站在生成式AI的潮头 NVIDIA正在构筑一个软硬融合的全新生态

您的位置：首页>培训 >

站在生成式AI的潮头 NVIDIA正在构筑一个软硬融合的全新生态

2023-05-25 00:42:40 中关村在线

生成式AI正在对企业的生产运营和人们的日常生活带来颠覆性的影响，数据的多样性和指数级的规模增长使得背后的IT平台同样面临着升级，单靠硬件的堆叠难以满足AI场景的复杂要求，如何有效的将软硬融合的创新与先进的生产力结合，是让生成式AI实现普惠的关键。在5月23日的微软Build大会上，NVIDIA宣布将NVIDIA AI Enterprise软件套件集成到微软的Azure机器学习中，由此会创建一个安全、企业就绪的平台，使全球Azure客户能够使用NVIDIA AI Enterprise（NVIDIA的AI平台的软件层）全面支持的100多个NVIDIA AI框架和工具来快速构建、部署并管理应用程序。

NVIDIA AI Enterprise与Azure机器学习集成，提供端到端云平台，供开发者构建、部署和管理大型语言模型的AI应用

通过Azure机器学习上集成的NVIDIA AI Enterprise，用户能够访问高性能的NVIDIA加速计算资源，以加快AI模型的训练和推理。要知道，在“全民AI”的今天，加速类的硬件资源较为缺乏，与NVIDIA的合作将让微软Azure机器学习的用户获得有力的基础算力支持。借助Azure机器学习，开发人员可以轻松扩展应用——从测试到大规模部署，同时使用Azure机器学习的数据加密、访问控制和合规认证可满足安全要求并符合其组织策略要求。借助安全、生产就绪的AI功能，NVIDIA AI Enterprise与Azure机器学习形成互补，并且获得NVIDIA专家的帮助和支持。

(资料图)

在NVIDIA AI Enterprise中，包含100多个框架、预训练模型和开发工具，例如用于加速数据科学负载的NVIDIA RAPIDS，NVIDIA Metropolis可加速视觉AI模型开发，而NVIDIA Triton Inference Server则支持企业实现标准化的模型部署和执行。此外，NVIDIA Omniverse Cloud平台即服务现已在Microsoft Azure上提供面向企业的私有版本，Omniverse Cloud为开发者和企业提供了一个全栈云环境，用于大规模设计、开发、部署和管理工业元宇宙应用。

目前，NVIDIA AI Enterprise与Azure机器学习的集成为有限技术预览版，可以在NVIDIA社区中注册获得。NVIDIA AI Enterprise还可以在Azure Marketplace上使用，为全球企业提供了一个全面安全和完全支持的AI开发和部署的新选项。

不仅如此，NVIDIA和微软还将生成式AI推向了广阔的桌面级市场，展示了一系列搭载NVIDIA RTX GPU的Windows 11 PC和工作站的成果，包括用于在Windows PC上开发AI的工具、优化和部署AI的框架，以及驱动性能和能效提升，将使开发人员能够以生成式AI为核心来构建下一代Windows应用。有超过400款应用和游戏已采用AI技术，通过RTX GPU上的专用处理器Tensor Core进行加速。

开发人员能够轻松地在Windows 11上训练并部署先进的AI模型，并在配备RTX的PC和工作站上提供节能的推理

要知道，AI开发通常在Linux上进行，需要开发人员启动双系统，或是使用多台PC在AI开发操作系统中进行工作，过去的几年中，微软一直致力于让Linux直接在Windows操作系统上运行，也就是适用于Linux的Windows子系统（WSL）。为此，NVIDIA与微软密切合作，为WSL内部的整个NVIDIA AI软件堆栈提供了GPU加速和支持，如今，开发人员可以使用Windows PC满足所有本地AI开发需求，并支持GPU加速的WSL深度学习框架。

NVIDIA RTX GPU在台式机工作站中提供了48GB的显存，使得开发人员可以在Windows上处理以前只能在服务器上处理的模型，大显存还提高了AI模型本地微调的性能和质量，使设计师能够根据自己的风格或内容进行定制。由于NVIDIA数据中心GPU也运行相同的NVIDIA AI软件堆栈，开发人员也可以将模型推送到微软Azure云上进行大规模训练。

为了帮助开发人员针对目标设备优化和部署 AI，微软还发布了Microsoft Olive工具链，用于优化PyTorch模型并将其转换到ONNX，使开发人员能够自动利用RTX Tensor Core等GPU硬件加速。开发人员可以通过Olive和ONNX优化模型，并将Tensor Core加速的模型部署到PC或云端。微软将继续投资，使PyTorch及相关工具和框架与WSL无缝协作，提供更好的AI模型开发体验。

生成式AI更注重逻辑层的效果，因此不同于加速时对训练要求，其对于推理的性能更加看重，RTX Tensor Core为AI推理提供了1400的Tensor TFLOPS（万亿次浮点运算）。NVIDIA会在532.03版驱动中发布最新的优化，与Olive优化的模型相结合，大幅提升AI性能。使用Olive优化版Stable Diffusion文本-图像转换器以及受欢迎的Automatic1111发行版，新驱动程序的性能提高两倍以上。

使用Automatic1111和文本-图像转换功能，在GeForce RTX 4090上测试Stable Diffusion的性能

NVIDIA还将推出新的Max-Q低功耗推理，用于RTX GPU上的纯AI工作负载，在优化TensorCore性能的同时，可以尽可能地降低GPU的功耗，延长电池续航时间，并使系统保持较好的散热和降噪表现。根据负载需要，GPU可以动态扩展，以提供更高的AI性能。

NVIDIA和微软还为开发人员提供了一些资源，以便在Windows PC上测试主要的生成式AI模型，在Hugging Face上提供了一个Olive优化版的Dolly 2.0大语言模型。此外，用于对话式AI的NVIDIA NeMo大型语言模型的PC优化版也即将在Hugging Face上线。开发人员还可以通过NVIDIA开发者网站上的AI加速应用页面，学习如何端到端地优化应用程序以充分利用GPU加速。

而更早之前，在戴尔科技集团全球大会上，戴尔科技集团与NVIDIA也宣布了一个合作项目，旨在让企业更方便在本地构建和使用生成式AI模型，从而实现快速、安全交付更好的客户服务、市场情报、企业搜索等各种功能。ProjectHelix会提供一系列包含技术专长和预构建工具的全栈式解决方案，基于戴尔和NVIDIA的基础设施与软件打造。

通过戴尔提供的经过测试和优化的软硬件产品组合，Project Helix可以简化企业生成式AI 的部署，支持从基础设施配置、建模、训练、微调、应用开发和部署一直到部署推理和精简结果等整个生成式AI的生命周期。在产品端，

Dell PowerEdge服务器为提升生成式AI训练和AI推理性能进行了优化，例如PowerEdge XE9680和PowerEdge R760xa，搭载了NVIDIA H100 Tensor Core GPU和NVIDIA Networking组成了这些工作负载的基础设施主干。客户可以将该基础架构与Dell PowerScale和Dell ECS Enterprise Object Storage等具有弹性、可扩展的非结构化数据存储搭配使用。利用Dell Validated Designs，客户可以使用戴尔服务器和存储软件中的企业功能，以及Dell CloudIQ软件提供的可观测能力。Project Helix包含NVIDIA AI Enterprise软件，为客户提供了用于整个AI生命周期的工具，还可以将安全和隐私功能内置在基础组件中，如Secured Component Verification。在本地保护数据可以降低固有风险，帮助企业满足监管要求。自2023年7月起，基于ProjectHelix项目的Dell Validated Designs将通过传统渠道和APEX的消费选项提供。

可以看到，NVIDIA正在构筑一个面向智能世界的生成式AI生态，通过软硬融合创新的方式满足来自云、边缘、本地的多元化场景需求，为企业探索基于AI的业务创新提供了坚持基础，以及丰富的平台和工具。



 相关阅读

站在生成式AI的潮头 NVIDIA正在构筑一个软硬融合的全新生态

生成式AI正在对企业的生产运营和人们的日常生活带来颠覆性的影响，数据的多样性和指数级的规模增长使得背后

2023-05-25 00:42:40
头条焦点：ai导出pdf如何压缩大小且图片不模糊 ai导出pdf怎么压缩不影响画质

今天来聊聊关于ai导出pdf如何压缩大小且图片不模糊，ai导出pdf怎么压缩不影响画质的文章，现在就为大家来简

2023-05-25 00:42:40
野村证券：英国央行可能会被迫再加息3次

野村证券：英国央行可能会被迫再加息3次；在周三英国发布了出人意料强劲的通胀数据之后，野村经济学家警告

2023-05-25 00:42:40
天天信息:英国央行行长：英国央行仍将顶住舆论压力坚持落实气候议程

英国央行行长：英国央行仍将顶住舆论压力坚持落实气候议程；英国央行行长贝利誓言将继续推进评估气候相关经

2023-05-25 00:42:40
当前速看：俄罗斯联邦委员会通过允许在战时状态进行选举的法律

俄罗斯联邦委员会通过允许在战时状态进行选举的法律；当地时间24日，俄罗斯联邦委员会（议会上院）表决通过

2023-05-25 00:42:40
全球信息:2022年川大1001人“二次高考”转专业！转出人数最多的专业竟然是！

很多大学生入学后会遭遇这样的问题：我不喜欢自己的专业怎么办？大学选错了专业就只能白白浪费四年吗？事实

2023-05-25 00:42:40
中年人头晕的原因_中年人头晕是什么原因引起的_微速讯

1、头晕又称为眩晕，是一种主观的感觉异常。2、可分为两类：一为旋转性眩晕，多由前庭神经系统及小脑的功能

2023-05-25 00:42:40
手机怎么查征信报告？看这里就知道

手机查征信报告具体步骤如下：1、通过一个手机浏览器，输入关键字“央行征信中心”，搜索出官网；2、点击进

2023-05-25 00:42:40
每日头条!助学贷款还款怎么还？3种方法让你选择

助学贷款的还款方式：支付宝还款，在支付宝上搜索“国家开发银行助学贷款”的小程序；银行还款，银行柜台去

2023-05-25 00:42:40
微信分付额度开通条件？符合五个要求就没有问题|环球动态

微信分付额度开通条件如下：完成实名认证、有良好的征信、有没有稳定的收入、年龄需要达标与有合理的信贷需

2023-05-25 00:42:40
健民集团将于5月31日解禁31.87万股

健民集团将于2023年5月31日解禁31 87万股，占总股本比例0 21%，解禁比例一般，解禁股类型是股权激励限售股

2023-05-25 00:42:40
焦点速看：拼多多砍价会把微信里的钱盗走吗_在拼多多里帮忙砍价自已微信上资金和银行卡安全吗

想必现在有很多小伙伴对于在拼多多里帮忙砍价，自已微信上资金和银行卡安全吗方面的知识都比较想要了解，那

2023-05-25 00:42:40
煜盛文化(01859)接获联交所复牌指引继续停牌

智通财经APP讯，煜盛文化(01859)公布，于2023年5月19 日，公司接获联交所的函件，当中载列以下恢复公司股份

2023-05-25 00:42:40
【全球聚看点】猴子与海豚告诉我什么道理_猴子与海豚的故事

猴子与海豚的故事

2023-05-25 00:42:40
环球新消息丨组织机构代码是哪9位_企业组织机构代码是几位数

1、由八位数字(或大写拉丁字母)本体代码和一位数字(或大写拉丁字母)校验码组成。2、组织机构代码证书包括正

2023-05-25 00:42:40
【世界新视野】1-4月湖北快递业务量超10.4亿件

今年1至4月，湖北省快递业务量超10 4亿件，同比增长14 13%。其中，咸宁、鄂州快递业务量增速最快，分别

2023-05-25 00:42:40
第三届全国戏曲 | 会演：4个少数民族“非遗”戏曲同台

昨晚（5月23日），第三届全国戏曲（南方片）会演的唯一一场组合演出——“少数民族戏曲剧种组台专场”，

2023-05-25 00:42:40
湖北发布2022年企业创新积分百强榜单创新积分可用于贷款

今天下午，湖北发布2022年企业创新积分百强企业名单，并出台《湖北省科创企业创新积分信用贷款业务实施办法

2023-05-25 00:42:40
湖北出台15条措施发展数字经济奖补最高可达千万元_观热点

日前，湖北省出台《数字经济高质量发展若干政策措施》，15条措施“真金白银”，加快推进全省数字经济高质量

2023-05-25 00:42:40
环球热点！油菜界的“顶级学霸”——“中油杂501”的成绩单出炉

“中油杂501”的试种成功后，将有望破解我国油菜单产和含油量偏低、机械化程度低等“卡脖子”问题。

2023-05-25 00:42:40