数以万计的 nvidia gpu、nvidia quantum-2 infiniband 以及全栈式 nvidia ai 软件即将登陆 azure;nvidia、微软和多家全球企业将使用该平台进行快速、经济的 ai 开发和部署
nvidia 于昨日宣布与微软展开一项为期多年的合作,双方将共同打造全球最强大的 ai 超级计算机。微软 azure 的先进超级计算基础设施,结合 nvidia gpu、网络和全栈式 ai 软件为此超级计算机赋能,以帮助企业训练、部署和扩展包括大型、先进模型在内的 ai。
azure 的云端 ai 超级计算机包括强大、可扩展 nd 与 nc 系列虚拟机,其专为 ai 分布式训练和推理而优化。azure 是首个采用 nvidia 先进 ai 堆栈的公有云,在其平台上添加了数以万计的 nvidia a100 和 h100 gpu、nvidia quantum-2 400gb/s infiniband 网络和 nvidia ai enterprise 软件套件。
此次合作中,nvidia 将使用 azure 的可扩展虚拟机实例来研究并进一步加快生成式 ai 的发展。生成式 ai 是正在迅速兴起的 ai 领域,其中像 megatron turing nlg 530b 这样的基础模型是无监督、自学习算法的基准,这些算法被用来创造新的文本、代码、数字图像、视频或音频。
两家公司还将合作优化微软的 deepspeed 深度学习优化软件。nvidia 的全栈式 ai 工作流和软件开发工具包皆专为 azure 进行了优化,并将提供给 azure 企业客户。
nvidia 企业计算副总裁 manuvir das 表示:“ai 技术正在加速发展,行业的采用速度也在同时加快。基础模型上的突破引发了研究浪潮、培育了新的初创企业并启动了新的企业应用程序。我们将与微软一同为研究者和企业提供最先进的 ai 基础设施和软件,使他们能够充分利用 ai 的变革性力量。”
微软云与 ai 事业部执行副总裁 scott guthrie 表示:“ai 正在掀起整个企业和工业计算的下一轮自动化浪潮,帮助企业机构在变幻莫测的经济环境中得以事半功倍。我们与 nvidia 合作,打造全球可扩展性最强的超级计算机平台,为微软 azure 上的每家企业提供最先进的 ai 功能。”
通过 azure 上的 nvidia 计算与
quantum-2 infiniband 实现可扩展峰值性能
微软 azure 的 ai 优化虚拟机实例采用了 nvidia 最先进的数据中心 gpu,并且是首个搭载 nvidia quantum-2 400gb/s infiniband 网络的公有云实例。客户可以在单个集群中部署数千 gpu 来训练最具规模的大型语言模型,大规模地构建最复杂的推荐系统以及实现生成式 ai。
目前的 azure 实例采用了 nvidia quantum 200gb/s infiniband 网络和 nvidia a100 gpu。未来的实例将集成 nvidia quantum-2 400gb/s infiniband 网络和 nvidia h100 gpu。结合 azure 先进的计算云基础设施、网络和存储,这些通过 ai 优化的产品将为任何规模的 ai 训练和深度学习推理工作负载提供可扩展的峰值性能。
加速 ai 的开发和部署
另外,该平台将支持广泛的 ai 应用和服务,包括微软 deepspeed 和 nvidia ai enterprise 软件套件。
微软 deepspeed 将使用 nvidia h100 transformer 引擎来加速基于 transformer 的模型,这些模型可用于大型语言模型、生成式 ai 和编写计算机代码等应用。该技术将 8 位浮点精度能力应用于 deepspeed,大大加快了 transformer 的 ai 计算速度,使其吞吐量达到 16 位运算的两倍。
被全球企业广泛采用的 nvidia ai 平台软件 nvidia ai enterprise 已通过认证并支持搭载 nvidia a100 gpu 的微软 azure 实例。未来的软件版本将增加对搭载 nvidia h100 gpu 的 azure 实例的支持。
nvidia ai enterprise 包括用于语音 ai 的 nvidia riva 以及 nvidia morpheus 网络安全应用框架,可简化从数据处理和 ai 模型训练到仿真和大规模部署等 ai 工作流中的每一步。
原文标题:nvidia 携手微软打造大规模云端 ai 计算机
文章出处:【微信公众号:nvidia英伟达】欢迎添加关注!文章转载请注明出处。
热循环试验-模拟光伏组件在温度重复变化下的性能缺陷
奇信智能公司携物联网机器人“奇信小π”亮相华为云人工智能高峰论坛
三星S8最新爆料:6GB运存+骁龙835,继续采用的SDI电池
爱高公布2020/21全年业绩 笔记本电脑品牌业务于充满挑战的环境中蓬勃发展
2015年德州仪器全国大学教育者年会在蓉举行
NVIDIA 携手微软打造大规模云端 AI 计算机
如何理解线程安全?
惠科投资100亿元 打造全球最大智能电视机生产基地
电脑维修之流程步骤全攻略
小米之家究竟都有哪些特别之处
高通芯片跑分反超华为?芯片之争再升级,它的布局才是关键!
IoT对智能工厂有什么影响
8通道数字源表测试气敏电阻案例
大模型之战的下半场:垂直化应用与生态化发展
OpenHarmony城市技术论坛——武汉站圆满举办
石英灯电子变压器电路图
结构胶点胶加工中点胶机的不足表现在哪些方面
无源元件的创新将会成为未来电子产品差异化的重要手段
ANet通信管理机的功能特点是怎样的
485无线通信模块与4-20mA采集模块传输方式的区别