在过去十年中,云计算每年增长20%,成为了价值1万亿美元的巨大行业大约3000万台cpu服务器完成大部分处理工作,另外,减少碳排放这任务从根本上与增加数据中心的需求相悖,未经过加速的工作负载都将会在cpu上进行处理在ai和云服务中。
在gtc 2023开发者大会上,英伟达向我们介绍了关于他在云计算领域的三个大动作。
首先,英伟达与微软azure、google gcp和oracle oci三家云厂商合作推出了nvidia dgx cloud。nvidia dgx cloud是一项人工智能超级计算服务,它可以让企业快速访问为生成式人工智能和其他开创性应用训练高级模型所需的基础设施和软件。通过一个浏览器,客户就可以将英伟达dgx ai超级计算机实时接入公司。
其次,面向具有构建、优化和运营定制大语言模型和生成式ai需求的客户,英伟达推出云服务nvidia ai foundations,提供语言、数据和生物学模型的定制服务。
同时,针对chatgpt等大语言模型的推理训练,英伟达推出了新的gpu h100。h100配备有94gb hbm3的显存,可以支持参数规模达到1750亿的gpt-3,并将大语言模型的处理成本降低一个数量级。
nvidia dgx cloud将透过多个云端服务供应商提供,微软azure预计于下一季起托管dgx cloud服务,包括google cloud等业者也将陆续开始供应服务,dgx cloud执行个体价格为每个执行个体每月36,999美金起。
每个dgx cloud执行个体皆有8个nvidia h100或nvidia a100 80gb tensor gpu,单一节点具备640gb 的gpu记忆体,并透过nvidia networking技术提供高效能、低延迟网路,使多个执行个体等同一个超大型gpu。
文章综合和讯 、格隆汇app、cnmo手机中国
华为鸿蒙系统首批升级机型名单曝光
马耳他颁布的三项法案可能会对数字货币交易者和交易所产生影响
无线网卡的安装与无线网络的设置步骤讲解
LG U+计划在未来5年内将5G用户规模扩大3倍
安捷伦发布全系列微波/射频/无线与雷达测试方案
GTC 2023:英伟达的三大云计划
高频雷达抑制冲击干扰的研究与实验
适用于所有音频应用的Jetson设备
全球首秀博世概念车展现全新出行模式
区块链网络消除信任需求的4种不同的共识机制介绍
华为举办暨 HarmonyOS 2.0手机应用开发者Beta活动
自动气象站技术将越来越先进,应用也会越来越广泛
浅谈3D打印技术在疫情防控中的作用
Aptina推出新型MT9P006高清5MP图像传感器
西门子博途SCL:REGION:构建程序代码的步骤
高效低功耗PFM DC-DC 同步升压芯片 AP8106
接触器如何选型_接触器选型原则_接触器选型电流原则
比特币投资成黑洞,第三次“硬分叉”命运悬而未决
华为Atlas人工智能计算平台正式开启其商用和规模销售的进程
清理华为审稿人事件之后,华为又有人入选IEEE Fellow