3月27日美国圣何塞报道,今天早上,英伟达gtc 2018年度大会的最重磅环节——创始人&ceo黄仁勋主题演讲——正式开始。
每年的gtc大会上,这位被粉丝们爱称为“老黄”的黑色皮衣爱好者ceo都会带来一场重磅主题演讲,通常来说不仅会发布新型gpu与超算电脑,还会宣布一些ai/vr/自动驾驶等领域重磅合作。
不过,今年的gtc 2018比较神奇,最为重磅的消息选择了在提前秘密发布,而不是在gtc keynote现场——英伟达重磅宣布,将联合芯片巨头arm打造iot设备的ai芯片专用ip,这款机器学习ip集成到arm的project trillium平台上,以实现机器学习,其技术源于英伟达xavier芯片以及去年开源的dla深度学习加速器项目。
arm是全球智能设备第一大主流芯片架构提供商,全球超过90%的智能设备采用了arm的芯片架构,包括手机、平板、手表、电视、无人机等等。本次arm牵手英伟达推出专用的iot设备人工智能ip,将会有助于人工智能在终端设备广泛铺开,使得上亿、甚至数十亿台iot设备都能够用上低功耗、低成本的ai芯片,使物联网芯片公司能够轻松地将ai集成到它们的设计中,并帮助它们将智能且价格实惠的产品带给全球数十亿的消费者。
nvidia副总裁兼自主机器事业部总经理deepu talla表示:“推理将成为每个物联网设备的核心能力。我们将与arm一同推进这一趋势的发展,帮助数百家芯片公司轻松采用深度学习技术。”
此外,在今天的gtc 2018上,黄仁勋还宣布了英伟达的以下进展:
1、推出光线追踪rtx技术(ray-tracing),能够提供电影级画质的实时渲染,渲染出逼真的反射、折射和阴影画面。这一技术由英伟达在前不久的gdc全球游戏开发者大会上展示过;
2、推出第一款采用volta架构的quadro gv100 gpu,由两个gv100连接而成;
3、推出了第一款专用于医疗图像处理的超级电脑clara;
4、新版tesla v100内存升为32g,可与旧版无缝换插,支持更多人工智能的工作负载;
5、推出dgx-2超级电脑,采用了最新的nvswitch链接,最多可同时连接16块tesla v100 gpu,其速度可以达到dgx-1的10倍,算下来可以每秒下载14000 部电影,售价39.9万美元;
6、推出新版机器学习应用平台tensorrt 4,支持int8与fp16精度,并与谷歌合作,将其整合进ai开源框架谷歌tensorflow 1.7中;
7、宣布打造下一代名为drive orin的自动驾驶芯片,但除了名字外没有透露更多信息;
8、正式推出3d仿真自动驾驶测试平台drive constellation,这一测试平台英伟达在ces上展示过,能够帮助自动驾驶系统提升“姿势水平”;
9、推出isaac机器人仿真训练平台sdk,将训练机器人的技术开放出去;
值得一提的是,智东西去年5月时也对gtc 2017进行了一线深入报道,在去年的ceo主题演讲开场前,英伟达的股价一路飙升至121美元,总市值达到了714亿美元。而在今年开场前一晚,英伟达的股价已经冲到了244美元,总市值超过1479亿美元。在这10个月内,英伟达的股价与市值再次翻倍。
光线追踪(ray-tracing)技术开场
今天一大早,智东西来到了gtc大会现场,准备参加每年gtc的最重磅环节——ceo黄仁勋主题演讲。此时是早上8点,离9点开场还有整整一小时前,但是入口处已经排起了巨长的队伍。
今天,老黄依旧是万年不变的一身黑皮衣+黑裤子开场。
他开场介绍的第一个项目就是英伟达在前不久gdc上发布的nvidia rtx光线追踪技术(ray-tracing),这项技术是英伟达耗时10年打造的,能够提供电影级画质的实时渲染,渲染出逼真的反射、折射和阴影画面,几乎与真实世界的照片或视频很难区分开来。现场展示的视频片段就是用光线追踪技术实时渲染的,而且并不需要一个超级强大的超算电脑,只需要一台dgx-station。
在真实世界中,我们看到的3d物体被光源照亮,且光子可以在到达观看者的眼睛以前从一个物体反弹到另一个物体。光线追踪技术则是反过来,通过从我们的眼睛(观景式照相机)反向追踪光线捕捉这些效果,通过追踪2d视表面上每个像素的光线的路径,并应用到场景的3d模型中。
可想而知,这种技术的计算量非常大,一般渲染复杂的特殊效果可能需要花上几天甚至几周的时间,所以此前该项技术一直仅限于高成本的电影制作中。
不过,目前,随着gpu性能日益强悍,能够支持光线追踪的电脑也越来越多,通过volta架构的gpu配合英伟达的rtx技术,产品设计师、游戏设计师、建筑师们能够在几秒内即可生成逼真的产品模型。
此外,英伟达还宣布gameworks sdk 将添加一个光线追踪降噪模块。更新版 gameworks sdk 即将推出,其中包含光线追踪区域阴影和光线追踪光泽反射。
新版quadro gv100,首次采用volta架构
与此同时,英伟达还在现场推出了quadro gv100 gpu,同时也是同系列产品中第一个采用volta架构的,因此能够搭载rtx技术的。
quadro gv100由两个gv100连接而成,一共拥有10240个cuda核,可达236 tflops tensor cores。与此同时,老黄又玩起了“买gpu省钱”的梗——“你买的gpu越多,就越省钱(the more you buy, the more you save.)”,这一个梗再次贯穿了全场。
推出医疗专用超级电脑clara,日常diss摩尔定律
接着,话锋一转,老黄开始谈起了计算力,我们也进入了gtc的必备环节——diss摩尔定律。
在将近10年的gtc上,每年老黄都会提到同一主题——摩尔定律。在过去30年里,我们受益于摩尔定律,芯片所提供的计算能力每年都高速增长。然而在最近的几年里,摩尔定律开始失灵,芯片发展的速度已经跟不上我们需要的计算力增长速度。
因此,我们需要新定律。
而随着数据量与计算量爆发式地增长,人工智能、gpu、cuda正在以一种极快的速度崛起,以gpu驱动的人工智能计算已经随处可见,并且渗入到各行各业当中去,教育、娱乐、工业、制造……这也引出了我们下一个话题——医疗。
老黄在现场推出了第一款专用于医疗图像处理的超级电脑clara,它能够支持cuda、cudnn、tensorrt、ogl、以及刚刚提到的rtx技术。
在现场,老黄展示了一个医疗图像实时处理的影像片段。这个段影像是用十几年的超声波老设备拍摄而成,本来只能看到2d的黑白图像。然而当数据传进clara后,配合人工智能软件,可以在2d图像中分析出3d的腔膛形状(图中红色部分)。因此,医院可以在现有医疗设备上直接接入这台电脑。
目前,英伟达正在和众多医疗厂商合作,除了ge通用电气、三星电子等大厂外,还有像图玛深维、推想科技等ai医疗创业公司。
新品升级:新版tesla v100、dgx-2超级电脑、tensorrt 4
在去年的gtc 2017上,老黄发布了一款名为tesla v100的新版gpu,使用volta架构,采用的是台积电的12nm finfet工艺,具有5120个cuda处理内核,16gb内存,能够为训练、推理应用提供120 tensor tflops算力。
今天,老黄宣布,新版tesla v100将内存升级一倍,达到32gb。
由于这几年间,cnn、rnn、gans、deep q-learning等算法不断变得复杂,更是对深度学习计算硬件提出了新挑战。因此,新版tesla v100拥有更大的内存,使得它能够运行更大、更复杂的神经网络,在某些hpc应用上能够提供高于之前16gb版本50%的性能。微软已经宣布采用了新版tesla v100,能够更快速地训练更加强大的深度神经网络。
此外,英伟达本次还推出的nvswitch高速互联技术。此前英伟达曾经推出nvlink,支持最多8块gpu高速互联;如今nvswitch技术可将这个数字翻上一倍,支持最多16块gpu同时互联。每一个gpu都能和另一个gpu进行超低延迟的通讯。
在去年gtc上,英伟达推出了搭载8块tesla v100的超级电脑dgx-1,今天在gtc 2018现场老黄宣布,推出能够搭载16块新版tesla v100的超级电脑dgx-2,比dgx-1还要快10倍。
dgx-2能够进行2 pflops的计算,算下来可以每秒下载14000部电影,拥有512gb hbm2,功耗为10kw,350lbs,能够支持更大数据集、更复杂神经网络的计算。售价399000美元,今年q3上市。
它其中搭载着被老黄称为“世界上最大的gpu”,共有81920个cuda核,可达2000 tflops tensor cores,拥有512gb hbm2。
此外,去年的gtc上,英伟达推出了“英伟达gpu云(nvidia gpu cloud)”,但它不是一个云计算“云”,而是一个能让人轻易地从零开始搭建一个深度学习的项目。今天老黄宣布,aws、阿里云、dgx、gcp、oracle cloud上都开始支持英伟达gpu云了。
而且,从cnn到lstm再到gans,现在的深度学习神经网络框架正变得越来越复杂、越来越多样、而且在日新月异地变化着,训练环节变得复杂了,应用(inference)环节自然也变得非常复杂。
因此,老黄还在现场推出了最新版本的tensorrt——tensorrt 4,这是一款可编程应用平台(programmable inference platform),当你将一个神经网络训练好了之后,可以通过tensorrt可编程平台,简便快捷地将这个训练好了的神经网络部署(deploy)到英伟达的gpu上。
新版tensorrt 4能够支持int8和fp16精度运算,能够将数据中心的功耗降低70%。而且,英伟达还与谷歌进行了深度合作,将tensorrt整合进如今最广泛应用的ai开源框架谷歌tensorflow 1.7中。而且现在还能够加速图像、视频、语言、nlp等ai应用。
同时,老黄还在现场宣布,kubernetes现在能够支持gpu了。kubernetes能够在主机集群之间提供一个能够自动化部署、可拓展、应用容器可运营的平台,通常结合docker容器工具工作,并且整合多个运行着docker容器的主机集群,不仅能够提供更大的计算力,还能够有更大的容错空间。
打造下一代drive orin自动驾驶芯片
老黄在现场还展示了英伟达感知基础(perception infrastructure)项目,这是一个大型的深度学习模型,能够收集并分析不同传感器(如摄像机、雷达等等)得出的距离、天气、雷达感知、高精地图等等不同数据。
在接下来2-3年间,英伟达还将技术研发这一技术,直到最后能够搭载在所有新车上。老黄说,这是我们至今遇到的最为复杂的问题之一。
在现场,老黄还展示了英伟达drive的研发路径,它们都基于同一框架、满足adsl-d的安全标准、并且性能/功耗比非常高:从drive px parker、到drive px 2、再到drive xavier、再到drive pegasus……
老黄说,虽然drive pegasus已经非常强大了,但是,英伟达还会打造下一代名为drive orin的芯片,不过现场没有透露更多信息。
推出自动驾驶仿真测试平台drive constellation
在今年1月的ces上,老黄曾经展示了一个全新的3d自动驾驶仿真测试平台。而今天,老黄正式推出了这款名为drive sim and constellation的3d自动驾驶仿真测试平台。
这款平台包括两个部分,先是在云端模拟照片级真实的图像,生成传感器数据(包括摄像头、雷达等)第二部分则包括将这些数据传到英伟达drive pegasus中,并运行全套自动驾驶软件,以帮助训练该自动驾驶系统提升“姿势水平”。
在实际演示中,英伟达的新仿真平台显得十分强大,不仅有传统一点的实时车导线规划、其他车辆识别,而且对环境的还原相当真实,复杂的光线条件也能够被模拟。测试人员还能够在平台内操纵、变化车辆传感器的探测范围。
另外,这个平台还支持开发人员在虚拟环境中“人为驾驶”一辆车作出各种危险动作来考验测试车,来考验测试车的算法。
会上,老黄还宣布,目前英伟达自动驾驶合作伙伴的数量已经达到了370家,其中包括整车厂、一级供应商、以及200+家创企。
与自动驾驶仿真测试平台相似的,英伟达还在去年推出了专用于机器人的仿真测试平台——isaac机器人训练模拟世界。你可以用这个虚拟世界来训练机器人前进、后退、转弯、躲避行人等。
今天,老黄宣布将isaac平台的技术开放出去,推出isaac sdk。
此外,英伟达此前还推出过一款vr多人交互平台holodeck。在今天的gtc 2018上,英伟达还展示了一个非常有趣、也非常’黑科技“的demo:在holodeck虚拟世界里远程控制现实世界里的汽车。(看过《黑豹》的同学大概可以理解一下)
上文提到,今年的gtc 2018比较神奇,最为重磅的消息选择了在提前秘密发布,而不是在gtc keynote现场——英伟达重磅宣布,将联合芯片巨头arm打造ai芯片专用ip,这款ip属于arm几年2月公布的trillium项目的一部分,其技术源于英伟达xavier芯片以及去年开源的dla深度学习加速器项目。
英伟达本次宣布同aem合作,将在数十亿物联网设备上实现深度学习。nvidia深度学习加速器ip将集成到arm的project trillium平台中,以便于构建深度学习iot芯片。
去年,英伟达也正式免费开源了完整版dla(deep learning accelerator,深度学习加速器),让厂商可以免费下载使用,打造属于自己的低功耗ai芯片(比如iot芯片)。
今年2月,芯片巨头arm公布了其人工智能项目trillium,同时推出两款专用ip,分别为物体检测od处理器和机器学习ml处理器。
arm是全球智能设备第一大主流芯片架构提供商,全球超过90%的智能设备采用了arm的芯片架构,包括手机、平板、手表、电视、无人机等等。而英伟达,作为全球ai浪潮的引领者,能够为人工智能提供强大的计算力,二者一拍即合。
本次arm牵手英伟达推出专用的iot设备人工智能ip,将会有助于人工智能在终端设备广泛铺开,使得上亿、甚至数十亿台iot设备都能够用上低功耗、低成本的ai芯片,使物联网芯片公司能够轻松地将ai集成到它们的设计中,并帮助它们将智能且价格实惠的产品带给全球数十亿的消费者。
nvidia副总裁兼自主机器事业部总经理deepu talla表示:“推理将成为每个物联网设备的核心能力。我们将与arm一同推进这一趋势的发展,帮助数百家芯片公司轻松采用深度学习技术。”
结语:更多精彩敬请期待
今年,共有超过8000人来到了gtc 2018现场,150个展位。值得一提的是,英伟达也在推动女性在科技行业中的力量,今年女性占据了gtc 2018总开发者的8%,总参会者的10%,以及11%的演讲者。
每年的gtc上,除了英伟达的各类主业务负责人的交流沟通会议、来自大大小小各类开发者或技术大牛的主题演讲外、还有150家英伟达的合作企业布设展位,以供开发者与媒体参观交流。
高透泄压阀是什么,有什么特点
!销售/回收VP7723A音频分析仪VP7723A 小兵R/
浅析MySQL中的各类运算符
混合信号IC设计难度高 选对工具是好的开始
便携式atp荧光检测仪使用方法的详细说明
ARM牵手英伟达推出专用的IOT设备人工智能IP
CES 2018 四大亮点揭秘:语音控制、8K TV、5G通信技术和AI技术
新能源汽车的发展仍然保持着两位数的高速增长!
车载绕线贴片功率电感—AMWPB系列
积分球内部挡板的设计
电能管理系统的应用说明
交换机的三层网络结构介绍
如何测试光模块的性能?需要哪些测试测量设备?
5G将成经济增长新引擎
经济型在线测试仪
如何判断光藕的好坏 光耦电路设计图介绍
产业发展数据喜人 我国工业机器人革命蓄势待发
智能家居的发展看重的是什么
智联世界中车联网的应用和数字化未来的发展
电机保护器操作方法 电机保护器故障检修