相对于前两年英伟达举办的 gtc(gpu technology conference) 来说,今年 gtc 在 gpu 技术架构和硬件创新的进展并不明显。在 keynote 环节,英伟达创始人兼 ceo 黄仁勋发布了一款定价 99 美元的 jetson nano——除此之外,并没有此前预想中的新架构,或者“大核弹”。
尽管如此,在现场见证了 keynote 之后,感受到了黄仁勋的激情,以及他在打造基于现有的 gpu 技术的应用生态方面的努力。无论是基于图灵架构和 rtx 技术的 nvidia omniverse 和 nvidia rtx servers 服务器,还是七家世界级的厂商将推出基于 nvidia t4 gpu 和 nvidia cuda-x ai 加速库的服务器,都让人体会到英伟达在技术应用生态方面的着力。
实际上,黄仁勋依旧在强调这句话:买的(gpu)越多,省的(money)越多。
黄仁勋:数据中心将成为巨无霸,但 ai 加速计算才是未来
在 gtc 大会正式举行的第二天,黄仁勋出现在媒体参与的 q&a 环节,他首先重点强调了本次 gtc 的两个核心关键词——ray-tracing 和 data science,随后回答了众多外界关注的关键问题,比如说未来的 gpu 技术路线、对以色列公司 mellanox 的收购,数据中心的未来、摩尔定律的终结等。
笔者也针对本次 q&a 的关键内容进行了提取。
一、关于英伟达对于 mellanox 的收购
在本次 gtc 正式开幕前一周,英伟达宣布了对以色列科技公司收购,这是英伟达历史上以来最大的一笔收购。对此,黄仁勋提到了以下几点:
在摩尔定律放缓的时期,网络软件堆栈必须尽可能转移到架构上,为 cpu 减负;现在,cpu 是一种有限的资源,所以必须尽可能地把工作从 cpu 中减负出来。mellanox 是 cpu 减负领域的一流企业。
在数据中心中,计算架构不再停留在节点上,而是将扩展到网络。整个网络都将涉及英伟达的 gpu。英伟达有能力与第一大互联技术公司 mellanox 紧密合作,整个行业非常欢迎它。
英伟达对 mellanox 收购一案获得监管部门的批准表示乐观,这将使得英伟达加速创新并推进技术发展,以更好地服务于客户。因为我们缺乏网络技术,而我们的目标是推进网络技术,为数据中心节省成本。而英伟达的客户普遍表示支持并乐见其成。
英伟达并不经常收购公司,因为它喜欢与别人合作,而英伟达也是一个开放的平台(比如说 cuda、dgx),同时英伟达的业务模式必须是开放的。但是之所以收购 mellanox,是因为双方之间长达 10 年的合作,而英伟达认为 mellanox 在高速、高性能计算和网络设计方面非常擅长。
英伟达为什么愿意以如此高价进行收购呢?因为 mellanox 值这个价——这不是成本的问题,而是价值的问题。
二、关于 3d 和堆叠技术、7nm 技术
本次 gtc 上,英伟达没有推出此前被广泛预测的 7nm gpu 架构,这也引起外界的质疑:在处理技术放缓的情况下,英伟达将如何看待 3d 和堆叠技术?而面的 amd 已经推出的 7nm cpu,英伟达会否会在 7nm 方面有所动作?
对此,黄仁勋表示:
tesla v100 已经是处理量最大的 3d 封装硅片,而英伟达也是台积电最大的芯片堆叠客户。事实上,3d 堆叠已经有 5 年的历史了,有些人甚至用它来堆叠手机芯片,这样可以降低封装高度。这种技术已经存在一段时间了,它不是新东西。
但是对于英伟达来说,不仅需要 3d 堆叠,也需要 2d 堆叠。而英伟达实现 2d 堆叠的方法就是 nvlink。英伟达也需要一定规模的数据中心,这不再是为了 2d 堆叠,而是为了提升处理量。为此,英伟达需要通过 mellanox 来实现,将多个 gpu 与大型计算引擎相连。
未来,数据中心将成为一个巨大的计算引擎,而且数据中心的体积也要不断减小,而计算效果却非常惊人——这需要具备高性能技术方面的专长,也是 mellanox 擅长的。
而针对外界关注的 7nm 技术和下一代 gpu 的发展,黄仁勋表示:
实际上 7nm 技术已经公开发售,台积电也希望能够卖给我们;我要想买它也非常容易。但是对于英伟达来说,我要考虑的问题是,购买 7nm 的要义和益处是什么?对 nvidia 来说,从台积电购买 7nm 处理器技术,并不会让我们成为一家好公司,只会让台积电变得更好。而英伟达的与众不同之处在于,我们在任何时候都能开发最具能效的 gpu,而且利用的是最具成本效益的技术。实际上,我们的工程师也是架构师,他们必须开发最具能效的 gpu,比如 turing;我们的贡献是兼顾效率与最佳架构——我们为 turing 选择了最佳的技术,即 12 nm。
三、关于软硬件关系、rtx 的技术应用
对于本次 gtc 来说,最新发布的 cuda-x 加速库成为一个亮点,同时数据中心和 rtx 技术成为重中之重,gpu 硬件被提及的次数很明显少了很多。当被问及为什么硬件在 gtc 2019 的角色被相对弱化时, 黄仁勋表示:
你之所以会听到很多关于软件的内容,是因为:如果我们不为硬件开发软件,那么硬件将没有用武之地;(正是因为有相应的)软件存在,才使硬件变得出色。如果我们不自己开发软件,那么市场上将只有适用于 cpu 的软件。英伟达的业务是向新市场销售计算机平台,如果我们想这样做,我们必须打造新的软件架构(比如说 cuda-x)。在这方面没人会帮我们,我必须亲力亲为。
而面对外界对于基于图灵架构的 rtx 市场销售和技术应用情况的质疑,黄仁勋回应称:
rtx 在最初八周内的增长几乎比 pascal 快50%。然而,人们为什么会觉得 rtx的应用放缓?这是因为当我们首次向市场推出该产品时,我们有加密产品的库存,我们不能推出整个系列——我想这样做,但是不能。现在,我们已推出了整个系列,它们都表现得很出色。
另外,伴随着 rtx 服务器的推出,外界也开始关心 rtx 技术何时能够纳入到 geforce now(简称为 gfn)中去并面向公众开放,对此,黄仁勋回应了如下要点:
目前新制造的 gfn 服务器都采用了光线追踪技术。
目前 gfn 的等待名单里有 300000 玩家和 100 万用户。首要挑战是要确保能大规模、高质量地提供这项服务,其次就是必须降低成本,以便减低客户成本,让他们去玩免费的游戏。另外,第三个挑战就是确保 gfn 能够覆盖全球更多的国家,而不仅仅是西方国家。
预计光线追踪将在 2019 年第三第四季度开放。
四、关于摩尔定律的终结和数据中心的未来
在本次 gtc 上,以数据中心为载体的数据科学(date science)也是黄仁勋谈到的重点内容。当被问及对英特尔最新架构的看法时,黄仁勋表示:
首先我认为英特尔也认识到了加速计算是未来的发展方向。整个行业不再认为 cpu 和 gpu 是互斥的,这当然是件好事,因为那条路已经走不通了。我们要承认,我们需要新的方法去引领行业向前发展。其次,我们仅占全球 hpc 总量的一小部分在全球超级计算机企业(500 强企业)中,英特尔有充分理由占据非常大的份额。英特尔是一家竞争力很强的公司。我期待他们奋勇向前,我们也将积极面对挑战,最后受益的将是全世界的用户和研究人员。第三,我不太确定,英特尔最新架构是设计本身的成功,还是原有技术的延展。但我认为非常好的是,英特尔这个声明基本是在讨论加速计算;它是在说:“来点真格的吧,加速我们的堆栈”。
而关于目前数据中心发展所受的限制,黄仁勋最后表示:
其实很简单,目前对数据中心的唯一限制就是:摩尔定律的终结。我们深知,未来计算负荷呈指数趋势增长。如果摩尔定律已经终结了,唯一的方式将是构建更多的数据中心。我相信,将来的趋势是增加数据中心的工作负荷,这样,数据中心的计算能力将会以 10 倍的速度提升,其结果是:软件创新将会突飞猛涨,计算能力将进一步增强,而这会推动更多的创新。
郭台铭为何对夏普情有独钟?
网络厂商推白牌交换器 撼动全球服务器版图
永磁直流电机的优缺点 永磁直流电机的应用范围
拉线式位移编码器的分辨率和精度是一样的吗
如何打造“流光溢彩”的背景墙?使用这套智能LED灯就够了
黄仁勋表示数据中心将成巨无霸 但AI加速计算才是未来
DDR互连仿真解决方案
对于已备受关注UPS电源,你了解多少?
中兴建设与炬光科技签署了上市辅导协议
小米平板3:电商提前曝光售价,4月6日发布!5月量产!
PC显示器也进入OLD时代?华硕21英寸OLED显示器曝光!
全球半导体IP市场仅值49亿美元,Arm绝对领先
轧钢系统无功补偿哪种方式比较好
P30 系列售价进一步上探,国行售价3988元起
老旧MacBook Pro设备用户更新设备黑屏,无法联网恢复
美图根据加密货币投资计划斥巨资购买以太币和比特币
用科技创新为中国物联网发展助推赋能
苹果公司不断寻找新的OLED供应商 iPhone OLED屏有望中国制造
三星手机在中国销量不景气 销量持续大幅下滑
简述基于UDS的BootLoader架构设计及规范