英伟达CTO谈DPU:这是我们的重中之重

2019年,michael kagan在mellanox technologies 担任首席技术官,领导加速网络技术的开发 ,这是他和八位同事在 20 年前创立的一家公司。然后在 2020 年 4 月,英伟达以 70 亿美元的价格收购了该公司,kagan接任了这家科技巨头的首席技术官——这是他梦寐以求的工作。
英伟达总部位于加州圣克拉拉,但kagan在公司位于以色列的办公室工作。
在位于以色列 yokneam illit 的 mellanox,kagan 监督了用于云数据中心计算和存储的高性能网络的开发。该公司生产适配器、电缆和高性能交换机等网络设备,以及新型处理器 dpu。kagan 说,该公司的高速 infiniband产品可以在世界上大多数最快的超级计算机中找到,其高速以太网产品也可以在大多数云数据中心中找到。
ieee 高级成员现在的工作重点是整合丰富的 nvidia 技术来构建加速计算平台,其基础是三个芯片:gpu、cpu 和 dpu,或数据处理单元。dpu 可以支持卸载、加速和隔离数据中心工作负载,从而减少 cpu 和 gpu 工作负载。
“在 mellanox,我们致力于数据中心互连,但在 nvidia,我们将最先进的计算连接成一个单一的计算单元:数据中心,”kagan 说。互连用于连接多个服务器并将整个数据中心组合成一个巨大的计算单元。
“我可以访问并打开 nvidia 技术的大门,”他说。“这就是让我的生活令人兴奋和有趣的原因。我们正在构建未来的计算。”
从英特尔到 mellanox
kagan出生在俄罗斯的圣彼得堡——当时被称为列宁格勒。1975 年高中毕业后,他的家人搬到了以色列。与许多崭露头角的工程师一样,他的好奇心使他分解和重新组装东西以弄清楚它们是如何工作的。而且,由于家里有很多工程师,他说,从事工程职业是一个容易的决定。
他就读于以色列理工学院technion,因为“它是世界上最好的工程大学之一,”他说。“我选择电气工程的原因是因为它被认为是 technion 最好的专业。”
kagan 于 1980 年毕业,获得电气工程学士学位。他于1983年加入位于以色列海法的英特尔,担任设计工程师,并最终搬到位于俄勒冈州希尔斯伯勒的公司办公室,在那里他从事 80387 浮点协处理器的工作。一年后,回到以色列后,kagan 担任 i8060xp 矢量处理器的架构师,然后领导和管理 pentium mmx 微处理器的设计。
在英特尔工作的 16 年中,他一路晋升为首席架构师。1999 年,他准备举家迁往加利福尼亚,在那里他将领导公司的一个备受瞩目的项目。然后,英特尔的前同事 eyal waldman 邀请 kagan 加入他和其他五个熟人的行列,组建了 mellanox。
他回忆说,kagan几乎每周都拒绝加入初创公司的提议,但 mellanox 及其联合创始人团队和远见吸引了他。他说,他认为这是一次“引人入胜的冒险,一个建立公司的机会基于我成长的核心价值观的文化:卓越、团队合作和承诺。”
他说,在他在那里的 21 年里,他没有后悔。
“这是我做过的最伟大的决定之一,”他说。“它最终使我生活的方方面面受益:专业、经济和所有的一切。”
kagan 说,这家初创公司的突破性产品 infiniband 专为今天的云计算而设计。
“我们采用了 infiniband 的优点并将它们固定在标准以太网之上,”他说。“因此,我们成为了最先进的高性能计算网络供应商。500 强计算机公司中超过一半的机器使用 mellanox 互连,现在是 nvidia 互连。
“大多数云提供商,如 facebook、azure和阿里巴巴,都使用 nvidia 的网络和计算技术。无论你在互联网上做什么,你最有可能通过我们设计的芯片运行。”
kagan 表示,mellanox 和 nvidia 之间的合作是“自然的”,因为两家公司已经合作了近十年。
“我们作为独立公司提供了很多创新解决方案,”他说。
bluefield 和 omniverse 超级计算机
过去两年,作为 nvidia 的 cto,kagan 已经将他的关注点从单纯的网络转移到集成多种 nvidia 技术,包括构建 bluefield数据处理单元和omniverse实时图形协作平台。
他表示,英伟达对未来数据中心的愿景基于其三款芯片:cpu、dpu 和 gpu。
“这三个支柱与最初在 mellanox 开发并在 nvidia 进一步开发的非常高效和高性能的网络相连,”他说。
bluefield dpu 的开发现在是 nvidia 的重中之重。它是一种芯片上的数据中心基础设施,针对高性能计算进行了优化。它还卸载、加速和隔离各种网络、存储和安全服务。
“在数据中心,你无法控制你的客户是谁,”kagan说。“客户很可能是一个坏人,想要侵入他的邻居或你的基础设施。你最好通过让一个隔离的或不同的计算平台运行操作系统来将你自己和其他客户彼此隔离开来,这基本上是基础设施管理、资源管理和供应。”
kagan 对 omniverse 感到特别兴奋,这是一种新的 nvidia 产品,它使用皮克斯的通用场景描述软件来创建虚拟世界——这就是众所周知的元宇宙。kagan 将 3d 平台描述为“通过收集数据和对世界进行物理上准确的模拟来创造一个世界”。
汽车制造商正在使用 omniverse 来试驾自动驾驶汽车。无需在各种条件下在不同类型的道路上实际驾驶汽车,而是可以生成有关虚拟世界的数据来训练 ai 模型。
“你可以创造汽车必须在现实世界中处理但你不希望它在现实世界中遇到的情况,比如车祸,”kagan说。“你不想让汽车撞车来训练模型,但你确实需要让模型能够处理道路上的危险情况。”
omniverse 平台可以生成数百万公里的合成驾驶数据,速度比实际驾驶汽车快几个数量级。
kagan说,英伟达正在大力投资自动驾驶汽车技术。
该公司还在建造它所谓的最强大的气候科学人工智能超级计算机:earth-2,地球的数字双胞胎。earth-2 旨在持续运行模型以预测区域和全球层面的气候和天气事件。
kagan说,气候建模技术将使人们能够尝试减缓全球变暖的技术,并了解它们在 50 年后可能产生的影响。
该公司还与医疗保健行业密切合作,开发基于人工智能的技术。它的超级计算机通过生成合成数据来帮助识别癌症,使研究人员能够训练他们的模型以更好地识别肿瘤。kagan说,它的人工智能和加速计算产品还有助于药物发现和基因组研究。
“我们实际上正在以相当不错的速度前进,”他说。“但问题是,你总是需要重新改造自己,更快更好地完成新事物,并且基本上以你拥有的东西取胜,而不是寻找无限的资源。这就是承诺的意义。
声明:本文版权归原作者所有,转发仅为更大范围传播,若有异议请联系我们修改或删除


2023年Q1全球芯片市场分析 芯片行业何时走出“寒冬”?
iPhone X购买巨划算,美国日本才是最便宜
Lattice正朝着网络边缘领域进军
MAX15003三输出buck控制器
这是一个iPhone8和三星S8都无法解决的问题,你别奢望了!
英伟达CTO谈DPU:这是我们的重中之重
立讯精密入选“2021中国数字经济产业示范样本50”
简述如何使用Harmony的动态驱动和状态机来编写程序
美军无人机文件流出 路由器是罪魁祸首
云计算、大数据与AI之间的相互关系
“数”说智造,为企业赋能
OPPO Reno3系列录屏曝光:可智能切换5G、4G网络
射频、微波天线技术探讨
物联网开发之个性化的网关设计分析
2020年中国锂电池总出货量158.5GWh,电池占新能源汽车成本40-50%
Microchip专家技术文章:热电偶信号调理
三星s8配色抢先曝光,超大屏占比,今晚发售!
人工智能潜力爆发,重庆发力AI技术创新
几个优秀的开源C语言开源项目
iphone常见硬件故障之-不充电