高性能计算市场规模稳步增长,应用范围更加广泛

据trendforce报告显示,2021年全球高性能计算(hpc,high performance computing)的市场规模约为368亿美元,比2020年增长7.1%,预计2022年将会增长7.3%,达到397亿美元。增长的主要驱动力来自数据中心、自动驾驶以及智能制造等领域对计算能力需求的提升。
从市场分布来看,美国是hpc最大的市场,约占市场总量的48%,其次是中国和欧洲市场,合计占了35%左右。那么,hpc主要有哪些应用呢?其实,高性能计算一直都是用来解决人类面临的最大挑战,比如气象预测、灾害预警、太空探索、基因测序以及智能制造等场景。
精准气候预测 自从有计算机后,气象局就是使用最频繁、用得最好的单位之一。气象局需要对天气的变化做出预测,而如果想要有效地模拟区域气候变化,并做出精准预测的话,就需要一台比现在大十亿倍的超级计算机。
来自 nvidia、加州理工学院、伯克利实验室、普渡大学、密歇根大学和莱斯大学的研究人员开发了一个名为 fourcastnet 的天气预报 ai 模型。fourcastnet 是一种基于物理信息的深度学习模型,可以预测飓风、大气河以及极端降水等事件。fourcastnet 以欧洲中期天气预报中心 (ecmwf) 长达 40 年的再分析数据为基础,学会了如何预测天气。
据了解,这是深度学习模型首次在降水预测方面的准确率超过了先进的数值模型,而且将预测速度提高了4到5个数量级,也就是说,传统的数值模拟需要一年时间才能完成的计算,现在只需要几分钟。
大气河是天空中巨大的水汽输送带 ,其输送的水汽量比亚马逊河的流量还要多。大气河一方面为美国西部提供了关键的降水来源,但另一方面,这些巨大的强风暴也会导致灾难性的洪灾和暴雪。
据nvidia的ceo黄仁勋介绍,此 gpu 加速的 ai 数字孪生模型 fourcastnet,由自适应傅里叶神经算子提供支持,基于 10 tb 的地球系统数据进行训练,依托这些数据,以及 nvidia modulus 和 omniverse,该模型能够提前一周预测灾难性大气河的精确路线。
更重要的是,在一块 nvidia gpu 的助力下,fourcastnet 只需几分之一秒即可完成预测。凭借如此快的速度,我们可以生成数千个模拟场景,探索所有可能的结果。与以往相比,人类能够更加自信地量化灾难性洪灾的风险。
其实,hpc主要是通过多台高速互联的服务器进行并行计算,从而达到提升整体计算能力,对cpu、gpu、存储和主板等都有较高的要求。fourcastnet之所以能如此精准快速地预测天气,主要得益于nvidia的高性能gpu的支持。不久前,nvidia更新了其gpu产品线,推出了其核弹级产品基于新一代hopper架构超级芯片h100,让gpu的性能更上一层楼。
性能更强的gpu和cpu是高性能计算的性能保障 据其官网介绍,h100 是一款超大的芯片,采用了 tsmc 4n 工艺,具有 800 亿个晶体管,可以实现纵向扩展和横向扩展。h100 是首款支持 pcie 5.0 标准的 gpu,也是首款采用 hbm3 标准的 gpu,单个 h100 可支持 40 tb/s 的 io 带宽。从另一个角度来说,20 块 h100 gpu 便可承托相当于全球互联网的流量。
h100采用最新的 hopper架构,相比前一代ampere架构,h100有更强的性能,并采用的新的tensor处理格式:fp8;采用风冷和液冷设计,是首个实现性能扩展至700瓦的gpu;在ai方面,hopper h100 fp8 的 4 petaflops 性能是 ampere a100 fp16 的 6 倍,且引入了transformer 引擎;在云计算方面,多租户基础架构能够直接转化为收益和服务成本,一块h100 可划分为多达 7 个实例,能够托管7个云租户;此前,机密计算只能基于 cpu,而hopper 实现了首个 gpu 机密计算;此外,h100引入了一组名为dpx的新指令集,可加速动态规划算法。
图:借助nvlink连接,dgx使8块h100成为了一个巨型gpu(来源:nvidia)
在封装方面,h100 采用 tsmc cowos 2.5d 封装,搭载了 hbm3 显存,并与电压调节集成至 sxm 的超级芯片模组中。8 个 h100 sxm 模组通过主板上的 4 个 nv switch 芯片相连可构建成更为先进的ai计算基础架构。比如dgx就是借助nvlink连接,让8块h100成为了一个巨型gpu,其包括了6400 亿个晶体管、32 petaflops 的 ai 性能、640 gb hbm3 显存,以及 24 tb/s 的显存带宽。
此外,dgx还可以进一步扩展,借助nvlink switch,可以连接多达32个dgx,也就是说,dgx只是最小的计算单元,通过 nvlink switch 系统,可以将其扩展为一个巨大的拥有 32 个节点、256 个 gpu 的 dgx pod,并且 hbm3 显存高达 20.5 tb,显存带宽高达 768 tb/s。
其实,除了gpu产品,nvidia在今年还推出了一个新的产品------针对数据中心的grace cpu 超级芯片,它集成了两个基于arm的cpu,有多达144个高性能arm neoverse核心,并且支持arm新一代矢量扩展指令集和1 tb/s的内存子系统,支持最新的pcie 5.0协议,可实现与gpu之间最高性能连接,同时还能连接nvidia connectx-7智能网卡以及nvidia bluefield-3 dpu。令人惊叹的是,整个模组(包括内存)的功率仅为 500 瓦。
isc 2022上,英伟达cpu+gpu的产品组合获得了认可,美国和欧洲的领先超级计算中心都将率先采用这两款超级芯片。
美国阿拉莫斯国家实验室(lanl)的新一代系统venado将成为美国首个采用nvidia grace cpu技术的系统。venado是使用hpe cray ex超级计算机构建而成的异构系统,将同时配备grace cpu超级芯片和grace hopper超级芯片,这一系统建成后的ai性能预计将超过10 exaflops(exaflops : 每秒10的18次方,百亿亿次)。
图:nvidia推出的液冷gpu
另一个率先采用英伟达grace cpu和 hopper gpu的系统是瑞士国家计算中心的新系统alps,该系统基于hpe cray ex超级计算机构建,这是一个通用系统,向瑞士及其他国家的研究者开放。
英伟达还宣布,源讯、戴尔科技,技嘉科技、慧与、浪潮、联想和超微宣布计划部署基于grace cpu和grace hopper超级芯片的服务器。
dpu为hpc提供强大助力 在nvidia于2020年提出dpu(data processing unit)数据处理器这一概念后,dpu成了数据中心市场竞相追逐的新潮流。dpu成了数据中心里除了cpu和gpu之外的第三大处理单元。通常这些dpu具备高速网络连接性,其作用说起来很简单,那就是优化数据中心里数据的移动,而cpu和gpu则专注于计算,从而腾出宝贵的计算资源用于其他价值更高的工作。
在欧洲和美国,hpc 开发者正在利用 nvidia bluefield-2 dpu 内的 arm 核和加速器的强大功能为超级计算机提供强大助力。
美国洛斯阿拉莫斯国家实验室 (lanl) 正在与 nvidia 进行一项为期多年的广泛合作,这项合作旨在将计算型多物理应用的性能提高 30 倍。
lanl 研究人员预计,使用在 nvidia quantum infiniband 网络上运行的 dpu可显著提升性能。这将使利用 bluefield 以及nvidia doca 软件框架在计算存储、模式匹配等领域实现技术创新。
德克萨斯高级计算中心 (tacc) 近期也开始在 dell poweredge 服务器中采用 bluefield-2。它将在 infiniband 网络上使用 dpu,使其 lonestar6 系统成为云原生超级计算的开发平台。tacc 的 lonestar6 为德州农工大学、德州理工大学和北德克萨斯大学的众多 hpc 开发者,以及一些研究中心和教职人员提供服务。
另外,据公开信息显示,剑桥大学、伦敦和慕尼黑的研究人员也在使用dpu。伦敦大学学院正在探索如何在 bluefield-2 dpu 上为主机系统调度作业。例如,可以使用它的能力在主机处理器之间移动数据,以便在需要时数据已然就位。dell poweredge 服务器内的 bluefield dpu 可为 cambridge service for data driven discovery 服务卸载主机 cpu 的安全策略、存储框架和其他作业,从而更大限度地提高系统性能。在美国,佐治亚理工学院的研究人员正在与桑迪亚国家实验室合作,利用 bluefield-2 dpu 加速分子动力学研究。一篇论文描述了他们目前的工作成果,结果表明,算法可以加速高达 20%,且不会损失模拟的准确性。
结语 其实,很多地方都在大量使用hpc,比如说互联大电网在线安全分析。经过百年的发展,电力系统已经成为了世界上最大的人工动态系统,在电网双碳战略实施,电力系统快速演进,日益运行于稳定边界的大电网,安全问题,日益突出。此时,如果想要建立互联大电网及关键设备的“影子系统”,实现快速仿真和分析,完成分钟级、甚至是秒级在线制定电网安全策略的话,就需要hpc的支持。
还有个性化医疗的智慧医疗、预测我们星球的未来的气候变迁、了解我们的星球和宇宙的太空探索、预防疾病的基因研究、灾害预警的地震数据处理、保证食品安全的智慧农业、具有更好的质量和成本的智能制造等等应用场景都是hpc的用武之地,未来性能更强的hpc,定然能够给人类生活带来更多的便利,解决人类目前面临的很多挑战。

示波器通道耦合与触发耦合的区别
玩王者荣耀延迟高怎么办?选一颗骁龙强芯
Intel在今年迎来50岁生日,欧洲一些在线网站已经列出了i7-8086K处理器,价格达到480欧元
如何使用LTspice进行瞬态分析和噪声源仿真?
发展面向实用化的高能量密度锂硫电池
高性能计算市场规模稳步增长,应用范围更加广泛
OpenHarmony数字管家是什么
一季度芯片进口同比下降 22.9%额减少2000亿元
今天我们大家一起来探讨一下关于PCBA生产中的问题
跻身全球智能机市场前五的传音控股:蛰伏之后,全球新兴市场昂首前进
基于DSP和电压反馈的机器人多轴运动控制器设计
贺利氏:看好电动汽车市场 发力挖掘传感器商机
linux重启网络服务
如何选择更适合自己的云OA?
2月14号红米note4x发布会,小米5c和小米6会同步登场吗?
对于手机的性价比来说,骁龙870是一个不错的选择
MS4989:64 微细分步进电机驱动器
Select、Switch组件的使用
STM32大小端序与堆栈及其增长方向分析
曾经的魅族科技三剑客,曾经的手机巨头怎么了?