HPC硬件的设计面临哪些挑战

晶体管的复杂程度持续走高,加上晶圆厂不断增加的设计规则,不少ic设计公司都发现自己陷入了一个你追我赶的境地。半导体设计如今需要额外的高性能计算资源才能保证开发的速度和质量,一旦这些资源没到位,工程师就都会受到限制,他们自己开发的硬件在追逐性能目标的同时,手头的设计工具也提出了一个不低的性能指标。
行业面临的设计挑战
如今芯片设计面临着诸多挑战,成本与良率、晶体管效率、裸片尺寸限制以及功耗与性能的取舍等等。这些挑战对任何公司来说都是需要攻克的难关,就拿amd来说,在他们的芯片设计中,预计2023年的逻辑门数将是2013年的225倍,要完成这样的设计工作,所以无论是eda还是fpga都得加入这轮军备竞赛,而且产品发布周期和质量目标使得amd必须保持这个节奏。
晶体管数量对eda提出了更高的要求,比如amd的versal premium acap拥有920亿晶体管,未来将发布的instinct mi300拥有1460亿晶体管,而这种晶体管密度下的设计并不是单靠制造工艺的演进就能解决的。以晶圆厂和eda厂商不断强调的dtco(设计与工艺协同优化)为例,在台积电给出的数据中,5nm到16nm这个范围内,面积上的改进基本都是靠制造工艺的提升,而到了3nm这个节点,dtco所占功劳已经近乎一半。
可如果不通过高性能计算硬件的辅助,是难以实现这等量级的设计自动化的。尤其是在先进工艺的后端设计上,需要更多的多线程运算、更长的运行时间,也面临着更大的内存和数据压力。
hpc硬件带来的改变无论是高性能多核cpu,还是最新的gpu或asic加速器,都为eda带来了性能上的飞跃。比如利用ansys的eda工具在应用amd的instinct gpu后,其求解器速度提高了三到六倍,而epyc 7003处理器的超大三级缓存,也让其在仿真工具负载上有了1.48倍的性能提升。
另一个显而易见的趋势,就是hpc与ai的交集。过去的hpc节点中,x86处理器才是负责各种工作负载的主体。尽管如今这一点并没有改变,但我们可以看到ai已经成了hpc上不可或缺性能指标,所以无论是特定域加速的ai加速器还是gpu,也都在hpc机器上普及,eda也同样因此受益。
比如通过ai将验证和测试线性化,从而直接预估综合的结果质量,减少对仿真的需求,又或是利用生成式ai来扩展设计空间和完成自动优化,以及通过ai来完成掩模优化,进一步提高良率等等,而这些都需要hpc硬件拥有一定的ai计算能力,才能满足eda愈发算法化的自动化工作。
更何况就连gpu本身的设计也开始用上ai,以英伟达的hopper h100 gpu为例。英伟达在设计h100的算数电路时用到了深度强化学习模型prefixrl,在整个h100的架构中,就有近13000个实例是完全由ai来设计的。
可打造这样一个模型需要的硬件资源也不可小觑,比如每个gpu的物理仿真需要用到256个cpu,训练一个64位加法器电路就需要32000个gpu工时。但结果是喜人的,prefixrl ai设计出来的加法器电路与最先进的eda工具设计的电路性能和功能相当,但面积却小上25%。可以看出在ai这块,就连eda厂商自己也还有不少提升的空间。
云端hpc的加入可在hpc硬件如此高昂的价格下,不少ic设计公司,尤其是初创企业,都望而却步,因为他们承受不起打造这样一个基础设施的成本,比如有的eda公司的专用硬件加速服务器就要千万元一台。哪怕自己有达标的硬件资源,也不像eda厂商预优化的硬件平台那样高效。
所以eda厂商纷纷与云服务厂商合作,开始打造eda的云hpc平台,云端按需使用的付费模式和对hpc硬件资源的灵活分配,大大降低了设计成本。像亚马逊这样自己也投身半导体行业的云服务厂商,每年也会完成多次流片。为了展示hpc云实例的性能,他们拿自己来作为范例,aws的gravition、inferentia等服务器芯片,从rtl到gds2,也都是全部在aws云上完成的。
结语hpc硬件的设计离不开先进的eda软件工具,可越来越复杂的设计要求,也使得eda工具开始依赖hpc硬件才能发挥全部优势,这种闭环推动了整个半导体行业延续并超越摩尔定律。而下个时代迎来了chiplet和3d封装,也为eda带来了布线、时序和信号完整度等方面的更大挑战,为了迎接这一挑战,也是时候加大在eda硬件上的投入了。


USB-C成为供电标准
等离子喷涂工艺绝缘轴承的正确安装方法
晶科成为全球首家通过科学碳目标SBTi全部审验的光伏企业
图灵的新想法:让计算机来冒充人!
国网冀北:坚持推动清洁能源发展,打造可再生能源智能电网创新示范区
HPC硬件的设计面临哪些挑战
Mate 9副卡也能支持联通3G?麒麟960处理器又带来了惊喜!
直放站的技术特点
光纤的传输速率和传输优势
海尔智家土耳其干衣机工厂开业暨洗碗机工厂奠基
ADI与百度合作,推动百度自动驾驶技术的开发
手机快充哪家强?魅蓝E2、努比亚Z17、小米Max2、华为P10区别评测对比
uwb技术有什么作用_uwb技术主要应用于哪些方面
戴森今年将发布空气净化耳机,同享洁净空气与纯净音质
FDD加速国产手机变局,9成中小品牌消亡
i.MX 93的机器学习能力有多强?这6个应用范例告诉你
Python成为2018年度编程语言,理由如下
外星人推出低配版m15游戏本,高强度铝合金机身
努比亚Z18确定9月5日发布 正巧与荣耀8X撞车
三星探知未来科普创新大赛 帮助中国青少年实现科技梦