浅谈DRAM的常用封装技术

处理器,无论是cpu、gpu、fpga,还是npu,要想正常运行,都离不开ram,特别是dram(动态随机存取存储器),它已经成为各种系统(pc,手机,数据中心等)中内存的代名词。根据应用不同,系统对芯片面积和功耗有不同要求,因此,dram被分成标准ddr(双倍数据速率)、lpddr、gddr等,当然,主要就是这三类。其中,ddr是相对于sdr(单数据速率)而言的,将i/o时钟加倍了,主要为pc和数据中心的cpu服务,目前已经发展到ddr5;lpddr是低功耗的ddr,主要用于手机等便携式设备;gddr则是gpu专用dram。
在高性能计算(hpc)和ai发展如火如荼的当下,一个很大的瓶颈就是处理器与dram之间的通信速度,越来越跟不上应用需求的前进脚步。对此,人们想出了多种方法,以提升通信带宽,如不断提升dram本身的接口性能,以及存算一体等,但从实际应用情况来看,只提升接口性能是不够用的,而存算一体短期内还无法实现。在这种情况下,推出更好的dram与cpu、gpu等处理器的结合形式,也就是不断让封装技术进步,成为了业界提升通信带宽的普遍共识。
01dram的常用封装技术
dram封装技术几经变迁,从双列直插封装dip、j型引脚小外形封装soj、薄型小尺寸封装tsop、底部引线塑料封装blp、焊球阵列封装bga(f-bga、w-bga),发展到芯片级封装csp、堆叠封装等高性能封装方式。在成本允许的条件下,可尽量采用先进的封装技术,以提升dram性能。目前,堆叠封装技术,特别是系统级封装(sip),可以在有限的空间内成倍提高存储器容量,或实现电子设计功能,解决空间、互连受限等问题。此外,由于封装设计的变化,引线键合封装因具有灵活性、可靠性和低成本的优点而备受青睐。倒装(flip chip,fc)芯片于2016年开始进军dram封装,由于高带宽需求的推动,倒装芯片在pc、服务器中的采用率不断增加。
目前,系统对高带宽、高性能、低延迟的综合要求很高,硅通孔(tsv)很适合高带宽内存封装需求。在便携式电子设备应用中(如手机),dram的封装尺寸会直接影响到产品的体积大小,所以,封装技术要向轻、薄、短、小方向发展。不同应用的产品尺寸、性能、形态等存在差异,采用的封装形式也不同。其中,移动终端dram(lpddr)多以wb-fbga为主,pc和服务器用的标准型ddr则以fbga、fc为主。以ddr为例,fbga线长较短,信号传输好且成本较低,曾经被三星、sk海力士和美光等主流厂商广泛采用,随着内存条产品发展到ddr4,三星、sk海力士的很多产品开始转向fc封装,其传输路径更短,电性能表现更好。
尽管fc的成本比fbga高,但得益于规模效应,两者成本基本持平。现在的高端产品,如ddr5,性能要求很高,目前多采用tsv堆叠封装。tsv采用纵向穿越结构,通过导线将不同层的芯片相互连接起来,这种连接方式不仅提供了更高的信号带宽,还减少了电阻和电感,提高了芯片的整体性能。通过tsv把多芯片的i/o连接,同时实现多芯片堆叠来扩容并实现更小的信号损失。lpddr与处理器紧密集成在一起,或者焊接在主板上,靠近cpu,或者直接在处理器(在这种情况下,通常是soc)的顶部以 package-on-package封装的形式出现,这种形式越来越常见。紧密的集成可减少将内存连接到处理器的长导线中的电阻,从而降低功耗。总体来看,引线键合是主要的封装方法,广泛应用于移动存储器,其次是倒装芯片封装,其在dram市场不断拓展。
02hbm带动封装技术再创新
目前,ai服务器对hbm(高带宽内存)的需求量越来越大,因为hbm大大缩短了走线距离,从而大幅提升了ai处理器运算速度。hbm经历了几代产品,包括hbm、hbm2、hbm2e和hmb3,最新的hbm3e刚出样品。hbm是一种应用于cpu和gpu的新型内存,它将多个ddr芯片堆叠在一起后和gpu封装在一起,主要通过tsv技术进行芯片堆叠,通过贯通所有芯片层的柱状通道传输信号、指令和电流,以增加吞吐量并克服单一封装内带宽的限制,实现了大容量、高带宽的ddr组合阵列。hbm3带宽可以达到819gb/s。
目前,全球三大存储芯片厂商都在开发hbm技术和产品,其中,三星和sk海力士已经量产了hbm3,主要用于英伟达的h100、h800和amd的mi300系列gpu,三星预计于2024年第一季度送样hbm3e,下半年量产,sk海力士则于近期给英伟达送去了hbm3e样品,其最新的gpu芯片h200已经标配了hbm3e。美光(micron)则相对落后,该公司选择跳过hbm3,直接开发hbm3e。传统封装技术已经难以满足hbm的需求,而台积电的cowos(chip-on-wafer-on-substrate)封装则是较为理想的方案。
cowos是一种集成逻辑和hbm芯片的2.5d封装技术,在这种封装中,处理器和hbm在硅中介层上并排键合,以形成具有细间距和器件之间高密度互连布线的晶圆上芯片(cow)。每个hbm都由带有微凸块的dram和一个带有tsv的逻辑基座组成,然后完成在基板上具有较大凸块的tsv中介层的组装。
多年来,cowos一直在追求不断增加硅中介层尺寸,以支持封装中的处理器和hbm堆栈。目前,cow是倒装芯片键合最常用的组装方法,它采用了一种称为混合键合方法的无凹凸技术。cowos产能不足是近期ai芯片出货量的主要瓶颈,以台积电为代表的厂商正在扩充相关产能,以满足市场需求。
03先进封装大战
台积电在2011年就开始布局cowos了,并陆续获得多个客户订单,但由于报价昂贵,加上相应的需求有限,因此,前些年的产能没有明显增加,但是,进入2023年以来,特别是aigc需求爆发,台积电开始大幅扩建cowos产线。目前,除了台积电,英特尔、三星等芯片制造大厂也在加大先进封装投入力度。英特尔方面,预计该公司最新先进封装服务将在2026年投入量产。不同于其它竞争对手主要采用硅制程的中间层技术,英特尔选择用玻璃基板,其成本会相对较高,业界采用该方案的厂商较少。对于赶超台积电hbm先进封装技术最为积极的是三星。2021年,三星推出了2.5d封装技术h-cube。今年9月,据etnews报道,为了追上台积电ai芯片的先进封装,三星将推出名为fo-plp的2.5d封装技术。
据悉,fo-plp可将处理器和hbm整合到硅中介层。据悉,fo-plp的基板是方形,而台积电的cowos是圆形基板,fo-plp不会有边缘基板损耗问题,但由于要将芯片由晶圆移植到方形基板,其作业较为复杂。近期,三星还推出了最新的封装技术saint,包括saint s(垂直堆叠内存和cpu),saint d(用于cpu、gpu和内存的垂直封装),saint l(用于堆叠应用处理器)。
消息人士称,saint s已经通过了验证测试,在与客户进行进一步测试后,三星将于2024年推出相应的商业服务。最近,三星hbm3及其封装服务通过了amd的质量测试,后者计划将这些芯片和服务用于其最新的gpu芯片instinct mi300x。此前,amd曾考虑使用台积电的封装服务,但由于后者的cowos产能严重供不应求,amd不得不改变计划。据韩国消息人士透露,三星还在与英伟达进行hbm3芯片技术验证,并提供封装服务。一旦工作完成,预计三星将负责英伟达h100 与hbm3的封装,据悉,这两家公司签署了一项服务和供应协议。今年6月,三星成立了多芯片集成联盟,目的是与存储芯片公司、外包半导体封装和测试公司(osat),以及芯片设计公司共同推进封装技术。
在先进封装技术研发方面,没有芯片工厂的amd也是不遗余力,特别是在hbm和gpu、cpu封装方面。在isscc 2023国际固态电路大会上,amd提出了多种新的封装设想,其中之一是在服务器cpu模块内部,直接堆叠内存,而且是多层堆叠。一种方式是将cpu模块和内存模块并排封装在硅中介层上,另一种方式是在计算模块上方直接堆叠内存,有点像手机soc。
amd表示,这种设计可以让计算核心以更短的距离、更高的带宽、更低的延迟访问内存,还能降低功耗。如果堆叠内存容量足够大,主板上的dimm插槽都可以省了。amd甚至考虑在instinct系列gpu已经整合封装hbm的基础上,继续堆叠dram,但只有一层,容量不会太大。这样做的最大好处是一些关键算法可以直接在此dram内执行,不必在cpu和独立内存之间往复通信,从而提升性能、降低功耗。amd还设想在2d/2.5d/3d封装内部,集成更多模块,包括内存、统一封装光网络通道物理层、特定域加速器等,并引入高速标准化的芯片间接口通道(ucie)。
04结语
3d封装是未来发展方向,这种多层结构有很多优点:一、它通过增加芯片层次和连接方式,实现了更高的芯片集成度和功能密度;二、多层堆叠结构减小了整个芯片的体积,使得电子设备变得更加轻薄便携;三、多层堆叠提供了更高的性能和效率,可进一步优化电子设备的处理速度和能耗。hbm所涉及的封装已经是当下最先进的内存封装技术了,不过,技术进步的脚步一直没有停歇,在扩充现有先进技术产线的基础上,各大厂商还在研发更具前瞻性的技术。
据悉,三星电子先进封装(avp)事业组正在研发新一代内存技术“cache dram”,目标是在2025年开始量产。与hbm相比,cache dram功耗效率可改善60%,延迟将减少50%。封装技术方面,cache dram与hbm也有很大区别,hbm是水平连接至gpu,cache dram则是与gpu垂直连接。当然,不止三星,英特尔、台积电、日月光等大厂都在开发新的内存封装技术,但具体情况还不得而知。在研发先进封装技术的道路上,需要解决的难题也很多,例如,随着堆叠层数的增加,热量的管理问题越来越凸出,因为在紧密堆叠的芯片中,热量散发变得更加困难。对此,科学家们正在不断寻找解决方案,以保持芯片高性能工作状态的稳定性和可靠性。


“531”过后的市场混乱 谁之错?
CD-ROM的读取速度
铝空气电池会替代锂电池吗
数字资产交易所开发|区块链交易所开发
模拟信号的基本原理和信号编码方案介绍
浅谈DRAM的常用封装技术
分析稳定系统中的惯性MEMS的频率响应
复旦微电推出三款MCU新品:FM33FG0xxA、FM33LF0xx、 FM33FK50xx系列
光伏将超过风电成为第三大电源
鲲云科技携可重构数据流技术出席全球AI芯片峰会
诺基亚推出了一个全新的Wi-Fi 6产品Beacon 6
采用CPLD的光伏逆变器锁相及保护电路设计
中国移动12月净增5G用户1762.1万,但是整体用户依然出现流失
先进的MPS同步整流器原理与方案设计
MAX1777, MAX1977, MAX1999高效率四路输出主电源控制器
Com合作提供面向低成本IoT市场的集成式LTE Cat
汽车主要的六大领域芯片
LED的应用优势及存在问题
一颗32.768KHz 3225尺寸TCXO(DSK321STD)
前端工程师应该怎样提升自己