近年业界在深度神经网络(dnn)技术发展上进展迅速,正对半导体ic设计与制造形成深刻的变革,2018年全球首款商用化dnn专用芯片将开始出货,或成为至今价格最高且最大的商用芯片,外界预期2018年将成为这类芯片相继问世的一年,而过去几年dnn技术开发的兴起,也带动创投资金重回半导体产业,可见近来基于新架构的新创企业数量大增、达15家以上,这在过去10~15年来在单一产业领域未曾见过的景象。
据ee times报导,预计2018年可能见到如英特尔(intel)收购的2.5d nervana芯片已在送样,还有10多个处理器正在开发中,其它如人工智能(ai)新创企业graphcore及其竞争对手cerebras systems均可望推出自有芯片产品,威腾(wd)与安谋(arm)等几家芯片业者也在开发自有核心,用以加速深度神经网络的推论部分。
市场研究机构the linley group负责人linley gwennap指出,nvidia在其最新绘图芯片(gpu)「volta」开发上表现非常出色,调整用于加速dnn训练,不过gwennap不认为这是最好的设计。
在训练芯片方面,英国graphcore及美国加州cerebras被视为是值得关注的公司,因拥有最好的团队且募得最多资金。由google前芯片设计师创立的新创企业groq计划于2018年推出一款推论芯片,宣称在每秒整体操作及推论效能表现上,比竞争对手高出4倍。
代号「lake crest」的英特尔nervana芯片则为一大值得关注的客制化设计,与nvidia volta相似的是,lake crest逻辑元件位在台积电cowos中介层中,与4个hbm2高带宽存储器堆叠相邻,这些芯片也被设计成网状,提供比volta高出5~10倍的效能表现。
虽然这类ai芯片将问世,不过芯片架构师仍未决定应如何进行评估。加州大学柏克莱分校荣誉教授david patterson指出,过去risc供应商在spec基准测试上进行合作,如今dnn加速器需要自行定义的测试套件,涵盖一系列资料类型的训练、推论以及独立且丛集的芯片。
因此由超过20家主要伺服器及软件制造商组成的服务器效能评测标准组织(tpc),于2017年12月12日宣布已组成工作团队,来定义机器学习的硬件及软件基准,tpc-ai委员会主席raghu nambiar指出,目标是要创建不论是以中央处理器(cpu)或gpu做为加速器都适用的测试。
基准测试之外,工程师还需要追踪仍在演化的神经网络算法,以确保其设计能获得采用。高通(qualcomm)下一代核心研发主任karam chatha表示,由于硬件将对软件形成影响,在软件总是在变化下,有及早推出硬件的必要性,至今行动芯片供应商在其snapdragon系统单芯片(soc)的dsp及gpu核心上的软件运行神经网络任务,不过部分观察家预期,高通将为2019年版7纳米snapdragon soc客制化一款全新机器学习芯片。
随着算法持续演进,研究人员也在扩大深度学习的应用面向,包括导入芯片设计及制造端,如英特尔汇整出超过40多项可能的用途领域,如华尔街采用的自动化交易程序及消费者在线消费助理等应用领域等。
另外,近期可见关于神经网络软件技术的融合努力,如由facebook与微软(microsoft)开启的开放源计划「开放神经网络交换」(qnnx)格式,有助将所创造的神经网络模型转换成图形(graphical)呈现方式,芯片制造商则能在最终图形上锁定期硬件,这对无法自行编写软件支持运算模式架构的新创企业如亚马逊(amazon)旗下mxnet、google的tensorflow、facebook的caffe2及微软cntk来说,自然是一好消息。
另由30多家主要芯片供应商组成的团体,也发布其「神经网络交换格式」(nnef),旨在提供芯片制造商可创建自有内部格式的替代解决方案,好比是nvidia的tensorrt及英特尔的nervana graph。
展望这类ai芯片发展前景,以半导体产业来看,patterson指出,随着英特尔、graphcore及nvidia已开发出全标线(full-reticle)芯片,下一阶段则是发展3d技术,过去在摩尔定律(moore’s law)发展火红时,基于忧心可靠性及成本问题,导致较复杂的封装技术无法获得采用青睐,但如今摩尔定律终止在即,将可在封装技术上看到许多试验在进行。最终是可开创出新形态的晶体管,可在逻辑与存储器层上进行on-die堆叠。美国电子工程学界人士认为,负电容铁电晶体管技术或可能成为上述芯片技术的基础,与3d nand相同的是均采on-die堆叠技术。
另外,美国麻省理工学院(mit)、柏克莱大学(uc berkeley)与史丹佛大学(stanford university)组成的学术团队,也将于2月国际固态电路会议(isscc)上发表类似技术的先进芯片架构,是将reram结构及碳纳米管制成的逻辑元件堆叠于芯片中,此技术灵感来自于dnn、且被程序设计为近似模式,而非至今计算机采用过的确定性数字,这类芯片可从案例中进行学习,比传统的系统所需操作要少得多,测试版芯片不久后将送交制造。
压缩空气露点仪应该怎么安装
我国动力电池业进入深度洗牌期 行业集中度也会将逐步提高
1.5V~3 0V开关稳压电源电路
常见的数字货币钱包有哪些
电池维修技术学习——放电化学反应方程式(网友问题解答)
深度神经网络变革发展迅速正对半导体IC设计与制造形成深刻的变革
如何增强双层石墨烯的超导性
世界芯片排名一览表 2021年芯片十大品牌有哪些?
基于SWD离线烧写OTP
直线马达立体式车库市场占有率正逐年增加
10大无人机新品燃爆2016 谁是真正上帝之眼?
沐渥共享饮水机开发让饮用水更放心
在嵌入FPGA的IP核8051微处理器上实现UIP协议栈的设计方法
基于FPGA和DDS+PLL器件实现跳频信号发生器的设计
工控机在电力系统中的作用
医疗物联网的的解析
可穿戴设备功能新趋势:有能力预判新冠症状
2018合肥网络安全大会成功召开:致力中国数字化转型
对话吴恩达:Landing.ai为何重要?或许以下几点值得注意
碾压高通击溃欧美!华为拿下5G时代