骁龙855的AI性能比麒麟980更强?

摘要:前段时间的高通发布会上,有关骁龙855 ai性能达到友商竞品两倍的言论可谓是赚足了眼球。高通指出,骁龙855针对cpu、gpu、dsp都进行了ai计算优化,结合第四代ai引擎可以实现每秒超过7万亿次运算(7 tops)的ai算力。
高通在发布会上指的“友商”,特意点名是安卓平台另一款使用7nm工艺的处理器,目前三星最新的处理器exynos 9820是基于8nm工艺打造,苹果a12芯片虽然使用了7nm工艺,但平台不同很难比较。言下之意,这里的“友商”很明显就是指的华为的最新处理器麒麟980。
说到手机芯片的ai性能,麒麟980主要依靠独立内置的npu来支撑,这颗npu就是ai芯片创企寒武纪开发的1h处理器。而就在12月13日于清华大学举办的嵌入式人工智能大会上,寒武纪创始人兼ceo陈天石在演讲中提到:“前段时间高通发布骁龙855时宣称,其ai性能是友商竞品的2倍,我不知道这是不是在指我们,如果是,我不认为1h的ai性能会落后于骁龙855。”陈天石还表示,“在我们内部测试中,1h的测试结果非常优秀,测试峰值非常的高。如果高通有信心地话不妨公布测试结果,比一个高下。”
显然,火药味很浓。
难道,没有搭载独立的npu内核的骁龙855真的比搭载寒武纪1h处理器的麒麟980芯片在ai性能上强两倍吗?最近,这一话题在知乎上也得到了一些从业者的关注和讨论。智能菌整理如下:
知乎作者麦克阿摄认为:从7万亿这个数字来看,骁龙855是横扫苹果的a12和华为麒麟980的(根据970的数据,算上980的增幅,可得麒麟980的算力为4.2tops)。
但从aimark平台上的跑分成绩来看,高通855平台获得2.2万分,和麒麟980的得分2.15万分相差不大,这又是怎么一回事呢?
原来,高通得出这个所谓的7 tops算力,是基于cpu+gpu+dsp这三部分的总计所得。但不管是华为还是苹果,给出的ai算力数据都是来源于其单独的npu。
需要科普的是,cpu非常适合逻辑运算和整数运算,也可以进行浮点运算,但其效率低并且功耗高。随着技术和应用的发展,单单cpu已经难以满足是来自图形渲染的需求了,于是专门进行浮点运算的gpu应运而生,它大大提升了浮点运算的效率,降低了功耗。而ai主要是做卷积运算,需要超大量的浮点运算来支撑,但这里的浮点运算并不需要gpu提供那么高的精度,只需要更低精度的浮点运算就完全胜任,而这正是npu所最擅长的领域。另外,高通的发布会中也特别强调了dsp的设计,但这毕竟也不是什么新概念。从硬件角度来说,可能有所提升,但也绝不具备npu在ai计算上的专业和高效率。
知乎用户养猫的哈士奇认为:衡量ai性能没有统一的标准,有很多都指标,有的跑卷积、有的跑池化、有的跑浮点、还有跑挖矿的,这里的指标最重要的应该是卷积。
本着“大胆假设,小心求证”的思路,拜托一位搞ai研发的朋友跑了一下卷积运算。测试机型是搭载骁龙845的小米mix 2s和搭载a12芯片的iphone xs。如果按照高通的说法,骁龙855的ai性能是845的三倍。
结果显示,在基于ai神经网络实测的场景下,搭载骁龙845的小米mix 2s测试数据为10.39,而搭载苹果a12芯片的iphone xs测试数据为72.64,测试数据越高代表ai性能越强。如果骁龙855的ai性能是845的三倍,那么测试数据应该是31.17,这一数字远低于a12的72.64,但是苹果a12芯片对外公布的ai算力只有5 tops。是不是很奇怪?
那么,高通骁龙855所公布的7 tops是怎么得来的?
骁龙855公布的ai性能是通过cpu+gpu+dsp的方式来实现的,如果是这样这个数字基本没意义。因为在移动端能耗比是非常重要的指标,更何况cpu、gpu、dsp还有其它任务不能全力投入ai运算,高通骁龙855的在ai运算上的能耗比太低了。
以上知乎作者都认为,高通宣称的骁龙855可以达到7 tops 算力完全是用来吹牛逼的。
但从另外一个角度看,不管是华为麒麟980还是高通骁龙855,以现有的应用来看,其ai性能都是大量过剩的。因为手机中所谓的ai只是一个执行加速器,并不会用来进行训练,现在的性能根本用不完,很多厂家在这方面都制造了足够的噱头。
未来智能实验室是人工智能学家与科学院相关机构联合成立的人工智能,互联网和脑科学交叉研究机构。
未来智能实验室的主要工作包括:建立ai智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)云脑研究计划,构建互联网(城市)云脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。

【通知】XDS560v2仿真器外壳免费换新
多要素气象环境自动观测站的功能特点有哪些
中国智能卡之路在何方?
买什么VR合适看了就就知道
单相电机接线柱接法_三相电机接线柱怎么接_3个或6个电机接线柱怎么接
骁龙855的AI性能比麒麟980更强?
关于面筋测定仪的具体操作步骤的详细讲解
区块链的三种类型及应用介绍
Antelope Audio发布带建模话筒的Edge Strip
小米max2即将推出,可能搭载高通骁龙660处理器!
三相程控精密测试电源的功能
阿迪达斯结合AR技术 突出了其环境可持续发展活动
CKS32F4xx系列产品串口DMA传输
索尼XZ premium拆解,看看这位防水鼻祖的内部做工到底长什么样
Maxim推出了可用于转接驱动eSATA/SATA信号的双通道缓冲器
湿喷机控制器/湿喷台车控制器方案,支持以太网通讯及远程升级程序
2022最值得入手的运动耳机、运动型蓝牙耳机推荐
搭载5nm麒麟1020 曝华为Mate 40将于9月发布
制造业的人工智能之路仍然漫长
关于STM32浮点运算单元FPU的应用示例