深度学习芯片领域的竞争从未停止过,2018年将开启深度学习硬件大战,在这场战局中英伟达、amd、英特尔谁能笑到最后。
随着英伟达titan v的发布,我们迈入了深度学习硬件发展的动荡期。nvidia能否在2018年保住深度学习硬件首要供应商的地位还未可知,amd和intel nervana都仍有机会。
所以对于想买硬件的消费者,最精明的选择就是等上3至9个月,到这种不确定的状态过去之后再决定。
深度学习芯片领域的竞争从未停止过。
nvidia决定在竞争初现端倪之前,先将自己的垄断地位变现。通过这种方式,他们希望在未来1-2年内确保行业领先,所以他们的titan v的售价高达3000美元!
虽然titan v的深度学习专用核心tensor core有着独特的性能,但性价比实在太糟,使其市场吸引力不足,只是现阶段除此之外又没有别的选择,所以至少当前就有什么用什么吧。
amd的硬件水平已经赶超nvidia了,而且他们计划再开发出相匹配的深度学习软件。如果这一步实现的话,其性价比会轻松超越nvidia,并在此领域成为新的标杆。而届时nvidia就会凭借着雄厚的资金实力来拼市场,所以我们或许会在未来看到非常便宜的nvidia产品。注意这种情况是建立在amd推出高质量软件的基础上——如果amd跳票,则丧失了抢走桂冠的机会,而nvidia的产品将仍停留在高价位。
市场上还有另一位新晋竞争者:intel nervana的神经网络处理器(nnp)。凭借着几种迎合cuda开发者需求的独特性能,它表现得还比较有竞争力。nnp处理器可以解决优化深度学习的cuda内核中绝大多数的问题,这款芯片才真正称得上第一枚深度学习芯片。
通常意义上,对于单一芯片之间的排名,我们会按照nervana 》 amd 》 nvidia的顺序来排,因为nvidia的芯片不得不在游戏、深度学习和高性能运算中维持平衡,amd也需要同时考虑游戏和深度学习,只有nervana可以聚焦于深度学习,这是一个巨大的优势,使得他们的芯片较其他两家少了很多无用的结构设计。
然而,获胜者往往不是取决于纯粹的性能或者性价比,而是要综合考虑性价比+周边生态+深度学习框架。
让我们来仔细了解一下这三家公司产品的优劣,看看它们到底处于什么位置。
nervana的神经网络处理器(nnp)
图:当前并没有专门为ai所设计的硬件产品,而intel nervana nnp帮我们摆脱了这种限制。
nervana芯片的独特之处在于它为计算扩展出大空间的缓存(类似cuda共享内存),相当于gpu的10倍,而单个计算单元的缓存是gpu的50倍。有了这种设计,其运算速度会提升至少一个量级,就可以在缓存内完成算法与模型计算并轻松地训练tb字节的数据(如一个带有200个单元的多层lstm)。
得益于flexpoint这个特殊的数据类型,nervana的芯片能够在缓存/ram内存储更多的数据并计算得更快。所有这些创新都意味着其比当前nvidia的gpu提速了10倍。这已经获得了初创公司以及一些大公司的关注。但是,所有这些的前提是他们能克服主要的问题:周边生态以及软件。
普通的用户和研究人员几乎完全依赖于芯片周边的生态系统。如果没有了这些,我们将无法使用缓存内的算法以及好的软件框架,从而无法更好的利用芯片。
所有人都希望使用可靠过硬的深度学习框架,而nervana的深度学习框架neon是否给力是值得怀疑的。软件使用优先于硬件支持,如果nervana仅仅出品良好的芯片而不在软件以及周边生态系统上发力的话,他们将输掉这场竞争。
软件以及生态系统与价格紧密相关。如果nervana 家的nnp价格定得太高,学生根本负担不起。虽然行业内的各种企业客户为硬件公司支付了绝大部分的收入,但仅凭产业化的应用是无法构建繁荣的生态环境的,学生群体才是促使硬件周边生态环境繁荣的主要驱动者。
只有当广大学生们可以支付得起之后,才会有众多配套软件得以涌现。任何超过3000美金的产品想都不要想;超过2000美金而且对学生有额外折扣的产品还凑合,没准会让人用用,一个2000美金的nnp还是会有一些接受度的;而如果产品低于1500美金,nervana在2-3年内将会成为市场的主导者。
如果把价钱定在1000美金左右,那另两家竞争者将会非常痛苦,而配套的软件就会如雨后春笋,不再是个问题。
如果nnp的价格低于2500美金,我是肯定会买的。它的性能比gpu好太多,我可以用它来做好多原来无法在nvidia产品上实现的事。但如果它超过了2500美元,这是我能承受的上限,我看还是把钱省下来吧,虽然好的硬件非常重要,但我还需要钱来干别的呢。
对于一般的消费者来说,价格不是他们考虑的唯一因素,他们还会考虑到产品的相对应的周边生态。
如果intel没有快速的将尽可能多的资源投入到该产品的周边生态并打造一个可靠的软件组成,那么nnp (the neural network processor) 的发展就会停滞不前并且最终消亡。不幸的是,intel 曾经因为对周边生态的管理不善而犯过这样的错误。如果发生了,这将非常让人失望,因为我真的很希望nervana获得成功。
总体来说, 如果nervana开发的nnp 可以把价格控制在2000美金以下,并且在这个产品发布之后的短短几个月内快速生成一个强大的周边生态和软件开发环境,那么这款产品将会击败它的同类竞争者而胜出。如果nnp的价格稍高同时周边生态略差,那它依然还是个不错的产品,只是就性价比和方便程度来说,它不能完胜它的竞争者们。当它的价格高于$4000美金或是不具备一个基本的产品周边生态的话,nnp甚至会完败。
对于高于$2000美金的nnp来说,如果希望它能对于一般学生有很好的新引力,那么该产品需要对学生有着相当程度的折扣才可以。
amd:便宜又强大,软件方面还需努力
amd的显卡非常的棒。vega frontier edition 系列明显的要优于nvidia的相应产品,通过一项类似于对volta和pascal所做的无偏差标准测试,在使用液态冷却的前提下,vega frontier 的性能要持平甚至优于titan v。值得注意的是,vega是基于传统的图形处理芯片架构,而titan v是全新的。这样,在2018第三季度即将发布的新一代amd架构,将会有更加出彩的表现。
amd希望仅仅通过把32-bit 浮点数运算的图形处理芯片换成16-bit,从而在深度学习硬件开发上取得成功。这是一个既简单又有效的策略。这样设计的gpu,虽然对于高性能计算没有什么用处,但是对于游戏玩家以及深度学习社群来说,这样的改变会获得更稳定的表现,同时由于16-bit浮点数运算显卡的运算非常直接,芯片的开发成本也会相应降低。
当然,如果单纯依靠性能指标来说,这样的改变不可能优于nervana的nnp,但是就性价比来说,市场上所有的产品都无出其右。你可以仅仅花费$700美元就买到一款液态冷却的vega frontier 显卡,而它的性能比起$3000美金的titan v仅仅差了一点而已。
然而最大的问题是软件。即使你拥有了这么强大的amd gpu,你却很难使用它-因为目前没有一款主流的软件框架能够很好支持amd gpu。
amd自身也处于这个发展过渡期,关于软件的发展过渡期。目前来看,他们打算放弃opencl而转向hip。但是他们现在官方依然支持opencl这种方法。
如果他们想推动hip而且在未来九个月内投放一些很好的深度学习软件于市场(不仅仅是用来计算卷积和矩阵相乘的软件包而是一个完整的深度学习框架,比如说hip可以支持pytorch),那么,他们在2018第三季度即将发布的新一代gpu会获得巨大的潜力并且击败所有竞争者。
总体来说,如果amd能够把它在软件方面所有棘手的问题处理好,那么毫无疑问它会成为深度学习硬件领域的主导力量。
nvidia: 地位坚固的硬件界大佬
nvidia 的江湖大佬地位毋庸置疑。他们拥有最棒的软件系统,最好的工具,他们的硬件很棒并且产品具备一个庞大,强壮并且完整的生态圈。
nvidia 的主要问题在于他们需要服务于多种使用者:高性能计算需求者,深度学习从业者,还有游戏玩家。这对于他们的硬件是一个巨大的压力。设计这些客户定制的图形处理芯片是非常昂贵的,因此nvidia的策略是设计一款多用途,适合所有框架的芯片,这项任务几乎很难完成。因此titan v只是一个很中庸的产品。
伴随竞争者的出现,nvidia有两种选择。(1)不停的压低价格,直到拖垮对手,或者是(2)开发出属于自己的专有深度学习图形处理芯片。nvidia拥有足够的资源去打价格战,并且它也拥有足够数量的专家去执行第二套方案。然而,设计新型的芯片需要一定的时间,nvidia有可能在此间失去王者的宝座。所以,我们很有可能看到它会同时执行两套方案:打价格战拖垮推手,从而为自己设计出专属的深度学习芯片赢得时间。
总体来说,nvidia的王座受到了一定的威胁,但是它有足够的经验和资源去击败出现的竞争对手。我们很有可能在未来看到一个便宜的nvidia 显卡和专为深度学习打造的产品。不过如果nvidia 不去降价打价格战的话,它是可能(暂时地)失去王者的地位的。
深度学习硬件的混战意味着目前不是一个投资该领域的最好时机,但是这也同时意味着更便宜的nvidia 卡,可用性更高的amd卡,以及超快的nervana卡会很快出现。这是一个激动人心的时代,我们消费者将会从这样的竞争当中获得巨大的利益。但是目前,我们必须耐心等待。
三星与小米共同合作开发了一款ISOCELL Bright HMX传感器
ATM专业监控系统防盗卡应用解决方案
单片机控制轮流交替闪烁跑马灯设计
蓝牙5.2的三大特性解析
NEC与三星合作共同开发5G基站,并利用其销售网络在全球推广彼此的产品
2018年开启深度学习硬件大战 英伟达/AMD/英特尔谁能笑到最后
关于在腾讯云上解析LPWAN节点数据的步骤介绍
未来几年商用5G网络将获得大量部署,到2025年将覆盖全球近三分之一的人口
关于德国仿生机器人的简单分析介绍
PCB阻焊设计对PCBA的影响
Z-Wave为智能家居的理想无线解决方案
中国医疗器械未来市场之路及发展趋势
输电线路工频参数测试仪的工作原理及产品参数
三星Galaxy S20+ 5G真机谍照曝光 背面搭载一块矩形四摄
利用NFC技术来实现LED驱动电源的可编程技术
激光雷达为自动驾驶的落地起到了极为重要的作用
无线传感器网络节点数据短距离接收研究
轻薄移动电源什么牌子好?超轻薄的移动电源推荐
应该了解300 CPU MPI全局数据通讯组态的方法
关于Blob的介绍及其在S3C44B0上的移植