(文章来源:ofweek)
	作为gpu在算法加速上强有力的竞争者,fpga是否立即支持不同硬件,显得尤为重要。fpga与gpu不同之处在于硬件配置灵活,且fpga在运行深入学习中关键的子程序(例如对滑动窗口的计算)时,单位能耗下通常能比gpu提供更好的表现。不过,设置fpga需要具体硬件的知识,许多研究者和应用科学家并不具备,正因如此,fpga经常被看作一种行家专属的架构。最近,fpga工具开始采用包括opencl在内的软件级编程模型,使其越来越受经主流软件开发训练的用户青睐。
	对考察一系列设计工具的研究者而言,其对工具的筛选标准通常与其是否具备用户友好的软件开发工具、是否具有灵活可升级的模型设计方法以及是否能迅速计算、以缩减大模型的训练时间有关。随着fpga因为高抽象化设计工具的出现而越来越容易编写,其可重构性又使得定制架构成为可能,同时高度的并行计算能力提高了指令执行速度,fpga将为深度学习的研究者带来好处。
	对应用科学家而言,尽管有类似的工具级选择,但硬件挑选的重点在于最大化提高单位能耗的性能,从而为大规模运行降低成本。所以,fpga凭借单位能耗的强劲性能,加上为特定应用定制架构的能力,就能让深度学习的应用科学家受益。
	fpga能满足两类受众的需求,是一个合乎逻辑的选择。本文考察fpga上深度学习的现状,以及目前用于填补两者间鸿沟的技术发展。因此,本文有三个重要目的。首先,指出深度学习领域存在探索全新硬件加速平台的机会,而fpga是一个理想的选择。其次,勾勒出fpga支持深度学习的现状,指出潜在的限制。最后,对fpga硬件加速的未来方向提出关键建议,帮助解决今后深度学习所面临的问题。
	传统来说,在评估硬件平台的加速时,必须考虑到灵活性和性能之间的权衡。一方面,通用处理器(gpp)可提供高度的灵活性和易用性,但性能相对缺乏效率。这些平台往往更易于获取,可以低廉的价格生产,并且适用于多种用途和重复使用。另一方面,专用集成电路(asic)可提供高性能,但代价是不够灵活且生产难度更大。这些电路专用于某特定的应用程序,并且生产起来价格昂贵且耗时。
	fpga是这两个极端之间的折中。fpga属于一类更通用的可编程逻辑设备(pld),并且简单来说,是一种可重新配置的集成电路。因此,fpga既能提供集成电路的性能优势,又具备gpp可重新配置的灵活性。fpga能够简单地通过使用触发器(ff)来实现顺序逻辑,并通过使用查找表(lut)来实现组合逻辑。现代的fpga还含有硬化组件以实现一些常用功能,例如全处理器内核、通信内核、运算内核和块内存(bram)。
另外,目前的fpga趋势趋向于系统芯片(soc)设计方法,即arm协处理器和fpga通常位于同一芯片中。目前的fpga市场由xilinx主导,占据超过85%的市场份额。此外,fpga正迅速取代asic和应用专用标准产品(assp)来实现固定功能逻辑。 fpga市场规模预计在2016年将达到100亿美元。
	对于深度学习而言,fpga提供了优于传统gpp加速能力的显著潜力。gpp在软件层面的执行依赖于传统的冯·诺依曼架构,指令和数据存储于外部存储器中,在需要时再取出。这推动了缓存的出现,大大减轻了昂贵的外部存储器操作。该架构的瓶颈是处理器和存储器之间的通信,这严重削弱了gpp的性能,尤其影响深度学习经常需要获取的存储信息技术。相比较而言,fpga的可编程逻辑原件可用于实现普通逻辑功能中的数据和控制路径,而不依赖于冯·诺伊曼结构。
	最重要的是,相比于gpu,fpga为硬件加速设计的探索提供了另一个视角。gpu和其它固定架构的设计是遵循软件执行模型,并围绕自主计算单元并行以执行任务搭建结构。由此,为深度学习技术开发gpu的目标就是使算法适应这一模型,让计算并行完成、确保数据相互依赖。与此相反,fpga架构是为应用程序专门定制的。在开发fpga的深度学习技术时,较少强调使算法适应某固定计算结构,从而留出更多的自由去探索算法层面的优化。需要很多复杂的下层硬件控制操作的技术很难在上层软件语言中实现,但对fpga执行却特别具有吸引力。
			
			
       	 	
    	全球化趋势明显 2016全球云计算市场发展情况总汇
         	 	
    	稳压二极管工作原理和注意事项
         	 	
    	一张图就足以看透5G颜值
         	 	
    	悬臂梁称重传感器的工作原理
         	 	
    	轻松拖地不费力,蒸汽拖把好用吗?
         	 	
    	如今FPGA飞速发展,它会是深度学习的未来吗
         	 	
    	UPS单模块10kVA单相电压型SPWM逆变器的Simulink模型建立及仿真分析
         	 	
    	浅谈 M3P 电池的性能优势和研发壁垒
         	 	
    	欧司朗将致力于发展高端温室技术,从而实现种植的智能化管理
         	 	
    	三星GALAXYNote3,小米1S上市后身价翻倍,你买到了吗?
         
       	 	
    	SFT-1150ZE静电复印机故障自动诊断
         	 	
    	汽车是艺术品,是工业技术发达的象征之一
         	 	
    	不同元器件在EMC设计中的选择及应用技巧
         	 	
    	以太网PHY的控制器驱动框架分析
         	 	
    	【节能学院】安科瑞预付费灌溉表在南非的设计与应用
         	 	
    	宁德时代与VinFast达成全球战略合作
         	 	
    	正力新能打造储能全领域一站式解决方案 满足市场和客户多样化的要求
         	 	
    	适用于初学者的DIY RepRap 3D 打印机教程—第1部分:构建
         	 	
    	断货王Xisem西圣ASN,重塑百元蓝牙耳机市场的极致性价比
         	 	
    	程序员的思维模式是怎样的