移动和嵌入式设备上也能直接玩机器学习?

最近,机器学习(ml)话题大热,arm也推出神经网络机器学习软件arm nn。这是一项关键技术,可在基于 arm 的高能效平台上轻松构建和运行机器学习应用程序。那么对于arm nn,你又了解多少呢?
实质上,该软件桥接了现有神经网络框架(例如 tensorflow或caffe)与在嵌入式 linux 平台上运行的底层处理硬件(例如 cpu、gpu 或新型arm 机器学习处理器)。这样,开发人员能够继续使用他们首选的框架和工具,经 arm nn 无缝转换结果后可在底层平台上运行。
机器学习需要一个训练阶段,也就是学习阶段(“这些是猫的图片”),另外还需要一个推理阶段,也就是应用所学的内容(“这是猫的图片吗?”)。训练目前通常在服务器或类似设备上发生,而推理则更多地转移到网络边缘,这正是新版本 arm nn 的重点所在。
对象识别是在嵌入式平台上运行的众多机器学习工作负载之一
一切围绕平台
机器学习工作负载的特点是计算量大、需要大量存储器带宽,这正是移动设备和嵌入式设备面临的最大挑战之一。随着运行机器学习的需求日益增长,对这些工作负载进行分区变得越来越重要,以便充分利用可用计算资源。软件开发人员面临的可能是很多不同的平台,这就带来一个现实问题:cpu 通常包含多个内核(在arm dynamiq big.little中,甚至还有多种内核类型),还要考虑 gpu,以及许多其他类型的专用处理器,包括 arm 机器学习处理器,这些都是整体解决方案的一部分。
arm nn 这时就能派上用场。下图中可以看出,arm nn 扮演了枢纽角色,既隐藏了底层硬件平台的复杂性,同时让开发人员能够继续使用他们的首选神经网络框架。
arm nn sdk 概览(首次发布版本)
您可能已经注意到,arm nn 的一个关键要求是compute library,它包含一系列低级别机器学习和计算机视觉函数,面向arm cortex-acpu 和arm mali gpu。我们的目标是让这个库汇集针对这些函数的一流优化,近期的优化已经展示了显著的性能提升——比同等 opencv 函数提高了 15 倍甚至更多。如果您是cortex-mcpu 的用户,现在还有一个机器学习原语库,也就是近期发布的cmsis-nn。
arm nn主要优势
有了 arm nn,开发人员可以即时获得一些关键优势:
更轻松地在嵌入式系统上运行 tensorflow 和 caffe
compute library 内部的一流优化函数,让用户轻松发挥底层平台的强大性能
无论面向何种内核类型,编程模式都是相同的
现有软件能够自动利用新硬件特性
与 compute library 相同,arm nn 也是作为开源软件发布的,这意味着它能够相对简单地进行扩展,从而适应 arm 合作伙伴的其他内核类型。
适用于 android 的 arm nn
在2017年五月举行的 google i/o 年会上,google 发布了针对 android 的 tensorflow lite,预示着主要新型 api 开始支持在基于 arm 的 android 平台上部署神经网络。表面上,这与 android 下的arm nn sdk解决方案非常相似。使用 nnapi 时,机器学习工作负载默认在 cpu 上运行,但硬件抽象层 (hal) 机制也支持在其他类型的处理器或加速器上运行这些工作负载。google 发布以上消息的同时,我们的 arm nn 计划也进展顺利,这是为使用 arm nn 的 mali gpu 提供 hal。今年晚些时候,我们还将为arm 机器学习处理器提供硬件抽象层。
arm 对 google nnapi 的支持概览
cmsis-nn
cmsis-nn 是一系列高效神经网络内核的集合,其开发目的是最大程度地提升神经网络的性能,减少神经网络在面向智能物联网边缘设备的 arm cortex-m 处理器内核上的内存占用。我们开发这个库的目的是全力提升这些资源受限的 cortex cpu 上的神经网络推理性能。借助基于 cmsis-nn 内核的神经网络推理,运行时/吞吐量和能效可提升大约 5 倍。
arm nn 的未来发展
这只是 arm nn 的第一步:我们还计划添加其他高级神经网络作为输入,对 arm nn 调试程序执行进一步的图形级别优化,覆盖其他类型的处理器或加速器……请密切关注今年的发展!

基于3G网络的企业数据通信安全方案
RISC-V内核RC遥控车拆解:空心杯电机+2.4G跳频控制,竟然可以“漂移”!
小米MIX2新机曝光!居然用一体化陶瓷机身!
谈谈被市场热捧“上天”的钙钛矿
MAX2163A 高度集成的调谐器IC,为ISDB-T 1段
移动和嵌入式设备上也能直接玩机器学习?
基于C/S的4层架构概述
浅析X-ray全自动点料机都有哪些优点
三维动态下对机器人设计中的实操运用
基于TMS320C6701浮点DSP芯片来实现线性调频信号的
华硕LCD屏幕销售告捷,占据日本市场第一
这波晶圆厂扩产浪潮对国产替代影响有多大?
全汉战神480电源评测:齐全线材 直指中高端
英特尔强推Ultrabook:Ultrabook=笔电未来?
浅谈一次性医疗连接器常用的4种接触互连技术
6GHz以下的频谱将成为5G应用的首选频段
扩声系统故障检修有哪些要求_扩声系统故障检修方法
摩尔线程MTT S50 MTT S80与蔚领时代、硅基大陆携手,共同加速PC云游戏应用
润和软件遭停牌 散户8天买554亿 鸿蒙概念股龙头润和软件重大消息停牌核查
小米5c、红米4X齐发!都是超高性价比怎么选?