从高性能内核到双核设计,MCU朝边缘AI进击

由于通用计算芯片很少对ai计算进行优化,所以在不少ai应用中,我们都需要传统意义上的ai芯片,比如gpu或者asic之类面积与功耗较大的产品。也正因为这些限制,这些ai芯片难以在边缘端铺开。
那么边缘ai是否可以交由mcu来完成呢?传统的mcu设计哪怕针对一些轻度ai计算来说,仍有一些吃力。所以不少mcu厂商开始发力更高性能的mcu,采用专为ai优化的设计,为边缘ai的普及添砖加瓦。
超高性能内核
考虑到不少mcu仍在使用cortex-m4、m3乃至m0之类的低功耗内核,考虑到复杂嵌入式ai算法的算力要求,这些旧内核在这类应用中也就不太够看了。既然存在计算性能上的劣势,那么就直接从性能上突破,这几年涌现了不少基于超高性能的内核的mcu产品,比如基于cortex-m7内核的gd32h7。
cortex-m7内核作为cortex-m4的继任者,基于armv7e-m架构开发。从核心关键特性来看,在所有cortex-m处理器中,cortex-m7是仅有的两个6级流水线以上设计核心之一,而另一个则是7级流水线的cortex-m85核心,基于该核心的mcu目前尚未正式面世。
兆易创新在gd32h7上将主频做到了600mhz,甚至超过了不少国外大厂的cortex-m7 mcu,如此高主频使其足以应对边缘侧的ai算力要求,无需再集成额外的npu了。而且为了满足ai算法的资源占用,gd32h7还配备了1024kb到3840kb的片上flash和1024kb的sram。
除了arm核心以外,像先楫半导体这样的risc-v厂商,也推出了hpm6700/6400系列这样的risc-v超高性能mcu。其中hpm64g0更是可以做到单核主频1ghz,支持双精度浮点运算的同时,也具备了强大的fpu和dsp扩展,足以满足不少tensorflow lite模型的运算需求。
多核mcu
解决性能问题的另外一个思路就是采用多核mcu设计,像意法半导体之类的厂商早在几年前就已经开始布局双核mcu产品。比如stm32h7系列,其中就有集成了cortex-m7和cortex-m4两个内核的产品,stm32h747/757。
这两个独立运行的核心可以分配不同的任务,比如cortex-m7负责高性能任务,而cortex-m4负责实时性任务。同时,借助st提供的stm32cube.ai工具,就能从已有的ai算法和预训练模型转换成可运行的代码。如果需要运行超过1mbyte的更大模型,则可以分配给cortex-m7更多的闪存。
除了双cortex-m核心的设计之外,也有的厂商开始探索不同架构的核心协作的路线。比如adi的max78000芯片,就选择了集成一个arm cortex-m4核心与一个risc-v核心,除此之外,该mcu还集成了一个神经网络加速器。
而且在max78000上,adi对这三大组件都做好了分工,其中cortex-m4负责mcu的控制与处理,而risc-v内核作为协处理器负责数据搬运,而神经网络加速器则提高cnn计算效率,这样的架构相较传统的mcu+dsp方案在功耗、并行性上都要更具优势。
写在最后
虽然当下mcu市场不少玩家都已经在发力边缘ai,但厂商们也需要做好软件生态的构建,提供完备的实例代码或可用模型,实现真正的开箱即用。与此同时,mcu也还有在性能上继续改进的空间,比如不少mcu参与的边缘ai计算,只能使用预训练好的模型,什么时候mcu能在边缘端同时完成轻量训练与推理的任务,其应用空间也会更加广阔。

单车用量增长的电池管理芯片们(BMIC)
两款电子灭蝇器的电路图分享
被动方法在城市街区和道路网络中使用广泛部署的传感器
125W D类超低音功率放大器电路设计
LCD面板涨价,京东方大赚一笔
从高性能内核到双核设计,MCU朝边缘AI进击
linux中more和less命令有何区别
谷歌AI中国中心正式成立,掌舵人是李飞飞和李佳
一种振动供能的车间远程火灾报警器
谷歌Pixel手机,物美价廉让我们共同期待它的诞生吧!
基于飞凌嵌入式FETMX8MM-C核心板的血细胞分析仪
新品发布 | Vertiv™ Liebert® DA,双重动力,无限可能
赛迪研究院电子信息研究所发布了白皮书《“新基建”发展白皮书》
电子元器件厂商Texas Instruments推出新电子书
“每一行代码皆可掌握” 数据库国产化替代正当时
弧焊机器人焊接参数包括哪些?要怎么设置?
何时使用MEMS器件?
区块链有些哪一些值得期待
双面电路板焊接方法视频
iphone8什么时候上市?iphone8最新消息:别等了,oled显示屏断货,iPhone8 可能将无缘亮相2017