向量扩展将定稿,RISC-V机器学习的崛起

向量扩展将定稿,risc-v机器学习的崛起
risc-v作为一个与x86和arm相比仍算年轻的架构,自然需要不少扩展模块来完善其指令集架构,尤其是对标x86与arm的simd指令集。然而simd指令集随着时间的发展变得越来越臃肿,让架构变得愈发复杂,david patterson也在几年前的一篇文章中写道,实现数据级并行性更优雅的方式就是向量架构,risc-v的向量扩展(rvv)也应运而生。
在机器学习算法中,向量被广泛用于处理数据集和数组。而rvv为基础指令集新增了多个向量寄存器和向量指令,可以让基于risc-v架构的处理器核心处理数组,与传统的标量运算一起来加速大数据集的指令运算。
risc-v向量扩展指令于2018年推出,在经过了多个版本的迭代后,终于在几天前进入了1.0 pb状态。rvv工作组认同了1.0版本的稳定性,已经可以在上游软件项目中开发相关的工具链、功能模拟器与实现了。而前段时间的risc-v论坛,也展示了risc-v在向量与机器学习上的进展。
risc-v机器学习用于太空应用
相信不少人都注意到近期逐渐增加的各项太空探索任务,比如祝融号火星车与中国空间站建设等,这些任务中ai与机器学习的应用也开始出现。然而将ai与机器学习加入太空任务依旧面临着诸多挑战,比如已有的太空处理器已经无法跟上ai与ml的计算需求,但现成的商用设备既无法满足辐射要求,也没有太空认证的软件栈支持。
来自加泰罗尼亚理工大学和巴塞罗那超算中心的两位研究员leonidas kosmidis和marc solé bonet给出了他们的创新方案,实现了在功率有限的risc-v处理器上加速ml运算。与采用额外大面积向量寄存器文件的传统方式不同,他们采用了一个开源的短simd模块通过重复利用整数寄存器文件来减小面积。这一方案以2个未使用的risc-v操作码实现了17个高度可配置的定制指令,可以用于实现ml应用中200多种组合运算。
他们成功将该模块移植到了cobham gaisler开发的开源risc-v太空处理器noel-v上,在最小的noel-v处理器的配置下进行通用ml程序的测试,得出的结果相当可观。只需多用到25%的面积,就能实现3到7倍的性能提升,还不会影响到处理器的频率。
两位研究员也实现了gaisler另一个太空处理器leon3的版本,该处理器采用的是sparc v8的架构。未来他们还计划引入tensorflow和编译器代码生成等一系列软件支持,并在欧洲航天局ops-sat实验卫星上的fpga上进行测试。
risc-v向量处理器的真正挑战
90年代可以说是dsp、cisc与dsp三家争霸的状态,然而到了21世纪,dsp已经越来越难突破ghz,而高频cpu中乘积累加运算单元的流行使得dsp在性能上败下阵来。而risc与cisc相比的优势在于其简单化的特性,更容易实现高频率。然而在向量处理器(vpu)上,必须要解决数据传输的问题。
传统vpu在带宽上的瓶颈 / 晶心科技
从数据传输的流程来看,系统总线已经被处理器占用处于繁忙状态,而所有数据都通过缓存走向总线,现在又多出了向量指令和向量数据,致使总线到内存的延迟增加,整体性能下降。因此,提高总线带宽的同时保持高频率,又不会增加额外的功耗也就成了一大设计挑战。传统的解决方案有预读取和更大的独立内存与缓存等,但往往需要牺牲功耗和尺寸。
晶心科技为了解决这一挑战,推出了晶心自定义扩展(andes custom extension,ace),这一risc-v扩展可以创造新的指令、新的协处理器和新的内存位置。ace引入了全新的streaming port,为外部硬件引擎创造了自定义数据接口和自定义数据内存,以很小的功率代价解决了数据传输问题。除此之外,ace还可以用于数据预处理与后处理,比如格式转换等,进一步提升vpu的性能,更好地控制和管理外部加速器。
结语
risc-v在向量扩展与处理器上的进展已经相当惊人,要知道苹果在前段时间招募risc-v开发者的工作描述中,不仅要求掌握risc-v的开发知识,还要求了解arm neon simd微架构的向量编程。随着rvv的定稿,向量寄存器与指令也将全部确定下来,届时相关的编译器等工具链也能够及时做到兼容。

基于ITRTSC-096A道路交通信号控制机的交通信号控制系统的设计
小米6配置再爆料:双版本+2K屏+骁龙835,1999起售!
简要概述工业物联网的功能和特点
马斯克突然开除80%推特合同工
三合一食品安全检测仪的性能
向量扩展将定稿,RISC-V机器学习的崛起
谐波产生的原因和危害怎么消除
鸿蒙系统2.0:华为没有退路,唯有背水一战
专业苹果粉分析苹果是否需要升级iOS10.2
【展会预告】第三届中国集成电路设计创新大会暨无锡IC应用博览会
12mm弯式储能连接器的定义和应用
今年三季度全球热销手机前十名中有五款来自三星
摩尔定律影响模组级电源管理(MLPM)系统地位
三代线程撕裂者GeekBench跑分曝光 超出2950X90%
两倍iPhone7的价格?华为Mate9保时捷版配置曝光!靓到爆炸!
晶圆代工供应端吃紧,整合触控暨驱动IC已转为卖方市场
安装包是7.apk,要求获取flag
双向可控硅结构原理及应用
复合材料的的特性与分类
影响气体超声波流量计计量精度的主要因素