【自适应计算在机器人领域的应用】连载二:工业类比CPU/GPU,ASIC和FPGA,谁更适合机器人计算

作者: víctor mayoral-vilches 和 giulio corradi,赛灵思公司
连载二:工业类比cpu/gpu,asic和fpga,谁更适合机器人计算
cpu 和通用 gpu (gpgpu) 是两种广泛使用的商业计算平台,因为它们可用性高且具有通用性。这些计算技术的通用性,是机器人专家对其特别感兴趣的原因。但是通用性的代价是:
1. 通用平台的固定架构难以适应新的机器人场景。追加功能往往需要追加硬件,这也往往意味着要花时间对新的硬件进行新的系统集成度。
2. 通用性必然导致其在时效上的缺陷,从而影响确定性形成(难以满足严格的实时性要求)。
3. 其功耗通常比专用计算架构(如 fpga 或 asic)高一到两个数量级 (1)。
4. 其固定的、不具备灵活应变能力的架构,导致其对网络安全威胁和恶意行为的抵御能力减弱。熔毁 ( meltdown ) 或者幽灵 ( spectre ) 等网络攻击示例表明,如果缺乏重新配置数据流流水线的能力,计算平台最终将丧失安全性。
总体而言,cpu、gpu 和 asic 等采用固定架构的器件,在其为开发者提供优势的同时,也让其付出了代价。它们所缺乏的灵活应变能力,导致其缺乏时效性,能耗增加。而且由于它们无法通过重新配置架构来提高硬件的抗风险能力,因此在网络威胁面前更加脆弱。
cpu的工业类比
图1是 cpu 的工业类比,它将 cpu 理解成一系列车间,并且每个车间安排一位技能非常娴熟的工人。
图1:cpu 的工业类比
这些工人每人都能使用通用工具生产出几乎任何产品。每位工人按顺序使用不同的工具,将原材料制造为成品,一次生产一件产品。根据任务的性质,这种串行生产流程可能用到大量步骤。这些车间基本(不考虑缓存的情况下)彼此独立,工人能全身心地完成不同任务,不必担心干扰或协调问题。尽管cpu 十分灵活,但它的底层硬件是固定的。cpu 仍然在基本的冯诺依曼架构(或者更确切地说,存储程序计算机)上运行。数据从存储器读取到处理器进行运算,然后写回到存储器。基本上每个 cpu 都以串行方式运行,一次一个指令。同时架构以算术逻辑单元 (alu) 为中心,每次运算都需要将数据输入到 alu 并从 alu 输出数据。
cpu的工业类比
gpu 也可以用车间和工人类比,但它们的数量要大得多,并且工人的专业化程度也要高很多,如图2所示。
图 2: gpu 的工业类比
gpu 工人只能使用特定的工具,每人能完成的任务种类要少得多,但他们完成任务的效率非常高。gpu 工人在重复做相同的少量任务时效率最高,尤其是当他们全体同时做同一件事情时。gpu 解决了 cpu 的主要缺陷之一,即并行处理大量数据的能力。
虽然 gpu 比 cpu 拥有非常多的核,但 gpu 采用的依然是固定的硬件架构。gpu 的核仍然包含某种类型的冯诺依曼处理器。一条指令就能处理上千条或者更多数量的数据,尽管通常必须对同时处理的每一条数据进行相同的运算。原子处理元在数据矢量上运算(非 cpu 情况下的数据点),但仍然是每个 alu 执行一条固定的指令。因此,用户仍然需要通过固定的数据路径,从存储器将数据传递给这些处理单元。与 cpu 相似,gpu 也采用固定硬件构建,对所有的机器人应用而言,其基本架构和数据流都是固定不变的。
fpga 的工业类比
如果说 cpu 和 gpu 是工人按照顺序依次将输入加工成输出的车间,那么 fpga 就是灵活的自适应工厂,能够针对手中的具体任务定制创设装配线和传送带(参见图 3)。
图 4: fpga 的工业类比
这种灵活应变能力,意味着 fpga 架构师可以先构建工厂、装配线和工位,然后根据所需完成的任务对它们进行量身定制,而不是使用通用工具。这些工厂中的原材料由分配在装配线上的工人小组逐步加工成成品。每名工人都重复地完成同样的任务,同时半成品通过传送带在工人间进行传递。这样能大幅提升生产力,并保证以最佳方式充分利用资源和电力。在这个类比中,工厂是 opencl 加速内核,装配线是数据流流水线,工位是 opencl 计算功能。
asic的工业类比
与 fpga 类似,asic 也建造工厂,但是 asic 中的工厂是最终形态,不能改动(参见图 4)。换言之,这些 asic 内部只有机器人,工厂内不存在人类认知。这些装配线和传送带是固定的,不允许变更自动化流程。asic 的这种专用型固定架构赋予它们极高的能效,以及大批量规模化生产下的最低价格。但遗憾的是,asic 的开发通常需要耗时多年,而且不支持进行任何变更,这将会导致前期投入的资产很快跟不上未来生产力提升的变化。
图 4: asic 的工业类比

如何变全面屏?如何隐藏前置摄像头?手机厂商们想的几种办法
同比增长14.31%!紫光国微发布2023年三季度报告
CAD的发布(publish),最简单的批量打印功能
黑客活动所致全球损失远不到万亿美元
人与机器人和谐共处所缔造工业4.0
【自适应计算在机器人领域的应用】连载二:工业类比CPU/GPU,ASIC和FPGA,谁更适合机器人计算
Armani最新款智能手表开启预售,简单而奢华,并支持无线充电,售价295美元起
用于电动汽车应用的反激式开关
厉害了大疆无人机,又一项新功能!大疆精灵4P、悟Inspire2协助公安干警抓捕逃犯?
200亿巨头封死跌停曝出个人信息交易内幕!数字身份如何告别“裸奔”?
电子产品用疏水泄压膜是防水透气膜中的一种
博通投资10亿美元芯片计划!
物联网人工智能企业宇泛智能完成近5亿元B2轮融
事故教训丨 火灾造成4死6伤,烧尽10亿市值,你应该准备好“它”
2014 CES:可穿戴设备的新奇之旅
Microchip安全认证让LoRa技术从此再无漏洞
手机内存6g和8g的区别
谷歌为Daydream VR虚拟现实平台增加了三个试验性功能
闪电网络的核心思想是什么
什么叫五极管?五极管的分类及其工作原理