现代处理器的主要指令集架构

现代处理器的主要指令集架构(isa)包括:x86指令集架构、risc指令集架构。
cisc尽可能将任务一次性做完,高效但费脑(性能高、功耗大);
risc则是将任务拆解,分次做完,虽然对个人能力要求不高(性能低、功耗小),代价是效率更低。
其中,x86可以划分为x86-32(英特尔)、x86-64(英特尔)、amd64(amd)等三种。risc可以划分为arm、mips、alpha、risc-v。国产cpu在信创市场已形成“四种技术路径(x86、arm、mips、alpha)、六大主要厂商(兆芯、海光、鲲鹏、飞腾、龙芯、申威)”的发展格局。
1、x86指令集
第一个方面,x86指令集为了保持二进制的兼容性,即:上一代芯片的应用程序仍然能运行在下一代芯片中,使之前后系列的芯片成为一个“系列机”,扩展了许多新的指令,导致x86指令集的规模不断膨胀。
第二个方面,x86指令集在设计时,采取了一种强指令的方式,即:一条指令可以完成非常强大的功能。例如,一条指令可以完成内存不同位置的整个运算过程,或将一块数据直接从内存的一个位置移动到另一个位置,而且这种强大的操作是在1个时钟周期内完成的。
上图列出了英特尔官方统计的指令数量变化。在将近40年的发展历史中,x86由不足200条指令到今天超过1600条指令。
上图列出了x86指令集的mov指令种类,其可以跳过一系列底层的微操作,实现一个较为复杂的指令功能。
基于以上的设计理念,x86指令集有以下的优点或缺点。注意,缺点也许是优点,优点也许是缺点,这是马克思辩证唯物主义的思想。
由于需要兼容以往的历史版本,x86的硬件设计复杂,这也成为了其历史包袱。但是,塞翁失马、焉知非福,二进制的兼容性获得了ibm的强力支持,让英特尔快速占领了pc和台式机市场。
一条指令的功能很强,这降低了对编译器的要求。另外,不需要考虑那么多的底层指令,早期的汇编程序员面对x86编程时也较为轻松。
多条高效率的指令并行,让单个核的性能强大。早期的处理器,单核架构足以满足应用需求。
必须要大量的冗余晶体管,以实现这种cisc复杂指令集设计。冗余的晶体管带来了大量的面积和功耗开销。
如今,x86指令集在笔记本、台式机、服务器等场景取得了近乎垄断的优势,和ibm有着紧密的联系。可以说,ibm的选择成就了x86指令集的今天,并成就了英特尔这家曾经名不见经传的小公司。
以上两段文字引自technews、半导体行业观察,其简要描述了ibm早期的选择及其巨大的市场成功。
2、arm指令集
在上世纪80年代,计算机科学家们分析了大量的程序,发现80%的指令是很少用到的,处理器频繁地使用20%的那部分指令,比如load指令、条件分支指令、store指令、比较指令。如下图所示,该表格引自《计算机体系结构:量化研究方法(第六版)》。作者是david patterson、john hennessy。
关于arm深入知识,请参考文章“arm处理器架构和天梯图解析”、“arm v8处理器概述、架构、及技术介绍”、“飞腾系和鲲鹏系:国产arm架构cpu服务器正在崛起”、“收藏:从全球超算战略看arm指令架构在hpc领域的发展”、“亚马逊最新arm服务器芯片详解”和“计算芯片变革:arm取代x86成为趋势”等。
因此,早期的risc指令集、mips指令集应运而生,它们砍掉了大量不常用的冗余指令,只保留了最基本、最常用、功能最简单的指令集合。基于这种risc指令集设计的处理器架构代表是arm架构,为了便于不同客户进行定制化修改,其每代均会推出以下三个授权版本:
cortex-a内核,面向高性能应用。
cortex-r内核,面向实时系统。
cortex-m内核,面向嵌入式设备场景。
相比于x86指令集(cisc复杂指令集),arm这种risc精简指令集的变化主要是:
第一个方面,原来大量的冗余指令,以及由于历史原因兼容的指令,都在统计结果的基础上予以删除。
第二个方面,原来的一条x86强指令,在arm中被多条基本的简单指令替代。
举一个例子:cisc提供的乘法指令,调用时可完成内存a和内存b中的两个数相乘,结果存入内存a,需要多个cpu周期才可以完成;而risc不提供“一站式”的乘法指令,需调用四条单cpu周期指令完成两数相乘:内存a加载到寄存器,内存b加载到寄存器,两个寄存器中数相乘,寄存器结果存入内存a。
基于以上的设计理念,或者说,在这样的底层逻辑下,arm指令集的处理器架构有如下优点或缺点:
砍掉了大量的x86冗余硬件设计,使得dec译码器的设计更加简单,节省了大量的面积和功耗开销。
一条arm指令的功能更加单一和基本,这种指令相比于x86的强指令可以称之为”弱指令“,执行这样的弱指令所需的功耗进一步降低。
由于原来一条x86强指令就可以搞定的事情,在arm这里需要多条弱指令组合来做,大幅提高了编译器的设计难度,同时提高了汇编语言编程的难度。
由于arm指令集的处理器,相比于x86指令集的处理器,其在硬件结构上更加简单,因此,单个arm核的面积和功耗更小,但是其性能也更弱小。这就导致了我们堆叠多个弱小的arm核来打一个强大的x86核。
3、risc-v指令集
risc架构随后经历了risc-i(1981)、risc-ii(1983)、risc-iii(1984)到risc-iv(1988)四代,却始终未能得到重视。但在这个过程中,risc的设计理念催生一系列新架构如mips、ibm powerpc以及现在统治移动边缘端的arm。
关于risc-v深入知识,请参考文章“risc-v科普:理解开源isa架构”、“玄铁risc-v处理器入门及实践”、“开放指令集与开源芯片发展报告(risc-v和mpis)”、“关于risc-v和开源处理器误区解读”、“深度:risc-v指令集架构和全球落地”、“深度:risc-v技术和指令集架构”和“深度报告:risc-v架构分析(50页ppt)”。
21世纪初期,受当时开源运动在操作系统和应用软件领域取得了巨大成功(如linux等)的影响,为开源芯片设计带来了崭新的前景。
大家认为,risc-v有望创造继x86、arm之后的第三波芯片浪潮。risc-v的灵活性,对定制化、碎片化场景的支撑力度良好,因此目前主要应用于物联网等终端领域,但在电脑、服务器等领域也已经有了一些尝试。国内risc-v发展重要事件有:
2018 年9 月 中国risc-v 产业联盟宣布成立。
2018 年11 月 中国开放指令生态(risc-v)联盟宣布成立,由倪光南院士担任联盟理事长。
2018 年11月 risc-v 基金会中国顾问委员会宣布成立。
2019 年7月 阿里巴巴平头哥发布高性能玄铁910 risc-v 处理器。
2019 年8月 兆易创新发布全球首个基于risc-v 内核32 位通用mcu。
2020 年3月 基金会总部从美国搬迁到瑞士,宣称是规避政治风险。
2023年8 月,risc-v中国峰会在京开幕,中国工程院院士倪光南、risc-v国际基金会ceo 卡莉斯塔·雷德蒙德等出席峰会。
2023年11月,阿里平头哥推出了三款基于risc-v架构的玄铁系列处理器,即将大规模商用。
4、指令集总结
这两种指令集之间的关系就好比是两种不同的烹饪风格。有些厨房可能更偏向于复杂多样的烹饪方式,而有些厨房则更喜欢简单高效的烹饪方式。同样地,cpu的设计者可以根据不同的需求选择使用cisc或者risc指令集来设计cpu,以满足不同的应用场景和性能要求。
x86架构:封闭架构,由英特尔和amd牢牢掌握话语权,amd给hg授权zen1架构;via(台湾威盛)曾获得x86架构licence授权,后来被z芯收购;20多年来没有第四家授权,其他芯片公司想用也用不了。
主流架构,生态好,由于被intel和amd垄断导致封闭状态,影响了国产x86 cpu厂商的创新进程,目前仍然主要处于“消化、吸收”与“小创新”阶段,但其优势在于能兼容wintel等原有x86生态;
arm架构:开放架构,虽然由arm公司所有,但授权开放,需要花钱购买。目前,h为和f腾拥有arm v8架构永久性授权;阿里平头哥、中兴等国内厂商购买了arm v9 架构ip授权。
主流架构,生态较好,由于开放授权的商业授权模式,使得国产arm cpu厂商能够进行更大程度的创新,使得更自主,但需要付出昂贵的授权费。至于是否发展中国自主的arm v9指令集(进入自主创新阶段),目前无法知悉,但考量因素肯定与生态有关,可能还没有到跟国际arm生态“脱钩”阶段,毕竟arm生态在快速追赶x86。
mips架构:开放架构,目前已开放了mips指令集的r6版本,以wave computing管理,但也难挽颓势,最后宣布终止开发,加入risc-v基金会。lx前期基于mips架构授权研发,后衍生出loongarch自主架构。
小众架构,生态弱,加上wave computing母公司“叛变”加入risc-v基金会,国产cpu厂商不得不踏上“自主创新”阶段,直接牺牲掉mips原本就单薄的生态。自主创新固然难得可贵,但是需要重新构建自主生态,可谓是“任重道远”。
alpha架构:开放架构,目前已经无实体主张该指令集的权利,但相关专利已被hp、intel等瓜分。申w前期基于alpha架构,后衍生出sw64自主架构。
小众架构,生态弱,加上很早就没“妈”了(无实体公司运营),所以国产cpu厂商选择“自主创新”,自然是顺理成章!自主创新固然难得可贵,但是单薄的生态,注定只能在小众市场进行落地。
risc-v架构:开源架构,最特殊,不属于任何机构或国家,开源免费,想用就用,运营成本全靠基金会的兄弟们帮衬。由阿里平头哥主导,越来越多的创业公司加入risc-v架构阵营。


pcb板边安全距离是多少合适?
智能感知系统的组成主要包含哪些
雷曼8K超高清显示屏助力北京冬奥会的内容传播
性价比最好的蓝牙耳机,无线蓝牙耳机性价比高推荐
技术瓶颈难破,无人零售只能是噱头
现代处理器的主要指令集架构
CEVA全面进军AI、语音、5G、连接、视频IP市场
满足节能、环保设计的半导体解决方案
简要介绍分析PCB中的常见名词
芯片产业三足鼎立的局势初现
高速PCB设计
MU-MIMO技术在智能路由器应用案例
创新OutlierAir真无线耳机评测 比起大部分千元真无线耳机丝毫不弱下风
广东省电子信息行业协会走访讯羽通信
三星Note10曝光将采用挖孔全面屏设计并搭载背部四摄像头
百年宾利终电动化!大排量内燃机已落幕
如何检验可燃气体报警器是否合格生产?
关于中国大硅片发展现状分析和方案设计
KOAN石英晶体谐振器的生产流程
汽车空气清新器,Air Purifier