苹果A7 CPU架构终极大揭秘

研究苹果的硬件总是一件很痛苦的事情,因为苹果在这方面从来都是极为封闭,绝少公开底层资料,因此绝大多数时候只能靠猜。
a7是苹果也是业内第一款64位架构的移动处理器,但是在iphone 5s首发的时候,我们对它几乎一无所知。当时猜测它只是上代a6 swift架构的简单改进版,解决了内存延迟等问题而已,但结果大错特错,严重低估了苹果。
ipad air发布的时候,资料多了一些,首次知道其架构代号为cyclone,还知道了架构方面的一些信息:
就目前看来,峰值发射宽度达到了六!也就是相当于a6、krait的两倍,混合不同指令的时候更是能有三倍。
浮点、整数的共同发射局限也基本不存在了,可以并行发射最多四个整数加法、两个浮点加法。每个时钟周期还可以执行最多两个载入或者存储。
近日,anandtech终于找到了苹果官方的llvm文档,揭示和确认了不少细节,虽然仍旧比较模糊但在苹果的世界里已经不可能再深入下去了。
根据这份文档,a6、a7的架构规格对比如下:
之前猜测和推测的不少规格都是正确的。a7 cyclone的确是一个很宽的架构,每个时钟周期最多可以同时解码、发射、执行、收回6个指令/微操作,a6 swift则最多不超过3个。
a7的重排序缓冲达到了惊人的192,是上代的四倍多,同时巧合的是正好与intel haswell架构一样。分支预测错误惩罚也增加了,但幅度不大,而且又正好与intel sandy bridge及其后的架构在同样范围内。
换句话说,苹果的架构已经在某些方面和intel桌面产品架构处于同一级别了。
一级缓存容量的翻番可以理解,而在执行端,整数alu单元、载入/存储单元、分支单元也都翻了一番,并首次加入了一个间接分支单元和至少一条浮点流水线,能够并行执行三个浮点操作,但注意第三条浮点/neon流水线是用来做除法、开方的,乘法只能最多并行两个。
每个单元对应的缓冲尺寸也基本明晰,应该对应每个单元的微操作数,但在所有执行单元之前应该不会有统一调度器,而是每个端口前安置静态分区缓冲。
根据这些信息,a7 cpu架构简图是这个样子的(很可惜a6的还是没有足够数据无法直观对比):
六个解码器、九个执行单元端口,a7 cpu的确很“大”,比其他任何移动处理器都要大,已经完全超越了高通krait、intel silvermont,足以媲美intel core酷睿架构。
事实上,iphone 5s发布的时候苹果就宣称a7是“桌面级别架构”(desktop-class architecture)——库克并没有夸张。
a7是苹果勇敢卖出的一大步,但正因为步子太大,应用还跟不上,至今没有一款能完全发挥其潜力,即便是苹果自己家的应用也做不到。a7 cpu就像一头沉睡的猛狮,等待唤醒怒吼。
另外,a7 cpu架构上很超前,但在内存上却很“吝啬”,iphone 5s、ipad air都只有区区1gb。尽管苹果可以做到只需少量内存就能把系统性能发挥到极致,但是1gb毕竟太少了,是不可能完全发挥a7 cpu潜力的。或许苹果意识到大家短期内做不到所以干脆就不浪费更多内存?
最后说一句,苹果起代号也不是即兴而为,看起来颇有深意:swift的意思是快速敏捷,a6 cpu的确符合这个特点;cyclone是旋风、飓风,a7 cpu确实很庞大。
接下来的问题是:苹果下一步会何去何从?a8又要冲击怎样的高度?
再做得更宽显然意义不大,但是性能改进仍有巨大的空间,尤其是提升频率和效率。a7的频率其实很低,iphone 5s/ipad mini 1.3ghz,ipad 1.4ghz,相比于高通骁龙最高已达2.5ghz有点相形见绌。
a8会用上新的20nm工艺,完全可以在不增加功耗的情况下明显提高频率,就看苹果愿意不愿意了。

Gigaphoton推出KrF激光器G300K,可提高生产性及削减成本
Exar发布Express DX1845高性能数据安全和缩减
迈向5G和边缘计算的重要一步
医疗器械行业的颠覆性创新——牙齿3D打印
视觉伟业上市了吗?视觉伟业详细资料
苹果A7 CPU架构终极大揭秘
开源算法体系构建高效繁荣的AI生态
ADI可穿戴式设备充电方案解析
PCB制造使用的绝缘材料
全自动线束检测设备发布
区块链将成为物联网的顶级应用
致敬乔布斯,iPhone8回归双玻璃+金属边框设计,屏占比很满意
PCB设计之热干扰及抵制
单母线和双母线接线各有何特点?单母线保护与双母线保护有何区别?
带选择性保护的电子式塑壳断路器的发展趋势分析
锌电池原理特性概述
背光,LED背光源是什么意思?
!销售/收购 R3361B R3361C R3361AN
运动耳机哪个牌子好,蓝牙运动耳机推荐
高速数控工具系统RFID自动识别是如何实现的