OpenEdv-开源电子网

 找回密码
 立即注册
正点原子全套STM32/Linux/FPGA开发资料,上千讲STM32视频教程免费下载...
查看: 4822|回复: 0

ARM内核全解析,从ARM7 ARM9到Cortex-A7 A8 Cortex-A53 A57 A72

[复制链接]

221

主题

221

帖子

0

精华

高级会员

Rank: 4

积分
762
金钱
762
注册时间
2021-5-18
在线时间
28 小时
发表于 2021-6-1 16:15:48 | 显示全部楼层 |阅读模式
以下总结一下近几年来手机端较为主流的ARM处理器。
以由高到低的方式来看,ARM处理器大体上可以排序为:
Cortex-A72处理器、Cortex-A57处理器、Cortex-A53处理器、Cortex-A15处理器、Cortex-A12处理器、Cortex-A9处理器、Cortex-A8处理器、Cortex-A7处理器、Cortex-A5处理器、ARM11处理器、ARM9处理器、ARM7处理器
再往低的部分手机产品中基本已经不再使用,这里就不再介绍。
● Cortex-A72处理器
不久前,ARM发布了自己的下一代核心Cortex-A72,A72将会直接取代A57,定位高端市场。
Cortex-A72性能已达到PC级CPUARM从A15之后,执行大小核的架构,所谓的big.LITTLE,在低负载用小核心,高负载用大核心,平衡性能与功耗的矛盾。
而这一次,ARM只发布了一个大核心A72,与其配套的小核心依然是上一代的A53,没有进一步发展,虽然ARM此前已经宣称,A53将顺序执行架构做到了极致。但是我们不认为就没有可升级的余地。ARM不更新的原因,可能是在小核心上,A53的性能已经够了,进一步升级无意义。
在这个A72的大核心上,ARM表示,Cortex-A72是其性能最出色、最先进的处理器,构建在Cortex-A57的基础之上,性能可达Cortex-A15 3.5倍。不过,从架构图和规格表上看,A72和A57并没有本质的不同,仍旧最多四核心,一级二级的缓存容量都没变,只是做了一些细节调整,比较明显的变化是砍去了NEON SIMD引擎中的加密扩展功能,总线接口扩展到128bit。
所以,A72的性能提升可能来自于微架构的改进,譬如分支预测的效率等等。
A72号称性能比A15处理器提升3.5倍,在同样的工作负载下,功耗降低75%。搭配大小核心方案,功耗还能降低40%-60%看上去非常美好。
不过,我们要知道,按照ARM这种性能算法,A57比A15也有1.9倍的性能提升。那是建立在20nm对28nm工艺的基础之上的。同样,A72这个所谓3.5倍的性能提升,也是建立在16nmfinFET对28nm的工艺优势上。
实际上,ARM的A57在同频下相对于A15只有25%-30%的提升。1.9GHZ的A15跑specint2000,大约是1100分,1.7GHZ的A57跑specint2000是1250分。
按照ARM的比例,3.5倍的A72相比1.9倍的A57只提升了1.84倍,估计同频A72相对于A57大约也是25%左右的提升。也就是1.7Ghz的A72跑Specint2000大约在1550分。
这个分数和苹果的A8处理器差不多,而A8是1.4GHZ,ARM这个下一代的A72核心,同频性能很可能还不如苹果的A8。
不过A8用在手机上只是双核心,而A72起步就是四核心,在频率上,A72号称能达到2.5GHZ,所以总体性能A72的处理器还是有优势的。不过等A72在2016年上市的时候,苹果A10可能都在路上了。
放到PC上去比较,A72大约还在酷睿2的等级,这个性能很不错,但是不能与主流的Intel i7去比较,移动距离桌面还有很远的距离。
多核心效率和内存性能大幅提升,CoreLink CCI-500最大的变化就是增加了一个“探听过滤器”(Snoop Filter),从而使探听控制不再局限于单个簇内部的CPU之间,可以扩展到整个处理器的所有核心。
过去,ARM虽然支持多核心,但实际上是四个核心一个簇,簇内部是有侦听的,可以解决缓存一致性的问题,而簇之间是没有的,所以从四核心到八核心会有一定的性能下降。
而ARM提倡的大小核恰恰是八核心的,这次增加“探听过滤器”可以提升多核心的性能。
额外的开销少了,内存的性能也跟着提升,ARM宣称CoreLink CCI-500可以提升30%的内存性能。
在内存带宽上,CoreLink CCI-500提升到了四通道128-bit内存位宽。这让采用ARM公版设计的厂商可以支持更宽的内存带宽,进而支持更高分辨率的显示设备。
而过去,只有高通的处理器内存带宽比较高,因为高通不使用ARM的一致性互联架构,而是自己搞一套。而高通处理器的体验也一直比较好。
在核心支持上,最多支持的CPU簇也从2个增加到4个,每个簇可以支持四个处理器,这样算最多可以支持16个处理器,可以用于一些高性能领域。手机上因为功耗原因估计还会是8核心(大小四核心)作为主流。
对消费者来说,最实惠就是“探听过滤器”带来的效能提升和四通道128-bit内存位宽带来的体验提升。


原文链接:https://www.yunduoketang.com/article/zxjy17.html

正点原子逻辑分析仪DL16劲爆上市
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则



关闭

原子哥极力推荐上一条 /2 下一条

正点原子公众号

QQ|手机版|OpenEdv-开源电子网 ( 粤ICP备12000418号-1 )

GMT+8, 2024-5-29 11:41

Powered by OpenEdv-开源电子网

© 2001-2030 OpenEdv-开源电子网

快速回复 返回顶部 返回列表