E X P
正努力加载中…
  • 编辑
  • 评论
  • 标题
  • 链接
  • 查错
  • 图文
  • 拼 命 加 载 中 ...

    ARM虽然是家小公司,但他们是整个ARM处理器阵营的核心,除了苹果、高通等极少数可以自己开发ARM兼容架构的公司之外,联发科、海思等大多数公司都会直接使用ARM的公版Cortex-A架构授权。64位时代以来,ARM已经发布了Cortex-A57/A53一大一小两种架构,但只有A53遍地开花,高性能的A57核心在手机市场只有三星、高通在用,面临着难产的尴尬。为此,ARM公司今年2月份推出了A57的继任者——Cortex-A72架构,号称性能是A15的3.5倍,功耗则降低了75%。

    当时我们对ARM的Cortex-A72核心了解并不多,只知道A72核心会使用新一代的FinFET工艺生产,包括三星/Globalfoundries的14nm及TSMC的16nm,得益于先进的工艺,A72核心频率更高,可以达到2.5GHz,更高的频率有助于A72增强服务器市场的存在感,这也是它的目标市场之一。

    ARM日前公布了Coretx-A72核心的详细架构,Anandtech网站也做了一番解析,我们来看下A72架构到底有哪些改进,毕竟A72核心很可能成为明年的旗舰手机/平板的标配。

    值得一提的是,原先首先解释了A72核心的命名由来,为什么不选择Cortex-A59这样的命名呢?ARM解释说这纯粹是方便市场宣传而已,如果跟A57的命名很相近,那么大家就不容易看出这两种核心之间的区别(大家都只会看数字辩好坏吗?)。


    A72核心的性能达到了A15的3.5倍


    功耗降低了75%

    ARM之前宣传A72核心性能是前代的3.5倍,功耗降低了75%,但大家也得清楚这只是宣传而已,ARM并没有直接对比A57与A72的差别,如果只看这两者,A72核心在同样的14/16nm工艺下只比A57提升了34%(2.6x到3.5x,还得考虑到频率上的差异),而在同样的28nm工艺下,其功耗也不过减少了20%左右。

    还要注意到,A72核心可以运行在更高的频率下,这不是简单地最高频率,此前A57由于太强,因此它只能在最高频率下维持很短时间就要降频,而ARM提供的数据表明,A72核心在16nm FinFET工艺下,2.5GHz频率运行时功耗只有750mW。

    除了功耗之外,ARM还在A72架构上做了很多优化,如上图所示,整数、浮点、内存等性能皆有不同程度的提升,虽然还缺少一些细节,不过IPC性能上提升16-30%还是有的。

    由A57升级而来的A72架构

    ARM似乎在性能、功耗及核心面积这三个方面都做了全面的改善,这也是半导体设计的三个重要指标。这个成绩是ARM重新优化了几乎所有A57逻辑区块之后才得来的,其中CPU架构做了相当大的改进,包括新的分支预测单元,改善了解码器管线设计等。

    在指令预取这一块,我们可以看到ARM重新设计了分支预测单元,它可以支持更复杂的算法,提高了性能、降低了功耗以、误预测率及投机(speculation),具体来说就是相比A57降低了50%的误预测,25%的投机率。多余的分支预测单元则被禁止了。——实际工作中,如果分支预测单元不能有效工作,那就会被绕过去。

    此外,通过更好地耦合不同的IP模块,ARM还优化了RAM组织。

    再来看A72的管线设计,解码/重命名性能也提升了。解码器自身是3指令发射的解码器,但ARM在提升性能。降低功耗方面花了很大精力。为了提高要性能,提升了有效的解码带宽,而解码器也获得了一些AArch64指令融合增强。此外,功耗也通过多种方法降低了,包括直接的解码等。

    看起来指令分派/收回(Dispatch/retire)单元是提升性能而做的改进中变化最大的。解码器可以融合指令,ARM的指令分派单元可以将ops操作打乱成更小的微操作(micro-ops)输送给执行单元,这样可以在指令派发单元将3发射变成等效5发射。这将提高解码器的吞吐量,同时也提高了每个周期内指令派发单元创建的微操作数。

    A72架构,ARM表示平均每个指令有1.08个微操作,这将缓解57架构中实际受限的指令派发单元的性能。

    另一方面执行单元也有新的设计,包括新一代的FP浮点/高级SIMD单元,由于FP浮点管线从9降低到了6,因此延迟更低。FMUL(浮点乘法)的延迟也从5周期降低了3周期,FADD(浮点加法)从4降到3,FMAC(浮点累积乘)从9降低到6,CVT单元从4降到2。FP浮点单元的渲染管线长度从19降低到了16。

    整数单元也做了改进,Radix-16除法器的带宽加倍,CRC单元延迟降低到了1周期,相比A57架构其带宽达到了3倍。

    另一个重大的性能改进是L/S(Load/Store)单元,ARM表示L/S单元的带宽提升了30%,这是因为引入了新的预取器。

    A72架构纸面上的改进让人印象深刻,它是A57架构的革新升级,不论是性能还是功耗,或者核心面积,A72都有改进。A57架构是去年Q3季度进入市场的,但现在才有三星、高通的A57架构处理器量产上市,所以A72核心真正进入市场还需要至少1年时间。

    ×
    热门文章
    1同样的A14处理器,iPhone 12和iPad Air跑分能差出20%?
    2安培、图灵、RNDA比一比:三大架构显卡能耗比对比测试
    3ID-COOLING SE-50风冷散热器评测:高性价比、单塔风冷搅局者
    4传闻RTX 3080 20GB和RTX 3070 16GB被取消,今年除RTX 3090外没大显存显卡
    5NVIDIA RTX A6000性能测试泄露,SPECviewperf比Quadro RTX 6000快11%
    6群联PS5018-E18主控速度迎来新高,顺序读写达到7381 MB/s和7025 MB/s
    7Alphacool发布全新Eisblock ES水冷头:适用于RTX3090/RTX3080显卡
    8宏碁发布Predator和Nitro系列显示器新品,涵盖24.5到34寸的多种选择
    9两大VLOG神器更新:DJI推Pocket 2云台相机,索尼ZV-1有了白色款
    已有 17 条评论,每一条合规评论都是对我们的褒奖。
    • 游客 2015-08-15 23:28

      已有X次舉報

      支持(0)  |   反对(0)  |   举报  |   回复

      17#

    • 游客 2015-06-13 05:39

      Advisor - ??ffentlichkeitsarbeit & Kommunikation

      支持(0)  |   反对(0)  |   举报  |   回复

      16#

    • blog168教授 2015-04-29 10:53  加入黑名单

      一次给你到位了,来年吃什么

      支持(0)  |   反对(0)  |   举报  |   回复

      15#

    • 没薯片会死星人初中生 2015-04-25 10:05  加入黑名单

      很不错的科普啊,赞一个!
      小编辛苦了!

      支持(0)  |   反对(0)  |   举报  |   回复

      14#

    • makedie博士 2015-04-24 19:49  加入黑名单

      跟着bolvar大涨姿势

      支持(2)  |   反对(0)  |   举报  |   回复

      13#

    • DragonKnight终极杀人王 2015-04-24 19:27  加入黑名单

      游客

      已有X次舉報是什麼鬼
      2015-04-24 18:11 已有9次举报
    • 支持(0)  |   反对(5)  |   举报  |   回复
    • 就是说,以前你说什么,如果有人不同意,他们都是点“反对”,现在他们改成点“举报”了。

      已有12次举报

      支持(0)  |   反对(4)  |   举报  |   回复

      12#

    • 游客 2015-04-24 18:26

      wx8600 博士

      这篇内容算是CS学科的知识范围内了……
      没学过计算机系统结构的人应该是很多看不懂(
      2015-04-24 16:57 已有2次举报
    • 支持(2)  |   反对(2)  |   举报  |   回复
    • 非常喜欢这样的文章,虽然不是这一学科毕业的,但是看过这类普及的话是不全懂却能理解一些。

      支持(0)  |   反对(1)  |   举报  |   回复

      11#

    • 游客 2015-04-24 18:11

      已有X次舉報是什麼鬼

      已有9次举报

      支持(0)  |   反对(5)  |   举报  |   回复

      10#

    • wx8600博士 2015-04-24 16:57  加入黑名单

      这篇内容算是CS学科的知识范围内了……
      没学过计算机系统结构的人应该是很多看不懂(

      已有2次举报

      支持(2)  |   反对(2)  |   举报  |   回复

      9#

    • DragonKnight终极杀人王 2015-04-24 14:26  加入黑名单

      该评论因举报过多,自动进入审核状态。

      8#

    • DragonKnight终极杀人王 2015-04-24 14:11  加入黑名单

      该评论因举报过多,自动进入审核状态。

      7#

    • bolvar终极杀人王 2015-04-24 14:01  加入黑名单

      游客

      想当年,T-72不好卖了,所以毛熊们改了一下数字,叫T-90继续卖~
      2015-04-24 13:47
    • 支持(2)  |   反对(0)  |   举报  |   回复
    • 别说俄毛了,ARM之前推出的A12后来就改成了A17核心。。。ARM不是第一次办这事了,不过之前有说是国内某些厂商的要求,这个不确定是真假。还有高通的骁龙801,之前也不存在这个型号,高通是用8974AA AB AC来区分,但后来也弄出个801来。

      已有1次举报

      支持(0)  |   反对(0)  |   举报  |   回复

      6#

    • bolvar终极杀人王 2015-04-24 13:59  加入黑名单

      游客

      得益于先进的频率

      应该是得益于先进的工艺吧,目前放出的ppt以及现在14nm7420的表现,下代的确值得等待大半年。
      2015-04-24 12:41 已有3次举报
    • 支持(0)  |   反对(0)  |   举报  |   回复
    • 已修正。

      支持(0)  |   反对(0)  |   举报  |   回复

      5#

    • 游客 2015-04-24 13:47

      想当年,T-72不好卖了,所以毛熊们改了一下数字,叫T-90继续卖~

      支持(2)  |   反对(0)  |   举报  |   回复

      4#

    • taozhiyykk博士 2015-04-24 13:33  加入黑名单

      这篇文章完全看不懂怎么办

      已有1次举报

      支持(0)  |   反对(1)  |   举报  |   回复

      3#

    • NISIZHIZHU一代宗师 2015-04-24 13:11  加入黑名单

      ARM是一家纯粹的PPT公司

      已有16次举报

      支持(3)  |   反对(2)  |   举报  |   回复

      2#

    • 游客 2015-04-24 12:41

      得益于先进的频率

      应该是得益于先进的工艺吧,目前放出的ppt以及现在14nm7420的表现,下代的确值得等待大半年。

      已有3次举报

      支持(0)  |   反对(0)  |   举报  |   回复

      1#

    提示:本页有 2 个评论因未通过审核而被隐藏

    我来评论
    为你推荐