E X P
本文约 1380 字,15 张图表,正拼命加载…
  • 编辑
  • 评论
  • 标题
  • 链接
  • 查错
  • 图文
  • 拼 命 加 载 中 ...

    ARM于昨晚正式发布了最新一代的高性能Cortex-A系列核心,也就是我们能够预测到的Cortex-A78核心,另外他们还发布了一款面向高性能的大核——Cortex-X1,它是Cortex家族历史上性能最强的一款内核。

    Cortex-A78是基于成功的Cortex-A76及Cortex-A77架构,是ARM的第三代Austin内核,通过继续优化而诞生的新架构。它仍然将PPA(Power, Performance and Area)作为自己关注的焦点,在内核IPC上遵循每代提高25%~30%的水平发展。它仍然是一枚采用Arm v8.2指令集的CPU,与常作为小核搭配使用的Cortex-A55之间是指令集兼容的。

    在Cortex-A77上面,ARM为它的后端引入了一个新的分支执行器,但前端跟不上需求。于是在Cortex-A78上,ARM扩大了前端的分支预测器,使得它能够在一个时钟周期内可以处理两个预测,提高了核心的吞吐量。同时,为了节约内核面积,ARM提供了32KB的L1指令缓存选项,原本固定为64KB。

    在内核的中间部分上,ARM着重于优化原有的设计,大部分工作都是在提高面积和能耗效率。当然,在指令重排与发射方面,ARM增加了指令调度器的宽度,相比Cortex-A77提高了2个μops,达12μops。

    后端执行单元部分并没有太大的改变,只是将其中的一个ALU升级为能够处理乘法的更复杂的单元。缓存子系统方面则有较大改变,新增了有一个Load单元,这是对现有的两个Load/Store单元的补充,可以给核心增加50%的Load带宽。通向L1数据缓存的带宽从每周期16B扩展到了每周期32B,核心通往L2缓存的带宽也增加了一倍。

    另外,与L1指令缓存的可选32KB大小对应,这里的L1数据缓存大小也可被配置为32KB,以节约内核面积。L2的TLB也从1280页减少到了1024页,足以覆盖4MB的L3缓存,同时提高了L2的能耗效率。

    Cortex-A78在整体设计上更为注重效率,但性能提升也是很明显的。

    A78 blog image1

    A78 blog image2

    A78 blog image4

    在官方提供的数据中,相比起前代Cortex-A77,单线程性能提升7%,能耗降低4%,面积需求降低5%。而在实际应用中,结合更新的工艺,Cortex-A78能够在相同功耗下提高20%的性能,或是在同性能下节约最多50%的电,是有较大的进步。

    为什么Cortex-A78要给出一些节约面积的选项呢?因为他们对大核有了更好的阐述,也就是这次发布的另一款核心——Cortex-X1,它是一款为高性能而生的大核。

    Cortex-X1在结构设计上与Cortex-A78如出一辙,但几乎在每个地方都进行了扩展。


    图片来自于WikiChip

    前端解码部分从4端口增加到了5端口,宏指令缓存直接加倍,达到3000条,甚至超过Intel的Sunny Cove(2250条),但少于Zen 2(4000条)。乱序重排缓冲区(ROB)的大小也是扩充到224条,与Zen 2和Skylake持平。

    执行部分中变化最大的是FP单元,也就是ARM特有的NEON浮点引擎,Cortex-X1上面直接将FP单元的数量倍增,达到4x128B的规模,宽度上基本等同于目前的桌面x86处理器,不过ARM目前的指令集并不允许单个长度大于128B的向量,在吞吐上肯定是不如桌面端处理器的。

    缓存部分也发生了较大的变化,除了同步Cortex-A78增加的一个Load AGU外,ARM允许Cortex-X1的二级缓存加倍,增加到1MB之多,同时L2 TLB较Cortex-A78翻倍,可覆盖8MB的L3缓存。

    Cortex-X1很像Cortex-A78,两者共享了不少设计改进,但Cortex-X1明显是冲着高性能去的,它很宽,有着更高的计算吞吐量。官方数据显示它相比Cortex-A77在峰值性能上有30%的提升,是相当巨大的。

    它为厂商提供了一个可定制的大核选项,以后我们在基于ARM的高性能移动处理器上可能会看到使用Cortex-X1作为超大核,加上多个Cortex-A78大核和Cortex-A55小核的配置。

    ARM推出Cortex-X1的目的也很明显,是为了更好地在高性能领域中建立自己的地盘,在移动端也可向苹果自研的A系列处理器发起冲击,后者的大核性能真的很恐怖。

    预计可以在今年晚些时候看到采用Cortex-A78和Cortex-X1的处理器。

    ×
    热门文章
    1想把电脑配件都塞桌子里吗?不妨来看看联力的这两款电脑桌机箱
    2超能课堂(235):你真的需要一个WiFi 6路由器吗?
    3一加发布三款新电视产品:768P、1080P、4K,约1300元起
    4铠侠正在研究晶圆级固态硬盘,可达到数百万IOPS的性能
    5华擎推出B460TM-ITX和H410TM-ITX,用笔记本内存的半高ITX主板
    6乔思伯即将带来新的MOD系列产品,外观更加收敛却精致
    7小米新款电源适配器产品通过3C认证:最高支持120W充电功率
    8ROG冰刃双屏上架京东开启预售:顶配版本接近50000元
    9育碧正式公开百人“都市巷战”主题大逃杀游戏《超猎都市》
    已有 21 条评论,每一条合规评论都是对我们的褒奖。
    • 游客 05-29 15:31

      游客

      让那些洋鬼子看看我们中国的伟大
      05-28 11:18 已有3次举报
    • 支持(1)  |   反对(0)  |   举报  |   回复
    • 有能力的话 是没问题

      支持(1)  |   反对(0)  |   举报  |   回复

      22#

    • 游客 05-28 11:18

      游客

      自研指令 + 自研OS + 自己的生态才是王道,外面一众ARM,怎么制裁都不怕
      05-27 15:36 已有1次举报
    • 支持(4)  |   反对(5)  |   举报  |   回复
    • 让那些洋鬼子看看我们中国的伟大

      已有3次举报

      支持(1)  |   反对(0)  |   举报  |   回复

      21#

    • 游客 05-28 09:53

      Adonis 博士

      ARM刚刚发布A78,华为在接下来几个月时间内就能拿出A78架构的麒麟1020 ?只要是人脑子,都知道不可能。
      别听快科技那群傻x胡扯,作也成年人要有思想主见。
      05-27 20:44 已有3次举报
    • 支持(13)  |   反对(7)  |   举报  |   回复
    • 你可以参考往年。。。。通常厂商会提前拿到的

      已有1次举报

      支持(6)  |   反对(0)  |   举报  |   回复

      20#

    • Adonis博士 05-27 20:44  加入黑名单

      游客

      麒麟1000/1020上A78是板上钉钉的事情,然后鲲鹏930有可能是基于Cortex-X1修改
      05-27 13:01 已有5次举报
    • 支持(1)  |   反对(3)  |   举报  |   回复
    • ARM刚刚发布A78,华为在接下来几个月时间内就能拿出A78架构的麒麟1020 ?只要是人脑子,都知道不可能。
      别听快科技那群傻x胡扯,作也成年人要有思想主见。

      已有3次举报

      支持(13)  |   反对(7)  |   举报  |   回复

      19#

    • 游客 05-27 18:35

      根据美帝主义行事作风 X 为极有可能拿不到A78受权 只能继续在A77基础上改进

      支持(10)  |   反对(1)  |   举报  |   回复

      18#

    • 游客 05-27 18:27

      游客

      感觉这个 X1 更适合做 laptop SoC 的核心
      05-27 15:56
    • 支持(1)  |   反对(0)  |   举报  |   回复
    • 不行吧,AMD YES才是王道

      支持(1)  |   反对(1)  |   举报  |   回复

      17#

    • 游客 05-27 15:56

      感觉这个 X1 更适合做 laptop SoC 的核心

      支持(1)  |   反对(0)  |   举报  |   回复

      15#

    • 游客 05-27 15:41

      游客

      自研指令 + 自研OS + 自己的生态才是王道,外面一众ARM,怎么制裁都不怕
      05-27 15:36 已有1次举报
    • 支持(4)  |   反对(5)  |   举报  |   回复
    • 半导体行业是极为强调全球技术合作,强如美国依然非常依赖其他国家而技术和设备。自研指令集+OS+生态这条路只有闭关锁国才有可能实现

      支持(16)  |   反对(1)  |   举报  |   回复

      14#

    • 游客 05-27 15:36

      超能康猩猩 教授

      该评论因举报过多,自动进入审核状态。

      自研指令 + 自研OS + 自己的生态才是王道,外面一众ARM,怎么制裁都不怕

      已有1次举报

      支持(4)  |   反对(5)  |   举报  |   回复

      13#

    • 游客 05-27 13:14

      该评论因举报过多,自动进入审核状态。

      12#

    • 游客 05-27 13:01

      超能康猩猩 教授

      该评论因举报过多,自动进入审核状态。

      麒麟1000/1020上A78是板上钉钉的事情,然后鲲鹏930有可能是基于Cortex-X1修改

      已有5次举报

      支持(1)  |   反对(3)  |   举报  |   回复

      11#

    • 超能康猩猩教授 05-27 12:57  加入黑名单

      该评论因举报过多,自动进入审核状态。

      10#

    • 游客 05-27 12:32

      看来安卓的单核性能在明年有希望能赶上苹果A12了。

      已有1次举报

      支持(4)  |   反对(0)  |   举报  |   回复

      9#

    • 倪嘉声编辑 05-27 12:20  加入黑名单

      vigo93 教授

      提升20%的对比是7nm 2.6G A77 vs 5nm 3G A78不说了?实际有10%偷笑了
      05-27 11:47 已有2次举报
    • 支持(2)  |   反对(1)  |   举报  |   回复
    • 写了“结合更新的工艺”,看清楚请

      支持(2)  |   反对(0)  |   举报  |   回复

      8#

    • 游客 05-27 12:19

      vigo93 教授

      提升20%的对比是7nm 2.6G A77 vs 5nm 3G A78不说了?实际有10%偷笑了
      05-27 11:47 已有2次举报
    • 支持(2)  |   反对(1)  |   举报  |   回复
    • 关键是2.6GHz A77跟3.0GHz的 A78功耗一样,当然功耗方面主要是5nm制程的功劳。所谓2.6GHz A77说的就是MTK天机1000+。至于3.0GHz A78,那就是麒麟1000/1020

      已有2次举报

      支持(0)  |   反对(0)  |   举报  |   回复

      7#

    • vigo93教授 05-27 11:47  加入黑名单

      提升20%的对比是7nm 2.6G A77 vs 5nm 3G A78不说了?实际有10%偷笑了

      已有2次举报

      支持(2)  |   反对(1)  |   举报  |   回复

      6#

    • 游客 05-27 11:44

      该评论因举报过多,自动进入审核状态。

      5#

    • 游客 05-27 11:27

      该评论因举报过多,自动进入审核状态。

      4#

    • 游客 05-27 11:17

      QQ23870862 终极杀人王

      该评论因举报过多,自动进入审核状态。

      华为能不能不用arm的东西做到真正的国产

      已有2次举报

      支持(8)  |   反对(2)  |   举报  |   回复

      3#

    • Hallo教授 05-27 11:17  加入黑名单

      希望可以见到X1和A78的大核芯片上平板……

      支持(4)  |   反对(0)  |   举报  |   回复

      2#

    • QQ23870862终极杀人王 05-27 11:09  加入黑名单

      该评论因举报过多,自动进入审核状态。

      1#

    提示:本页有 2 个评论因未通过审核而被隐藏

    我来评论
    为你推荐