E X P

  • 编辑
  • 评论
  • 标题
  • 链接
  • 查错
  • 图文
  • 拼 命 加 载 中 ...

      虽然AMD每年都在升级CPU或者APU产品,但是不论是Richland APU还是Vishera FX处理器都是架构优化,制程工艺也没有升级。即便是Jaguar架构的Kabini、Temash APU也只是工艺升级,架构升级只是从K10精简变成了推土机精简而已,AMD要想给大家新的希望,就必须拿出更有分量的产品。

      这个产品就是Kaveri APU,它身上有很多第一:第一个支持HSA异构运算的APU、第一个真正使用GCN架构GPU核心的APU、第一个使用Steamroller架构CPU核心的桌面APU,而且Kaveri APU也会升级28nm工艺。至少在这些表面的光环加持下,Kaveri APU要比AMD其他产品更值得期待。

      之前我们已经有过太多的Kaveri APU爆料了,从架构、工艺升级再到FM2+插槽A88X芯片组等皆有涉及。日本PCWatch专栏作者后藤弘茂日前又对Kaveri APU的架构做了深入分析,其中也谈到了Steamroller架构以及与Intel处理器的一些对比,来看一下。

    Kaveri APU工艺进化:32nm SOI到28nm Bulk

      介绍架构之前,首先来看Kaveri APU的工艺变化,大家知道的是Kaveri会从AMD万年不变的32nm升级到28nm,但是准确来说这是从32nm SOI工艺到28nm Bulk工艺的变化,不仅仅是制程变化。

      从SOI转向Bulk工艺是AMD早前就已经定下的,去年的WSA晶圆供货会议上AMD就有此表态。他们从130nm节点就开始跟IBM联合开发SOI(绝缘体上硅)技术,不过在32nm SOI阶段,从AMD分离出去的Globalfounderies遇到了困难,第一代Llano APU就遇到了大坑,或许这也是AMD放弃SOI转向更普遍的Bulk工艺的原因之一。

      后藤弘茂称转向28nm bulk工艺之后,晶体管的性能没有什么损失,制程从32nm升级到28nm之后还可以提升晶体管密度,相比前几代APU,这一次制程工艺升级这对APU来说也是一个跳跃。

    随晶体管增长而变化的GPU规模

      制程工艺升级之后晶体管密度更大,Kaveri APU上可以容纳的电路单元更多,所以其电路规模也显著扩张。Trinity/Richland APU使用的Piledriver打桩机核心只是推土机架构的小改款,而Steamroller压路机则是推土机的大改。

      Kaveri中的GPU核心也是如此,从之前的VLIW 5/4体系提升到更高效的GCN架构,流处理器单元更多,缓存更大。举例来说,之前的APU中流处理器单元最多384个,而Kaveri APU的流处理器单元是512个(从之前的Berlin APU推测而来),提升了33%。

    Steamroller架构改进:改进双路并行解码单元

      Kaveri APU使用的CPU核心是Steamroller,这是继推土机Bulldozer、打桩机Piledriver之后的第三代模块化架构,之前我们已经有文章详细介绍过了Steamroller架构的改进,详情可以参考:推土机三世能否翻身,Steamroller聚焦性能提升

      后藤弘茂原文也提到了一些Steamroller架构的改进,简单来说下。之前的Bulldozer推土机架构使用的模块化设计,每个模块内由2个整数单元和1个弹性浮点单元组成,不过这两个整数单元使用的一个解码器,虽然降低了设计难度,但是这种前端设计在应付两个线程时是有问题的。

      Steamroller的改变就是设计了两个并行的解码器,每个整数单元都有自己的解码单元,这样一来每周期内每个线程可执行的整数指令提升了25%,此外Steamroller架构的存储系统也做了增强,提升了IPC(每周期指令)性能。


    前端设计改进


    单核执行单元性能提升


    Steamroller架构要点:提升每瓦性能比


    推土机架构与Steamroller架构对比(点击放大)

    GPU架构改进:512个GCN流处理器单元

      再来看Kaveri AP中的GPU核心的变化。虽然之前AMD已经在Richland APU中把整合的集显升级到了HD 8000系列,但他们说起来都是VLIW 5/4架构的马甲,Kaveri APU中的GPU才是真正的GCN架构。

      Kaveri APU中的MAD(乘积加)单元是512个,因为GCN架构中64个MAD单元为一组CU计算单元,所以Kaveri APU使用的是8组CU单元,512个流处理器单元。此前Lllano APU中有320个流处理器单元,Trnity/Richland最多384个,不过他们都是VLIW体系的,Llano的320个流处理器单元只相当于80个1D单元,与Kaveri APU的512个不可同日而语。

      512个GCN流处理器元的Kaveri APU理论上大约能带来1TFLOPS的性能。此外,Kavri APU的GPU不仅仅是33%的数量增长,与VLIW体系相比,GCN架构的性能也会更强。

      这张表格是AMD 40nm和28nm工艺下的不同GPU核心的规模,可以对比下Kaveri APU所出的位置。

      另外,Kaveri APU有512个流处理器单元,这个数量大约是PS4所用的、1152个流处理器单元的APU的一半,PS4的浮点性能为1.8TFLOPS,不过Kaveri还在使用DDR3内存,受带宽所限,所以其性能是达不到PS4一半的水平的。

    Kaveri的内部总线变化


    目前的Trinity APU的内部总线系统

      Kaveri APU之前的APU都有两条内部总线,一条是Radeon Memory Bus(代号Garlic大蒜),它主要用于独显与集显GPU连接。另外一条总线是Fusion Compute Link(代号Onion洋葱),它主要用于集显与CPU连接,在PS4上使用的总线系统也是这两条总线的扩展版。

      在Kaveri APU上这一切都改变了,因为Kaveri支持AMD的hUMA异构统一寻址技术,CPU和GPU可以通过虚拟的统一寻址空间共享数据,因此Garlic和Onion总线都被淘汰了。

      AMD CTO以及高级GPU架构师也对这种高度集成的总线表示了赞赏,认为这样的设计要比之前的双总线设计更高效,数据共享更容易,编程开发更简单。

    与IVB、Haswell的比较

      Kaveri虽然升级到了28nm工艺,但是与Intel的22nm 3D晶体管工艺相比依然处于弱势,这里就对比了三代APU以及Intel最近三代CPU的工艺及核心面积情况。

      在32nm节点,Intel SNB架构的4核+GT2处理器核心面积在216mm2,AMD的Llano 4核大约是228mm2,双方相差不大。到了22nm 3D晶体管时代,Intel的IVB 4核+GT2处理器的核心面积降低到了160mm2,而且GPU性能几乎翻倍,而Hasewll时代4核+GT2核显的面积约为177mm2,而且GPU性能更强,相比32nm时代其核心面积只有原来的74-82%。

      Kaveri APU的核心面积没有官方数据,不过根据下图的Kaveri APU实物测量,核心面积大约在240mm2以内,与32nm工艺的Llano/Trinity持平,这是AMD不占优势的地方,不过与Intel性能最好的4核Haswell+GT3e处理器的260mm2相比还算可以了。


    拆开外壳之后测量的Kaveri APU核心面积


    预测的AMD未来CPU核心面积(点击放大)

      编者注:对Kaveri APU来说,这应该是AMD近年来首次同时升级架构及工艺,在Haswell特别是在GPU性能上快速逼近的情况下,Kaveri将担当起AMD未来一两年阻击Intel的关键重任,反正AMD对高端FX处理器也是意兴阑珊了,Steamroller架构都没有首先应用在FX处理器上。

      Kaveri APU会集成512个GCN架构的流处理器单元,规模相当于HD 7750了,当然最终的性能受限于DDR3的带宽,肯定不能跟HD 7750相比,但是这样大的提升也是值得期待的,入门级独显市场越来越危险啊。

      原文谈的都是一些架构上的改进,对于Kaveri APU我们现在还没见到实物,发布上市还得等到年底,所以其意义如何还得看实际表现,现在还无法作出评价。

    ×
    热门文章
    1[直播结束]为发烧级手游玩家打造的旗舰,一加Ace Pro手机正式发布
    2十铨科技发布ELITE PLUS DDR5内存:全新对称式散热片,最高6000MHz可选
    3AMD Ryzen 7000系列CPU新包装曝光,高端型号可能会涨价
    4XPG龙耀LANCER DDR5吹雪内存评测:华硕吹雪主板的绝佳搭配
    5传英伟达降低GeForce RTX 4070/4080功耗,可能还有20GB显存的型号
    6最新版Windows 11会丢失用户数据,微软建议大家赶紧打个降性能补丁
    7壁仞科技发布首款通用GPU芯片BR100:算力创全球记录,目前正在测试中
    8联想推出ThinkStation P358工作站,AMD Ryzen Pro 5000系列现身
    9Solidigm展示全球首款PLC SSD,将率先用于数据中心
    已有 40 条评论,共 88 人参与。
    登录快速注册 后发表评论
    • 游客  2014-01-15 14:36

      该评论年代久远,荒废失修,暂不可见。

      支持(0)  |   反对(0)  |   举报  |   回复

      40#

    • 游客  2013-12-10 11:55

      该评论年代久远,荒废失修,暂不可见。

      支持(0)  |   反对(12)  |   举报  |   回复

      39#

    • 游客  2013-12-10 11:46

      该评论年代久远,荒废失修,暂不可见。

      支持(0)  |   反对(1)  |   举报  |   回复

      38#

    • 游客  2013-09-29 18:28

      该评论年代久远,荒废失修,暂不可见。

      支持(0)  |   反对(0)  |   举报  |   回复

      37#

    • 游客  2013-09-29 18:28

      该评论年代久远,荒废失修,暂不可见。

      支持(0)  |   反对(0)  |   举报  |   回复

      36#

    • 游客  2013-07-09 20:24

      该评论年代久远,荒废失修,暂不可见。

      支持(2)  |   反对(4)  |   举报  |   回复

      35#

    • 游客  2013-07-08 19:07

      该评论年代久远,荒废失修,暂不可见。

      支持(5)  |   反对(0)  |   举报  |   回复

      34#

    • 超能网友终极杀人王 2013-07-08 18:27    |  加入黑名单

      该评论年代久远,荒废失修,暂不可见。

      支持(0)  |   反对(0)  |   举报  |   回复

      33#

    • 游客  2013-07-08 17:57

      该评论年代久远,荒废失修,暂不可见。

      支持(0)  |   反对(0)  |   举报  |   回复

      32#

    • 游客  2013-07-08 17:56

      该评论年代久远,荒废失修,暂不可见。

      支持(0)  |   反对(2)  |   举报  |   回复

      31#

    • 游客  2013-07-08 17:08

      该评论年代久远,荒废失修,暂不可见。

      支持(0)  |   反对(0)  |   举报  |   回复

      30#

    • 我匿名了  2013-07-08 16:53

      该评论年代久远,荒废失修,暂不可见。

      支持(1)  |   反对(0)  |   举报  |   回复

      29#

    • 游客  2013-07-08 16:08

      该评论年代久远,荒废失修,暂不可见。

      支持(0)  |   反对(0)  |   举报  |   回复

      28#

    • 游客  2013-07-08 15:48

      该评论年代久远,荒废失修,暂不可见。

      支持(0)  |   反对(2)  |   举报  |   回复

      27#

    • 超能网友终极杀人王 2013-07-08 14:41    |  加入黑名单

      该评论年代久远,荒废失修,暂不可见。

      支持(0)  |   反对(0)  |   举报  |   回复

      26#

    • 游客  2013-07-08 14:34

      该评论年代久远,荒废失修,暂不可见。

      支持(0)  |   反对(0)  |   举报  |   回复

      25#

    • 游客  2013-07-08 14:25

      该评论年代久远,荒废失修,暂不可见。

      支持(0)  |   反对(5)  |   举报  |   回复

      24#

    • 游客  2013-07-08 14:23

      该评论年代久远,荒废失修,暂不可见。

      支持(0)  |   反对(3)  |   举报  |   回复

      23#

    • 游客  2013-07-08 14:21

      该评论年代久远,荒废失修,暂不可见。

      支持(0)  |   反对(2)  |   举报  |   回复

      22#

    • 游客  2013-07-08 14:12

      该评论年代久远,荒废失修,暂不可见。

      支持(0)  |   反对(1)  |   举报  |   回复

      21#

    • 游客  2013-07-08 13:00

      该评论年代久远,荒废失修,暂不可见。

      支持(1)  |   反对(0)  |   举报  |   回复

      20#

    • 游客  2013-07-08 10:59

      该评论年代久远,荒废失修,暂不可见。

      支持(0)  |   反对(2)  |   举报  |   回复

      19#

    • 游客  2013-07-07 17:44

      该评论年代久远,荒废失修,暂不可见。

      支持(0)  |   反对(0)  |   举报  |   回复

      18#

    • 游客  2013-07-07 17:41

      该评论年代久远,荒废失修,暂不可见。

      支持(0)  |   反对(0)  |   举报  |   回复

      17#

    • 游客  2013-07-07 13:17

      该评论年代久远,荒废失修,暂不可见。

      支持(0)  |   反对(0)  |   举报  |   回复

      16#

    • 游客  2013-07-06 11:09

      该评论年代久远,荒废失修,暂不可见。

      支持(0)  |   反对(0)  |   举报  |   回复

      15#

    • 游客  2013-07-05 20:15

      该评论年代久远,荒废失修,暂不可见。

      支持(0)  |   反对(0)  |   举报  |   回复

      14#

    • 游客  2013-07-05 18:32

      该评论年代久远,荒废失修,暂不可见。

      支持(0)  |   反对(0)  |   举报  |   回复

      13#

    • 游客  2013-07-05 16:22

      该评论年代久远,荒废失修,暂不可见。

      支持(0)  |   反对(0)  |   举报  |   回复

      12#

    • 游客  2013-07-05 16:12

      该评论年代久远,荒废失修,暂不可见。

      支持(0)  |   反对(0)  |   举报  |   回复

      11#

    加载更多评论

    登录 后发表评论,若无帐号可 快速注册 ,请留意 评论奖罚说明