E X P
正努力加载中…
  • 编辑
  • 评论
  • 标题
  • 链接
  • 查错
  • 图文
  • 拼 命 加 载 中 ...

      虽然AMD每年都在升级CPU或者APU产品,但是不论是Richland APU还是Vishera FX处理器都是架构优化,制程工艺也没有升级。即便是Jaguar架构的Kabini、Temash APU也只是工艺升级,架构升级只是从K10精简变成了推土机精简而已,AMD要想给大家新的希望,就必须拿出更有分量的产品。

      这个产品就是Kaveri APU,它身上有很多第一:第一个支持HSA异构运算的APU、第一个真正使用GCN架构GPU核心的APU、第一个使用Steamroller架构CPU核心的桌面APU,而且Kaveri APU也会升级28nm工艺。至少在这些表面的光环加持下,Kaveri APU要比AMD其他产品更值得期待。

      之前我们已经有过太多的Kaveri APU爆料了,从架构、工艺升级再到FM2+插槽A88X芯片组等皆有涉及。日本PCWatch专栏作者后藤弘茂日前又对Kaveri APU的架构做了深入分析,其中也谈到了Steamroller架构以及与Intel处理器的一些对比,来看一下。

    Kaveri APU工艺进化:32nm SOI到28nm Bulk

      介绍架构之前,首先来看Kaveri APU的工艺变化,大家知道的是Kaveri会从AMD万年不变的32nm升级到28nm,但是准确来说这是从32nm SOI工艺到28nm Bulk工艺的变化,不仅仅是制程变化。

      从SOI转向Bulk工艺是AMD早前就已经定下的,去年的WSA晶圆供货会议上AMD就有此表态。他们从130nm节点就开始跟IBM联合开发SOI(绝缘体上硅)技术,不过在32nm SOI阶段,从AMD分离出去的Globalfounderies遇到了困难,第一代Llano APU就遇到了大坑,或许这也是AMD放弃SOI转向更普遍的Bulk工艺的原因之一。

      后藤弘茂称转向28nm bulk工艺之后,晶体管的性能没有什么损失,制程从32nm升级到28nm之后还可以提升晶体管密度,相比前几代APU,这一次制程工艺升级这对APU来说也是一个跳跃。

    随晶体管增长而变化的GPU规模

      制程工艺升级之后晶体管密度更大,Kaveri APU上可以容纳的电路单元更多,所以其电路规模也显著扩张。Trinity/Richland APU使用的Piledriver打桩机核心只是推土机架构的小改款,而Steamroller压路机则是推土机的大改。

      Kaveri中的GPU核心也是如此,从之前的VLIW 5/4体系提升到更高效的GCN架构,流处理器单元更多,缓存更大。举例来说,之前的APU中流处理器单元最多384个,而Kaveri APU的流处理器单元是512个(从之前的Berlin APU推测而来),提升了33%。

    Steamroller架构改进:改进双路并行解码单元

      Kaveri APU使用的CPU核心是Steamroller,这是继推土机Bulldozer、打桩机Piledriver之后的第三代模块化架构,之前我们已经有文章详细介绍过了Steamroller架构的改进,详情可以参考:推土机三世能否翻身,Steamroller聚焦性能提升

      后藤弘茂原文也提到了一些Steamroller架构的改进,简单来说下。之前的Bulldozer推土机架构使用的模块化设计,每个模块内由2个整数单元和1个弹性浮点单元组成,不过这两个整数单元使用的一个解码器,虽然降低了设计难度,但是这种前端设计在应付两个线程时是有问题的。

      Steamroller的改变就是设计了两个并行的解码器,每个整数单元都有自己的解码单元,这样一来每周期内每个线程可执行的整数指令提升了25%,此外Steamroller架构的存储系统也做了增强,提升了IPC(每周期指令)性能。


    前端设计改进


    单核执行单元性能提升


    Steamroller架构要点:提升每瓦性能比


    推土机架构与Steamroller架构对比(点击放大)

    GPU架构改进:512个GCN流处理器单元

      再来看Kaveri AP中的GPU核心的变化。虽然之前AMD已经在Richland APU中把整合的集显升级到了HD 8000系列,但他们说起来都是VLIW 5/4架构的马甲,Kaveri APU中的GPU才是真正的GCN架构。

      Kaveri APU中的MAD(乘积加)单元是512个,因为GCN架构中64个MAD单元为一组CU计算单元,所以Kaveri APU使用的是8组CU单元,512个流处理器单元。此前Lllano APU中有320个流处理器单元,Trnity/Richland最多384个,不过他们都是VLIW体系的,Llano的320个流处理器单元只相当于80个1D单元,与Kaveri APU的512个不可同日而语。

      512个GCN流处理器元的Kaveri APU理论上大约能带来1TFLOPS的性能。此外,Kavri APU的GPU不仅仅是33%的数量增长,与VLIW体系相比,GCN架构的性能也会更强。

      这张表格是AMD 40nm和28nm工艺下的不同GPU核心的规模,可以对比下Kaveri APU所出的位置。

      另外,Kaveri APU有512个流处理器单元,这个数量大约是PS4所用的、1152个流处理器单元的APU的一半,PS4的浮点性能为1.8TFLOPS,不过Kaveri还在使用DDR3内存,受带宽所限,所以其性能是达不到PS4一半的水平的。

    Kaveri的内部总线变化


    目前的Trinity APU的内部总线系统

      Kaveri APU之前的APU都有两条内部总线,一条是Radeon Memory Bus(代号Garlic大蒜),它主要用于独显与集显GPU连接。另外一条总线是Fusion Compute Link(代号Onion洋葱),它主要用于集显与CPU连接,在PS4上使用的总线系统也是这两条总线的扩展版。

      在Kaveri APU上这一切都改变了,因为Kaveri支持AMD的hUMA异构统一寻址技术,CPU和GPU可以通过虚拟的统一寻址空间共享数据,因此Garlic和Onion总线都被淘汰了。

      AMD CTO以及高级GPU架构师也对这种高度集成的总线表示了赞赏,认为这样的设计要比之前的双总线设计更高效,数据共享更容易,编程开发更简单。

    与IVB、Haswell的比较

      Kaveri虽然升级到了28nm工艺,但是与Intel的22nm 3D晶体管工艺相比依然处于弱势,这里就对比了三代APU以及Intel最近三代CPU的工艺及核心面积情况。

      在32nm节点,Intel SNB架构的4核+GT2处理器核心面积在216mm2,AMD的Llano 4核大约是228mm2,双方相差不大。到了22nm 3D晶体管时代,Intel的IVB 4核+GT2处理器的核心面积降低到了160mm2,而且GPU性能几乎翻倍,而Hasewll时代4核+GT2核显的面积约为177mm2,而且GPU性能更强,相比32nm时代其核心面积只有原来的74-82%。

      Kaveri APU的核心面积没有官方数据,不过根据下图的Kaveri APU实物测量,核心面积大约在240mm2以内,与32nm工艺的Llano/Trinity持平,这是AMD不占优势的地方,不过与Intel性能最好的4核Haswell+GT3e处理器的260mm2相比还算可以了。


    拆开外壳之后测量的Kaveri APU核心面积


    预测的AMD未来CPU核心面积(点击放大)

      编者注:对Kaveri APU来说,这应该是AMD近年来首次同时升级架构及工艺,在Haswell特别是在GPU性能上快速逼近的情况下,Kaveri将担当起AMD未来一两年阻击Intel的关键重任,反正AMD对高端FX处理器也是意兴阑珊了,Steamroller架构都没有首先应用在FX处理器上。

      Kaveri APU会集成512个GCN架构的流处理器单元,规模相当于HD 7750了,当然最终的性能受限于DDR3的带宽,肯定不能跟HD 7750相比,但是这样大的提升也是值得期待的,入门级独显市场越来越危险啊。

      原文谈的都是一些架构上的改进,对于Kaveri APU我们现在还没见到实物,发布上市还得等到年底,所以其意义如何还得看实际表现,现在还无法作出评价。

    ×
    热门文章
    1华硕天选2游戏本评测:全面进化的二次元战斗姬
    2英特尔正式发布Iris Xe台式机独显,仅提供给OEM厂商
    3索尼在美国市场开售Xperia PRO,具有Micro HDMI输入、定价2499.99美元
    4AMD营收破记录,芯片供应紧张会持续到今年下半年
    5AMD Nashira Summit GPU出现在《奇点灰烬》数据库中,引起诸多猜测
    6索尼发布全画幅旗舰微单Alpha 1,5010万像素30张/秒连拍、10位的8K视频录制
    7XPG翼龙S70 PCIE 4.0 2TB SSD评测:大步迈向7400MB/s的极速体验
    8美光宣布批量出货1α工艺节点DRAM,实现新的技术突破
    9高通发布第四代骁龙汽车数字驾驶舱平台,基于5nm工艺打造
    已有 40 条评论,共 88 人参与。
    登录快速注册 后发表评论
    • 游客  2014-01-15 14:36

      游客:
      网友 [Guest] 的原贴:1楼
      为什么ps4的apu不能用在pc?
      CPU性能太弱
      电脑平台是听微软的Windows不给予良好的支持,即便登录市场也不会有好的结果。

      支持(0)  |   反对(0)  |   举报  |   回复

      40#

    • 游客  2013-12-10 11:55

      AMD既非行业翘楚,PC又非朝阳产业,所以谈论新技术总是纸上谈兵意味大。没钱是无法推动新技术的。 APU的前途不大,可能连主机都不如。异构计算也可能更早在移动领域实现,还是看苹果的动作吧。

      支持(0)  |   反对(12)  |   举报  |   回复

      39#

    • 游客  2013-12-10 11:46

      网友 [Guest] 的原贴:1楼
      为什么ps4的apu不能用在pc?
      CPU性能太弱

      支持(0)  |   反对(1)  |   举报  |   回复

      38#

    • 游客  2013-09-29 18:28

      网友 [Guest] 的原贴:1楼
      集显平台一定得买双通道内存,高达¥499. 独显平台可以买1条4G,就降低200元成本
      独显也要乖乖上4G*2的。

      支持(0)  |   反对(0)  |   举报  |   回复

      37#

    • 游客  2013-09-29 18:28

      网友 [Guest] 的原贴:1楼
      HD7850 默认带宽 是 4.5G x 256b/8=144G A10-6800k 的带宽是 2133m x 128b/8=34G HD7850 2G hawk 已经 ¥1099,1G 版本已经是 9百多元 默认是4倍于 A10 的图形性能和带宽,超频后达到5倍。 HD7850 40帧运行的游戏,A10只有10帧 HD7850 60帧运行的游戏,A10只有15帧 集显平台一定得买双通道内存,高达¥499. 独显平台可以买1条4G,就降低200元成本 坑妹的DDR3统一寻址,下半年 2133 双通道,涨到¥599,那就笑死了。
      内存涨价了,显存就不会涨么。还有独显也要乖乖上4G*2的。

      支持(0)  |   反对(0)  |   举报  |   回复

      36#

    • 游客  2013-07-09 20:24

      14nm+3D晶体管猛于虎

      支持(2)  |   反对(4)  |   举报  |   回复

      35#

    • 游客  2013-07-08 19:07

      网友 [Guest] 的原贴:1楼
      不及PS4性能的一半?PS4是美洲虎架构,属于低能耗APU,还不是同一寻址。预计kaveri apu顶级和PS4的持平或超过。
      谁告诉你ps4不是统一寻址的?

      支持(5)  |   反对(0)  |   举报  |   回复

      34#

    • bolvar终极杀人王 2013-07-08 18:27    |  加入黑名单

      网友 [Guest] 的原贴:1楼
      “32B eSRAM”缺个M
      多谢,已经修复

      支持(0)  |   反对(0)  |   举报  |   回复

      33#

    • 游客  2013-07-08 17:57

      “32B eSRAM”缺个M

      支持(0)  |   反对(0)  |   举报  |   回复

      32#

    • 游客  2013-07-08 17:56

      下半年 2133 双通道,涨到¥599

      支持(0)  |   反对(2)  |   举报  |   回复

      31#

    • 游客  2013-07-08 17:08

      网友 [Guest] 的原贴:1楼
      压路机里普及三通道才是王道
      网友 [bolvar] 的原贴:2楼
      三通道倒也是个解决方案,不知道AMD为啥不考虑这个,要么目前的Kaveri APU可能还不需要这样的带宽,性能有限也是有意为之
      网友 [Guest] 的原贴:3楼
      成本問題,技術問題,廠商願不願意跟進也是一個問題,畢竟INTEL也就是LGA2011 Socket的主板才用三通道,如果AMD 主流APU也用三通道的話,單就主板成本、內存成本而言,已經會是部份用家退卻,如果實際效能不能達到一個所謂嘅心理理想級別的話,更加影響銷售。
      2011是4通道啊,1366/1356才是3通道

      支持(0)  |   反对(0)  |   举报  |   回复

      30#

    • 我匿名了  2013-07-08 16:53

      网友 [Guest] 的原贴:1楼
      压路机里普及三通道才是王道
      网友 [bolvar] 的原贴:2楼
      三通道倒也是个解决方案,不知道AMD为啥不考虑这个,要么目前的Kaveri APU可能还不需要这样的带宽,性能有限也是有意为之
      成本問題,技術問題,廠商願不願意跟進也是一個問題,畢竟INTEL也就是LGA2011 Socket的主板才用三通道,如果AMD 主流APU也用三通道的話,單就主板成本、內存成本而言,已經會是部份用家退卻,如果實際效能不能達到一個所謂嘅心理理想級別的話,更加影響銷售。

      支持(1)  |   反对(0)  |   举报  |   回复

      29#

    • 游客  2013-07-08 16:08

      网友 [Guest] 的原贴:1楼
      HD7850 默认带宽 是 4.5G x 256b/8=144G A10-6800k 的带宽是 2133m x 128b/8=34G HD7850 2G hawk 已经 ¥1099,1G 版本已经是 9百多元 默认是4倍于 A10 的图形性能和带宽,超频后达到5倍。 HD7850 40帧运行的游戏,A10只有10帧 HD7850 60帧运行的游戏,A10只有15帧 集显平台一定得买双通道内存,高达¥499. 独显平台可以买1条4G,就降低200元成本 坑妹的DDR3统一寻址,下半年 2133 双通道,涨到¥599,那就笑死了。
      你这种人呢,就是看到铜知道铜是软的,看到锡知道锡也是软的,就是不想知道铜和锡的合金黄铜的硬度能比铜和锡单体的硬度的和还大

      支持(0)  |   反对(0)  |   举报  |   回复

      28#

    • 游客  2013-07-08 15:48

      下半年 2133 双通道,涨到¥599

      支持(0)  |   反对(2)  |   举报  |   回复

      27#

    • bolvar终极杀人王 2013-07-08 14:41    |  加入黑名单

      网友 [Guest] 的原贴:1楼
      压路机里普及三通道才是王道
      三通道倒也是个解决方案,不知道AMD为啥不考虑这个,要么目前的Kaveri APU可能还不需要这样的带宽,性能有限也是有意为之

      支持(0)  |   反对(0)  |   举报  |   回复

      26#

    • 游客  2013-07-08 14:34

      压路机里普及三通道才是王道

      支持(0)  |   反对(0)  |   举报  |   回复

      25#

    • 游客  2013-07-08 14:25

      HD7850 默认带宽 是 4.5G x 256b/8=144G A10-6800k 的带宽是 2133m x 128b/8=34G HD7850 2G hawk 已经 ¥1099,1G 版本已经是 9百多元 默认是4倍于 A10 的图形性能和带宽,超频后达到5倍。 HD7850 40帧运行的游戏,A10只有10帧 HD7850 60帧运行的游戏,A10只有15帧 集显平台一定得买双通道内存,高达¥499. 独显平台可以买1条4G,就降低200元成本 坑妹的DDR3统一寻址,下半年 2133 双通道,涨到¥599,那就笑死了。

      支持(0)  |   反对(5)  |   举报  |   回复

      24#

    • 游客  2013-07-08 14:23

      DDR3统一寻址。 下半年 2133 双通道,涨到¥599,那就笑死了。

      支持(0)  |   反对(3)  |   举报  |   回复

      23#

    • 游客  2013-07-08 14:21

      集显平台一定得买双通道内存,高达¥499. 独显平台可以买1条4G,就降低200元成本

      支持(0)  |   反对(2)  |   举报  |   回复

      22#

    • 游客  2013-07-08 14:12

      HD7850 默认带宽 是 4.5G x 256b/8=144G A10-6800k 的带宽是 2133m x 128b/8=34G HD7850 2G hawk 已经 ¥1099,1G 版本已经是 9百多元 默认是4倍于 A10 的图形性能和带宽,超频后达到5倍。 HD7850 40帧运行的游戏,A10只有10帧 HD7850 60帧运行的游戏,A10只有15帧

      支持(0)  |   反对(1)  |   举报  |   回复

      21#

    • 游客  2013-07-08 13:00

      网友 [Guest] 的原贴:1楼
      不及PS4性能的一半?PS4是美洲虎架构,属于低能耗APU,还不是同一寻址。预计kaveri apu顶级和PS4的持平或超过。
      怎么可能,晶体管规模在这里放着,能赶上一半都不错了

      支持(1)  |   反对(0)  |   举报  |   回复

      20#

    • 游客  2013-07-08 10:59

      不及PS4性能的一半?PS4是美洲虎架构,属于低能耗APU,还不是同一寻址。预计kaveri apu顶级和PS4的持平或超过。

      支持(0)  |   反对(2)  |   举报  |   回复

      19#

    • 游客  2013-07-07 17:44

      为什么ps4的apu不能用在pc?

      支持(0)  |   反对(0)  |   举报  |   回复

      18#

    • 游客  2013-07-07 17:41

      为什么ps4的apu不能用在pc?

      支持(0)  |   反对(0)  |   举报  |   回复

      17#

    • 游客  2013-07-07 13:17

      感觉22nm的现在还不太可靠,太热了,不知14nm会不会更热

      支持(0)  |   反对(0)  |   举报  |   回复

      16#

    • 游客  2013-07-06 11:09

      网友 [Guest] 的原贴:1楼
      路机 apu 的盖子设计,这完全为了是给玩家来开盖, 上液态金属 来 DIY 啊,内核四周的金属框保护了电容,避免被开盖刀片割坏 如果金属框高度和内核高度一样,还能保护内核被散热器压坏。 好像大部分显卡,就是热管散热和GPU核心直接接触。 A10-7800k 就应该取消封盖来卖。
      哈哈哈哈哈哈哈 蠢

      支持(0)  |   反对(0)  |   举报  |   回复

      15#

    • 游客  2013-07-05 20:15

      网友 [Guest] 的原贴:1楼
      路机 apu 的盖子设计,这完全为了是给玩家来开盖, 上液态金属 来 DIY 啊,内核四周的金属框保护了电容,避免被开盖刀片割坏 如果金属框高度和内核高度一样,还能保护内核被散热器压坏。 好像大部分显卡,就是热管散热和GPU核心直接接触。 A10-7800k 就应该取消封盖来卖。
      别被图片骗了,FM2+的APU是左边的, 右边GPU式防压金属框的是给超薄本等准备的。

      支持(0)  |   反对(0)  |   举报  |   回复

      14#

    • 游客  2013-07-05 18:32

      网友 [Guest] 的原贴:1楼
      28nm和intel 14nm PK?
      14NM要到后年 明年28nmVS22nm 后年16nmVS14nm.intel应该不占什么优势了。

      支持(0)  |   反对(0)  |   举报  |   回复

      13#

    • 游客  2013-07-05 16:22

      HD7750可以挑翻GT645啊………… 像我们中特效玩个流畅的确实再也不要买什么独显了~~~

      支持(0)  |   反对(0)  |   举报  |   回复

      12#

    • 游客  2013-07-05 16:12

      路机 apu 的盖子设计,这完全为了是给玩家来开盖, 上液态金属 来 DIY 啊,内核四周的金属框保护了电容,避免被开盖刀片割坏 如果金属框高度和内核高度一样,还能保护内核被散热器压坏。 好像大部分显卡,就是热管散热和GPU核心直接接触。 A10-7800k 就应该取消封盖来卖。

      支持(0)  |   反对(0)  |   举报  |   回复

      11#

    加载更多评论

    登录 后发表评论,若无帐号可 快速注册 ,请留意 评论奖罚说明
    为你推荐