虽然AMD每年都在升级CPU或者APU产品,但是不论是Richland APU还是Vishera FX处理器都是架构优化,制程工艺也没有升级。即便是Jaguar架构的Kabini、Temash APU也只是工艺升级,架构升级只是从K10精简变成了推土机精简而已,AMD要想给大家新的希望,就必须拿出更有分量的产品。
这个产品就是Kaveri APU,它身上有很多第一:第一个支持HSA异构运算的APU、第一个真正使用GCN架构GPU核心的APU、第一个使用Steamroller架构CPU核心的桌面APU,而且Kaveri APU也会升级28nm工艺。至少在这些表面的光环加持下,Kaveri APU要比AMD其他产品更值得期待。
之前我们已经有过太多的Kaveri APU爆料了,从架构、工艺升级再到FM2+插槽、A88X芯片组等皆有涉及。日本PCWatch专栏作者后藤弘茂日前又对Kaveri APU的架构做了深入分析,其中也谈到了Steamroller架构以及与Intel处理器的一些对比,来看一下。
Kaveri APU工艺进化:32nm SOI到28nm Bulk
介绍架构之前,首先来看Kaveri APU的工艺变化,大家知道的是Kaveri会从AMD万年不变的32nm升级到28nm,但是准确来说这是从32nm SOI工艺到28nm Bulk工艺的变化,不仅仅是制程变化。
从SOI转向Bulk工艺是AMD早前就已经定下的,去年的WSA晶圆供货会议上AMD就有此表态。他们从130nm节点就开始跟IBM联合开发SOI(绝缘体上硅)技术,不过在32nm SOI阶段,从AMD分离出去的Globalfounderies遇到了困难,第一代Llano APU就遇到了大坑,或许这也是AMD放弃SOI转向更普遍的Bulk工艺的原因之一。
后藤弘茂称转向28nm bulk工艺之后,晶体管的性能没有什么损失,制程从32nm升级到28nm之后还可以提升晶体管密度,相比前几代APU,这一次制程工艺升级这对APU来说也是一个跳跃。
随晶体管增长而变化的GPU规模
制程工艺升级之后晶体管密度更大,Kaveri APU上可以容纳的电路单元更多,所以其电路规模也显著扩张。Trinity/Richland APU使用的Piledriver打桩机核心只是推土机架构的小改款,而Steamroller压路机则是推土机的大改。
Kaveri中的GPU核心也是如此,从之前的VLIW 5/4体系提升到更高效的GCN架构,流处理器单元更多,缓存更大。举例来说,之前的APU中流处理器单元最多384个,而Kaveri APU的流处理器单元是512个(从之前的Berlin APU推测而来),提升了33%。
Steamroller架构改进:改进双路并行解码单元
Kaveri APU使用的CPU核心是Steamroller,这是继推土机Bulldozer、打桩机Piledriver之后的第三代模块化架构,之前我们已经有文章详细介绍过了Steamroller架构的改进,详情可以参考:推土机三世能否翻身,Steamroller聚焦性能提升。
后藤弘茂原文也提到了一些Steamroller架构的改进,简单来说下。之前的Bulldozer推土机架构使用的模块化设计,每个模块内由2个整数单元和1个弹性浮点单元组成,不过这两个整数单元使用的一个解码器,虽然降低了设计难度,但是这种前端设计在应付两个线程时是有问题的。
Steamroller的改变就是设计了两个并行的解码器,每个整数单元都有自己的解码单元,这样一来每周期内每个线程可执行的整数指令提升了25%,此外Steamroller架构的存储系统也做了增强,提升了IPC(每周期指令)性能。
前端设计改进
单核执行单元性能提升
Steamroller架构要点:提升每瓦性能比
GPU架构改进:512个GCN流处理器单元
再来看Kaveri AP中的GPU核心的变化。虽然之前AMD已经在Richland APU中把整合的集显升级到了HD 8000系列,但他们说起来都是VLIW 5/4架构的马甲,Kaveri APU中的GPU才是真正的GCN架构。
Kaveri APU中的MAD(乘积加)单元是512个,因为GCN架构中64个MAD单元为一组CU计算单元,所以Kaveri APU使用的是8组CU单元,512个流处理器单元。此前Lllano APU中有320个流处理器单元,Trnity/Richland最多384个,不过他们都是VLIW体系的,Llano的320个流处理器单元只相当于80个1D单元,与Kaveri APU的512个不可同日而语。
512个GCN流处理器元的Kaveri APU理论上大约能带来1TFLOPS的性能。此外,Kavri APU的GPU不仅仅是33%的数量增长,与VLIW体系相比,GCN架构的性能也会更强。
这张表格是AMD 40nm和28nm工艺下的不同GPU核心的规模,可以对比下Kaveri APU所出的位置。
另外,Kaveri APU有512个流处理器单元,这个数量大约是PS4所用的、1152个流处理器单元的APU的一半,PS4的浮点性能为1.8TFLOPS,不过Kaveri还在使用DDR3内存,受带宽所限,所以其性能是达不到PS4一半的水平的。
Kaveri的内部总线变化
目前的Trinity APU的内部总线系统
Kaveri APU之前的APU都有两条内部总线,一条是Radeon Memory Bus(代号Garlic大蒜),它主要用于独显与集显GPU连接。另外一条总线是Fusion Compute Link(代号Onion洋葱),它主要用于集显与CPU连接,在PS4上使用的总线系统也是这两条总线的扩展版。
在Kaveri APU上这一切都改变了,因为Kaveri支持AMD的hUMA异构统一寻址技术,CPU和GPU可以通过虚拟的统一寻址空间共享数据,因此Garlic和Onion总线都被淘汰了。
AMD CTO以及高级GPU架构师也对这种高度集成的总线表示了赞赏,认为这样的设计要比之前的双总线设计更高效,数据共享更容易,编程开发更简单。
与IVB、Haswell的比较
Kaveri虽然升级到了28nm工艺,但是与Intel的22nm 3D晶体管工艺相比依然处于弱势,这里就对比了三代APU以及Intel最近三代CPU的工艺及核心面积情况。
在32nm节点,Intel SNB架构的4核+GT2处理器核心面积在216mm2,AMD的Llano 4核大约是228mm2,双方相差不大。到了22nm 3D晶体管时代,Intel的IVB 4核+GT2处理器的核心面积降低到了160mm2,而且GPU性能几乎翻倍,而Hasewll时代4核+GT2核显的面积约为177mm2,而且GPU性能更强,相比32nm时代其核心面积只有原来的74-82%。
Kaveri APU的核心面积没有官方数据,不过根据下图的Kaveri APU实物测量,核心面积大约在240mm2以内,与32nm工艺的Llano/Trinity持平,这是AMD不占优势的地方,不过与Intel性能最好的4核Haswell+GT3e处理器的260mm2相比还算可以了。
拆开外壳之后测量的Kaveri APU核心面积
编者注:对Kaveri APU来说,这应该是AMD近年来首次同时升级架构及工艺,在Haswell特别是在GPU性能上快速逼近的情况下,Kaveri将担当起AMD未来一两年阻击Intel的关键重任,反正AMD对高端FX处理器也是意兴阑珊了,Steamroller架构都没有首先应用在FX处理器上。
Kaveri APU会集成512个GCN架构的流处理器单元,规模相当于HD 7750了,当然最终的性能受限于DDR3的带宽,肯定不能跟HD 7750相比,但是这样大的提升也是值得期待的,入门级独显市场越来越危险啊。
原文谈的都是一些架构上的改进,对于Kaveri APU我们现在还没见到实物,发布上市还得等到年底,所以其意义如何还得看实际表现,现在还无法作出评价。
游客 2014-01-15 14:36
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
40#
游客 2013-12-10 11:55
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(12) | 举报 | 回复
39#
游客 2013-12-10 11:46
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(1) | 举报 | 回复
38#
游客 2013-09-29 18:28
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
37#
游客 2013-09-29 18:28
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
36#
游客 2013-07-09 20:24
该评论年代久远,荒废失修,暂不可见。
支持(2) | 反对(4) | 举报 | 回复
35#
游客 2013-07-08 19:07
该评论年代久远,荒废失修,暂不可见。
支持(5) | 反对(0) | 举报 | 回复
34#
超能网友终极杀人王 2013-07-08 18:27 | 加入黑名单
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
33#
游客 2013-07-08 17:57
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
32#
游客 2013-07-08 17:56
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(2) | 举报 | 回复
31#
游客 2013-07-08 17:08
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
30#
我匿名了 2013-07-08 16:53
该评论年代久远,荒废失修,暂不可见。
支持(1) | 反对(0) | 举报 | 回复
29#
游客 2013-07-08 16:08
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
28#
游客 2013-07-08 15:48
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(2) | 举报 | 回复
27#
超能网友终极杀人王 2013-07-08 14:41 | 加入黑名单
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
26#
游客 2013-07-08 14:34
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
25#
游客 2013-07-08 14:25
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(5) | 举报 | 回复
24#
游客 2013-07-08 14:23
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(3) | 举报 | 回复
23#
游客 2013-07-08 14:21
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(2) | 举报 | 回复
22#
游客 2013-07-08 14:12
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(1) | 举报 | 回复
21#
游客 2013-07-08 13:00
该评论年代久远,荒废失修,暂不可见。
支持(1) | 反对(0) | 举报 | 回复
20#
游客 2013-07-08 10:59
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(2) | 举报 | 回复
19#
游客 2013-07-07 17:44
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
18#
游客 2013-07-07 17:41
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
17#
游客 2013-07-07 13:17
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
16#
游客 2013-07-06 11:09
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
15#
游客 2013-07-05 20:15
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
14#
游客 2013-07-05 18:32
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
13#
游客 2013-07-05 16:22
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
12#
游客 2013-07-05 16:12
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
11#
加载更多评论