◆ Kepler架构解析:3倍核心是怎样练成的
早前在分析Kepler的架构的文章中,我们就提出了GK104架构像GF100还是像GF114的问题,网上甚至有人根据GK104那1536个CUDA核心的规格PS出了GK104的架构,当然最终的结果是GK104更像GF114那样,GPC和SM单元数量减少,但是每组SM单元容纳的CUDA核心更多。
GF110架构图
GF110有为4组GPC,每组下辖4组SM单元,每组SM单元又有32个CUDA核心,总计有512个CUDA核心,64个纹理单元,48个ROP单元,16个曲面细分单元,搭配6组64bit显存控制器,总计384bit位宽,1536MB显存。
GF114架构
GF114架构中只有2组GPC单元,SM单元数量也从16组减少到8组,但是每组SM单元的CUDA核心数提高到48个,内存控制器减少到4组,总位宽256bit,曲面细分单元也减少到8组,但是纹理单元依然维持在64个,ROP单元也有32个。
通过这些优化,GF114架构的核心面积大幅减少,而性能也没有因为规格大减而损失多少。
GK104的核心透视图
NVIDIA给出的GK104核心透视图上可以清晰地看到它有8组SM单元,架构上跟GF114更为相似。
GK104架构图
从这张图上可以看到GK104有四组GPC单元,每组又由2组SM单元组成---准确来说是SMX单元,NVIDIA对SM的称呼有所变化。
现在来对比一下GF110、GF114以及GK104架构中的SM/SMX单元变化。
GF110 SM单元(左)、GF114 SM单元(中)以及GK104 SMX单元(右)对比(点击放大)
GF110的SM单元有32个CUDA内核,四个SFU单元,16个LD/ST存储单元,64KB L1本地缓存,每组SM单元有4组纹理单元,总计64个纹理单元。另外每组SM还有一个多边形引擎负责曲面细分计算。
GF114的GPC和SM单元总数砍掉一半,SM还剩8组,但是每组容纳的CUDA内核数增加到48个,SFU单元增加到8个,LD/ST也增加到32个,相应地Dispatch单元也增加了一组,L1缓存依然为64KB,不过纹理单元增加到8个,总数依然维持在64个,不过此时的多边形引擎也没有变化。
GK104的SMX单元中,NVIDIA大手笔集成了192个CUDA核心,纹理单元也增加到16组,前端渲染单元也增加到四组,同时SFU以及LD/ST单元也是水涨船高,增加到32组,纹理单元再次翻倍,8组SMX单元总计有1536个流处理器、128个纹理单元以及32个ROP单元。
GK104与GF110规格对比
每组SM/SMX单元性能对比
更主要的是内在的变化,从Kepler开始,NVIDIA以往坚持的Core:Shader=1:2的分频模式已经没有了,以前采用这种方式是因为核心频率不能大幅提高,为了提高性能就必须让CUDA的核心频率增加一倍,但是这也意味着更高的能耗。
GTX 680中NVIDIA将SMX单元中的CUDA核心数提高至原来的3倍,而且核心频率也达到1GHz以上,不再需要Shader异步了,二者将同频运行,有助于降低显卡功耗,因此GTX 680在CUDA数量暴增的同时功耗更低,而每瓦性能比更是提高了一倍。
还有一个变化就是Polygon多边形引擎升级到2.0,虽然物理单元结构没有变化,但是Kepler的PolyMorph Engines 2.0的每周期性能是GTX 580的两倍多,再加上1006MHz的频率也要比GTX 580高出30%,因此整体性能反而会更强。即便与对手HD 7970相比,NVIDIA宣称GTX 680的曲面细分性能要比后者快4倍。
游客 2016-03-30 14:23
该评论年代久远,荒废失修,暂不可见。
已有1次举报支持(3) | 反对(1) | 举报 | 回复
76#
游客 2016-03-26 02:49
该评论年代久远,荒废失修,暂不可见。
已有1次举报支持(2) | 反对(1) | 举报 | 回复
75#
游客 2016-03-08 19:51
该评论年代久远,荒废失修,暂不可见。
已有1次举报支持(1) | 反对(1) | 举报 | 回复
74#
游客 2015-09-29 15:51
该评论年代久远,荒废失修,暂不可见。
已有3次举报支持(1) | 反对(0) | 举报 | 回复
73#
游客 2015-06-13 11:05
该评论年代久远,荒废失修,暂不可见。
已有1次举报支持(1) | 反对(0) | 举报 | 回复
72#
我匿名了 2012-05-19 19:10
该评论年代久远,荒废失修,暂不可见。
已有1次举报支持(1) | 反对(0) | 举报 | 回复
71#
游客 2012-04-10 14:53
该评论年代久远,荒废失修,暂不可见。
已有1次举报支持(2) | 反对(1) | 举报 | 回复
70#
超能网友小学生 2012-03-30 13:07 | 加入黑名单
该评论年代久远,荒废失修,暂不可见。
已有1次举报支持(2) | 反对(1) | 举报 | 回复
69#
游客 2012-03-29 17:31
该评论年代久远,荒废失修,暂不可见。
支持(1) | 反对(0) | 举报 | 回复
68#
游客 2012-03-27 22:36
该评论年代久远,荒废失修,暂不可见。
已有1次举报支持(2) | 反对(0) | 举报 | 回复
67#
超能网友管理员 2012-03-27 10:08 | 加入黑名单
该评论年代久远,荒废失修,暂不可见。
已有1次举报支持(1) | 反对(0) | 举报 | 回复
66#
游客 2012-03-27 01:02
该评论年代久远,荒废失修,暂不可见。
已有1次举报支持(16) | 反对(4) | 举报 | 回复
65#
游客 2012-03-25 17:19
该评论年代久远,荒废失修,暂不可见。
已有1次举报支持(1) | 反对(0) | 举报 | 回复
64#
游客 2012-03-25 14:02
该评论年代久远,荒废失修,暂不可见。
支持(1) | 反对(0) | 举报 | 回复
63#
游客 2012-03-25 11:13
该评论年代久远,荒废失修,暂不可见。
支持(3) | 反对(1) | 举报 | 回复
62#
游客 2012-03-24 23:57
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
61#
超能网友教授 2012-03-24 20:49 | 加入黑名单
该评论年代久远,荒废失修,暂不可见。
支持(1) | 反对(0) | 举报 | 回复
60#
游客 2012-03-24 19:14
该评论年代久远,荒废失修,暂不可见。
已有1次举报支持(2) | 反对(0) | 举报 | 回复
59#
游客 2012-03-24 17:10
该评论年代久远,荒废失修,暂不可见。
已有2次举报支持(0) | 反对(0) | 举报 | 回复
58#
游客 2012-03-24 15:58
该评论年代久远,荒废失修,暂不可见。
支持(1) | 反对(0) | 举报 | 回复
57#
超能网友终极杀人王 2012-03-24 13:11 | 加入黑名单
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
56#
超能网友终极杀人王 2012-03-24 12:57 | 加入黑名单
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
55#
游客 2012-03-24 07:58
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
54#
超能网友博士 2012-03-23 23:00 | 加入黑名单
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
53#
超能网友博士 2012-03-23 21:18 | 加入黑名单
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
52#
游客 2012-03-23 20:00
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
51#
游客 2012-03-23 17:12
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
50#
游客 2012-03-23 17:02
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
49#
游客 2012-03-23 17:02
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
48#
游客 2012-03-23 15:24
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
47#
加载更多评论