NV给出的图不太容易看出GK110架构的具体配置,Beyond3D论坛有人作出了配以文字说明的分析图,如下图所示:
图片来源于Beyond3D论坛
GK110有15组SMX单元,每组SMX单元还是维持了GK104的192个CUDA核心,16个纹理单元,理论上有2880个CUDA核心,240个纹理单元,实际启用的可能是14组SMX,总计2688个CUDA核心,224个纹理单元,ROP单元为48个。
不过Guru3D称新的消息显示GK110实际上是16组SMX单元,CUDA核心总数是3072个,如果屏蔽一组的话也有2880个CUDA核心,240个纹理单元,只是guru3D并没有给出更详细的说明。
显存位宽已经确认为384bit,不过频率未知,另外显存容量也没有公布,不过黄仁勋在演讲中称显存容量配置取决于DRAM业界,6GB、12GB甚至24GB都是有可能的。
对比一下,上一代的Tesla M2090配备的是6GB显存,Tesla K10配备的则是8GB显存,支持GPU虚拟化的NVIDIA显卡搭配的则是16GB显存,但是规格只是DDR3。如此一来,GK110搭配的显存容量不可能比上一代的6GB还低,12GB是最可能的配置,24GB容量也有可能,不过黄仁勋也说了具体容量要依赖DRAM产业界,意味着要看DRAM厂商什么时候能推出单颗容量更高的显存颗粒,目前主流的是2Gb(512MB),24GB需要48颗,现在显然没空间布置这么多显存。
以上是基于Tesla加速卡考虑的,如果是GK110显卡,最可能的显存容量应该是3GB,比GTX 580高一倍,比GTX 680高50%,厂商则会有6GB版非公版显卡推出。
核心频率也是未知数,3DCenter认为在800MHz左右,PCGH认为有880MHz,并且DGEMM效率高达80-85%,与Fermi架构约50%的效率高得多。以此估算GK110架构的双精度浮点效效能为:14SMX*192SP*2FLOPS*0.85*880MHz/4=1000GFLOPS,而上一代最强的计算卡M2090最高上665GFLOPS,以DGEMM计则为332GFLOPS,GK110恰好是其三倍左右。
NVIDIA公布的K10浮点效能只有0.19TFLOPS,K20未知
其他方面,GK110加速卡的TDP功耗是300W,使用6pin+8pin接口,预计GK110显卡的TDP功耗也是如此。
游客 2012-05-17 15:04
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
6#
游客 2012-05-17 14:22
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
5#
游客 2012-05-17 14:17
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
4#
游客 2012-05-17 14:02
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
3#
游客 2012-05-17 13:47
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
2#
我匿名了 2012-05-17 12:32
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
1#