本文约1168字,需2分钟阅读

去年底的超级计算机国际会议(SC 2013)上,NVIDIA推出了Tesla K40加速卡,它使用的是完整版Kepler架构,2880个CUDA核心,12GB显存。今年的SC 14会议上,NVIDIA除了获得美国能源部投资研发下一代超算之外,还推出了新一代的Tesla K80加速卡,双芯设计,但它的核心很奇怪,依然是Kepler架构,但却是之前从未见过的GK210核心,只有2496个CUDA核心,售价5000美元。

NVIDIA要出Tesla K80的传闻之前就有了,8月份就有人从NVIDIA的驱动程序中发现了Tesla K80的蛛丝马迹,当时认为K80是基于双芯的GTX Titan Z,拥有5760个CUDA核心,显存容量甚至高达24GB,不过NVIDIA现在推出的Tesla K80有些奇怪,显存容量24GB倒是准了,但是核心并不是完整的GK110,而是全新的GK210,CUDA核心数量为2496个,不同于之前Titan显卡的2668个,也不同于GTX 780 Ti的2880个,也不是GTX 780的2304个。


Anandtech网站列出的Tesla K80规格表

从规格上来看,GK210核心的Tesla K80核心频率降低到了562MHz,加速频率875MHz,但性能要比之前的Tesla K40强,单精度浮点性能8.74TFLOPS,双精度浮点性能2.91FLOPS,即便是砍掉一半,GK210核心的性能看起来也要比GK110核心更强。

其他规格上,Tesla K80确实拥有2x12GB显存,位宽384bit,频率5GHz,带宽240GB/s,也有所降低,TDP功耗300W,被动散热,发布售价为5000美元,约合人民币30620元,比Tesla K40的5499美元还要便宜。


Tesla K80规格及亮点


黄总又在PPT上欺负Intel处理器了

GK210核心之谜

算上现在的这个GK210核心,NVIDIA在GK110家族中一共出了3个不同的GK110核心了,他们的完整版都是15组SMX单元,2880个CUDA核心,不过细节上有所不同,NVIDIA做了不同程度的调整。


Anandtech网站的GK110家族核心规格表

总的来说,NVIDIA并没有改变CUDA核心数或者CUDA的架构,他们改进的只是SMX单元之间的内存子系统,GK110(B)的SMX单元拥有256KB寄存器文件,64KB共享缓存,GK210的规模翻倍,拥有512KB寄存器文件,128KB共享缓存,因此它改进了SMX单元的数据吞吐量,提高了效率,确保CUDA核心的更容易频繁使用。

NVIDIA以前没有这么做过,这也是第一次看到GPU往这个方向改进。这也就是说,这反应了GPU市场的变化,而这也意味着Kepler在未来一段时间还会继续陪伴着我们。(Maxwell架构虽然高效,不过双精度设计上GK110还是更强,估计得到GM210之后再说更强的Tesla加速卡了。)


Anandtech网站自制的GK210核心示意图,非官方表格

NVIDIA这么做是希望针对HPC市场改进他们的GPU,修正勘误表,降低功耗(同时也是提升性能),这也是他们为何能在300W TDP下作出双芯的Tesla K80(作为对比,GTX Titan Z使用的是完整版GK110核心,TDP为375W)。

还有一个问题就是GPU Boost技术,之前的Tesla K40加速卡上的GPU加速技术相比消费级GPU效果有限,严重受限于TDP,通常只有特定的3个加速频率,而Tesla K80上NVIDIA使用了与消费级GPU相同的GPU加速技术,只要TDP允许,K80会尽可能地加速。

Tesla K80是双芯设计,它的性能指标看起来比K40高得多,不过实际上不一定总是超过K40,因为单个GPU的规格比K40低,而且它的基础频率更低,不过K80主要的应用环境显然都是对多路GPU优化较好的,所以Tesla K80还是要快得多。

此外,高密度应用也会很有趣,300W的TDP是个挑战,不过在1U机架内还是可以放下8个GK210显卡的,这样一来其FP64双精度浮点性能将超过10TFLOPS。

最后,Tesla K80是一次硬发布——发布之后就能上市,NVIDIA的合作伙伴已经推出了相应的产品,虽然NVIDIA没有公布建议售价,不过Tesla K80的售价应该在5000美元左右,比5500美元左右的Tesla K40发布价更低,不过后者目前的售价是3900美元左右。


  • 游客  2017-07-02 20:12

    挖矿神卡

    支持(0)  |   反对(0)  |   举报  |   回复

    7#

  • 北京思腾创新学前班 2014-12-24 16:34

    有需要NVIDIA tesla k80的可以联系,13301397412 温经理 QQ499686668 北京思腾创新科技发展有限公司

    支持(0)  |   反对(0)  |   举报  |   回复

    6#

  • 游客  2014-11-18 15:23

    gm210不会出现在28nm,这个gk210无非是gk110的修正版,类似以前的nv42芯片。从384bit仍然保留来看,出现在零售市场机会很渺茫,跟970竞争没有任何意义。

    支持(0)  |   反对(0)  |   举报  |   回复

    5#

  • 游客  2014-11-18 14:10

    游客:
    这卡是干嘛的?3W+能玩扫雷吗
    能不要这么无知吗?

    支持(0)  |   反对(0)  |   举报  |   回复

    4#

  • 游客  2014-11-18 13:23

    这卡是干嘛的?3W+能玩扫雷吗

    支持(0)  |   反对(0)  |   举报  |   回复

    2#

  • yueyejinghun博士 2014-11-18 10:41

    GK210当时是在某张泄露出的路线图上. GM204发布后还看到了. 不过还以为这只是谬误. 这货发布的可能性不大. 没想到居然真出了. 看来nV还确实是按照路线图走的. 就是不知道GM200什么时候才能发布.

    支持(0)  |   反对(0)  |   举报  |   回复

    1#

加载更多评论

我来评论

热门文章
1日韩贸易争端影响大:8Gb DDR4内存颗粒价格两周涨幅超过20%
2ROG Strix XG438Q巨擘显示器上架:4K 120Hz,Freesync 2 HDR,8999元
3为了避免以后再被人掐脖子,三星打算自建氟化氢工厂
4苹果发布一大波系统更新:iOS获得无线数据迁移功能
5英特尔Ice Lake-U处理器跑分再曝光:单核性能已与Rzyen 3900X相当
6三星Galaxy Note10+可能比较激进:6.8英寸屏、4300mAh电池、45W快充
7开发团队成员披露Windows 7的幕后故事:它的代号不是Blackcomb,而就是7
8《德军总部 新血脉》的光追效果很好,但发售初期不会实装
9英特尔智能手机调制解调器业务或已有下家:传苹果10亿美元收购