E X P
  • 编辑
  • 评论
  • 标题
  • 链接
  • 查错
  • 图文
  • 拼 命 加 载 中 ...

    去年底的超级计算机国际会议(SC 2013)上,NVIDIA推出了Tesla K40加速卡,它使用的是完整版Kepler架构,2880个CUDA核心,12GB显存。今年的SC 14会议上,NVIDIA除了获得美国能源部投资研发下一代超算之外,还推出了新一代的Tesla K80加速卡,双芯设计,但它的核心很奇怪,依然是Kepler架构,但却是之前从未见过的GK210核心,只有2496个CUDA核心,售价5000美元。

    NVIDIA要出Tesla K80的传闻之前就有了,8月份就有人从NVIDIA的驱动程序中发现了Tesla K80的蛛丝马迹,当时认为K80是基于双芯的GTX Titan Z,拥有5760个CUDA核心,显存容量甚至高达24GB,不过NVIDIA现在推出的Tesla K80有些奇怪,显存容量24GB倒是准了,但是核心并不是完整的GK110,而是全新的GK210,CUDA核心数量为2496个,不同于之前Titan显卡的2668个,也不同于GTX 780 Ti的2880个,也不是GTX 780的2304个。


    Anandtech网站列出的Tesla K80规格表

    从规格上来看,GK210核心的Tesla K80核心频率降低到了562MHz,加速频率875MHz,但性能要比之前的Tesla K40强,单精度浮点性能8.74TFLOPS,双精度浮点性能2.91FLOPS,即便是砍掉一半,GK210核心的性能看起来也要比GK110核心更强。

    其他规格上,Tesla K80确实拥有2x12GB显存,位宽384bit,频率5GHz,带宽240GB/s,也有所降低,TDP功耗300W,被动散热,发布售价为5000美元,约合人民币30620元,比Tesla K40的5499美元还要便宜。


    Tesla K80规格及亮点


    黄总又在PPT上欺负Intel处理器了

    GK210核心之谜

    算上现在的这个GK210核心,NVIDIA在GK110家族中一共出了3个不同的GK110核心了,他们的完整版都是15组SMX单元,2880个CUDA核心,不过细节上有所不同,NVIDIA做了不同程度的调整。


    Anandtech网站的GK110家族核心规格表

    总的来说,NVIDIA并没有改变CUDA核心数或者CUDA的架构,他们改进的只是SMX单元之间的内存子系统,GK110(B)的SMX单元拥有256KB寄存器文件,64KB共享缓存,GK210的规模翻倍,拥有512KB寄存器文件,128KB共享缓存,因此它改进了SMX单元的数据吞吐量,提高了效率,确保CUDA核心的更容易频繁使用。

    NVIDIA以前没有这么做过,这也是第一次看到GPU往这个方向改进。这也就是说,这反应了GPU市场的变化,而这也意味着Kepler在未来一段时间还会继续陪伴着我们。(Maxwell架构虽然高效,不过双精度设计上GK110还是更强,估计得到GM210之后再说更强的Tesla加速卡了。)


    Anandtech网站自制的GK210核心示意图,非官方表格

    NVIDIA这么做是希望针对HPC市场改进他们的GPU,修正勘误表,降低功耗(同时也是提升性能),这也是他们为何能在300W TDP下作出双芯的Tesla K80(作为对比,GTX Titan Z使用的是完整版GK110核心,TDP为375W)。

    还有一个问题就是GPU Boost技术,之前的Tesla K40加速卡上的GPU加速技术相比消费级GPU效果有限,严重受限于TDP,通常只有特定的3个加速频率,而Tesla K80上NVIDIA使用了与消费级GPU相同的GPU加速技术,只要TDP允许,K80会尽可能地加速。

    Tesla K80是双芯设计,它的性能指标看起来比K40高得多,不过实际上不一定总是超过K40,因为单个GPU的规格比K40低,而且它的基础频率更低,不过K80主要的应用环境显然都是对多路GPU优化较好的,所以Tesla K80还是要快得多。

    此外,高密度应用也会很有趣,300W的TDP是个挑战,不过在1U机架内还是可以放下8个GK210显卡的,这样一来其FP64双精度浮点性能将超过10TFLOPS。

    最后,Tesla K80是一次硬发布——发布之后就能上市,NVIDIA的合作伙伴已经推出了相应的产品,虽然NVIDIA没有公布建议售价,不过Tesla K80的售价应该在5000美元左右,比5500美元左右的Tesla K40发布价更低,不过后者目前的售价是3900美元左右。

    ×
    热门文章
    1英伟达GeForce Game Ready 552.22 WHQL驱动:修复了旧显卡存在已久的问题
    2Sharkoon推出Rebel C20 ITX机箱:立卧双形态,兼容360水冷及365mm长显卡
    3英伟达推出RTX A1000 / A400:单槽Ampere架构工作站显卡,TDP仅50W
    4AMD发布Ryzen PRO 8000系列产品组合:为企业用户带来支持AI技术的处理器
    5锐龙5 8400F天梯榜首发评测:打造高性价比游戏整机平台
    6逐渐放弃Gecko内核,XR浏览器Wolvic推出Chromium内核版本
    7雷神推出T-BOOK 16D笔记本:银白主题设计,2K@120Hz屏幕,首发价3999元
    8《黑神话 : 悟空》已在PS商店上架:8月20日同步发售,未提及定价
    9英伟达Blackwell新平台产品需求看涨,或带动台积电全年CoWoS产能提升逾150%
    已有 6 条评论,共 6 人参与。
    登录快速注册 后发表评论
    • 游客  2017-07-02 20:12

      该评论年代久远,荒废失修,暂不可见。

      支持(0)  |   反对(0)  |   举报  |   回复

      7#

    • 超能网友学前班 2014-12-24 16:34    |  加入黑名单

      该评论年代久远,荒废失修,暂不可见。

      支持(0)  |   反对(0)  |   举报  |   回复

      6#

    • 游客  2014-11-18 15:23

      该评论年代久远,荒废失修,暂不可见。

      支持(0)  |   反对(0)  |   举报  |   回复

      5#

    • 游客  2014-11-18 14:10

      该评论年代久远,荒废失修,暂不可见。

      支持(0)  |   反对(0)  |   举报  |   回复

      4#

    • 游客  2014-11-18 13:23

      该评论年代久远,荒废失修,暂不可见。

      支持(0)  |   反对(0)  |   举报  |   回复

      2#

    • 超能网友博士 2014-11-18 10:41    |  加入黑名单

      该评论年代久远,荒废失修,暂不可见。

      支持(0)  |   反对(0)  |   举报  |   回复

      1#

    登录 后发表评论,若无帐号可 快速注册 ,请留意 评论奖罚说明