E X P
  • 编辑
  • 评论
  • 标题
  • 链接
  • 查错
  • 图文
  • 拼 命 加 载 中 ...

    去年底的超级计算机国际会议(SC 2013)上,NVIDIA推出了Tesla K40加速卡,它使用的是完整版Kepler架构,2880个CUDA核心,12GB显存。今年的SC 14会议上,NVIDIA除了获得美国能源部投资研发下一代超算之外,还推出了新一代的Tesla K80加速卡,双芯设计,但它的核心很奇怪,依然是Kepler架构,但却是之前从未见过的GK210核心,只有2496个CUDA核心,售价5000美元。

    NVIDIA要出Tesla K80的传闻之前就有了,8月份就有人从NVIDIA的驱动程序中发现了Tesla K80的蛛丝马迹,当时认为K80是基于双芯的GTX Titan Z,拥有5760个CUDA核心,显存容量甚至高达24GB,不过NVIDIA现在推出的Tesla K80有些奇怪,显存容量24GB倒是准了,但是核心并不是完整的GK110,而是全新的GK210,CUDA核心数量为2496个,不同于之前Titan显卡的2668个,也不同于GTX 780 Ti的2880个,也不是GTX 780的2304个。


    Anandtech网站列出的Tesla K80规格表

    从规格上来看,GK210核心的Tesla K80核心频率降低到了562MHz,加速频率875MHz,但性能要比之前的Tesla K40强,单精度浮点性能8.74TFLOPS,双精度浮点性能2.91FLOPS,即便是砍掉一半,GK210核心的性能看起来也要比GK110核心更强。

    其他规格上,Tesla K80确实拥有2x12GB显存,位宽384bit,频率5GHz,带宽240GB/s,也有所降低,TDP功耗300W,被动散热,发布售价为5000美元,约合人民币30620元,比Tesla K40的5499美元还要便宜。


    Tesla K80规格及亮点


    黄总又在PPT上欺负Intel处理器了

    GK210核心之谜

    算上现在的这个GK210核心,NVIDIA在GK110家族中一共出了3个不同的GK110核心了,他们的完整版都是15组SMX单元,2880个CUDA核心,不过细节上有所不同,NVIDIA做了不同程度的调整。


    Anandtech网站的GK110家族核心规格表

    总的来说,NVIDIA并没有改变CUDA核心数或者CUDA的架构,他们改进的只是SMX单元之间的内存子系统,GK110(B)的SMX单元拥有256KB寄存器文件,64KB共享缓存,GK210的规模翻倍,拥有512KB寄存器文件,128KB共享缓存,因此它改进了SMX单元的数据吞吐量,提高了效率,确保CUDA核心的更容易频繁使用。

    NVIDIA以前没有这么做过,这也是第一次看到GPU往这个方向改进。这也就是说,这反应了GPU市场的变化,而这也意味着Kepler在未来一段时间还会继续陪伴着我们。(Maxwell架构虽然高效,不过双精度设计上GK110还是更强,估计得到GM210之后再说更强的Tesla加速卡了。)


    Anandtech网站自制的GK210核心示意图,非官方表格

    NVIDIA这么做是希望针对HPC市场改进他们的GPU,修正勘误表,降低功耗(同时也是提升性能),这也是他们为何能在300W TDP下作出双芯的Tesla K80(作为对比,GTX Titan Z使用的是完整版GK110核心,TDP为375W)。

    还有一个问题就是GPU Boost技术,之前的Tesla K40加速卡上的GPU加速技术相比消费级GPU效果有限,严重受限于TDP,通常只有特定的3个加速频率,而Tesla K80上NVIDIA使用了与消费级GPU相同的GPU加速技术,只要TDP允许,K80会尽可能地加速。

    Tesla K80是双芯设计,它的性能指标看起来比K40高得多,不过实际上不一定总是超过K40,因为单个GPU的规格比K40低,而且它的基础频率更低,不过K80主要的应用环境显然都是对多路GPU优化较好的,所以Tesla K80还是要快得多。

    此外,高密度应用也会很有趣,300W的TDP是个挑战,不过在1U机架内还是可以放下8个GK210显卡的,这样一来其FP64双精度浮点性能将超过10TFLOPS。

    最后,Tesla K80是一次硬发布——发布之后就能上市,NVIDIA的合作伙伴已经推出了相应的产品,虽然NVIDIA没有公布建议售价,不过Tesla K80的售价应该在5000美元左右,比5500美元左右的Tesla K40发布价更低,不过后者目前的售价是3900美元左右。

    ×
    热门文章
    1芯动科技召开“风华1号”产品发布会,顶级双芯版将配备32GB GDDR6X显存
    2厂商将推出不支持PCIe 5.0的Z690主板,以大幅度降低售价
    3乔思伯推出T8 PLUS机箱:散热出众+带铝合金提手,便携性拉满
    4海韵Focus SPX-750白色版电源图赏:高颜值且高规格的SFX小钢炮
    5VR又失一家大厂?传言Valve对VR失去兴趣
    6百元风冷散热器横评
    7蓝宝石推出搭载RX 6600 XT的GearBox 500显卡坞,大幅提升轻薄本的图形性能
    8英伟达下一代GPU均采用台积电5nm工艺,相关供应链正在为量产做准备
    9蓝宝石GPRO X060/X080泄露,基于AMD RDNA 2架构的新款矿卡
    已有 6 条评论,共 6 人参与。
    登录快速注册 后发表评论
    • 游客  2017-07-02 20:12

      该评论年代久远,荒废失修,暂不可见。

      支持(0)  |   反对(0)  |   举报  |   回复

      7#

    • 超能网友学前班 2014-12-24 16:34    |  加入黑名单

      该评论年代久远,荒废失修,暂不可见。

      支持(0)  |   反对(0)  |   举报  |   回复

      6#

    • 游客  2014-11-18 15:23

      该评论年代久远,荒废失修,暂不可见。

      支持(0)  |   反对(0)  |   举报  |   回复

      5#

    • 游客  2014-11-18 14:10

      该评论年代久远,荒废失修,暂不可见。

      支持(0)  |   反对(0)  |   举报  |   回复

      4#

    • 游客  2014-11-18 13:23

      该评论年代久远,荒废失修,暂不可见。

      支持(0)  |   反对(0)  |   举报  |   回复

      2#

    • 超能网友博士 2014-11-18 10:41    |  加入黑名单

      该评论年代久远,荒废失修,暂不可见。

      支持(0)  |   反对(0)  |   举报  |   回复

      1#

    登录 后发表评论,若无帐号可 快速注册 ,请留意 评论奖罚说明
    为你推荐