NVIDIA再发一款图灵显卡Tesla T4:75W TDP,2560个CUDA核心

2018-9-13 15:04  |  作者:孟宪瑞   |  关键字:NVIDIA,Tesla T4,图灵,AI,显卡

今天NVIDIA在日本GTC大会上又宣布了一款图灵架构的新卡——Tesla T4,有2560个CUDA核心,集成320个Tensor Core核心,FP32浮点性能8.1TFLOPS,INT4浮点性能最高260TFLOPS,更神奇的是这款显卡只有75W TDP,在规模比RTX 2070显卡还高的情况下TDP功耗低得多。

本文约561字,需1分钟阅读

NVIDIA的图灵架构发布以来已经有六款显卡问世了,包括专业级的RTX 8000/6000/5000及消费级的RTX 2080 Ti/2080/2070显卡。今天NVIDIA在日本GTC大会上又宣布了一款图灵架构的新卡——Tesla T4,有2560个CUDA核心,集成320个Tensor Core核心,FP32浮点性能8.1TFLOPS,INT4浮点性能最高260TFLOPS,更神奇的是这款显卡只有75W TDP,在规模比RTX 2070显卡还高的情况下TDP功耗低得多。

这次发布的Tesla T4显卡主要面向AI推理应用,使用了PCIe插槽,被动散热设计,外观风格跟RTX 8000及RTX 2080 Ti显卡又不是一种风格了,看图片更有金属质感。

虽然Tesla系列的专业卡跟普通消费者关系不大,不过Tesla T4的意义在于它不同于现有的几款图灵显卡,CUDA核心数为2560个,高于RTX 2070显卡的2304个,低于RTX 2080显卡的2944个,考虑到后两款显卡使用的分别是TU104、TU106核心,Tesla T4显卡很可能是基于完整版TU106核心的(更正:读者提醒后者应该是阉割版TU104核心),集成了320个Tensor核心,但没有提到RT Core。

性能方面,Tesla T4的FP32浮点性能8.1 TFLOPS,FP16性能65TFLOPS,INT8、IN4性能分别是130、260TFLOPS。

显存方面,Tesla T4配备了16GB GDDR6显存,但是官方的给出的带宽又只有320GB/s,如果是256bit位宽,那么320GB/s对应的频率就是10Gbps,频率明显比GDDR6显存要低,所以这个卡要么显存位宽有所降低,要么就是使用了低频版GDDR6。

最神奇的是显卡的TDP功耗只有75W,在CUDA核心数比RTX 2070显卡2304个CUDA核心更多的情况下,TDP功耗低了100W,通常这意味着GPU核心频率大降,但8.1TFLOPS的性能又不太可能比RTX 2070低,种种意外之处都透露着这款显卡的图灵核心有点不不寻常。

如果不是面向专业卡市场的话,这个图灵核心其实更合适做游戏卡,前提是放弃光线追踪技术。


  • 游客  09-15 03:07

    诶?这个我在前阵子下 CUDA 的时候看到了…原来没发布过的吗…

    支持(0)  |   反对(0)  |   举报  |   回复

    18#

  • Caroys博士 09-14 09:37

    cnbeta 研究生 :

    连显示接口都没有,也叫显卡吗?
    09-13 19:11
  • 支持(1)  |   反对(2)  |   举报  |   回复
  • N官方也称其为“GPU”,叫显卡也没错。

    支持(0)  |   反对(0)  |   举报  |   回复

    17#

  • 游客  09-13 22:55

    小编你看清楚,2070是完整TU106 (2304CUDA, 36SM, 144TMU),而Tesla T4是 5/6 的TU104, 正好 5 GPC (2560CUDA, 40SM, 160TMU).

    支持(2)  |   反对(0)  |   举报  |   回复

    16#

  • 游客  09-13 21:50

    cnbeta 研究生 :

    连显示接口都没有,也叫显卡吗?
    09-13 19:11
  • 支持(1)  |   反对(2)  |   举报  |   回复
  • 计算卡都不知道,看个毛的显卡

    支持(0)  |   反对(1)  |   举报  |   回复

    15#

  • cnbeta研究生 09-13 19:11

    连显示接口都没有,也叫显卡吗?

    支持(1)  |   反对(2)  |   举报  |   回复

    14#

  • 超能康猩猩大学生 09-13 18:36

    突然感觉这张卡才是图灵构架真正的核心科技所在,这应该不会是单独流片的核心,就是TU104阉割来的,个人认为这可能说明图灵构架在加速计算和图形运算之间有非常灵活高效的分配能力,使得在使用加速计算时完全不启用图形计算的晶体管,才能将功耗控制得这么低。

    已有1次举报

    支持(5)  |   反对(0)  |   举报  |   回复

    13#

  • 游客  09-13 17:34

    用N卡核能发电,电表倒转!
    用A卡国家电网公司,战略合作伙伴

    已有1次举报

    支持(4)  |   反对(0)  |   举报  |   回复

    12#

  • 游客  09-13 17:34

    用N卡核能发电,电表倒转!
    用A卡国家电网公司,战略合作伙伴

    已有1次举报

    支持(7)  |   反对(0)  |   举报  |   回复

    12#

  • heqi博士 09-13 16:56

    Yagami 小学生 :

    老黄万年黑皮衣?你不耶吗?
    09-13 16:49
  • 支持(1)  |   反对(0)  |   举报  |   回复
  • 开完发布会赶着去夜店,就不换衣服了

    支持(1)  |   反对(0)  |   举报  |   回复

    11#

  • Yagami小学生 09-13 16:49

    老黄万年黑皮衣?你不耶吗?

    支持(1)  |   反对(0)  |   举报  |   回复

    10#

  • 不要让我看见你大学生 09-13 16:26

    外观不错,可惜不是公版游戏卡

    支持(0)  |   反对(0)  |   举报  |   回复

    9#

  • 游客  09-13 16:20

    游客:

    做游戏卡?这显卡看图片没有视频输出接口啊
    09-13 15:54 已有1次举报
  • 支持(2)  |   反对(0)  |   举报  |   回复
  • 专业卡可以不用非得带视频输出口,但核心应该是可以视频输出的,2560个CUDA,即便频率很低,性能也不会差到哪儿去,关键是75W TDP相当诱人,带个风扇做到双槽半高卡没问题,完全是Mini PC的福音

    支持(2)  |   反对(0)  |   举报  |   回复

    8#

  • 游客  09-13 16:19

    TDP能砍到这个程度大概是另外设计的而不是改RTX的核心。完全去掉光栅和纹理单元和RT这些没用的东西,只保留CUDA和Tensor Core。然后压低工作电压到0.9以下,也没有TB的话,75W是有可能做到的。

    支持(2)  |   反对(0)  |   举报  |   回复

    7#

  • 游客  09-13 16:06

    感觉像是矿卡?但又没有风扇.....

    支持(1)  |   反对(0)  |   举报  |   回复

    6#

  • 苟利国大学生 09-13 16:06

    看这一串醒目的举报,啧啧,建议管理员重做评论系统,禁掉游客评论,评论下举报、评论、点赞都显示用户名。

    已有12次举报

    支持(5)  |   反对(2)  |   举报  |   回复

    5#

  • 孟宪瑞管理员 09-13 16:00

    游客:

    做游戏卡?这显卡看图片没有视频输出接口啊
    09-13 15:54 已有1次举报
  • 支持(2)  |   反对(0)  |   举报  |   回复
  • 这个显卡是给专业市场用的,说的是这个核心可以用来做游戏卡,不是特指T4显卡。

    支持(2)  |   反对(0)  |   举报  |   回复

    4#

  • 游客  09-13 15:54

    做游戏卡?这显卡看图片没有视频输出接口啊

    已有1次举报

    支持(2)  |   反对(0)  |   举报  |   回复

    3#

  • 游客  09-13 15:48

    75W TDP,被动散热设计?这么自信,还是把锅甩给了机箱暴力风扇……

    已有2次举报

    支持(0)  |   反对(1)  |   举报  |   回复

    2#

  • 游客  09-13 15:36

    英伟达真抠,涡轮扇都舍不得装,只想买一张玩玩还要另外买暴力扇才能用,使用体验极差

    已有4次举报

    支持(0)  |   反对(6)  |   举报  |   回复

    1#

查看全部评论(19)

回复