VCZ曝光NVIDIA Turing架构秘密:SM单元大改,CUDA性能提升50%

2018-9-12 11:44  |  作者:梁俊豪   |  关键字:NVIDIA,Turing,VideoCardZ

VideoCardZ他们居然曝光了Turing架构显卡的一些秘密,比方说SM单元大改,CUDA性能提升50%,RTX 2070其实用TU106核心,还有一大堆新的着色技术引入。

本文约882字,需1分钟阅读

NVIDIA第一批光线追踪显卡评测解禁临近,但我们依然对其中Turing架构的细节一无所知,这与NVIDIA最近实施最强的管控措施有关,从源头上就限制住各方提前爆料的可能性,比如说显卡不能提前给媒体、限制驱动分发等等。所以想提前知道详细规格、性能如何?但这难不倒VideoCardZ,他们居然曝光了Turing架构显卡的一些秘密,比方说SM单元大改,CUDA性能提升50%,RTX 2070其实用TU106核心,还有一大堆新的着色技术引入。

由于NVIDIA尚未公布Turing架构白皮书,很多细节无法得知。但VideoCardZ不知道哪里搞来了全套架构图,公布的架构图与NVIDIA官方传统风格不一样,可能是为了规避水印而做的高清重制版本,真实性应该可以得到确认,不然没事谁会乱P一个架构图呢?

我们先来看看SM单元的组成吧。除了原有的FP32单精度单元,FP64双精度单元全都砍掉了,加入了INT32单元以及Tensor Core,底下新增加了一个相对独立的RT Core。VCZ还提到Turing架构SM单元还将共享缓存、L1缓存、纹理缓存引入了统一架构,可以让L1缓存更充分利用资源,这样的设计可以使得每一个CUDA单元获得50%的性能提升。


来源VideoCardZ

再回到比较大的层面上,看看RTX 2080 Ti的TU102框架图,这可不得了非常壮观的规格。TU102一共分为6组GPC单元,每组GPC单元又拥有12个SM单元,一共是72个SM单元,但RTX 2080 Ti也只是用了68个而已。同时按照已经RTX 2080 Ti已经公布的参数,可以计算得出,每个SM单元将会配备64个CUDA、8个Tensor Core 、1个RT Core。


来源VideoCardZ

完整版的TU106核心依然是6组GPC单元,不过每组GPC改为8个SM单元,一共是48个,RTX 2080的GPU核心是TU104-400,只用上了46组,还有预留有2组空缺的。VCZ给出的数据是545平方毫米,一共有136亿晶体管。


来源VideoCardZ

原本以为RTX 2070依然会是TU104核心“阉割”下来,但是VCZ确实是全新的核心型号TU106,你可以将其视作RTX 2080 Ti规格砍半,3组GPC单元,3×12=36组SM单元,经过计算,RTX 2070是满血版的TU104核心。VCZ给出的数据时454平方毫米,一共有106亿晶体管。但是这样算下来,RTX 2070规格并不比GTX 1080好多少,性能提升堪忧。


来源VideoCardZ

Turing显卡使用了新的显存无损压缩技术,不过VCZ也只是简单说明了相比于Pascal显卡有50%带宽增长而已,没具体说明。

此外NVLink可以确认为RTX 2080 Ti、RTX 2080独享,RTX 2070并不支持。此外新的Turing显卡使用了新的视频图像引擎,支持Displayport 1.4标准,最高可以输出8K@60Hz图像,还可以一次性驱动两台这样的显示器。 新编解码引擎,可以编码H.265 8k@30FPS视频,或者解码YUV 4:4:4 10/12bit HDR 8K和VP9 10/12bit HDR视频。

还有一大堆新的着色技术,比如Mesh Shading 、Variable Rate Shading (VRS)、Texture-Space Sharing、Multi-View Rendering (MVR) 等。



  • 游客  09-14 10:32

    NV已经走上费米错误道路。大幅消减SP,大幅提高控制单元,晶体管大幅消耗。这问题很严重,短期因AMD显卡不济NV错误决策未凸显出来,但路线走错让NV3年不快乐

    支持(0)  |   反对(0)  |   举报  |   回复

    10#

  • 游客  09-12 21:27

    看到 CUDA性能提升50% 我就笑了

    支持(2)  |   反对(1)  |   举报  |   回复

    9#

  • lygmzj大学生 09-12 16:38

    第5段,完整版的TU106核心依然是6组GPC单元,应是 TU104。
    第6须,RTX 2070是满血版的TU104核心,应是TU106。

    支持(5)  |   反对(0)  |   举报  |   回复

    8#

  • 游客  09-12 15:02

    所以性能提升会很可观吗?

    支持(1)  |   反对(0)  |   举报  |   回复

    7#

  • 游客  09-12 13:31

    游客:

    工艺不提升 历史性上能没超过百分之40的
    09-12 12:36 已有8次举报
  • 支持(1)  |   反对(8)  |   举报  |   回复
  • 活在梦里的历史

    已有1次举报

    支持(7)  |   反对(1)  |   举报  |   回复

    6#

  • 游客  09-12 13:06

    大新闻啊!还是VC厉害!看来2070会很渣,真2060 Ti?黄老板的刀法又变了!2080是甜点!384 bit?

    支持(0)  |   反对(0)  |   举报  |   回复

    5#

  • 游客博士 09-12 13:03

    游客:

    工艺不提升 历史性上能没超过百分之40的
    09-12 12:36 已有8次举报
  • 支持(1)  |   反对(8)  |   举报  |   回复
  • 游客:

    7900gtx-8800gtx
    09-12 12:53
  • 支持(7)  |   反对(0)  |   举报  |   回复
  • 7950GX2

    已有1次举报

    支持(0)  |   反对(2)  |   举报  |   回复

    4#

  • 游客  09-12 12:53

    游客:

    工艺不提升 历史性上能没超过百分之40的
    09-12 12:36 已有8次举报
  • 支持(1)  |   反对(8)  |   举报  |   回复
  • 7900gtx-8800gtx

    支持(7)  |   反对(0)  |   举报  |   回复

    3#

  • 游客  09-12 12:36

    工艺不提升 历史性上能没超过百分之40的

    已有8次举报

    支持(1)  |   反对(8)  |   举报  |   回复

    2#

  • 游客  09-12 12:34

    用N卡就是这么的自信

    已有5次举报

    支持(5)  |   反对(1)  |   举报  |   回复

    1#

查看全部评论(10)

回复