E X P
  • 编辑
  • 评论
  • 标题
  • 链接
  • 查错
  • 图文
  • 拼 命 加 载 中 ...

    记得当初GTX Titan显卡刚发布时,NVIDIA官方强调它不仅仅是最强游戏显卡,而且还可以做专业卡,不仅是因为它强大的性能,也与当初GK110核心保留了专业级的双精度性能有关。GTX Titan X发布时,NVIDIA为它配备了12GB显存,当时也有说是给一些专业用户预留的,这一次Pascal架构显卡也发布了,其计算性能又如何呢?

    对于NVIDIA Kepler及Maxwell架构的计算性能,我们之前分别做过单独的分析和测试,详情可以参考:

    聪明的“选择”,GTX Titan通用计算性能及其影响

    GTX Titan X显卡计算性能:单精度无敌,双精度变渣

    GP104架构计算性能改进

    与专门针对HPC市场的GP100大核心相比,GP104是针对游戏市场的,后者对GPU通用计算性能并没有多高的精度要求,特别是FP64双精度性能更没特别要求,而高精度浮点运算需要太多的计算单元,因此这种出力不讨好的设计在游戏GPU上并不受欢迎,GP104相比GP100就砍掉了很多与计算无关的设计——包括NV Link、1:2的FP64性能等,HBM 2显存也降级到了GDDR5X。

    在此前的GTX 1080架构分析中,我们可以看到GP104核心的SM单元架构与前代GM204架构非常相似,每组SM单元也是128个CUDA核心(FP32),其中有4组FP64双精度单元,FP64:FP32的比例还是1:32,这一点与GTX 980/GTX 980 Ti都是相同的,与GP100核心FP32:FP64的1:2超高比例大不相同。

    对AMD、NVIDIA来说,GPU的单双精度比都是根据需要来设计的,“同一个”核心可能有不同的变化,比如AMD的FirePro W9100跟R9 290X一样都是2816个流处理器单元,但前者的单双精度比是1:2,后者就只有1:8,而Fury X的Fiji核心虽然浮点性能高达8.6TFLOPS,但单双精度比下降到了1:16,Radeon Pro Duo显卡同核心的FirePro S9300 X2发布时AMD也只强调它是单精度最快的加速卡,因为双精度性能不过0.8TFLOPS,比FirePro S9170/9100还要低得多。

    对GP104核心来说,尽管单双精度比维持了GM204/GM200核心的1:32,不过它也不是没有改进,它支持了FP16半精度运算,而且FP32:FP16比例是1:2,也就是说半精度性能是单精度的2倍,上个月的GTC大会上,NVIDIA推出的DGX-1深度学习超算就是强调半精度性能的。

    GM204核心的Maxwell架构中,FP16半精度性能与FP32单精度性能还是1:1的,也就是没做优化支持。不过早在Tegra X1芯片发布时,NVIDIA就开始强调混合精度,也就是支持FP16半精度运算的,理论上目前的Maxwell架构也是可以做优化的。

    不过实际测试中Pascal的FP16半精度运算是不理想的,Sandra 2016的GPU计算中,GTX 980/980 Ti显卡的FP16显示是“模拟”出来的,而GTX 1080是“原生”,而且GTX 1080的FP16原生性能远远低于GTX 980显卡“模拟”出来的性能,这很可能意味着GTX 1080显卡现在的FP16支持还没做好驱动支持。

    下面就是GTX 1080显卡的计算性能实测,对比的只有GTX 980和GTX 980 Ti,因为手头没有Fury X显卡了。


    GTX 1080显卡与GTX 980显卡的计算性能对比

    在计算性能方面,GTX 1080的浮点性能是9TFLOPS,GTX 980是5TFLOPS,实测结果也是大比分领先了GTX 980显卡,Sandra的双精度、四精度领先优势更明显。


    GTX 1080显卡与GTX 980 Ti显卡的计算性能对比

    与GTX 980 Ti显卡相比,GTX 1080的运算性能领先幅度就没这么明显了,当然比GTX 980 Ti领先还是很是有的,特别是Sandra、AIDA64的GPU计算中。

    手头没有Fury X显卡了,所以没法对比它的计算性能,不过Fury X的浮点性能也有8.6TFLOPS,与GTX 1080差不多,单双精度比是1:16,要高于GP104核心,理论上其计算性能不会比GTX 1080差多少,双精度应该更有优势。

    总之,GP104核心因为是专注游戏市场的,所以在计算性能方面,GTX 1080相比GTX 980并没有明显的架构改变,但它依然有两大优势——首先是GPU性能强劲,浮点性能依然大比分优势领先GTX 980显卡,比GTX 980 Ti也有1/4的提升。

    第二点,Pascal架构原生支持FP16半精度运算,高精度运算对游戏、VR来说可能没什么意义,但原生支持FP16半精度运算可以大幅提升计算性能,NVIDIA目前主要强调应用在深度学习中,但未来游戏及VR都有可能因此受益。

    ×
    热门文章
    1英特尔透露Copilot本地运行条件:至少需要40 TOPS算力的NPU
    2英特尔Lunar Lake MX参考平台曝光:8核心CPU及GPU,集成LPDDR5X内存
    3矽速科技开发中的新掌机十分小巧,基于FPGA芯片打造
    4华硕发布RT-BE88U Wi-Fi 7双频路由器:10网口配置,无线速率达7200Mbps
    5京东方凭定价赢得苹果OLED订单,或成为第四代iPhone SE独家面板供应商
    6两个版本的微星Claw性能对比:酷睿Ultra 5的游戏性能几乎与酷睿Ultra 7相同
    7九州风神推出PN D/M系列电源:支持ATX 3.1规范,双金牌认证,399元起
    8《双人成行》销量突破1600万份,开发团队表示玩家的支持意味着一切
    9微星推出MAG 274UPF E2游戏显示器:4K@160Hz,采用Rapid IPS面板
    已有 19 条评论,共 43 人参与。
    登录快速注册 后发表评论
    • 游客  2016-05-28 16:23

      该评论年代久远,荒废失修,暂不可见。

      支持(0)  |   反对(0)  |   举报  |   回复

      19#

    • 超能网友博士 2016-05-21 14:01    |  加入黑名单

      超能网友 博士

      该评论年代久远,荒废失修,暂不可见。
      2016-05-20 17:54
    • 支持(1)  |   反对(1)  |   举报  |   回复
    • 该评论年代久远,荒废失修,暂不可见。

      支持(2)  |   反对(0)  |   举报  |   回复

      18#

    • 游客  2016-05-21 09:29

      超能网友 博士

      该评论年代久远,荒废失修,暂不可见。
      2016-05-20 17:54
    • 支持(1)  |   反对(1)  |   举报  |   回复
    • 该评论年代久远,荒废失修,暂不可见。

      支持(0)  |   反对(0)  |   举报  |   回复

      17#

    • 超能网友博士 2016-05-20 17:54    |  加入黑名单

      该评论年代久远,荒废失修,暂不可见。

      支持(1)  |   反对(1)  |   举报  |   回复

      16#

    • 游客  2016-05-20 08:44

      游客

      该评论年代久远,荒废失修,暂不可见。
      2016-05-20 04:07 已有2次举报
    • 支持(2)  |   反对(1)  |   举报  |   回复
    • 该评论年代久远,荒废失修,暂不可见。

      支持(0)  |   反对(0)  |   举报  |   回复

      15#

    • 我匿名了  2016-05-20 04:07

      游客

      该评论年代久远,荒废失修,暂不可见。
      2016-05-19 23:02 已有5次举报
    • 支持(0)  |   反对(0)  |   举报  |   回复
    • 该评论年代久远,荒废失修,暂不可见。

      已有2次举报

      支持(2)  |   反对(1)  |   举报  |   回复

      14#

    • 游客  2016-05-20 03:56

      该评论年代久远,荒废失修,暂不可见。

      支持(1)  |   反对(0)  |   举报  |   回复

      13#

    • 游客  2016-05-20 01:09

      该评论年代久远,荒废失修,暂不可见。

      支持(0)  |   反对(0)  |   举报  |   回复

      12#

    • 我匿名了  2016-05-19 23:02

      该评论年代久远,荒废失修,暂不可见。

      已有5次举报

      支持(0)  |   反对(0)  |   举报  |   回复

      11#

    • 游客  2016-05-19 20:10

      超能网友 终极杀人王

      该评论年代久远,荒废失修,暂不可见。
      2016-05-19 17:41
    • 支持(2)  |   反对(0)  |   举报  |   回复
    • 该评论年代久远,荒废失修,暂不可见。

      支持(0)  |   反对(0)  |   举报  |   回复

      10#

    • 游客  2016-05-19 19:25

      该评论年代久远,荒废失修,暂不可见。

      支持(0)  |   反对(0)  |   举报  |   回复

      9#

    • 游客  2016-05-19 18:39

      该评论年代久远,荒废失修,暂不可见。

      支持(0)  |   反对(0)  |   举报  |   回复

      8#

    • 游客  2016-05-19 18:09

      该评论年代久远,荒废失修,暂不可见。

      支持(0)  |   反对(0)  |   举报  |   回复

      7#

    • 超能网友终极杀人王 2016-05-19 17:41    |  加入黑名单

      游客

      该评论年代久远,荒废失修,暂不可见。
      2016-05-19 16:54
    • 支持(0)  |   反对(2)  |   举报  |   回复
    • 该评论年代久远,荒废失修,暂不可见。

      支持(2)  |   反对(0)  |   举报  |   回复

      6#

    • 游客  2016-05-19 16:57

      该评论年代久远,荒废失修,暂不可见。

      支持(2)  |   反对(0)  |   举报  |   回复

      5#

    • 游客  2016-05-19 16:54

      该评论年代久远,荒废失修,暂不可见。

      支持(0)  |   反对(2)  |   举报  |   回复

      4#

    • 超能网友终极杀人王 2016-05-19 16:27    |  加入黑名单

      游客

      该评论年代久远,荒废失修,暂不可见。
      2016-05-19 16:20
    • 支持(3)  |   反对(0)  |   举报  |   回复
    • 该评论年代久远,荒废失修,暂不可见。

      支持(0)  |   反对(0)  |   举报  |   回复

      3#

    • 游客  2016-05-19 16:21

      该评论年代久远,荒废失修,暂不可见。

      支持(0)  |   反对(0)  |   举报  |   回复

      2#

    • 游客  2016-05-19 16:20

      该评论年代久远,荒废失修,暂不可见。

      支持(3)  |   反对(0)  |   举报  |   回复

      1#

    登录 后发表评论,若无帐号可 快速注册 ,请留意 评论奖罚说明