E X P
  • 编辑
  • 评论
  • 标题
  • 链接
  • 查错
  • 图文
  • 本文约5086字,需8分钟阅读(全文浏览

    AMD RX Vega性能解禁在即,相信大家一定很兴奋,“吹”了将近一年的Vega显卡终于要用真面目示人了。之前我们曾经用AMD Radeon Vega Frontier Edition开发者卡来打过游戏——《专业卡能不能打游戏?AMD Radeon Vega Frontier显卡性能测试》,发现其性能大约是在其竞争对手NVIDIA GTX 1080、GTX 1070之间,但部分游戏成绩甚至不如GTX 1070。经过向AMD驱动部门沟通得知,尽管Radeon Vega Frontier Edition驱动中拥有一个Gaming Mode,但是这个切换的仅仅是驱动UI界面,而非驱动本身,驱动还是偏向于专业开发者的方面,直接用于游戏是不合理的。因此我们决定让AMD Radeon Vega Frontier显卡做回本行工作——只做专业测试,6款专业测试软件共47个专业测试子项,并且携带上好朋友Radeon Pro Duo(Polaris 10 x2)以及假想敌NVIDIA Quadro P5000,三款专业卡将同场较量。

    AMD Radeon Vega Frontier Edition:

    Vega显卡作为AMD今年重头大写之一,当然是万众期待。Radeon Vega Frontier作为首批与我们见面的Vega架构显卡,它身上的秘密已经被探索得非常透彻了。

    Radeon Vega Frontier Edition首先可以确认是满血版的Vega核心,也就是64组NCU单元,每组64个流处理器共同构成4096个流处理器,256个纹理单元,64个光栅单元,4MB的L2缓存。8GB的HBM 2显存,位宽为2048bit,而显存带宽高达484GB/s。

    其余更多新特性可以参考上一期的超能课堂《超能课堂(99):揭秘AMD Radeon Vega架构新玩意》,绝大部分疑惑都可以在里面找到答案。

    这里我们主要谈一下Vega架构中关于NCU单元(Next-Generation Compute Engine)的事情,一般来说3D游戏渲染对于FP32单精度要求是比较高的,不过在专业深度计算上对FP16半精度更为青睐,毕竟性能好、功耗低,也因此AMD在Vega最新的微架构(估计会延续过去叫GCN X.X,暂未公布)中引入了紧缩的半精度计算支持,可以灵活地使用NCU单元的ALU算术逻辑单元支持FP16、FP32计算。因此基于Vega架构的Radeon Instinct MI25计算卡其FP32单精度浮点性能12.5TFLOPS,而半精度FP16性能直接翻倍到25TFLOPS。

    稍微遗憾的是,目前除了实际应用中使用到FP16单元,可复现、标准FP16性能测试基本是没有的,即使有也是模拟出来FP16性能,并不准确,如果大家有什么好的测试意见,欢迎向小超哥微信9501417提出。

    测试驱动为:Radeon™ Vega Frontier Edition Driver 17.6

    AMD Radeon Pro Duo:

    最近Vega显卡锋芒毕露,大家注意力都被吸引过去了,甚至不知道有一张双Polaris 10核心的专业卡存在吧。虽然它命名为Radeon Pro Duo,但此Radeon Pro Duo非彼Radeon Pro Duo,不是我们之前熟知的基于双Fiji核心的Radeon Pro Duo。

    新的Polaris架构Radeon Pro Duo拥有36*2组CU单元,共2304*2个流处理器,核心频率1243MHz,单精度浮点运算能力为11.45TFLOPS(旧版Radeon Pro Duo为16.4TFLOPS),显存位宽256bit*2,显存频率1750MHz,显存带宽448GB/s(旧版Radeon Pro Duo为512GB/s,因为用的HBM显存)。

    从性能上来看,当然是旧版的Radeon Pro Duo更胜一筹,但是付出了以功耗、散热为代价,350W的TDP以及水冷散热都是玩家的痛。使用Polaris架构的新Radeon Pro Duo显然更加符合实际需求,尽管性能能够缩水了1/3。

    不过在NVIDIA、AMD均宣布不再重点支持多卡SLI、Crossfire以后,两家公司将会以发展更高性能单核心显卡为主要目标。毕竟多卡互联之后性能提升大家有目共睹,1+1=1.4已经是非常好的结果,剩下全都要靠驱动重点优化才有“神油”效果,在这方面付出太多显然太不划算了。

    尽管双芯卡性能要比一般的2Ways Crossfire性能要好,但是并不适合游戏,对于专业级用户来说还是有一定价值,毕竟部分渲染、计算就是需要暴力堆砌流处理器驱动,越多越好。这种任务的流程简单,就像跑着固定的流水线上,不像游戏场景那么复杂多变,只要处理单元越多,性能当然越好。

    测试驱动为:Radeon Pro Software Enterprise Driver 17.Q3

    NVIDIA Quadro P5000:

    Quadro P5000显卡有一个大家都熟悉的身份,那就是Pascla显卡的先锋GTX 1080,他们直接的硬件规格都是一模一样的——GP104-400核心。

    GP104-40核心拥有20组SM单元,每组SM单元有128个CUDA核心,一共2560个,首次搭配了与美光联合开发的8GB GDDR5X显存,主要是显存频率更高了,飙到10Gbps,间接地弥补了GDDR5显存带宽比不过HBM显存弊端。而作为专业卡的Quadro P5000显然对显存大小更为敏感,NVIDIA为其增加了一倍的GDDR5X显存,双面布局共16GB。

    如果你要问,Quadro P5000用的GP104-400与Quadro P6000的GP100核心有什么区别?这个区别可就大了,GP104本来就是针对游戏市场,还记得Maxwell架构显卡超高能耗比怎么来的吗?就是砍FP64双精度单元,从GP100核心FP32:FP64的1:2超高比例,砍到GP104-400的1:32,这个刀法可是非常厉害的。

    而AMD Radeon Pro Duo的FP32:FP64比例为1:16,而AMD Radeon Vega Frontier Edition目前还不好说,AMD官方还没有公布详细的架构示意图。

    不过Vega架构总算是引入了FP16半精度单元,如果有需要也可以重新“组装”成FP32单精度单元,而NVIDIA引入FP16单元已经有相当长一段时间,因为NVIDIA涉足人工智能、大数据处理、机器学习已经挺久了,这些应用对于运算精度要求并不好,FP16不仅速度快,而且功耗更低,非常适合。NVIDIA为了应付即将爆发的深度学习领域需求,已经大胆地在下一代Volta架构的Tesla V100引入了Tensor单元,这种单元与深度学习计算性能高度相关,性能非常可怕,在FP32:FP64:Tensor单元比例为8:4:1下,Tensor性能就高达120TFLOPS,NVIDIA已经未雨绸缪。

    测试驱动为:QUADRO DESKTOP DRIVER RELEASE 384 U2 (385.12)

    测试平台:

    ×
    热门文章
    已有 15 条评论,共 53 人参与。
    登录快速注册 后发表评论
    • 游客  2018-06-02 11:49

      该评论年代久远,荒废失修,暂不可见。

      支持(0)  |   反对(0)  |   举报  |   回复

      17#

    • 游客  2018-06-02 11:47

      该评论年代久远,荒废失修,暂不可见。

      支持(0)  |   反对(0)  |   举报  |   回复

      16#

    • 游客  2018-03-18 07:56

      该评论年代久远,荒废失修,暂不可见。

      支持(0)  |   反对(0)  |   举报  |   回复

      15#

    • 超能网友编辑 2017-08-16 11:39    |  加入黑名单

      游客

      该评论年代久远,荒废失修,暂不可见。
      2017-08-14 22:31
    • 支持(0)  |   反对(0)  |   举报  |   回复
    • 该评论年代久远,荒废失修,暂不可见。

      支持(0)  |   反对(0)  |   举报  |   回复

      14#

    • 游客  2017-08-14 22:58

      游客

      该评论年代久远,荒废失修,暂不可见。
      2017-08-14 18:19 已有3次举报
    • 支持(9)  |   反对(6)  |   举报  |   回复
    • 该评论年代久远,荒废失修,暂不可见。

      已有1次举报

      支持(14)  |   反对(0)  |   举报  |   回复

      13#

    • 游客  2017-08-14 22:31

      该评论年代久远,荒废失修,暂不可见。

      支持(0)  |   反对(0)  |   举报  |   回复

      12#

    • 游客  2017-08-14 21:43

      该评论年代久远,荒废失修,暂不可见。

      支持(0)  |   反对(0)  |   举报  |   回复

      11#

    • 游客  2017-08-14 20:45

      游客

      该评论年代久远,荒废失修,暂不可见。
      2017-08-14 18:19 已有3次举报
    • 支持(9)  |   反对(6)  |   举报  |   回复
    • 该评论年代久远,荒废失修,暂不可见。

      支持(0)  |   反对(1)  |   举报  |   回复

      9#

    • 超能网友终极杀人王 2017-08-14 19:40    |  加入黑名单

      游客

      该评论年代久远,荒废失修,暂不可见。
      2017-08-14 18:56
    • 支持(0)  |   反对(0)  |   举报  |   回复
    • 该评论年代久远,荒废失修,暂不可见。

      支持(1)  |   反对(0)  |   举报  |   回复

      8#

    • 超能网友博士 2017-08-14 19:01    |  加入黑名单

      游客

      该评论年代久远,荒废失修,暂不可见。
      2017-08-14 18:19 已有3次举报
    • 支持(9)  |   反对(6)  |   举报  |   回复
    • 该评论年代久远,荒废失修,暂不可见。

      支持(1)  |   反对(0)  |   举报  |   回复

      6#

    • 游客  2017-08-14 19:00

      游客

      该评论年代久远,荒废失修,暂不可见。
      2017-08-14 18:19 已有3次举报
    • 支持(9)  |   反对(6)  |   举报  |   回复
    • 该评论年代久远,荒废失修,暂不可见。

      支持(1)  |   反对(0)  |   举报  |   回复

      5#

    • 超能网友等待验证会员 2017-08-14 18:59    |  加入黑名单

      该评论年代久远,荒废失修,暂不可见。

      支持(1)  |   反对(0)  |   举报  |   回复

      4#

    • 游客  2017-08-14 18:56

      游客

      该评论年代久远,荒废失修,暂不可见。
      2017-08-14 18:46
    • 支持(0)  |   反对(0)  |   举报  |   回复
    • 该评论年代久远,荒废失修,暂不可见。

      支持(0)  |   反对(0)  |   举报  |   回复

      3#

    • 我匿名了  2017-08-14 18:46

      该评论年代久远,荒废失修,暂不可见。

      支持(0)  |   反对(0)  |   举报  |   回复

      2#

    • 游客  2017-08-14 18:19

      该评论年代久远,荒废失修,暂不可见。

      已有3次举报

      支持(9)  |   反对(6)  |   举报  |   回复

      1#

    登录 后发表评论,若无帐号可 快速注册 ,请留意 评论奖罚说明
    为你推荐