E X P
正努力加载中…
  • 编辑
  • 评论
  • 标题
  • 链接
  • 查错
  • 图文
  • 拼 命 加 载 中 ...

    昨晚AMD果然举行了Next Horizon”大会,主题当然就是7nm产品,除了7nm Zen 2内核处理器外,少不了7 nm显卡,首发产品却是面向计算领域的Radeon Instinct计算卡——Radeon Instinct MI 60、Radeon Instinct MI 50。

    Radeon Instinct MI 60/50依旧是基于Vega架构演进而来,7nm工艺加持下,晶体管密度增加一倍,在331mm2的核心面积中集成了132亿晶体管,作为参考14nm Vega核心核心面积484mm2晶体管数量却为125亿,进步相当明显。

    新工艺还带了额外的“红利”,在相同功耗情况下,性能提升25%;同样频率下,功耗下降50%,7nm工艺真的足够诱惑,毕竟解决了很多AMD显卡以往积累下来的问题。

    AMD还很喜欢讲Vega是一个高度灵活的高性能架构,不过这一次7nm Vega核心架构似乎更加偏向于专业方面,拥有目前世界上最快的FP64/FP32 浮点性能、HBM 2显存、显存ECC纠错功能、唯一的硬件虚拟化,适用于机器学习训练。

    这一次AMD给Radeon Instinct计算卡配备了32GB HBM2显存,使得显存带宽突破了1TB/s大关,并支持ECC纠错技术,这些都意味着专门应用于计算领域,游戏领域可用不上这么夸张的显存容量、带宽。

    我们目前显卡均采用PCI-E 3.0接口,而7nm Vega架构率先完成了对PCI-E 4.0的适配支持,配合AMD专有的Infinity Fabric总线,支持四张Radeon Instinct计算卡同时并行运算,具备极佳的扩展性,而且这种架构下,显卡性能得到最大提升,双卡几乎是100%提升。

    目前Radeon Instinct MI 60、Radeon Instinct MI 50的具体规格依然是保密的,不过AMD也提供了一些性能参考数据,Radeon Instinct MI 60双精度性能为7.4 TFLOPS,单精度翻倍至14.7 TFLOPS,整数性能118 TLOPS。这个数值与NVIDIA的Tesla V100显卡单精度浮点15 TFLOPS,双精度浮点7.5 TFLOPS相近。

    Radeon Instinct MI 50具体规格、性能将会稍后公布,两张7nm Radeon Instinct显卡均会在今年出货,而7nm游戏显卡将会在明年与大家见面,至于是Vega架构还是Navi架构,大家猜一猜?


    ×
    已有 19 条评论,每一条合规评论都是对我们的褒奖。
    登录快速注册 后发表评论
    • NightView博士 2018-11-10 01:14  加入黑名单

      快报快报!
      AMD在MI60的PPT当中没有对N卡进行正确配置,得到的结果有误:
      wccftech.com/amd-radeon-mi60-resnet-benchmarks-v100-tensor-not-used/?tdsourcetag=s_pcqq_aiomsg
      在正确设置后,PCIe的Tesla V100深度学习RESNET-50性能达到了MI60的3.7倍!就连70W TDP的Tesla T4都比300W TDP的MI60更强,真是笑死人啦

      支持(0)  |   反对(0)  |   举报  |   回复

      19#

    • NightView博士 2018-11-08 19:18  加入黑名单

      超能康猩猩 教授

      GV100也是7.4T,说最快依然没毛病
      2018-11-08 19:02 已有7次举报
    • 支持(0)  |   反对(7)  |   举报  |   回复
    • 你这是小数点精度不够看着一样而已
      然而真正更精确的指标是:
      Quadro GV100 FP32是14.807TFlops,FP64是7.40352TFlops
      MI60 FP32是14.7456TFlops,FP64是7.3728TFlops
      MI60的那7.4TFlops不过是四舍五入近似,根本没真正达到,而Quadro GV100才是真正达到了7.4TFlops的。

      况且别忘记Quadro GV100是有boost的,boost频率1628MHz
      Quadro GV100在boost后的真实性能是FP32:16.671TFlops,FP64:8.335TFlops

      支持(2)  |   反对(0)  |   举报  |   回复

      18#

    • 超能康猩猩教授 2018-11-08 19:02  加入黑名单

      NightView 博士

      当Quadro GV100不存在是么?还是说Quadro GV100接口不是PCIE呢?
      2018-11-08 18:50
    • 支持(4)  |   反对(1)  |   举报  |   回复
    • GV100也是7.4T,说最快依然没毛病

      已有7次举报

      支持(0)  |   反对(7)  |   举报  |   回复

      17#

    • NightView博士 2018-11-08 18:50  加入黑名单

      超能康猩猩 教授

      pcie接口的v100性能只有7T,NVlink的才能达到7.8T
      2018-11-08 18:45 已有7次举报
    • 支持(0)  |   反对(7)  |   举报  |   回复
    • 当Quadro GV100不存在是么?还是说Quadro GV100接口不是PCIE呢?

      支持(4)  |   反对(1)  |   举报  |   回复

      16#

    • 超能康猩猩教授 2018-11-08 18:45  加入黑名单

      NightView 博士

      Tesla V100难道不是插PCIe插槽上用的?难道不是pcie capable?
      2018-11-08 18:32
    • 支持(3)  |   反对(0)  |   举报  |   回复
    • pcie接口的v100性能只有7T,NVlink的才能达到7.8T

      已有7次举报

      支持(0)  |   反对(7)  |   举报  |   回复

      15#

    • NightView博士 2018-11-08 18:32  加入黑名单

      超能康猩猩 教授

      pcie capable gpu?
      2018-11-08 18:23 已有6次举报
    • 支持(0)  |   反对(6)  |   举报  |   回复
    • Tesla V100难道不是插PCIe插槽上用的?难道不是pcie capable?

      支持(3)  |   反对(0)  |   举报  |   回复

      14#

    • 超能康猩猩教授 2018-11-08 18:23  加入黑名单

      NightView 博士

      第三张图的最左面那堆文字,你看不懂英文么?还是眼睛不好?
      2018-11-07 22:07
    • 支持(5)  |   反对(0)  |   举报  |   回复
    • pcie capable gpu?

      已有6次举报

      支持(0)  |   反对(6)  |   举报  |   回复

      13#

    • NightView博士 2018-11-08 00:45  加入黑名单

      游客 终极杀人王

      同样频率下,功耗下降50%
      2018-11-07 23:21 已有4次举报
    • 支持(0)  |   反对(4)  |   举报  |   回复
    • MI25功耗300W,频率1500MHz,12.288TFlops的单浮点
      也就是说, MI60在300W功耗情况下,拥有12.288*1.25=15.36TFlops单精度浮点,计算下来是1875MHz频率
      因为默认单精度浮点是14.7TFlops所以计算下来大概1800MHz频率

      根据同频率下功耗低50%,所以MI60在1500MHz的时候只有150W功率,增加375MHz后,功耗翻倍到300W,你认为这样可能性大么?a
      所以这个“同频率”很有可能是同为1200MHz甚至1000MHz的时候,多半不是1500MHz下,这功耗低得有意义么?

      支持(0)  |   反对(1)  |   举报  |   回复

      12#

    • 游客终极杀人王 2018-11-07 23:21  加入黑名单

      游客

      同功耗提升25%,所谓7nm也救不了GCN
      2018-11-07 17:39
    • 支持(1)  |   反对(2)  |   举报  |   回复
    • 同样频率下,功耗下降50%

      已有4次举报

      支持(0)  |   反对(4)  |   举报  |   回复

      11#

    • NightView博士 2018-11-07 22:07  加入黑名单

      超能康猩猩 教授

      人家只说是第一个7nmGPU,什么时候说是最快了?
      2018-11-07 21:24 已有11次举报
    • 支持(1)  |   反对(12)  |   举报  |   回复
    • 第三张图的最左面那堆文字,你看不懂英文么?还是眼睛不好?

      支持(5)  |   反对(0)  |   举报  |   回复

      10#

    • 超能康猩猩教授 2018-11-07 21:24  加入黑名单

      NightView 博士

      AMD果然够不要脸的,单双精度性能明明都不如Tesla V100,结果还好意思宣称是全世界最快
      2018-11-07 13:14 已有4次举报
    • 支持(12)  |   反对(4)  |   举报  |   回复
    • 人家只说是第一个7nmGPU,什么时候说是最快了?

      已有11次举报

      支持(1)  |   反对(12)  |   举报  |   回复

      9#

    • 游客 2018-11-07 17:39

      同功耗提升25%,所谓7nm也救不了GCN

      支持(1)  |   反对(2)  |   举报  |   回复

      8#

    • 游客 2018-11-07 15:53

      专注挖矿几十年

      支持(0)  |   反对(0)  |   举报  |   回复

      7#

    • NightView博士 2018-11-07 13:35  加入黑名单

      INT整数性能都只有118TLOPS,然而Tesla V100的FP16都能有120TFLOPS了。
      至于RTX8000的INT4整数性能则达到了500多TLOPS...

      支持(2)  |   反对(0)  |   举报  |   回复

      6#

    • 游客 2018-11-07 13:24

      一般说到TFLOPS都会用FP32性能来指代,这里牛逼,直接用FP64了,不知道的还以为AMD这一代性能只有上代一半呢

      支持(1)  |   反对(1)  |   举报  |   回复

      5#

    • NightView博士 2018-11-07 13:14  加入黑名单

      AMD果然够不要脸的,单双精度性能明明都不如Tesla V100,结果还好意思宣称是全世界最快

      已有4次举报

      支持(12)  |   反对(4)  |   举报  |   回复

      4#

    • 游客 2018-11-07 12:57

      amd加油,618买的1070ti刚送去返修,nv真的烂。

      已有7次举报

      支持(4)  |   反对(7)  |   举报  |   回复

      3#

    • liyun_1981博士 2018-11-07 12:14  加入黑名单

      按摩店早就应该刺激下英伟达了

      已有6次举报

      支持(2)  |   反对(7)  |   举报  |   回复

      2#

    • 游客 2018-11-07 12:10

      AMD加油就行了

      支持(3)  |   反对(1)  |   举报  |   回复

      1#

    登录 后发表评论,若无帐号可 快速注册 ,请留意 评论奖罚说明
    为你推荐