E X P
本文约 2260 字,6 张图表,正努力加载…
  • 编辑
  • 评论
  • 标题
  • 链接
  • 查错
  • 图文
  • 拼 命 加 载 中 ...

    今天晚上9点,NVIDIA将会放出CEO黄仁勋为主讲人的GTC 2020主题演讲,经过官方的多次预热和暗示,我们很有可能会看到新一代的Ampere架构,还有基于新架构的GPU、新的Tesla计算卡和DGX计算服务器产品。在今晚揭晓谜底之前,我们整合了截至目前的多条流言和传闻,尝试为各位读者构建出一个尽量接近最终成品的Ampere架构。

    ga102-rumor
    传说中的GA102核心图,来自于@Ragdoll_Kitties

    我们首先从制程工艺开始讲起。

    制程工艺:台积电7nm还是三星8nm?

    Ampere GPU将使用谁家的哪种制程工艺可以说是目前最为扑朔迷离的一个问题。要搞清楚这个问题,我们需要回顾一系列的新闻事实。

    最早的传闻出现在去年的6月份,当时有媒体报道NVIDIA将会选择三星的7nm EUV工艺来生产新一代的Ampere GPU而不是用老伙伴台积电的7nm工艺。

    这则消息随后被NVIDIA韩国的头头确认了,随后又被NVIDIA官方发言人和VP改正为他们将在下代GPU上同时使用两家的工艺”。之后很长时间,我们都以这个官方确认为准,但同时用两家代工厂肯定会带来一个新的问题:哪家多哪家少?

    于是在去年于苏州举办的GTC 2019中国大会上面,有媒体直接向CEO黄仁勋询问了这个问题。当时黄仁勋确实给出了回答,原话是怎么样的现在已经不可知,目前能够找到的相关报道的引源都是来自于这段话:

    NVIDIA创始人黄仁勋日前接受媒体访问时澄清,未来还是会将大多数7纳米制程产品订单交由台积电生产,三星只会获得少量订单。

    通过CEO的澄清,我们似乎可以确定台积电在新一代产品中仍然将作为主要的代工厂。但之后不久,又出现了NVIDIA将会使用三星的8nm制程制造游戏GPU的传闻。

    但其实细看的话,两者之间并不冲突,“会将大多数7纳米制程产品订单交由台积电生产”这句话中提到的产品是“7纳米制程产品订单”,而如果游戏GPU直接不使用7纳米制程,那它根本就不算是“7纳米制程产品订单”的成分,那么传闻和已经被确认的事实之间就不存在冲突了。

    基于以上的判断,我们可以提出如下的猜测:核心面积巨大、面向专业计算市场的GA100可能会交由台积电进行生产,而面积更小,诸如GA104等游戏GPU将会交由三星进行生产,并且使用8nm制程。

    由于三星的8nm工艺实质是10nm节点工艺的改良版本,其密度提升不大,所以是比较适合用来“摊大饼”以降低先进制程工艺带来的积热效应,在游戏卡上面可以用更低的成本来控制好核心温度。

    架构优化升级

    从Kepler架构开始,NVIDIA就着重于提升GPU的能效比,Ampere架构肯定也会伴随着一定的能效比提升,这其中部分是来自于制程工艺的升级,部分是来自于自身的架构优化升级。

    从这几代NVIDIA GPU架构的变化来看,有几个趋势是比较明显的,一是单个SM中的CUDA Core数量在变少,而SM数量在不断变多;二是缓存系统在不断地变大,尤其是共享的L2缓存,在不断地变大;三是将整数与浮点计算解耦,对不同的数据类型进行并行化处理。

    Turing是一代改变较大的架构,就算是与它的前辈Volta比,改变也堪称巨大。首先它引入了RT Core,支持对光线追踪进行硬件加速计算,并成功地将Tensor Cores应用在游戏卡上面。另外它独立设置了处理INT16的单元,让整数与浮点走两条并行的处理管线。总的来说,它打好了NVIDIA未来图形架构的基础,Ampere将会在它的基础上进行优化升级。目前的传言中,对于Ampere架构的猜测主要有如加大L2缓存,增加Tensor Cores的数量,RT Cores的效率改进等等。

    先来说说Turing核心中被玩家们叫成是“电炉丝”的Tensor Cores和RT Cores。

    Tensor Cores的更多用处:帮助压缩显存?

    有传言称Ampere将会把单个SM中的Tensor Cores给加倍,以提供更强劲的FP16运算能力,那么会用在何处呢?

    想必各位还是比较认同DLSS 2.0在图像质量和性能上面的优化改进的,传言中称,一个兼容性更好(能兼容TAA算法,目前不行)的DLSS 3.0已经在路上了,它会提供比DLSS 2.0更强的表现。那么数量加倍的Tensor Cores想必能够在AI相关的应用中提供好不少的性能,DLSS就是一大重点用途。当然,对于计算市场,加倍的Tensor Cores在计算能力方面也将会有出色的表现。

    另外,传言中还说,Tensor Cores可能将会帮助GPU进行显存的压缩,以增加GPU与显存之间的带宽,这对当前的GDDR6显存是一个友好的补充。

    RT Core改进:4倍光追性能?

    再来看RT Core相关的内容,Turing GPU在处理实时光追效果时,会有不小的性能损失。Ampere的每个SM仍然只会有一个RT Cores,但它会在效率上可能会有很大的提升。

    image-20200514192925255

    效率的提升会让GPU在处理实时光追时更为得心应手,至少不会像Turing那样,在碰到大量应用光线追踪特效时出现大幅度的帧数下降这种情况了。

    L2缓存加大:提升IPC性能

    缓存设计是现代GPU设计中重要的一环,非常影响最终的性能表现。从Kepler一路看过来,你可以发现NVIDIA一直都在加大GPU的缓存,Turing的L1缓存架构还被重新设计了一番。

    目前的传闻中,Ampere将会把L2缓存给加倍,这也是得益于制程工艺的提升。这也会让架构的IPC得到一定的提升。配合上新工艺带来的频率提升,可以预见的是,Ampere在普通应用中(没有光追和DLSS)相比Turing也会有较大的提升。

    I/O、显示接口升级:PCIe 4.0板上钉钉,DP 2.0、HDMI 2.1可以有

    Ampere架构是未来一到两年中NVIDIA方面主打的GPU架构,那么在I/O部分自然也要有相当的前瞻性以满足后面几年的需求才行。从Turing到现在过去已经快有两年的时间了,I/O接口有了不少的升级,比如说HDMI推出了2.1版本,DisplayPort也推出了2.0版本,而PCIe 4.0也已经进入实用领域,竞争对手的最新GPU中已经升级到了PCIe 4.0,那么NVIDIA自然是不会落后,支持PCIe 4.0总线可以说是板上钉钉的事情。

    为了面向未来的8K甚至更高的分辨率,对显示接口进行升级也基本上是可以肯定的事情。我们很有可能会看到它支持HDMI 2.1和DisplayPort 2.0,原来的USB-C支持也将保留。

    总结

    好了,以上就是对今晚即将要发布的Ampere GPU的一些传闻的汇总,我们抛去了传闻中针对游戏卡的部分,只保留了架构的变动,由于Ampere很明显将会是一代同时面向计算和游戏的通用型架构,我们从今晚的主题演讲中应该会得知关于它的很多信息,敬请等待今晚九点之后的专题报道。

    ×
    热门文章
    1索尼确认将关闭Japan Studio,或与索尼游戏国际化理念不符所致
    2高通在英国遭遇维权组织反垄断诉讼,被指滥用市场支配地位需赔偿6.8亿美元
    3联想拯救者刃7000P将搭载自家RX 6900XT/6800XT显卡,外形酷似当年镭7
    4Intel Xe-HPG游戏显卡规格曝光,最大的拥有512组EU
    5AMD在3月份仅发布Radeon RX 6700 XT且库存少,非XT版将推迟发布
    6索尼计划在今年夏季启用PlayStation 5里的M.2插槽,以实现存储升级
    已有 21 条评论,共 87 人参与。
    登录快速注册 后发表评论
    • yjhercules终极杀人王 2020-05-15 15:49    |  加入黑名单

      y神的风扇 博士

      咱别买丐版显卡了吧?
      2020-05-15 15:19
    • 支持(0)  |   反对(0)  |   举报  |   回复
    • 1660super就没有什么好的, 特别是散热能达到我认可的标准的
      最近是看上一索泰,这也是时隔12-13年再次考虑索泰。
      从超能测试看比耕长那个卡低了3度。不过频率是1785 不是耕升的1800核心。 联系售后,1660super 毁灭者的孔距是58*58
      也就是gtx680 770 的扣具,好办,手里就有680。能上680的显卡散热器肯定能上1660super 压680能压到58度。那么压1660super估计51-52度的样子。就是个头大。 有时间我做一个1660super 换显卡散执器测试。 测试显卡散热器有 2奶 萨满 mk13 肉架 还有当时gtx680带的3风扇3槽宽的5热管。

      已有2次举报

      支持(0)  |   反对(0)  |   举报  |   回复

      21#

    • y神的风扇博士 2020-05-15 15:19    |  加入黑名单

      yjhercules 终极杀人王

      我就开机测试了3天, 就玩一个游戏,主要是高温FURMARK 80度
      裸机 23度室温。这要是夏天30度,就跟给同事装的华硕tuf1660一个样,频繁90度还不得。 目前看索泰毁灭者1660s了
      超能有测试,我去对比一样。从索泰售后得到的消息是
      这个安装散热器孔距阳59*59 也是醉了
      2020-05-15 13:45 已有2次举报
    • 支持(0)  |   反对(0)  |   举报  |   回复
    • 咱别买丐版显卡了吧?

      支持(0)  |   反对(0)  |   举报  |   回复

      20#

    • yjhercules终极杀人王 2020-05-15 13:45    |  加入黑名单

      游客

      所以为什么能用一年再退呢
      2020-05-15 10:08
    • 支持(1)  |   反对(0)  |   举报  |   回复
    • 我就开机测试了3天, 就玩一个游戏,主要是高温FURMARK 80度
      裸机 23度室温。这要是夏天30度,就跟给同事装的华硕tuf1660一个样,频繁90度还不得。 目前看索泰毁灭者1660s了
      超能有测试,我去对比一样。从索泰售后得到的消息是
      这个安装散热器孔距阳59*59 也是醉了

      已有2次举报

      支持(0)  |   反对(0)  |   举报  |   回复

      19#

    • 游客  2020-05-15 12:36

      游客

      所以为什么能用一年再退呢
      2020-05-15 10:08
    • 支持(1)  |   反对(0)  |   举报  |   回复
    • 水军福利

      支持(2)  |   反对(0)  |   举报  |   回复

      18#

    • 游客  2020-05-15 10:08

      yjhercules 终极杀人王

      是显卡都行
      主要是评估点。我就是看温度
      原来gt650 换上ac散热器 夏天玩游戏42度最高,30-32度室温。封闭机箱再也上不去了,8800gt 原来换ac2奶是 55度玩游戏 室温30-32度
      现在同样功率的1660s 我退的耕升直接80度。可想
      当然超能测试耕升1660s 和我买的是一块,超能的数据还好呢 25度FURMARK 71 我是23度 furymark 80-83度。噪声忍不了。
      不过测试功率我发现。耕升的1660s 实际最大稳定功率在140w-150w间。待机是30w furymark是170w
      2020-05-15 09:58
    • 支持(0)  |   反对(0)  |   举报  |   回复
    • 所以为什么能用一年再退呢

      支持(1)  |   反对(0)  |   举报  |   回复

      17#

    • yjhercules终极杀人王 2020-05-15 09:58    |  加入黑名单

      游客

      1660s都成吹显卡了啊
      2020-05-15 09:32
    • 支持(0)  |   反对(0)  |   举报  |   回复
    • 是显卡都行
      主要是评估点。我就是看温度
      原来gt650 换上ac散热器 夏天玩游戏42度最高,30-32度室温。封闭机箱再也上不去了,8800gt 原来换ac2奶是 55度玩游戏 室温30-32度
      现在同样功率的1660s 我退的耕升直接80度。可想
      当然超能测试耕升1660s 和我买的是一块,超能的数据还好呢 25度FURMARK 71 我是23度 furymark 80-83度。噪声忍不了。
      不过测试功率我发现。耕升的1660s 实际最大稳定功率在140w-150w间。待机是30w furymark是170w

      支持(0)  |   反对(0)  |   举报  |   回复

      16#

    • 游客  2020-05-15 09:32

      游客

      30度温度不错 50度温度很高 60度太热 70度受不了。Y神对温度的看法。实际在吹一波显卡而已和温度没有什么关系、
      2020-05-14 21:46
    • 支持(3)  |   反对(0)  |   举报  |   回复
    • 1660s都成吹显卡了啊

      支持(0)  |   反对(0)  |   举报  |   回复

      15#

    • 游客  2020-05-15 08:33

      vigo93 一代宗师

      采用三星10nm改名8nm 坐等核弹爆炸
      2020-05-14 20:41 已有5次举报
    • 支持(0)  |   反对(5)  |   举报  |   回复
    • 然而只会把你主子炸了

      已有1次举报

      支持(2)  |   反对(0)  |   举报  |   回复

      14#

    • yjhercules终极杀人王 2020-05-15 08:24    |  加入黑名单

      游客

      30度温度不错 50度温度很高 60度太热 70度受不了。Y神对温度的看法。实际在吹一波显卡而已和温度没有什么关系、
      2020-05-14 21:46
    • 支持(3)  |   反对(0)  |   举报  |   回复
    • 1660super退了,太热。耕升。22 度室温。烧furmark
      1024*768 跑了了80度。裸机。
      目前正在考虑买哪个1660s 索泰还是evga 还是映众
      当然 也赖NVIDIA 1660s的扣具孔距 我目前测量的结果查
      51*51 索泰说是59*59
      这全是不标准的扣具孔距,反倒是2060 公版表示显示为53*53
      目前1660super 最多是2热管。也是醉了。我大4热管的ac 怎么放呢
      升级1660super之后的计划是1060 全拆换上利民6热管萨满玩玩

      已有9次举报

      支持(0)  |   反对(2)  |   举报  |   回复

      13#

    • 游客  2020-05-14 22:58

      花屏解决了吗

      已有1次举报

      支持(0)  |   反对(2)  |   举报  |   回复

      12#

    • 游客  2020-05-14 22:13

      然并卵

      支持(0)  |   反对(0)  |   举报  |   回复

      11#

    • 我匿名了  2020-05-14 21:46

      游客

      我想知道Y神是怎么做到用了一年后以发热量大散热不行这种理由退货的,何况还是1660这种120W的卡
      2020-05-14 21:44
    • 支持(0)  |   反对(0)  |   举报  |   回复
    • 30度温度不错 50度温度很高 60度太热 70度受不了。Y神对温度的看法。实际在吹一波显卡而已和温度没有什么关系、

      支持(3)  |   反对(0)  |   举报  |   回复

      10#

    • 游客  2020-05-14 21:44

      我想知道Y神是怎么做到用了一年后以发热量大散热不行这种理由退货的,何况还是1660这种120W的卡

      支持(0)  |   反对(0)  |   举报  |   回复

      9#

    • 游客  2020-05-14 21:41

      yjhercules 终极杀人王

      该评论因举报过多,自动进入审核状态。

      用了1年退货,您可真是咱冢

      支持(4)  |   反对(0)  |   举报  |   回复

      8#

    • 游客  2020-05-14 21:29

      该评论因举报过多,自动进入审核状态。

      7#

    • 我匿名了  2020-05-14 21:13

      游客

      其实这次首发价格是好几年以来“最低”的了。
      大家只需要翻一下以前的首发定价(按电商报价为准,并且需要考虑当时汇率),在同级产品升级性能的前提下,这次的“NV汇率”几乎是虚高最少的。且NV高低端芯片组几乎是首发马上一起上市,加上散片2080ti直接上来就来报了个低价,这是多少年没试过的境况了?
      总之有竞争总是有好处的。
      2020-05-14 20:14 已有1次举报
    • 支持(1)  |   反对(2)  |   举报  |   回复
    • ???那是2080TI首发就花屏不得不降价。

      支持(0)  |   反对(0)  |   举报  |   回复

      6#

    • 游客  2020-05-14 20:44

      Navi10晶体管密度41,GA100晶体管密度64,这密度提升难道是5nm?

      支持(0)  |   反对(0)  |   举报  |   回复

      5#

    • vigo93一代宗师 2020-05-14 20:41    |  加入黑名单

      采用三星10nm改名8nm 坐等核弹爆炸

      已有5次举报

      支持(0)  |   反对(5)  |   举报  |   回复

      4#

    • yjhercules终极杀人王 2020-05-14 20:27    |  加入黑名单

      该评论因举报过多,自动进入审核状态。

      3#

    • 我匿名了  2020-05-14 20:14

      其实这次首发价格是好几年以来“最低”的了。
      大家只需要翻一下以前的首发定价(按电商报价为准,并且需要考虑当时汇率),在同级产品升级性能的前提下,这次的“NV汇率”几乎是虚高最少的。且NV高低端芯片组几乎是首发马上一起上市,加上散片2080ti直接上来就来报了个低价,这是多少年没试过的境况了?
      总之有竞争总是有好处的。

      已有1次举报

      支持(1)  |   反对(2)  |   举报  |   回复

      2#

    • QQ23870862终极杀人王 2020-05-14 20:02    |  加入黑名单

      2代卡降价清货不?

      已有4次举报

      支持(0)  |   反对(0)  |   举报  |   回复

      1#

    提示:本页有 1 个评论因未通过审核而被隐藏

    登录 后发表评论,若无帐号可 快速注册 ,请留意 评论奖罚说明
    为你推荐