E X P
本文约 2930 字,16 张图表,正拼命加载…
  • 编辑
  • 评论
  • 标题
  • 链接
  • 查错
  • 图文
  • 拼 命 加 载 中 ...

    今天不管对DIY硬件业界还是对游戏业界来说,都是个大日子,因为NVIDIA发布了新一代在性能上有巨大飞跃的RTX 30系显卡。首批的三张显卡在性能方面可谓是有着非常大的提升,就算其中定位最低的RTX 3070在官方宣传口径中都能有超过上一代旗舰卡RTX 2080 Ti的性能。那么,RTX 30系显卡是如何做到如此巨大的性能提升幅度的呢?本文就基于官方目前给出的信息对RTX 30系显卡的核心,也就是代号为Ampere的GPU进行简要的分析,由于官方尚未给出新一代显卡的白皮书,故本文只能挖掘到较为浅层的一些信息。

    相关文章:
    NVIDIA正式发布新一代GeForce RTX 30系列显卡:性能爆炸,价格惊喜
    与RTX 30系显卡一同登场的各种黑科技汇总:AI技术已经来到我们身边
    [视频] 5分钟看完NVIDIA RTX 30系列GPU发布会!
    [视频] 初谈刚发布的NVIDIA RTX 30系列显卡!7家AIC厂商聊他们的看法!

    Turing架构是NVIDIA的初代RTX架构,它首次引入了RT Core,并升级了从Volta架构开始引入的Tensor Core。

    它的意义在于将整个GPU的处理管线分成多个部分,早前的GPU只需要全力渲染画面即可,而在引入实时光线追踪特效之后,GPU中的处理核心需要分心去算光线追踪特效,偏偏这部分又非常吃算力,会让传统的GPU浪费非常多的算力。

    于是NVIDIA想到为实时光线追踪引入独立的硬件处理管线,也就是RT Core。但在开启实时光线追踪的情况下,单靠RT Core在那边加速仍然没法达成高帧数的目标,所以NVIDIA研发了DLSS技术,也就是利用机器学习,通过AI升频的方式将低分辨率的游戏图像实时处理成高分辨率的图像输出。因为降低了实际的渲染分辨率,所以大幅减轻了GPU的计算压力,从而达成开启实时光追下的流畅游戏。

    但是,Turing显卡的一大问题就是计算规模不够大,老黄在发布上也很坦诚的说,开了光追的Turing显卡表现和没开光追的Pascal差不太多(从图上甚至可以看到GTX 1080 Ti在非光追情况下的表现要优于光追场景下的RTX 2080 Super)。但是Turing GPU的工艺已经不允许NVIDIA往里面塞入更多的计算单元了,那么,是时候换工艺了。

    与A100加速卡上那枚使用台积电N7工艺的GA100芯片不同的是,NVIDIA选择和三星合作,定制了基于三星8nm工艺的制程,称为Samsung 8N(N for NVIDIA)。在面积最大的GA102芯片中,NVIDIA塞入了280亿个晶体管,这个数字是TU102的1.5倍,但仍然比面向计算用途的GA100少很多(542亿)。

    这多出来的1.5倍晶体管主要被用在加倍FP32单元上,从NVIDIA官网上的对比表我们即可看到这一明显的区别点。

    以往在NVIDIA的GPU中,一个CUDA Core对应一个FP32计算单元,在Turing GPU上面,NVIDIA加入了独立的整数计算单元,它与传统FP32计算单元的比例是1:1,到了Ampere上,因为对算力有非常高的需求,NVIDIA直接选择把FP32单元的数量暴力翻倍。并且官方并没有采用一个CUDA Core对应两个FP32单元的计数方式,仍然保留了1:1的算法,所以我们看到了CUDA核心数量暴涨的一代显卡,下表对几代同级显卡的CUDA核心数量进行了对比:

    注:Ampere显卡的INT单元数量暂时按照1:2的比例计算。

    从上表中我们可以感受到RTX 30显卡在计算规模上的暴增,不过这只是它性能增幅来源的一个部分。NVIDIA还引入了第二代RT Core和第三代Tensor Core。新的RT Core在处理光线追踪相关的计算时,可达到初代RT Core的1.7x效率,而GA100的同款Tensor Core则带来了2.7x的AI性能提升。

    另外不得不提的还有新的显存。RTX 3080和RTX 3090都使用了来自于美光的GDDR6X显存,在显存带宽上逼近1TB/s的大关。这多个方面拼合到一起,让RTX 30系列显卡拥有了暴涨的性能表现。


    第二代RT Core让RTX 30显卡在越复杂的实时光追场景下有更高的性能增幅

    总的来看,Ampere GPU在能耗比上达成了一个1.9x的进步,在半导体制程提升日益困难的今天,这个进步幅度已经算是不小了。但是从上图我们也需要注意到,Ampere显卡在功耗上将会比Turing显卡去到更高的地步。

    再来详细谈一谈这次发布的三张显卡。

    首先是RTX 3080,官方将其作为旗舰卡,而不是RTX 3090。官方标称它有2倍于RTX 2080的性能。

    就算单看RTX 3080的CUDA核心数量,我也会信NVIDIA的说法,毕竟它有着三倍于RTX 2080的CUDA核心数量。但是这也带来了一个问题,三倍于RTX 2080的CUDA核心数量为什么只能带来两倍的性能?这个问题只能等到官方公布显卡白皮书的时候才能知晓了。

    RTX 3080香不香?当然了,同样的起售价给你两倍的性能,能不让人高喊“NVIDIA YES”吗?但各位准备买新显卡的朋友需要注意两个问题,一个是供电,另一个是新卡的体积。

    三星的8nm制程实际上是10nm的改良版,给GPU带来的省电效果是比从TSMC N16跨越到N7差得远了。庞大的GPU规模带来的必然是能耗和发热的大幅增加,公版的RTX 3080的标称TGP达到了320W,同时其GPU最高限温被抬高到了93℃。原本GPU的瞬时功耗就要比标称的TGP高上不少,现在基数都高了很多,那瞬时功耗还不得上天?这就给电源带来了很大的挑战,首先是瓦数要高,750W可能只能算是底线,上850W会更好,另外是电源的品质要好,能够应付新显卡的超高瞬时功率。那么功耗高了,发热量当然也会上去,这带来了第二个问题,为了即时散去热量,显卡厂商需要升级散热器,增大鳍片、加多风扇叶片数量这些都是常规操作了,自然会带来散热器体积的增加,进而增加了显卡整体的体积。官方给公版RTX 3080的标称厚度是双槽,不过就我们手上的显卡和今晚AIC们的发布来看,新显卡占到三槽的可以说是比比皆是。

    再来说说大家都爱的RTX 3070。如果说RTX 2070是一代坑爹卡的话,那么这次的RTX 3070可以说是回归系列定位初心的一张卡。让我们回想一下,当年的各种x70显卡提供的是什么?是次旗舰级别的性能表现和平近易人的价格,最经典的就是GTX 970和GTX 1070 Ti了。那么这次的RTX 3070在性能上虽然仍被拉开了一个身位,次旗舰级别的性能表现无从谈起,但如果进行代际之间比较的话,它是比RTX 2080 Ti略强一点点的,换句话说,你可以用4000块钱买到一张RTX 2080 Ti级别的显卡,想想之前RTX 2080 Ti卖到多少吧。唯一的一个问题是,它仍然只有8GB的显存,在未来的4K游戏普及时代,这点显存可能会出现不够用的情况。

    再说说这次的卡皇RTX 3090。老黄用了“BFGPU”这个自造缩写来描述这款显卡。它瞄准的,已经不再是简单的4K游戏,而是更高层次的8K游戏,而且一做,就要做到8K60。当然,这个目标是要通过DLSS技术来实现的,但也足以让人们惊叹了。24GB的显存也让它很适合用来当成一张创作卡,或者说,准专业卡。 最后,¥11999的售价看上去不怎么亲民,但想想上一代Titan RTX的定价……足够让人发自肺腑的说一句,老黄良心啊。

    当然,老黄是不是真的良心,我们抱持怀疑态度,因为这次的RTX 30系显卡采取如此有性价比的定价方案可能是受到AMD方面的压力了,RDNA 2可能真的不是省油的灯,所以NVIDIA需要通过提前布局市场来防范对手。

    好了,以上就是我个人对Ampere架构和首发游戏卡的快速分析,如有看法可以在评论区讨论。

    ×
    热门文章
    1NZXT H1机箱存在安全隐患,官方准备提供简易维修套件
    2传言《极限竞速:地平线5》将于2021年问世:或是赛车游戏画质新标杆
    3三星的真无线耳机也会更“专业”了,将推出带主动降噪的Galaxy Buds Pro
    已有 156 条评论,每一条合规评论都是对我们的褒奖。
    登录快速注册 后发表评论
    • 这些评论亮了
    • 游客 09-02 19:24

      yjhercules你好!我是天津市精神疾病健康研究中心的主治医生,主攻脑残方向的研究与治疗。我院领导看到你的发表的评论以后高度重视你的情况,特派我来帮你摆脱病魔的困扰。希望你相信医生,配合我们工作,精神疾病可防可控可治,你要树立起坚强的信心,我们一定会使你走出阴影,过上正常人的生活。

      已有8次举报

      支持(72)  |   反对(4)  |   举报  |   回复

    • 游客 10-26 19:33

      我有话要说...

      支持(0)  |   反对(0)  |   举报  |   回复

    • 清风道士学前班 09-16 16:12  加入黑名单

      坐等4060秒杀3080…………

      支持(0)  |   反对(0)  |   举报  |   回复

    • 游客 09-11 13:12

      游客

      讨论的这么激烈,看来大家都很有钱啊,羡慕死了,我还是等着3060的消息吧
      09-10 09:43
    • 支持(4)  |   反对(0)  |   举报  |   回复
    • 看来你也有钱啊 我们只有唾沫星子的钱 你到能买3060了 你个龟孙 看不起云玩家?

      已有1次举报

      支持(0)  |   反对(0)  |   举报  |   回复

    • 游客 09-10 09:43

      讨论的这么激烈,看来大家都很有钱啊,羡慕死了,我还是等着3060的消息吧

      支持(4)  |   反对(0)  |   举报  |   回复

    • 游客 09-04 22:51

      cnwjlb2019 教授

      该评论因举报过多,自动进入审核状态。

      别xjb爆主机圈大腿引战了

      支持(2)  |   反对(0)  |   举报  |   回复

    • 游客 09-04 22:30

      现在近六十了,不玩游戏 gt610够用 性能过剩

      支持(0)  |   反对(0)  |   举报  |   回复

    • 游客 09-04 15:46

      该评论因举报过多,自动进入审核状态。

    • cjgbd高中生 09-04 11:07  加入黑名单

      游客

      从头到尾都没提过任何单精度浮点能力,只说了光追涨幅,其实整体性能依然是个未知数
      09-03 09:34 已有2次举报
    • 支持(5)  |   反对(8)  |   举报  |   回复
    • 我如果没看错的话,发布会说的是2080super的着色器性能是11T,而3080的着色器是30T

      已有1次举报

      支持(2)  |   反对(2)  |   举报  |   回复

    • 游客 09-04 00:37

      游客

      从头到尾都没提过任何单精度浮点能力,只说了光追涨幅,其实整体性能依然是个未知数
      09-03 09:34 已有2次举报
    • 支持(5)  |   反对(8)  |   举报  |   回复
    • 单精度浮点是最不值得说的,你看sp数量的增幅就知道了
      反倒是效率比较让人担心,像当年kepler,780ti比680的sp数接近翻倍,性能只提升50% ...

      支持(4)  |   反对(0)  |   举报  |   回复

    • 游客 09-03 19:46

      游客

      不会吧不会吧 今天难得用下匿名就成了别人啦?搜下豿这个用字哪个号用得多。。。啧啧啧
      09-02 16:57
    • 支持(0)  |   反对(1)  |   举报  |   回复
    • 小号多就是好啊,可以随便切换角色,一会儿装客观装高玩,一会儿做满口污言秽语的暴民

      支持(3)  |   反对(0)  |   举报  |   回复

    • yjhercules终极杀人王 09-03 13:46  加入黑名单

      该评论因举报过多,自动进入审核状态。

    • 游客 09-03 12:57

      vigo93 一代宗师

      该评论因举报过多,自动进入审核状态。

      上帝真是太残忍了,居然忘记给你长眼睛了

      已有1次举报

      支持(3)  |   反对(0)  |   举报  |   回复

    • vigo93一代宗师 09-03 11:50  加入黑名单

      该评论因举报过多,自动进入审核状态。

    • 游客 09-03 10:14

      游客

      我认为4k游戏,3070会受到显存影响,真玩4K还得买3080,或者等高显存版本的3070(super or ti)
      09-03 09:51 已有1次举报
    • 支持(1)  |   反对(1)  |   举报  |   回复
    • 3070的定位本来就是2K游戏好不,玩4K自然80系列起步

      已有1次举报

      支持(2)  |   反对(0)  |   举报  |   回复

    • 游客 09-03 09:51

      游客

      自己看吧 只有个别4k游戏80ti 80s才有30%差距 平均也就20% 老黄ppt真的不能信 到时看评测呗 真有2080ti性能你叫那些玩家怎么想?
      09-02 18:27 已有7次举报
    • 支持(2)  |   反对(5)  |   举报  |   回复
    • 我认为4k游戏,3070会受到显存影响,真玩4K还得买3080,或者等高显存版本的3070(super or ti)

      已有1次举报

      支持(1)  |   反对(1)  |   举报  |   回复

    • 游客 09-03 09:49

      QQ23870862 终极杀人王

      该评论因举报过多,自动进入审核状态。

      你又定义现代人了

      已有1次举报

      支持(7)  |   反对(0)  |   举报  |   回复

    • 游客 09-03 09:46

      为什么高端卡用三星8nm马甲工艺啊?

      已有1次举报

      支持(2)  |   反对(1)  |   举报  |   回复

    • 游客 09-03 09:34

      从头到尾都没提过任何单精度浮点能力,只说了光追涨幅,其实整体性能依然是个未知数

      已有2次举报

      支持(5)  |   反对(8)  |   举报  |   回复

    • 游客 09-03 08:56

      游客

      不会吧不会吧 今天难得用下匿名就成了别人啦?搜下豿这个用字哪个号用得多。。。啧啧啧
      09-02 16:57
    • 支持(0)  |   反对(1)  |   举报  |   回复
    • 你重新定义了无耻这个字

      支持(0)  |   反对(0)  |   举报  |   回复

    • 游客 09-03 08:52

      游客

      不会吧不会吧 今天难得用下匿名就成了别人啦?搜下豿这个用字哪个号用得多。。。啧啧啧
      09-02 16:57
    • 支持(0)  |   反对(1)  |   举报  |   回复
    • 还在装,尾巴被踩到了吧,哈哈

      支持(0)  |   反对(0)  |   举报  |   回复

    • 游客 09-02 23:19

      roshad 高中生

      你和老光头就是镇站之宝,不懂为什么大家要举报你俩.
      09-02 22:52
    • 支持(6)  |   反对(0)  |   举报  |   回复
    • 现在要加上一个cnwjlb2019,这家伙以前评论区装客观,今天终于按耐不住摘下面具胡说八道了

      支持(5)  |   反对(0)  |   举报  |   回复

    • roshad高中生 09-02 22:52  加入黑名单

      yjhercules 终极杀人王

      该评论因举报过多,自动进入审核状态。

      你和老光头就是镇站之宝,不懂为什么大家要举报你俩.

      支持(6)  |   反对(0)  |   举报  |   回复

    • yjhercules终极杀人王 09-02 20:43  加入黑名单

      该评论因举报过多,自动进入审核状态。

    • 超能康猩猩教授 09-02 20:32  加入黑名单

      超能康猩猩 教授

      差不多就是这个意思,其实30系的SP就跟CPU开超线程一样,实际提升大概有30~40%,把30系列的SP数量除以2再加上“超线程”的提升,以及频率的提升,就可以得出一个接近目前透露的实际游戏提升的幅度。
      09-02 20:28
    • 支持(4)  |   反对(0)  |   举报  |   回复
    • 说漏了,是可以得出对比20系的提升幅度

      支持(2)  |   反对(0)  |   举报  |   回复

    • 超能康猩猩教授 09-02 20:28  加入黑名单

      凭栏听雨声 博士

      我来解答关于小编提到的为什么3080三倍CUDA数量于2080却在官方PPT里只有两倍提升
      外媒已有评测数据,3080在实际游戏中相比2080平均提升幅度在70-80%,远达不到CUDA数量对应的水准?是不是有些似曾相识?没错,Kepler相比Fermi正是CUDA翻了三倍但实际提升远远达不到相应幅度,真正原因在于仲裁机构没有得到加强,Ampere相比Turing只是单纯翻倍了FP32数量,由每SM单元64个翻倍到128个,但前端仲裁却和2080Ti一样都是68个(RT Core和Tensor Core数量也和2080Ti相同只是改进效率),这就导致了大量CUDA运算资源冗余,造成实际游戏无法发挥这么多CUDA的真正实力,而宣称的30TFlops也只是在理论测试中才能达到的,因为理论计算不需要依赖过多仲裁,但游戏不同
      既Kepler之后NV又一次走上了重计算轻仲裁的老路,但是有理由相信Hopper架构会大幅强化仲裁,FP32将恢复为每SM 64个,这样RT和TS单元数量翻倍,使得4080有望在CUDA数量没有大幅增长的情况下性能依旧吊打3080,同时光追和DLSS性能暴增
      09-02 15:56
    • 支持(11)  |   反对(0)  |   举报  |   回复
    • 差不多就是这个意思,其实30系的SP就跟CPU开超线程一样,实际提升大概有30~40%,把30系列的SP数量除以2再加上“超线程”的提升,以及频率的提升,就可以得出一个接近目前透露的实际游戏提升的幅度。

      支持(4)  |   反对(0)  |   举报  |   回复

    • zhaoyun980博士 09-02 20:24  加入黑名单

      3070不是应该和2070S对比吗?保不准以后也来个3070S?

      支持(0)  |   反对(0)  |   举报  |   回复

    • 波利斯博士 09-02 20:13  加入黑名单

      cnwjlb2019 教授

      该评论因举报过多,自动进入审核状态。

      呵呵。

      支持(1)  |   反对(0)  |   举报  |   回复

    • zhaoyun980博士 09-02 20:12  加入黑名单

      2070S用户哭晕在厕所

      支持(1)  |   反对(0)  |   举报  |   回复

    • QQ23870862终极杀人王 09-02 20:00  加入黑名单

      该评论因举报过多,自动进入审核状态。

    提示:本页有 4 个评论因未通过审核而被隐藏

    加载更多评论

    登录 后发表评论,若无帐号可 快速注册 ,请留意 评论奖罚说明
    为你推荐