E X P
本文约 2390 字,6 张图表,正努力加载…
  • 编辑
  • 评论
  • 标题
  • 链接
  • 查错
  • 图文
  • 拼 命 加 载 中 ...

    微软于昨晚正式宣布推出DirectX 12的最新升级版——DirectX 12 Ultimate,这可以说是DirectX 12从2015年正式上线以来最为重大的一次更新,它加入了许多新的特性,实际上其中的部分特性已经在去年十月份已经预告过了,原本它应该会作为Direct3D 12 Feature Levels 12_2出现的,不过这次微软改名部上线了,给新版本DirectX 12加了个“Ultimate”的后缀,那今后比DirectX 12 Ultimate更强的新版本会叫什么呢?


    以后支持DX12 Ultimate的产品在包装盒上可能会增加这个Logo

    好了话说回来,官方在博文中给出了有关于新特性的一些详细内容,本文就尝试解读一番。

    首先DirectX 12 Ultimate中新增的特性主要有四大块,分别是DirectX Raytracing 1.1可变速率渲染Mesh渲染器采样器反馈(Sampler Feedback)。

    DirectX Raytracing 1.1

    DirectX Raytracing(DXR)是微软在2018年为DirectX 12引入的新特性,让它支持实时光线追踪处理。1.0版本的DXR在软件特性上比较基础,可以说它是围绕着Turing架构的硬件实现而设计的,当时也没有从软件开发角度去考虑如何实现光追。而1.1版本扩展了DirectX 12在光线追踪方面的软件特性,让它的效率更高,同时对开发者也更友好。主要有三点:

    允许GPU直接调用光追

    跑在GPU上面的着色器在1.1版本中可以直接调用光线追踪,而无需折返CPU来调用。这项功能对于自适应光线追踪场景非常有用,尤其是在基于着色器实现的剔除、排序、分类和细化等场景中。基本上今后的光线追踪工作可以在GPU上面准备并立即生成。

    按需加载光线追踪着色器

    当玩家在游戏世界中移动、新的物件变为可见的过程中,流式引擎可以根据此时的画面需求来加载新的光线追踪着色器,提高处理过程的效率。

    内联光线追踪

    内联光线追踪(Inline raytracing)是目前基于动态着色器的光线追踪的一种替代形式,你可以将其理解为一种简化的光线追踪。开发者在内联光线追踪过程中将有更大的控制权,并且可以在任意的着色阶段调用它,包括计算着色和像素着色阶段。它与传统基于动态着色器的光线追踪可以混合使用,对于简单的场景,内联光线追踪将会提供更好的性能表现,而在复杂场景中,基于动态着色器的光线追踪将会提供更好的运行效果。

    可变速率着色

    可变速率渲染(Variable Rate Shading)是一项由NVIDIA在其Turing GPU上率先引入的加速着色特性,具体介绍可以看我们的课堂文章:《超能课堂(212):VRS可变速率着色为什么可以提高帧数?》,这边就简单讲一下它的原理,而不再赘述细节了。

    简单来说,VRS的原理是通过改变单次像素着色器操作所处理的像素数量,来改变屏幕不同区域的着色质量。简单来说,它可以改变同个画面中不同部分的渲染精细度,它的用处是提高画面帧数

    在不开启VRS的情况,也就是正常情况下,一帧画面的所有像素都是独立着色的;而开启VRS之后,原本独立的像素被分成了一个个像素块,它们会共享着色结果,此时GPU会根据程序员设定的重要性分级为所有像素块分配不同的着色精细度。拿上面的图片为例,车辆和远景部分的像素仍然是独立着色的,但快速变动的道路和路边的像素块就是区块共同着色的,此时由于显卡的计算资源得到了节约,所以游戏的帧数会有所提高。

    在NVIDIA以外,Intel已经在Ice Lake处理器中的第11代核显中加入了针对VRS的支持,而AMD方面则暂时没有相关支持,不过他们也已经宣布将会在RDNA 2架构中加入相关支持。

    Mesh着色器:下一代几何处理管线的基础

    在过去的二十年中,传统的几何图形处理管线已经增加了好几个阶段了,不过它的核心理念仍然基于传统的光栅化预着色方法的,放在今天已经过于复杂,并且拖累处理效率。硬件和软件开发者都希望改变这一现状,于是,DirectX 12引入了Mesh着色器,它为开发者提供了前所未有的可编程能力。

    原本的管线中,GPU硬件的并行能力被隐藏,或者说是被自动化了,硬件会帮助打包操作然后并行执行它,这很高效,但也存在问题——灵活性不够。

    Mesh着色器就完全改变了这一过程,它不再是针对单一顶点或图元的单一函数,而是工作在整个计算线程组中。在某一阶段中,Mesh着色器的每个线程都是针对一个顶点,而在另外一个阶段,每个线程针对着一个图元。整个线程组的内存是共享的,访问灵活度很高,同时开发人员对硬件的控制权也更大,甚至还能启发新的技术,节约内存使用量和内存带宽。

    与Mesh着色器一同出现的还有一个可选的放大着色器(Amplification Shader)阶段,它运行在Mesh着色器之前,计算得到需要多少个Mesh着色器,并启动他们。

    采样器反馈

    最后一个大特性就是采样器反馈(Sampler Feedback),先说效果:更好的视觉质量、更短的加载时间和更少的卡顿。它的核心思想实际上就是让程序只加载必要的纹理,把资源交给更有需要的地方。

    采样器反馈是允许游戏引擎去跟踪纹理采样器的使用方式,让后者向引擎提供反馈,方法是生成“反馈图(Feedback Map)”,它会记录不同纹理区域的不同驻留等级,然后程序可以根据这些反馈信息来做决策——包括该如何使用纹理采样器和要在显存中保留哪些资源等。这比原先的流程更为精确,可以更好地分配计算资源。简单来说它的实际效果就是用更少的显存渲染更大、更详细的纹理

    另外,采样器反馈还允许了一项新技术——纹理空间着色。它可以在不栅格化对象的情况下进行对象着色,其中心目的就是缓存和重用着色结果,减少GPU的计算量。

    总结:面向新图形架构和下世代主机

    在微软推出DirectX 12 Ultimate之后,NVIDIA和AMD就迅速地宣布已经/将要支持它,实际上,DirectX 12 Ultimate的绝大部分新特性可以说是基于Turing架构来的,NVIDIA在设计Turing架构时可能预留了相当部分的新特性是没有公开的。而AMD方面在目前只能说是一个跟进者,要用上新特性,首先要等到年底的RDNA 2架构。

    DirectX 12 Ultimate的这些特性很明显有两个共通的目标,一是提高开发者对硬件的控制力,二是提高总体计算效率。这也是为下世代主机——Xbox Series X和传说中的Xbox Series S所准备的,很难说我们要等多长时间才能看到这些特性被应用到实际游戏中去——至少今年是看不到的,需要等引擎开发商、游戏开发者对新世代主机做适配或者做专门性的开发后,我们才能在PC游戏中也看到这些技术的运用。

    以上就是DirectX 12 Ultimate的详细解读,由于我不是业内人员,对这些特性的理解也只是点到为止,难免存在认知错误,敬请读者指正。

    ×
    热门文章
    1超能课堂(223):手机内存都已经16GB了,PC的8GB内存还够用吗?
    2华为发布2020款MateBook X Pro:1TB固态仅需加价3000元
    3多项收费“吃相难看”、安卓/iOS价格歧视……11家音视频网站被约谈
    4Zen 3桌面版,代号Vermeer的Ryzen 4000系列可能会在九月份登场亮相
    5华为2020款Matebook X Pro默默升级到十代处理器,首发还优惠卖
    6联发科处理器被抓跑分“作弊”:P95性能比天玑1000L还高
    7Fractal Design推出Celsius+系列一体式水冷散热器,全面升级ARGB
    8联发科、三星或将成为华为5G基带芯片供应商
    9SK海力士推出PE8000系列企业级低功耗PCIe 4 SSD
    已有 45 条评论,每一条合规评论都是对我们的褒奖。
    • 游客 03-24 19:47

      NightView 博士

      光追没用?战地5光追出来多久了??至于效果大家都有目共睹:
      www.bilibili.com/video/av65045439
      www.bilibili.com/video/av64621848
      www.bilibili.com/video/av76713499
      www.bilibili.com/video/av61231219
      一些瞎子继续当鸵鸟把头埋沙子里面自欺欺人吧

      反倒是PCIE4.0才是毫无屁用,所谓的PCIE4.0显卡性能照样被2080、2080Super、2080Ti、Titan RTX等等N卡按在地上各种摩擦
      这PCIE4.0带来什么能实际感受得到的性能进步了?PCIE4.0主板一出来价格高达1500以上,而Z390只要700左右就能买到,这价格差距明摆着的。更不用说9600KF+Z390套装现在也就1800出头,超5G游戏性能比所谓的PCIE4.0主板+3900X强一截,甚至3950X也斩落马下
      03-23 19:20 已有3次举报
    • 支持(1)  |   反对(1)  |   举报  |   回复
    • 不是很懂你要表达什么,游戏画面本身不错开和没开光追几乎只能看出一毛线差别,对于大部分人来说不告诉你开了光追还真以为关闭了光追的画面是开了光追的, 看评论下面还有几个朋友 ...

      支持(1)  |   反对(0)  |   举报  |   回复

    • NightView博士 03-23 19:20

      游客

      话不是这么说的。光追游戏在当时确实没什么用,宣传得天花乱坠显卡特别贵买到手没游戏玩现在有也没看出特别的地方,4.0是一出来就能用的最起码相对友商的3.0主板来说没多花钱,现在 ...
      03-22 22:26 已有1次举报
    • 支持(2)  |   反对(1)  |   举报  |   回复
    • 光追没用?战地5光追出来多久了??至于效果大家都有目共睹:
      www.bilibili.com/video/av65045439
      www.bilibili.com/video/av64621848
      www.bilibili.com/video/av76713499
      www.bilibili.com/video/av61231219
      一些瞎子继续当鸵鸟把头埋沙子里面自欺欺人吧

      反倒是PCIE4.0才是毫无屁用,所谓的PCIE4.0显卡性能照样被2080、2080Super、2080Ti、Titan RTX等等N卡按在地上各种摩擦
      这PCIE4.0带来什么能实际感受得到的性能进步了?PCIE4.0主板一出来价格高达1500以上,而Z390只要700左右就能买到,这价格差距明摆着的。更不用说9600KF+Z390套装现在也就1800出头,超5G游戏性能比所谓的PCIE4.0主板+3900X强一截,甚至3950X也斩落马下

      已有3次举报

      支持(1)  |   反对(1)  |   举报  |   回复

    • onelite教授 03-22 23:21

      天衣无缝II 终极杀人王

      我只想知道什么时候,哪种情况下可以享受到这么好的技术。
      另外,用户需要安装什么软件,怎么设置才可打开这好东西。

      不说以上的内容,其它说多都没用。
      03-22 07:13 已有2次举报
    • 支持(2)  |   反对(1)  |   举报  |   回复
    • 硬件:A卡等RDNA2发布、N卡RTX 20XX
      软件:Windows 10 v2004(20H1)
      剩下的就是游戏开发商用不用、什么时候用、用的程度和技术如何了。

      支持(8)  |   反对(0)  |   举报  |   回复

    • 游客 03-22 22:26

      洋仔小次郎 初中生

      嗯,AMD:光追看不出区别没用,看到RDNA2光追demo,AMD:虽然看着没老黄的星战效果好,但是不能这么打脸,要收句真香
      03-22 21:30 已有2次举报
    • 支持(2)  |   反对(1)  |   举报  |   回复
    • 话不是这么说的。光追游戏在当时确实没什么用,宣传得天花乱坠显卡特别贵买到手没游戏玩现在有也没看出特别的地方,4.0是一出来就能用的最起码相对友商的3.0主板来说没多花钱,现在 ...

      已有1次举报

      支持(2)  |   反对(1)  |   举报  |   回复

    • 洋仔小次郎初中生 03-22 21:30

      游客

      pcie4.0明显有用啊,不够显存的时候通过4.0读取内存性能高得很,4.0SSD也快得很呢, 光追游戏开和没开一般人看不出来你说你是不是花了钱还找安慰非要吹
      03-22 14:46 已有1次举报
    • 支持(1)  |   反对(1)  |   举报  |   回复
    • 嗯,AMD:光追看不出区别没用,看到RDNA2光追demo,AMD:虽然看着没老黄的星战效果好,但是不能这么打脸,要收句真香

      已有2次举报

      支持(2)  |   反对(1)  |   举报  |   回复

    • 游客 03-22 16:38

      感觉明年显卡可能要进入飞速发展十代,每年性能提升40%不是梦了

      支持(0)  |   反对(0)  |   举报  |   回复

    • 游客 03-22 16:02

      游客

      其实对于CPU部分,zen也只是让AMD回归正常并没有反转,因为ZEN出来前也是在挤牙膏,ZEN出来后只是一下把之前的牙膏一下挤出来
      03-22 15:53
    • 支持(1)  |   反对(1)  |   举报  |   回复
    • 新批次的zen2 体质都提高了。感觉又可以再测一次的节奏

      支持(0)  |   反对(0)  |   举报  |   回复

    • 游客 03-22 15:53

      其实对于CPU部分,zen也只是让AMD回归正常并没有反转,因为ZEN出来前也是在挤牙膏,ZEN出来后只是一下把之前的牙膏一下挤出来

      支持(1)  |   反对(1)  |   举报  |   回复

    • 游客 03-22 14:55

      游客

      照你这么说挺像那些说pci4.0没用的
      03-21 17:45 已有2次举报
    • 支持(1)  |   反对(1)  |   举报  |   回复
    • 就算PCIE4.0一般人用不到也没有因为这个卖得贵,总比卖个PCIE3.0还自信得比卖PCIE4.0的贵。 按你这么说白送都不要,加价买的你才要咯,恕我直言脑子希望你有

      支持(1)  |   反对(0)  |   举报  |   回复

    • 游客 03-22 14:46

      游客

      照你这么说挺像那些说pci4.0没用的
      03-21 17:45 已有2次举报
    • 支持(1)  |   反对(1)  |   举报  |   回复
    • pcie4.0明显有用啊,不够显存的时候通过4.0读取内存性能高得很,4.0SSD也快得很呢, 光追游戏开和没开一般人看不出来你说你是不是花了钱还找安慰非要吹

      已有1次举报

      支持(1)  |   反对(1)  |   举报  |   回复

    • 游客 03-22 10:59

      洋仔小次郎 初中生

      照你这逻辑,Ati红√卖身后一直还是老样子,买N卡的人还是多,是不是A√都是嘴上吹A卡实际去买了N卡,黑A论最多的就是A√,不信自己去看看
      03-21 19:30 已有7次举报
    • 支持(1)  |   反对(5)  |   举报  |   回复
    • 这引战号又是谁的马甲小号?这网站的回复越来越没品味,今年经济铁定扑街,置换电脑的人只会少不会多,请问这位囤足狗粮了没? ...

      已有1次举报

      支持(1)  |   反对(0)  |   举报  |   回复

    • yjhercules终极杀人王 03-22 09:04

      还算不错, 跟dx9 a b c 差不多
      dx11 dx11。1 dx10 dx10。1

      做为一个 升级就是

      已有3次举报

      支持(0)  |   反对(1)  |   举报  |   回复

    • 天衣无缝II终极杀人王 03-22 07:13

      我只想知道什么时候,哪种情况下可以享受到这么好的技术。
      另外,用户需要安装什么软件,怎么设置才可打开这好东西。

      不说以上的内容,其它说多都没用。

      已有2次举报

      支持(2)  |   反对(1)  |   举报  |   回复

    • 洋仔小次郎初中生 03-21 19:30

      照你这逻辑,Ati红√卖身后一直还是老样子,买N卡的人还是多,是不是A√都是嘴上吹A卡实际去买了N卡,黑A论最多的就是A√,不信自己去看看

      已有7次举报

      支持(1)  |   反对(5)  |   举报  |   回复

    • 游客 03-21 19:00

      该评论因举报过多,自动进入审核状态。

    • 洋仔小次郎初中生 03-21 18:12

      该评论因举报过多,自动进入审核状态。

    • 游客 03-21 18:06

      RDNA1冤大头,一项都不支持

      支持(7)  |   反对(0)  |   举报  |   回复

    • 游客 03-21 17:45

      游客 一代宗师

      说话都要看时效性的,当时游戏确实没用硬件跟不上游戏跟不上。
      03-21 17:21 已有2次举报
    • 支持(2)  |   反对(1)  |   举报  |   回复
    • 照你这么说挺像那些说pci4.0没用的

      已有2次举报

      支持(1)  |   反对(1)  |   举报  |   回复

    • 游客一代宗师 03-21 17:21

      洋仔小次郎 初中生

      该评论因举报过多,自动进入审核状态。

      说话都要看时效性的,当时游戏确实没用硬件跟不上游戏跟不上。

      已有2次举报

      支持(2)  |   反对(1)  |   举报  |   回复

    • 洋仔小次郎初中生 03-21 13:04

      该评论因举报过多,自动进入审核状态。

    • 洋仔小次郎初中生 03-21 12:59

      该评论因举报过多,自动进入审核状态。

    • 游客 03-21 09:05

      该评论因举报过多,自动进入审核状态。

    • 倪嘉声编辑 03-20 23:32

      游客

      小编正好可以来篇科普文章,介绍一下二者个异同
      03-20 22:31
    • 支持(0)  |   反对(0)  |   举报  |   回复
    • 这个有点复杂,可能需要一定的时间才能出来

      支持(1)  |   反对(0)  |   举报  |   回复

    • 游客 03-20 22:31

      倪嘉声 编辑

      说马甲就过分了,两者在设计思路上面有趋同,但是实现是完全不同的。
      03-20 18:45
    • 支持(1)  |   反对(0)  |   举报  |   回复
    • 小编正好可以来篇科普文章,介绍一下二者个异同

      支持(0)  |   反对(0)  |   举报  |   回复

    • NightView博士 03-20 21:46

      该评论因举报过多,自动进入审核状态。

    • 洋仔小次郎初中生 03-20 20:55

      微软提到,DXR 1.1版本中有NVIDIA不小的功劳

      已有5次举报

      支持(1)  |   反对(3)  |   举报  |   回复

    • 倪嘉声编辑 03-20 18:45

      游客

      该评论因举报过多,自动进入审核状态。

      说马甲就过分了,两者在设计思路上面有趋同,但是实现是完全不同的。

      支持(1)  |   反对(0)  |   举报  |   回复

    • 游客 03-20 18:21

      该评论因举报过多,自动进入审核状态。

    • 游客 03-20 18:12

      元旦4599上的EVGA 2080 black车很惬意

      已有2次举报

      支持(0)  |   反对(0)  |   举报  |   回复

    • 游客 03-20 17:47

      和Vulkan比有什么优势吗,可以科普下Vulkan和dx12吗

      支持(1)  |   反对(0)  |   举报  |   回复

    提示:本页有 5 个评论因未通过审核而被隐藏

    加载更多评论

    我来评论
    为你推荐