RT Cores——实时光线追踪的“光剑”
Turing非常之多特性都传承于Volta架构,但Volta架构也能实现实时光线追踪。是因为RT Core这一特殊单元的加入,让Turing显卡实现计算机图形学的一大突破,Real-Time Ray Tracing实时光线追踪成为了可能。我们也在超能课堂——《RTX显卡支持的实时光线追踪是什么?》中详细地描述过实时光线追踪是怎么一回事,其效果就不说了,这绝对是Turing显卡的核心灵魂,也是架构的最大进步,以至于NVIDIA利用了非常大的篇幅来描述他们是怎么实现的。
不可否认光栅化在过去功劳,一直以较小的资源开销实现更逼真的光影场景效果,但事实上它是有不可解决的局限性,会在渲染出现违反物理现象的画面,但实时光线追踪是基于物理上的一种密集渲染方式来还原,不存在这缺点。这就是为什么NVIDIA坚持让显卡加入RT Core实现更逼真的游戏场景。正如我们的观点,光栅化与实时光线追踪不是对立的,NVIDIA也认为两者结合是最好的,也就是混合渲染,光栅化用于普通、需要高效处理的场景中,而光线追踪用于最具视觉效果的地方,比方说水面反射、镜子反射、玻璃折射等。
其实不能实现全光线追踪渲染的原因在于,目前显卡性能还达不到要求,因为考虑到场景复杂程度、分辨率、最终效果,不能指望说每个像素都能投射出数百条光线进行渲染计算,算力完全跟不上,只能在次要景物上“偷工减料”,减少投射的光线数目,由于样本数目太少,可能会因为蒙特卡洛积分近似求解中样本数量不足,导致画面会有大量噪点。NVIDIA通过针对极低样本数量的光线追踪结果进行实时降噪的研究,在GameWorks SDK中一个光线追踪降噪模块,也就是Denoising算法。最终可以用比较低样本的光线追踪应用到实时渲染中,最终渲染质量可以媲美大样本下的光线追踪收敛图像。
其实在没有RT Core帮助下,Pascal架构显卡也能实现光线追踪,但效率奇低。主要是因为BVH遍历的过程需要通过着色器操作来执行,并且每个光线投射需要数千个指令来计算BVH中的边界交叉点,直到最终击中三角形。你想想一个像素点有100条光线,一条光线需要数以万计的指令来完成计算,就这处理速度完全达不到实时光线追踪需求。
但RT Core 可以,其实它有点像是Tensor Core那样术业有专攻,只不过是专门为光线追踪计算服务的,实质上它是一条特异化的专用流水线,用于加速计算包围盒层级(BVH)遍历以及光线和三角求交。由于专项专用的ASIC都拥有非常高效的特性,不像CUDA这种通用单元,效率当然有平方级的提升。
RT核心包括两个专用单元:第一个进行包围盒分类计算,第二个进行射线三角求交计算
实现实时光线追踪最大问题就出在求交计算上,场景越复杂、物体数量越多,计算就越耗时间,要达到实时光线追踪,那就必须要得解决求交计算速度问题。高效的实时光线追踪实现主要是从BVH Traversal入手解决,BVH利用数据结构树形式对物体进行分门别类,不断细分。在计算时,光线会寻找被击中的第一个包围盒,再计算里面剩余包围盒,如此往复,直到最终的唯一三角形,。算法就可以大大减少计算每一条光线最近的交点所需要遍历的三角形的数量,在一次渲染中这个预处理只需要进行一次,就可以供所有光线使用。
因此一个SM单元中只需要配备一个RT Core即可,因为SM单元只是个引子,用于启动,剩下的工作全都交由RT Core处理,会自动计算执行BVH遍历以及光线和三角求交,并且向SM单元返回结果,从而节省SM单元执行的数以千计的指令。
同时SM单元可以自由地执行其他任务,比如是顶点生成、计算这色等。因此一个GPC单元中SM单元数目发生重大变化,有可能是与RT Core性能匹配相关,毕竟两者相辅相成,谁跑得太快或者太慢都是不行的。
最后RT Core还要配合GameWorks SDK的光线追踪降噪模块、RTX API等软件层面的协同工作,才能一张Turing显卡就能实现实时光线追踪。
最终RTX 2080 Ti每秒钟可以追踪10G条光线,78T的RTX-OPS;RTX 2080每秒追踪光线降低至8G条,RTX-OPS也降低至60T;RTX 2070每秒能追踪的光线只有6G条,45T RTX-OPS;而Pascal的游戏王者GTX 1080 Ti只能追踪1.1G条光线,RTX-OPS只有11.3T,RT Core性能是非常强劲的。
NVIDIA定义的RTX-OPS性能是这样计算的, RTX-OPS= TENSOR * 20% + FP32 * 80% + RTOPS * 40% + INT32 * 28%
RTX光线追踪效果对比(记住了RTX不一定代表实时光线追踪,还可能是支持DLSS):
游客 2019-07-16 21:16
该评论年代久远,荒废失修,暂不可见。
支持(59) | 反对(0) | 举报 | 回复
90#
超能网友博士 2018-12-27 21:28 | 加入黑名单
该评论年代久远,荒废失修,暂不可见。
支持(136) | 反对(1) | 举报 | 回复
88#
游客 2018-11-20 21:46
该评论年代久远,荒废失修,暂不可见。
支持(253) | 反对(0) | 举报 | 回复
87#
游客 2018-10-31 14:44
该评论年代久远,荒废失修,暂不可见。
支持(234) | 反对(0) | 举报 | 回复
85#
游客 2018-10-26 20:54
该评论年代久远,荒废失修,暂不可见。
支持(227) | 反对(1) | 举报 | 回复
84#
游客 2018-10-22 14:32
该评论年代久远,荒废失修,暂不可见。
支持(213) | 反对(0) | 举报 | 回复
82#
游客 2018-10-19 10:40
80#
游客 2018-10-15 04:23
该评论年代久远,荒废失修,暂不可见。
支持(72) | 反对(1) | 举报 | 回复
78#
游客 2018-10-15 02:45
该评论年代久远,荒废失修,暂不可见。
支持(20) | 反对(0) | 举报 | 回复
76#
游客 2018-10-14 07:38
该评论年代久远,荒废失修,暂不可见。
支持(20) | 反对(0) | 举报 | 回复
73#
游客 2018-10-13 07:04
该评论年代久远,荒废失修,暂不可见。
已有3次举报支持(31) | 反对(1) | 举报 | 回复
71#
超能网友教授 2018-09-20 15:59 | 加入黑名单
61#
游客 2018-09-20 12:23
53#
超能网友博士 2018-09-19 22:08 | 加入黑名单
23#
超能网友教授 2018-09-19 21:37 | 加入黑名单
14#
游客 2020-07-26 21:24
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
93#
游客 2020-05-02 01:18
该评论年代久远,荒废失修,暂不可见。
支持(0) | 反对(0) | 举报 | 回复
92#
游客 2019-10-17 04:23
该评论年代久远,荒废失修,暂不可见。
支持(19) | 反对(0) | 举报 | 回复
91#
游客 2019-07-13 16:49
该评论年代久远,荒废失修,暂不可见。
支持(1) | 反对(0) | 举报 | 回复
89#
游客 2018-11-20 21:24
该评论年代久远,荒废失修,暂不可见。
已有2次举报支持(6) | 反对(2) | 举报 | 回复
86#
游客 2018-10-25 23:31
该评论年代久远,荒废失修,暂不可见。
支持(14) | 反对(0) | 举报 | 回复
83#
游客 2018-10-20 03:55
该评论年代久远,荒废失修,暂不可见。
支持(10) | 反对(3) | 举报 | 回复
81#
游客 2018-10-15 04:27
支持(18) | 反对(0) | 举报 | 回复
79#
游客 2018-10-15 02:52
该评论年代久远,荒废失修,暂不可见。
支持(2) | 反对(1) | 举报 | 回复
77#
游客 2018-10-15 02:41
支持(19) | 反对(0) | 举报 | 回复
75#
超能网友教授 2018-10-14 13:27 | 加入黑名单
本评论因举报过多被折叠 [+]74#
游客 2018-10-14 07:36
支持(19) | 反对(1) | 举报 | 回复
72#
游客 2018-10-13 06:59
支持(19) | 反对(0) | 举报 | 回复
70#
游客 2018-10-07 02:14
该评论年代久远,荒废失修,暂不可见。
支持(3) | 反对(1) | 举报 | 回复
69#
游客 2018-09-24 05:56
该评论年代久远,荒废失修,暂不可见。
已有3次举报支持(0) | 反对(7) | 举报 | 回复
68#
提示:本页有 3 个评论因未通过审核而被隐藏
加载更多评论