E X P

  • 编辑
  • 评论
  • 标题
  • 链接
  • 查错
  • 图文
  • 拼 命 加 载 中 ...

    NVIDIA在去年9月发布了基于Ada Lovelace架构的GPU,此前GeForce RTX 4090和RTX 4080已相继上市,分别搭载的是AD102和AD103。不过对于大部分游戏玩家来说,这两款定位高端的显卡虽然性能强劲,但定价较高,并非是其首选的产品。进入2023年后,NVIDIA带来了定位更低的GeForce RTX 4070 Ti,更为贴近主流。

    GeForce RTX 4070 Ti搭载的是AD104 GPU,起售价格为6499元。与GeForce RTX 4080/4090不同的是,RTX 4070 Ti没有Founders Edition产品,首批上市的都是NVIDIA合作伙伴的非公显卡。

    GeForce RTX 4070 Ti规格

    NVIDIA在发布Ada Lovelace架构GPU的时候就公布了三颗GPU,分别是RTX 4090所用的AD102,RTX 4080所用的AD103,以及这次RTX 4070 Ti所用的是AD104,拥有完整的5组GPC,每个含有6个TPC,共30组TPC,每组有两个SM单元,共60组。

    与完整的AD104核心相比,RTX 4070 Ti上用的AD104-400少了两个NVDNC和一个NVENC,完整AD104应该是三个NVENC与三个NVDNC的,估计完整规格要在专业显卡上才会使用。

    和更高一级的RTX 4080相比,RTX 4070 Ti的SM单元从76组减少至60组,CUDA Cores数量从9728个降低至7680个,Tensor Cores与RT Cores数量也有相应减少,L2缓存从65536KB降至49152KB。相对应的,晶体管数量从459亿个减少到358亿个,因此芯片面积也变小了。

    RTX 4070 Ti的显存位宽相比RTX 4080是有所下降,从256bit降至192bit,依然使用GDDR6X显存,不过显存数据速率也从22.4Gbps降低至21Gbps,整体显存带宽从716.8GB/s降至504GB/s,显存容量从16GB减少到12GB。其Boost频率为2610MHz,相比RTX 4080更高,而整卡TGP为285W,比RTX 4080低了35W,推荐电源功率也从750W降低至700W。

    Ada Lovelace架构解析

    SM架构图

    到了SM单元里面,会发现其整体的结构也是与上一代Ampere架构一模一样,分为四个一样的主要计算模块,一个RT光追核心,以及128KB一级数据缓存/共享内存等。每个主要的计算模块内的结构也和Ampere架构一样,有64KB寄存器文件、零级指令缓存、一个Warp调度器、一个分配单元、16个FP32单精度浮点CUDA核心、16个FP32/INT32单精度浮点和整数混合CUDA核心、一个Tensor Core张量核心、四个载入存储单元、一个特殊功能单元(SFU)用于执行图形差值指令。

    差别也很明显,那就是RT Core光追核心从之前的第二代升级到第三代,Tensor Core张量核心也从第三代升级到第四代。

    第三代RT Core有效光追算力是上代3倍

    全新的第三代RT Core可以提供2倍的光线与三角形求交性能,并且加入了两个全新的重要硬件单元,即Opacity Micro-Map引擎和Displaced Micro-Mesh引擎。

    Opacity Micro-Map引擎将光线追踪的Alpha-Test几何性能提升2倍;而全新的Displaced Micro-Mesh引擎可动态生成微网格,以产生额外的几何图形。Displaced Micro-Mesh引擎可在提升几何图形丰富度的同时,不以传统复杂几何图形处理的性能和存储成本为代价。

    Displaced Micro-Mesh引擎

    光线追踪的计算是以光线射向一个平面这样的模型来计算的,而实际的渲染中物体几乎不会是简单的平面型,而是各种曲面,所以就需要将曲面分解成许多个小的三角形平面,然后计算光线与三角形求交。在Ampere架构上,面对一个复杂的曲面,如果想得到逼真的光线追踪效果,那么分解的三角形平面是非常多的,多个三角形平面带来非常复杂的BVH,这就非常难以计算。

    Ada Lovelace架构的处理方式就不一样,通过Displaced Micro-Mesh引擎,它将这些三角形平面仅通过一个三角形然后加上不同的位移图来表达,显著缩短了BVH的构建时间,同时BVH的存储空间需求也减小了很多,而最终仍然能实现一样的光线追踪最终渲染效果。

    实际应用中由于Displaced Micro-Mesh引擎的存在,面对复杂物体的渲染,BVH的构建速度可以超过15倍,而存储空间的需求却可以小20倍之多,越是复杂的物体该引擎的优势就越能体现。

    而且Displaced Micro-Mesh引擎不止可以应用在游戏领域,对于创作领域的用户来说,也有软件会支持,目前Adobe、Simplygon这两家企业已经确认得到了支持。

    Opacity Micro-Map引擎

    Opacity Micro-Map引擎则是可以对游戏中常见的树叶这类物体加速光线追踪计算,Ampere架构面对这种场景的Alpha-Test需要多个着色器来进行计算,而Opacity Micro-Map引擎对于这种不透明的对象进行了不透明度的编码,可以更准确的对物体边缘进行光线追踪计算,简化了叶子轮廓之外完全透明和叶子轮廓之内完全不透明的区域的计算,耗费更少的着色器就可以实现真实的光线追踪渲染。

    以《传送门》RTX版这个游戏为例,Opacity Micro-Map引擎可以让Gbuffer填充速度加快30%,游戏帧率提高10%。

    在这些改进下,第三代RT Core可以使完整的Ada Lovelace架构核心具有200 TFLOPS的有效光线追踪计算能力,几乎是上代产品的三倍。

    第四代Tensor核心性能超上代5倍

    第四代Tensor Core最主要的变化是新增了Hopper FP8 Transformer Engine,可提供1400 TFLOPS的张量处理性能,可以说深度学习性能得到了巨大的飞跃,这也意味着通过它可以实现新的技术想法,后面的DLSS 3我们会再次提到Tensor Core的功劳。

    DLSS 3作为这次NVIDIA大力宣传的重点,相信大家都急不可耐想深入的了解这个技术,但是为了更清楚的了解DLSS 3,还要先介绍两个新东西,那就是着色器执行重排序(SER)和Optical Flow Accelerator光流加速器。

    着色器执行重排序(SER)提高光追并行效率

    着色器执行重排序技术的重大作用是可以极大的提升光线追踪性能,这是与CPU的乱序执行一样的重大创新。

    由于光线追踪的特性,它很难并行处理,因为光线会向各个方向反射,并与各种类型的表面相交,所以光线追踪的工作负载需要不同的线程处理,需要不同的着色器,并且需要不同的显存来存取中间的计算过程。

    GPU的特点就是适合并行处理,只有面对并行处理的任务才可以发挥GPU的特点获得更好的计算效率,而着色器执行重排序就是可以通过实时重新调度任务,即时重新安排着色器负载来提高执行效率,从而更好地利用GPU资源,以实现更佳的光线追踪性能,据称,SER可以为光线追踪带来最高可达3倍的性能提升,整体游戏性能提升可高达25%。

    应用了着色器执行重排序(SER)之后,《赛博朋克2077》在全景光线追踪模式下可以提高44%的性能,《传送门》RTX版可以提高29%的性能,《Racer RTX》可以提高20%的性能。

    Ada光流加速器算力可超300 TFLOPS

    回看前面的完整核心图,可以看到左上角清晰的标出了Optical Flow Accelerator,也就是光流加速器,而尽管之前的Ampere架构中没有提及,但同样也是具备的。不同的是,Ada Lovelace架构中大大增加了光流加速器的运算性能,从之前Ampere架构的126 TFLOPS增加到现在的300 TFLOPS(详细值是305 TFLOPS)。

    Ada的光流加速器带来的巨大的性能提升,具有更广泛的实用性了,使DLSS 3能够更准确预测场景中的运动,使神经网络能够在保持图像质量的同时提高帧率。前面提到的第四代Tensor Core的1400 TFLOPS的张量处理性能,加上这里Ada Lovelace光流加速器300 TFLOPS的光流运算性能,再加上后方的NVIDIA超级计算机提供的超过1 ExaFLOPS的AI计算性能,这三者就组成了这一代DLSS 3的硬件层面基础。

    DLSS 3全方位提升流畅度、延迟和画质

    新一代的DLSS 3包括全新的帧生成技术、DLSS 2超分辨率技术和NVIDIA Reflex技术,与之对应的游戏中,这三个都启用了才算是完整地开启了DLSS 3。

    其中帧生成必须RTX 40系列GPU才能支持,超分辨率则是RTX 40/30/20系列都支持,Reflex的要求最低是GTX 900系列及以后的GPU。总得来说,DLSS 3是提升游戏体验的一整套解决方案,也就是说对于游戏体验的三要素:流畅度、延迟和画质。DLSS 3是全方位的提升,而不是以拆东墙补西墙的方式。

    DLSS 3的帧率

    之前的DLSS 2,提升帧率的方式简单说就是以低分辨率渲染,然后通过AI训练重建高分辨率画面返回输出,比如我们将游戏设置成4K,打开DLSS,那么实际的计算过程是先以1080p分辨率渲染帧画面,然后AI学习经过训练的更高分辨率的帧再将这个帧画面压缩到4K最终输出,中间相差的这3/4部分的像素信息是通过AI计算来添加的(本地主要是Tensor Core来计算)。由于以低分辨率渲染,所以在AI补充像素的性能足够的情况下,帧率自然可以提高了。

    这样的方式无法突破CPU性能的瓶颈,毕竟降低原始渲染分辨率可以使得GPU每一帧的计算量更少,但是CPU每一帧的计算量是不变化的(因为CPU负责计算的部分与分辨率并无关系)。实际上,由于帧率提高,最终CPU的计算量还增大了。

    那么DLSS 3是怎么做的呢?

    首先,还是与DLSS 2一样,比如输出4K游戏画面的话,它也是先降低原始渲染分辨率到1080p,然后通过AI计算来添加像素再压缩成4K画面。在连续的游戏画面中,我们就可以通过这样得到连续的4K帧画面,第1帧、第2帧、第3帧等等。

    然后这样的每两帧之间,DLSS 3通过光流加速器为神经网络提供像素级的帧到帧的运动方向和速度信息,然后通过分析前一帧和当前帧几何图形和像素的运动矢量并将其输入至神经网络,就能计算出两帧中间的帧画面了。

    实现超越CPU限制的帧数

    这样连续下去的话,原本的第1帧、第2帧、第3帧中间都会有一个新的帧,等于实际最终输出的帧画面中,有1/2是没有CPU参与的,完全是GPU计算出来的,所以理论上可以将原本受限于CPU性能的游戏帧率提高一倍。

    另外,我们去关注像素的话,会发现靠传统渲染方式计算的像素其实只有1/8,最终输出的游戏画面7/8的像素其实都是通过DLSS 3的一系列AI计算填补上的,这极大的提升了效率。

    DLSS 3的画质

    其实看我们的网站的网友评论可以看到,还是有很多网友对DLSS技术很抗拒,认为不是原始渲染出的画面就不好,或许这一观念是时候需要改变了。且不说网友有这一观念可能是由于初代DLSS技术确实效果不佳,形成了刻板印象,即便之后的DLSS 2超分辨率技术已经有很好的画面也很难摒弃已经形成的观念,对于现在的DLSS技术其实可以比较一下这几帧画面,已经完全看不出区别。

    对于DLSS 3的生成帧这方面大家不免想到已经问世好久的各种插帧技术,DLSS 3的生成帧确实也可以算作插帧的一种,但是又与其他的插帧技术完全不一样。


    简单的插帧技术利用两帧之间像素的位移来确定中间帧的图像,这样其实非常容易出现明显令人觉得视觉异常的画面,特别是对于阴影这种需要计算的画面效果,当主体移动之后,正确的阴影是需要经过复杂计算的,单单根据像素的位移来确定的画面几乎肯定违反客观世界的物理规律。

    DLSS 3使用光流加速器分析两帧连续的游戏图像,计算帧到帧之间物体、元素的运动矢量数据,综合游戏中的一对超级分辨率帧,以及引擎和光流运动矢量,并将其输入至卷积神经网络,计算生成出新的一帧,大大提高了画面的准确性。

    DLSS 3的延迟

    通过前面的梳理大家会发现DLSS 3尽管提高了帧速率,也保证了画质,但是对于延迟是没有缩短的,因为每一个新生成的帧都是需要后一帧渲染出来之后才可以准确生成的。更高的帧率提升了游戏的顺滑程度,但延迟会影响游戏的响应度,如果延迟太高,游戏的体验也不会好,而为此,DLSS 3也集成了NVIDIA Reflex技术来降低延迟提高响应速度。

    总得来说,DLSS 3是包括了基于AI的超分辨率提升技术、基于AI的帧生成技术以及NVIDIA Reflex低延迟技术这些软件层面以及第四代Tensor Core的1400 TFLOPS的张量处理性能、Ada Lovelace光流加速器300 TFLOPS的光流运算性能以及NVIDIA超级计算机提供的超过1 ExaFLOPS的AI计算性能组成的硬件层面综合实现的一项新技术,对于游戏体验的提升也不是单方面的,而是全方位的提升。

    全新第八代NVENC支持AV1编码和双编码器

    Ada Lovelace架构相比Ampere架构的另一项重要升级就是NVIDIA 编码器 (NVENC)升级到了第八代,开始支持AV1编码了。AV1的效率比H.264高40%,这意味着在传输同样质量的画面时候只需要大约70%的数据量,或者说在同样的带宽下可以实现更清晰的画面质量,并且由于AV1是免费、开放的,可以让厂商节省相当一笔费用,AV1已经明显将要取代H.264成为主流格式。

    在中国的备受欢迎的视频编辑应用“剪映专业版”、Blackmagic Design 的 DaVinci Resolve 18、以及 Adobe Premiere Pro 较为流行的 Voukoder 插件均支持 AV1,且均可通过编码预设使用NVENC AV1编码器。此外,OBS、Discord以及更多的公司都已在采用NVENC AV1编码器。

    比如首发的RTX 4090给开放了两个NVENC编码器,这两个NVENC可实现协同工作,并自动分配以实现双路输出。全新的双编码器可将视频导出时间缩短至原来的一半,未来主播用户可借助第八代编码器中AV1双编码器的优势提升直播体验,还可以通过OBS Studio录制高达8K@60FPS的内容。

    RTX 4070 Ti星曜OC解析

    由于没有Founders Edition产品,所以首批上市的都是NVIDIA合作伙伴的非公显卡。这次我们GeForce RTX 4070 Ti的首发评测会有三款非公版显卡,影驰GeForce RTX 4070 Ti星曜OC便是其中之一。

    规格

    从名字就知道,影驰的这款GeForce RTX 4070 Ti星曜OC是一张经过出厂预超频的显卡。其Boost频率由公版的2610MHz提升至2685MHz,默认的温度上限是84摄氏度,可以向上解锁至88摄氏度,整卡功耗的上限默认状态下为285W,可解锁提升至360W。其他规格就与RTX 4070 Ti公版一致,供电接口同样采用新款12VHPWR接口。

    介绍

    影驰的这款GeForce RTX 4070 Ti星曜OC的外包装延续了上一代产品的二次元动漫风格,浅浅的、略微渐变的色调非常好看,洋溢着青春的味道。正面中间位置是影驰新版的虚拟形象“星曜娘”的战斗篇形象,作为影驰星曜系列的代表人物形象,展现了年轻、动感、活力的形象气息,与星曜系列可定制外观的特性相得益彰,右下方则标明了显卡为RTX 4070 Ti。外包装背面有显卡的主要技术特性说明,以及一些基本的介绍,让消费者对这款产品有基本的了解。

    GeForce RTX 4070 Ti星曜OC采用了纯白色的外观设计,散热器保护罩最外一层是透明的上壳,上面带有钻石切割和类似碎钻的造型,有着水晶的既视感,搭配的散热风扇也是透明的,整体显得玲珑剔透。显卡正面、右侧面与顶部LOGO灯之外的白色部分均采用包边进行衔接,大大增加了自由喷绘和涂鸦的面积,且能让定制图案更加立体。同时透明的上壳是可拆卸的,方便玩家对显卡进喷涂和拆装,玩家可以发挥自己的想象力,打造个人专属显卡。

    新显卡采用的是最新的12VHPWR供电接口,理论上可以提供最高600W的持续供电,影驰还附送了3x 8Pin转12VHPWR的转接线。视频输出接口方面,GeForce RTX 4070 Ti星曜OC为三个DisplayPort 1.4a接口和一个HDMI 2.1接口,均可实现最高8K@60Hz的输出,并实现最多4屏输出,支持HDCP 2.3。挡板也有大面积的镂空设计,可以加大出风口面积,增加散热效果。

    GeForce RTX 4070 Ti星曜OC显卡的重量为1800g,相比不少RTX 4080/4090显卡会稍微轻一些。

    影驰在新款GeForce RTX 4070 Ti星曜OC上采用了星卓III散热系统,有三个102mm超大风扇,每个风扇包括11片半透明的三折静霜扇叶,转动时候能呈现一种陀螺的样子,强化散热效能的同时,能够投射璀璨的极光炫彩灯效,而且风扇边缘的水晶外壳均带有凸起花边,可以进一步反射灯光,增强ARGB氛围。影驰也对顶部的LOGO灯也进行了全面升级,新增多层折射镜面设计,通过特殊工艺可营造多达8层的ARGB灯光效果。

    GeForce RTX 4070 Ti星曜OC还附送了全新的星曜定制散热支架,能通过简单调控来稳固支撑显卡体型,且支持ARGB灯光同步。利用ARGB三风扇+顶部LOGO灯+星曜定制散热支架,构成了星曜系列独一无二的ARGB灯效系统,支持多种律动和色彩变幻,并使用影驰魔盘和各大板厂灯控软件对其进行同步调控。

    此外,该款显卡通过ARGB同步线连接设置后,可以与四大主板厂商实现同步操作,配合纯白透明的外观,带来更炫更耀的ARGB灯效。其ARGB灯效除了能让玩家构建光彩夺目的系统,还能利用其“负能量”检测系统,通过不同的灯色的闪烁,让玩家更直观地排除故障,比如开机显卡灯效呈现黄光闪烁代表显卡外接供电异常,开机显卡灯效呈现红光闪烁代表主板异常。

    拆解

    GeForce RTX 4070 Ti星曜OC为8层PCB的影驰自研非公版,尾部还运用了PCB镂空设计,进一步优化散热效能。其采用13相核心供电,3相显存供电设计,所用的MosFET为Alpha & Omega的AOZ5311NQI,这款DrMOS的连续电流输出是55A,而10ms的瞬时峰值电流能到80A,10us瞬时峰值能到120A,核心供电的PWM控制器是uP9512R,在PCB的背面。6颗美光的GDDR6X芯粒半围绕着GPU布置,组成192bit/12GB的规格。

    将GeForce RTX 4070 Ti星曜OC显卡拆解后,可以很清晰地看到AD104核心。RTX 4070 Ti所搭载的AD104核心和RTX 4080的AD103核心是pin to pin,所以PCB设计方面会有一些相似的地方,最明显的就是GPU周围有8个放置显存芯片的位置。由于AD104只有192bit所以只会焊上6颗GDDR6X芯粒,多出了两个空焊位,同时供电方面也有所缩减,没有在PCB两侧都安放有GPU供电。

    这次星曜新系列产品采用了星卓III散热系统,实现了GPU、显存和供电部分的全方位覆盖;配备了三个102mm超大风扇,专属11叶静霜扇叶,支持智能启停,闲暇时自动停止转动以减少噪音和功耗;配有两根8mm和五根6mm镀镍复合热管;采用了回流焊接工艺;利用合金加强件强化PCB;背板大面积镂空以强化散热,高效能复合热管结合均热板以及大面积散热鳍片。影驰通过打造一体式强力散热系统,为显卡超频预留了更多的余量。

    性能测试

    测试平台与说明

    测试平台CPU使用的是AMD Ryzen 9 7950X,而搭配的主板是华硕ROG CROSSHAIR X670E HERO,加上32GB的EXPO DDR5-6000内存以及1200W的电源,最大程度上确保测试时不会出现瓶颈,从而影响显卡最终的测试成绩。

    参加测试的显卡包括了更高一级的GeForce RTX 4080,还有NVIDIA和AMD的上一代卡皇GeForce RTX 3090 Ti和Radeon RX 6950 XT,测试以2K分辨率为主,包括传统光栅游戏以及光追游戏,光栅游戏分为2K和4K分辨率,光追游戏只测试2K分辨率,DLSS测试部分只测试DLSS3。

    理论性能测试

    首先是纯理论跑分,会以3D Mark作为显卡基准性能测试,测试项目包括Fire Strike、Fire Strike Extreme、Fire Strike Ultra、Time Spy、Time Spy Extreme、Port Royal以及Speed Way六个项目。其中Fire Strike、Fire Strike Extreme、Fire Strike Ultra三个项目分别测试的是显卡在DX11游戏中的1080p分辨率、2K分辨率和4K分辨率下的性能指数,Time Spy、Time Spy Extreme两个项目则是显卡在DX12游戏中的2K分辨率和4K分辨率下的性能指数,Port Royal是测试的显卡实时光线追踪的性能指数,具体成绩见下表,表中所列成绩均为3D Mark显卡单项的得分。

    在1080P和2K分辨率下,RTX 4070 Ti的性能略微超越自家上一代旗舰RTX 3090 Ti了,不过在4K分辨率下还是有一点差距,毕竟两者之间在显存带宽和容量方面还是有差距。两项光追测试里,RTX 4070 Ti的得分也是略低于RTX 3090 Ti,但差距不大,与高一级的RTX 4080相比,跑分大概落后19%~25%左右。

    如果与竞争对手AMD上一代旗舰RX 6950XT相比,DX11时分辨率越低RX 6950XT的领先幅度越大,不过随着分辨率的提高,RTX 4070 Ti与RX 6950XT的差距逐渐缩小,在4K分辨率下两者基本平手;到了DX12测试,RTX 4070 Ti至少领先RX 6950XT 12%;两项光追测试,RTX 4070 Ti的领先幅度就更明显了,Speed Way测试里面领先接近40%。

    游戏性能测试

    在这次游戏测试环节中,我们选择了15款光栅化游戏和8款光追游戏。一般情况下,光栅游戏会选择极高或者超高的预设画质,而光追游戏会根据流畅度来决定具体的设置,这些测试里都没有开启DLSS或FSR。

    2K光栅化游戏

    2K分辨率是目前最多玩家关注的分辨率,也是RTX 4070 Ti的主战场。在该分辨率下,RTX 4070 Ti、RTX 3090 Ti和RX 6950XT三者之间争夺得非常激烈。

    大部分情况下,RTX 4070 Ti的表现与RTX 3090 Ti相同,不过落到具体的游戏就会显现差异了。在《木卫四协议》里,RTX 4070 Ti领先RTX 3090 Ti接近15%;《F1 22》里,RTX 4070 Ti落后RTX 3090 Ti差不多20%;RTX 4070 Ti在《极限竞速:地平线5》中也领先RTX 3090 Ti超过10%。如果将RTX 4070 Ti与RX 6950XT进行比较,RTX 4070 Ti整体领先约5%,RTX 4070 Ti的整体性能可以与NVIDIA与AMD的上代旗舰相媲美。不少项目里,RTX 4070 Ti都有着超过120fps的高帧率表现,完全可以满足游戏玩家在2K分辨率下的流畅游戏需求。

    4K光栅化游戏

    许多玩家还非常在意新一代显卡在4K分辨率下的表现,由于RTX 4070 Ti只配备了12GB显存,想要在高分辨率下仍有良好的帧数表现,压力有点大。

    不少游戏里RTX 4070 Ti的帧率都低于RTX 3090 Ti,只不过两者的差距不算太大,整体落后5%左右。如果比较对象换成RX 6950XT,RTX 4070 Ti领先和落后的项目基本各占一半,整体领先大概5%。虽然RTX 4070 Ti在4K分辨率下的表现不是那么出众,但大多数游戏仍在60fps以上,其实还是可以的。玩家如果想有有更顺畅的游戏体验,可以选择开启像DLSS这样的功能。

    2K光追游戏

    光追游戏项目里,由于《赛博朋克2077》对显卡的要求太高,所以只选择了RTX中等画质,而其他7款游戏都选择了最高画质以及最高光线追踪效果。

    RTX 4070 Ti在2K分辨率下的表现说明,可以流畅运行光追游戏。与前面一些测试反映的情况一样,RTX 4070 Ti基本能向RTX 3090 Ti看齐,两者的整体差价不大;与高一级的RTX 4080相比,性能落后19%左右;与竞争对手上一代旗舰RX 6950XT相比,则要领先30%。另外众所周知,NVIDIA的GPU架构在光追性能方面仍然有比较大的优势。

    DLSS性能测试

    在DLSS 3测试中,将测试RTX 4070 Ti在2K/4K分辨率下开启与关闭DLSS 3时的游戏帧率、1%低帧率以及系统整体延迟,同时还会放上RTX 3090 Ti开启DLSS 2时的数据作为对比。在2K分辨率,会使用DLSS质量模式,到4K分辨率,则会使用性能模式。

    首先来看看DLSS 3开启和关闭的画质对比,列出部分测试游戏的实机截图。

    可以直观地看到,开启DLSS 3不但没有降低画质,而且提升了画质,情况或许会与部分玩家所想的有些不一样。接下来可以看看在画质提升的情况下,平均帧、1%低帧率和系统延迟的对比。

    与前面的测试一样,《赛博朋克2077》里选择的是是RTX中等画质,RTX 4070 Ti在2K分辨率下启用DLSS 3质量模式后,平均帧率直接翻了一倍,1%最低帧更是翻了一倍多,系统延迟降低了39%,显然流畅度会大幅提升,和开启DLSS 2的RTX 3090 Ti相比,平均帧率提升了44%,1%低帧率也提升了44%。

    当分辨率提升到4K分辨率后,RTX 4070 Ti无法直接承受4K光追的负载,不过在DLSS 3性能模式加持下,帧率变成了原来的3.2倍,1%低帧率也是原来的2.6倍,延迟降低了60%。显然不开启DLSS基本没办法正常游戏,开启后效果明显。如果RTX 4070 Ti和RTX 3090 Ti进行对比,平均帧率要高出20fps,而1%低帧率相同。

    《F1 22》开启最高画质及最高光追效果后,即便没有开启DLSS,RTX 4070 Ti在2K分辨率下也有着较高帧率,整体延迟很低。当开启DLSS 3质量模式后,平均与1%低帧率都翻了一倍,延迟变化不大。在DLSS 3的加持下,RTX 4070 Ti的平均帧率高出RTX 3090 Ti大概18.5%,1%低帧率则高出48.5%。

    将分辨率提升到4K的话,DLSS 3的作用就比较明显了。不开启时,RTX 4070 Ti的平均帧率是低于60fps,开启DLSS 3性能模式后帧率直接飙升至144fps,完全可以满足高刷屏的需求,延迟也降低了28%。此时RTX 4070 Ti的平均帧率和用DLSS 2性能模式的RTX 3090 Ti差不多,但1%低帧率要高出不少。

    《战锤40K:暗潮》同样选择最高画质与最高光追效果,RTX 4070 Ti在2K分辨率不开启DLSS时平均帧率低于60fps,开启DLSS 3质量模式后平均和1%低帧率都实现了翻倍,延迟也降低了31%。RTX 4070 Ti和RTX 3090 Ti相比平均帧率高出44.8%,1%低帧率高出35.4%。

    4K分辨率下,若没有DLSS,RTX 4070 Ti运行起来非常勉强,当开启DLSS 3性能模式后,帧率差不多提升到原来的3倍,1%最低帧更是提升至3倍以上,延迟也降低到原来的一半。RTX 4070 Ti和RTX 3090 Ti相比,平均帧率高出30%,1%低帧率高出25.8%。

    《微软模拟飞行》开启最高画质,RTX 4070 Ti在2K分辨率下也有不错的表现,打开DLSS 3质量模式后,平均帧率增加了84.8%,1低帧率提升了87.4%。RTX 4070 Ti和RTX 3090 Ti相比平均帧率高出43.5%,1%低帧率高出77.9%。

    4K分辨率下,RTX 4070 Ti没有DLSS时帧率不超过60fps,开启DLSS 3性能模式后,平均与1%低帧率都翻倍了,延迟也降低了16%。RTX 4070 Ti和RTX 3090 Ti相比平均帧率高出43.5%,1%低帧率高出77.9%。

    《瘟疫传说:安魂曲》开启最高画质,RTX 4070 Ti在2K分辨率下也可以流畅运行,在开启DLSS 3质量模式后,平均帧率是原来是193%,1%低帧率也翻倍了,系统延迟降低了26%。RTX 4070 Ti和使用DLSS 2的RTX 3090 Ti相比,平均帧率提升了41%,1%低帧率提升了51.8%。

    分辨率提升到4K后,RTX 4070 Ti的平均帧率低于60fps,开启DLSS 3性能模式后,平均帧率是原来的2.4倍,1%低帧率接近原来的3倍,系统延迟降低了39%。RTX 4070 Ti和RTX 3090 Ti相比,平均帧率提升32%,1%低帧率提升了40.8%。

    AV1编码测试

    RTX 4070 Ti的媒体引擎与RTX 4090和RTX 4080是一样的,均配备两个第八代的NVENC和一个NVDNC,支持AV1格式的编码/解码,这两个NVENC可实现协同工作,并自动分配以实现双路输出。

    在该测试中,测试了视频编辑应用“剪映专业版”和Blackmagic Design 的 DaVinci Resolve 18通过编码预设使用NVENC AV1编码器的输出耗时。由于RTX 3090 Ti和RX 6950 XT不支持AV1编码,所以选择Intel的Arc A770来进行AV1编码的对比。

    AV1编码测试可以看到RTX 4070 Ti在制作4K分辨率的适配时效率和RTX 4080是同一水平,但在制作8K视频时速度就明显慢不少了,无论是RTX 4080还是RTX 4070 Ti相比Arc A770都大幅度领先,剪映中的耗时只是Arc A770的40%左右。

    温度测试

    我们的GPU散热测试均在裸机状态(如果安装在机箱内,GPU温度会高出5℃左右)下进行测试,测试环境温度约为24.6℃。待机温度是开机以后记录5分钟,满载温度则是完成3DMark压力测试后记录下,数据通过GPU-Z的Log to File功能记录,以下为温度测试曲线。

    影驰GeForce RTX 4070 Ti星曜OC显卡支持风扇待机停转,所以待机温度都是被动散热下的温度,经过5分钟的待机测试,从开始的31.9摄氏度上升到36.3摄氏度左右,5分钟待机过程中最热点温度则是最低是开始的39.9摄氏度,最后最高处是44.6摄氏度。

    满载状态下,最高温度位67.1摄氏度,对于高端显卡来说这温度并不高。如果是最热点温度,最高是78.6摄氏度,可见GeForce RTX 4070 Ti星曜OC的散热器模块能很好地应付AD104核心本身的发热量。

    通过GPU-Z,可以看到影驰GeForce RTX 4070 Ti星曜OC显卡在待机时风扇是会停转,也就是说在待机状态下完全没有噪音,当负载和温度超过一定程度后风扇就会启动,满载状态下,风扇最高转速在1255RPM,转速并不高。

    功耗测试

    通过PCAT套件,可以分别精确地测量显卡PCIe和外接电源接口瓦特数,显卡最大功耗在3DMark Time Spy Extreme压力测试中获得,待机功耗则是在进入系统后记录1分钟取平均值。

    统计功耗测试的结果算出,这张影驰GeForce RTX 4070 Ti星曜OC显卡的整卡待机功耗平均为18.46W,满载功耗平均为282.49W,峰值功耗达到了327.88W。对于RTX 4070 Ti这样级别的显卡来说,如果平台其他部件的功耗不高,那么选择额定功率为750W的电源就可以了,如果其他部件的功耗或者为以后升级留有余地,建议至少选择额定功率850W的电源。

    影驰GeForce RTX 4070 Ti星曜OC显卡在满载运行情况下,显卡的最高频率能达到2805MHz,负载过程中一般保持在2790MHz,这个频率还是非常稳定的。

    噪音测试

    上面的测试所知显卡满载时风扇最高转速是1260RPM,PWM大概是39%左右。将显卡放进了环境噪音只有18 dBA的消音房,把风扇调成同样转速,然后在50厘米的距离上测试其噪音水平,由于显卡在待机时风扇是停转的,所以就不用测试了。

    在消音房里,影驰GeForce RTX 4070 Ti星曜OC显卡所测得的噪音水平是非常低,只有33.8 dBA,这是一个较低的噪音值,非常地安静,基本上不会察觉到。

    超频测试

    超频的时候显卡的TGP上限提升至360W,经过多番尝试,最终显卡的加速频率能提高250MHz,GPU的频率最高能到3.075GHz,显存频率提高175MHz,等效数据频率达到了23.8Gbps,并通过了3DMark Time Spy测试,显示显卡得分为24456分,相比默认频率,性能提高了约8%。

    总结

    在这次GeForce RTX 4070 Ti首发评测中,我们直接选择了上一代旗舰产品RTX 3090 Ti进行比较,可以更为直观地了解到性能的提升,因此就没有再选择性能明显更低的RTX 3070 Ti。新一代基于Ada Lovelace架构的GeForce RTX 4070 Ti,在2K分辨率下的表现非常不错,与RTX 3090 Ti没有太大的差别,而且支持更新的技术,能效比表现也更好。

    当分辨率提高到4K以后,由于12GB显存容量的限制,在部分游戏中会有些力不从心,实际表现会比RTX 3090 Ti差一些,但不代表完全不能适应于4K分辨率。由于GeForce RTX 4070 Ti支持DLSS 3,游戏帧数可以有翻倍的表现,优于RTX 3090 Ti开启DLSS 2,使其可以满足4K分辨率下的游戏需求,即便在2K分辨率下也能带来更高且稳定的帧数。虽然仍然有一些玩家不太愿意接受超分辨率技术,但从长远来看,这样的技术可以让玩家在硬件选择和游戏设置上更为灵活,提供了更多的可能性,会被更多的游戏开发商所支持。

    相比更高一级的RTX 4080相比,RTX 4070 Ti有着大概19%的性能落差,反映到价格上的差距就更大了。对于选择2K而非4K显示器的玩家来说,RTX 4070 Ti可能更为适合。从这个角度来看,RTX 4070 Ti更好地迎合了现今玩家对于性能的需求。

    影驰GeForce RTX 4070 Ti星曜OC显卡在设计上延续了之前该系列RTX 4080产品的设计,外观、性能、静音和功耗等各方面有着很好的平衡,温度和噪音控制都相当不错,而且有着一定的可玩性,满足了部分玩家自定义的需求。其价格为7099元,比RTX 4070 Ti的官方起售价高一些,考虑到该款显卡的品质,加上有着更高的厂商频率,这样的定价还是能够接受的。

    ×
    热门文章
    1英伟达RTX 3060 3840SP显卡曝光:完整的GA106核心,配备6GB显存
    2Radeon RX 7800/7700/7600系列显卡规格流出?AMD或以Navi 33冲击主流市场
    3锐龙9 7845HX PassMark处理器跑分泄露:相比锐龙9 6900HX提升近90%
    4惠普Z32k G3显示器发售:32寸4K IPS Black屏,配备雷电4接口,价格6999元
    5英特尔Xeon W-3400/2400系列处理器及W790芯片组:详细规格以及发布日程
    6适用于Radeon RX 6000系列显卡的驱动即将到来,AMD会在两周内发布
    7《最后生还者:第一部》PC版宣布跳票:游戏延期至3月28日
    8《神秘岛》重制版将登陆iPhone,需要A12 Bionic及以上芯片
    9台积电宣布开放学界使用16nm FinFET技术:培养半导体人才并推动学术创新
    已有 21 条评论,共 490 人参与。
    登录快速注册 后发表评论
    • 这些评论亮了
    • 4638263教授 01-05 10:43    |  加入黑名单

      说的再好,这个价格也不会考虑

      已有2次举报

      支持(23)  |   反对(2)  |   举报  |   回复

      14#

    • 左忙高中生 01-05 09:57    |  加入黑名单

      希望摩尔线程不是泡沫了,这种一家独大的嘴脸真是看够了

      已有1次举报

      支持(20)  |   反对(2)  |   举报  |   回复

      13#

    • zerg_hzc教授 01-05 09:15    |  加入黑名单

      加入的话,4070ti的成绩就不好看了,价格也没有明显优势,你让人家怎么卖?

      已有2次举报

      支持(34)  |   反对(1)  |   举报  |   回复

      11#

    • 哈曼卡恩等待验证会员 01-05 08:56    |  加入黑名单

      为什么不把7900xt加到对比列表里?这应该算是竞品吧

      支持(28)  |   反对(1)  |   举报  |   回复

      9#

    • 下穿穿教授 01-05 08:48    |  加入黑名单

      通货膨胀 3499不能再多 你不要不知好歹

      支持(40)  |   反对(2)  |   举报  |   回复

      8#

    • 茶扉丶博士 01-05 01:21    |  加入黑名单

      半价享受上代卡皇,但市场已经不是上代的市场了

      已有1次举报

      支持(26)  |   反对(1)  |   举报  |   回复

      4#

    • 诺坎普小屁孩教授 01-04 22:28    |  加入黑名单

      第一个70ti是3499的1070ti

      已有1次举报

      支持(20)  |   反对(1)  |   举报  |   回复

      1#

    • RainMax博士 01-10 12:00    |  加入黑名单

      挺好的,如果他是买3k的话。
      但是老黄非要买7k。只能说谢谢了。

      支持(9)  |   反对(0)  |   举报  |   回复

      23#

    • 不吹不黑客观帝初中生 01-07 05:46    |  加入黑名单

      yjhercules 终极杀人王

      4070 基本平3080ti吧
      那么4060 赢个3080不是太问题
      4070 是不是会卡在4999
      那么4060也就是3999的样子了
      4060的功率是不是能200w 内呢
      01-06 19:41 已有8次举报
    • 支持(1)  |   反对(15)  |   举报  |   回复
    • 一本正经的胡说八道。。。4070还想赢3080ti?4060还想赢3080?你还能再小白一点?4k下3090ti薄纱4070ti看不到?然后你再去网上搜搜3080ti和3090ti同频评测和3080ti和3080 10g的对比评测吧,一搜一大堆。。。都只说4k下,3080ti和3090ti同频下只有1%差距;3080 10g和3080ti大部分游戏都只有5%左右的差距,就这4060还想赢3080呢?天大的笑话,现在tpu根据4060已知硬件规格给出的推测天梯图4060有多烂知道么你,tpu天梯图3080 10g比4060强了70%知道不,也比4060ti强63%,你知道4060和4060ti的硬件规格有多低么就在这里胡说八道。。。另外4k下3090ti怎么吊锤4070ti的,3080ti也一样做的到

      已有1次举报

      支持(13)  |   反对(7)  |   举报  |   回复

      22#

    • yjhercules终极杀人王 01-06 19:41    |  加入黑名单

      4070 基本平3080ti吧
      那么4060 赢个3080不是太问题
      4070 是不是会卡在4999
      那么4060也就是3999的样子了
      4060的功率是不是能200w 内呢

      已有8次举报

      支持(1)  |   反对(15)  |   举报  |   回复

      21#

    • yjhercules终极杀人王 01-06 19:40    |  加入黑名单

      游客

      不错就去买哦 。
      01-06 00:21 已有1次举报
    • 支持(4)  |   反对(1)  |   举报  |   回复
    • 没有游戏动力。自然就不想买
      3060 我还在等等呢,天天上下班
      玩游戏的时间越来越少

      已有5次举报

      支持(1)  |   反对(2)  |   举报  |   回复

      20#

    • 我匿名了  01-06 00:21

      yjhercules 终极杀人王

      本评论因举报过多被折叠 [+]

      不错就去买哦 。

      已有1次举报

      支持(4)  |   反对(1)  |   举报  |   回复

      19#

    • ywp0815教授 01-05 19:17    |  加入黑名单

      显卡的价格上限一直在拉高 太恐怖了 当年1080才多少钱

      支持(13)  |   反对(0)  |   举报  |   回复

      18#

    • yjhercules终极杀人王 01-05 19:15    |  加入黑名单

      本评论因举报过多被折叠 [+]

      17#

    • lyahehehehe教授 01-05 17:29    |  加入黑名单

      性能全靠DLSS是吧?

      已有1次举报

      支持(16)  |   反对(1)  |   举报  |   回复

      16#

    • 我匿名了  01-05 11:03

      小编的标题。。。麻烦你看看12G,什么情况下才能不爆显存

      支持(12)  |   反对(0)  |   举报  |   回复

      15#

    • dfrankly大学生 01-05 08:57    |  加入黑名单

      不想要AI出来的帧

      已有1次举报

      支持(4)  |   反对(0)  |   举报  |   回复

      10#

    • zerg_hzc教授 01-05 08:33    |  加入黑名单

      3k级别的显卡卖到6k+,我就等着看你们怎么降价

      已有1次举报

      支持(17)  |   反对(1)  |   举报  |   回复

      7#

    • flare教授 01-05 01:32    |  加入黑名单

      能把一张3090ti性能的卡做成定位2K的4K残废卡,NV负责显存的人员多少沾点公报私仇了。

      已有5次举报

      支持(19)  |   反对(5)  |   举报  |   回复

      5#

    • cnwjlb2019一代宗师 01-04 23:02    |  加入黑名单

      看完测评发现6950xt性能比预想中更强大。4070ti完全不是7900XT的对手,再过几个月差距会拉的很大

      已有11次举报

      支持(19)  |   反对(10)  |   举报  |   回复

      3#

    • QQ23870862终极杀人王 01-04 22:33    |  加入黑名单

      3999最多了

      已有1次举报

      支持(17)  |   反对(3)  |   举报  |   回复

      2#

    提示:本页有 21 个评论因未通过审核而被隐藏

    登录 后发表评论,若无帐号可 快速注册 ,请留意 评论奖罚说明