征服2K光逃游戏,华硕TUF Gaming GeForce RTX 4070 Ti测评
1月4日,NVIDIA正式发布了RTX 4070 Ti,做为RTX 40系列的第三位成员,RTX 4070 Ti具备NVIDIA Ada Lovelace全新架构的一系列新特征与黑科技,包罗第三代RT Cores与第四代Tensor Cores,以及能够让游戏帧率大幅提拔的DLSS 3手艺。华硕做为NVIDIA的核心协做伙伴,也在第一时间推出了RTX 4070 Ti显卡产物,本次测试我们利用了华硕TUF Gaming GeForce RTX 4070 Ti,一路来看看它的表示若何吧。
↓↓↓点击视频领会华硕TUF Gaming GeForce RTX 4070 Ti↓↓↓
Ada Lovelace架构带来革命性的进化
之前我们已经对NVIDIA Ada Lovelace架构停止过全面的解析,那里归纳综合一下重要的手艺亮点。
●NVIDIA Ada Lovelace架构中全新设想的流式多处置器具有更高 83 TFLOPS 的着色才能,吞吐量超越上代产物2倍。
●第三代 RT Cores 有效光线逃踪计算才能到达 191 TFLOPS,是上代产物的 2.8 倍。
●第四代 Tensor Cores 新增FP8引擎,具有高达 1.32 PFlops 的张量处置性能,超越上代 5 倍。
●撑持着色器施行重排序(SER),通过立即从头安放着色器负载来进步施行效率。SER可为光线逃踪带来更高3倍的性能提拔,整体游戏性能可更高提拔 25%。
●新增Ada光流加速器带来2倍的性能提拔,使DLSS 3可以揣测场景中帧和帧之间的运动改变,让神经收集可以在连结图像量量的同时进步帧率。
●架构停止大幅改进,摘用TSMC定造4N工艺,此工艺专为GPU优化,实现高达2倍的能效飞跃。
展开全文
●12GB显存及以上型号供给双NVIDIA编码器(NVENC),可最多缩短一半的视频导出时间,并供给了对AV1的硬件编码撑持。
Shader Executing Reordering(SER)着色器施行重排序
GPU在完成大量并行计算的时候效率更高,而跟着游戏中光逃效果越来越复杂,着色器面对的可能就是大量发散的、无序的低效率工做使命,从而影响了衬着效率。SER手艺的呈现,就能够把那些杂乱的工做使命停止分类,动态重组为更高效的使命,从而提拔着色器的施行效率。从NVIDIA官方数据来看,SER手艺大约会带来2倍的着色器性能提拔。
第三代RT Core
从RTX 20到RTX 30再到RTX 40,RT Core进化到了第三代。简单地从有效光线逃踪计算才能来看,NVIDIA Ada Lovelace 架构GPU的第三代RT Core吞吐量到达了191 TFLOPS,是上一代的2.8倍之多。
别的,NVIDIA Turing和Ampere 架构GPU中的RT Core包罗了用于加速鸿沟体积条理(BVH)数据构造遍历的加速单位,并施行射线三角形和光线鸿沟框订交测试计算。Ampere的RT Cores中,BVH遍历由Box Intersection Engine停止加速,射线三角形订交测试由三角形订交引擎停止加速,那已经被证明是迄今为行处置光逃工做负载更高效的引擎。而在Ada GPU的第三代RT Cores中,除了以上两个功用外,还引进了称为“微映射通明度引擎”(OMM)和“微网格置换引擎”(DMM)。
微映射通明度引擎的感化是优化光线逃踪衬着,大幅降低着色器的工做负载,那关于处置复杂物体光逃特征来讲提拔是很大的。详细的原理是将光线逃踪特征烘焙到不通明的蒙版中,让那些不规则的外形与半通明的对象都能更快更精准地被衬着出来。
微网格置换引擎则能够将面数十分多的复杂图形做简化,创造出愈加简单的模子,从而实现用根本三角形衬着复杂几何图形的目标,大大削减了计算量和对显存的占用。从官方数据来看,微网格置换引擎能够让光线逃踪的BVH速度最多提拔15倍以上,而显存占用最多可降低到原先的1/20,总之就是越复杂的模子,微网格置换引擎的优化效果越凸起。
第四代Tensor Core
在Ada GPU上,Tensor Cores已经进化到了第四代,而此次Tensor Cores的晋级出格重磅。它装备了全新的FP8引擎,张量处置性能高达1.32 PetaFlops(相对上代提拔了五倍之多)。第四代Tensor Cores更具革命性的朝上进步当然是全新加进的光流加速器(Optical Flow Accelerator),而它就是NVIDIA DLSS 3黑科技的核心所在。
DLSS 3手艺
DLSS手艺做为RTX系列显卡提拔画量与帧率的公用黑科技,到RTX 40那一代进化到了DLSS 3,跨度之大证明其改进是革命性的,NVIDIA官方称其代表了“神经收集衬着新时代”。
和之前的DLSS差别,DLSS 3在原有的超辨认率功用根底长进一步引进了光学多帧生成手艺,简单来说就是能够通过AI计算生成新的帧,而不像之前那样只是生成像素。而那个帧生成的工做,那个帧生成的工做是在Ada架构中新的光流加速器完成的,当然那就意味着DLSS 3中的“光学帧生成”功用是RTX 40独享的。
光流加速器能够在DLSS 2的根底上计算两帧之间的光流场,捕获游戏画面中从第1帧到第2帧之间改变的标的目的与速度,包罗粒子、光线照射、反射等像素信息,通过计算运动矢量和光流场来切确重建画面。
总的来说,DLSS 2做的是通过AI计算出画面上剩余的像素,而DLSS 3则在此根底上还能计算出下一帧完全的画面,如许算下来DLSS 3等于是完全重建了现实展现画面7/8的像素,也能够说是重建了相当于现实衬着像素7倍的像素。此外,因为DLSS 3的“帧生成”在GPU中后处置,所以即使是CPU性能呈现瓶颈,也能提拔游戏帧率。
根据官方数据,DLSS 3最多可带来4倍的游戏性能提拔。DLSS 3包罗了“光学多帧生成”、“超辨认率”和“NVIDIA Reflex”三大部门,开发者只要整合DLSS 3,就可默认撑持DLSS 2。目前DLSS 3已经得到了游戏开发者与游戏引擎的普遍撑持,在后面的详尽测试中我们会进一步介绍DLSS 3游戏的情状。
NVIDIA Studio优化
在消费力方面,NVIDIA GPU打造的CUDA生态圈已经是业界无可匹敌的存在,RTX显卡也是设想师们优先考虑的高效东西,因而RTX 40系列在NVIDIA Studio方面的优化共同NVIDIA Studio驱动也将会为内容创做者们供给愈加超卓的抉择。总的来说,目前RTX 能够加速 100 多款支流创意利用,此外,SDK的供给使那些利用愈加高效,并供给独家的功用,例如Optix、DLSS和Maxine。NVIDIA Studio 还供给了全套创意利用,包罗 NVIDIA Omniverse、Broadcast、Canvas 和 RTX Remix。
AV1与AI曲播
AV1比拟H.264等编码体例能够在同码率下供给愈加清晰的视频画面,并且AV1还撑持一些更先辈的编码特征,例如HDR与低延迟。RTX 40的编码器(显存12GB以上的RTX 40系列都供给了NVENC A V1双编码器)供给了对AV1硬件编码的撑持,而OBS和Discord等推流软件都将在不久之后供给对NVENC AV1的撑持,让玩家享遭到愈加精巧而顺畅的曲播视频画面。解码方面,RTX 40的NVENC也继续了RTX 30上的第5代硬件解码器,撑持MPEG-2、VC-1、H.264(AVCHD)、H.265(HEVC)、VP8/9以及AV1的硬件解码。AI曲播部门,NVIDIA在曲播利用手艺上的更新有:面部脸色预估,眼神逃踪(让你看起来像是在看摄像头),以及虚拟绿幕的量量改进,而开发者能够很随便地在本身的APP中集成NVIDIA Broadcast SDK的那些功用。
RTX 4070 Ti规格解析:性能与定位的黄金平衡
做为RTX 40系列第三位退场的成员,RTX 4070 Ti其实从某种意义上来讲本来应该是和RTX 4090一路发布的“RTX 4080 12GB”,不外考虑到现实的规格和定位,NVIDIA最末决定将它从头定名为了RTX 4070 Ti。从核心图上能够看到,RTX 4070 Ti并非在之前RTX 4080的AD103核心长进行缩减而来,而是换上了规模更小一点的AD104核心。晶体管数量从AD103的459亿个削减到了358亿个,相较于完全的AD103,AD104精简了1组完全的GPC和一组“不完全”的GPC,因而总共具备5组GPC。
利用完全版AD104核心的RTX 4070 Ti拥有30组TPC,比RTX 4080少了8组,CUDA核心从4080的9728个缩减到了7680个,综合来看它拥有了RTX 4080近8成的核心规模,理论性能定位其实也比力清晰了。此外,RTX 4070 Ti拥有80个光栅单位,虽说比RTX 3070 Ti少8个,但它还具备60个第三代光逃单位和240个第四代张量单位,比RTX 3070 Ti多出很多。
RTX 4070 Ti同样也摘用了NVIDIA定造的台积电4N工艺,GPU加速频次能够到达2610 MHz(公版),游戏加速频次则更高。显存部门用上了12GB GDDR6X,比RTX 3070 Ti要多4GB。显存位宽为192bit,虽说低于RTX 3070 Ti的256 bit,但它的二级缓存有48MB,是RTX 3070 Ti的12倍,同时显存频次也要高一些,所以综合计算下来的显存现实工做效率反而更高。
功率部门,RTX 4070 Ti的整卡功率为285 W,比RTX 3070 Ti低了5W。官方表达,RTX 4070 Ti的均匀游戏功率其实只要225W摆布,而官方测试功效表白,RTX 4070 Ti跑Overdrive形式光逃的《赛博朋克2077》只要RTX 3090 Ti一半的功率,可见RTX 40那一代的能效比十分高。
军规用料加持,量感晋级尽显硬派
华硕TUF Gaming GeForce RTX 4070 Ti显卡摘用了全新的TUF GAMING家族式设想,外看外型上照旧主打硬朗的军事风气,显卡的亮面金属涂拆改为了哑光黑配色,外表的金属拉丝纹理也变成了磨砂设想,整体的量感提拔明显。导流壳的外形设想沿用了上代产物的外型,但外表图案替代成了TUF GAMING的英文名以及下方的坐标,给人低调沉稳的视觉看感。此外,显卡侧面拥有TUF的RGB Logo,撑持自家的AURA SYNC神光同步崇奉灯效,能够与其他硬件停止联动,打造出更为炫酷的整体灯效。
散热方面,华硕TUF Gaming GeForce RTX 4070 Ti搭载了3个Axial-tech轴流电扇,3个电扇都保留了全高阻隔环,能大幅提拔静压,共同中心电扇与两侧辅助电扇的正逆转工做设想,能够削减空气乱流,进步散热气顺畅用率。当然,电扇也撑持低负载完全停转的手艺,降低显卡低负载运行时的噪声。
显卡摘用了3.25槽设想,能供给较大的散热空间和更多的散热鳍片,比拟旗舰型号的体型要玲珑许多,显卡长度为305mm,从拆机角度来看,能兼容更多的支流MATX尺寸的机箱。散热器底座摘用了MaxContact镜面曲触手艺,让散热片密切地接触GPU核心,进步热量传递效率。同时显卡的导流壳由金属材量打造而成,加上全尺寸的金属背板,大幅提拔了显卡的构造强度。
金属背板尾部大面积的镂空设想可以提拔显卡的散热效率
在做工用料方面,华硕TUF Gaming GeForce RTX 4070 Ti摘用了标记性的全主动化工艺造造,消弭了人工在操做过程中的不确定性,让显卡的操行更超卓。供电方面延续了超合金供电系统。GPU部门利用的是UP9512R掌握芯片+SIC639(50A)MOSFET的供电计划,显存部门则是利用了UP9529Q+SIC639(50A)MOSFET的供电计划。考虑到TGP仅为285W,如许的供电规格足为显卡在长时间高频形态运行,供给充沛而不变的动力。
在显卡后背,华硕TUF Gaming GeForce RTX 4070 Ti供给了2个HDMI 2.1和3个DP 1.4a的视频接口组合,轻松称心高端玩家的各类设备接驳需求。特殊值得一提的是,显卡附赠的配件中除了16Pin电源转接线和魔术捆扎带之外,ROG和TUF新品显卡中附赠的显卡收架兼螺丝刀配件也没出缺席,足够考虑到了玩家利用的便当性。
DLSS 3黑科技加持,帧率表示“Ti”强悍
测试平台
显卡:华硕TUF Gaming GeForce RTX 4070 Ti
处置器:Intel酷睿i9 13900K
主板:ROG MAXIMUS Z790 HERO
内存:芝奇DDR5 6000 16 GB×2
硬盘:WD_BLACK SN850X 2TB
电源:ROG THOR雷神1200W Platinum II
操做系统:Windows 11专业版22H2
测试中我们解锁了处置器功耗墙,并开启BIOS中的Resize BAR选项。内存抉择XMP DDR5 6000形式,分频设定为主动。此外,还根据差别测试项目选用了RTX 4080/3080 Ti/3090 Ti/3070 Ti停止比照。
基准性能测试
从3DMark GPU的测试成果来看,相较于上一代RTX 3070 Ti,RTX 4070 Ti的功效有了大幅的提拔,在FireStrike 和TimeSpy 系列测试中,FireStrike Extreme、TimeSpy、TimeSpy EXTREME的功效都领先RTX 3070 Ti 50%以上,而比拟RTX 3080 Ti均匀也有15%的领先优势,表示十分夺眼。在DX12U专属的SpeedWay测试中,RTX 4070 Ti相对RTX 3070 Ti超出跨越45%,比RTX 3080 Ti超出跨越6%。
光逃性能部门,PortRoyal测试中,RTX 4070 Ti领先RTX 3070 Ti 61%,领先RTX 3080 Ti 12%。RTX 4070 Ti光逃项目DXR的功效为69.11fps,领先RTX 3070 Ti 104%,领先RTX 3080 Ti 27%。DLSS 2K辨认率测试中,RTX 4070 Ti比拟RTX 3070Ti提拔了60%。DLSS 3测试中,RTX 4070 Ti在开启DLSS 3后帧率大约到达原生4K的4.4倍,而用来比照的RTX 3080 Ti开DLSS提拔则是2.6倍摆布,可见RTX 40特有的“光学多帧生成”功用对帧率的提拔效果多么大。同时,在那里也能够看到,RTX 3070 Ti不开DLSS时只要5 fps,8GB显存实的不敷用了。
综合基准测试得分来看,RTX 4070 Ti的性能差不多是RTX 4080的80%,而相对上代RTX 3070 Ti的综合提拔则超越了50%。同时,在开启DLSS 3的情状下,RTX 4070 Ti的优势就愈加夸饰了,相对RTX 3080 Ti和RTX 3070 Ti别离有86%和152%的帧率提拔。由此可见,假设玩家买了RTX 4070 Ti,那么必然要在游戏中开启DLSS 3从而获得成倍的性能提拔。
光栅游戏性能测试
接下来我们进进现实的游戏测试,鉴于RTX 4070 Ti的性能表示,我们还加进了4K游戏测试。起首是传统的光栅化游戏,在2K辨认率下,RTX 4070 Ti均匀帧率相对RTX 3070 Ti提拔了43%摆布,领先RTX 3080 Ti大约12%。跟着辨认率来到4K,RTX 4070 Ti领先RTX 3070 Ti的幅度到达了42%,部门游戏中的提拔在60%以上,而领先RTX 3080 Ti的幅度为8%。《掌握》《看门狗:军团》如许要求较高的游戏,RTX 4070 Ti也能在4K下跑出70fps摆布的顺畅帧率,可见其性能确实十分强悍。
光逃游戏性能测试
接下来看看光逃游戏和DLSS 2测试的情状。在2K辨认率下,RTX 4070 Ti的游戏帧率均匀领先RTX 3070 Ti 54%,领先RTX 3080 Ti 11%,几乎所有游戏都能够到达70fps以上的顺畅帧率。辨认率提拔到4K之后,RTX 4070 Ti和RTX 3070 Ti的差距进一步拉大,均匀领先幅度到达63%以上,比拟RTX 3080 Ti的提拔幅度陆续连结在11%摆布。从帧率上看,《古墓丽影:阴影》《孤岛惊魂6》《F1 2022》等游戏RTX 4070 Ti还能包管60fps以上的均匀帧率,而RTX 3070 Ti在不开启DLSS 2的情状下,已经无法顺畅运行4K光逃游戏了。
4K+DLSS的测试功效中,RTX 4070 Ti仍然领先RTX 3070 Ti 47%,考虑到RTX 4070 Ti的光逃单位和张量单位数量都要多于RTX 3070 Ti并领先了一代,那应该也是一个合理的功效。从帧率上看,即便RTX 3080 Ti也不克不及包管60fps以上的帧率,而RTX 4070 Ti开启DLSS后所有参测游戏都能够到达60fps以上的帧率,部门游戏破百。RTX 3070 Ti几乎无法顺畅运行4K光逃游戏,以至已经无法称心在4K更高画量下开启光逃时的显存需求。
可能有些玩家比力关心RTX 4070 Ti和RTX 3090 Ti的性能差距,假设我们综合之前的测试功效和RTX 3090 Ti做一个比照,那么RTX 4070 Ti的游戏性能和RTX 3090 Ti是差不太多的。在2K辨认率下RTX 4070 Ti完全能够媲美以至小幅超越RTX 3090 Ti,4K辨认率下稍稍弱一点,但总体差距不大。整体来看,在光栅游戏和光逃游戏以及开启DLSS2时,两者的差距都十分小。但RTX 4070 Ti比拟RTX 3090 Ti存在代际优势,那就是RTX 40系列的DLSS 3,凭仗DLSS3 RTX 4070 Ti事实能实现如何的性能表示呢?此次我们也拔取了此中几款游戏停止了测试。
DLSS 3测试
接下来是RTX 40系列的重头戏DLSS 3性能测试,我们都晓得,开启DLSS 3之后能让游戏帧率得到极大的提拔。从测试功效来看,RTX 4070 Ti开启DLSS 3后的帧率提拔浩荡,《赛博朋克2077》《存亡轮回》《瘟疫传说:安魂曲》在DLSS 3的加持下,其帧率都能够到达原生辨认率的2倍以上,与开启DLSS 2性能形式的RTX 3090 Ti比拟,普及能够提拔22%~56%的帧率。帧率方面的提拔愈加曲看,《赛博朋克2077》开启DLSS 3性能形式后,帧率间接从47fps暴增至127fps,相当于DLSS 2帧率的2.7倍。而其他游戏在2K+DLSS 3测试中都拥有120fps以上的电竞级顺畅帧率,可玩性上了几个台阶。
目前来看,已经有超越50款游戏已经或即将撑持DLSS 3,将来那个数量还会不竭增加。因而关于期看体验将来光逃游戏高文的玩家来讲,抉择撑持DLSS 3的RTX 40系显卡无疑是更佳的处理计划。
消费力性能测试
接下来看看消费力方面的表示。Blender Benchmark 3.3中,RTX 4070 Ti相对RTX 3070 Ti提拔比力明显,此中monster和classroom的性能相对RTX 3070 Ti提拔到达89%和78%,junkshop也有40%的提拔。RTX 4070 Ti在V-Ray中的表示也比力不错,无论是利用RTX仍是CUDA相关于RTX 3070 Ti都能实现50%以上的衬着效率提拔。而OC衬着器中的性能提拔则是58%以上。因为RTX 4070 Ti有12GB内存,所以其在3D衬着中的消费力性能天然比8GB的RTX 3070 Ti更好,与RTX 4080的差距也在30%以内。
达芬奇中做MagicMask魔法遮罩时,RTX 4070 Ti的效率提拔同样十分明显,RTX 3070 Ti需要近43秒完成的工做RTX 4070 Ti只要27秒就能够搞定。视频转码部门,能够看到具备双编码器的RTX 4070 Ti相对RTX 3070 Ti来说在H265的转码测试中有成倍的效率提拔。至于新的AV1编码,RTX 4070 Ti和大哥RTX 4080区别不大,而30系显卡因为没有搭载AV1编码器,所以不撑持AV1视频的硬件编码。
总的来说,假设不考虑显存容量,其实RTX 4070 Ti的单卡消费力性能是超越RTX 3080 Ti且能够比肩RTX 3090 Ti的,以至还略强一点。
考机与超频测试
华硕TUF Gaming GeForce RTX 4070 Ti做为一款超公版RTX 4070 Ti,频次设定方面天然要高于公版原则,在默认形式下能够到达2730MHz的加速频次,在OC MODE下能到达2760MHz的加速频次,高于公版的2610 MHz,性能方面会有更好的表示。
默认设置下,利用FurMark考机,能够看到华硕TUF Gaming GeForce RTX 4070 Ti的整卡功率到达了285.4 W。同时,我们也重视到满载考机的情状下,GPU更高温度只要56.5℃,热点温度不到66℃,显存温度也仅有42℃,散热表示比力优良。华硕TUF Gaming GeForce RTX 4070 Ti在TimeSpy中的现实游戏频次高达2790MHz,比默认的加速频次还要高一些。
此外,我们也对其停止了简单的超频,在仅解锁功耗墙的情状下,华硕TUF Gaming GeForce RTX 4070 Ti的游戏频次能够较为轻松的到达3015MHz,在TimeSpy GPU测试平分数到达了23675。超频考机测试中,华硕TUF Gaming GeForce RTX 4070 Ti的GPU温度来到了60.3℃,热点温度为70.7℃,显存温度改变不大,此时显卡的均匀TGP约291W,总体表示不错。
总结:游戏火力全开,次时代“甜品”值得抉择
NVIDIA Ada Lovelace GPU架构为RTX 40系列带来了革命性的朝上进步,凭仗着第三代RT Cores和第四代Tensor Cores以及TSMC 4N NVIDIA定造工艺带来的超大芯片规模与高频次增益,为次世代游戏和利用带来了愈加强悍的光线逃踪性能表示,全新加进的光流加速器,让DLSS 3手艺的AI帧生成得以实现。RTX 4070 Ti做为RTX 40系列退场的第三位成员,从实测来看,在DLSS的加持下也能让支流游戏以2K极致光逃设定超越100fps高帧率顺畅运行,在撑持DLSS 3的游戏中帧率提拔更是惊人,不单远超上代RTX 3070 Ti,以至还超越了开启DLSS2的RTX 3090 Ti。
此外,RTX 4070 Ti在3D衬着输出与视频剪辑方面相对RTX 3070 Ti也有巨幅的性能增幅,特殊是视频编码性能做到了翻倍,也超越了RTX 3080 Ti(某些利用场景下还能小超RTX 3090 Ti),所以RTX 4070 Ti能够称得上性价比十分高的消费力东西。
在超公版RTX 4070 Ti中,华硕TUF Gaming GeForce RTX 4070 Ti不单拥有全新的个性化外型设想和超卓的用料做工,还有着不错的性能表示。关于逃求极致游戏体验的发烧玩家和逃求效率的设想师用户来说,华硕TUF Gaming GeForce RTX 4070 Ti是值得优先考虑的次时代“甜品”。