电源技术网|技术阅读
登录|注册

您现在的位置是:电源技术网 > 技术阅读 > RTX 4090评测:性能再次超越想象

RTX 4090评测:性能再次超越想象

问:有什么办法能以合理的价格买到30系显卡?答:在40系显卡发售后等矿工退休。

很显然,刚刚的“模拟Q&A”只不过是游戏玩家对20系之后显卡价格飞涨的吐槽。但话又说回来,对于上一次升级显卡还是为了以1080P分辨率玩PUBG的玩家来说,现在确实是一个升级显卡的好时候:以太合并释放了大量高性能显卡的需求,高刷新率2K/4K现实面板价格的下降也让不少玩家选择升级到高分高刷的2K144/4K144屏幕。

再加上Apex Legend、2077、COD战区等游戏的火爆,即使GTX 1060依旧是Steam平台中最多玩家使用的显卡,但面对2022年全新的玩家需求,我们不得不承认“老显卡确实不够用了”,也确实是时候升级新显卡了。

毫无疑问,英伟达最新推出的RTX 4090是你目前能买到的最强公版游戏显卡之一,先进的Ada Lovelace架构与DLSS 3.0技术也为游戏玩家带来了全新的4K游戏体验,12999元的国行售价也能从另一个角度证实其非凡的实力。

但如果这对你来说还不够强呢?如果你既要体验4K甚至是8K游戏的超高分辨率,也不愿意牺牲任何的画质与特效效果,更无法忍受任何的卡顿与撕裂呢?

由著名外设品牌七彩虹推出的首批非公RTX 4090——七彩虹iGame RTX 4090 Vulcan OC(七彩虹4090火神),可能就是你等待的那张“天外有天”显卡。

硬件介绍

不同于七彩虹同时发布的另一张RTX 4090显卡“水神”或是火神采用了相对来说RTX 4090FE比较相似的三风扇布局:前两个风扇直接压在拥有9根8mm热管的散热器上,为显卡带来足够的进风量,镂空燕尾结构上方则是第三个高性能散热风扇,可以充分借助电脑前面板抽入的空气,以更高的气流量帮助显卡完成热交换。

但不同于RTX 4090FE,由于火神采用了非公方案,因此核心的主频上火神比FE的2520要高,在一键OC模式下可以来到2625MHz。这里的一键OC其实也是七彩虹双BIOS的特性:

显卡自带两个不同的BIOS,其中一个主频与RTX 4090FE看齐,为2235-2520MHz,OC版BIOS主频默认可以来到2625MHz,实际测试中约在2800MHz左右。不同版本的BIOS可以通过显卡背后的一键OC按钮切换,也可以在七彩虹iGame桌面软件中找到,无需关机重启也能直接启用。

尺寸方面,火神尺寸为349×160×71mm,是一张长度接近35cm的四槽显卡,一般的机箱不要说显卡立装了,就连放不放得下也是个问题。由于性能和功耗都有所升级,七彩虹推荐的电源功率从英伟达公版卡的850W以上提升到1000W。同时显卡也改用了符合PCIe 5.0定义的12VHPWR接口,考虑到大多数玩家用的还是旧标准的电源,七彩虹也随附了12VHPWR转8Pin电源的转接线,转为4个8Pin接口,按照一个8Pin150W来计算,火神功率应该在600W左右,比公版的450W高出不少。

值得一提的是,由于显卡“厚度”惊人,七彩虹还在火神侧边准备了磁力吸附的iGame智能屏,可以实时显示GPU/CPU的性能数据甚至是自定义内容。iGame智屏不仅可以横向吸附在显卡上,使用标配的USB底座可以将其单独放在桌面使用,也可以以立装的形式配合立装GPU固定,虽然我也不知道什么机箱能立着装下一张四槽卡就是了。

说到机箱,七彩虹同时也寄来一套iGame台式电脑主题的积木玩具,让你可以用另一种方式“装电脑”,还是非常有趣的。

测试平台

好马配好鞍,为了不让测试平台成为七彩虹iGame RTX 4090 Vulcan OC的性能瓶颈,我们为它准备了一套足够强大的测试平台:

CPU:英特尔12代酷睿i9-12900K主板:ROG MAXIMUS Z790 Hero显卡:七彩虹iGame RTX 4090 Vulcan OC内存:英睿达美光DDR5 4800 16GB×2硬盘:海盗船MP600 Pro LPX散热器:ROG STRIX LC II 360一体式水冷电源:ROG THOR II 1200W铂金电源系统:Windows 11 22H2

驱动版本:GameReady 521.90

这里也感谢七彩虹和ROG愿意借出相关硬件让我们进行测试,让我们有机会一睹“卡皇”的风采。

基准测试

首先,我们来看看七彩虹iGame RTX 4090 Vulcan OC基准测试的成绩。得益于GDDR6X 24GB高速大显存和七彩虹一键超频带来的额外核心主频,七彩虹火神不仅在4K测试中保持了出色的表现,同时也超过了英伟达RTX 4090FE的表现。只不过由于两者得分差距并不大,即使是差距最明显的Fire Strike Ultra测试两者的差距也不足3%。

而真正能体现出RTX 4090实力的,还得是DLSS 3.0。

DLSS 3.0性能对比

在20显卡发布时,英伟达发布了一项全新的技术——DLSS。简单来说,DLSS的工作原理是预渲染低分辨率的素材从而降低显卡负担,提高每一帧画面的生成速度,再通过深度学习(DL、Deep Learning)技术将低分辨率的图像超高采样(SS、Super Sampling)至目标分辨率。深度学习+超高采样,这也是DLSS这项技术名字的构成。

和常规的超采样技术不同,DLSS生成的画面不再是简单粗暴地将原始低分辨率“1:4”放大,而是利用深度学习,对画面进行分析后在原始像素周围智能生成原本不存在的新像素。这也是DLSS在高分辨率的情况下显著提升游戏运行帧率,且不容易损失原始画面的原因。

但由于早期技术限制,早版本的DLSS在运行上其实也有不少缺点。首先,DLSS需要游戏适配,在易用性上有待提升。其次,DLSS需要足够的原始数据支撑,这意味着DLSS更多地还是用于高分辨率屏幕,1080P分辨率下的表现并不显著。另外,即使DLSS利用了深度学习,但也会“画蛇添足”、生成错误像素的情况。最后,由于DLSS本质上有深度学习的过程,对画面有额外的运算步骤,因此每帧画面需要更多的帧生成时间,变相提高了画面延迟。

针对上述四个弊端,英伟达在DLSS 3.0中做出了专门的优化:更详细的帮助文档能让开发者更好地适配新技术,改进的DL策略不仅可以让GPU更好地理解游戏画面,同时也能有效减少超采样阶段的“错误像素”,让画面看起来更自然。而全新的DLSS帧生成技术与NVIDIA Reflex技术也能显著降低帧生成时间,不仅可以减少屏幕割裂、也能缩短帧生成时间,降低画面延迟。

我们先来看看帧率部分,根据英伟达的数据,DLSS 3.0能在4K光追的情况下带来300%的帧率提升。而根据小雷的实测,英伟达显然还是太保守了。

*以下数据与结论基于测试版驱动与测试版游戏

在4K分辨率关闭DLSS,最高画质与最高光追质量的情况下,赛博朋克2077在性能测试中的帧率只有41fps,渲染-显示时延为38.7ms。考虑到分辨率、画质与光追效果统统拉满,而且2077是一个开放世界游戏,41fps的表现其实也不算差了,只要画质或者光追效果稍微调低一点,满足4K60运行不成问题。

但如果我们打开DLSS 3.0(性能优先),同样画质与特效赛博朋克2077性能测试却可以实现平均137fps的惊人表现。可能有人会说平均帧率仅供参考,影响卡顿的是1%的表现,那火神的性能也不需要担心:即使是1%Low FPS也能维持到63fps,4K高刷新率畅玩不成问题。

另外,在NVIDIA帧生成技术和NVIDIA Reflex技术的帮助下,2077的渲染-显示时延也从原本的38.7ms降低至2.04ms,画面延迟大幅降低,操作少了“粘滞感”自然更跟手。

像2077这样fps提升超过300%的游戏还有不少,比如因周冠宇获得F1席位而出圈,但因游戏“换汤不换药”而褒贬不一的赛车游戏F1 22,4K分辨率最高特效且关闭DLSS的情况下巴林测试平均帧率只有90fps,1% 22fps、渲染-显示时延24.58ms。虽然这个表现已经秒杀了游戏主机,但对赛车游戏来说还远远不够。

但开启DLSS 3.0后,同样设置下的F1 22测试平均帧率一举来到210fps、1% Low也提升到68fps、渲染-显示时延更是低至2ms。大家可能比较熟悉的国产3A网友逆水寒,在4K拉满但关闭DLSS的情况下平均帧率只有17fps,根本无法“游玩”。但只要开启DLSS 3.0,平均帧率立即来到84fps。

不难看出,即使是4K最高画质+最高光追效果的这种极限情况下,开启了DLSS 3.0的七彩虹iGame RTX 4090 Vulcan OC依旧能流畅应对,无惧不讲道理的极限挑战。

DLSS 3.0画质分析

既然提到了F1 22和逆水寒,这里我们顺带可以讲一下DLSS 3.0除了帧率之外的另一个提升。之前说过,由于DLSS的工作原理是利用深度学习生成新的像素,所以在特殊情况下可能会错误渲染,更有可能影响画质。那么这种情况在RTX 4090以及DLSS 3.0身上还会出现吗?

先说答案:会。

在小雷测试的首批支持DLSS 3.0游戏中,DLSS的效果大致可以分为三种情况:画质提升、画质不变与“灵异事件”。

先说画质提升的部分,很多人认为DLSS既然是超采样的一种,那它的画质肯定不如原始高像素渲染。但实际情况并非如此。在赛博朋克2077的测试中,由于DLSS利用深度学习“强化”画面,因此在4K120录屏回放时,我们会发现在部分情况下,开启DLSS 3.0反而能获得比原生4K更清晰的画面。

以下演示如无特殊备注,左侧均为开启DLSS 3.0画面,右侧为关闭DLSS画面。

比如地面、排水口等规则图形在DLSS 3.0下就比原生4K画面更加清晰。

除了规则图形外,角色衣物上非规则的图像也能获得更清晰的展现。

Unity引擎的Enemies演示Demo的表现则更是出色。可能有人不知道,这个Demo并非播片而是实时画面渲染,我们可以在演示过程中随时切换DLSS 3.0开启或关闭。而开启DLSS 3.0后,人物衣物上的编织图案不仅比原始渲染更加清晰,同时也更有光泽。

逆水寒的表现有些特殊:在原始4K渲染的画面中,可能是游戏本身设计的原因,过高分辨率的原始素材让游戏画面出现了“颗粒化”的现象就像用画图的画笔直接图画出来的一样,这种情况在地面、柱子、树叶等纹理密集的地方非常明显。

但开启DLSS 3.0后,游戏不仅帧率有了明显提升,同时游戏画面看起来也更加自然。

3DMark DLSS测试、Lyra和微软飞行模拟等游戏的表现则较为均衡,画面没有明显变化,但开启DLSS后帧率却直线上升。

最后则是“著名”的F1 22,这款游戏自发布以来就存在开启DLSS出现鬼影的情况。在RTX 4090的测试中,鬼影和画面撕裂的情况虽然没有加剧,但也没有变少。由于画面高速运动,当轮胎与红白路肩“重叠”时,DLSS似乎无法分辨轮胎和路肩的边缘,这会导致轮胎边缘出现模糊的红白色块。路边护栏和灯柱也有相同的情况出现。

但更严重的还是悬浮在画面当中的HUD和UI控件,以右下角的菜单键为例,高速行驶的赛车几乎把整个菜单按钮都开成了“拖影”。这种情况在F1 22刚刚发布时就存在,没想到在现在依旧没有改善。但平心而论,这种情况说到底并不完全是游戏厂商的问题:DLSS的工作机制本身就会带来这个问题,F1 22只不过将这个问题呈现出来而已。

说完性能表现我们来看看显卡的功耗。根据FrameView抓到的数据,游戏测试期间GPU主频在2800MHz左右波动,最低为2790MHz,最高为2805MHz。GPU核心温度在79摄氏度至98摄氏度之间浮动,平均温度普遍在96摄氏度。

AD102A在哪里?

看到这里,相信大家对七彩虹iGame RTX 4090 Vulcan OC的表现也有了一定的了解。如果你有充足的预算,只想用最高的画质畅玩当下主流,甚至是未来几年内的主流大作,那RTX 4090毫无疑问是你当前唯一的选择。而在散热与主频方面有全面提升的七彩虹iGame RTX 4090 Vulcan OC,也绝对“卡皇”的有力竞争者。

但问题是当前4090采用的都是AD102-300-A1核心,而拥有18176个CUDA单元、主频能拉到2.9GHz的真正“满血AD102”,似乎还不见踪影。再联系到今年五月曾经曝光的所谓4090Ti FE散热器,我们不难推测出在RTX 4090之上,似乎还有一张深不可测的RTX 4090Ti顶级显卡。

回顾NVIDIA的产品线,曾经的TITAN已经“停更多年”,而RTX 40系在最初也有着4070/4080/4090这样的产品阶梯。考虑到现阶段英伟达只发布了4080和4090两款显卡来试探市场,不难发现英伟达手中还藏着一张“王牌”。

但从英伟达取消了“4070”这一行为来看,英伟达现阶段的首要任务似乎是想办法将30系显卡普及,换言之RTX 4090Ti短期内并不会出现。也就是说如果你想趁着双十一安排一台“游戏机皇”,那七彩虹iGame RTX 4090 Vulcan OC作为超越公版RTX 4090的选择,确实值得考虑。


做最“硬”的数码产品评测体验


????快来点击关注????


如您认为我们的内容有版权等问题,请联系:

邮箱:jubao@leikeji.com | 微信:leikeji004

我们会第一时间处理!