实测 RTX 4090,性能爆表?
转自:机器之心 | Steven Walton
顶级游戏大作,全都可以开 4K144Hz 高特效,而且功耗没有增加,现在压力和瓶颈全到了 CPU 上,这就是 RTX 40 时代。
9 月 21 日,英伟达在 GTC 大会上发布了全新架构的 GeForce RTX40 系列,新显卡因为台积电的 5nm 制程,全新光追处理器和 DLSS 3 实现了性能的大幅提升。
在今天凌晨,各家媒体陆续放出了旗舰版本 RTX 4090 的测评文章,看起来最高的这个版本果然和之前英伟达声称的一样性能强大,而且「最有性价比」。
RTX 4090 基于 AD102 芯片,尺寸为 608.4 平方毫米,比 RTX 3080 和 3090 使用的 GA102 小约 3%。从上代 Ampere 的三星 8N 工艺转移到台积电的 4N 工艺,让 Ada Lovelace 架构的 4090 晶体管数量增加了 170%,从 283 亿增加到了疯狂的 763 亿个。
与 RTX 3090 Ti 相比,4090 的流处理器、CUDA 核、Tensor 核及 RT 核和纹理单元增加了 52%。ROP 计数增加了 57%,加速时钟频率提升了 35%。使用的还是相同的 21 Gbps GDDR6X 内存,在 384 位宽的内存总线上仍有 24GB 内存,所以是相同的 1008 GB/s 内存带宽。GPU 还保留了相同的 PCI Express 4.0 x16 接口。
英伟达声称 RTX 4090 的功率额定值为 450W,与 3090 Ti 相同,而最高温度已从 93℃ 略微降低到 90℃ 。最低电源要求为 850W,测试时也用了该功率的电源。
有人还放出了和 X Box X、PS5 对比的照片,是这样的:
散热是稳了,可是也不知道怎么塞进机箱?
在设计方面,Founders Edition 版的 RTX4090 看起来与 3090 相似,但有一些相当明显的变化。最引人注目的是显卡的宽度。3090 的宽度为 52 毫米,而新的 RTX 4090 的宽度为 61 毫米。尽管尺寸有所增加,但两种型号的重量都相同,均为 2190 克。
另外就是 NVLink 连接器的缺失,英伟达已经取消了 NVLink,取而代之的是依赖于 PCIe 4.0 总线。其他的重大变化是已升级到 PCIe 5.0 规范的 16 针电源输入,也称为 super catch 12VHPWR 电源连接器。
单个 PCIe 5.0 电源连接器可提供高达 600W 的功率,而以前需要四个 8 针电源连接器。你不需要更换符合 PCIe 5.0 标准的 PSU,因为 RTX 4090 自带一个 4x8 针到单个 16 针适配器,类似于 3090 Ti 提供的 3x8 针到 16 针适配器。
除了各类核心的数量提升,GeForce 40 还引入了 DLSS 3,这是目前 GeForce 40 系列独有的功能。
这种新的升级 / 帧速率倍增技术令人兴奋,在游戏的测试中可以展示一些结果,但对于 DLSS 3 的全面分析还要继续等待更多数据。DLSS 3 需要大量的测试和分析,这远远超出了首批评测的测试范围。
为了进行测试,所有 GPU 都设置为以官方时钟规格运行,测试平台的 CPU 是 Ryzen 7 5800X3D,在 MSI MPG 上使用 32GB 双列、双通道 DDR4-3200 CL14 内存 X570S Carbon Max WiFi 主板。
游戏基准评测
在「看门狗:军团」(1440p)的游戏测试中,GeForce RTX 4090 似乎并不是非常惊艳的,但它确实是目前为止最快的 GPU——比 6950 XT 提速了约 9%。
RTX 4090 比 RTX 3090 Ti 提速了 22%,这和二者的价格差距相应。在测评中,RTX 4090 的问题似乎不大,反而是测试平台的 CPU 5800X3D 成了系统的主要瓶颈。
因此,测评团队将分辨率提高到 4K 来测试 RTX 4090 的帧率到底有多高,结果发现 4090 比 6950 XT 高了 60%,比 3090 Ti 高了 64%,这才是真正的 4K 的高刷新率游戏体验。
同时,RTX 4090 再次比 3090 Ti 帧率高出 60%,尽管与 Radeon 6950 XT 的差距一直在增长,现在我们看到 AMD 的差距为 102%。
「孤岛惊魂 6」通常在 A 卡上性能更好,在 1440p 时测试平台的 CPU 瓶颈效应严重,使用 RTX 4090 只能获得 9% 的性能提升,平均刷新率为 187 fps。
转换成 4K 分辨率后,RTX 4090 带来了巨大的性能增益,平均刷新率是 164 fps,比 6950 XT 提升了 34%,提升幅度较大,相比于 RTX 3090 Ti 的提升幅度则更大,达到了 50%,比标准 3090 甚至提升了 60%。
「刺客信条:英灵殿」也是一个在 A 卡上运行良好的游戏。测评结果表明,在 1440p 情况下,RTX 4090 的帧率比 6950 XT 高了 27%,这是一个不错的增益,但远不如其他对比提升,并且 RTX 4090 也仅比 3090 Ti 提高了 37%,而不是 4K 时的 60% 增益。
另一款游戏「赛博朋克 2077」,对 CPU 和 GPU 的要求都很高。而安装了 RTX 4090 后,我们几乎可以肯定 CPU 会受到 1440p 的限制。测评结果表明,RTX 4090 在赛博朋克上的平均刷新率为 145 fps,比 6950 XT 高 33%,比 3090 Ti 高 36%。
然而,4K 情况下的性能增益并没有预期那么大,RTX 4090 比 3090 Ti 提升了 51% ,但 RTX 4090 远远超过了 60 fps,这是其他 GPU 远远达不到的。
性能总结
Techspot 的测评共在 13 个游戏上进行了测试,在 1440p 分辨率时,GeForce RTX 4090 的平均性能大致如下:输出帧率为 219 fps,比 6950 XT 高 44%,比 3090 Ti 高 45%。
这些都是巨大的提升,但仍不能完全说明 RTX 4090 的优秀性能,因为测试过程中系统的 5800X3D 多次受限,尽管 5800X3D 已经是一个非常快的游戏 CPU 了。这说明目前最快的游戏 CPU 之一仍然会在 1440p 情况下给 RTX 4090 造成严重的性能瓶颈。
在 4K 游戏中,GeForce RTX 4090 平均比 RTX 3090 Ti 高 59%,比 6950 XT 高 71%,这些都是巨大的提升。同样令人印象深刻的是,RTX 4090 在 4K 时的平均帧率为 145 fps,正好是很多高刷显示器的上限。这确实是第一款能够提供高刷新率游戏体验的 4K GPU。
此外,使用 Ryzen 7 5800X3D 在 1080p 时,RTX 4090 比 3090 Ti 高 28%,比 6950 XT 高 24%。
光追和新一代 DLSS
赛博朋克 2077 是首批支持 DLSS 3 的游戏之一,下面来看看它的表现。请注意,这只是初步的评测。
在使用高质量预设的 1440p 时,RTX 4090 在赛博朋克中的平均帧率为 145 fps,比 3090 Ti 和 6950 XT 高约 35%。但是,启用 DLSS 3 后性能提高了 90%,达到 276 fps。
DLSS 3.0 的真正优势可以在启用超高质量光线追踪的情况下看到,此处 RTX 4090 在低分辨率的平均帧数为 191 fps,比 DLSS 2 高了近 70%。然后在 4K 时,GeForce RTX 4090 开 DLSS 3 输出了 113 fps,比 DLSS 2 提升了 43%。
功耗
摩尔定律终结之后,提升芯片性能的方式经常是增加功耗,这一点在旗舰 GPU 上尤为明显。测试者尝试以 1440p 玩「光环:无限」观察总系统功耗,可看到 RTX 4090 实际上并没有想象的那么糟糕。事实上它的性能比 RX 3090 Ti 高 50%,同时功耗更低。RTX 4090 和 3090 Ti 都是 450W 显卡,所以从技术上讲,它们的功耗应该差不多。
测试使用的 RTX 3090 Ti 将总系统使用率提高了约 50W,因为市面上并没有 3090 Ti 的 Founders Edition,这里使用的是使用高于规格电压的 MSI 非公版。尽管已将其降频至官方版本的规格,这在性能方面降低了几个百分点,但更高的电压意味着功耗仍然高于基本型号。
下面来看看 RTX 4090 的能效如何,通过将帧速率锁定在 90 fps,我们可以看到每个 GPU 使用了多少功率。
固定帧率后,RTX 4090 仅消耗 215W,这意味着对于相同水平的性能,3090 Ti 需要多消耗 93% 的功率,而 6950 XT 需要多 40% 的功率。因此,尽管人们都在谈论 RTX 4090 会功耗爆炸,但它在效率方面实际上是非常令人印象深刻的。
散热
在冷却方面,FE 版的 RTX 4090 在安装在 ATX 机箱内且门关闭的 21℃ 房间内经过一个小时的高负载运行后,热点达到了 83℃ 的峰值。GPU 的平均温度达到了 72℃ 的峰值,内存温度达到了 84℃ 的峰值,考虑到运行的内容的话,所有这些都是可以接受的。
另外,风扇转速仅为 1600 RPM,运行音量仅为 42 dBA,比过去测试过的大多数高端甚至中端显卡都要安静。在这个测试中,核心时钟速度相当稳定地保持在 2730 MHz,内存运行在 21 Gbps,最后 GPU 功耗平均为 415W。
性价比
对于性价比,我们的使用每帧成本进行分析,看起来 RTX 4090 与 Radeon 6950 XT 和 6900 XT 水平大致相当,但比我们认为的 RTX 3080 和 6800 XT 中上一代高端 GPU 的合理选择成本高出 30% 以上 — 实际上它比 6800 XT 贵了约 50%。
如果对比的是实际售价,RTX 4090 的吸引力就降低了。在 1440p 分辨率下性价比要比 3090 Ti 略差,使其成为市场上每帧成本和整体价格最昂贵的 GPU。
4090 显然在 4K 分辨率下的效率更高,在这里我们看到它比 6950 XT 稍微好一点,也比折扣后的 RTX 3090 略好,这对于高级产品来说是相当不错的。
不过 3070 等中高端的显卡总是可以提供更高的性价比。
总结
GeForce RTX 4090 显然是块非常快的 GPU,人们对于它的主要担忧是定价和功耗。很明显,它相比上一代功耗没有增加。另一方面,由于性能提升幅度很大,它的效率也增加了。你可以看到,当限制帧速率时,RTX 4090 在游戏时消耗的功率比 3090 Ti 少近 50%,比 6950 XT 少近 30%。
不过这只是新世代的一个开端:在更多 RTX 40 Ada Lovelace GPU,当然还有与之竞争的 AMD RDNA3 GPU 出现之前,很难说 RTX 4090 是不是最具性价比的那一个。
但如果不计较是否交了智商税的问题,RTX 4090 作为显卡是值得赞赏的,这是我们第一次能在不影响视觉效果的情况下享受真正的 4K 高刷新率游戏体验。光线追踪终于成为了一种无忧无虑的选择,虽然 DLSS 仍然很重要,但在 4K 下享受超高质量光线追踪的游戏,如赛博朋克 2077、看门狗,同时帧速率保持在 60 fps 以上是一种特殊的体验。
DLSS 3 是一个令人兴奋的新功能,但我们需要深入研究它,然后才能进一步评论它的价值。
当然,这只是对于公版进行的评测,我们在仅使用原先的 Corsair RM850x 850w PSU 的情况下正常运行了 4090,FE 卡在满负荷下长时间运行非常安静,不比优质的中档显卡更吵,而且功耗并不高。
这并不是说 RTX 4090 适合所有人。它的价格超过一万块钱,不过如果你决定购买 4090 的话应该不会有太多麻烦,库存显然很充足。
对于大多数人来说,使用一半价格,或是四分之一价格的 GPU 来享受游戏才是正常情况,我们可以等待 RTX 4070,当然还有 AMD 即将推出的 RDNA 3 系列。
参考内容:
https://www.theverge.com/23398201/nvidia-rtx-4090-review-test-benchmark
https://www.techspot.com/review/2544-nvidia-geforce-rtx-4090/
推荐阅读
微信扫码关注该文公众号作者