找回密码
 加入我们
搜索
      
查看: 4585|回复: 56

[显卡] Transformer 模型光线重构画质好,但是老卡性能损失严重

[复制链接]
发表于 2025-2-7 01:59 | 显示全部楼层 |阅读模式
HUB 最近做了个对比测试,通过降级的方式让几个支持光线重构的游戏跑 CNN 和 Transformer 模型作对比,画质上的提升是很明显的,但是我更感兴趣的是新卡对比老卡的性能损失。因为老卡的 Tensor Core 是比较少,也比较弱的,结果挺有意思:
https://www.youtube.com/watch?v=9ptUApTshik

50 和 40 系效能几乎一致,CNN 换 Transformer 后,性能损失大约 3-4% 都是可以接受的范围

Screenshot 2025-02-06 at 9.45.41 AM.png

Screenshot 2025-02-06 at 9.46.03 AM.png

30 就压力大了不少,性能减少 10% ,值得一提的是下面 Starwars 成绩中,其实手选 Transformer 模型选项是不生效的,实际游戏里面被驱动强制使用 CNN 模型,所以性能没有影响:

Screenshot 2025-02-06 at 9.46.16 AM.png

而 20 系更惨,性能几乎少了 1/3:

Screenshot 2025-02-06 at 9.46.31 AM.png

所以结论就是:

  • Tensor Core 在曾经的 20 系里面是个边缘性存在,而且 20 系确实是性能最低的,但是新款的 40,50 系都有所加强,而且可以遇见的未来,在图形性能已经难以爬升的时候, Nvidia 会进一步加强 Tensor Core 的数量和性能,用更多的 AI 魔法来取代传统渲染。
  • 50系 的 Tensor Core 似乎没有比 40 系更好,性能影响的幅度都差不多,进一步坐实了 50 就是 40 系小改款的说法。
  • 随着 Tensor Core 和 AI 研究的推进,画质确实会有改进,但是对新卡会有更好的发挥,老卡已经力不从心。
  • 警惕 Nvidia 驱动里面的手脚,可以看见老卡被驱动强制锁定 CNN,但是游戏里面确能选择 Transformer 模型会让很多人产生困惑,说明性能的衰减都在 Nvidia 的控制之中,这事情其实让人想起当初黑猴的测试,一些选项虽然能启动,但是并没生效,所以初期跑出来的各种测试天差地别。
发表于 2025-2-7 02:03 来自手机 | 显示全部楼层
确实我的3080在赛博朋克2077中,更新后,只切换了cnn到变形金刚,帧数明显下降,卡顿增加。
发表于 2025-2-7 02:10 | 显示全部楼层
所以到底升级了个啥?
 楼主| 发表于 2025-2-7 02:14 | 显示全部楼层
赫敏 发表于 2025-2-6 10:10
所以到底升级了个啥?

画质更好了,过去光线重构的很多缺点,现在的 Transformer 模型光线重构解决了,但是依然还有提升的空间。

简单的说光线重构差不多经历了 DLSS 1 那种完全没法忍受的画质 -> DLSS 2 大部分可以接受的水平。
 楼主| 发表于 2025-2-7 02:15 | 显示全部楼层
a1929598615a 发表于 2025-2-6 10:03
确实我的3080在赛博朋克2077中,更新后,只切换了cnn到变形金刚,帧数明显下降,卡顿增加。 ...

这就是为啥老黄允许老卡使用 DLSS 4 的模型改进吧,让你们体会到画质增强的同时,性能再降一点,利于升级
发表于 2025-2-7 05:32 来自手机 | 显示全部楼层
这样看dlss 3的模型吃掉了好多的细节啊。
发表于 2025-2-7 05:45 | 显示全部楼层
说到驱动做手脚,我这4090fe最新驱动默认跑tse分数只有19200了,换回24年4月份的552.22驱动之后变回了19800,对比了下两版驱动的详细分数,差距主要在tse第一个场景的帧数上,差了有6.5%,奇怪的是第二个场景帧数却没区别
发表于 2025-2-7 06:39 | 显示全部楼层
不过30系现在也不配开光追啊,无所谓了
倒是DLSS的新旧模型有性能对比吗?我记得以前树导有测试过游戏时就算是3090的tensor core负载峰值也不会超过50%的,这新模型消耗还能翻倍的吗?
 楼主| 发表于 2025-2-7 07:17 | 显示全部楼层
掩不住的锋芒 发表于 2025-2-6 13:32
这样看dlss 3的模型吃掉了好多的细节啊。

最恶心的还是 dlss 4 不出来,没人对 dlss 3 的画质质疑,等 4 一出来,才发现原来不是游戏的问题,是重构技术的限制。

那完全可以质疑,如今的 4 也就是半吊子东西,等 5 出来,老黄又可以吹画质大大改善。

这跟过去画质本身是个恒定量,显卡无论新旧只有性能差别的范式被打破了,而且解释权永远在老黄手上。
发表于 2025-2-7 07:52 来自手机 | 显示全部楼层
privater 发表于 2025-2-7 07:17
最恶心的还是 dlss 4 不出来,没人对 dlss 3 的画质质疑,等 4 一出来,才发现原来不是游戏的问题,是重 ...

对啊,我之前一直说dlss降画质忍不了,一堆人说我分辨率低了。感觉一堆人自适应了。

现在是缩纹理,缩画质,来搞光追。关键这个视频对比里很多光追投影都是错的,乱的。

不明白为什么舍本逐末,纹理,画质,材质,贴图质量才是最重要的吧。哪怕2077全光追也有很多穿帮的地方,以性能为代价,还不如做的好的光影本身烘焙好的有些。

关键很多人像被驯化了dlss 4不出来就不知道dlss 3缩了画质。这些和不开原画质对比肯定能比较出来的。
发表于 2025-2-7 08:02 | 显示全部楼层
本帖最后由 yangzi123aaa20 于 2025-2-7 08:03 编辑
privater 发表于 2025-2-7 07:17
最恶心的还是 dlss 4 不出来,没人对 dlss 3 的画质质疑,等 4 一出来,才发现原来不是游戏的问题,是重 ...


那你用不支持光线重构的A卡试试还有没有这些细节
光线重构本来就是“脑补”出来的画面,升级了模型能脑补的更多了而已
发表于 2025-2-7 08:13 来自手机 | 显示全部楼层
privater 发表于 2025-2-7 02:15
这就是为啥老黄允许老卡使用 DLSS 4 的模型改进吧,让你们体会到画质增强的同时,性能再降一点,利于升级 ...

跟10系能跑portal royal一样,不过没一个游戏支持的
发表于 2025-2-7 09:48 | 显示全部楼层
wjm47196 发表于 2025-2-7 08:13
跟10系能跑portal royal一样,不过没一个游戏支持的

战地5 地铁离去当时10系都能开光追,帧数下降幅度取决于塞了多少光线追踪特效,战地5 1080都能勉强玩,地铁离去用1080ti帧数都很差
发表于 2025-2-7 09:51 | 显示全部楼层
本帖最后由 PPXG 于 2025-2-7 09:52 编辑

我更好奇这20系 30系性能掉这么多的原因是真的tensorcore落后还是显卡本身基础性能就差,比如可能transformer模型在某个目标帧数下需要满足一个基础的性能阈值,低于这个阈值会拖慢DLSS流程的速度之类的

应该拉出来2080S 3060Ti 4060这几张传统光栅性能差的不多但是不属于同一世代的卡同台竞技的
发表于 2025-2-7 10:02 | 显示全部楼层
privater 发表于 2025-2-7 07:17
最恶心的还是 dlss 4 不出来,没人对 dlss 3 的画质质疑,等 4 一出来,才发现原来不是游戏的问题,是重 ...

其实就看能不能接受,忘了之前看的哪个媒体提到原本CNN模型在2077里数据终端顶部那个半透明光罩特效关系在某些纯色背景下会出现关系错误,还有一些栅栏上的闪烁图标采样错误,即使transformer模型也有缺陷。

然后笑死,我2077玩了一百多个小时愣是没发现有这问题,而且我做DLSS开关画质对比的时候喜欢去来生 樱花市集 扭扭街 长滩涂料厂这类地方,截图放大盯帧也刚好遇不到这类场景,给我的感觉就是这开关DLSS好像确实也看不出啥区别啊

之前遇到的DLSS就算刚打开就发现很明显的画质劣化的游戏也就黑神话第一章 第三章 花果山这种植被和阴影很细密的场景,开DLSS会明显感觉树叶和阴影精度下降造成的闪烁问题,哪怕4K+DLSS质量都能看出来区别
 楼主| 发表于 2025-2-7 10:32 | 显示全部楼层
本帖最后由 privater 于 2025-2-6 23:01 编辑
PPXG 发表于 2025-2-6 18:02
其实就看能不能接受,忘了之前看的哪个媒体提到原本CNN模型在2077里数据终端顶部那个半透明光罩特效关系 ...


这其实不是人的问题,人在实际看到更好的画质前,无法预料更好的画质是什么样子,只是吃厂商喂过来的东西。

我有很多同事只玩主机,从远古时代到现在,30fps 的游戏花了上千小时,你问他卡不卡,人家都毫无察觉,直到你把他邀请到家里,4k 120 hz OLED 电视面前玩上 2 小时,再回家拿起手柄,顿时不香了。想换 PC,我跟他们都说别折腾了,你们的水平连驱动都装不了。等两周,人家又适应 30fps 960-720p 插值 4k 全 low 画质了——人的适应性确实很强,但是你以后再跟他们提起 PC 和主机,他们都会有很正常的反应了,再也不会坚持说两者差别不大。

画质是个比较级,但是核心还是玩,很多时候画面动起来,时间一拖长,你真不会在乎这个地方是不是缺了个特效,那里贴图是差了一个档次。

这个帖子不是想说 DLSS 怎么样,而是一个厂商现在垄断了对什么叫画质的解释权,什么贴图精度,建模不重要,鬼影,粒子可以自适应,哪怕帧数都能靠拼,一切为所谓的光追服务,这是我觉得最要命的。
发表于 2025-2-7 10:41 | 显示全部楼层
privater 发表于 2025-2-7 10:32
这其实不是人的问题,人在实际看到更好的画质前,无法预料更好的画质是什么样子,只是吃厂商喂过来的东西 ...


对的,核心还是玩,玩游戏最重要的一帧,就是你点击“开始游戏”的那一帧
发表于 2025-2-7 10:45 | 显示全部楼层
掩不住的锋芒 发表于 2025-2-7 07:52
对啊,我之前一直说dlss降画质忍不了,一堆人说我分辨率低了。感觉一堆人自适应了。

现在是缩纹理,缩画 ...

阁下一句话 做好光影 知不知道就是是R星也要8年才能做出荒野大镖客 开游戏公司亏死 DLSS本质是加速游戏工业生产力 好事 天大的好事
发表于 2025-2-7 10:48 来自手机 | 显示全部楼层
privater 发表于 2025-2-7 10:32
这其实不是人的问题,人在实际看到更好的画质前,无法预料更好的画质是什么样子,只是吃厂商喂过来的东西 ...

由奢入俭难,想抛弃对画面的坚持堪比戒D,不对,可能还更难受,降画质宁愿不玩
发表于 2025-2-7 10:57 来自手机 | 显示全部楼层
本质上还是对老黄的自适应容忍度高
发表于 2025-2-7 11:02 | 显示全部楼层
BloodRaining 发表于 2025-2-7 10:45
阁下一句话 做好光影 知不知道就是是R星也要8年才能做出荒野大镖客 开游戏公司亏死 DLSS本质是加速游戏工 ...

结果大表哥2依然存在光照处理的bug
发表于 2025-2-7 11:04 | 显示全部楼层
我黑猴和2077反而都有提升 为什么呢 4090
发表于 2025-2-7 12:25 | 显示全部楼层
我说实话 动起来差别不是很大,有些效果甚至可能是单纯调整temporal参数就可以实现,不一定是transformer的效果
发表于 2025-2-7 12:31 | 显示全部楼层
glancing angle甚至开倒车。。。
图像_2025-02-07_123130208.png
发表于 2025-2-7 12:54 | 显示全部楼层
这个模型的优秀之处不是在于开启DLSS性能档吗
发表于 2025-2-7 13:33 | 显示全部楼层
privater 发表于 2025-2-7 10:32
这其实不是人的问题,人在实际看到更好的画质前,无法预料更好的画质是什么样子,只是吃厂商喂过来的东西 ...

分析得很有道理。
发表于 2025-2-7 13:53 | 显示全部楼层
本质上光线跟踪太耗性能了,要达到离线渲染的效果还需要硬件性能数量级的提升,只有靠这种方式去曲线救国。
发表于 2025-2-7 13:56 来自手机 | 显示全部楼层
trans需要有个定论,3月要升级显卡了
发表于 2025-2-7 13:59 来自手机 | 显示全部楼层
4070跑了第一后裔,性能确实没看出来有损失,dlss画质确实更清晰了,不过目前最新的光线重构有一些小bug
发表于 2025-2-7 14:00 | 显示全部楼层
BloodRaining 发表于 2025-2-7 10:45
阁下一句话 做好光影 知不知道就是是R星也要8年才能做出荒野大镖客 开游戏公司亏死 DLSS本质是加速游戏工 ...

加速游戏工业发展为什么要玩家买单, 而且要高价买AI 侧重的显卡芯片?


更多粗制滥造的游戏,比如2077 ,BUG 没搞清楚就发售,然后搞光追,哈哈。
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

Archiver|手机版|小黑屋|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806 上海市互联网违法与不良信息举报中心

GMT+8, 2025-2-20 05:32 , Processed in 0.014564 second(s), 6 queries , Gzip On, Redis On.

Powered by Discuz! X3.5 Licensed

© 2007-2024 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表