找回密码
 加入我们
搜索
      
查看: 17593|回复: 56

[显卡] 关于 AMD Anti-Lag 和 Nvidia Reflex

[复制链接]
发表于 2023-3-9 03:56 | 显示全部楼层 |阅读模式
本帖最后由 privater 于 2023-3-8 12:03 编辑

昨天在一个聊 FSR 3 大饼 的帖子里面吐槽了下,结果就有人跑来跟我对线说 AMD 有 Anti-Lag 哦,你 out 了。

我想说的是,这些对线的人估计自己都从没用过 AMD Anti-Lag,只因为 AMD 把这样一个选项丢在设置里面了,就以为这个功能可以对标 Reflex。

Anti-Lag 的官方的宣传稿:

AMD Software: Adrenalin Edition 中的 Radeon Anti-Lag(抗延迟)能够在显卡有局限的情况下降低输入延迟。 Radeon Anti-Lag(抗延迟)功能可以控制 CPU 工作的速度以确保不超过显卡太多,从而减少排队等待的 CPU 工作。 因此,Radeon Anti-Lag(抗延迟)可以将输入延迟缩短几乎一整帧1,从而恢复疾速响应的游戏体验。

dh3-033-1_0.jpg

而这个技术其实是对标 Nvidia 曾经的 NVIDIA Ultra Low Latency(NVIDIA 超低延迟模式),这个功能其实是随着 436.02 驱动推出的, 跟 Anti-Lag 差不多隔了 2 个月:
官方说明链接

实际作用和 AMD Anti-Lag 非常相似,都是优化显卡对 CPU 调度,当帧数很高时,GPU 优化渲染队列,减少输入延迟。
当您的游戏受 GPU 限制且帧速率介于 60 到 100 FPS 之间时,低延迟模式的影响最大,使您能够在不降低图形保真度的情况下获得高帧速率游戏的响应能力。


Screenshot 2023-03-08 at 11.24.42 AM.png

gamescom-2019-geforce-game-ready-driver-ultra-low-latency-nvcpl-option-alt-850px.png

而 Reflex 完全是另一种技术:

NVIDIA Reflex SDK:是面向游戏开发者的一套新 API,旨在减少和测量渲染延迟。通过直接与游戏集成,Reflex 低延迟模式能够让游戏引擎即时完成渲染任务,从而消除 GPU 渲染排队现象,降低 CPU反压。与现有的仅使用驱动的技术(如 NVIDIA 超低延迟模式)相比,这能提供更低的延迟。


然后花了大量篇幅讲系统延迟的产生原理和他们在每一种延迟上的解决办法:
有兴趣的可以去看原文,这里就不赘述了
Screenshot 2023-03-08 at 11.34.11 AM.png

简单的说 AMD Anti-Lag 和 Nvidia Ultra Low Latency 仅仅只是在 GPU 满载时,CPU 运行过快时 GPU 向 CPU 渲染队列的深度控制,从而减少一丁点的响应速度。
而 Nvidia Reflex 是开发者把 Reflex 库融入到游戏源代码中,它会自动分析游戏生成每一帧的过程去优化中间可能导致的延迟和排队现象,从根本上解决一切浪费时间的无效等待。

老实说聊了这么多干的,不如直接上评测结果,这是 Anti-Lag 在 堡垒之夜的测试结果:
你要说这是测试误差吧,打开后也确实有那么一丢丢提升
Screenshot 2023-03-08 at 11.30.19 AM Large.jpeg

然后再看看 Ultra Low Latency 和 Reflex 的效果:

可以明显的看到  Ultra Low Latency 跟之前的 Anti-Lag 几乎一样,仅仅只是减少一点排队延迟,基本没有任何实质上的改善,但是 Reflex 开启后明显把延迟降低了几乎一半,而且随着分辨率提升,效果反而更显著

Screenshot 2023-03-08 at 11.29.34 AM Large.jpeg

简单的说无论是 Anti-Lag 还是 Ultra Low Latency 技术,都只在在 GPU 渲染调度上修修补补,在 GPU 受限的情况下去搭配 CPU,而实际效果可以说是聊胜于无,而在实际应用中,大量的人抱怨 Anti-Lag 不仅没起到减少延迟的作用,反而让游戏更加卡顿。

Reflex 才是真正意义上从根本解决了延迟产生的源头,从而让系统整体响应变快,这不仅是让高帧数的游戏延迟更小,关键是让中低帧数的游戏,延迟也大量减小(4K+RT+Ultra)让玩家获得更加“跟手”的输入响应体验。

技术靠的是实力,不是取个像的名字就代表你也有了。就好比光追,三家都说自己有最牛逼的光追单元,实际效果呢? Intel 都不好意思宣传



所以对于 FSR 3 这种大饼,除非 AMD 有能力把自家的 Reflex 技术先搞出来让开发者集成到游戏里面,否则光说插帧,完全是画大饼,引用我在那个帖子的回复:

很多人只看到 DLSS frame generation,以为插帧就是 DLSS 3,其实 DLSS 3 背后的功臣是 Reflex 技术。

如果仅仅只有补帧,那么渲染延迟必然是翻倍的, 60 fps 插到 120 fps,帧延迟跟 60 fps 是一摸一样的 16.7ms,并不是真实 120 fps 对应的 8.3ms。
正是因为有 Reflex 减少了渲染延迟,才使得最终结果是 100fps,但是帧延迟降到 12ms 左右 虽然不如真正的 100 fps 的 10ms,但是也远好于不开 DLSS 3 的 16.7ms。

而 Reflex 是从 DLSS 2 时代就引入的技术,所以至少从那时起 Nvidia 就在铺垫 DLSS 3 了,而且让游戏开发者从 3 年前就开始集成 Reflex 技术,最终开启 DLSS 3 只是一个开关的事情。

而 AMD 仅仅只是发布了行似 DLSS frame generation 的 FSR 3 预告,AMD 对应的 Reflex 又在哪?开发者支持又在哪里?毫无意外即便是 FSR 3 真的如期发布了,有那么 1-2 个游戏展示,距离真的让开发者全盘接受 AMD 版本的 Reflex 又是好几年的时间和砸钱,那时候怕是 5090 Ti 都上市了。


发表于 2023-3-9 04:37 | 显示全部楼层
兄弟,这不是多么高级的技术,程序调个swap chain buffer数量和GPU频率的事情,既然都要上FSR3了一起给个开发指南就好了,我觉得甚至可以不需要专门的SDK,你拿光追来比,那你真是太看不起光追了。
发表于 2023-3-9 04:49 来自手机 | 显示全部楼层
看着楼上两位大佬的交流,瑟瑟发抖
 楼主| 发表于 2023-3-9 06:31 | 显示全部楼层
本帖最后由 privater 于 2023-3-8 15:47 编辑
LambdaDelta 发表于 2023-3-8 12:37
兄弟,这不是多么高级的技术,程序调个swap chain buffer数量和GPU频率的事情,既然都要上FSR3了一起给个开 ...


Talk is cheap,  Reflex 已经出来两年半了,AMD 对应的东西在哪?

如果 AMD 觉得这事很简单,不需要额外植入 SDK 和工具就能完成,那么可以先放出白皮书让大家看看它打算怎么实现,再不济也可以给我们看看对比效果。

同一个星球上,姑且就算 AMD 和 Nvidia 的工程师水平相当,那么一方能想到的处理方式,另一方也能想到,就像当初 AMD 推出 Anti-Lag,Nvidia 两个月后就搞出来 Ultra Low Latency,AMD 包装了 ReBar 为 AMD Smart Access Memory,Nvidia 三个月后也搞出来 ReBar 做类似的优化。

另外我作为一个旁观者,真不觉得 RT 光追单元堆料有啥难的,Intel Arc 第一次尝试光追单元就能做到 RTX 30 系甚至略好的水平,AMD 有什么借口让自己第二代光追单元比 RTX 20 还差?要么技不如人,要么打心底就没重视过光追,不想做好。

发表于 2023-3-9 06:44 | 显示全部楼层
本帖最后由 qiuhepeng 于 2023-3-9 06:49 编辑

东西还没出来,让子弹飞一会
发表于 2023-3-9 06:46 来自手机 | 显示全部楼层
本帖最后由 qiuhepeng 于 2023-3-9 07:04 编辑

到时候看实际效果,应该是一起优化过。关键是,fsr3会不会给6000开放,会不会像2一样n卡也能用。AMD喜欢开源
发表于 2023-3-9 07:44 | 显示全部楼层
privater 发表于 2023-3-9 06:31
Talk is cheap,  Reflex 已经出来快 2 年了,AMD 的东西在哪?

如果 AMD 觉得这事很简单,那么可以先放 ...


AMD觉得没必要做呗,而且提前录制和提交command list到command queue确实有助于提高GPU利用率,获得更高的帧数,毕竟全世界没几个人会真正去测量全系统延迟,而且游戏真有需要的话,也会自己去做这种事。至于白皮书,我想这种会自己写个最简单渲染器的人都会事情,没必要还出个白皮书吧。
虽然你说talk is cheap,这种事情用在网络辩论中,你应该先反省一下你自己,但是这东西我确实简单到甚至今天我上班摸鱼说不定就能做出来
如果我空闲时间够的话,今天就给你表演一个,就单纯用d3d12给你做出来一个演示。
最后吧,你扯再多这种间接的不能再间接的旁证,也没有我先给你讲讲这个怎么实现来的有力。

这东西你的连接已经说的很明白了,就是不让程序提前录制command list到command queue。在调用command queue的execute command list之后,通常会有一个fence用来确认新的back buffer是不是已经可以用,如果可用的话,就直接开始用对应的command allocator和对应的command list进行下一帧的命令录制,如果不可用才需要设置一个event来等待当前back buffer可用。而reflex的做法很简单,直接等待刚才才被提交的command list执行完毕,也就是command queue直接signal 改变fence的值,然后等待fence的值等于刚才改变的值,然后才进行下一次的录制和执行,这样command queue永远没有command list处于等待状态。这就完了。
发表于 2023-3-9 08:38 来自手机 | 显示全部楼层
还得看实际疗效才能下定论,不过论坛上对dlss3的批判基本上变成月经贴,想必这些人应该对类似的fsr3同样非常痛恨吧,毕竟都是骗人的把戏
发表于 2023-3-9 09:12 | 显示全部楼层
专门挑Hogwarts这款游戏去黑AMD的光追,你高兴就好
发表于 2023-3-9 09:27 | 显示全部楼层
atiufo 发表于 2023-3-9 08:38
还得看实际疗效才能下定论,不过论坛上对dlss3的批判基本上变成月经贴,想必这些人应该对类似的fsr3同样非 ...

那该批判还得批判啊,延迟高就踏马的垃圾,这种东西给游戏机用还差不多。
发表于 2023-3-9 09:31 来自手机 | 显示全部楼层
LambdaDelta 发表于 2023-3-9 09:27
那该批判还得批判啊,延迟高就踏马的垃圾,这种东西给游戏机用还差不多。 ...

5月前能看到rdna3新卡开卖吗?
发表于 2023-3-9 09:36 | 显示全部楼层
BFG9K 发表于 2023-3-9 09:31
5月前能看到rdna3新卡开卖吗?


不知道,有消息说有,我反正觉得rdna3,收个33玩玩就够了
发表于 2023-3-9 09:36 | 显示全部楼层
真技术突破还得看nv
农企能山寨出来廉价版就不错了,速度和质量别要求那么多
发表于 2023-3-9 09:37 来自手机 | 显示全部楼层
LambdaDelta 发表于 2023-3-9 09:36
不知道,有消息说有,我反正觉得rdna3,收个33玩玩就够了

我还以为3月能看到桌面7600XT,现在看是一点希望都没有了。
发表于 2023-3-9 09:41 | 显示全部楼层
关于Reflex,这里有游戏开发人员解释的很清楚   reddit.com/r/nvidia/comments/10qe2sc/nvidia_reflex_lowers_your_latency_by_up_to_60ms

"There's not much in depth to go TBH.

Is more of a technical thing regarding how an app main thread is managed and how the input is managed.

The essence behind Reflex is to decouple the input reading from the rendering thread and sync both threads ONLY when is a need, so the player can input all the time and the input and rendering thread are only syncing when the frame needs to be rendered and the input have to be displayed.

Since they can't 100% decouple it the input lag is reduced "only" by the time the input and the rendering are decoupled."


Reflex 本质上是将游戏的输入读取与渲染线程分离,并且仅在需要渲染帧和显示输入时同步。

所以它需要集成到游戏引擎里来获得最大效率
发表于 2023-3-9 11:57 | 显示全部楼层
Hogwarts 光追是根本就不能用的 我还玩的是empress的优化版
这游戏时不时fps会掉到很低 尤其是过场动画的时候  然后放一会就恢复
光追开了后掉的更厉害 到10fps左右
不管是什么显卡 这游戏都不应该开光追
发表于 2023-3-9 12:54 | 显示全部楼层
fatezeroart 发表于 2023-3-9 09:41
关于Reflex,这里有游戏开发人员解释的很清楚   reddit.com/r/nvidia/comments/10qe2sc/nvidia_reflex_lowe ...

有没可能虚幻引擎已经集成了reflex,开发者调用一下就好了
发表于 2023-3-9 12:54 | 显示全部楼层
LambdaDelta 发表于 2023-3-9 09:36
不知道,有消息说有,我反正觉得rdna3,收个33玩玩就够了

笔记本不会只有33吧?
发表于 2023-3-9 13:59 | 显示全部楼层
FelixIvory 发表于 2023-3-9 12:54
笔记本不会只有33吧?

那不会,至少有个对标上代3090桌面版性能的东西,但是我不知道是32还是31。
发表于 2023-3-9 14:02 来自手机 | 显示全部楼层
LambdaDelta 发表于 2023-3-9 13:59
那不会,至少有个对标上代3090桌面版性能的东西,但是我不知道是32还是31。 ...

那不就只能是31了,32怎么对标3090桌面版
发表于 2023-3-9 14:08 来自手机 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
发表于 2023-3-9 14:14 | 显示全部楼层
magiclu 发表于 2023-3-9 11:57
Hogwarts 光追是根本就不能用的 我还玩的是empress的优化版
这游戏时不时fps会掉到很低 尤其是过场动画的时 ...

我的4090全程可以维持在120fps以上
只有**试炼中的解密
在石柱子生成植物时那一瞬间会掉到90fps
发表于 2023-3-9 14:17 来自手机 | 显示全部楼层
作为8年游戏引擎开发经验的图形程序员,我跟你说这个玩意儿开发者真心想优化根本不需要reflex,reflex只是给你个方便的工具,优化好做一点。
发表于 2023-3-9 18:06 | 显示全部楼层
wawa 发表于 2023-3-9 14:14
我的4090全程可以维持在120fps以上
只有**试炼中的解密
在石柱子生成植物时那一瞬间会掉到90fps

我开的4k分辨率  dlss quality 不开光追玩的
3080ti
你这么高是因为分辨率开的低
发表于 2023-3-9 18:29 | 显示全部楼层
atiufo 发表于 2023-3-9 08:38
还得看实际疗效才能下定论,不过论坛上对dlss3的批判基本上变成月经贴,想必这些人应该对类似的fsr3同样非 ...

AMD的就不一样了不是吗?
发表于 2023-3-9 18:39 | 显示全部楼层
老黄赢了,但是毫不影响f**k nv的有效性。
只要fsr3.0出来后不太拒绝老设备,就值得喊yes,真以为需要fsr来拯救帧率的人有多少关心那破延迟?
发表于 2023-3-9 19:22 | 显示全部楼层
magiclu 发表于 2023-3-9 18:06
我开的4k分辨率  dlss quality 不开光追玩的
3080ti
你这么高是因为分辨率开的低 ...

我就是4k 所有能拉满的全拉满了
光追是开的极致

你可以指定个掉帧厉害的场景我截图给你看
真全程120fps以上,不说假话
只不过是dlss质量+dlss插帧实现的
一丁点卡顿都没有
除了我说的mei lin试炼石头长植物
发表于 2023-3-9 21:30 来自手机 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
发表于 2023-3-9 21:31 来自手机 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
发表于 2023-3-9 21:32 来自手机 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

Archiver|手机版|小黑屋|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806 上海市互联网违法与不良信息举报中心

GMT+8, 2024-10-5 06:30 , Processed in 0.016941 second(s), 6 queries , Gzip On, Redis On.

Powered by Discuz! X3.5 Licensed

© 2007-2024 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表