【GDC2025】DXR 1.2推出&神经网络渲染&Cooperative vectors即将于SM6.9实装

dange66 发表于 2025-3-21 13:37

本帖最后由 dange66 于 2025-3-21 16:29 编辑

https://devblogs.microsoft.com/directx/wp-content/uploads/sites/42/2025/03/Slide44.jpg

微软在刚举办的GDC2024上宣布即将推出新的DirectX Raytracing 1.2标准，引入了OMM和SER两个特性：

Opacity micromaps significantly optimize alpha-tested geometry, delivering up to 2.3x performance improvement in path-traced games. By efficiently managing opacity data, OMM reduces shader invocations and greatly enhances rendering efficiency without compromising visual quality.

Shader execution reordering offers a major leap forward in rendering performance — up to 2x faster in some scenarios — by intelligently grouping shader execution to enhance GPU efficiency, reduce divergence, and boost frame rates, making raytraced titles smoother and more immersive than ever. This feature paves the way for more path-traced games in the future.
这两个名词乍看很眼熟，搜了下果然跟Nv在40系架构上画的饼一样（这下老黄又喝到汤了
以前要游戏开发商合并老黄专门维护的UE的nvrtx分支或者额外集成老黄的SDK才能用到这些特性，现在进入DX标准后应该方便很多。

GDC上还额外提到了次世代的神经网络渲染以及DX的Cooperative vectors扩展，预计会在四月份的Shader Model 6.9上实现。
据说半条命2的RTX重制版用了neural rendering，但它是DXVK转译的好像不太方便profiling，不太确定DLSS4新模型+神经网络渲染下tensor core是否够用。
lz就只挑了2077下DLSS4帧生成/DLSS4 Transformer/DLSS3 CNN的Tensor core使用情况以供参考(测试环境为i5-12600kf+4070ti, 4k DLSS平衡，测试工具Nsight graphics)：

首先是参照对象，只开FSR3下tensor core利用率为0，和理论相符：

开启XeSS上采样+DLSS4 FG后，tensor core利用率大概在6%上下，插帧占用很小：

开启DLSS4 Transformer模型，关闭帧生成，占用在40%~60%，负载略重：

开启DLSS3 CNN模型，关闭帧生成，占用在16%上下，轻微负载的水平：

测试结果省流，FG占用~6%，DLSS CNN占用~16%，DLSS Transformer占用~60%，TF模型消耗大的有点出乎意料，
不知道会不会和后面的 neural rendering 抢资源。

附一个显卡支持特性的列表：

dange66 发表于 2025-3-21 13:40

忘了贴原文地址：https://devblogs.microsoft.com/directx/announcing-directx-raytracing-1-2-pix-neural-rendering-and-more-at-gdc-2025/

panzerlied 发表于 2025-3-21 13:43

很好的测试

dange66 发表于 2025-3-21 14:11

panzerlied 发表于 2025-3-21 13:43
很好的测试

柯基佬高强度刷论坛啊[傻笑]

tengyun 发表于 2025-3-21 15:06

破案了，30系不让插帧，就是老黄故意的[傻笑] 什么狗屁算力不行。

真正吃算力的居然是TF模型。

PolyMorph 发表于 2025-3-21 15:14

本帖最后由 PolyMorph 于 2025-3-21 15:24 编辑

5090跑神经渲染30帧不到，大家尽快升级6090

路西法大大 发表于 2025-3-21 15:16

本帖最后由路西法大大于 2025-3-21 15:18 编辑

tengyun 发表于 2025-3-21 15:06
破案了，30系不让插帧，就是老黄故意的什么狗屁算力不行。

真正吃算力的居然是TF模型。 ...

所以好像是有破解的，不过很麻烦。新的AI插帧对原始帧影响比原本用的光流算法小太多了

pdvc 发表于 2025-3-21 15:17

T模的tensor占用有点狠啊，不过实测性能只损失了10%。

aibo 发表于 2025-3-21 15:25

我觉得从图灵开始，dx12的新特性就是重新打包黄的那一套。
所以实际上变成了（特性上）黄卡战未来了[困惑]

PPXG 发表于 2025-3-21 15:55

aibo 发表于 2025-3-21 15:25
我觉得从图灵开始，dx12的新特性就是重新打包黄的那一套。
所以实际上变成了（特性上）黄卡战未来了 ...

现在感觉directX特性支持已经变成AMD被NV牵着鼻子走了，DX8 DX9时代两家竞相讨好微软对新特性做支持的情形不复存在了[偷笑]

gartour 发表于 2025-3-21 15:57

aibo 发表于 2025-3-21 15:25
我觉得从图灵开始，dx12的新特性就是重新打包黄的那一套。
所以实际上变成了（特性上）黄卡战未来了 ...

A卡以前的战未来常常是初始驱动太烂，发挥不了全部性能，发布一段时间后才慢慢好转。客观上给人“战未来”的感觉。现在也还可以继续这样玩。

atiufo 发表于 2025-3-21 16:20

本质就是把nv的几个技术整合进来形成行业标准

BloodRaining 发表于 2025-3-21 16:24

光追和神经网络渲染都不是英伟达发明，本来就是整个计算机图形学界认可的发展方向。尤其是光追。只是说英伟达率先引入自己显卡里，做的相对更完善更好。

koney 发表于 2025-3-21 16:26

raytracing 2018年出来的，2028年普及度都不一定能有50％

dange66 发表于 2025-3-21 16:54

tengyun 发表于 2025-3-21 15:06
破案了，30系不让插帧，就是老黄故意的什么狗屁算力不行。

真正吃算力的居然是TF模型。 ...

插帧对cost很敏感，可能每个中间帧只有几ms的预算，超出这个时间计算出来的帧会被直接丢掉。

40系以上的大L2是基础，据说30系也只有高端的GA102几款能达到插帧能用的水平，中低端开了基本没什么效果，这个可能panzerlied知道的多。

PolyMorph 发表于 2025-3-21 17:18

BloodRaining 发表于 2025-3-21 16:24
光追和神经网络渲染都不是英伟达发明，本来就是整个计算机图形学界认可的发展方向。尤其是光追。只是说英 ...

a卡现在还没有硬件bvh遍历

页: [1]

Chiphell - 分享与交流用户体验's Archiver

【GDC2025】DXR 1.2推出&神经网络渲染&Cooperative vectors即将于SM6.9实装