关于5000系列4:2:2 10bit的解码支持所有你想要知道的~

nApoleon · 发表于 2025-1-18 21:17

是不是NV给Intel专利费了?管它呢...反正就是这次开始终于支持了~

和Intel的Arc独显不一样的是,关于这个我单独说下,Intel的Arc从高到低不同产品针对4:2:2 10bit的解码/编码处理能力其实是相同的,因为处理这个编码的编解码器不同GPU(Intel Arc)规模是相同的,但是因为不同的卡显存大小不同,所以没人用A380去干剪视频的活,但实际上如果不爆显存A380干的效果不会比A770慢.

好了,回到NV的5000系列,这次有了新的编码器以及新的解码器,然后因为是新的然后就很自然地(真的那么自然么?)开始支持4:2:2 10bit这个格式了,但和Intel Arc不一样的是,5000系列这个编解码器的数量是不统一的,90(包含90D)是3个,80是2个,往下就是1个.

然后就是效率了,有人肯定觉得编解码器越多越好,实际上是需要使用的软件支持,大家可以理解为这个编解码器就是单线程/双线程/三线程,软件支持的情况下就是拆分让多个编解码器分别去干活最后拼凑在一块,注意因为有拼凑所以并不是直接2个就是翻倍的关系,中间会有(效率)损耗,然后呢不同的卡频率越高也能提升编解码器的干活效率.

以上就是5000系列关于4:2:2 10bit格式编解码的理论逻辑,我用PY换来的,实际如何还是得后续实测了才知道,但不差钱单纯作为生产力来说却是Intel Arc最强的优势应该是无了,但Intel核显的优势我依然觉得不是AMD CPU+NV GPU的组合可以取代的,因为核显+独显是可以一起协调一起干活的,同时Intel的核显属于出小钱办大事,除非AMD的CPU在纯性能上真的遥遥领先Intel,不然不是洗,视频生产力我依然支持Intel的CPU去,以上.

hellol1 · 发表于 2025-1-18 21:26

本帖最后由 hellol1 于 2025-1-18 21:27 编辑

挺好，无反视频机录制的中间格式推动硬件往前走了。。。

cetusli · 发表于 2025-1-18 21:26

“用PY换来的”，划重点。

银月 · 发表于 2025-1-18 21:28

前段时间剪东西我发现用amd的680m核显跑pr也是可以回放流畅的，非常流畅

Evalyn · 发表于 2025-1-18 21:33

别的不说我楼下玩AE那哥们已经四处打听哪里搞5090了，422真的吸引力巨大

Misaka_9993 · 发表于 2025-1-18 21:40

能效上也是核显加速预览赢了，尤其是笔记本上轻度剪辑一下

intel有HEVC 10bit 4:2:2解码可以追溯到很久之前Ice Lake那一代了

aozorahishi · 发表于 2025-1-18 21:43

其实422最重要的是解码，所以就NVDEC来说90 80都是两个，有422解码需求的80就够了，时间线上回放的解码可以是比较容易适配两个解码器并行，解得动就不卡解不动就卡死你，最后导出的编码用到NVENC的话一路两路三路就只是时间差别了

nApoleon · 发表于 2025-1-18 21:48

aozorahishi 发表于 2025-1-18 21:43
其实422最重要的是解码，所以就NVDEC来说90 80都是两个，有422解码需求的80就够了，时间线上回放的解码可以 ...

怎么说呢,不靠这个赚钱的80就够了,靠的应该直接无脑90~

aozorahishi · 发表于 2025-1-18 21:51

nApoleon 发表于 2025-1-18 21:48
怎么说呢,不靠这个赚钱的80就够了,靠的应该直接无脑90~

时间线上直接4路4K60那确实得32G显存

dioluve · 发表于 2025-1-18 21:52

U200系列的核显的编码和解码能有什么水平，相比A380的话，能不能针对这个评测一下

nApoleon · 发表于 2025-1-18 21:55

dioluve 发表于 2025-1-18 21:52
U200系列的核显的编码和解码能有什么水平，相比A380的话，能不能针对这个评测一下 ...

去看我之前的视频,很详细的介绍过了.

natt · 发表于 2025-1-18 22:01

好哒明白了

YJotd · 发表于 2025-1-18 22:31

轮大还推intel呀，怕是只有类似你全用h265 10bit422的场景合适哦，正常黑奴剪辑师各种素材，h264 10bit422 h265 10bit422，PRAW BRAW，还是5000系靠谱。

gbawrc · 发表于 2025-1-18 22:42

提示: 作者被禁止或删除内容自动屏蔽

kinglfa · 发表于 2025-1-18 22:44

哇塞是轮子用PY换来的，摸摸轮子的PY……

Misaka_9993 · 发表于 2025-1-18 22:53

本帖最后由 Misaka_9993 于 2025-1-18 22:55 编辑

YJotd 发表于 2025-1-18 22:31
轮大还推intel呀，怕是只有类似你全用h265 10bit422的场景合适哦，正常黑奴剪辑师各种素材，h264 10bit422 ...

你说的可能是这张图？

nApoleon · 发表于 2025-1-18 22:56

gbawrc 发表于 2025-1-18 22:42
问题来了，15TH的核显可以跟50显卡协同干活吗？

可以,我视频不是刚拍过嘛...

YJotd · 发表于 2025-1-18 23:18

Misaka_9993 发表于 2025-1-18 22:53
你说的可能是这张图？

是啊，所以干活还是得5000系，自己玩玩intel。

Misaka_9993 · 发表于 2025-1-18 23:26

YJotd 发表于 2025-1-18 23:18
是啊，所以干活还是得5000系，自己玩玩intel。

似乎是这样的。RTX50比intel多了一个h264 4:2:2支持，这个少见。但没有RAW加速。

With Blackwell GPUs, NVDEC doubles the video decoding throughput for H.264 decoding and adds support for 422 decoding for H.264 and HEVC codecs.

https://developer.nvidia.com/video-codec-sdk

YJotd · 发表于 2025-1-18 23:31

本帖最后由 YJotd 于 2025-1-18 23:34 编辑

Misaka_9993 发表于 2025-1-18 23:26
似乎是这样的。RTX50比intel多了一个h264 4:2:2支持，这个少见。但没有RAW加速。

你要是干后期的活，那就见得多了，索尼微单S3之后，包括电影机的mxf封装格式，内核编解码是h264 10bit422，佳能全系电影机，其他就不一一说了。其实在后期是很常见的，甚至在h265 10bit422标配以前，高端机都是h264 10bi422.
raw是看算力的，基本没有支持raw硬件解码的显卡，所以在有更多的编解码基础上，50系打工更优。

Misaka_9993 · 发表于 2025-1-18 23:41

YJotd 发表于 2025-1-18 23:31
你要是干后期的活，那就见得多了，索尼微单S3之后，包括电影机的mxf封装格式，内核编解码是h264 10bit422 ...

确实如此。一旦软件适配到位，RTX50应该是最周全的选择。

如果只考虑h265 4:2:2素材，那intel也够用，不知道他们是否有动力跟进h264 4:2:2了，未来肯定是h265的。

https://pro.sony/s3/2024/06/2611 ... WhitePaper_v1.0.pdf

屏幕截图 2025-01-18 233720.png

gartour · 发表于 2025-1-19 00:05

nv的硬件编码，至少前面几代，只要是调用的nv的接口，两个硬件编码器是自动串联工作的，不需要专门设置。至少我用ffmpeg和nvencc都是这样。

效率方面，基本就是倍数增长。比如两个ffmpeg进程，每个个80fps，只跑一个进程时能接近160fps。

50系如果没有什么特殊的改动，应该还是这样吧。

Misaka_9993 · 发表于 2025-1-19 00:24

gartour 发表于 2025-1-19 00:05
nv的硬件编码，至少前面几代，只要是调用的nv的接口，两个硬件编码器是自动串联工作的，不需要专门设置。至 ...

FFmpeg 7.1里这个会自动开启，根据官方文档说的，它会降低质量，并且只在4k (~2160p)以上生效。慢速预设默认不开这个。

https://docs.nvidia.com/video-te ... -split-frame-encode

屏幕截图 2025-01-19 002012.png

gartour · 发表于 2025-1-19 00:43

Misaka_9993 发表于 2025-1-19 00:24
FFmpeg 7.1里这个会自动开启，根据官方文档说的，它会降低质量，并且只在4k (~2160p)以上生效。慢速预设 ...

第一次知道。

切割后画质下降倒是很好理解，因为运动搜索范围也被切割了，运动块无法跨条带（估计），需要付出额外的bit。

不过我一直都用的最高质量设置。

Misaka_9993 · 发表于 2025-1-19 01:06

本帖最后由 Misaka_9993 于 2025-1-19 01:07 编辑

gartour 发表于 2025-1-19 00:43
第一次知道。

切割后画质下降倒是很好理解，因为运动搜索范围也被切割了，运动块无法跨条带（估计），需 ...

所以你用的最高质量，那这个功能按理应该是禁用的。

比如你的卡有2个nvenc，那根据你的描述，应该每个nvenc上都能提供160fps才对，而不是两个ffmpeg抢占同一个nvenc，如果是这样，那说明软件调度还是有问题。只有第一个nvenc在工作，第二个在摸鱼。

gartour · 发表于 2025-1-19 01:30

本帖最后由 gartour 于 2025-1-19 01:41 编辑

Misaka_9993 发表于 2025-1-19 01:06
所以你用的最高质量，那这个功能按理应该是禁用的。

比如你的卡有2个nvenc，那根据你的描述，应该每个nv ...

不一定的。

也可能是：

即使没有条带编码，两个编码器仍然可以串联工作。只是有轻微损失，比如两个比一个只增加95%，使用条带编码后增加到100%。

这个只要强制打开/关闭条带的参数来编码对比一下就知道了。

=========================================

用rigaya的nvenc试了一下

NVEncC64.exe -i -c hevc --profile main10 --cqp 20:23:25 --split-enc forced_2 --output-depth 10
NVEncC64.exe -i -c hevc --profile main10 --cqp 20:23:25 --split-enc disable --output-depth 10

编码速度基本一样，上面343fps，下面342fps

Misaka_9993 · 发表于 2025-1-19 01:54

gartour 发表于 2025-1-19 01:30
不一定的。

也可能是：

请注意，除非启用拆分帧编码，否则无论GPU上存在的NVENC数量如何，单个编码会话的性能都不能超过每个NVENC的性能。多NVENC分割帧编码是SDK12.0在Ada GPU上为HEVC和AV1引入的功能。

文档说单个编码会话的性能不能超过单个nvenc的性能，除非启用frame split模式。

https://docs.nvidia.com/video-te ... l#nvenc-performance

gartour · 发表于 2025-1-19 02:27

Misaka_9993 发表于 2025-1-19 01:54
文档说单个编码会话的性能不能超过单个nvenc的性能，除非启用frame split模式。

https://docs.nvidia. ...

我看过nv另外的文档里说过两个编码器会自动串联。

nvenc的sdk里有不少过时的，功能重复的参数，我怀疑是这个文档的错误

Misaka_9993 · 发表于 2025-1-19 02:34

gartour 发表于 2025-1-19 02:27
我看过nv另外的文档里说过两个编码器会自动串联。

nvenc的sdk里有不少过时的，功能重复的参数，我怀疑是 ...

你找找。我链接的文档已经是12.2最新版本的了

Misaka_9993 · 发表于 2025-1-19 02:51

本帖最后由 Misaka_9993 于 2025-1-19 02:54 编辑

gartour 发表于 2025-1-19 02:27
我看过nv另外的文档里说过两个编码器会自动串联。

nvenc的sdk里有不少过时的，功能重复的参数，我怀疑是 ...

又找了Ada架构的解读blog，还是一样的说法。

单个编码任务无法从双nvenc中获益，多个编码任务时才会自动调度双nvenc来提高吞吐量。

单个编码任务想要提升性能，只能靠牺牲质量，用拆分帧的方式提高双nvenc的利用率。

https://developer.nvidia.com/blo ... elace-architecture/

一些NVIDIA Ada GPU有不止一个NVENC。这可以支持并行编码更多流。编码单个流时，帧会按顺序发送到不同的NVENC。因此，在编码单个视频流时，使用多个NVENC并不能提高吞吐量，但在并行编码两个或多个视频流时可以提高整体吞吐量。在具有多个NVENC的GPU上，来自不同流的不同帧将在多个NVENC之间进行调度，保持所有NVENC的充分利用，从而提高吞吐量。

账号		自动登录	找回密码
密码			加入我们

gbawrc gbawrc 当前离线积分 3607	发表于 2025-1-18 22:42 \| 显示全部楼层提示: 作者被禁止或删除内容自动屏蔽
gbawrc gbawrc 当前离线积分 3607
	回复举报

[显卡] 关于5000系列4:2:2 10bit的解码支持所有你想要知道的~