找回密码
 加入我们
搜索
      
查看: 33261|回复: 90

[显卡] QSV/DG2 vs NVENC/Turing 硬件编码器质量对比 2022

[复制链接]
发表于 2022-10-24 19:31 | 显示全部楼层 |阅读模式
本帖最后由 Misaka_9993 于 2022-10-24 19:43 编辑

NVEnc/QSVEnc/VCEEnc的作者 rigaya 7月份从京东海淘了一块Intel Arc A380,
并用它和 RTX 2070 等做了一些硬件编码器的质量对比。这里挑选具有代表性的最高质量 quality 预设进行对比。

测试视频为1080p 29.97fps。对比的码率区间为1000~16000kbps,同比特率下SSIM值高者质量更佳。

使用的测试命令如下:
  1. qsv H.264 (-u 1:quality, 4:normal)
  2. --icq <x> -u <1,4>

  3. qsv HEVC (-u 1:quality, 4:normal)
  4. --icq <x> -u <1,4> -c hevc

  5. qsv HEVC 10bit (-u 1:quality, 4:normal)
  6. --icq <x> -u <1,4> -c hevc --profile main10 --output-depth 10

  7. qsv H.264 FF (-u 1:quality, 4:normal)
  8. --icq <x> -u <1,4> --fixed-func

  9. qsv HEVC FF (-u 1:quality, 4:normal)
  10. --icq <x> -u <1,4> --fixed-func -c hevc

  11. qsv HEVC FF 10bit (-u 1:quality, 4:normal)
  12. --icq <x> -u <1,4> --fixed-func -c hevc --profile main10 --output-depth 10

  13. qsv AV1 FF (-u 1:quality, 4:normal)
  14. --icq <x> -u <1,4> --level 5.2 --fixed-func -c av1

  15. qsv AV1 FF 10bit (-u 1:quality, 4:normal)
  16. --icq <x> -u <1,4> --level 5.2 --fixed-func -c av1 --output-depth 10

  17. nvenc H.264
  18. --vbrhq 0 --vbr-quality <x> --preset quality --weightp --bref-mode each --lookahead 32 --level 5.1

  19. nvenc HEVC
  20. --vbrhq 0 --vbr-quality <x> --preset quality --weightp --bref-mode each --lookahead 32 -c hevc --level 6 -b 3

  21. nvenc HEVC 10bit
  22. --vbrhq 0 --vbr-quality <x> --preset quality --weightp --bref-mode each --lookahead 32 -c hevc --level 6 --output-depth 10 -b 3
复制代码


H.264 8bit:
h264_quality_1080p.png

HEVC、AV1 8bit:
hevc_8b_quality_1080p.png

HEVC、AV1 10bit:
hevc_10b_quality_1080p.png


结论是 DG2 的QSV H.264 H.265 硬件编码质量已经超过了 Turing NVENC,其中 QSV H.264 小幅优于 NVENC H.264,而 QSV H.265 则优势明显。
QSV AV1 编码器在低码率下质量优于 QSV H.265,高码率下 QSV H.265 仍然占优。


此外 DG2 的 QSV 在最高质量 quality 预设下,速度仍然优于 Turing NVENC,这一点核显做不到,只能在质量(EU)和速度(fixed-function)中选其一,详细数据请详见原blog:
https://rigaya34589.blog.fc2.com/blog-entry-1549.html

隔壁 RX6000 的 VCN3 AMF 由于过于拉跨,连 H.265 的 b 帧和 QVBR 预设都不支持,这里就不上镜了,有兴趣可自行浏览:
https://rigaya34589.blog.fc2.com/blog-entry-1574.html

RTX 4090 4080 新增了 AV1 编码,并拥有 2 个 NVENC 单元,速度上肯定有提升,但官方未提及编码质量提升,
希望 H.264 H.265 NVENC 编码质量不要原地踏步(因为RTX20 30已经连着用了两代Gen7 NVENC了。
发表于 2022-10-24 19:35 | 显示全部楼层
cpu的都隐藏了吗,有没有和cpu的质量对比
发表于 2022-10-24 19:36 | 显示全部楼层
请教个事,之前看到12代牙膏的PPT说核显HD770的提升可以用作直播中编码,就是直播软件指定核显来做编码,和显卡互不耽误,不影响玩游戏的性能。
确实如此吗?HD770能推12000码率1080p@60Hz吗?
 楼主| 发表于 2022-10-24 19:38 | 显示全部楼层
zhgbbs 发表于 2022-10-24 19:35
cpu的都隐藏了吗,有没有和cpu的质量对比

没有和CPU软件编码比较的,没显示的是核显,它速度和质量不可兼得。
发表于 2022-10-24 19:41 | 显示全部楼层
果然是生产力工具啊
 楼主| 发表于 2022-10-24 19:41 | 显示全部楼层
kinglfa 发表于 2022-10-24 19:36
请教个事,之前看到12代牙膏的PPT说核显HD770的提升可以用作直播中编码,就是直播软件指定核显来做编码,和 ...

UHD770做这种事是很轻松的,用OBS里的QuickSync就行了。
不过12代牙膏核显不支持编码AV1,最高只能HEVC。

需要注意的是核显吃内存带宽,内存敏感型游戏仍然会有影响。
发表于 2022-10-24 19:43 | 显示全部楼层
上一代安培也是支持av1编码/解码,最近想洗版,不知道用哪个软件压出av1
 楼主| 发表于 2022-10-24 19:44 | 显示全部楼层
本帖最后由 Misaka_9993 于 2022-10-24 19:46 编辑
liusha1010 发表于 2022-10-24 19:43
上一代安培也是支持av1编码/解码,最近想洗版,不知道用哪个软件压出av1


记错了吧。RTX30安培只能解AV1,没法编。要编AV1只能上RTX40 Ada。

QSV AV1硬编码刚合并进ffmpeg主线,NVENC AV1还没有动静,至少再等个半年软件跟进吧。否则就用svt-av1软件编码咯。
发表于 2022-10-24 19:51 | 显示全部楼层
本帖最后由 liusha1010 于 2022-10-24 19:52 编辑
Misaka_9993 发表于 2022-10-24 19:44
记错了吧。RTX30安培只能解AV1,没法编。要编AV1只能上RTX40 Ada。

QSV AV1硬编码刚合并进ffmpeg主线,N ...


官方文档显示支持,右下角那个位置

无标题.jpg



 楼主| 发表于 2022-10-24 19:52 | 显示全部楼层
本帖最后由 Misaka_9993 于 2022-10-24 19:55 编辑
liusha1010 发表于 2022-10-24 19:51
官方文档显示支持


“+ AV1 decode”只能解不能编。

https://developer.nvidia.com/vid ... -support-matrix-new

屏幕截图 2022-10-24 195452.png
发表于 2022-10-24 19:54 | 显示全部楼层
本帖最后由 liusha1010 于 2022-10-24 19:55 编辑



果然不能
无标题.jpg
发表于 2022-10-24 19:55 来自手机 | 显示全部楼层
liusha1010 发表于 2022-10-24 19:51
官方文档显示支持,右下角那个位置

明显是只有decode才+了av1啊
发表于 2022-10-24 19:56 来自手机 | 显示全部楼层
但是最常用的obs用的qsv还是上古版本,画质稀烂还不支持hevc
发表于 2022-10-24 19:56 | 显示全部楼层
aibo 发表于 2022-10-24 19:55
明显是只有decode才+了av1啊

大意了            
发表于 2022-10-24 19:56 | 显示全部楼层
从京东海淘可还行
 楼主| 发表于 2022-10-24 19:56 | 显示全部楼层

https://www.nvidia.com/en-us/geforce/graphics-cards/compare/

https://developer.nvidia.com/vid ... -support-matrix-new

官网和开发者官网都写了RTX30不支持AV1 Encode,难不成你这个文档还能无中生有?
 楼主| 发表于 2022-10-24 19:59 | 显示全部楼层
pc_based 发表于 2022-10-24 19:56
从京东海淘可还行

那时候日本人买不着A380,只能从中国海淘
发表于 2022-10-24 20:02 | 显示全部楼层
本帖最后由 liusha1010 于 2022-10-24 20:04 编辑


看走眼了,反正不割卵子~
发表于 2022-10-24 20:06 | 显示全部楼层
顺便问一下,380和770对于hevc 10bit 422的硬解,是不是效果一样?
 楼主| 发表于 2022-10-24 20:09 | 显示全部楼层
本帖最后由 Misaka_9993 于 2022-10-24 20:10 编辑
斯登 发表于 2022-10-24 20:06
顺便问一下,380和770对于hevc 10bit 422的硬解,是不是效果一样?


DG2从最低端的A310到最高端的A770,编解码引擎数量都是2个,没有阉割和限制,所以效果速度都一样。

单纯指HEVC 4:2:2解码。如果是渲染需要显存和EU数量,太少了速度肯定有影响。
发表于 2022-10-24 20:12 | 显示全部楼层
Misaka_9993 发表于 2022-10-24 20:09
DG2从最低端的A310到最高端的A770,编解码引擎数量都是2个,没有阉割和限制,所以效果速度都一样。

单纯 ...

感谢回复,受教了,多谢
发表于 2022-10-24 20:16 | 显示全部楼层
14代的核显估计能上AV1硬编码
发表于 2022-10-24 20:17 | 显示全部楼层
Misaka_9993 发表于 2022-10-24 20:09
DG2从最低端的A310到最高端的A770,编解码引擎数量都是2个,没有阉割和限制,所以效果速度都一样。

单纯 ...

请教一下,h.265编码,纯cpu编码和gpu编码画质差别大不大?TLF那边的int好像都是纯cpu编码
 楼主| 发表于 2022-10-24 20:40 | 显示全部楼层
liusha1010 发表于 2022-10-24 20:17
请教一下,h.265编码,纯cpu编码和gpu编码画质差别大不大?TLF那边的int好像都是纯cpu编码 ...

压制组没人用GPU编码的,个个都开了写轮眼,那是一帧一帧地修。就DG2这个质量的来看的话,自用和串流完全是绰绰有余了。
发表于 2022-10-24 20:45 | 显示全部楼层
Misaka_9993 发表于 2022-10-24 20:40
压制组没人用GPU编码的,个个都开了写轮眼,那是一帧一帧地修。就DG2这个质量的来看的话,自用和串流完全 ...

QSV/DG2/NVENC是对应图中的这三个吧?

无标题.jpg
 楼主| 发表于 2022-10-24 20:46 | 显示全部楼层
liusha1010 发表于 2022-10-24 20:45
QSV/DG2/NVENC是对应图中的这三个吧?

DG2是A380 A770这些intel独显的代号,它们支持QSV(QuickSync)。

AMD的VCE VCN和AMF是一个东西。

NV是NVENC。
发表于 2022-10-24 20:53 | 显示全部楼层
uuyyhhjj 发表于 2022-10-24 20:16
14代的核显估计能上AV1硬编码

牙膏说了,要把媒体这块功能集成到cpu中。

也许以后就不需要gpu来做这事了。
 楼主| 发表于 2022-10-24 21:04 | 显示全部楼层
aibo 发表于 2022-10-24 20:53
牙膏说了,要把媒体这块功能集成到cpu中。

也许以后就不需要gpu来做这事了。 ...

现在本来也不需要GPU来做编解码啊,MFX和SFC单元都是单独的一块,传统意义上的EU shader根本不需要动。问题就是intel想把这部分放在哪,放在CPU边上,就是所谓的“集成到CPU”中。
发表于 2022-10-24 21:10 | 显示全部楼层
Misaka_9993 发表于 2022-10-24 20:09
DG2从最低端的A310到最高端的A770,编解码引擎数量都是2个,没有阉割和限制,所以效果速度都一样。

单纯 ...


那a310是好东西啊,这个做亮机卡不错
发表于 2022-10-24 21:18 | 显示全部楼层
Misaka_9993 发表于 2022-10-24 21:04
现在本来也不需要GPU来做编解码啊,MFX和SFC单元都是单独的一块,传统意义上的EU shader根本不需要动。问 ...


就是要集成在“cpu”里面,一直可用。

现在算是集成在集显里,关掉集显就用不了。
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

Archiver|手机版|小黑屋|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806 上海市互联网违法与不良信息举报中心

GMT+8, 2024-11-27 02:38 , Processed in 0.013636 second(s), 6 queries , Gzip On, Redis On.

Powered by Discuz! X3.5 Licensed

© 2007-2024 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表