找回密码
 加入我们
搜索
      
查看: 1595|回复: 4

[显卡] 9070xt地fp8(应该叫1/4精度?)性能是不是吊打7900xtx了?

[复制链接]
发表于 2025-3-6 02:45 来自手机 | 显示全部楼层 |阅读模式
今天折腾7900xtx在wsl2下部署comfyui以及对应的flux-d模型,这个我下载的模型就是fp8量化的 跑个720p的图要二百多秒(当然我参数大了一点)
9070xt要是fp8性能起飞了的话 未来要出32g版本我是必换的啊(当然rocm也要跟上了)

7900xtx的wsl2支持也是去年年底才落实,用了没几个月就用不下去了,唉
发表于 2025-3-6 06:57 | 显示全部楼层
支持fp8的话也就是把fp16拆2份跑,计算速度理论上会翻倍,但是比如说flux实际上你要来回倒腾显存,之前pytorch支持fp8加速之后出图速度也没有翻倍,因为大部分时间花在从硬盘加载两个巨大的模型t5和flux本体
发表于 2025-3-6 08:28 来自手机 | 显示全部楼层
RDNA3都不支持fp8
 楼主| 发表于 2025-3-6 10:48 来自手机 | 显示全部楼层
rana23 发表于 2025-3-6 08:28
RDNA3都不支持fp8

我只能说7900xtx能跑……就是特别慢
 楼主| 发表于 2025-3-6 11:33 来自手机 | 显示全部楼层
平安是福 发表于 2025-3-6 06:57
支持fp8的话也就是把fp16拆2份跑,计算速度理论上会翻倍,但是比如说flux实际上你要来回倒腾显存,之前pyto ...

第一次加载确定够慢的 后面就好不少了
a卡支持wsl2是真的方便啊,直接部署原版rocm,不用折腾兼容性差的zluda了
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

Archiver|手机版|小黑屋|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806 上海市互联网违法与不良信息举报中心

GMT+8, 2025-4-21 12:16 , Processed in 0.008130 second(s), 4 queries , Gzip On, Redis On.

Powered by Discuz! X3.5 Licensed

© 2007-2024 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表