甘尼克斯 发表于 2025-4-9 18:29

转:5090与5090D在深度学习模型上的基准性能测试

【5090和5090D在深度学习模型上的基准性能测试】https://www.bilibili.com/video/BV1JidsYDE2L?vd_source=482eb9534cc718f7928239b03a00abe8

补充下:5090使用的是96G DDR5 6400内存

先说结论


汇总对比图




youxiaonv 发表于 2025-4-9 19:04

我也跑了一些模型是没区别,不排除后期来个驱动软锁

StevenG 发表于 2025-4-9 19:05

大家关注的,不一直是多卡性能有没有阉割嘛,单卡的差距哪怕按照老黄的ppt来,炼丹佬也不在意的。。

甘尼克斯 发表于 2025-4-9 19:32

StevenG 发表于 2025-4-9 19:05
大家关注的,不一直是多卡性能有没有阉割嘛,单卡的差距哪怕按照老黄的ppt来,炼丹佬也不在意的。。 ...

多卡不受影响的   不论90还是90D 已经有实测

awpak78 发表于 2025-4-10 09:46

手搓pytorch代码测显卡AI性能

含金量比用原神测旗舰显卡还高,近似于用Minecraft+TNT测评新旗舰显卡

有种大二上机课刚学会 pip install torch 的美

williamqh 发表于 2025-4-10 11:37

awpak78 发表于 2025-4-10 09:46
手搓pytorch代码测显卡AI性能

含金量比用原神测旗舰显卡还高,近似于用Minecraft+TNT测评新旗舰显卡


为什么呀?他用的模型不都是一些已知模型么?

z010q3w 发表于 2025-4-10 11:43

5090D可以刷5090的bios吗?

sunjiangfan 发表于 2025-4-10 11:52

纯游戏玩家表示围观

甘尼克斯 发表于 2025-4-10 12:56

z010q3w 发表于 2025-4-10 11:43
5090D可以刷5090的bios吗?

理论上不能   芯片代码不同
不过刷5090的BIOS没有意义啊,一样锁600W

robles 发表于 2025-4-11 21:42

看来可以年底冲5090d了。

dukeyli 发表于 2025-4-12 17:03

5090D国行有质保,也不比5090差啥,还是值得入手的。

zhuifeng88 发表于 2025-4-12 17:34

williamqh 发表于 2025-4-10 11:37
为什么呀?他用的模型不都是一些已知模型么?

因为实现距离硬件性能上限太远, 就算有锁也撞不到锁
上面那些测试项目本身规模太小, 就算充分优化, 训练时tensorcore使用率都一般不会到10%, 而手搓pytorch代码更是"就算充分优化"这个假设都大概率不存在了

你会认为测红警的帧率能代表2025年旗舰卡的性能吗

welsmann 发表于 2025-4-12 18:12

本帖最后由 welsmann 于 2025-4-12 18:19 编辑

说实话,感觉经典CV领域基本上已经是边际效应拉满了,正如楼上所述,一个词评价,

williamqh 发表于 2025-4-10 11:37
为什么呀?他用的模型不都是一些已知模型么?

因为实现距离硬件性能上限太远, 就算有锁也撞不到锁
上面那些测试项目本身规模太小, 就算充分优化, 训练时tensorcore使用率都一般不会到10%, 而手搓pytorch代码更是"就算充分优化"这个假设都大概率不存在了

你会认为测红警的帧率能代表2025年旗舰卡的性能吗
如测-_-||


Ampere以后,重心开始倾向低精度。
没有FP4的测试,就算了,你可以跟我说pytorch还没跟上

那,
为什么没有FP8的测试?

还有,之前坛子里类似的贴子中,
有人之前跟我说训练和推理对卡的负载相似,但为什么没有训练的测试呢?

应该能体现普遍性的呀

以前针对4090的优化的FP8脚本也拿出来看看喽,反正FP8都兼容的。
跑个FP8的FLUX1. Lora测试一下呗~4090都能吃满的
页: [1]
查看完整版本: 转:5090与5090D在深度学习模型上的基准性能测试