转:5090与5090D在深度学习模型上的基准性能测试
【5090和5090D在深度学习模型上的基准性能测试】https://www.bilibili.com/video/BV1JidsYDE2L?vd_source=482eb9534cc718f7928239b03a00abe8补充下:5090使用的是96G DDR5 6400内存
先说结论
汇总对比图
我也跑了一些模型是没区别,不排除后期来个驱动软锁 大家关注的,不一直是多卡性能有没有阉割嘛,单卡的差距哪怕按照老黄的ppt来,炼丹佬也不在意的。。 StevenG 发表于 2025-4-9 19:05
大家关注的,不一直是多卡性能有没有阉割嘛,单卡的差距哪怕按照老黄的ppt来,炼丹佬也不在意的。。 ...
多卡不受影响的 不论90还是90D 已经有实测 手搓pytorch代码测显卡AI性能
含金量比用原神测旗舰显卡还高,近似于用Minecraft+TNT测评新旗舰显卡
有种大二上机课刚学会 pip install torch 的美 awpak78 发表于 2025-4-10 09:46
手搓pytorch代码测显卡AI性能
含金量比用原神测旗舰显卡还高,近似于用Minecraft+TNT测评新旗舰显卡
为什么呀?他用的模型不都是一些已知模型么? 5090D可以刷5090的bios吗? 纯游戏玩家表示围观 z010q3w 发表于 2025-4-10 11:43
5090D可以刷5090的bios吗?
理论上不能 芯片代码不同
不过刷5090的BIOS没有意义啊,一样锁600W 看来可以年底冲5090d了。
5090D国行有质保,也不比5090差啥,还是值得入手的。 williamqh 发表于 2025-4-10 11:37
为什么呀?他用的模型不都是一些已知模型么?
因为实现距离硬件性能上限太远, 就算有锁也撞不到锁
上面那些测试项目本身规模太小, 就算充分优化, 训练时tensorcore使用率都一般不会到10%, 而手搓pytorch代码更是"就算充分优化"这个假设都大概率不存在了
你会认为测红警的帧率能代表2025年旗舰卡的性能吗 本帖最后由 welsmann 于 2025-4-12 18:19 编辑
说实话,感觉经典CV领域基本上已经是边际效应拉满了,正如楼上所述,一个词评价,
williamqh 发表于 2025-4-10 11:37
为什么呀?他用的模型不都是一些已知模型么?
因为实现距离硬件性能上限太远, 就算有锁也撞不到锁
上面那些测试项目本身规模太小, 就算充分优化, 训练时tensorcore使用率都一般不会到10%, 而手搓pytorch代码更是"就算充分优化"这个假设都大概率不存在了
你会认为测红警的帧率能代表2025年旗舰卡的性能吗
如测-_-||
Ampere以后,重心开始倾向低精度。
没有FP4的测试,就算了,你可以跟我说pytorch还没跟上
那,
为什么没有FP8的测试?
还有,之前坛子里类似的贴子中,
有人之前跟我说训练和推理对卡的负载相似,但为什么没有训练的测试呢?
应该能体现普遍性的呀
以前针对4090的优化的FP8脚本也拿出来看看喽,反正FP8都兼容的。
跑个FP8的FLUX1. Lora测试一下呗~4090都能吃满的
页:
[1]