找回密码
 加入我们
搜索
      
查看: 10648|回复: 45

[显卡] B站UP关于5090和5090D的AI性能基准测试

[复制链接]
发表于 2025-1-24 22:45 | 显示全部楼层 |阅读模式
某装机猿的,看来是误差级别的?
930.png
屏幕截图 2025-01-24 223948.png
 楼主| 发表于 2025-1-24 22:47 | 显示全部楼层

不过测试归测试,实际长什么样子谁知道
发表于 2025-1-24 22:48 | 显示全部楼层
装机员还推测,是老黄故意在前期测试阶段不砍(/▽╲),后期卖出去了再暗砍
发表于 2025-1-24 22:48 | 显示全部楼层
其实这玩意你得考虑个事。

再把4090和4090D加进去,和5090/D对比,会不会也一样。
发表于 2025-1-24 22:50 | 显示全部楼层
这种程度的测试根本跑不满这种级别的卡 。。。
发表于 2025-1-24 22:54 | 显示全部楼层
其实这玩意你得考虑个事。

再把4090和4090D加进去,和5090/D对比,会不会也一样。


+1。对照试验自变量因变量不足,没有说服力的......有本事最好把驱动和测试的python脚本也放出来
发表于 2025-1-24 22:57 来自手机 | 显示全部楼层
没有写清楚软件环境也没有4090对比,说明不了问题啊。4090在刚出前一个月的时候pytorch都还没更新支持最新的cuda版本,跑起来都跑不满的。
发表于 2025-1-24 23:04 | 显示全部楼层
本帖最后由 cloud 于 2025-1-24 23:07 编辑
lh4357 发表于 2025-1-24 22:48
其实这玩意你得考虑个事。

再把4090和4090D加进去,和5090/D对比,会不会也一样。 ...


66c30022-6298-4874-8f43-9c890a6cc2e2.png cfd52305-f649-45ce-a8cd-79055c0b7c67.png

我测了相同项目 可以参考下

目前ai开源的基本都跑不了 基本只能跑nv给的

173ce46f-9aca-4570-8d88-38096abe9f28.png

我自己把mlperf自己改跑了半个小时 性能和5090一样
发表于 2025-1-24 23:06 | 显示全部楼层
TONY大叔的测试 DLSS4 4倍帧生成的情况下,5090D比5090少个5-8帧,这还是90D是夜神,90是TUF的情况下,如果都是夜神差距更大
发表于 2025-1-24 23:08 | 显示全部楼层
cloud 发表于 2025-1-24 23:04
我测了相同项目 可以参考下

目前ai开源的基本都跑不了 基本只能跑nv给的

那这玩意锁啥了,锁了个寂寞?
发表于 2025-1-24 23:09 | 显示全部楼层
cloud 发表于 2025-1-24 23:04
我测了相同项目 可以参考下

目前ai开源的基本都跑不了 基本只能跑nv给的

llama.cpp vllm 啥的能跑了吗,我看前几天就有支持 blackwell 的 PR 了
发表于 2025-1-24 23:13 | 显示全部楼层
cloud 发表于 2025-1-24 23:04
我测了相同项目 可以参考下

目前ai开源的基本都跑不了 基本只能跑nv给的

是不是可以这么认为 跑推理基本没影响...限制的是学习算力
发表于 2025-1-24 23:14 来自手机 | 显示全部楼层
这是让大家去买 Doge 版吗?
发表于 2025-1-24 23:17 | 显示全部楼层
hsy-x 发表于 2025-1-24 23:13
是不是可以这么认为 跑推理基本没影响...限制的是学习算力

我尝试跑之前我跑色图的SD1.5 lora训练 跑不了 只能以后再说了
发表于 2025-1-24 23:18 | 显示全部楼层
neavo 发表于 2025-1-24 23:09
llama.cpp vllm 啥的能跑了吗,我看前几天就有支持 blackwell 的 PR 了


pr明显是nv安排的 我觉得和真实环境还是有差别

llama我昨天晚上下了  但没时间折腾了
发表于 2025-1-24 23:19 来自手机 | 显示全部楼层
本帖最后由 welsmann 于 2025-1-24 23:23 编辑
cloud 发表于 2025-1-24 23:04
我测了相同项目 可以参考下

目前ai开源的基本都跑不了 基本只能跑nv给的


那么也就是说nv提供的测试benchmark。并不代表全场景下的所有的性能都是5090比4090快那么一大截。是否存在一种可能,单位的这个优化是有水分的,也就是像你最后的那句话这样说,如果把40系平台下面按同样的方法魔改,实际上也能跑到。接近5090和dog版的表现?
如果可以在5090到网上下一个经常流传的flux一键训练包。比比看在同样的数据集下面。到底fp8能快多少?

补充
看来我发这个帖子的时候,上面已经有回复了
那么也就是说nv提供的驱动,为了防止真实情况“露馅”特地针对某些场景进行了锁定。可能 flux也不行……只有等到dog版。通用驱动出来才能摘掉他的帽子。
发表于 2025-1-24 23:25 | 显示全部楼层
welsmann 发表于 2025-1-24 23:19
那么也就是说nv提供的测试benchmark。并不代表全场景下的所有的性能都是5090比4090快那么一大截。是否存 ...

comfy+flux fp8+nf4我自己配置的 40的对比数据我都提前跑了 但50根本跑不了

https://zhuanlan.zhihu.com/p/17058910503
发表于 2025-1-24 23:30 | 显示全部楼层
5090d 支持fp4
4090d 不支持fp4
发表于 2025-1-24 23:46 来自手机 | 显示全部楼层
cloud 发表于 2025-1-24 23:18
pr明显是nv安排的 我觉得和真实环境还是有差别

llama我昨天晚上下了  但没时间折腾了 ...

全量微调llama3.2-1b试试
发表于 2025-1-24 23:51 | 显示全部楼层
本帖最后由 neavo 于 2025-1-24 23:55 编辑
cloud 发表于 2025-1-24 23:18
pr明显是nv安排的 我觉得和真实环境还是有差别

llama我昨天晚上下了  但没时间折腾了 ...


你需要的话我可以帮你做个 llama.cpp 的 bench 的一键包,只要双击就可以运行出结果

说实话图上这些ai测试都没啥意义,因为跟实际的高负载情景差的太远了

典型的高负债情景是 Linux下主流引擎(vllm llama.cpp sglang 等)上的大 batch_size  LLM 推理和训练,这也是那些被回收的 4090 唯一的用途
发表于 2025-1-24 23:58 | 显示全部楼层
airforce18 发表于 2025-1-24 23:06
TONY大叔的测试 DLSS4 4倍帧生成的情况下,5090D比5090少个5-8帧,这还是90D是夜神,90是TUF的情况下,如果 ...

DLSS4 4倍帧数才少5-8,那正常就少1-2帧了。(PS 夜神和TUF性能不会有什么区别,可能噪声和温度有点区别)
发表于 2025-1-25 08:20 | 显示全部楼层
neavo 发表于 2025-1-24 23:51
你需要的话我可以帮你做个 llama.cpp 的 bench 的一键包,只要双击就可以运行出结果

说实话图上这些ai测 ...

好 方便的话 你做了我试试
发表于 2025-1-25 09:28 | 显示全部楼层
阉割了之后游戏性能是要弱一点,AI功能几乎全割,这是意料之中,所以有啥纠结的呢?可能唯一纠结的就是定价问题吧
 楼主| 发表于 2025-1-25 12:03 | 显示全部楼层
IMG_8581.jpeg IMG_8580.jpeg IMG_8579.jpeg
再来个极巴湾的比较一下
发表于 2025-1-25 12:30 | 显示全部楼层
cloud 发表于 2025-1-25 08:20
好 方便的话 你做了我试试

llama.cpp bench 一键包

链接: https://pan.baidu.com/s/1vG-liNmqxvNckMfKrxFTdA?pwd=tc4n 提取码: tc4n

其实应该测训练,毕竟限制 AI 训练才是制裁的主要目的,也存在只锁训练不锁推理的可能性
但是训练测试做不了一键包,就先测测推理吧
发表于 2025-1-25 13:13 | 显示全部楼层
neavo 发表于 2025-1-25 12:30
llama.cpp bench 一键包

链接: https://pan.baidu.com/s/1vG-liNmqxvNckMfKrxFTdA?pwd=tc4n 提取码: tc ...

好 收到 我没会员 明年应该下的完
发表于 2025-2-3 10:45 | 显示全部楼层
neavo 发表于 2025-1-25 12:30
llama.cpp bench 一键包

链接: https://pan.baidu.com/s/1vG-liNmqxvNckMfKrxFTdA?pwd=tc4n 提取码: tc ...

5080今天跑了下 跑完发现窗口关了 没看见结果

我在bat后面加了个pause
发表于 2025-2-3 10:49 | 显示全部楼层
v2-117b0b793c6869163730715afc34fc34_r.jpg

deepseek的,跑32b还是很溜。
发表于 2025-2-3 11:44 | 显示全部楼层
我輩樹である 发表于 2025-2-3 10:49
deepseek的,跑32b还是很溜。

怎么回事,AMD不是发图说小模型7900xtx爆杀4090么,怎么差距这么大,你一定是A黑
发表于 2025-2-3 11:52 | 显示全部楼层
fgfdhgg 发表于 2025-2-3 11:44
怎么回事,AMD不是发图说小模型7900xtx爆杀4090么,怎么差距这么大,你一定是A黑
...

肯定是驱动不一样,nv被战未来了。
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

Archiver|手机版|小黑屋|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806 上海市互联网违法与不良信息举报中心

GMT+8, 2025-4-22 12:12 , Processed in 0.014946 second(s), 6 queries , Gzip On, Redis On.

Powered by Discuz! X3.5 Licensed

© 2007-2024 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表