找回密码
 加入我们
搜索
      
楼主: PolyMorph

[显卡] 5090的ai算力扒完皮仅剩419TFLOPS

[复制链接]
发表于 2025-1-19 06:12 | 显示全部楼层
q3again0605 发表于 2025-1-18 19:32
这点我一直不明白什么意思,nvlink 4090就没有,p2p的话4090可以破,5090有人看过了吗,有没有large bar ...

很多程序插上就能用的。。不需要NVLINK
发表于 2025-1-19 08:52 | 显示全部楼层
fgfdhgg 发表于 2025-1-18 18:38
现在的造谣路线是
因为老黄做过LHR软锁算力,后续给解锁了
而且5090D看起来大概率也是软锁

解锁你可想太多了。
发表于 2025-1-19 10:48 | 显示全部楼层
buxp 发表于 2025-1-19 06:12
很多程序插上就能用的。。不需要NVLINK

不管是大参数模型的推理还是训练,卡间通信走nvlink至少p2p还是很有意义的。目前专业卡至少还有p2p这样在并行推理上还是很有优势的
发表于 2025-1-19 12:12 | 显示全部楼层

频率不是只差了0.1G吗?每个算力怎么会差30%+?
发表于 2025-1-19 13:08 来自手机 | 显示全部楼层
算力不是看fp16 with fp32 accumulate那一行吗?4090被砍半才160,5090可能是满速。
 楼主| 发表于 2025-1-19 16:15 | 显示全部楼层
本帖最后由 PolyMorph 于 2025-1-20 03:28 编辑
用户 发表于 2025-1-19 13:08
算力不是看fp16 with fp32 accumulate那一行吗?4090被砍半才160,5090可能是满速。


quadro tesla计算卡才会满速,5090要是满血,tf32  fp32 on tensor,这些卡不用卖了





发表于 2025-1-19 22:40 来自手机 | 显示全部楼层
赫敏 发表于 2025-1-18 08:18
现在fp4能算什么

self host跑推理模型都q4量化 其实连int4都用不上拿fp32速度也完全够 还是得单卡塞大显存参数量堆上去
发表于 2025-1-22 13:48 | 显示全部楼层
5090 D真的是纯纯的智商税了 AI性能还不如4090吗
发表于 2025-1-22 14:24 | 显示全部楼层
jaycty 发表于 2025-1-22 13:48
5090 D真的是纯纯的智商税了 AI性能还不如4090吗

卡着禁售线不就是这样吗,官网虽然玩文字游戏但是参数和标准都写的很明白,实际 5090D 就是 4090D 一个水平的算力
发表于 2025-1-22 16:03 | 显示全部楼层
PolyMorph 发表于 2025-1-19 16:15
quadro tesla计算卡才会满速,5090要是满血,tf32  fp32 on tensor,这些卡不用卖了

记得那些卡制程比RTX卡低吧?反而频率高?
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

Archiver|手机版|小黑屋|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806 上海市互联网违法与不良信息举报中心

GMT+8, 2025-4-23 14:55 , Processed in 0.009934 second(s), 5 queries , Gzip On, Redis On.

Powered by Discuz! X3.5 Licensed

© 2007-2024 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表