terryhux
发表于 2025-3-9 20:48
我特意看了下发帖日期
渣渣纸
发表于 2025-3-9 21:58
lz火星了?
BADASSBOT
发表于 2025-3-10 11:59
gLaiVe 发表于 2025-3-9 14:13
那4090可以多卡互联么?是所有的5090也都不能多卡互联么?
40可以的。。
BADASSBOT
发表于 2025-3-10 11:59
本帖最后由 BADASSBOT 于 2025-3-10 12:02 编辑
robles 发表于 2025-3-9 19:08
你这是哪里天顶星的新闻,40代就封杀了nvlink好不好。
我说的互联又不是NVLINK。。。你火星了把
40系起码一个系统内能多卡,50系直接都不行了
雨季不再来
发表于 2025-3-10 12:07
hjmfun 发表于 2025-3-9 14:57
迷惑,没有任何技术分析,全是烂大街的信息。如果芯片刻印可以算证据,华强北已经掌握让3090 变‘4090’的 ...
这个技术,国家项目里面早就用上了 [流泪]
小豆豆2
发表于 2025-3-10 12:26
lh4357 发表于 2025-3-8 20:06
你这句话我更看不懂了。
“只知道是这样,却不知道为什么是这样。”
问题是,我连是不是这样(有没有锁) ...
是没有人测还是说目前测下来 90和90d算力一样?
lh4357
发表于 2025-3-10 12:31
本帖最后由 lh4357 于 2025-3-10 12:34 编辑
小豆豆2 发表于 2025-3-10 12:26
是没有人测还是说目前测下来 90和90d算力一样?
是测不出来,目前我只发现fp32+fp16混合精度训练,会降速到一个epoch时间比4090还长。
但这个是算力锁还是软件BUG就不好说,因为fp32+bf16混合,速度又快了,而且纯fp32 fp16 bf16的速度都不会被影响。
hammerbolt
发表于 2025-3-10 12:33
现代芯片设计技术里面有种器件叫做efuse,可以集成在硅片中,永久控制晶体管的行为;即使一摸一样的产片,一摸一样的批次,一摸一样的晶体管,只要通过JTAG之类的接口刷写一次,就可以改变芯片原有的规格和功能,甚至能废弃它。
SkyGZO
发表于 2025-3-10 13:40
5090D本地部署deepseek r1 32b推理速度比4090快30%你怎么解释啊
robles
发表于 2025-3-10 15:12
BADASSBOT 发表于 2025-3-10 11:59
我说的互联又不是NVLINK。。。你火星了把
40系起码一个系统内能多卡,50系直接都不行了 ...
这个据说没有问题,跟4090一样。
电脑
发表于 2025-3-10 17:07
很多人不相信可以改到96G,以为最多48G,其实可以的,显存中运行程序,效率极高,这就是4090黄牛价格居高不下的原因,
[吃惊]论坛里终于有人证实了96g卡的存在?你这不赶紧单开一帖开箱测试一下吗?
zhuifeng88
发表于 2025-3-10 17:59
BADASSBOT 发表于 2025-3-10 11:59
我说的互联又不是NVLINK。。。你火星了把
40系起码一个系统内能多卡,50系直接都不行了 ...
你听抄测试流程都抄不明白纯瞎测一通的kol放屁...
hred9D
发表于 2025-3-10 20:50
SkyGZO 发表于 2025-3-10 13:40
5090D本地部署deepseek r1 32b推理速度比4090快30%你怎么解释啊
本地部署或端侧AI,是使用已经训练好的“权重文件”(比如7B,32B,671B),GPU越强,读取效率就更高,这些是使用的场景。
这不是训练权重的场景,5090D不具有超过4090的训练推理能力,训练生成权重文件的效率不超过4090,是芯片级别的锁死。
YsHaNg
发表于 2025-3-10 21:42
hred9D 发表于 2025-3-8 11:45
一张显卡,对公司没有意义。小型计算和示范,使用几张卡还是可以的,比如极客湾用4张4090,个人电脑上使用 ...
fp8训练 本身效率就挺高的
我宣布 两年以后今天一定是2027年
YsHaNg
发表于 2025-3-10 21:46
fdgfdhfh 发表于 2025-3-9 01:47
你这标题没起对,应该叫:
今天,我突然发现5090和5090D的核心代号不一样
一直没开联网搜索的ai今天突然被人配置了搜索引擎api
YsHaNg
发表于 2025-3-10 21:48
lh4357 发表于 2025-3-10 04:31
是测不出来,目前我只发现fp32+fp16混合精度训练,会降速到一个epoch时间比4090还长。
但这个是算力锁还 ...
架构变了呀 像gtx10系那代一样
老司机dd
发表于 2025-3-10 21:59
zhuifeng88 发表于 2025-3-10 17:59
你听抄测试流程都抄不明白纯瞎测一通的kol放屁...
tinygrad的p2pmod不管用啊,大佬你这是怎么实现的
gartour
发表于 2025-3-10 21:59
lh4357 发表于 2025-3-8 20:06
你这句话我更看不懂了。
“只知道是这样,却不知道为什么是这样。”
问题是,我连是不是这样(有没有锁) ...
他说不出来了,只能车轱辘话
翰墨留香
发表于 2025-3-10 23:09
翻来覆去一直在云……合着是穿越来的啊?
zhuifeng88
发表于 2025-3-11 04:22
老司机dd 发表于 2025-3-10 21:59
tinygrad的p2pmod不管用啊,大佬你这是怎么实现的
不要p2p啊, 又不是没有就不能用
而且实际微调场景下有没有p2p性能差个零头而已
jinye2001
发表于 2025-3-11 08:33
其实不是穿越,最近90D开始放货了,黄牛搞来的90卖不出去了,肯定要想点不同出来,才能继续卖4w的高价
而且2w5的90d还能有保修,50出幺蛾子的事情又不少,外面的货拆开就少rop是没人管的
BADASSBOT
发表于 2025-3-11 10:17
zhuifeng88 发表于 2025-3-10 17:59
你听抄测试流程都抄不明白纯瞎测一通的kol放屁...
好消息,好消息、。。。我该更新了