terryhux 发表于 2025-3-9 20:48

我特意看了下发帖日期

渣渣纸 发表于 2025-3-9 21:58

lz火星了?

BADASSBOT 发表于 2025-3-10 11:59

gLaiVe 发表于 2025-3-9 14:13
那4090可以多卡互联么?是所有的5090也都不能多卡互联么?

40可以的。。

BADASSBOT 发表于 2025-3-10 11:59

本帖最后由 BADASSBOT 于 2025-3-10 12:02 编辑

robles 发表于 2025-3-9 19:08
你这是哪里天顶星的新闻,40代就封杀了nvlink好不好。

我说的互联又不是NVLINK。。。你火星了把

40系起码一个系统内能多卡,50系直接都不行了

雨季不再来 发表于 2025-3-10 12:07

hjmfun 发表于 2025-3-9 14:57
迷惑,没有任何技术分析,全是烂大街的信息。如果芯片刻印可以算证据,华强北已经掌握让3090 变‘4090’的 ...

这个技术,国家项目里面早就用上了   [流泪]

小豆豆2 发表于 2025-3-10 12:26

lh4357 发表于 2025-3-8 20:06
你这句话我更看不懂了。
“只知道是这样,却不知道为什么是这样。”
问题是,我连是不是这样(有没有锁) ...

是没有人测还是说目前测下来 90和90d算力一样?

lh4357 发表于 2025-3-10 12:31

本帖最后由 lh4357 于 2025-3-10 12:34 编辑

小豆豆2 发表于 2025-3-10 12:26
是没有人测还是说目前测下来 90和90d算力一样?

是测不出来,目前我只发现fp32+fp16混合精度训练,会降速到一个epoch时间比4090还长。
但这个是算力锁还是软件BUG就不好说,因为fp32+bf16混合,速度又快了,而且纯fp32 fp16 bf16的速度都不会被影响。

hammerbolt 发表于 2025-3-10 12:33

现代芯片设计技术里面有种器件叫做efuse,可以集成在硅片中,永久控制晶体管的行为;即使一摸一样的产片,一摸一样的批次,一摸一样的晶体管,只要通过JTAG之类的接口刷写一次,就可以改变芯片原有的规格和功能,甚至能废弃它。

SkyGZO 发表于 2025-3-10 13:40

5090D本地部署deepseek r1 32b推理速度比4090快30%你怎么解释啊

robles 发表于 2025-3-10 15:12

BADASSBOT 发表于 2025-3-10 11:59
我说的互联又不是NVLINK。。。你火星了把

40系起码一个系统内能多卡,50系直接都不行了 ...

这个据说没有问题,跟4090一样。

电脑 发表于 2025-3-10 17:07

很多人不相信可以改到96G,以为最多48G,其实可以的,显存中运行程序,效率极高,这就是4090黄牛价格居高不下的原因,

[吃惊]论坛里终于有人证实了96g卡的存在?你这不赶紧单开一帖开箱测试一下吗?

zhuifeng88 发表于 2025-3-10 17:59

BADASSBOT 发表于 2025-3-10 11:59
我说的互联又不是NVLINK。。。你火星了把

40系起码一个系统内能多卡,50系直接都不行了 ...

你听抄测试流程都抄不明白纯瞎测一通的kol放屁...

hred9D 发表于 2025-3-10 20:50

SkyGZO 发表于 2025-3-10 13:40
5090D本地部署deepseek r1 32b推理速度比4090快30%你怎么解释啊

本地部署或端侧AI,是使用已经训练好的“权重文件”(比如7B,32B,671B),GPU越强,读取效率就更高,这些是使用的场景。
这不是训练权重的场景,5090D不具有超过4090的训练推理能力,训练生成权重文件的效率不超过4090,是芯片级别的锁死。

YsHaNg 发表于 2025-3-10 21:42

hred9D 发表于 2025-3-8 11:45
一张显卡,对公司没有意义。小型计算和示范,使用几张卡还是可以的,比如极客湾用4张4090,个人电脑上使用 ...

fp8训练 本身效率就挺高的
我宣布 两年以后今天一定是2027年

YsHaNg 发表于 2025-3-10 21:46

fdgfdhfh 发表于 2025-3-9 01:47
你这标题没起对,应该叫:

今天,我突然发现5090和5090D的核心代号不一样

一直没开联网搜索的ai今天突然被人配置了搜索引擎api

YsHaNg 发表于 2025-3-10 21:48

lh4357 发表于 2025-3-10 04:31
是测不出来,目前我只发现fp32+fp16混合精度训练,会降速到一个epoch时间比4090还长。
但这个是算力锁还 ...

架构变了呀 像gtx10系那代一样

老司机dd 发表于 2025-3-10 21:59

zhuifeng88 发表于 2025-3-10 17:59
你听抄测试流程都抄不明白纯瞎测一通的kol放屁...

tinygrad的p2pmod不管用啊,大佬你这是怎么实现的

gartour 发表于 2025-3-10 21:59

lh4357 发表于 2025-3-8 20:06
你这句话我更看不懂了。
“只知道是这样,却不知道为什么是这样。”
问题是,我连是不是这样(有没有锁) ...

他说不出来了,只能车轱辘话

翰墨留香 发表于 2025-3-10 23:09

翻来覆去一直在云……合着是穿越来的啊?

zhuifeng88 发表于 2025-3-11 04:22

老司机dd 发表于 2025-3-10 21:59
tinygrad的p2pmod不管用啊,大佬你这是怎么实现的

不要p2p啊, 又不是没有就不能用
而且实际微调场景下有没有p2p性能差个零头而已

jinye2001 发表于 2025-3-11 08:33

其实不是穿越,最近90D开始放货了,黄牛搞来的90卖不出去了,肯定要想点不同出来,才能继续卖4w的高价
而且2w5的90d还能有保修,50出幺蛾子的事情又不少,外面的货拆开就少rop是没人管的

BADASSBOT 发表于 2025-3-11 10:17

zhuifeng88 发表于 2025-3-10 17:59
你听抄测试流程都抄不明白纯瞎测一通的kol放屁...

好消息,好消息、。。。我该更新了
页: 1 2 [3]
查看完整版本: 5090D是芯片核心锁死,有图为证