5090D是芯片核心锁死，有图为证 - 第3页 - 电脑讨论(新) - Chiphell - 分享与交流用户体验

terryhux 发表于 2025-3-9 20:48

我特意看了下发帖日期

渣渣纸 发表于 2025-3-9 21:58

lz火星了?

BADASSBOT 发表于 2025-3-10 11:59

gLaiVe 发表于 2025-3-9 14:13
那4090可以多卡互联么？是所有的5090也都不能多卡互联么？

40可以的。。

BADASSBOT 发表于 2025-3-10 11:59

本帖最后由 BADASSBOT 于 2025-3-10 12:02 编辑

robles 发表于 2025-3-9 19:08
你这是哪里天顶星的新闻，40代就封杀了nvlink好不好。

我说的互联又不是NVLINK。。。你火星了把

40系起码一个系统内能多卡，50系直接都不行了

雨季不再来 发表于 2025-3-10 12:07

hjmfun 发表于 2025-3-9 14:57
迷惑，没有任何技术分析，全是烂大街的信息。如果芯片刻印可以算证据，华强北已经掌握让3090 变‘4090’的 ...

这个技术，国家项目里面早就用上了 [流泪]

小豆豆2 发表于 2025-3-10 12:26

lh4357 发表于 2025-3-8 20:06
你这句话我更看不懂了。
“只知道是这样，却不知道为什么是这样。”
问题是，我连是不是这样（有没有锁） ...

是没有人测还是说目前测下来 90和90d算力一样？

lh4357 发表于 2025-3-10 12:31

本帖最后由 lh4357 于 2025-3-10 12:34 编辑

小豆豆2 发表于 2025-3-10 12:26
是没有人测还是说目前测下来 90和90d算力一样？

是测不出来，目前我只发现fp32+fp16混合精度训练，会降速到一个epoch时间比4090还长。
但这个是算力锁还是软件BUG就不好说，因为fp32+bf16混合，速度又快了，而且纯fp32 fp16 bf16的速度都不会被影响。

hammerbolt 发表于 2025-3-10 12:33

现代芯片设计技术里面有种器件叫做efuse，可以集成在硅片中，永久控制晶体管的行为；即使一摸一样的产片，一摸一样的批次，一摸一样的晶体管，只要通过JTAG之类的接口刷写一次，就可以改变芯片原有的规格和功能，甚至能废弃它。

SkyGZO 发表于 2025-3-10 13:40

5090D本地部署deepseek r1 32b推理速度比4090快30%你怎么解释啊

robles 发表于 2025-3-10 15:12

BADASSBOT 发表于 2025-3-10 11:59
我说的互联又不是NVLINK。。。你火星了把

40系起码一个系统内能多卡，50系直接都不行了 ...

这个据说没有问题，跟4090一样。

电脑发表于 2025-3-10 17:07

很多人不相信可以改到96G，以为最多48G，其实可以的，显存中运行程序，效率极高，这就是4090黄牛价格居高不下的原因，

[吃惊]论坛里终于有人证实了96g卡的存在？你这不赶紧单开一帖开箱测试一下吗？

zhuifeng88 发表于 2025-3-10 17:59

BADASSBOT 发表于 2025-3-10 11:59
我说的互联又不是NVLINK。。。你火星了把

40系起码一个系统内能多卡，50系直接都不行了 ...

你听抄测试流程都抄不明白纯瞎测一通的kol放屁...

hred9D 发表于 2025-3-10 20:50

SkyGZO 发表于 2025-3-10 13:40
5090D本地部署deepseek r1 32b推理速度比4090快30%你怎么解释啊

本地部署或端侧AI，是使用已经训练好的“权重文件”（比如7B,32B,671B），GPU越强，读取效率就更高，这些是使用的场景。
这不是训练权重的场景，5090D不具有超过4090的训练推理能力，训练生成权重文件的效率不超过4090，是芯片级别的锁死。

YsHaNg 发表于 2025-3-10 21:42

hred9D 发表于 2025-3-8 11:45
一张显卡，对公司没有意义。小型计算和示范，使用几张卡还是可以的，比如极客湾用4张4090,个人电脑上使用 ...

fp8训练本身效率就挺高的
我宣布两年以后今天一定是2027年

YsHaNg 发表于 2025-3-10 21:46

fdgfdhfh 发表于 2025-3-9 01:47
你这标题没起对，应该叫：

今天，我突然发现5090和5090D的核心代号不一样

一直没开联网搜索的ai今天突然被人配置了搜索引擎api

YsHaNg 发表于 2025-3-10 21:48

lh4357 发表于 2025-3-10 04:31
是测不出来，目前我只发现fp32+fp16混合精度训练，会降速到一个epoch时间比4090还长。
但这个是算力锁还 ...

架构变了呀像gtx10系那代一样

老司机dd 发表于 2025-3-10 21:59

zhuifeng88 发表于 2025-3-10 17:59
你听抄测试流程都抄不明白纯瞎测一通的kol放屁...

tinygrad的p2pmod不管用啊，大佬你这是怎么实现的

gartour 发表于 2025-3-10 21:59

lh4357 发表于 2025-3-8 20:06
你这句话我更看不懂了。
“只知道是这样，却不知道为什么是这样。”
问题是，我连是不是这样（有没有锁） ...

他说不出来了，只能车轱辘话

翰墨留香 发表于 2025-3-10 23:09

翻来覆去一直在云……合着是穿越来的啊？

zhuifeng88 发表于 2025-3-11 04:22

老司机dd 发表于 2025-3-10 21:59
tinygrad的p2pmod不管用啊，大佬你这是怎么实现的

不要p2p啊, 又不是没有就不能用
而且实际微调场景下有没有p2p性能差个零头而已

jinye2001 发表于 2025-3-11 08:33

其实不是穿越，最近90D开始放货了，黄牛搞来的90卖不出去了，肯定要想点不同出来，才能继续卖4w的高价
而且2w5的90d还能有保修，50出幺蛾子的事情又不少，外面的货拆开就少rop是没人管的

BADASSBOT 发表于 2025-3-11 10:17

zhuifeng88 发表于 2025-3-10 17:59
你听抄测试流程都抄不明白纯瞎测一通的kol放屁...

好消息，好消息、。。。我该更新了

页: 1 2 [3]

Chiphell - 分享与交流用户体验's Archiver