多卡5090d也能正常运行,那90d到底锁了啥
https://www.bilibili.com/video/BV1fnRJYaEwE/?spm_id_from=333.1007.tianma.6-1-19.click&vd_source=387a4ca1624f5a1d9637b4cabc7ee2fd 也是哦,记得当时说D是阉割掉多卡的 现在看到的说法是长时间训练(一两个小时以上)才会触发算力锁,跑推理之类的瓶颈卡在显存带宽上就一直不会触发了 有没有一种可能,加个D单纯给国会老爷看的,这样国会老爷满意了,也不影响老黄卖卡 没区别的话国内买高价 5090 的就搞笑了 跑AI久了不是锁算力、功耗? DEEPSEEK推理对GPU性能要求不高,只是吃显存。尤其是用户并发少的使用场景 不算太冷的知识是普通训练吃不满计算单元,尤其多卡,尤其多卡通信被限制下还要模型拆散在多卡上跑模型并行,在通信被阉割下我用4090多卡跑llm的全量微调,显卡功率使用率完全上不去。在推理情况下,尤其不能打高batch情况下,计算单元的利用率也没那么高。 瓶颈在显存容量,跟cuda之类的都没啥关系,所以看起来5090D和5090区别不大。
如果是跑那种不需要显存的AI功能,D卡就不行了。当然,现在AI的瓶颈都在显存。
页:
[1]