gonghao
发表于 2024-8-14 17:23
不知道跑 SD 的性能也能跑到接近一张 H100 ?
wengong8
发表于 2024-8-15 19:28
gonghao 发表于 2024-8-14 17:23
不知道跑 SD 的性能也能跑到接近一张 H100 ?
comfy ui可以设置多卡并发,理论上接近单卡h100-pcie实际未知。而且本文方案还目前空着三条pcie x16;等游戏卡价格回落再加4090上去,推理性能还能提
rankaiyx
发表于 2024-9-27 14:37
Qwen 110B 测试结果约每秒多少token呢 试过最新出的 Qwen2.5-72B-Instruct 么
xoabc123
发表于 2024-10-2 16:28
大佬!我看你的25Gnas文章,我也是cx4LX,两头设备都是windows server 2022,为什么无法启用RDMA呢
waring_id
发表于 2024-10-16 11:35
厉害了,特别 nvlink 的配置和兼容这都是平常很少用到的技能
iaminheu
发表于 2024-10-16 14:41
跑大模型 可以用多张不同规格的卡呗?
Akiiiiii
发表于 2024-10-19 22:24
我之前也遇到过掉通道的情况,结果发现是固定主板那个螺柱短接背面焊点了[流汗]
chip_discovery
发表于 2024-11-19 16:27
感觉那个SXM2 的扩展箱子和国鑫的那个10pcie 主板是绝配啊,能上5个箱子,这不都20块v100了嘛
kanshui
发表于 2024-11-20 15:27
真的很高端啊
CraftDeadMRC
发表于 2024-11-20 17:06
v100降价了但是底板现在要2000了[晕倒]
wolfivan
发表于 2024-12-29 14:12
好奇为啥gpu0/1和gpu4/5的p2p速度这么慢,这两卡不是在一个sxm板子上基于nvlink连接的吗?反而和2080Ti连接速度快,不科学啊。