找回密码
 加入我们
搜索
      
查看: 5279|回复: 5

[显卡] 海光K100在大模型推理上是什么水平了?

[复制链接]
发表于 2024-7-18 16:37 | 显示全部楼层 |阅读模式
客户要采购跑大模型推理的设备,目前纠结这4个方案,感觉16张4090最合适?但又说不上来到底强在哪,有没有大佬给点建议?感谢

海光 K100 * 8张
A10 * 16张
A40 * 4张
RTX4090 * 16张
发表于 2024-7-18 17:54 | 显示全部楼层
4090那个小显存也能拿来推理吗,3090感觉都靠谱点啊。
发表于 2024-7-18 18:15 | 显示全部楼层
用流水线并行的方式可以跑多8 session,2张4090一组跑70bq4模型速度大概15t/s左右。
缺点是外围设备x8。
发表于 2024-7-18 18:21 | 显示全部楼层
我輩樹である 发表于 2024-7-18 18:15
用流水线并行的方式可以跑多8 session,2张4090一组跑70bq4模型速度大概15t/s左右。
缺点是外围设备x8。 ...


怎么会只有15

2张3090 qwen2 72b q4 bs1都有20多
2`BQWN36CWXIBBH5Z$T~EE3.png
发表于 2024-7-18 21:45 | 显示全部楼层
考不考虑天数智芯。。。。
发表于 2024-7-18 22:04 | 显示全部楼层
买国产的图啥
啥时候nv被严格封禁了再捏着鼻子买国产也不迟
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

Archiver|手机版|小黑屋|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806 上海市互联网违法与不良信息举报中心

GMT+8, 2025-4-16 11:59 , Processed in 0.009088 second(s), 6 queries , Gzip On, Redis On.

Powered by Discuz! X3.5 Licensed

© 2007-2024 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表