找回密码
 加入我们
搜索
      
查看: 2412|回复: 39

[CPU] hx370跑大模型的速度是不是有问题?

[复制链接]
发表于 2025-4-7 15:47 | 显示全部楼层 |阅读模式
心血来潮买了个零刻ser9pro 64G版,发现最大到70b,跑大模型的速度GPU相比纯CPU没快多少,感觉买了个寂寞
cpu14b.png
gpu14b.png
跑个70bq4的模型只有不到2t/s的速度,完全没法用。
请问各位大拿,是不是我的软件设置有问题?lmstudio+魔塔的gguf官方模型
发表于 2025-4-7 15:50 | 显示全部楼层
4090跑70b q4也这速度
全都跑内存上去了能有多快
发表于 2025-4-7 15:50 | 显示全部楼层
 楼主| 发表于 2025-4-7 15:53 | 显示全部楼层
xy. 发表于 2025-4-7 15:50
ddr5 就是这个速度
https://vmem-for-llms.kcores.com/index-cn

我还特地买的64g版,划分48g显存,跑出来跟cpu完全没区别,看起来可能GPU有一点点加速
发表于 2025-4-7 15:53 | 显示全部楼层
lm studio是amd版本的吗?
发表于 2025-4-7 15:55 | 显示全部楼层
m2max 96G也这个速度
 楼主| 发表于 2025-4-7 15:58 | 显示全部楼层
创世神493 发表于 2025-4-7 15:53
lm studio是amd版本的吗?

我开始安装的是LMStudio for Ryzen AI,后来自动升级到0.3.14。核显驱动是最新3月16日发布。
 楼主| 发表于 2025-4-7 15:59 | 显示全部楼层
kzfile 发表于 2025-4-7 15:55
m2max 96G也这个速度

虽然平衡了,但确实买了个寂寞,跟4090比起来差太多了
发表于 2025-4-7 16:07 | 显示全部楼层
tutupc 发表于 2025-4-7 15:59
虽然平衡了,但确实买了个寂寞,跟4090比起来差太多了

那显存可比内存快太多了,至少差10倍的
发表于 2025-4-7 16:19 | 显示全部楼层
看来这个对带宽需求巨大,内存做显存还是瓶颈
发表于 2025-4-7 16:51 | 显示全部楼层
70b q4需要50多G显存吧?要不换32b q4看看?
发表于 2025-4-7 16:52 | 显示全部楼层
4090 LLaMA CPP在显存够的情况下(2x4090或者4090 48G) 70b q4大概是15~20t/s之间。
发表于 2025-4-7 17:28 | 显示全部楼层
楼主是在哪改的?B站看到一个人发改内存的视频 该不是你的机器吧
发表于 2025-4-7 18:57 | 显示全部楼层
kzfile 发表于 2025-4-7 15:55
m2max 96G也这个速度


HX370的实际内存带宽,不到80GB/s;
而,
m2max是400GB/s。96GB统一内存,用mlx跑70b,至少有13tokens以上。
发表于 2025-4-7 19:03 | 显示全部楼层
本身性能就不太行啊,一个移动平台的产品,专门跑大模型就是被忽悠了
发表于 2025-4-7 19:15 | 显示全部楼层
跑AI不行的。虽然也做成了类似统一内存,但带宽没跟上,就是硬伤。

传送门,
AI9 HX370 迷你主机零刻 SER9 深度测试
https://baijiahao.baidu.com/s?id=1812360342745639461
发表于 2025-4-7 19:22 | 显示全部楼层
HX370的890M目前还没有rocm适配呢......得有内测资格才行
 楼主| 发表于 2025-4-7 19:49 | 显示全部楼层
LMY99 发表于 2025-4-7 17:28
楼主是在哪改的?B站看到一个人发改内存的视频 该不是你的机器吧

我买的64g,不是改的
 楼主| 发表于 2025-4-7 19:50 | 显示全部楼层
某人的马甲 发表于 2025-4-7 19:22
HX370的890M目前还没有rocm适配呢......得有内测资格才行

希望适配了可能会好点
 楼主| 发表于 2025-4-7 19:51 | 显示全部楼层
云霄 发表于 2025-4-7 19:15
跑AI不行的。虽然也做成了类似统一内存,但带宽没跟上,就是硬伤。

传送门,

确实买了个寂寞,cpu和核显提升都不大,相比2k多的8845,毫无性价比
发表于 2025-4-7 21:10 | 显示全部楼层
要500g那种8通道的内存当显存才能跑跑,,,
发表于 2025-4-7 21:23 | 显示全部楼层
这玩意要能跑得动  老黄就该倒闭了
发表于 2025-4-7 21:38 | 显示全部楼层
32b q4也不是不能用,近期玩双A770 32G,感觉比楼主这个更能战未来。起码win11+lmstudio能跑到10tokens以上。

但这个速度其实对于vscode+cline的代码生成也是让人捉急得很。。。2tokens更不用想了。
发表于 2025-4-7 21:42 | 显示全部楼层
双通道 8000 lpddr5x跟性能没一毛钱关系
发表于 2025-4-7 22:59 | 显示全部楼层
tutupc 发表于 2025-4-7 19:50
希望适配了可能会好点

现阶段速度可能都不如8845
不过战未来嘛......linux下好像是初步适配了
发表于 2025-4-8 14:36 | 显示全部楼层
跑内存不就这个速度,想跑的快得390才行,那个四通道内存要快不少
当然还是很慢就是
 楼主| 发表于 2025-4-8 21:28 | 显示全部楼层
fgfdhgg 发表于 2025-4-8 14:36
跑内存不就这个速度,想跑的快得390才行,那个四通道内存要快不少
当然还是很慢就是 ...

对,跟4090比起来还是慢如蜗牛
发表于 2025-4-8 21:41 | 显示全部楼层
去年华硕天选首发的说是后续更新了bios怎么游戏性能好点了
发表于 2025-4-12 16:37 | 显示全部楼层
tutupc 发表于 2025-4-7 19:49
我买的64g,不是改的

现在JD自营都买不到64G版本了
 楼主| 发表于 2025-4-12 23:55 | 显示全部楼层
shalei2004 发表于 2025-4-12 16:37
现在JD自营都买不到64G版本了

我觉得32g都没必要,8845足以
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

Archiver|手机版|小黑屋|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806 上海市互联网违法与不良信息举报中心

GMT+8, 2025-4-19 23:28 , Processed in 0.014346 second(s), 6 queries , Gzip On, Redis On.

Powered by Discuz! X3.5 Licensed

© 2007-2024 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表