找回密码
 加入我们
搜索
      
楼主: KimmyGLM

[CPU] 9700x+192G 跑1.58bit 671B 分享

[复制链接]
发表于 2025-2-18 10:03 | 显示全部楼层
KimmyGLM 发表于 2025-2-18 09:04
也许双路6代志强+AMX+mcridmm8000内存,可能流畅。。。

据说单路双路影响不大,AMX和内存带宽影响大,我从b站看的哈。
发表于 2025-2-18 10:05 | 显示全部楼层
KimmyGLM 发表于 2025-2-18 09:54
傲腾死的不冤枉,这玩意没前途啊,本身傲腾安装都要1根傲腾+1根普通dimm内存交替;
带宽就算是第三代D5, ...

Xeon Max我也看了 要是能正常使用现在绝对很合适 可惜 牢英啊牢英
发表于 2025-2-18 10:13 | 显示全部楼层
话说KT现在只有0.21吧,0.3有没有大致的时间什么时候放出来?目前的0.21用avx512能达到怎样的性能?
 楼主| 发表于 2025-2-18 10:27 | 显示全部楼层
hawie 发表于 2025-2-18 10:13
话说KT现在只有0.21吧,0.3有没有大致的时间什么时候放出来?目前的0.21用avx512能达到怎样的性能? ...

https://www.chiphell.com/thread-2672942-1-1.html

昨天一起发的,单路9654+4090,跑Q4 671b,0.2的KT框架;
10- 14token!非常惊人

评分

参与人数 1邪恶指数 +5 收起 理由
hawie + 5

查看全部评分

发表于 2025-2-18 11:29 | 显示全部楼层
学习了,好歹能跑,48G单条买的哪家的?
 楼主| 发表于 2025-2-18 13:10 | 显示全部楼层
秦南瓜 发表于 2025-2-18 11:29
学习了,好歹能跑,48G单条买的哪家的?

闲鱼搜48G 海力士 UDIMM即可
发表于 2025-2-18 13:32 | 显示全部楼层
后排给要买内存的提个醒

当下不要买32G买48G,两者都没差几个钱,epyc12条 576G,足够KTF方案了,64G又太贵了
发表于 2025-2-18 13:51 | 显示全部楼层
KimmyGLM 发表于 2025-2-18 13:10
闲鱼搜48G 海力士 UDIMM即可

感谢,OC到6000c28需要加马甲吗?

老哥你多少钱一条买的,参考下
发表于 2025-2-18 16:37 来自手机 | 显示全部楼层
KimmyGLM 发表于 2025-2-18 01:54
傲腾死的不冤枉,这玩意没前途啊,本身傲腾安装都要1根傲腾+1根普通dimm内存交替;
带宽就算是第三代D5, ...

ollama也是fa限定tensor core 连带着kvcache什么都不能上 正好节省资源的手段老卡都用不了 llama.cpp都port到非tensor连rocm都能用 这东西开发太慢了 以后gqa包括mla都有的等
发表于 2025-2-18 16:40 | 显示全部楼层

X870E 战斧可否192g 6000C30?
 楼主| 发表于 2025-2-18 16:41 | 显示全部楼层
YsHaNg 发表于 2025-2-18 16:37
ollama也是fa限定tensor core 连带着kvcache什么都不能上 正好节省资源的手段老卡都用不了 llama.cpp都po ...

llama.cpp支持了AMX,但是没有看到应用成功的;
另外他们的offload 混合部署好像还不太行
 楼主| 发表于 2025-2-18 16:48 | 显示全部楼层
秦南瓜 发表于 2025-2-18 13:51
感谢,OC到6000c28需要加马甲吗?

老哥你多少钱一条买的,参考下

价格都一样的,660....
不需要马甲,温度很低,跑DS 47度
发表于 2025-2-18 16:50 | 显示全部楼层
本帖最后由 秦南瓜 于 2025-2-18 16:57 编辑
KimmyGLM 发表于 2025-2-18 16:48
价格都一样的,660....
不需要马甲,温度很低,跑DS 47度


太棒了,性价比可以啊!感谢!
发表于 2025-2-18 17:21 来自手机 | 显示全部楼层
KimmyGLM 发表于 2025-2-18 08:41
llama.cpp支持了AMX,但是没有看到应用成功的;
另外他们的offload 混合部署好像还不太行 ...

按照大家说法都是ollama/llama.cpp只配当草履虫 开源方案还得看vllm/transformer 更别提那些没开源的推理框架 包括deepseek自己的 目前市面上应该还没有任何别的mla实现
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

Archiver|手机版|小黑屋|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806 上海市互联网违法与不良信息举报中心

GMT+8, 2025-2-19 04:44 , Processed in 0.010356 second(s), 6 queries , Gzip On, Redis On.

Powered by Discuz! X3.5 Licensed

© 2007-2024 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表