找回密码
 加入我们
搜索
      
查看: 2670|回复: 7

[CPU] KTransformers库给cpu运行dsr1带来了极大的变化

[复制链接]
发表于 2025-2-12 09:31 | 显示全部楼层 |阅读模式
本帖最后由 qdzx123 于 2025-2-12 09:39 编辑

https://github.com/kvcache-ai/ktransformers

c09504de63d5691c963b78463e859b44.png

大体上就是用gpu加速的纯cpu方案 仅需一个16g显存的显卡 推荐30系以后
有个神奇的双socket加速(大概就是付出双倍的容量可能还有cpu负载换等效带宽)


开发者使用的是带amx的8路志强 但是我猜用12路的epyc会更劲

感谢开发者大佬 终于有我承受的起的便宜本地方案了


强烈建议各位手上有符合要求设备的兄弟们在v0.3正式释出后多测试 现在还搞不清楚新的性能瓶颈是什么
发表于 2025-2-17 13:54 | 显示全部楼层
性能瓶颈大概率还是内存带宽

就是不知道这个方案甜点显存大小是多少,如果是32g显存和128g显存速度差了很多的话就没啥必要了
发表于 2025-2-17 14:02 | 显示全部楼层
目前还有待确认的一点就是AMX的影响到底大不大,毕竟四五代EPYC内存带宽可是实打实的比四五代的志强可扩展大,比如9965,带宽 576GB/s, 8593Q 358.4GB/s,差的有点多,但是V0.3需要AMX支持,
发表于 2025-2-17 16:42 | 显示全部楼层
amx都没几款CPU支持
发表于 2025-2-17 16:45 | 显示全部楼层
richardlynn 发表于 2025-2-17 16:42
amx都没几款CPU支持

4代5代可拓展志强都支持的
发表于 2025-2-17 16:56 | 显示全部楼层
chip_discovery 发表于 2025-2-17 14:02
目前还有待确认的一点就是AMX的影响到底大不大,毕竟四五代EPYC内存带宽可是实打实的比四五代的志强可扩展 ...

这个问题我也想知道
发表于 2025-2-17 17:44 | 显示全部楼层
单路 Intel(R) Xeon(R) Gold 6226R CPU @ 2.90GHz
能跑这个架构的么 查了一下没有AMX指令集
 楼主| 发表于 2025-2-18 09:41 | 显示全部楼层
autobotsop 发表于 2025-2-17 17:44
单路 Intel(R) Xeon(R) Gold 6226R CPU @ 2.90GHz
能跑这个架构的么 查了一下没有AMX指令集 ...

手上有硬件建议尝试下
手上没有建议观望
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

Archiver|手机版|小黑屋|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806 上海市互联网违法与不良信息举报中心

GMT+8, 2025-4-22 05:08 , Processed in 0.010265 second(s), 6 queries , Gzip On, Redis On.

Powered by Discuz! X3.5 Licensed

© 2007-2024 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表