找回密码
 加入我们
搜索
      
楼主: os39000

[CPU] 8581C和1080ti单精度浮点都在10TFLOPS左右

[复制链接]
发表于 2025-1-13 23:58 | 显示全部楼层
zhuifeng88 发表于 2025-1-11 10:42
展开这个那直接去看deepseek的paper喽, mla是在v2最初提出的, 附录C部分

已经有人测试过了,效果不错。MLA不是问题
发表于 2025-1-14 01:06 | 显示全部楼层
本帖最后由 zhuifeng88 于 2025-1-14 01:08 编辑
mfkiwl 发表于 2025-1-13 23:58
已经有人测试过了,效果不错。MLA不是问题


我也测过, 现在mla cpu几个实现prefill连20tflops都跑不到, 只能当玩具 (当然性能目标只是单用户十几k context长度以内玩玩的话那当我没说)
发表于 2025-1-14 01:55 | 显示全部楼层
zhuifeng88 发表于 2025-1-14 01:06
我也测过, 现在mla cpu几个实现prefill连20tflops都跑不到, 只能当玩具 (当然性能目标只是单用户十几k co ...

你这13格也太高了。这东东能给个提供本地LLM就相当不错了
发表于 2025-1-15 21:31 | 显示全部楼层
momo77989724 发表于 2025-1-8 23:50
内存问题不大  都支持 48G便宜现在
超微主板睿频后有点卡卡的 我周末去搞个技嘉主板试试 ...

windows 对4 5 6 代cpu 有c6 bug,响应慢,建议关闭c6
发表于 2025-1-15 22:20 | 显示全部楼层
fengxu106 发表于 2025-1-15 21:31
windows 对4 5 6 代cpu 有c6 bug,响应慢,建议关闭c6

关闭就没睿频了。。。牙膏唯一的睿频优势就G了
发表于 2025-1-15 22:47 | 显示全部楼层
zhuifeng88 发表于 2024-12-12 20:46
不过用法可能和你想的不太一样...因为是纯gemm算力, 而转置/scale之类的能力还是普通CPU水平, 所以4,5,6 ...

厉害
发表于 2025-1-15 22:48 | 显示全部楼层
网仙 发表于 2024-12-14 12:19
请教下,这种马来CPU,在海鲜市场存量好像非常之大。而且都是正式版,价格比行货便宜太多,还是很超值的 ...

稳定性应该没问题,算是大厂定制吧,运营商,云服务商,数据中心,很多这种
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

Archiver|手机版|小黑屋|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806 上海市互联网违法与不良信息举报中心

GMT+8, 2025-2-20 11:12 , Processed in 0.009056 second(s), 4 queries , Gzip On, Redis On.

Powered by Discuz! X3.5 Licensed

© 2007-2024 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表