找回密码
 加入我们
搜索
      
查看: 1619|回复: 7

[CPU] 听说这次的ultra处理器都有npu?那读gguf的大模型能加速了?

[复制链接]
发表于 2024-10-12 17:22 | 显示全部楼层 |阅读模式
目前14700k的话运行70b的大模型才1token/s
根本没法愉快玩耍
如果ultra有npu加速的话,要能提升到5t/s的话至少是能用状态了
新u的游戏性能拉跨,但是大模型能加速的话我还真有心把手头这个14700k给换了
发表于 2024-10-12 17:39 | 显示全部楼层
瓶颈在内存上,就算intel把NVIDIA收购了在285K里集成4090也是1~2token/s
发表于 2024-10-12 17:46 来自手机 | 显示全部楼层
流星湖的npu 真要硬说12-14代也有npu 那会还叫gna 要不发布会上ultra 200v还有openvino里那个第五代npu哪来的
发表于 2024-10-12 23:41 | 显示全部楼层
awpak78 发表于 2024-10-12 17:39
瓶颈在内存上,就算intel把NVIDIA收购了在285K里集成4090也是1~2token/s

amd有个四通道的附带40cu核显与npu的玩意,那个跑llm岂不是很舒服
发表于 2024-10-12 23:51 | 显示全部楼层
本帖最后由 Ownab 于 2024-10-13 00:10 编辑

NPU不像CPU和GPU那样是个标准硬件
各家的NPU 甚至各代的NPU 都要用厂商私有SDK对接
别说ultra200,就算ultra300估计也很难普及,除非微软在系统层面完成硬件对接,对应用提供标准接口,就像DirectX那样标准化
而各家做端侧模型的为了覆盖更多市场(手机、车机、以及各种安卓设备) 高通平台优先级是最高的,Windows端侧适配NPU的商业区动力尚且不足

ultra200 硬件大概明年3月上市,而据我所知目前行业内头部厂商都没有正式的适配计划
发表于 2024-10-13 01:52 | 显示全部楼层
就为一小碟醋包两车皮饺子?
发表于 2024-10-13 01:55 | 显示全部楼层
随便弄个显卡不都比这强?
发表于 2024-10-13 02:16 | 显示全部楼层
用cpu跑大模型,这么狠。

cpu的内存带宽只有gpu的1/10,换9950x来都不太好使的,还是不要干这种事情吧。
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

Archiver|手机版|小黑屋|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806 上海市互联网违法与不良信息举报中心

GMT+8, 2025-2-20 11:37 , Processed in 0.008468 second(s), 5 queries , Gzip On, Redis On.

Powered by Discuz! X3.5 Licensed

© 2007-2024 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表