找回密码
 加入我们
搜索
      
查看: 1604|回复: 17

[软件] 4070+13700k+128内存带不动deepseek-r1 14B吗?

[复制链接]
发表于 2025-3-19 20:08 | 显示全部楼层 |阅读模式
本帖最后由 vyvix 于 2025-3-19 20:10 编辑

公版4070+13700k+128内存,带不动deepseek-r1 14B吗?

我安装的是Ollama:deepseek-r1:14b
客户端:Cherry Studio
8B速度挺快的,14B有点慢,可以通过设置提速吗?

8B:response_token/s: 45.81,prompt_token/s: 2736.29
14B:response_token/s: 7.55,prompt_token/s: 34.6
QQ20250319-200555.png
发表于 2025-3-19 20:17 | 显示全部楼层
爆显存了,14B大概是13G多吧。你找个蒸馏得只有8G多的14B-Q4试试就知道了。
 楼主| 发表于 2025-3-19 20:19 | 显示全部楼层
xysquare 发表于 2025-3-19 20:17
爆显存了,14B大概是13G多吧。你找个蒸馏得只有8G多的14B-Q4试试就知道了。

我用的是:ollama官网的deepseek-r1:14b(9.0GB),你说的在哪里下载?
发表于 2025-3-19 20:55 | 显示全部楼层
本帖最后由 YsHaNg 于 2025-3-19 12:57 编辑
vyvix 发表于 2025-3-19 12:19
我用的是:ollama官网的deepseek-r1:14b(9.0GB),你说的在哪里下载?


我记得ollama.com默认提供的是q4k_m 你换个q3的试试ollama run hf.co/unsloth/DeepSeek-R1-GGUF:Q3_K_M
ollama show deepseek-r1:14b看看模型是不是小于显存就好
ollama ps看看跑的时候是不是100%在gpu上
13700内存带宽太小 再快容易点的办法是换llama.cpp或者一步到位vllm/transformers
发表于 2025-3-19 21:16 | 显示全部楼层
看见有2080ti的魔改22G 商家还带保修  不知道跑个14B行不行··
发表于 2025-3-19 21:23 | 显示全部楼层
你没看见共享内存当显存了吗
发表于 2025-3-19 22:19 | 显示全部楼层
我的3060 TI 8G显存 +至强 W3235+96兆内存,挺快的
 楼主| 发表于 2025-3-19 22:33 | 显示全部楼层
a010301208 发表于 2025-3-19 21:23
你没看见共享内存当显存了吗

怎么解决呢?
发表于 2025-3-19 22:45 | 显示全部楼层

要么换大显存显卡,要么就别跑14B了,反正也爆显存了,用内存直接跑更大的模型
 楼主| 发表于 2025-3-20 00:24 | 显示全部楼层
a010301208 发表于 2025-3-19 22:45
要么换大显存显卡,要么就别跑14B了,反正也爆显存了,用内存直接跑更大的模型 ...

内存直接跑更大的模型,怎么选内存跑?
发表于 2025-3-20 00:34 | 显示全部楼层
vyvix 发表于 2025-3-20 00:24
内存直接跑更大的模型,怎么选内存跑?

自动分配
发表于 2025-3-20 05:10 来自手机 | 显示全部楼层
vyvix 发表于 2025-3-19 16:24
内存直接跑更大的模型,怎么选内存跑?

找个能给ollama传递参数的前端 pass num_gpu=0
open webui
发表于 2025-3-20 08:16 来自手机 | 显示全部楼层
不至于啊,我c612 2640v4 96G 内存加512M 亮机卡都可以跑14b ,不至于是硬件问题。
发表于 2025-3-20 09:38 来自手机 | 显示全部楼层
这速度还嫌慢啊?我137k+64g d+2060 12g还跑32b呢,速度更慢,能跑就行
发表于 2025-3-20 11:53 | 显示全部楼层
gqy2000 发表于 2025-3-19 22:19
我的3060 TI 8G显存 +至强 W3235+96兆内存,挺快的

96兆?????????????
发表于 2025-3-20 12:12 | 显示全部楼层
你带起来干嘛,14B可能还不如** 3.5,直接用满血API,你充10块钱能用好久了
发表于 2025-3-20 13:10 | 显示全部楼层
vyvix 发表于 2025-3-19 20:19
我用的是:ollama官网的deepseek-r1:14b(9.0GB),你说的在哪里下载?

去抱脸网找找合适的模型。需科学。
发表于 2025-3-20 13:33 | 显示全部楼层
12700k+ddr4 96g+A770 16G跑14B流畅,跑32B慢吞吞。
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

Archiver|手机版|小黑屋|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806 上海市互联网违法与不良信息举报中心

GMT+8, 2025-4-21 03:33 , Processed in 0.012033 second(s), 6 queries , Gzip On, Redis On.

Powered by Discuz! X3.5 Licensed

© 2007-2024 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表