4070+13700k+128内存带不动deepseek-r1 14B吗？

vyvix 发表于 2025-3-19 20:08

本帖最后由 vyvix 于 2025-3-19 20:10 编辑

公版4070+13700k+128内存，带不动deepseek-r1 14B吗？

我安装的是Ollama：deepseek-r1:14b
客户端：Cherry Studio
8B速度挺快的，14B有点慢，可以通过设置提速吗？

8B：response_token/s: 45.81，prompt_token/s: 2736.29
14B：response_token/s: 7.55，prompt_token/s: 34.6

xysquare 发表于 2025-3-19 20:17

爆显存了，14B大概是13G多吧。你找个蒸馏得只有8G多的14B-Q4试试就知道了。

vyvix 发表于 2025-3-19 20:19

xysquare 发表于 2025-3-19 20:17
爆显存了，14B大概是13G多吧。你找个蒸馏得只有8G多的14B-Q4试试就知道了。

我用的是：ollama官网的deepseek-r1:14b（9.0GB），你说的在哪里下载？

YsHaNg 发表于 2025-3-19 20:55

本帖最后由 YsHaNg 于 2025-3-19 12:57 编辑

vyvix 发表于 2025-3-19 12:19
我用的是：ollama官网的deepseek-r1:14b（9.0GB），你说的在哪里下载？

我记得ollama.com默认提供的是q4k_m 你换个q3的试试ollama run hf.co/unsloth/DeepSeek-R1-GGUF:Q3_K_M
ollama show deepseek-r1:14b看看模型是不是小于显存就好
ollama ps看看跑的时候是不是100%在gpu上
13700内存带宽太小再快容易点的办法是换llama.cpp或者一步到位vllm/transformers

ruo101 发表于 2025-3-19 21:16

看见有2080ti的魔改22G 商家还带保修不知道跑个14B行不行··

a010301208 发表于 2025-3-19 21:23

你没看见共享内存当显存了吗

gqy2000 发表于 2025-3-19 22:19

我的3060 TI 8G显存 +至强 W3235+96兆内存，挺快的

vyvix 发表于 2025-3-19 22:33

a010301208 发表于 2025-3-19 21:23
你没看见共享内存当显存了吗

怎么解决呢？

a010301208 发表于 2025-3-19 22:45

vyvix 发表于 2025-3-19 22:33
怎么解决呢？

要么换大显存显卡，要么就别跑14B了，反正也爆显存了，用内存直接跑更大的模型

vyvix 发表于 2025-3-20 00:24

a010301208 发表于 2025-3-19 22:45
要么换大显存显卡，要么就别跑14B了，反正也爆显存了，用内存直接跑更大的模型 ...

内存直接跑更大的模型，怎么选内存跑？

a010301208 发表于 2025-3-20 00:34

vyvix 发表于 2025-3-20 00:24
内存直接跑更大的模型，怎么选内存跑？

自动分配

YsHaNg 发表于 2025-3-20 05:10

vyvix 发表于 2025-3-19 16:24
内存直接跑更大的模型，怎么选内存跑？

找个能给ollama传递参数的前端 pass num_gpu=0
open webui

jihu123 发表于 2025-3-20 08:16

不至于啊，我c612 2640v4 96G 内存加512M 亮机卡都可以跑14b ，不至于是硬件问题。

loughlion 发表于 2025-3-20 09:38

这速度还嫌慢啊？我137k+64g d+2060 12g还跑32b呢，速度更慢，能跑就行

刘品德1983 发表于 2025-3-20 11:53

gqy2000 发表于 2025-3-19 22:19
我的3060 TI 8G显存 +至强 W3235+96兆内存，挺快的

96兆?????????????

重庆森林 发表于 2025-3-20 12:12

你带起来干嘛，14B可能还不如** 3.5，直接用满血API，你充10块钱能用好久了

xysquare 发表于 2025-3-20 13:10

vyvix 发表于 2025-3-19 20:19
我用的是：ollama官网的deepseek-r1:14b（9.0GB），你说的在哪里下载？

去抱脸网找找合适的模型。需科学。

斩龙发表于 2025-3-20 13:33

12700k+ddr4 96g+A770 16G跑14B流畅，跑32B慢吞吞。

页: [1]

Chiphell - 分享与交流用户体验's Archiver

4070+13700k+128内存带不动deepseek-r1 14B吗？