E5神教捡垃圾_低预算挑战DeepSeek-R1-Q3_K_L
本帖最后由 esxcfr 于 2025-2-17 01:18 编辑模型名称:DeepSeek-R1-GGUF/DeepSeek-R1-Q3_K_L-00001-of-00009.gguf
模型大小:347.45 GB
运行内存:325G
运行显存:22G
**天灵地煞听号令!
八方英灵速显形!**
今有弟子某某某,
恭请诸天神魔归位——
一拜玄天至圣CPU老尊者!
(高举(E5紫金法印)
尊驾四代九龙元神出窍:
14核真火照乾坤,28方外化分身!
超频敕令鬼神惊,算尽三界无遗策!
二迎黄氏仙山光明圣坛!
(奉上P40琉璃神龛)
光追宝镜悬九霄,tesla神通现法相:
CUDA两千化身列阵前,驱魔斩妖破虚妄!
游戏孽障皆退散,帧率直通南天门!
**三界见证——**(击鼓作法)
X99坐骑稳踏七星方位,
三星六臂护法风雷随身行,
西数十道童吞吐周天元气,
长城电母挥洒霹雳镇乾坤!
末了再请玄冰洞主水冷娘娘:
九曲黄河缠玉柱,四海真元纳壶中,
保得尊者头顶三花不散,胸中五气长存!
-----------------------------以上内容由DeepSeek-R1生成--------------------------------
各路老神仙大家都很熟,本尊照片不放了
下面是神仙们出场费明细:
E5 60
X99 499
DDR4REG(64G*6) 1860
P40 900(这位我请的早)
2.5SATA120G*10 200
共计4000左右
才0.5t/s?你就说能不能跑吧,这价格要啥自行车
有啥用?
0.5t够了,一天能翻译一篇短篇日本XX书了
效果不是70B那种蒸馏出来的弱智可以比的,身体部位的描写和心理活动润色的很好[偷笑] a010301208 发表于 2025-2-17 01:02
0.5t够了,一天能翻译一篇短篇日本XX书了
效果不是70B那种蒸馏出来的弱智可以比的,身体部位的描写和心理 ...
这位同学,你看XX书也不想被家人发现吧[偷笑],网址悄悄地发我 本帖最后由 a010301208 于 2025-2-17 01:15 编辑
esxcfr 发表于 2025-2-17 01:09
这位同学,你看XX书也不想被家人发现吧,网址悄悄地发我
我只是找20年前那些GALGAME的原版小说试了试,发现确实不错,反正用AINIee设置本地API就能全自动翻译,也不需要频繁操作,慢点就慢点,不过推理模型喜欢自己加戏,比如一个反派称自己是老子如何如何,有点出戏[偷笑] 用24G显存在本地跑70B其实也很慢。。。。而且还智障
翻译的话可以直接找G P T老师[再见] 内存带宽限制了发挥吧,x99太老了 LZ用的是E5 V4? 14 Core 28 thread 神教? 我有一台打人硕 X99-DELUXE II,E5 V3 16Core,32 thread,P40,内存80G,DeepSeek-R1-Q3_K_L 跑起很吃力 可能不如一块gen4 ssd 那还不如另一个水贴里的1代傲腾跑呢,造价稍微高点,0.8token,关键是量大管饱,双512G 就可以跑Q8全量的 0.5T,那啥,最普通的一个小问题,不都是15,20分钟起步的[狂笑] 飞翔的影子 发表于 2025-2-17 01:21
用24G显存在本地跑70B其实也很慢。。。。而且还智障
翻译的话可以直接找G P T老师 ...
24g显存跑14b差不多了,本身32b的模型质量就一般,还不如14b q8 KimmyGLM 发表于 2025-2-17 09:11
那还不如另一个水贴里的1代傲腾跑呢,造价稍微高点,0.8token,关键是量大管饱,双512G 就可以跑Q8全量的 ...
这个组合是想要验证KTransformers那个方案的,各指标都按那个配置,最后装在一个ITX机箱里 甚至还不如X79纯CPU跑[再见] 正好,我还有个720xd来着,就差显卡了~[偷笑] 哇哦,我都想试试了,不知道-04的zen3是不是有bug,跑ollama会卡死。
页:
[1]