找回密码
 加入我们
搜索
      
查看: 8581|回复: 53

[软件] 国内deepseek的api谁的最流畅

[复制链接]
发表于 2025-2-6 09:34 | 显示全部楼层 |阅读模式
官方的目前白给了,api暂停开放,据说已经购买的速度也不理理,硅基流动的api因为这波活动现在难用的一笔,还有那些厂家的api可以考虑的,性价比高的。

自建目前手中的两套配置最高只能跑14b,在等等 amd的  395
发表于 2025-2-6 09:35 | 显示全部楼层
2080ti 22G*2 70b永远不亏
发表于 2025-2-6 09:40 | 显示全部楼层
秦南瓜 发表于 2025-2-6 09:35
2080ti 22G*2 70b永远不亏

速度咋样
 楼主| 发表于 2025-2-6 09:41 | 显示全部楼层
秦南瓜 发表于 2025-2-6 09:35
2080ti 22G*2 70b永远不亏


昨天还专门了解了一下这个 显卡成本在4500多,咸鱼买两个送nvlink,但是我bzhan搜了下 速度好像不是特别快,最主要的是 找不到好的购买渠道
发表于 2025-2-6 09:49 来自手机 | 显示全部楼层
4090 改 48g

点评

groq 的速度也可以,不过模型不是原生  发表于 2025-2-6 09:51
发表于 2025-2-6 09:55 | 显示全部楼层
发表于 2025-2-6 10:02 | 显示全部楼层
kanademoment 发表于 2025-2-6 09:55
正在用这个,跟着学习:https://www.bilibili.com/video/BV1EHFueSEZQ/?spm_id_from=333.1007.top_right_ba ...

广告就别发了
发表于 2025-2-6 10:03 | 显示全部楼层

哈哈,我还没弄呢,做了几天功课,反正2080ti 22g相当便宜。自己玩玩能跑就行。追求速度是没底的
发表于 2025-2-6 10:06 | 显示全部楼层
i6wz1l 发表于 2025-2-6 09:41
昨天还专门了解了一下这个 显卡成本在4500多,咸鱼买两个送nvlink,但是我bzhan搜了下 速度好像不是特别 ...


捡垃圾是这样的。要靠谱的24G vram就得3090ti起步,因为3090ti之前的不是矿就是魔改。

或者换换思路。4060ti 16G, 4070tisuper 多卡
发表于 2025-2-6 10:13 来自手机 | 显示全部楼层
openrouter吧,硅基我测试只有10token/s
发表于 2025-2-6 10:16 | 显示全部楼层
Nvidia NIM,这两天用 R1 速度很满意,1000 次 API 调用目前也足够了。
发表于 2025-2-6 10:44 | 显示全部楼层
反正我转回chatg p t了,而且下个月准备开200刀的pro。
发表于 2025-2-6 10:53 | 显示全部楼层

送你一句话,
要像质子一样思考和学习。


连筛选是否是广告的能力都没有,就不要先评论。

— —

内容解决了楼主api用不了用的慢的问题,手把手教你怎么用groq上的70b蒸馏模型

举一反三,还能学习博主怎么解决api区域问题的。
 楼主| 发表于 2025-2-6 10:56 | 显示全部楼层
秦南瓜 发表于 2025-2-6 10:06
捡垃圾是这样的。要靠谱的24G vram就得3090ti起步,因为3090ti之前的不是矿就是魔改。

或者换换思路。40 ...

两个4060ti能连机么,还是依次调用,好像有性能损失?
 楼主| 发表于 2025-2-6 10:57 | 显示全部楼层

咸鱼看了一下 要2w了
发表于 2025-2-6 11:28 | 显示全部楼层
现在几乎不能正常用的状态,硅基流动帮忙生成个代码卡在半路停了。官方总是崩溃刷不出答案
发表于 2025-2-6 11:52 | 显示全部楼层
还是用gemini2.0,deepseek开源了gemini的效率也提了不少。
发表于 2025-2-6 12:55 来自手机 | 显示全部楼层
试着用了一下阿里百炼、百度千帆和豆包,感觉豆包的最快,还有思考过程,百炼和千帆没有思考过程,速度一般。现在都有赠送token,可以都试试
发表于 2025-2-6 13:04 | 显示全部楼层
泥潭人均5090,配个32B,Q4的本地环境又不是不能用,再说4090这配置都有30 token/s的速度。
发表于 2025-2-6 13:09 | 显示全部楼层
不用过于追求token生成速度
超过了你的阅读速度,再快也没用了
发表于 2025-2-6 15:07 | 显示全部楼层
noirchen 发表于 2025-2-6 12:55
试着用了一下阿里百炼、百度千帆和豆包,感觉豆包的最快,还有思考过程,百炼和千帆没有思考过程,速度一般 ...

千帆的具体开始提示“抱歉,服务调用异常,请调整后再试。”硅基的也总是出问题,真是废了。。
发表于 2025-2-6 15:32 | 显示全部楼层
充了ds官方和硅基流动的API,现在都用不了,只能等等
发表于 2025-2-6 15:43 | 显示全部楼层

2080ti 22g 跑32B 还挺快的,有20tokens 的样子吧,两张2080ti 22g 跑70B我记得看B站别人测试速度挺慢,tokens 只有个位数
发表于 2025-2-6 16:03 | 显示全部楼层
groq可以
发表于 2025-2-6 16:06 | 显示全部楼层
满血版  nvdia NIM速度最快,比官网快,蒸馏的智商太低就不用了
发表于 2025-2-6 16:11 | 显示全部楼层
5090D现在还没法本地部署吗
发表于 2025-2-6 16:40 | 显示全部楼层
双3090 作sli是不是目前最平衡的方案?3090ti就算了,性价比不怎么高呀
发表于 2025-2-6 17:28 | 显示全部楼层
我輩樹である 发表于 2025-2-6 10:44
反正我转回chatg p t了,而且下个月准备开200刀的pro。

我最近也看到别人也是这么操作。

ds是很吊,chatg p t也不差,但是稳定大于一切,所以就买200刀的pro了
发表于 2025-2-6 17:30 | 显示全部楼层
本帖最后由 厌夜 于 2025-2-6 17:33 编辑

试试百度的,好像是8元还是16元百万token。(我说的是r1)
发表于 2025-2-6 17:43 | 显示全部楼层
chip_discovery 发表于 2025-2-6 15:43
2080ti 22g 跑32B 还挺快的,有20tokens 的样子吧,两张2080ti 22g 跑70B我记得看B站别人测试速度挺慢,t ...

跑推理模型双卡有用么?
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

Archiver|手机版|小黑屋|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806 上海市互联网违法与不良信息举报中心

GMT+8, 2025-4-20 03:02 , Processed in 0.335586 second(s), 6 queries , Gzip On, Redis On.

Powered by Discuz! X3.5 Licensed

© 2007-2024 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表