MDC 发表于 2025-2-27 11:26

请教一下怎么区分DeepSeek的版本问题?

本帖最后由 MDC 于 2025-2-27 14:29 编辑

请教下大佬们,有什么验证机制,能验证API给的哪个模型,是满血671B还是用的是量化或者蒸馏版本?就是公司找了第三方提供Api,但是说的是671B,如果偷偷换了什么70b或者1.58 1.72量化版本。我怎么知道呢?
________________________________________________________________________________
一轮测试,官网版,英伟达版本,还有钉钉内置671B基本上都回答正确。
硅基流动 对了一半,可能用的量化版本?
阿里云百练直接答错/不知道怎么搞的。
32 70b这种蒸馏的也是翻车。

MDC 发表于 2025-2-27 11:27

顺便请教下大佬们,你们用的什么联网搜索的API啊?还是说duckgogo这种免费的?

我輩樹である 发表于 2025-2-27 11:46

最近的研究,蒸馏版喜欢overthinking。

ziehie107 发表于 2025-2-27 11:48

我一般问两个问题,strawberry有几个r,以及左边木右边乞是什么字,只有671b回答是又快又准

MDC 发表于 2025-2-27 12:14

ziehie107 发表于 2025-2-27 11:48
我一般问两个问题,strawberry有几个r,以及左边木右边乞是什么字,只有671b回答是又快又准 ...

是不是还有古诗的?其次是1.58这种R1量化的不是蒸馏的,是不是也会准确?

平安是福 发表于 2025-2-27 12:35

MDC 发表于 2025-2-27 12:14
是不是还有古诗的?其次是1.58这种R1量化的不是蒸馏的,是不是也会准确? ...

1.58bit的三元值量化相比fp8损失非常大,至少用2.22或者2.5

MDC 发表于 2025-2-27 14:07

平安是福 发表于 2025-2-27 12:35
1.58bit的三元值量化相比fp8损失非常大,至少用2.22或者2.5

对,我知道这个,但是比较好奇,怎么只通过api知道用的是哪版?

lja046 发表于 2025-2-27 14:49

MDC 发表于 2025-2-27 14:07
对,我知道这个,但是比较好奇,怎么只通过api知道用的是哪版?

不是DS官方重新放开了API的充值了吗,直接用原版的啊

atlantis414 发表于 2025-2-27 14:51

ziehie107 发表于 2025-2-27 11:48
我一般问两个问题,strawberry有几个r,以及左边木右边乞是什么字,只有671b回答是又快又准 ...

"strawberry有几个r" 这个问题厉害啊

我用deepseek官网问这个问题, 开启深度思考(r1)


居然用了250秒, 并且打开思考过程好像是陷入无限循环中.

蒸馏模型32B会答错, 70B就能够正确回答了

蓦然回首 发表于 2025-2-27 14:53

ziehie107 发表于 2025-2-27 14:57

atlantis414 发表于 2025-2-27 14:51
"strawberry有几个r" 这个问题厉害啊

我用deepseek官网问这个问题, 开启深度思考(r1)


我本地部署的70b有时候会答错,但671b一直是很准的

c2h6o 发表于 2025-2-27 15:43

直接看模型文件大小或者占用的空间
就算是671B,还有不同精度的版本,回答问题是有区别的。

MolaMola 发表于 2025-2-27 18:27

atlantis414 发表于 2025-2-27 14:51
"strawberry有几个r" 这个问题厉害啊

我用deepseek官网问这个问题, 开启深度思考(r1)


因为中文互联网上有一些错误答案,ds自己思考然后对比网上的答案发现不一样就会再验证再思考

YsHaNg 发表于 2025-2-27 19:24

c2h6o 发表于 2025-2-27 07:43
直接看模型文件大小或者占用的空间
就算是671B,还有不同精度的版本,回答问题是有区别的。 ...

api不会给你返回文件大小的

YsHaNg 发表于 2025-2-27 19:25

MDC 发表于 2025-2-27 03:27
顺便请教下大佬们,你们用的什么联网搜索的API啊?还是说duckgogo这种免费的?
...

google pse 就论坛右上角那个

juhne 发表于 2025-2-27 19:45

硅基流动的671b回答几个r的问题陷入了死循环了快,难道不是满血版?

ironrage 发表于 2025-2-27 19:59

这个问题在我mac上跑的的32b的回答是对的

c2h6o 发表于 2025-2-27 20:12

YsHaNg 发表于 2025-2-27 19:24
api不会给你返回文件大小的

光靠问题只能大概判断,同一个问题多问几次可能结果每次都不完全一样。

MDC 发表于 2025-2-27 20:30

c2h6o 发表于 2025-2-27 20:12
光靠问题只能大概判断,同一个问题多问几次可能结果每次都不完全一样。 ...

那你有好办法么

nn1122 发表于 2025-2-27 21:41

就用官网API就行,最近能冲值了,费用也正在优惠期间

wun_008 发表于 2025-2-28 08:33

问他微信的微是几笔 答对了就是 70B 以上
页: [1]
查看完整版本: 请教一下怎么区分DeepSeek的版本问题?