请教一下怎么区分DeepSeek的版本问题？

MDC 发表于 2025-2-27 11:26

本帖最后由 MDC 于 2025-2-27 14:29 编辑

请教下大佬们，有什么验证机制，能验证API给的哪个模型，是满血671B还是用的是量化或者蒸馏版本？就是公司找了第三方提供Api,但是说的是671B，如果偷偷换了什么70b或者1.58 1.72量化版本。我怎么知道呢？
________________________________________________________________________________
一轮测试，官网版，英伟达版本，还有钉钉内置671B基本上都回答正确。
硅基流动对了一半，可能用的量化版本？
阿里云百练直接答错/不知道怎么搞的。
32 70b这种蒸馏的也是翻车。

MDC 发表于 2025-2-27 11:27

顺便请教下大佬们，你们用的什么联网搜索的API啊？还是说duckgogo这种免费的？

我輩樹である 发表于 2025-2-27 11:46

最近的研究，蒸馏版喜欢overthinking。

ziehie107 发表于 2025-2-27 11:48

我一般问两个问题，strawberry有几个r，以及左边木右边乞是什么字，只有671b回答是又快又准

MDC 发表于 2025-2-27 12:14

ziehie107 发表于 2025-2-27 11:48
我一般问两个问题，strawberry有几个r，以及左边木右边乞是什么字，只有671b回答是又快又准 ...

是不是还有古诗的？其次是1.58这种R1量化的不是蒸馏的，是不是也会准确？

平安是福 发表于 2025-2-27 12:35

MDC 发表于 2025-2-27 12:14
是不是还有古诗的？其次是1.58这种R1量化的不是蒸馏的，是不是也会准确？ ...

1.58bit的三元值量化相比fp8损失非常大，至少用2.22或者2.5

MDC 发表于 2025-2-27 14:07

平安是福发表于 2025-2-27 12:35
1.58bit的三元值量化相比fp8损失非常大，至少用2.22或者2.5

对，我知道这个，但是比较好奇，怎么只通过api知道用的是哪版？

lja046 发表于 2025-2-27 14:49

MDC 发表于 2025-2-27 14:07
对，我知道这个，但是比较好奇，怎么只通过api知道用的是哪版？

不是DS官方重新放开了API的充值了吗，直接用原版的啊

atlantis414 发表于 2025-2-27 14:51

ziehie107 发表于 2025-2-27 11:48
我一般问两个问题，strawberry有几个r，以及左边木右边乞是什么字，只有671b回答是又快又准 ...

"strawberry有几个r" 这个问题厉害啊

我用deepseek官网问这个问题, 开启深度思考(r1)

居然用了250秒, 并且打开思考过程好像是陷入无限循环中.

蒸馏模型32B会答错, 70B就能够正确回答了

蓦然回首 发表于 2025-2-27 14:53

ziehie107 发表于 2025-2-27 14:57

atlantis414 发表于 2025-2-27 14:51
"strawberry有几个r" 这个问题厉害啊

我用deepseek官网问这个问题, 开启深度思考(r1)

我本地部署的70b有时候会答错，但671b一直是很准的

c2h6o 发表于 2025-2-27 15:43

直接看模型文件大小或者占用的空间
就算是671B，还有不同精度的版本，回答问题是有区别的。

MolaMola 发表于 2025-2-27 18:27

atlantis414 发表于 2025-2-27 14:51
"strawberry有几个r" 这个问题厉害啊

我用deepseek官网问这个问题, 开启深度思考(r1)

因为中文互联网上有一些错误答案，ds自己思考然后对比网上的答案发现不一样就会再验证再思考

YsHaNg 发表于 2025-2-27 19:24

c2h6o 发表于 2025-2-27 07:43
直接看模型文件大小或者占用的空间
就算是671B，还有不同精度的版本，回答问题是有区别的。 ...

api不会给你返回文件大小的

YsHaNg 发表于 2025-2-27 19:25

MDC 发表于 2025-2-27 03:27
顺便请教下大佬们，你们用的什么联网搜索的API啊？还是说duckgogo这种免费的？
...

google pse 就论坛右上角那个

juhne 发表于 2025-2-27 19:45

硅基流动的671b回答几个r的问题陷入了死循环了快，难道不是满血版？

ironrage 发表于 2025-2-27 19:59

这个问题在我mac上跑的的32b的回答是对的

c2h6o 发表于 2025-2-27 20:12

YsHaNg 发表于 2025-2-27 19:24
api不会给你返回文件大小的

光靠问题只能大概判断，同一个问题多问几次可能结果每次都不完全一样。

MDC 发表于 2025-2-27 20:30

c2h6o 发表于 2025-2-27 20:12
光靠问题只能大概判断，同一个问题多问几次可能结果每次都不完全一样。 ...

那你有好办法么

nn1122 发表于 2025-2-27 21:41

就用官网API就行，最近能冲值了，费用也正在优惠期间

wun_008 发表于 2025-2-28 08:33

问他微信的微是几笔答对了就是 70B 以上

页: [1]

Chiphell - 分享与交流用户体验's Archiver

请教一下怎么区分DeepSeek的版本问题？