请教一下怎么区分DeepSeek的版本问题?
本帖最后由 MDC 于 2025-2-27 14:29 编辑请教下大佬们,有什么验证机制,能验证API给的哪个模型,是满血671B还是用的是量化或者蒸馏版本?就是公司找了第三方提供Api,但是说的是671B,如果偷偷换了什么70b或者1.58 1.72量化版本。我怎么知道呢?
________________________________________________________________________________
一轮测试,官网版,英伟达版本,还有钉钉内置671B基本上都回答正确。
硅基流动 对了一半,可能用的量化版本?
阿里云百练直接答错/不知道怎么搞的。
32 70b这种蒸馏的也是翻车。 顺便请教下大佬们,你们用的什么联网搜索的API啊?还是说duckgogo这种免费的?
最近的研究,蒸馏版喜欢overthinking。 我一般问两个问题,strawberry有几个r,以及左边木右边乞是什么字,只有671b回答是又快又准 ziehie107 发表于 2025-2-27 11:48
我一般问两个问题,strawberry有几个r,以及左边木右边乞是什么字,只有671b回答是又快又准 ...
是不是还有古诗的?其次是1.58这种R1量化的不是蒸馏的,是不是也会准确? MDC 发表于 2025-2-27 12:14
是不是还有古诗的?其次是1.58这种R1量化的不是蒸馏的,是不是也会准确? ...
1.58bit的三元值量化相比fp8损失非常大,至少用2.22或者2.5 平安是福 发表于 2025-2-27 12:35
1.58bit的三元值量化相比fp8损失非常大,至少用2.22或者2.5
对,我知道这个,但是比较好奇,怎么只通过api知道用的是哪版? MDC 发表于 2025-2-27 14:07
对,我知道这个,但是比较好奇,怎么只通过api知道用的是哪版?
不是DS官方重新放开了API的充值了吗,直接用原版的啊 ziehie107 发表于 2025-2-27 11:48
我一般问两个问题,strawberry有几个r,以及左边木右边乞是什么字,只有671b回答是又快又准 ...
"strawberry有几个r" 这个问题厉害啊
我用deepseek官网问这个问题, 开启深度思考(r1)
居然用了250秒, 并且打开思考过程好像是陷入无限循环中.
蒸馏模型32B会答错, 70B就能够正确回答了
atlantis414 发表于 2025-2-27 14:51
"strawberry有几个r" 这个问题厉害啊
我用deepseek官网问这个问题, 开启深度思考(r1)
我本地部署的70b有时候会答错,但671b一直是很准的 直接看模型文件大小或者占用的空间
就算是671B,还有不同精度的版本,回答问题是有区别的。 atlantis414 发表于 2025-2-27 14:51
"strawberry有几个r" 这个问题厉害啊
我用deepseek官网问这个问题, 开启深度思考(r1)
因为中文互联网上有一些错误答案,ds自己思考然后对比网上的答案发现不一样就会再验证再思考 c2h6o 发表于 2025-2-27 07:43
直接看模型文件大小或者占用的空间
就算是671B,还有不同精度的版本,回答问题是有区别的。 ...
api不会给你返回文件大小的 MDC 发表于 2025-2-27 03:27
顺便请教下大佬们,你们用的什么联网搜索的API啊?还是说duckgogo这种免费的?
...
google pse 就论坛右上角那个 硅基流动的671b回答几个r的问题陷入了死循环了快,难道不是满血版? 这个问题在我mac上跑的的32b的回答是对的 YsHaNg 发表于 2025-2-27 19:24
api不会给你返回文件大小的
光靠问题只能大概判断,同一个问题多问几次可能结果每次都不完全一样。 c2h6o 发表于 2025-2-27 20:12
光靠问题只能大概判断,同一个问题多问几次可能结果每次都不完全一样。 ...
那你有好办法么
就用官网API就行,最近能冲值了,费用也正在优惠期间 问他微信的微是几笔 答对了就是 70B 以上
页:
[1]