hantty 发表于 2025-1-27 12:43

DeepSeek和chat**什么关系??

我看推送它早上宕机就去问了它一下,结果它当自己是chat**?





8owd8wan 发表于 2025-1-27 12:47

现在各种模型之间,都是被拿着互相训练。
习惯就好。
你喂我,我喂你,你蒸馏我,我蒸馏你

Anderson997 发表于 2025-1-27 12:51

think都点开了,你是怎么得出标题这个结论的?

我輩樹である 发表于 2025-1-27 12:52

强化学习需要有个环境来提供反馈,这个环境有可能是别家ai。

这个就没必要纠结了,各家都是这样的,无非就是后面要不要做c e n s o r了。

相思风雨中 发表于 2025-1-27 13:00

竞争对手

鬼武人 发表于 2025-1-27 13:05

前浪后浪

Mitsuha 发表于 2025-2-5 11:42

深度思考都告诉你思考内容了,他思考的是**相关信息,看不明白吗?

uxuey 发表于 2025-2-5 11:55

冷知识 ds的数据库截止到2023年10月,你这个结果都是搜网页出来的

theUserName 发表于 2025-2-5 12:49

本质上一样的,deepseek你可以理解为是中国版chat**,用低得多的成本和有独创性的方法达到了差不多(甚至更好)的效果

vancho 发表于 2025-2-5 13:13

巨人的肩膀和我

dreamyeah 发表于 2025-2-5 13:28

就是抄袭chat**.

dcx_310 发表于 2025-2-5 13:59

dreamyeah 发表于 2025-2-5 13:28
就是抄袭chat**.

张口就来

Doomslang 发表于 2025-2-5 14:00

原以为是弯道超车

结果发现是蒸馏人家尾气

tasagapro 发表于 2025-2-5 14:00

dreamyeah 发表于 2025-2-5 13:28
就是抄袭chat**.

文盲水平

cravin 发表于 2025-2-5 14:15

Doomslang 发表于 2025-2-5 14:00
原以为是弯道超车

结果发现是蒸馏人家尾气

蒸馏有这个技术水平和效率的话,为什么Chat**不先蒸馏优化一下自己[偷笑]

我輩樹である 发表于 2025-2-5 14:16

jihuan 发表于 2025-2-5 14:40

deepseek除了蒸馏chat外,应该还喂了很多网络小说和王文的语料。这样做中文写作可以增强,但也污染了数据,让它写个论文结论都给写的和网文一样。

jihuan 发表于 2025-2-5 14:42

theUserName 发表于 2025-2-5 12:49
本质上一样的,deepseek你可以理解为是中国版chat**,用低得多的成本和有独创性的方法达到了差不多(甚至更 ...

dp只是训练成本低,开发成本绝对要爆,代码都是用汇编写的,开发工作量拉满。

zhjook 发表于 2025-2-5 14:43

也行某一天,你会怀疑发帖的楼主 是不是 个ai

chenwen834 发表于 2025-2-5 15:34


deepseek被chat**抄袭的关系

云无心 发表于 2025-2-5 15:38

竞争对手, 算法更先进。 需求算力小很多。

不过也有一部分AI行业相互蒸馏这个确实存在,**也蒸馏过文心一言得。   

dikuf001 发表于 2025-2-5 15:41

jihuan 发表于 2025-2-5 14:42
dp只是训练成本低,开发成本绝对要爆,代码都是用汇编写的,开发工作量拉满。 ...

华为等公司都搞定了,用人工智能写汇编语言程序。。。。

刹之那 发表于 2025-2-5 16:09

现在是ai的春秋战国时代,互相抄袭,互相学习,等最后的赢家出来吧,希望是开源的、没有任何审查的ai胜出。

Bento 发表于 2025-2-5 16:21

开源和闭源的关系, 要是OPENAI开源你说DEEPSEEK抄袭说我还能信一手,闭源说个鬼故事啊

powerduke 发表于 2025-2-5 16:22

让子弹多飞几天吧,消息都靠猜,技术都靠吹,现阶段谁都不信。

huhudna 发表于 2025-2-5 16:24

dreamyeah 发表于 2025-2-5 13:28
就是抄袭chat**.

都开源了还抄袭呢。真是抄的早该有大新闻了

ypsdz 发表于 2025-2-5 16:25

jihuan 发表于 2025-2-5 18:27

huhudna 发表于 2025-2-5 16:24
都开源了还抄袭呢。真是抄的早该有大新闻了

不是抄袭代码,而是用chat**训练

YsHaNg 发表于 2025-2-5 18:29

dikuf001 发表于 2025-2-5 07:41
华为等公司都搞定了,用人工智能写汇编语言程序。。。。

然后再被kernel.org maillist拉出来给全球开发者挂耻辱柱

fengpc 发表于 2025-2-5 20:53

jihuan 发表于 2025-2-5 14:42
dp只是训练成本低,开发成本绝对要爆,代码都是用汇编写的,开发工作量拉满。 ...

汇编应该指的是他们用汇编和底层编程的方式优化他们自己的萤火虫算力平台,现在ds公开的模型是用ollma运行的模型包。现在公开版的ds之所以省算力是因为使用了moe的结构,每个token只激活一个37B参数的专家子模型。
现在能达到他宣称性能的是671B参数的全量模型,需要8张80G显存的A100来部署
页: [1] 2
查看完整版本: DeepSeek和chat**什么关系??