找回密码
 加入我们
搜索
      
查看: 5812|回复: 38

[网络] DeepSeek和chat**什么关系??

[复制链接]
发表于 2025-1-27 12:43 | 显示全部楼层 |阅读模式
我看推送它早上宕机就去问了它一下,结果它当自己是chat**?
img_8531.png

img_8530.png


发表于 2025-1-27 12:47 来自手机 | 显示全部楼层
现在各种模型之间,都是被拿着互相训练。
习惯就好。
你喂我,我喂你,你蒸馏我,我蒸馏你
发表于 2025-1-27 12:51 | 显示全部楼层
think都点开了,你是怎么得出标题这个结论的?
发表于 2025-1-27 12:52 | 显示全部楼层
强化学习需要有个环境来提供反馈,这个环境有可能是别家ai。

这个就没必要纠结了,各家都是这样的,无非就是后面要不要做c e n s o r了。
发表于 2025-1-27 13:00 | 显示全部楼层
竞争对手
发表于 2025-1-27 13:05 | 显示全部楼层
前浪后浪
发表于 2025-2-5 11:42 | 显示全部楼层
深度思考都告诉你思考内容了,他思考的是**相关信息,看不明白吗?
发表于 2025-2-5 11:55 | 显示全部楼层
冷知识 ds的数据库截止到2023年10月,你这个结果都是搜网页出来的
发表于 2025-2-5 12:49 | 显示全部楼层
本质上一样的,deepseek你可以理解为是中国版chat**,用低得多的成本和有独创性的方法达到了差不多(甚至更好)的效果
发表于 2025-2-5 13:13 | 显示全部楼层
巨人的肩膀和我
发表于 2025-2-5 13:28 | 显示全部楼层
就是抄袭chat**.
发表于 2025-2-5 13:59 来自手机 | 显示全部楼层
dreamyeah 发表于 2025-2-5 13:28
就是抄袭chat**.

张口就来
发表于 2025-2-5 14:00 | 显示全部楼层
原以为是弯道超车

结果发现是蒸馏人家尾气
发表于 2025-2-5 14:00 | 显示全部楼层

文盲水平
发表于 2025-2-5 14:15 | 显示全部楼层
Doomslang 发表于 2025-2-5 14:00
原以为是弯道超车

结果发现是蒸馏人家尾气

蒸馏有这个技术水平和效率的话,为什么Chat**不先蒸馏优化一下自己
发表于 2025-2-5 14:16 | 显示全部楼层
afb25e0aee01777625b575c8bef53b14.png
发表于 2025-2-5 14:40 来自手机 | 显示全部楼层
deepseek除了蒸馏chat外,应该还喂了很多网络小说和王文的语料。这样做中文写作可以增强,但也污染了数据,让它写个论文结论都给写的和网文一样。
发表于 2025-2-5 14:42 来自手机 | 显示全部楼层
theUserName 发表于 2025-2-5 12:49
本质上一样的,deepseek你可以理解为是中国版chat**,用低得多的成本和有独创性的方法达到了差不多(甚至更 ...

dp只是训练成本低,开发成本绝对要爆,代码都是用汇编写的,开发工作量拉满。
发表于 2025-2-5 14:43 | 显示全部楼层
也行某一天,你会怀疑  发帖的楼主 是不是 个ai
发表于 2025-2-5 15:34 | 显示全部楼层
QQ图片20250205153336.png
deepseek被chat**抄袭的关系
发表于 2025-2-5 15:38 | 显示全部楼层
竞争对手, 算法更先进。 需求算力小很多。

不过也有一部分AI行业相互蒸馏这个确实存在,**也蒸馏过文心一言得。   
发表于 2025-2-5 15:41 | 显示全部楼层
jihuan 发表于 2025-2-5 14:42
dp只是训练成本低,开发成本绝对要爆,代码都是用汇编写的,开发工作量拉满。 ...

华为等公司都搞定了,用人工智能写汇编语言程序。。。。
发表于 2025-2-5 16:09 | 显示全部楼层
现在是ai的春秋战国时代,互相抄袭,互相学习,等最后的赢家出来吧,希望是开源的、没有任何审查的ai胜出。
发表于 2025-2-5 16:21 | 显示全部楼层
开源和闭源的关系, 要是OPENAI开源你说DEEPSEEK抄袭说我还能信一手,闭源说个鬼故事啊
发表于 2025-2-5 16:22 | 显示全部楼层
让子弹多飞几天吧,消息都靠猜,技术都靠吹,现阶段谁都不信。
发表于 2025-2-5 16:24 | 显示全部楼层

都开源了还抄袭呢。真是抄的早该有大新闻了
发表于 2025-2-5 16:25 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
发表于 2025-2-5 18:27 来自手机 | 显示全部楼层
huhudna 发表于 2025-2-5 16:24
都开源了还抄袭呢。真是抄的早该有大新闻了

不是抄袭代码,而是用chat**训练
发表于 2025-2-5 18:29 来自手机 | 显示全部楼层
dikuf001 发表于 2025-2-5 07:41
华为等公司都搞定了,用人工智能写汇编语言程序。。。。

然后再被kernel.org maillist拉出来给全球开发者挂耻辱柱
发表于 2025-2-5 20:53 | 显示全部楼层
jihuan 发表于 2025-2-5 14:42
dp只是训练成本低,开发成本绝对要爆,代码都是用汇编写的,开发工作量拉满。 ...

汇编应该指的是他们用汇编和底层编程的方式优化他们自己的萤火虫算力平台,现在ds公开的模型是用ollma运行的模型包。现在公开版的ds之所以省算力是因为使用了moe的结构,每个token只激活一个37B参数的专家子模型。
现在能达到他宣称性能的是671B参数的全量模型,需要8张80G显存的A100来部署
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

Archiver|手机版|小黑屋|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806 上海市互联网违法与不良信息举报中心

GMT+8, 2025-4-22 12:21 , Processed in 0.015250 second(s), 7 queries , Gzip On, Redis On.

Powered by Discuz! X3.5 Licensed

© 2007-2024 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表