DeepSeek和chat**什么关系??
我看推送它早上宕机就去问了它一下,结果它当自己是chat**?现在各种模型之间,都是被拿着互相训练。
习惯就好。
你喂我,我喂你,你蒸馏我,我蒸馏你
think都点开了,你是怎么得出标题这个结论的? 强化学习需要有个环境来提供反馈,这个环境有可能是别家ai。
这个就没必要纠结了,各家都是这样的,无非就是后面要不要做c e n s o r了。 竞争对手 前浪后浪 深度思考都告诉你思考内容了,他思考的是**相关信息,看不明白吗? 冷知识 ds的数据库截止到2023年10月,你这个结果都是搜网页出来的 本质上一样的,deepseek你可以理解为是中国版chat**,用低得多的成本和有独创性的方法达到了差不多(甚至更好)的效果 巨人的肩膀和我 就是抄袭chat**. dreamyeah 发表于 2025-2-5 13:28
就是抄袭chat**.
张口就来 原以为是弯道超车
结果发现是蒸馏人家尾气 dreamyeah 发表于 2025-2-5 13:28
就是抄袭chat**.
文盲水平 Doomslang 发表于 2025-2-5 14:00
原以为是弯道超车
结果发现是蒸馏人家尾气
蒸馏有这个技术水平和效率的话,为什么Chat**不先蒸馏优化一下自己[偷笑] deepseek除了蒸馏chat外,应该还喂了很多网络小说和王文的语料。这样做中文写作可以增强,但也污染了数据,让它写个论文结论都给写的和网文一样。 theUserName 发表于 2025-2-5 12:49
本质上一样的,deepseek你可以理解为是中国版chat**,用低得多的成本和有独创性的方法达到了差不多(甚至更 ...
dp只是训练成本低,开发成本绝对要爆,代码都是用汇编写的,开发工作量拉满。 也行某一天,你会怀疑发帖的楼主 是不是 个ai
deepseek被chat**抄袭的关系 竞争对手, 算法更先进。 需求算力小很多。
不过也有一部分AI行业相互蒸馏这个确实存在,**也蒸馏过文心一言得。 jihuan 发表于 2025-2-5 14:42
dp只是训练成本低,开发成本绝对要爆,代码都是用汇编写的,开发工作量拉满。 ...
华为等公司都搞定了,用人工智能写汇编语言程序。。。。 现在是ai的春秋战国时代,互相抄袭,互相学习,等最后的赢家出来吧,希望是开源的、没有任何审查的ai胜出。 开源和闭源的关系, 要是OPENAI开源你说DEEPSEEK抄袭说我还能信一手,闭源说个鬼故事啊 让子弹多飞几天吧,消息都靠猜,技术都靠吹,现阶段谁都不信。 dreamyeah 发表于 2025-2-5 13:28
就是抄袭chat**.
都开源了还抄袭呢。真是抄的早该有大新闻了 huhudna 发表于 2025-2-5 16:24
都开源了还抄袭呢。真是抄的早该有大新闻了
不是抄袭代码,而是用chat**训练 dikuf001 发表于 2025-2-5 07:41
华为等公司都搞定了,用人工智能写汇编语言程序。。。。
然后再被kernel.org maillist拉出来给全球开发者挂耻辱柱 jihuan 发表于 2025-2-5 14:42
dp只是训练成本低,开发成本绝对要爆,代码都是用汇编写的,开发工作量拉满。 ...
汇编应该指的是他们用汇编和底层编程的方式优化他们自己的萤火虫算力平台,现在ds公开的模型是用ollma运行的模型包。现在公开版的ds之所以省算力是因为使用了moe的结构,每个token只激活一个37B参数的专家子模型。
现在能达到他宣称性能的是671B参数的全量模型,需要8张80G显存的A100来部署
页:
[1]
2