找回密码
 加入我们
搜索
      
楼主: enolc

[显卡] 探讨和求证deepseek背后的算力真相

[复制链接]
发表于 2025-1-30 09:09 | 显示全部楼层
enolc 发表于 2025-1-28 12:34
2000个英伟达H800芯片集群训练V3,我觉得真的很牛啊!同时也很怀疑deepseek能拥有50000块H100的说法 ...

我有2个问题想请教你:

第一,刚推出时有人问过DeepSeek是哪个大模型时,它为何说自己是Chat**!?

第二,有人问DeepSeek如何使用它的API时,DeepSeek给出OpenAI API 的详细教程!??
发表于 2025-1-30 09:11 | 显示全部楼层
xks07 发表于 2025-1-28 17:47
好像是万卡A100,不是H100.
H100出来不到几个月老美就出了禁令,根本来不及抢卡的。
限制之前,国内买卡 ...

现在重点不是用哪张卡,外国人问的主要是这两个问题!

第一,刚推出时有人问过DeepSeek是哪个大模型时,它为何说自己是Chat**!?

第二,有人问DeepSeek如何使用它的API时,DeepSeek给出OpenAI API 的详细教程!??
发表于 2025-1-30 09:13 | 显示全部楼层
2ndWeapon 发表于 2025-1-30 09:01
只是效率提高了而已,最后还是得靠堆算力

现在重点不是用哪张卡,外国人觉得它的解答是基于OpenAI的数据而来!
发表于 2025-1-30 09:15 | 显示全部楼层
套壳CHAT ,期待后续。
发表于 2025-1-30 09:20 | 显示全部楼层
los_parrot 发表于 2025-1-29 16:27
v3的论文说的很详细了,使用了配备2048块h800的阵列,单个Node 8xh800,总共消耗278万8千个h800 gpu时.也就 ...

只要是有 非洲兄弟、东南亚盟友、中东各“附属”国 和 新加坡,中国就可以不用高关税出口货物到欧美,也可以从各大科技大厂买入很多芯片! 这个对欧美日韩澳纽加都心知肚明的秘密!
 楼主| 发表于 2025-1-30 09:20 | 显示全部楼层
inone2 发表于 2025-1-30 09:09
我有2个问题想请教你:

第一,刚推出时有人问过DeepSeek是哪个大模型时,它为何说自己是Chat**!?

据彭博社报道,OpenAI 和微软正在调查 DeepSeek 是否通过 OpenAI 的 API 将 OpenAI 的 AI 模型整合到 DeepSeek 自有的模型中。消息人士称,微软的安全研究人员在 2024 年底发现,大量数据通过 OpenAI 开发者账户被导出,而这些账户被认为与 DeepSeek 有关联。

OpenAI 向《金融时报》表示,他们发现了 DeepSeek 使用“蒸馏”技术的证据。据IT之家了解,“蒸馏”是一种常见的开发手段,开发者通过从更大、更强大的模型中提取数据来训练自己的 AI 模型。这种技术能够以远低于 OpenAI 训练 **-4 所花费的 1 亿美元以上的成本,高效地训练出小型模型。尽管开发者可以通过 OpenAI 的 API 将其 AI 技术整合到自己的应用程序中,但利用输出数据来构建竞争模型则违反了 OpenAI 的服务条款。不过,OpenAI 并未透露其发现的具体证据细节。

TheVerge 称,这充满了讽刺意味,毕竟 OpenAI 自身也曾通过大规模抓取网络上的文字信息(未经许可)来推动其 ** 模型的发展。

OpenAI 在一份声明中表示:“我们深知,中国等国家的公司以及其他一些企业一直在试图蒸馏美国领先 AI 公司的模型。作为 AI 领域的领军者,我们采取了反制措施来保护我们的知识产权,这包括在发布模型时谨慎选择哪些前沿功能可以包含在内。我们相信,未来与美国政府密切合作,以防止对手和竞争对手窃取美国技术,保护最先进的模型,是至关重要的。”
发表于 2025-1-30 09:31 | 显示全部楼层
inone2 发表于 2025-1-30 09:11
现在重点不是用哪张卡,外国人问的主要是这两个问题!

第一,刚推出时有人问过DeepSeek是哪个大模型时, ...

谷歌大模型还说它是文心一言呢,不信你自己去查2023年的新闻
这些大模型就是缺数据,所以进行数据蒸镀是常见手法。
A100和H100差距大的一批
A100是2020发布的老卡。算力只有H100的20%不到。这差距就行4050和4090的游戏性能一样。
万卡A100和万卡H100那是两码事。
这都不懂你争什么?

发表于 2025-1-30 09:36 | 显示全部楼层
inone2 发表于 2025-1-30 09:13
现在重点不是用哪张卡,外国人觉得它的解答是基于OpenAI的数据而来!


你用它的数据,又用不了它的模型。
openai的最新的大模型都是闭源的。
现在大模型的数据就没知识产权的说法。包括搜索引擎的爬虫。
所以老美只能往国家安全上扯淡。
你跟着扯淡不是更搞笑。
发表于 2025-1-30 09:38 | 显示全部楼层
本帖最后由 inone2 于 2025-1-30 09:41 编辑
enolc 发表于 2025-1-30 09:20
据彭博社报道,OpenAI 和微软正在调查 DeepSeek 是否通过 OpenAI 的 API 将 OpenAI 的 AI 模型整合到 Dee ...


在互联网上得到的大部份是数据(Data),而数据经过处理之后才能成为信息(Information),从这些信息中分析出来的讯息称为知识(Knowledge),再通过不断地行动与验证,逐渐形成智慧(Wisdom);所以在互联网上得到的数据是公开的,例如空气一样是公共资源,你不会认为空气需要别人允许你才可以吸取吧! 但信息、知识 和 智慧就不同了。就比如空气是免费享用的,但医疗公司用空气制作的氧气瓶就不同的,你不但要给钱,而且必须要拥有者同意了才能使用。Open AI的是知识(Knowledge)和 智慧(Wisdom)而不是数据(Data)。
发表于 2025-1-30 09:41 | 显示全部楼层
你从哪搬的主楼的文章,营销号是不是以为 RL 是 deepseek 发明的,或者 RL 之前一直没人关注?
发表于 2025-1-30 09:42 | 显示全部楼层
xks07 发表于 2025-1-30 09:36
你用它的数据,又用不了它的模型。
openai的最新的大模型都是闭源的。
现在大模型的数据就没知识产权的说 ...

在互联网上得到的大部份是数据(Data),而数据经过处理之后才能成为信息(Information),从这些信息中分析出来的讯息称为知识(Knowledge),再通过不断地行动与验证,逐渐形成智慧(Wisdom);所以在互联网上得到的数据是公开的,例如空气一样是公共资源,你不会认为空气需要别人允许你才可以吸取吧! 但信息、知识 和 智慧就不同了。就比如空气是免费享用的,但医疗公司用空气制作的氧气瓶就不同的,你不但要给钱,而且必须要拥有者同意了才能使用。Open AI的是知识(Knowledge)和 智慧(Wisdom)而不是数据(Data)。
发表于 2025-1-30 09:44 来自手机 | 显示全部楼层
inone2 发表于 2025-1-30 09:09
我有2个问题想请教你:

第一,刚推出时有人问过DeepSeek是哪个大模型时,它为何说自己是Chat**!?

这个倒不一定能证明套壳,也有可能是训练用的语料带入的,毕竟**是最流行的,大量的文字资料都会提到
发表于 2025-1-30 09:47 | 显示全部楼层
inone2 发表于 2025-1-30 09:42
在互联网上得到的大部份是数据(Data),而数据经过处理之后才能成为信息(Information),从这些信息中 ...

大过年的你扯淡什么?
谷歌用百度的数据是2023的事。
1223.jpg
发表于 2025-1-30 09:47 | 显示全部楼层
算力真相和模型蒸馏都是关键点
发表于 2025-1-30 09:50 | 显示全部楼层
gartour 发表于 2025-1-30 09:44
这个倒不一定能证明套壳,也有可能是训练用的语料带入的,毕竟**是最流行的,大量的文字资料都会提到 ...

他这种人就是跪傻了。
数据蒸馏很正常,尤其是我们缺少英文数据源,就像老美那边缺少中文数据源一样的。
互相蒸馏是必然。
openai一样会偷偷的蒸馏中文数据。
发表于 2025-1-30 09:57 | 显示全部楼层
xks07 发表于 2025-1-30 09:31
谷歌大模型还说它是文心一言呢,不信你自己去查2023年的新闻
这些大模型就是缺数据,所以进行数据蒸镀是 ...

我在2021年时,就听说过 “有瑞士公共卫生专家艾德华兹(Wilson Edwards)说新冠病毒是美国制作的,而且还有科学证据。” ,之后瑞士官方就立即开了记者会,说没有任何在瑞士注册的医护人员是如该篇报导中所提供的姓名,连当时瑞士驻中国大使都在他的微博官方账号中解释过了,不过很快就被微博删了! 而外国记者之后更调查出相关报社,是中国某间报社驻瑞士的分支机构。

另外,还有人在外散布:俄罗斯出兵乌克兰是因为乌克兰有美国散播新冠病毒的证据,不过所有报导内容都是蕳体字或来源于简体字传媒。
发表于 2025-1-30 10:03 | 显示全部楼层
gartour 发表于 2025-1-30 09:44
这个倒不一定能证明套壳,也有可能是训练用的语料带入的,毕竟**是最流行的,大量的文字资料都会提到 ...

哪行? 你试试用同一个问题问这两个大模型,看看除了顺序和文字修饰之外,内容是否一致???
发表于 2025-1-30 10:04 | 显示全部楼层
inone2 发表于 2025-1-30 09:57
我在2021年时,就听说过 “有瑞士公共卫生专家艾德华兹(Wilson Edwards)说新冠病毒是美国制作的,而且 ...

大过年的傻嗨
我上面发的截图
另外告诉你,deepseek数据蒸馏是V3模型就知道的事
老美那时候不紧张,
为什么现在紧张,因为1月20号发布的R1在数理这些子项目反超openai了
所以老美急了。
 楼主| 发表于 2025-1-30 10:30 | 显示全部楼层
本帖最后由 enolc 于 2025-1-30 10:33 编辑
inone2 发表于 2025-1-30 09:42
在互联网上得到的大部份是数据(Data),而数据经过处理之后才能成为信息(Information),从这些信息中 ...


医疗公司用空气制作的氧气瓶里面的氧气可不是我们平时呼吸的氧气,就像我们买的那些商店里的种花用土也不是我们在野外随处可以挖到的土

网络上的信息和数据 (免费)--Open AI (闭源)--Deepseek (开源) 五十步笑百步
发表于 2025-1-30 10:35 | 显示全部楼层
本帖最后由 Kyle-Zhu 于 2025-2-1 12:51 编辑
enolc 发表于 2025-1-29 09:07
就AI行业而言,美帝的资金和硬件优势没人否定哈,我们现在成为不了主流不代表将来不是主流,把时间线拉长 ...


3天就被解密了,利用openai的资源做二次开发罢了,简单讲就是做的比较好的套子。
 楼主| 发表于 2025-1-30 10:38 | 显示全部楼层
Open AI 着急的真实原因不是因为被蒸馏,而是因为deepseek证明了Open AI 底层技术逻辑的设计出了问题,同时也失去了投资人和使用者的信任............这才是Open AI的最大危机

 楼主| 发表于 2025-1-30 10:43 | 显示全部楼层
Kyle-Zhu 发表于 2025-1-30 10:35
3天就被解密了,利用openai的资源做二次开发罢了,简单讲就是做的比较好的套子。 ...


为啥美帝的AI公司没有人想到做套子?其实大家就事论事就好,蒸馏是蒸馏,算力是算力,技术是技术,deepseek的技术路线不能简单称之为套子吧,更何况v3,R1和后续的Pro版本都在不断发布中...............真相总有大白天下的时刻,让我们拭目以待
发表于 2025-1-30 18:40 | 显示全部楼层
enolc 发表于 2025-1-30 10:30
医疗公司用空气制作的氧气瓶里面的氧气可不是我们平时呼吸的氧气,就像我们买的那些商店里的种花用土也不 ...

你以前也是这样支持姜萍的吗?

你以前也是这样支持汉芯CPU的吗?
发表于 2025-1-30 18:41 | 显示全部楼层
xks07 发表于 2025-1-30 10:04
大过年的傻嗨
我上面发的截图
另外告诉你,deepseek数据蒸馏是V3模型就知道的事

你以前也是这样支持姜萍的吗?

你以前也是这样支持汉芯CPU的吗?
发表于 2025-1-30 18:42 | 显示全部楼层
enolc 发表于 2025-1-30 10:43
为啥美帝的AI公司没有人想到做套子?其实大家就事论事就好,蒸馏是蒸馏,算力是算力,技术是技术,deepse ...

不要试图叫醒装睡的人,你永远叫不醒他们的。
发表于 2025-1-30 19:04 | 显示全部楼层
enolc 发表于 2025-1-30 10:38
Open AI 着急的真实原因不是因为被蒸馏,而是因为deepseek证明了Open AI 底层技术逻辑的设计出了问题,同时 ...

愿闻其详! 是哪点令你觉得Open AI 底层逻辑有问题???

我只记得老师是这样教我分办某人是读经典数学还是读实用数学的。

例子:在火炉上放一个装满凉水(已经烧开)的水煲,之后叫他煲一壶热水!!!

结果1:他把水直接开火煲热的,必定是读实用数学的。因为他们只会应用。你只要创造过一次并把数据全部给他,他能干得比你好百倍,可惜没有了前人的成果,他们也只能停滞不前。比如陈景润和罗华庚。

结果2:他把水煲内的水全倒掉了,再到水管内把水装满整壸,之后再把水烧开,必定是读经典数学的。他们不是最聪明的,而且可能也不是最顶尖的,但他们却是所有数学家中最重要的,能把数学推向另一个层次的。比如欧几里德和哥德巴克。
发表于 2025-1-30 19:12 | 显示全部楼层
8xwob3ko 发表于 2025-1-29 00:22
那是之前了,现在只能间接用(比如租海外的算力),或者买符合规范被阉割很多的卡,或者直接买国产卡 ...

对,现在合规原因,h20都不买了。

不过可以租,租的也就是千卡级别,而且网络拉胯。

搞万卡H800还不如H20,H20之前都快成了字节特供卡
 楼主| 发表于 2025-1-30 23:30 | 显示全部楼层
inone2 发表于 2025-1-30 18:42
不要试图叫醒装睡的人,你永远叫不醒他们的。

没有人装着睡着哈,尊重事实最重要,等各AI大厂检验的最终结果吧
 楼主| 发表于 2025-1-30 23:34 | 显示全部楼层
inone2 发表于 2025-1-30 18:40
你以前也是这样支持姜萍的吗?

你以前也是这样支持汉芯CPU的吗?

你这是偷换概念哈..........
 楼主| 发表于 2025-1-30 23:37 | 显示全部楼层
inone2 发表于 2025-1-30 19:04
愿闻其详! 是哪点令你觉得Open AI 底层逻辑有问题???

我只记得老师是这样教我分办某人是读经典数学还是 ...

不能以此抹杀陈景润和罗华庚二老对于数学的巨大贡献...............

对于AI技术,我站队开源AI
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

Archiver|手机版|小黑屋|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806 上海市互联网违法与不良信息举报中心

GMT+8, 2025-4-22 22:25 , Processed in 0.013894 second(s), 5 queries , Gzip On, Redis On.

Powered by Discuz! X3.5 Licensed

© 2007-2024 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表