找回密码
 加入我们
搜索
      
楼主: dikuf001

[显卡] 传蚂蚁集团使用国产芯片训练AI取得突破:可媲美英伟达H800芯片

[复制链接]
发表于 2025-3-24 17:41 | 显示全部楼层
KimmyGLM 发表于 2025-3-24 15:34
蚂蚁是当初卖asic 矿机的吧?这种预制菜,还是持保留意见。

他曾经教导过我们:不要听风就是雨

你这...这里的蚂蚁集团肯定是支付宝啊 我同事就在那...
发表于 2025-3-24 17:42 | 显示全部楼层
dikuf001 发表于 2025-3-24 16:58
不过你说这话我也觉得很正常,清华大学的教授前几个月还在说中国的人工智能远远落后于美国,他这种层次的 ...

刘嘉是吧
1997–2002: 哲学博士,方向:认知神经科学;

麻省理工学院(MIT)脑与认知科学系

指导教师:Prof. Nancy Kanwisher (美国科学院院士)

1995–1997: 理学硕士,方向:认知心理学;北京大学心理学系

指导教师:朱滢教授

1990–1995: 理学学士,方向:普通心理学;北京大学心理学系

1992–1994: 辅修,方向:电子学与信息系统;北京大学无线电系

工作经历

2020– : 基础科学讲席教授,清华大学社科学院心理学系、清华大学脑与智能实验室

2005–2020: 教授(二级),北京师范大学心理学部、心理学院、认知神经科学与学习国家重点实验室

2009–2010:富布莱特访问学者,麻省理工学院

2003–2005: 副教授/教授,中科院生物物理所脑与认知科学国家重点实验室

2002–2003: 博士后,麻省理工学院脑与认知科学系

研究领域

人工智能的认知神经基础(AI of Brain & Cognition, ABC)、视觉智能
============================================
我也不知道一个研究心理学的怎么就能随意评价人家cs的了,helloworld都不知道会不会写
 楼主| 发表于 2025-3-24 17:49 | 显示全部楼层
本帖最后由 dikuf001 于 2025-3-24 17:54 编辑
wjm47196 发表于 2025-3-24 17:42
刘嘉是吧
1997–2002: 哲学博士,方向:认知神经科学;


关键是他还说了中文的语料污染,导致了中国的ai比不上美国的。。。其实无论中英文写作ds的体验都好openai。等于说你中国的菜里面激素和农药太多,美国的肉菜蔬菜安全,没农药,他也不看看现在x上面用人工智能生成的各种视频图片,正在迅速的毒化污染视频生成类的人工智能语料。。
发表于 2025-3-24 17:52 | 显示全部楼层
panzerlied 发表于 2025-3-24 16:20
现在最tmd难的是,集成方案只有昇腾的Atlas 800I A2能用。

你们倒是拿东西出来卖啊 ...

in-house系统没必要拿出来卖吧,看最终服务了。
只是这系统是空中楼阁还是迪拜塔就另论了
发表于 2025-3-24 17:52 来自手机 | 显示全部楼层
dikuf001 发表于 2025-3-24 17:49
关键是他还说了中文的语料污染,导致了中国的ai比不上美国的。。。等于说你中国的菜里面激素和农药太多, ...

这两年各种回旋镖DeepSeek打了不少人的脸,外门看热闹。特斯拉在美国本土被各种砸
发表于 2025-3-24 17:52 | 显示全部楼层
dikuf001 发表于 2025-3-24 17:49
关键是他还说了中文的语料污染,导致了中国的ai比不上美国的。。。等于说你中国的菜里面激素和农药太多, ...

英语简写才是纯纯的语料污染,我跟澳村和美国老哥聊天简写一样,意思是不一样的。、。。。
发表于 2025-3-24 19:40 | 显示全部楼层
影都没有 就一个“传”就开始YY了

就跟一帮屌丝看到个女的孩子名字都想好了有啥区别
发表于 2025-3-24 20:09 | 显示全部楼层
专业卡跟黄狗的游戏卡差别太大,不是一般人能玩的,不过软件和硬件有进步就是好事。
发表于 2025-3-24 20:23 | 显示全部楼层
这新闻说的应该不是华为,atlas 800 a2在我们的手里跟a30差不多,跟h800还有两代差距
华为的硬件问题在于显存和互联太弱,在一众国产卡里垫底,只适合跑猛怼tensor core算子的网络,理想的测试项目可以跑到a100水平,但一上到有vector算子的实际网络就痿了,集群规模增大点就更是悲剧
但硬件都是小问题,软件才是最大的问题,生态太封闭,从nv迁移过去的成本比tm重新开发一套都高
发表于 2025-3-24 21:06 | 显示全部楼层
要信早信,晚信不如不信
发表于 2025-3-24 21:19 | 显示全部楼层
坛子里有的人真有趣看到专家混合机器学习就喷"人工", 科普一下专家混合学习就是MoE,和DeepSeek在MLP层一样的技术,但据我所知qwen max的moe是早于deepseek的,但是没有思维链。新闻的意思是说用在MoE的方式下,非N卡训练的模型的结果与H800的相近,并且总成本下降20%(没说速度,速度大概率是比H800慢的,说的是卡数量 * 单卡成本 * time)
发表于 2025-3-24 21:53 | 显示全部楼层
晓古城 发表于 2025-3-24 17:52
这两年各种回旋镖DeepSeek打了不少人的脸,外门看热闹。特斯拉在美国本土被各种砸 ...

哪有那么容易的改革 鱿鱼几个派别昂撒几个派别加起来10几个利益party。。。

川皇+马巡按这对活宝 再给他俩长10个脑袋都不够开洞 还什么鸡脖stargate哪凉快去哪晾着。。。
远的不说就看眼前吧 掰到丑联储减息这步都已经掰不动跪下去了 过关斩将还真不是谁来都会的。。。

唯一出路是学阿道夫那套得民心夺军权然后make西嗨again 可是这俩货又没有人家阿道夫的魅力框框闹笑话。。。
改革春风吹满地。。。看看现在这些腐烂败坏在即的资本主义 就目前咱家这种特色主义的执行力 蓝星没有对手。。。


不像挖币那样总量终点就在那看得到 当下伪ai这条路没有尽头。。。
训练推理蒸馏可以一直循环 蒸到无可再蒸 加个新ip伪需求立马又提上来。。。
国产发力对我们diyer来说算是个好兆头 甭管翻腾过后皮衣那套gpgpu能不能继续。。。
起码多几个competitor参加 游戏卡才可以不那么被"重视"而回到一个相对"健康"的市场生态。。。


发表于 2025-3-24 22:10 来自手机 | 显示全部楼层
神他媽 MOE mixture of expert 能讓人說成 人工,看笑了
发表于 2025-3-24 22:16 | 显示全部楼层
呵呵,高,实在是高
发表于 2025-3-24 22:39 来自手机 | 显示全部楼层
ONEChoy 发表于 2025-3-24 21:53
哪有那么容易的改革 鱿鱼几个派别昂撒几个派别加起来10几个利益party。。。

川皇+马巡按这对活宝 再给 ...

突然感觉懂王就是被推上来背锅的,工业化的现在艺术生也救不了美国,真有实力早就打伊朗重新立棍,封锁一带一路,介入中亚五国。美俄应该感谢冷战存了不少核武器,不然玩常规战谁都不好使,G7工业全部加起来也不够看。
发表于 2025-3-24 22:48 | 显示全部楼层
晓古城 发表于 2025-3-24 22:39
突然感觉懂王就是被推上来背锅的,工业化的现在艺术生也救不了美国,真有实力早就打伊朗重新立棍,封锁一 ...

哈哈哈笑死宝宝 霉弟是真的穷途末路了现在。。。

保安胡塞大爷守着游泳都游不过去还想去阿曼湾摸波斯 在梦里狂欢一下可害行 赶紧洗洗睡哈哈。。。

发表于 2025-3-24 23:18 | 显示全部楼层
根据厂商和我聊的信息,百度昆仑芯最新产品强于N卡, 910C预期也强于N卡,不知真假
 楼主| 发表于 2025-3-24 23:19 | 显示全部楼层
本帖最后由 dikuf001 于 2025-3-24 23:21 编辑
星空小琛 发表于 2025-3-24 23:18
根据厂商和我聊的信息,百度昆仑芯最新产品强于N卡, 910C预期也强于N卡,不知真假 ...


很明显和你聊的那个厂商,在华强北租了一个大排档,不卖cpu,也不卖显卡,炒快餐外卖的。如果你还信了,那你肯定地沟油吃多了。
发表于 2025-3-24 23:21 | 显示全部楼层
呜呜呜,海光,我的海光 深算三号没人买么
发表于 2025-3-24 23:23 来自手机 | 显示全部楼层
ONEChoy 发表于 2025-3-24 22:48
哈哈哈笑死宝宝 霉弟是真的穷途末路了现在。。。

保安胡塞大爷守着游泳都游不过去还想去阿曼湾摸波斯  ...

岁数再小也是帝国~还能蹦跶一段,俄乌停战后,几大势力就要去中东博弈了,现在已经开始囤弹药了。最近周边那边美🐶发现即将更替主人,内部疯狂博弈变得不稳定,迟早要清算他们。
发表于 2025-3-24 23:39 | 显示全部楼层
dikuf001 发表于 2025-3-24 23:19
很明显和你聊的那个厂商,在华强北租了一个大排档,不卖cpu,也不卖显卡,炒快餐外卖的。如果你还信了, ...

还行吧,前者是华三运营商渠道消息,后半句是华为运营商渠道消息
发表于 2025-3-24 23:40 | 显示全部楼层
大头吃小头 发表于 2025-3-24 23:21
呜呜呜,海光,我的海光 深算三号没人买么

DCU K100 AI在狂卖哈哈哈哈
发表于 2025-3-24 23:54 | 显示全部楼层
dikuf001 发表于 2025-3-24 15:35
是啊,他基本上和美国佬吹嘘的顶级模型性能上是一样的,但人家价格低呀,你怎么玩? ...

怎么玩?你有人家便宜,你没有人家直接禁售……怎么玩?舔他啊?
发表于 2025-3-25 00:35 | 显示全部楼层
iamdefer 发表于 2025-3-23 23:23
隐藏了工时的成本看着笑笑就完了。

阿里有个芯片就能造轮子,小公司教研室拿什么搞,用户都不一定是学cs ...

AMD是真不行,软件支持还不如华为,ROCM就是一个笑话
发表于 2025-3-25 00:54 来自手机 | 显示全部楼层
mi300x价格也没比h800低多少,训练也困难。不知道今年mi300x有没有优化之前semi analysis爆出的问题。
发表于 2025-3-25 09:17 来自手机 | 显示全部楼层
这种新闻多半是放出来拉股价的。。。
发表于 2025-3-25 09:50 来自手机 | 显示全部楼层
vva 发表于 2025-3-24 23:54
怎么玩?你有人家便宜,你没有人家直接禁售……怎么玩?舔他啊?

真的假的,国外高端产业能有多便宜,现在造不如买早行不通了?对方封锁正好摊牌,正等着突破呢。
发表于 2025-3-25 10:01 | 显示全部楼层
推理芯片门槛比较低,各种方案都有。国产性价比也高。
但是跑训练的话   N卡现在还是独一档。
几万个卡大模型,稳定跑训练要求非常高。
发表于 2025-3-25 10:09 来自手机 | 显示全部楼层
晓古城 发表于 2025-3-25 09:50
真的假的,国外高端产业能有多便宜,现在造不如买早行不通了?对方封锁正好摊牌,正等着突破呢。 ...

摊牌的前提是你得有技术储备。封锁了市场可以容忍高价。实际是你搞出来了它降价,然后有人会说你造出来有啥用那么贵的。想想内存闪存液晶屏都是这个路数。你多久没听见硬盘厂发大水停电了
发表于 2025-3-25 11:31 来自手机 | 显示全部楼层
vva 发表于 2025-3-25 10:09
摊牌的前提是你得有技术储备。封锁了市场可以容忍高价。实际是你搞出来了它降价,然后有人会说你造出来有 ...

技术储备完全不缺,全产业链就等老美忍不住制裁。战略诱骗让对方先动手,让内部投降派无话可说,丑国现在连军工都拉胯,发布F-47又赢麻了…
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

Archiver|手机版|小黑屋|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806 上海市互联网违法与不良信息举报中心

GMT+8, 2025-4-21 03:22 , Processed in 0.013618 second(s), 5 queries , Gzip On, Redis On.

Powered by Discuz! X3.5 Licensed

© 2007-2024 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表