壹米月光 发表于 2024-8-26 09:57

NVLINK升级至1.4TB/s NVIDIA Blackwell已在数据中心运行

8月25日消息,据媒体报道,NVIDIA在近期的吹风会上,展示了Blackwell在数据中心的运行情况,并驳斥了此前关于Blackwell推迟上市的传闻。不仅如此,NVIDIA NVLINK技术也迎来了重大升级,带宽翻倍达到1.4TB/s。https://img1.mydrivers.com/img/20240825/S8f0a666c-6da7-438d-bead-4eff004f0519.jpgBlackwell平台不仅包含Blackwell GPU,还集成了Grace CPU、NVLINK Switch Chip、Bluefield-3、ConnectX-7、ConnectX-8、Spectrum-4和Quantum-3等多种芯片,形成了一个全面的数据中心解决方案。https://img1.mydrivers.com/img/20240825/S9f41f70d-0f65-409b-b530-8efed4aaa9aa.pngBlackwell平台的设计目标是满足现代人工智能的需求,特别是针对超大型语言模型的计算需求,随着AI模型参数的不断增长,数据中心对计算能力和低延迟的要求也越来越高。https://img1.mydrivers.com/img/20240825/S813f5de0-5027-4c10-9841-cde298e3fbc4.pngBlackwell平台的多GPU推理方法,通过在多个GPU上分配计算任务,实现了低延迟和高吞吐量的处理能力。https://img1.mydrivers.com/img/20240825/S27128fdb-2888-4eaa-8308-d738bd27218a.jpgNVIDIA通过Blackwell推出了速度更快的NVLINK交换机,该交换机基于台积电4NP节点,提供了1.8TB/s的双向NVLINK带宽,能够连接72个GPU,大幅提高了数据中心的通信效率。https://img1.mydrivers.com/img/20240825/Sdd8a2201-508d-4941-a14e-879723cd959d.pngNVIDIA还分享了全球首张使用FP4计算生成的人工智能图像,展示了FP4量化模型在速度上的显著优势,同时保持了与FP16模型相似的图像质量。来源:https://news.mydrivers.com/1/999/999367.htm

赫敏 发表于 2024-8-26 10:31

pcie连夜发布pcei8.0标准[偷笑]

深渊将军维斯卡 发表于 2024-8-26 11:22

赫敏 发表于 2024-8-26 10:31
pcie连夜发布pcei8.0标准

戳辣,是CXL连夜发布新版本[偷笑]

弯道尽头 发表于 2024-8-26 12:06

什么时候下发到民用[偷笑]

mimico 发表于 2024-8-26 12:58

发个代码我要参与一下

huhudna 发表于 2024-8-26 13:56

1.4T[困惑]恐怖

壹米月光 发表于 2024-8-26 15:22

赫敏 发表于 2024-8-26 10:31
pcie连夜发布pcei8.0标准

戳中笑点[狂笑]

tim6252 发表于 2024-8-26 23:29

好猛但是这东西老黄不会再给游戏卡用了防止用户多卡获得性价比

JP_ToKyo 发表于 2024-8-27 04:35

tim6252 发表于 2024-8-26 23:29
好猛但是这东西老黄不会再给游戏卡用了防止用户多卡获得性价比

要AMD先下放才能搞老黃也下放吧...

不然遊戲市場應該都沒動力了....畢竟主導市場不在這邊...

aibo 发表于 2024-8-27 14:14

tim6252 发表于 2024-8-26 23:29
好猛但是这东西老黄不会再给游戏卡用了防止用户多卡获得性价比

10x的芯片上就已经不给nvlink模块了

就算rtx6000也没辙

正义的大宝剑 发表于 2024-8-28 08:42

tim6252 发表于 2024-8-26 23:29
好猛但是这东西老黄不会再给游戏卡用了防止用户多卡获得性价比

文中说的技术都是给数据中心业务场景下使用的,不用多考虑噪音和发热,下放到民用的研发方向和成本,跟文中的是两回事

tim6252 发表于 2024-8-29 00:52

本帖最后由 tim6252 于 2024-8-29 00:54 编辑

aibo 发表于 2024-8-27 14:14
10x的芯片上就已经不给nvlink模块了

就算rtx6000也没辙

游戏卡没有 影响有但是不大, RTX6000都不给就有点恶心了,要知道 CG和电影制作时 超大和超精细的资产和特效整合是非常吃多旗舰卡来实时显示的,虽说最终都是CPU渲染但是制作时的效果预览也是很需要效率的
多年前公司做超大型交战镜头就是4张K6000 sli才能跑的动的,普通单卡机器基本一个小时文件都打不开就卡死了
页: [1]
查看完整版本: NVLINK升级至1.4TB/s NVIDIA Blackwell已在数据中心运行