simplex 发表于 2025-1-7 12:22

黄皮Nvidia Spark五月份出AI迷你“personal AI supercomputer”机

本帖最后由 simplex 于 2025-3-19 17:48 编辑

我希望,但是不太相信会成真。但黄皮在CES发布会上说五月左右上市

rainbow2003 发表于 2025-1-7 12:22

dgx 同款配色啊。。。

canonguy 发表于 2025-1-7 12:42

不懂就问:这是啥东东?能替代Mac Mini 4 pro么?[偷笑]

oppoig 发表于 2025-1-7 12:43

想起那个传闻,今年NVIDIA会出WOA的产品。

nApoleon 发表于 2025-1-7 12:44

老黄:i have a dream,干死Intel和AMD~

StevenG 发表于 2025-1-7 12:47

出了搞一台,就为这外形[偷笑]

zhuifeng88 发表于 2025-1-7 12:48

StevenG 发表于 2025-1-7 12:47
出了搞一台,就为这外形

3000刀起步, 其中一半价格给了400g网卡, 核心性能持平5070, 内存带宽还拉了个大垮

老饭 发表于 2025-1-7 13:09

arm20核心 128g统一内存,1P FP4算力

theworkbench 发表于 2025-1-7 13:10

这配色抽象

darkness66201 发表于 2025-1-7 13:12

AMD那边的AI max才是真AI迷你机吧,四通道超大内存+40cu,就看AMD能不能把他弄成类似AI工作站之类的东西了

simplex 发表于 2025-1-7 13:55

本帖最后由 simplex 于 2025-1-7 13:57 编辑

zhuifeng88 发表于 2025-1-7 12:48
3000刀起步, 其中一半价格给了400g网卡, 核心性能持平5070, 内存带宽还拉了个大垮 ...

就看价格了。内存要大很多,而且可以两台合着用。起码也有256bit吧?

不考虑x64,应该可以杀strix halo

zhuifeng88 发表于 2025-1-7 13:59

simplex 发表于 2025-1-7 13:55
就看价格了。内存要大很多,而且可以两台合着用。起码也有256bit吧?

不考虑x64,应该可以杀strix halo ...

目标是干halo那倒是没什么问题...

wikieden 发表于 2025-1-7 14:01

可以做电视盒子

allensakura 发表于 2025-1-7 14:08

oppoig 发表于 2025-1-7 12:43
想起那个传闻,今年NVIDIA会出WOA的产品。

不用传闻,是真的

archxm 发表于 2025-1-7 14:15

nApoleon 发表于 2025-1-7 12:44
老黄:i have a dream,干死Intel和AMD~

为啥不是干死 winsows?

archxm 发表于 2025-1-7 14:17

某 ithome


Windows 95彻底改变了计算机行业,它使多媒体服务成为可能,对应用程序的开发方式影响深远。然而,这个计算模型对人工智能来说并不完美。我们的目标是,在未来,让人工智能成为你的助手。
人工智能是在云端构建的,我们的愿景是将它带到任何地方,当然也可以在你的公司中进行部署。英伟达最希望的是将其集成到个人电脑中。因此,如果我们能找到一种方法,使 Windows PC 成为世界级的人工智能平台,那将是非常令人兴奋的。
事实证明,实现这一目标的答案是 Windows WSL 2。WSL 2 将 Windows 和 Linux 无缝结合,运行效果出色,为开发者量身打造。你可以直接访问裸机资源,并且 WSL 2 已经针对云原生应用程序进行了优化,能够实现开箱即用的效果。只要你的计算机能够支持它,而你能够适应这种模式,我们就能提供多种适合的模型,无论是视觉模型、语言模型还是动画、数字人类或人类模型等各种类型的AI模型,都非常适合在你的电脑上运行。你可以轻松下载并使用它们。
因此,我们的重点是将 Windows WSL 2 和 Windows PC 打造成理想的一流平台,并将在未来持续支持和维护这一平台。

oppoig 发表于 2025-1-7 14:18

allensakura 发表于 2025-1-7 14:08
不用传闻,是真的

那基本就这个形态换发哥上就是了

zhengxinhn 发表于 2025-1-7 14:25

wikieden 发表于 2025-1-7 14:01
可以做电视盒子

3000刀的电视盒子,太富了

simplex 发表于 2025-1-7 15:03

黄皮Nvidia五月份出AI迷你“Super”机

zhengxinhn 发表于 2025-1-7 14:25
3000刀的电视盒子,太富了

3000刀是乱说

记得lunar lake两块lpddr5x就128bit了,那么这个就可有512bit,可以干过5070。黄皮称之为“Super”

zhengxinhn 发表于 2025-1-7 15:08

simplex 发表于 2025-1-7 15:03
3000刀是乱说

记得lunar lake两块lpddr5x就128bit了,那么这个就可有512bit,可以干过5070。黄皮称之为 ...

是啊,跟M4 max一样8块内存,M4 max就是512bit。128g+4T这个配置如果按苹果的尿性3000刀都算便宜了

fhhghost 发表于 2025-1-7 15:09

不是x86的 没啥意义

Amtrak 发表于 2025-1-7 15:42

老黄每过几年就想在CPU上试试水

simplex 发表于 2025-1-7 16:00

本帖最后由 simplex 于 2025-1-7 16:20 编辑

还真的是$3,000起价:Press release: NVIDIA Puts Grace Blackwell on Every Desk and at Every AI Developer's Fingertips

V2ELAO 发表于 2025-1-7 16:02

这玩意儿看起来可以叠叠乐,叠双机可以叠到256G显存,配个专门的swicth叠4层就有512G显存,想想就好玩[偷笑]

StevenG 发表于 2025-1-9 10:15

zhuifeng88 发表于 2025-1-7 12:48
3000刀起步, 其中一半价格给了400g网卡, 核心性能持平5070, 内存带宽还拉了个大垮 ...

两台就能运行/微调405b规模的大模型,同样配置比两台mbp并联便宜不少,而且并联的网络是双200g,带宽也高于mbp

tim6252 发表于 2025-1-9 10:35

simplex 发表于 2025-1-7 13:55
就看价格了。内存要大很多,而且可以两台合着用。起码也有256bit吧?

不考虑x64,应该可以杀strix halo ...

。。。2X的价格你这是用多少倍的成本 杀strix halo....

zhuifeng88 发表于 2025-1-9 11:44

本帖最后由 zhuifeng88 于 2025-1-9 12:01 编辑

StevenG 发表于 2025-1-9 10:15
两台就能运行/微调405b规模的大模型,同样配置比两台mbp并联便宜不少,而且并联的网络是双200g,带宽也高 ...

哪怕抛开速度不谈, 微调两台内存大小也远远不够的, 你不算激活参数, compute buffer, 优化器参数的占用的吗, qlora一般说的"差不多等于模型参数量"的显存占用只是极端粗略的估算, 你实际跑个能用的context length哪怕4096的微调看看比那个估算值高多少倍吧...

而且要是可以抛开速度不谈, 那CPU也可以3000刀这么干, 4/5/6代xeon是真的可以微调, 软件框架不如cuda但也差不多是饭喂到嘴上的程度了, 还比这个更快...

这个东西就纯粹的实验平台不指望实际跑任何东西的, 定位更像是上集群跑之前拿这玩意调通代码, 不用占用贵死人的集群 (或者给不差钱的玩玩, 毕竟m4 max都有人买来顶着那几乎没法用的prefill速度跑推理, 这玩意至少prefill没拉垮到果硅那种程度)

StevenG 发表于 2025-1-9 13:46

zhuifeng88 发表于 2025-1-9 11:44
哪怕抛开速度不谈, 微调两台内存大小也远远不够的, 你不算激活参数, compute buffer, 优化器参数的占用的 ...

这玩意的优势不就是既能用cuda还能做些实验性的调试嘛,价格还比mbp低,体积轻便,做点小项目还能带到现场显示成果。真正的生产集群跑一次都是w刀起步的成本,这3000刀的投入还不值嘛。。。

klxq15 发表于 2025-1-9 13:48

pytorch有arm版么

大道无言 发表于 2025-1-9 13:52

zhuifeng88 发表于 2025-1-7 12:48
3000刀起步, 其中一半价格给了400g网卡, 核心性能持平5070, 内存带宽还拉了个大垮 ...

这个里面塞的是400g nic吗
页: [1] 2
查看完整版本: 黄皮Nvidia Spark五月份出AI迷你“personal AI supercomputer”机