找回密码
 加入我们
搜索
      
查看: 9273|回复: 30

[显卡] 50系AI TOPS值高,4090能改48G显存,那么问题来了:跑AI更倾向于哪个?

[复制链接]
发表于 2025-1-7 12:34 | 显示全部楼层 |阅读模式
本帖最后由 nekotheo 于 2025-1-7 12:37 编辑

GeForce-RTX-50-Series-Graphics-Cards-NVIDIA-01-07-2025_12_32_PM.png




单从AI TOPS的数值上看,5070Ti已经超过4090且价格低了很多,但显存只有16GB,5080也是同样如此

4090还能改48G

那么问题来了:

跑AI更倾向于哪个?
发表于 2025-1-7 12:49 | 显示全部楼层
5090真实算力是3352/2/1321=127% 4090
发表于 2025-1-7 12:50 | 显示全部楼层
llwin 发表于 2025-1-7 12:49
5090真实算力是3352/2/1321=127% 4090

正解,50系放的算力是int4   40系放的算力是int8  故50系要除以2才能对上实际算力。
发表于 2025-1-7 12:50 | 显示全部楼层
毫无疑问是4090 48G,显存多少决定你模型跑不跑得起来,至于算力只影响速度
发表于 2025-1-7 12:51 | 显示全部楼层
那么4090现在改48G要多少钱?使用后稳定性如何?谁知道?
发表于 2025-1-7 12:52 | 显示全部楼层
只能说你压根没看明白ai tops这个指标背后是怎么来的
发表于 2025-1-7 12:54 | 显示全部楼层
Fp4你要用得上前提是
发表于 2025-1-7 13:14 | 显示全部楼层
gmlee1999 发表于 2025-1-7 12:51
那么4090现在改48G要多少钱?使用后稳定性如何?谁知道?

2w4可开票,涡轮。搬核心技术非常成熟
发表于 2025-1-7 13:18 | 显示全部楼层
转一下在隔壁贴的回复

wjm47196 发表于 2025-1-7 12:57
能改但是没人要。。。其实我也觉得很奇怪,又不差那点性能

因为技术还没流出吧,只有改好的批量卖,不像 2080 Ti 22G 一样可以拿自己的卡去改

对于大批量采购算力的企业用户来说,4090 一般都是用来推理,推理的话 24G 大部分时候已经足够了,正规一点的算力中心也不会去买魔改卡,何况政府出资的都有信创的要求,我认为这一端对 4090 48G 的需求其实是高估了的

个人用户倒是有用4090训练的需求,但是4090毕竟是五位数价格的东西,我已经有卡了再加点钱改一下倒还行,让我一次性出两万多买张随时会BOOM的魔改卡大部分人还是要打退堂鼓的

2080 Ti 22G 受欢迎是因为便宜,三千块,就当买个玩具了,坏了算自己倒霉
发表于 2025-1-7 13:20 | 显示全部楼层
5090改64G
 楼主| 发表于 2025-1-7 13:22 | 显示全部楼层

pass,暂时技术未攻克
发表于 2025-1-7 13:23 | 显示全部楼层
肯定是48G呀
还有不少用 Mac Mini 来跑,图它的64G呢
发表于 2025-1-7 13:29 | 显示全部楼层
平安是福 发表于 2025-1-7 12:50
正解,50系放的算力是int4   40系放的算力是int8  故50系要除以2才能对上实际算力。 ...

我就说怎么提升这么大,搞半天 5080 AI还比不过4090。这算下来5080的 TPP只有3600,跟禁售差远了
发表于 2025-1-7 13:43 来自手机 | 显示全部楼层
neavo 发表于 2025-1-7 13:18
转一下在隔壁贴的回复



我也搬一下回复,24g勉强够,但是谁也不保证下一个模型就能装,但凡能用到48的,要不就花7w买ada6000,要不就是3w的这个,那么同样的钱买两片半这个不香嘛
发表于 2025-1-7 14:05 | 显示全部楼层
pingji 发表于 2025-1-7 13:43
我也搬一下回复,24g勉强够,但是谁也不保证下一个模型就能装,但凡能用到48的,要不就花7w买ada6000,要 ...

当然是有这种需求的,但是这应该不是主流需求
发表于 2025-1-7 14:17 | 显示全部楼层
肯定是50系,我也改过显存翻倍。这玩意副作用贼大。算了吧。要么是间歇闪屏,要么掉驱动,要么游戏内验证不通过。二手卖的时候还是个大修货,别想卖上价。
发表于 2025-1-7 14:21 来自手机 | 显示全部楼层
neavo 发表于 2025-1-7 14:05
当然是有这种需求的,但是这应该不是主流需求

100片起订的规模……主流……无限收都能收几片卖几片的规模说主流不主流有毛线意义,就整个大陆个人diy手里这点4090的量,只要敢卖,随便来俩大商家就能把货全吃了信不信
发表于 2025-1-7 14:34 | 显示全部楼层
pingji 发表于 2025-1-7 14:21
100片起订的规模……主流……无限收都能收几片卖几片的规模说主流不主流有毛线意义,就整个大陆个人diy手 ...

主要是真玩AI的也不会用4090了 很明显单卡可以算力不足 但是能互联成系统的才是大规模开发需要的  
发表于 2025-1-7 14:36 | 显示全部楼层
Illidan2004 发表于 2025-1-7 14:34
主要是真玩AI的也不会用4090了 很明显单卡可以算力不足 但是能互联成系统的才是大规模开发需要的   ...

pcie互联又不是不能用, l20/l40s 8卡机卖那么好...
发表于 2025-1-7 14:49 来自手机 | 显示全部楼层
Illidan2004 发表于 2025-1-7 14:34
主要是真玩AI的也不会用4090了 很明显单卡可以算力不足 但是能互联成系统的才是大规模开发需要的   ...

我寻思ada6000不是也没nvlink嘛……
发表于 2025-1-7 15:58 | 显示全部楼层
Illidan2004 发表于 2025-1-7 14:34
主要是真玩AI的也不会用4090了 很明显单卡可以算力不足 但是能互联成系统的才是大规模开发需要的   ...

4卡8卡单节点的还是不错的。现在p2p也可以可以打开的。
发表于 2025-1-7 16:08 来自手机 | 显示全部楼层
neavo 发表于 2025-1-7 13:18
转一下在隔壁贴的回复



反老美制裁的强力部门是最大消费者
不敢那么乱来的
发表于 2025-1-7 16:18 | 显示全部楼层
平安是福 发表于 2025-1-7 12:50
正解,50系放的算力是int4   40系放的算力是int8  故50系要除以2才能对上实际算力。 ...

应该是fp4,40系标的是fp8
30系只能fp16或者int8
发表于 2025-1-7 16:22 | 显示全部楼层
aibo 发表于 2025-1-7 16:18
应该是fp4,40系标的是fp8
30系只能fp16或者int8

如果是浮点会专门用tflops标注来着,autodl网站上4090标注165t fp16(稠密)算力,也就是660t 稀疏fp8算力,老黄标1330t那应该就是指的int8(稀疏)算力
发表于 2025-1-7 16:56 | 显示全部楼层
本帖最后由 zbq123 于 2025-1-7 17:12 编辑

都不选,老黄这次不是掏出来个Nvidia Project Digits跑AI开发,虽然暂时还是个期货,但是1 PFLOP FP4浮点+128 GB统一内存太香了
发表于 2025-1-7 17:07 来自手机 | 显示全部楼层
平安是福 发表于 2025-1-7 16:22
如果是浮点会专门用tflops标注来着,autodl网站上4090标注165t fp16(稠密)算力,也就是660t 稀疏fp8算 ...

ada白皮书,4090的int8和fp8都支持稀疏,算力都是1321,4090也支持int4,稀疏算力翻倍2642。
但是老黄在ada/hopper的时候着重说了fp8,因为30系支持int4/8,但不支持fp8。

所以这次我甚至怀疑老黄用的是fp4。
不然4090的int4不会那么低
发表于 2025-1-7 18:06 | 显示全部楼层
llwin 发表于 2025-1-7 12:49
5090真实算力是3352/2/1321=127% 4090

所以 4090是禁售卡 而5090D不是 因为5090D的int8算力只有4090的89.89%
发表于 2025-1-7 18:07 | 显示全部楼层
而5090D 是1187.5  4090D 的int8 是1177  恩 10.5的差距 难怪不禁售
发表于 2025-1-7 18:09 | 显示全部楼层
1. 肯定48G啊
2. int4精度太差了,量化能接受的,是int8
发表于 2025-1-7 18:21 | 显示全部楼层
真搞AI没必要自己买这么贵的卡,花点小钱租计算中心的卡不是挺好,方便快捷价格低。

看新闻现在计算中心的利用率也就2x%,完全可以本地游戏卡+租计算卡,算下来省很多钱。
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

Archiver|手机版|小黑屋|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806 上海市互联网违法与不良信息举报中心

GMT+8, 2025-2-20 22:44 , Processed in 0.013127 second(s), 6 queries , Gzip On, Redis On.

Powered by Discuz! X3.5 Licensed

© 2007-2024 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表