找回密码
 加入我们
搜索
      
查看: 6816|回复: 29

[显卡] 谈谈这代Ada产品规划的问题及更合理的可能

[复制链接]
发表于 2023-1-7 20:45 | 显示全部楼层 |阅读模式
本帖最后由 Rafale 于 2023-1-7 21:34 编辑

先说我觉得存在的主要问题:
1,TSMC 4N(N4?)贵这我们知道,$16000往上,但也没必要总是堆到超大规模面积去,用密度和频率换取性能足够了,尤其上面还有个Hooper。因此整体产品定位稍微调降是必要的,你可以说整体营业额的问题,但更应该看到PC游戏生态的凋零,稍微降一些门槛让更多的玩家留存,游戏开发商也才能有足够销量。生态走向衰败,高价肯定是重要因素。
2,高端用力过猛,40系列算下来频率比30系列平均提升了48%左右,就算架构效率没改善,现在AD102的12个GPC也比GA102的7个提升了71.4%,加起来RAW Power是253.7%,当然实际没这个效果很多人都说是目前架构堆GPC的瓶颈明显导致的,那为啥不省点面积呢?维持频率或略降,10组GPC,得到210%左右的RAW Power提升,算是合格的换代吧?
3,中端产品显存容量存在缺憾,显存容量的问题自30系列以来NV一直没解决的很好,当然这也是跟位宽直接挂钩的,到了40系列采用大缓存来配合位宽缩减,上2GB的颗粒这个问题好解决多了,但是,目前的配置下,4070ti等中端产品的显存容量还是显得容易过时,或者说12GB显存更合理的搭配是个更弱一丢丢的核心。
4,显存带宽设定方面也存在一些问题,尤其是在4070ti就很明显了,高分辨率下瓶颈严重。你可以说4070ti更多配2K屏,但你也不看看价格,6499超过了4K 144Hz MiniLED的显示器价格了,我装机显示器的预算和使用周期都显著更长。这不说底下还有一档4K 60Hz玩3A的大把用户群,显卡和显示器怎么搭配?这代40的显存带宽最富于的反而是4080(平均每SP带宽为73.7MB/s),4070ti仅有65.5MB/s,这里还没算70ti的SP频率更高。我并不是清楚Ada架构下L2的原理跟AMD那边容量效率直接与分辨率挂钩还是不同的原理,这里先不谈L2。
5,大多数的玩家是游戏玩家而不是什么DIY玩家,把TDP搞得那么极限给散热的压力也很大,用起来不省心。对于常规电脑机箱来说超过250W的显卡很难伺候。稍微调降一些TDP,性能没啥影响。

然后是我认为更合理的多的组合:

cfg

cfg


1,这里保持了低端AD107 30%左右的平均毛利,而高端AD102则有60%以上,这也符合ASIC企业的理想毛利范围。
2,整体的裁剪策略兼顾瑕疵利用率和市场细分的需要,当然还是尽量减少一些非不良处的阉割带来的浪费。
3,每个Die的最高端产品频率也会定的高一些,TDP也比较高,这也是常规做法;也意味着在Wafer边缘的体质稍差的die哪怕是完整的也会被阉割降档。
4,Ada架构的L2绑定关系我不是很清楚,跟MC挂钩但并没绑定,也跟GPC没有绑定,我姑且认为可以做到最小8MB的阉割单位吧。

AD102这档我认为10个GPC就够了,维持L2。可以分为两个PCB,高的那个走14~16层HDI并且优化走线,我知道批量上23Gbps很难。这个板子还要兼顾双面贴片的48GB产品卖给炼丹的(频率降到21Gbps),毕竟底下有两个阉割的厉害的型号,没有足够多的近满血产品销量,那残次品只能更多刻意为之,有点浪费。
AD103……原来的AD103这个80个SM(12*7-4不对称)实在是憋死强迫症,我这干脆没有了,和原有的AD104来了个折中,6个GPC的配置挺好,依靠频率能取得比上代旗舰GA102高出25~28%的RAW Power,足够了,16GB显存也很合适,命名为AD104希望能承担更大的销量责任。
AD106肯定是需要稍微提升下规模来填充原来AD104被合并的空间,SP数量=GA104但从8*6变为12*4,ROP规模缩为64个(但频率高啊),我认为是足够的,原来GA104的前端规模那么足,但性能也比只多一组(16个)ROP的GA102相去甚远。
AD107是我最纠结的,体系里唯一位宽的缩减幅度(192b-128b)大于ROP缩减幅度(64-48),但确实再往下去32ROP的话光栅性能差的太远了,低端产品还是以确保电竞网游等低运算高填充游戏的帧率下限为优先级吧,GA106的配置复刻挺合适。最低端产品显存频率低于颗粒预设,给AIC空间去摆烂PCB。

然而这一切没有发生,残念!

发表于 2023-1-7 20:51 | 显示全部楼层
个人认为这一代除了4090是正常换代,其它都是因为大量30系得存在而导致得不合理
发表于 2023-1-7 21:00 | 显示全部楼层
确实感觉晶体管数量接近x3,但是核心数量就x1.6,频率x1.5,但是最后性能也就1.7的水平(4090)就很迷惑。。。
 楼主| 发表于 2023-1-7 21:01 | 显示全部楼层
Stretford 发表于 2023-1-7 20:51
个人认为这一代除了4090是正常换代,其它都是因为大量30系得存在而导致得不合理 ...

看的出来NV是准备和30系列长期并存销售了,导致前三个产品的定位定价都这么高。4090的die cost确实是高,比三星8nm贵太多了,我还是觉得没必要在总成本上一直往走,经济大环境摆在那。
发表于 2023-1-7 21:26 | 显示全部楼层
因为农企计划中有个naive32*2呀,只有现在的AD102能对付,至于农企计划没能实现,这属于意料之外。

再就是,1.5倍的粗大和1.4倍的频率只换来了1.6倍的性能,和游戏跟不上有很大的关系,就算妳架构效率再高,满帧的游戏还是会满帧,低负载的游戏还是会低负载,把这些综合成绩里一拉,还能提升多少?农卡这边也是一样的,游戏和跑分提升差距大。这肿情况就算提升分辨率来拉高负载也没用,因为是前端过剩,只提升分辨率的话后端又会吃紧。只有等游戏材质跟上了,让上一代的显卡即便在2K或1080P下都跑不上20帧,才能真正发挥这一代显卡的威力。比如逆水寒
发表于 2023-1-7 21:36 | 显示全部楼层
LOLI反应堆 发表于 2023-1-7 21:26
因为农企计划中有个naive32*2呀,只有现在的AD102能对付,至于农企计划没能实现,这属于意料之外。

再就是 ...

真出现像你说的情况 那只有4090能顶住
只能怪现在游戏太垃圾了 基本不进步  让几年前的显卡都能跑百帧 出点吃配置的游戏那真是纯吃配置 画面还和狗屎一样
怀念crysis
个位数.JPG
 楼主| 发表于 2023-1-7 21:37 | 显示全部楼层
本帖最后由 Rafale 于 2023-1-7 21:41 编辑

老黄估计也没想到农企快拉到可以无视了,搞得把整体产品定位拱得这么高,整体市容量堪忧啊。也没啥补可能的救措施,因为再往下走的几个die,显存容量又太小了。
现在的显卡或者PC游戏行业根本不是性能不足的问题,更多的是市场空间因为高价竞争导致的萎缩,带来的开发商投入优化资源的不足。
发表于 2023-1-7 21:40 | 显示全部楼层
wangguan8602745 发表于 2023-1-7 21:36
真出现像你说的情况 那只有4090能顶住
只能怪现在游戏太垃圾了 基本不进步  让几年前的显卡都能跑 ...


我记得逆水寒4K下4090只有16帧,顶不住。

3090ti只有8帧。
多来几个这样的,4090对3090ti的提升保证到80%以上
发表于 2023-1-7 21:55 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
发表于 2023-1-7 21:57 | 显示全部楼层
设计产品的一条准则,就是不能设计成完美的产品,必须有缺陷。否则你都满足了,怎么还会去买下一个产品呢?
 楼主| 发表于 2023-1-7 22:04 | 显示全部楼层
wg8232213 发表于 2023-1-7 21:55
你觉得合理,能赚钱不?所以你觉得合理有啥用,天生立场就不一样啊朋友

放心,人家也想着维持好GP的情况下GMV最大化,而不是卖出一个产品的毛利额。现在的问题就是价格拉的太高市场容量不足,但其实按我的想法成本降下来后,竞争力未必差多少。其实在我的规划里,AD102的几款产品毛利率是高于现有的,因为die size下来了。
 楼主| 发表于 2023-1-7 22:06 | 显示全部楼层
raiya 发表于 2023-1-7 21:57
设计产品的一条准则,就是不能设计成完美的产品,必须有缺陷。否则你都满足了,怎么还会去买下一个产品呢? ...

每一代产品自身要相对合理,不是完美;这代最大的问题是中端显存容量配不上核心规模。没有完美的产品,因为下一代一定性能更强,而我这个调降本代性能的方案恰好给下代性能跃升提升了空间。
发表于 2023-1-7 22:56 | 显示全部楼层
本帖最后由 raiya 于 2023-1-7 23:04 编辑
Rafale 发表于 2023-1-7 22:06
每一代产品自身要相对合理,不是完美;这代最大的问题是中端显存容量配不上核心规模。没有完美的产品,因 ...


不不不,完全均衡的话,你有没有想过,他还怎么推出比如说 S ti。而且到了下一代,新一代的产品和老一代的高一个型号产品,会在性能上完全重合,比如说3080=4070,完全一模一样的性能。这样上一代的二手卡和库存就会影响新一代的销售,就像10系的显卡是万年钉子户。他就被迫每一代必须推出颠覆性的新功能,才能造成差异,才能产生卖点。这是掐自己脖子,断自己的退路。

反过来,每个产品留一个缺陷,下一次推出新产品的时候,补一下这个缺陷,就有卖点了。举个例子,3080即便他比3090的显存少了60%,但是他比2080多了2G显存,一群人就觉得提升很大。同时他4k有爆显存的风险,让人觉得不满足,那么就还可以出一个12G版本的。

设计产品是拿来卖钱的,不是拿来做善事的。
发表于 2023-1-7 23:02 | 显示全部楼层
Rafale 发表于 2023-1-7 22:04
放心,人家也想着维持好GP的情况下GMV最大化,而不是卖出一个产品的毛利额。现在的问题就是价格拉的太高 ...

高端产品的性能定位,必须要考虑对手的高端产品;
在7900上市之前,那个性能是吹得很猛的!  3X 提升,你怕不怕。
发表于 2023-1-7 23:17 来自手机 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
发表于 2023-1-7 23:36 | 显示全部楼层
本帖最后由 kinglfa 于 2023-1-7 23:37 编辑

4090的核心规模晶体管数量是3090的2.69倍,
频率是3090的1.35倍,
二缓是3090的9倍(6MB~72MB),
为啥玩游戏性能只有3090的2倍?

点评

隔壁A家貌似性能相当于规格感觉也这样。。  发表于 2023-1-8 00:25
发表于 2023-1-7 23:38 | 显示全部楼层
kinglfa 发表于 2023-1-7 23:36
4090的核心规模晶体管数量是3090的2.69倍,
频率是3090的1.35倍,
二缓是3090的9倍(6MB~72MB),


这就好比在问3080的核心规模晶体管数量和3090ti一样

为啥3080游戏性能只有3090ti的80%

拿4090去比不如拿4070ti举例子
 楼主| 发表于 2023-1-7 23:41 | 显示全部楼层
raiya 发表于 2023-1-7 22:56
不不不,完全均衡的话,你有没有想过,他还怎么推出比如说 S ti。而且到了下一代,新一代的产品和老一代 ...

新老替换这是避免不了的过程,3070=2080Ti的时候不也是该卖就卖,你总不能指望下一代最低端都比上一代旗舰更强吧。排除竞争压力,这次升级确实用力过猛导致价格段崩了。
GA102的一堆版本的故事是个逐步产品化完善的过程,且由于是旗舰die,可玩空间很大,显存10G~24G都能配出来还有相对合理的位置。反观这次的AD104,显存还能怎么玩?4070ti给24G就太浪费了吧(而且首要问题是成本售价要下的来),给20G意味着位宽缩成160b,,现在瓶颈都很严重了。
 楼主| 发表于 2023-1-7 23:44 | 显示全部楼层
本帖最后由 Rafale 于 2023-1-7 23:46 编辑

我现在只希望接下来的4070千万不能缩位宽和容量(保持12G),最好显存频率也保持21Gbps,把核心砍两组TPC,出来个7168SP,12G GDDR6X的规格,做到5K以内平替3080Ti……
发表于 2023-1-7 23:48 来自手机 | 显示全部楼层
Rafale 发表于 2023-1-7 23:41
新老替换这是避免不了的过程,3070=2080Ti的时候不也是该卖就卖,你总不能指望下一代最低端都比上一代旗 ...

主要还是RDNA3给的压力太小了,不然也是AD102做4080了。
其实现在这个大残的ad102版的4090倒是和3080比较像
 楼主| 发表于 2023-1-7 23:54 | 显示全部楼层
BFG9K 发表于 2023-1-7 23:48
主要还是RDNA3给的压力太小了,不然也是AD102做4080了。
其实现在这个大残的ad102版的4090倒是和3080比较 ...

4090ti的规模18176SP,完整的96MB L2,22.4Gbps的显存,似乎地球人都想得到等在哪,无奈目前的Navi32看上去连不足4090一半规模的70ti都打不过,x2还想打得过原生单核心的4090?ti怕是一时半会儿不用出了。
倒是我设想的最高端15104SP规模的产品,估计就能小压Navi32*2,还能守好成本。都是高估农企惹得。
发表于 2023-1-7 23:57 | 显示全部楼层
Rafale 发表于 2023-1-7 23:44
我现在只希望接下来的4070千万不能缩位宽和容量(保持12G),最好显存频率也保持21Gbps,把核心砍两组TPC, ...

只有7168和7680的前端差别的话,最多4%的性能差距,先不说这一代性能间距明显很大,4%的差距指望便宜250刀实在是白日做梦。
 楼主| 发表于 2023-1-8 00:01 | 显示全部楼层
LOLI反应堆 发表于 2023-1-7 23:57
只有7168和7680的前端差别的话,最多4%的性能差距,先不说这一代性能间距明显很大,4%的差距指望便宜250 ...

当然,频率调降8%到2410这样,TDP回到3070的220W,显存给18Gbps也能接受...编不下去了,其实就是想降价一些,重复3070和3070ti这个史上差距最小ti和能耗比倒挂的故事。
发表于 2023-1-8 00:05 | 显示全部楼层
那看来不用等90ti了??
发表于 2023-1-8 00:12 | 显示全部楼层
Rafale 发表于 2023-1-8 00:01
当然,频率调降8%到2410这样,TDP回到3070的220W,显存给18Gbps也能接受...编不下去了,其实就是想降价一 ...

老黄说:我太清楚妳想干嘛了,TDP200W给妳锁的死死的,1M都别想超
发表于 2023-1-8 06:21 | 显示全部楼层
Rafale 发表于 2023-1-7 23:44
我现在只希望接下来的4070千万不能缩位宽和容量(保持12G),最好显存频率也保持21Gbps,把核心砍两组TPC, ...

那可能想太美好了,毕竟4070都砍到5888去了
发表于 2023-1-8 08:18 | 显示全部楼层
本帖最后由 Flanker 于 2023-1-8 08:22 编辑

挺没劲的,纯粹由果及因搞出个两家高端竞争激烈的假象,把上限搞得这么低90也不过降价$100,而且现实里102切成90的良率和成本很可能更好看

106/107这价格也没表现出想拉销量的意思
发表于 2023-1-8 08:39 | 显示全部楼层
本帖最后由 atiufo 于 2023-1-8 08:42 编辑
Rafale 发表于 2023-1-7 23:44
我现在只希望接下来的4070千万不能缩位宽和容量(保持12G),最好显存频率也保持21Gbps,把核心砍两组TPC, ...


新的传闻是显存频率、容量和位宽没缩,但5888的cuda,实际性能能不能干过3080都是个问题,大概会是同代70和80差距最大的一次
更早版本的传闻是cuda微缩,显存10g,160bit
总之两个都是浑身难受的规格
发表于 2023-1-8 09:40 | 显示全部楼层
说 4090 性能提升还不够的,别忘了你谈的是  AD102 是满血芯片,而如今的 4090 只有 16384 cuda 核心开启了,仅有 88%,缓存也是锁到只有 72MB,比满血 96MB 少了 25%。核心电压更是锁到 1.05v,导致功率无论怎么提,功耗最大也就500w左右,频率只有 3G 出头,让默认的600w 功耗墙形同虚设。

所以真正的 AD102 ,如果解锁 800w 功耗,核心电压解锁 1.15v,满 Cuda,满缓存,频率 3.3G 起。这才是真正的 AD102,这时候你去看晶体管数量提升差不多就对了。

或者换句话说,如今你看到的 4090,差不多核心面积实际用上的就 520 mm²,并不是 608 mm²。
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

Archiver|手机版|小黑屋|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806 上海市互联网违法与不良信息举报中心

GMT+8, 2025-1-15 20:44 , Processed in 0.015884 second(s), 7 queries , Gzip On, Redis On.

Powered by Discuz! X3.5 Licensed

© 2007-2024 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表