找回密码
 加入我们
搜索
      
查看: 7886|回复: 45

[显卡] NVIDIA 官方实锤:5090 的光栅性能瓶颈完全在 ROPs 上

[复制链接]
发表于 2025-2-22 12:01 | 显示全部楼层 |阅读模式
本帖最后由 chungexcy 于 2025-2-22 12:01 编辑

联动之前的贴子:我来告诉你们为啥50系毫无提升,本质 Ada Refresh。。。

NVIDIA 官方表示,受影响的 5090 性能损失 4%。



5090 ROPs 是 176,受影响的ROPs 是 168。少的 8 个 ROPs,刚好少了 4%

TechPowerUp 表示部分游戏甚至损失 6%(老头环)



评分

参与人数 1邪恶指数 +10 收起 理由
silverse + 10

查看全部评分

发表于 2025-2-22 12:05 来自手机 | 显示全部楼层
5070ti也少rops,而5080这个完整核心的没事,挺幽默的。
发表于 2025-2-22 12:10 | 显示全部楼层
这是切除的不干净,切偏了一点?
发表于 2025-2-22 12:10 | 显示全部楼层
官方有说怎么处理吗?
发表于 2025-2-22 12:13 来自手机 | 显示全部楼层
airforce18 发表于 2025-2-22 12:10
官方有说怎么处理吗?

有问题的卡联系厂家换新
发表于 2025-2-22 12:16 来自手机 | 显示全部楼层
airforce18 发表于 2025-2-22 12:10
官方有说怎么处理吗?

溢价跟牛买的就找牛呗,哈哈哈哈
发表于 2025-2-22 12:17 | 显示全部楼层
airforce18 发表于 2025-2-22 12:10
官方有说怎么处理吗?

海量个例,厂家换新
发表于 2025-2-22 12:19 | 显示全部楼层
punk100 发表于 2025-2-22 12:10
这是切除的不干净,切偏了一点?

是切完了发现还有坏块
发表于 2025-2-22 12:33 | 显示全部楼层
50系只是没有达到我们心目中的预期而已,不代表它效率下滑。
5090,5080,5070Ti,都是性能提升≥粗大提升,频率,晶体管,面积等还有所下降。
至于5090只比5080强55%,那是因为到这个性能区间有太多游戏众生平等拉低了平均成绩,就像10系跑2K一样。
发表于 2025-2-22 12:35 | 显示全部楼层
这下真的是海量个例了
发表于 2025-2-22 12:35 | 显示全部楼层
Scarlet〃 发表于 2025-2-22 12:05
5070ti也少rops,而5080这个完整核心的没事,挺幽默的。

这说明老黄的纳米刀法抖了,也许是得了帕金森
发表于 2025-2-22 12:48 | 显示全部楼层
我最近一直在看UE5相关的的玩意
基本可以得出一个结论,那就是不论是EPIC还是NV都认为4K渲染未来一点都不重要
他们有意劣化4K原生画质下的性能逼迫玩家和厂商选择DLSS的性能模式
既然设计的目标渲染分辨率就是只有1080P,那ROP为什麽要增加呢?



发表于 2025-2-22 13:00 | 显示全部楼层
allensakura 发表于 2025-2-22 12:48
我最近一直在看UE5相关的的玩意
基本可以得出一个结论,那就是不论是EPIC还是NV都认为4K渲染未来一点都不重 ...

是这样,如果dlss技术既能解决画质问题,又能解决帧率速度问题也行啊。因为我们游戏玩家只需要显示器上最终的输出结果体验嘛,你中间刀耕火种,土法炮制无所谓,只要端上桌子我吃的满意就行。
发表于 2025-2-22 13:07 | 显示全部楼层
allensakura 发表于 2025-2-22 12:48
我最近一直在看UE5相关的的玩意
基本可以得出一个结论,那就是不论是EPIC还是NV都认为4K渲染未来一点都不重 ...

这也能带上 UE5我是没想到的。建议去看看虚幻5文档,1080P 60FPS的渲染目标指的是在主机上,人家当然是根据主机性能定的渲染目标了。就PS5的光追性能,4K原生 那是做不到啊……
发表于 2025-2-22 13:10 | 显示全部楼层
黄伟达:净事房捅的篓子 关我什么事 我户部只管韭菜收成。。。
发表于 2025-2-22 13:19 | 显示全部楼层
甚至GB202依然保持12组GPC不变的情况下塞下了24576CUDA,为此需要每组GPC的TPC数量从6增加到8,但是ROP单元数量并没有增加,也就是说GB202在CUDA规模对比AD102大了33%的情况下,依然拥有相同数量的光栅单元顺带一提因为5090和4090恰好都是启用11组GPC,所以反映到实际产品上他俩也恰好都是176个ROPs

作为对比,前两代和GB202以外的绝大多数核心都是每组GPC含6组TPC,光栅单元配比是更充足的

或许这就是AI显卡吧
 楼主| 发表于 2025-2-22 13:31 来自手机 | 显示全部楼层
本帖最后由 chungexcy 于 2025-2-22 13:38 编辑
PPXG 发表于 2025-2-22 13:19
甚至GB202依然保持12组GPC不变的情况下塞下了24576CUDA,为此需要每组GPC的TPC数量从6增加到8,但是ROP单元 ...


建议加大ai显卡力度,争取早日进化成gh200那种3rops/gpc的
发表于 2025-2-22 13:43 | 显示全部楼层
本帖最后由 allensakura 于 2025-2-22 14:11 编辑
理智的边缘 发表于 2025-2-22 13:07
这也能带上 UE5我是没想到的。建议去看看虚幻5文档,1080P 60FPS的渲染目标指的是在主机上,人家当然是根 ...


原本4K渲染相对於1080P的压力是2.25倍
但在UE5使用Nanite之後,4K相对於1080P是3倍以上
Nanite提高渲染解析度对光栅化性能会有严重影响,程度取决於屏幕多边形的数量
如果NV想解决这个问题,必须加大ROP的相对於其他单元的比例,但相反的是5系大幅减少
既然如此结论只有一个


发表于 2025-2-22 13:45 | 显示全部楼层
6%都够老黄切出一张卡了 可怕可怕 恭喜奸商中招
发表于 2025-2-22 13:53 | 显示全部楼层
ONEChoy 发表于 2025-2-22 13:10
黄伟达:净事房捅的篓子 关我什么事 我户部只管韭菜收成。。。

hahaha~
发表于 2025-2-22 13:54 | 显示全部楼层
PPXG 发表于 2025-2-22 13:19
甚至GB202依然保持12组GPC不变的情况下塞下了24576CUDA,为此需要每组GPC的TPC数量从6增加到8,但是ROP单元 ...

从15年春泰坦x到16年夏泰坦p到17年春泰坦xp再到18年底泰坦rtx,
长期保持96rop雷打不动
发表于 2025-2-22 13:59 | 显示全部楼层
punk100 发表于 2025-2-22 12:10
这是切除的不干净,切偏了一点?

应该是把好腿给截了
发表于 2025-2-22 14:07 来自手机 | 显示全部楼层
faimie6183 发表于 2025-2-22 13:54
从15年春泰坦x到16年夏泰坦p到17年春泰坦xp再到18年底泰坦rtx,
长期保持96rop雷打不动 ...

那会儿是因为ROPs和L2、显存控制器绑定,几代泰坦都是384bit所以ROPs没提升,一直到20系都是这么设计的,TITAN RTX也是96ROPs

从30系开始ROPs不再和L2绑定,而是塞入GPC中,随GPC开启情况调整
发表于 2025-2-22 14:12 | 显示全部楼层
LOLI反应堆 发表于 2025-2-22 12:33
50系只是没有达到我们心目中的预期而已,不代表它效率下滑。
5090,5080,5070Ti,都是性能提升≥粗大提升, ...

50系效率没有下滑,但也基本没有什么提升。5080比4080s 4k平均12%的性能增幅,cuda多了5%,rop单元多了14%,纹理单元多了5%,rt core多了5%,显存频率多了33%,boost频率多了2.6%,功耗提升12.5%。能耗比和4080s几乎没差。
发表于 2025-2-22 14:36 | 显示全部楼层
本帖最后由 LOLI反应堆 于 2025-2-22 14:38 编辑
heroyours 发表于 2025-2-22 14:12
50系效率没有下滑,但也基本没有什么提升。5080比4080s 4k平均12%的性能增幅,cuda多了5%,rop单元多了14 ...


GB203和AD103 rops一样的啊,它们都是7GPC。
考虑到5080频率还低一点,像素填充率应该也低一点。
发表于 2025-2-22 14:55 | 显示全部楼层
LOLI反应堆 发表于 2025-2-22 14:36
GB203和AD103 rops一样的啊,它们都是7GPC。
考虑到5080频率还低一点,像素填充率应该也低一点。 ...

rop我看错了,不好意思。5080频率不低啊,同为fe,5080fe的boost频率还更高。
发表于 2025-2-22 14:58 | 显示全部楼层
heroyours 发表于 2025-2-22 14:55
rop我看错了,不好意思。5080频率不低啊,同为fe,5080fe的boost频率还更高。


在游戏里普片要低一点。40系都是2800mhz+,5080和5070Ti大部分时间都是2750mhz甚至不到。
发表于 2025-2-22 15:02 | 显示全部楼层
LOLI反应堆 发表于 2025-2-22 14:58
在游戏里普片要低一点。40系都是2800mhz+,5080和5070Ti大部分时间都是2750mhz甚至不到。 ...

2800mhz以上的都是oc版了,FE频率在2745-2775之间浮动
 楼主| 发表于 2025-2-22 15:05 来自手机 | 显示全部楼层
heroyours 发表于 2025-2-22 14:12
50系效率没有下滑,但也基本没有什么提升。5080比4080s 4k平均12%的性能增幅,cuda多了5%,rop单元多了14 ...

你咋不对比4080的规模呢
发表于 2025-2-22 15:09 | 显示全部楼层
heroyours 发表于 2025-2-22 14:12
50系效率没有下滑,但也基本没有什么提升。5080比4080s 4k平均12%的性能增幅,cuda多了5%,rop单元多了14 ...


不是12%是16%,而且算上dlss4的提升,5080的优势会更大。

1.jpg
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

Archiver|手机版|小黑屋|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806 上海市互联网违法与不良信息举报中心

GMT+8, 2025-4-22 01:32 , Processed in 0.298750 second(s), 7 queries , Gzip On, Redis On.

Powered by Discuz! X3.5 Licensed

© 2007-2024 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表