找回密码
 加入我们
搜索
      
查看: 2575|回复: 10

[显卡] 连续三代NV家的显卡ALU效率都是完全一致了吧?

[复制链接]
发表于 2025-1-29 15:48 | 显示全部楼层 |阅读模式
从30系到现在,似乎就没有效率上的改进,导致基本上看CUDA数量就能分析单精度浮点游戏性能。下一代6090在改制程的同时能像CPU那样改进一下ALU单元的效率吗?
发表于 2025-1-29 16:23 | 显示全部楼层
如果不是硬件研究方向,单从用户角度,没必要关心这个。只需要关心实际性能,价格,功耗。

只要6090能做到性能翻倍,价格5000,功耗200w,那就是nb。至于用了多少个cuda,对我有什么影响?用1亿个也没关系的。
发表于 2025-1-29 23:36 | 显示全部楼层
提升"ALU效率"根本就影响不到游戏性能。
如果你以为游戏性能是受单精度浮点瓶颈,那4k性能就是1080p的1/4
发表于 2025-1-29 23:58 | 显示全部楼层
50补全了int32单元,也算是有点改进了。40只有1/2。

要怎么提升单精度浮点呢,因为放再多的流处理器会影响到放tensor core,现在到底哪一边才是黄的心头肉,不言而喻了。

只能寄望有一天这种割裂的状态消失,比如老黄挖到黑科技,tensor core可以算渲染管线的任务了。
发表于 2025-1-30 00:35 | 显示全部楼层
貌似还开倒车改回pascal那种int32/fp32兼顾的设计了

从turing分离int32和fp32,到ampere/ada改回一半,到现在完全改回,兜兜转转变种挤牙膏
发表于 2025-1-30 09:19 | 显示全部楼层
我輩樹である 发表于 2025-1-29 23:58
50补全了int32单元,也算是有点改进了。40只有1/2。

要怎么提升单精度浮点呢,因为放再多的流处理器会影响 ...

AMD把RDNA和CDNA分开也没用啊
发表于 2025-1-30 11:44 来自手机 | 显示全部楼层
gartour 发表于 2025-1-29 16:23
如果不是硬件研究方向,单从用户角度,没必要关心这个。只需要关心实际性能,价格,功耗。

只要6090能做到 ...

因为这种架构改进,才能在每晶体管价格不明显降低的现在,实现每元性能的有效提升。
发表于 2025-1-30 11:49 来自手机 | 显示全部楼层
zexis744 发表于 2025-1-30 00:35
貌似还开倒车改回pascal那种int32/fp32兼顾的设计了

从turing分离int32和fp32,到ampere/ada改回一半,到 ...

你就说架构改没改吧,我们已经很努力了,哈哈哈
发表于 2025-1-30 13:01 | 显示全部楼层
zexis744 发表于 2025-1-30 00:35
貌似还开倒车改回pascal那种int32/fp32兼顾的设计了

从turing分离int32和fp32,到ampere/ada改回一半,到 ...



1080TI 坏了,我活成版本真神
发表于 2025-1-30 15:13 | 显示全部楼层
zexis744 发表于 2025-1-30 00:35
貌似还开倒车改回pascal那种int32/fp32兼顾的设计了

从turing分离int32和fp32,到ampere/ada改回一半,到 ...

turing之前压根不开放int32性能

捕获.JPG
发表于 2025-1-30 15:18 | 显示全部楼层
稍微懂一点的都能算出50系有提升
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

Archiver|手机版|小黑屋|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806 上海市互联网违法与不良信息举报中心

GMT+8, 2025-4-23 03:32 , Processed in 0.010705 second(s), 6 queries , Gzip On, Redis On.

Powered by Discuz! X3.5 Licensed

© 2007-2024 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表