gihu 发表于 2025-3-4 18:37

LOLI反应堆 发表于 2025-3-4 18:24
他的意思是7000系虽然有双份的FP32理论值,但实际效率不高。在结果里就像超线程和物理核心之间的差距。 ...

我理解你说的效率不高,是指rdna3的理论浮点性能没能体现到显卡的光栅性能上。或者说实际光栅性能被其他架构浮点性能相近的gpu吊打,但这和浮点性能无关啊。
能最简单测试gpu/cpu单双精度浮点能力的就是aida64的gpgpu了,测一下就知道了。
举另外一个不太恰当的例子,zen5的单双精度浮点,用gpgpu测试,8核的9700x和24核的14900k旗鼓相当,也不比285K差太多。但大多数依赖浮点运算渲染测试,9700x根本无法跟两款牙膏旗舰对比,其实也是类似的道理。

路西法大大 发表于 2025-3-4 19:17

本帖最后由 路西法大大 于 2025-3-4 19:23 编辑

gihu 发表于 2025-3-4 17:55
你还是搞混了光栅性能和浮点性能,RDNA4对于3的改进,并不在于浮点双泵,我丢给你两张参数表,你对比一下 ...

7000系列那浮点理论值是虚的,实际作用很小。一般HT的效率大约能增加30%不到的算力而30%浮点算力的增加大约只能提升10%左右的图形性能换算到游戏帧数更低。更何况还有很大一部分游戏就根本实现不了这个浮点超线程等于是0提升,而这次9000系的物理浮点单元X2那可就是实打实的所有游戏都能享受的到这个翻倍的浮点性能,这换算到游戏上是真的会有30%的性能增幅跟30系的情况是一样的。

gihu 发表于 2025-3-4 19:33

路西法大大 发表于 2025-3-4 19:17
7000系列那浮点理论值是虚的,实际作用很小。一般HT的效率大约能增加30%不到的算力而30%浮点算力的增加大 ...

理论值虚不虚,跑一下测试就知道了

路西法大大 发表于 2025-3-4 19:48

gihu 发表于 2025-3-4 19:33
理论值虚不虚,跑一下测试就知道了

测出来的理论浮点也许会高一些但是游戏基本调用不到发挥不出来又有啥用呢?这次9000系列的IPC就是比7000系列高了40%,这里面除了更高的主频外剩下就是这个类似于30系的设计起的作用。

gihu 发表于 2025-3-4 20:12

路西法大大 发表于 2025-3-4 19:48
测出来的理论浮点也许会高一些但是游戏基本调用不到发挥不出来又有啥用呢?这次9000系列的IPC就是比7000 ...

是啊,但这和你说的到了RDNA4才支持浮点双泵是两回事啊,人家RX7000只是优化不好,不等于不支持啊。

冷水鱼 发表于 2025-3-4 21:00

tator 发表于 2025-3-4 06:34
猜猜
FSE
TS


对了三个,错了两个

冷水鱼 发表于 2025-3-4 21:01

◥█◣神◢█◤ 发表于 2025-3-4 17:58
2077
天国拯救者2
有试过吗?~~

2077特效全开,4k分辨率大概3,40帧吧。。

路西法大大 发表于 2025-3-4 21:10

gihu 发表于 2025-3-4 20:12
是啊,但这和你说的到了RDNA4才支持浮点双泵是两回事啊,人家RX7000只是优化不好,不等于不支持啊。 ...

但我一开始说的就是双倍的浮点计算单元啊,上一代是硬件上只有一个浮点计算单元但是设计上能同时运作两条运算指令也就是类似于CPU上超线程的方式结果不出意外的失败了。也就是说AMD一开始是想用超线程的方式来取巧达到既省晶体管又产生较高效能但是最终证明行不通,最终还是只能走回去30系的路子多花了不少的晶体管来容纳额外的一个浮点计算单元导致核心在看似规格不高的情况下最终的核心面积晶体管等仍然是比较庞大的。

DDK350 发表于 2025-3-4 21:14

弄出来了吗[偷笑]多吗

◥█◣神◢█◤ 发表于 2025-3-4 21:44

冷水鱼 发表于 2025-3-4 21:01
2077特效全开,4k分辨率大概3,40帧吧。。

您感觉比6900XT强多少?我是3440*14402。5K

冷水鱼 发表于 2025-3-4 21:49

◥█◣神◢█◤ 发表于 2025-3-4 21:44
您感觉比6900XT强多少?我是3440*14402。5K

我没6900xt啊。。所以不晓得哦

gihu 发表于 2025-3-4 21:53

路西法大大 发表于 2025-3-4 21:10
但我一开始说的就是双倍的浮点计算单元啊,上一代是硬件上只有一个浮点计算单元但是设计上能同时运作两条 ...

你可能对超线程有什么误解,超线程可不能让浮点性能翻倍,只能让一些无法充分利用计算资源的应用多线程运算时减少处理器的等待时间。
RDNA3已经可以让整数计算单元同时兼做浮点计算,这点RDNA4并没有不同。只是AMD在计算shader的时候,只算浮点单元,而Nvidia是两种单元都算。所以会出现类似规格的显卡,N的cuda核心是A的stream processors的两倍。

路西法大大 发表于 2025-3-4 22:16

gihu 发表于 2025-3-4 21:53
你可能对超线程有什么误解,超线程可不能让浮点性能翻倍,只能让一些无法充分利用计算资源的应用多线程运 ...

RDNA3的架构图用的是dual issue simd units,也就是双发射simd单元

RDNA4的架构图用的是dueal simd vector units,也就是双simd计算单元

具体的细节差别你细品。

風吹花影動 发表于 2025-3-4 22:34

哟, 冷水鱼你这厮还活着啊,从小蔡接手雄狮国际店就没见过你了
页: 1 2 [3]
查看完整版本: 弄弄……