找回密码
 加入我们
搜索
      
楼主: atles

[显卡] 话说RDNA3翻倍浮点到底是给谁用的啊

[复制链接]
 楼主| 发表于 2023-1-8 22:23 | 显示全部楼层
灵乌路空 发表于 2023-1-8 12:44
我之前回复过一个人的:

你这没有解答我的疑惑啊,他浮点单元翻倍了,但是如果6900xt规模X1.2的同时频率x1.2,性能应该和7900xtx一致,7900xtx的游戏性能也确实和它顶点渲染性能以及三角形渲染性能一致。那么翻倍的浮点单元对游戏和渲染的贡献在哪里。
发表于 2023-1-8 23:07 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
发表于 2023-1-8 23:21 | 显示全部楼层
发表于 2023-1-9 01:00 | 显示全部楼层
atles 发表于 2023-1-8 22:23
你这没有解答我的疑惑啊,他浮点单元翻倍了,但是如果6900xt规模X1.2的同时频率x1.2,性能应该和7900xtx ...

不是写了加强光追了吗
发表于 2023-1-9 01:26 来自手机 | 显示全部楼层
NV这么做是因为cuda。amd没cuda还在这搞计算卡gpu,不太理解
发表于 2023-1-9 09:02 | 显示全部楼层
panzerlied 发表于 2023-1-8 11:46
和30系结构一样的,差距在于寄存器

所以综合来看,RDNA3的浮点性能提升实际体现到游戏上,最多只能打个对折?
再考虑到移动平台的性能/散热限制,还得继续打个折?
发表于 2023-1-9 23:29 | 显示全部楼层
lyent2010 发表于 2023-1-7 22:36
30系是跑INT的也能跑FP32了。而且考虑到游戏INT和FP32的比例。
不是基本上30系流处理器/2是原来同规格流 ...

规格提升20%,频率20%最终性能40%。说不定浮点翻倍才有现在这个线性提升的结果,毕竟同架构的7900xt到xtx规格提升25%频率提升5%性能才提升10%
发表于 2023-1-9 23:30 | 显示全部楼层
chp1979 发表于 2023-1-7 23:01
安培离线渲染强啊,RDNA3呢

RDNA3啥都没有,跟Vega一样塞了一堆看起来最终被放弃的东西
发表于 2023-1-9 23:31 | 显示全部楼层
lyent2010 发表于 2023-1-7 23:44
那不是7000APU里塞的么?
GPU好像没宣布吧?

是没说,这不在猜这些电阻丝到底是什么东西嘛
发表于 2023-1-9 23:46 | 显示全部楼层
本帖最后由 疾风之心 于 2023-1-9 23:48 编辑
用户 发表于 2023-1-9 01:26
NV这么做是因为cuda。amd没cuda还在这搞计算卡gpu,不太理解


amr都搞计算芯片,也没依赖cuda。并不是所有的计算类应用都需要cuda
发表于 2023-1-10 00:55 | 显示全部楼层
lyent2010 发表于 2023-1-8 12:44
那不是7000APU里塞的么?
GPU好像没宣布吧?

NAVI31 7900发布时就提到了GPU内置的AI单元。但是那会因为完全没应用,所以几乎没提。
我猜FSR3可能要上AI upscaling
发表于 2023-1-10 09:18 | 显示全部楼层
sfh0525 发表于 2023-1-10 00:55
NAVI31 7900发布时就提到了GPU内置的AI单元。但是那会因为完全没应用,所以几乎没提。
我猜FSR3可能要上A ...

唔,估计是.
NAVI31这波反正就很奇怪.
发表于 2023-1-10 09:59 | 显示全部楼层
sfh0525 发表于 2023-1-10 00:55
NAVI31 7900发布时就提到了GPU内置的AI单元。但是那会因为完全没应用,所以几乎没提。
我猜FSR3可能要上A ...

但是,用FP32去跑ai。对比隔壁tensor跑。
难道没有刺刀耕地的感觉吗。。。
发表于 2024-12-24 10:52 | 显示全部楼层
这玩意吧,计算精度属于黑盒吧,光看规模有点不实际。
比如0.996666*0.996666可能区别不大,但0.996666*0.996666*0.996666*0.996666*0.996666*0.996666可能会做骚操作来优化。到时候,虽然快了,可能画质不如从前了。
皮克斯就更喜欢用几千个CPU来做渲染,而不用gpu
发表于 2024-12-24 11:19 | 显示全部楼层
NVidia GPU虽然擅长浮点运算,但并不严格遵守IEEE-754标准,这可能会导致与CPU计算相比的查准率/准确率差异。这种偏差在要求高数值准确率的领域尤其显著,如科学计算和财务分析。GPU架构针对速度进行了优化,导致了查准率/准确率可能会被牺牲的权衡。
对于准确率不可协商的应用程序,开发人员应考虑基于CPU的计算或提供更高查准率/准确率算法的专用库。NVidia的舍入误差虽然是标度不变的,但可以通过计算工作流程放大,这使得严格的误差分析和选择适当的数值格式或查准率/准确率水平至关重要。
在利用NVidia GPU时,了解和缓解这些查准率/准确率权衡至关重要。开发人员必须平衡GPU的计算能力和应用程序的数字需求,确保结果不会受到硬件限制的影响。

https://news.miracleplus.com/share_link/27300
发表于 2024-12-24 11:32 | 显示全部楼层
本帖最后由 zhuifeng88 于 2024-12-24 11:37 编辑
archxm 发表于 2024-12-24 11:19
NVidia GPU虽然擅长浮点运算,但并不严格遵守IEEE-754标准,这可能会导致与CPU计算相比的查准率/准确率差异 ...


只能说少看点10年以上的旧闻....nvidia kepler开始就支持严格的ieee754浮点

至于说计算精度黑盒...? 又不是拿不到计算结果, 能直接比对怎么就计算精度黑盒了
发表于 2024-12-24 11:55 来自手机 | 显示全部楼层
zhuifeng88 发表于 2024-12-24 11:32
只能说少看点10年以上的旧闻....nvidia kepler开始就支持严格的ieee754浮点

至于说计算精度黑盒...? 又 ...

我感觉 30 系确实好多了。
这文章好像就前两年的
发表于 2024-12-24 12:43 | 显示全部楼层
竟然是坟贴。。。糟糕
发表于 2024-12-25 10:26 | 显示全部楼层
本帖最后由 archxm 于 2024-12-25 10:35 编辑
zhuifeng88 发表于 2024-12-24 11:32
只能说少看点10年以上的旧闻....nvidia kepler开始就支持严格的ieee754浮点

至于说计算精度黑盒...? 又 ...


那是不是说10年前,也就是2014年,n卡确实因为浮点准确度不行,导致发灰发绿呢?因为准确度随意一些,故可以更快,帧率更高。
而a卡则一板一眼。而且,那个时候也只有a 能挖那啥。
但是据说titan还可以做计算卡。

nga 用户,还是更愿意分享一些:https://ngabbs.com/read.php?pid=711989441&opt=128
发表于 2024-12-25 10:39 | 显示全部楼层
zhuifeng88 发表于 2024-12-24 11:32
只能说少看点10年以上的旧闻....nvidia kepler开始就支持严格的ieee754浮点

至于说计算精度黑盒...? 又 ...

从相机的有损raw压缩和无损,视频的压缩(vmaf 96和98)看
不管是静态图片还是视频
这些浮点的计算精度误差完全是肉眼不可见的。

发表于 2024-12-25 10:44 | 显示全部楼层
aibo 发表于 2024-12-25 10:39
从相机的有损raw压缩和无损,视频的压缩(vmaf 96和98)看
不管是静态图片还是视频
这些浮点的计算精度误 ...

其实这些,一眼不可见,两眼一样分不出区别,三眼四眼也不行。
但看的多了,偶尔更换一块显卡,就仿佛发现了新世界。
发表于 2024-12-25 10:48 | 显示全部楼层
本帖最后由 zhuifeng88 于 2024-12-25 10:59 编辑
aibo 发表于 2024-12-25 10:39
从相机的有损raw压缩和无损,视频的压缩(vmaf 96和98)看
不管是静态图片还是视频
这些浮点的计算精度误 ...


视频压缩不是通用计算单元做的, 而且也不是浮点处理的, 质量差异单纯是各家实现的子集和配置不一样的区别, 理解成类似软编参数不同的区别就行

结果比对说的是精确的数值比对, 这点在GPU通用计算普及之后各家就很重视了, 和肉眼可见没什么关系
发表于 2024-12-25 10:50 | 显示全部楼层
本帖最后由 zhuifeng88 于 2024-12-25 10:57 编辑
archxm 发表于 2024-12-25 10:26
那是不是说10年前,也就是2014年,n卡确实因为浮点准确度不行,导致发灰发绿呢?因为准确度随意一些,故 ...


这个无关, 非标浮点误差主要是末位舍入问题, 就算是累计误差也不可能体现在最终整体颜色上, 你没有24bit色深的显示器(有也看不出来), 更何况10bit都不普及
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

Archiver|手机版|小黑屋|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806 上海市互联网违法与不良信息举报中心

GMT+8, 2025-4-19 08:48 , Processed in 0.012954 second(s), 5 queries , Gzip On, Redis On.

Powered by Discuz! X3.5 Licensed

© 2007-2024 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表