mnak888 发表于 2024-9-19 22:44

锐龙9000执行AVX-512时频率会下降10%, 在旧Intel处理器上通常会大幅降频


AMD自上代Zen 4开始支持AVX-512指令集,但那是使用256位SIMD用两个时钟周期来执行AVX-512指令的,而Zen 5则可提供完整的512位数据位宽,根据我们首发测试,锐龙9 9950X的AVX-512计算性能几乎是锐龙9 7950X的两倍。当然了AVX-512指令在日常的应用范围偏窄,但它确实可以显著提高多种工作负载的性能,但在以往的认知中,调用AVX-512指令会让CPU功耗大增并让工作频率下降。



根据InstLatX64的测试,采用Zen 5架构的AMD锐龙9000系列处理器在AVX-512负载中并不会出现频率大幅度下降和功率大增的情况,锐龙9 9950X在使用AVX-512负载时,CPU主频会从5700MHz降低至5300MHz,大概降低了10%,而在Intel旧的Skylake-X上使用AVX-512通常会导致频率大幅下降,当然这情况在Rocket Lake以及Ice Lake之后的处理器上就不在出现了,甚至在12代酷睿之后的消费级产品AVX-512甚至都没了。



AMD Zen 5架构处理器有四个用于AVX-512的全宽512位执行单元,而旧的Zen 4架构则使用两个AVX-256单元来执行512位指令,这使得Zen 5执行这类指令非常高效,但这设计确实增大了芯片面积。此外,款数据路径本身就很耗电,因此锐龙9000处理器在执行AVX-512指令时会消耗多多少电还有待观察。

对于高性能台式机、工作站和服务器通常用于处理器来自AI和HPC领域的各种矢量工作负载,因此AMD设计用于台式机和服务器的Zen 5架构时,完整的AVX-512算力非常重要,但对于移动处理器来说就不是这样了,tomshardware表示用与移动处理器的Strix Point其实和Zen 4一样用两个AVX-256单元来执行AVX-512指令。

虽然同是Zen 5架构但使用两种不同的方法实现AVX-512可能会让开发者和用户感到困惑,但AMD通过这样的设计让Strix Point核心变得更加紧凑,从而可塞下更多的核心,而更多的核心可为用户带来更高的AVX-512性能。

新闻来源 https://www.expreview.com/95914.html

赫敏 发表于 2024-9-19 23:32

这个东西越来越没用了

rico19375 发表于 2024-9-20 07:54

感觉这个指令集是牙膏厂当年想取代计算卡用的,结果不但没取代成功,反而差距越来越大,然后AMD还给捡起来了。。。

gg20073659 发表于 2024-9-20 08:18

赫敏 发表于 2024-9-19 23:32
这个东西越来越没用了

Intel有:万岁!消费级也要给我加进来
amd有:这个东西越来越没用了
[生病]

gg20073659 发表于 2024-9-20 08:19

rico19375 发表于 2024-9-20 07:54
感觉这个指令集是牙膏厂当年想取代计算卡用的,结果不但没取代成功,反而差距越来越大,然后AMD还给捡起来 ...

我记得几年前坛子里一堆叫嚣要AVX512的,美其名曰我可以不用但一定要有

赫敏 发表于 2024-9-20 08:27

本帖最后由 赫敏 于 2024-9-19 19:30 编辑

gg20073659 发表于 2024-9-19 19:18
Intel有:万岁!消费级也要给我加进来
amd有:这个东西越来越没用了

光一个avx512确实用处不大,要做到amx才香起来。zen5纯过渡。而且以后直接跳过avx512搞amx专用执行单元也是可能的
https://openbenchmarking.org/embed.php?i=2301158-NE-ONEDNN30I77&sha=89d5ced4419e&p=2

aibo 发表于 2024-9-20 09:02

赫敏 发表于 2024-9-20 08:27
光一个avx512确实用处不大,要做到amx才香起来。zen5纯过渡。而且以后直接跳过avx512搞amx专用执行单元也 ...

这玩意儿,小的玩玩还没问题
大一点的就要丢给gpu了

况且现在的内存带宽都已经满足不了avx512

tim6252 发表于 2024-9-20 10:02

其实两者实现的AVX512完全不同,AMD只以极小的硬件单元就做到了不需要大幅影响正常单元计算能力实现AVX512。
至于AVX512有没有用,当然有用,首先不用大幅降频的AVX512就更高效,然后是很多老游戏模拟器要用这个的,最后其实也是最关键的(当然对于不玩模拟器游戏用户没用),就是很多渲染器里的算法是可以利用AVX512提升精度或者效率的

用户 发表于 2024-9-20 10:07

aibo 发表于 2024-9-20 09:02
这玩意儿,小的玩玩还没问题
大一点的就要丢给gpu了



双路granite rapids的mlperf,看着依旧只有两块B100的十分之一,仍没有摆脱cpu是十分之一gpu的宿命。

frakristy 发表于 2024-9-20 12:10

gg20073659 发表于 2024-9-20 08:19
我记得几年前坛子里一堆叫嚣要AVX512的,美其名曰我可以不用但一定要有

你没记错,确实有一批人

gg20073659 发表于 2024-9-20 12:58

tim6252 发表于 2024-9-20 10:02
其实两者实现的AVX512完全不同,AMD只以极小的硬件单元就做到了不需要大幅影响正常单元计算能力实现AVX512 ...

当时坛子里好多叫嚣AVX512就是为了压片子,做渲染

tim6252 发表于 2024-9-20 13:28

gg20073659 发表于 2024-9-20 12:58
当时坛子里好多叫嚣AVX512就是为了压片子,做渲染

做CG行业的才多少人, 对于普通玩家来说最实际的也就是那些游戏模拟器了 比如PS3模拟器

imluvian 发表于 2024-9-20 17:18

不是说这个是玩PS3模拟器专用么

aasa0001 发表于 2024-9-20 21:16

我一会不理解为什么IA都是采取全核降频,而不是分频或者插空avx512、维护核心频率。

yan1990_y 发表于 2024-9-23 14:31

tim6252 发表于 2024-9-20 13:28
做CG行业的才多少人, 对于普通玩家来说最实际的也就是那些游戏模拟器了 比如PS3模拟器...

我就是喜欢玩ps3模拟器才入的9700x…

tim6252 发表于 2024-9-23 17:59

yan1990_y 发表于 2024-9-23 14:31
我就是喜欢玩ps3模拟器才入的9700x…

嗯,根据自己核心需求购买产品才不会出问题
页: [1]
查看完整版本: 锐龙9000执行AVX-512时频率会下降10%, 在旧Intel处理器上通常会大幅降频