AMD: zen4的3d cache是这么用的，比zen3不知道高到哪里去了

T.JOHN · 发表于 2023-3-1 21:49

source: https://www.pcmag.com/reviews/amd-ryzen-9-7950x3d
我说苏妈你能不能别砍APU的L3？学学别人intel 5775c来个APUx3D版本，能耗比爆杀intel用在laptop上岂不美哉？
另外32EU的UHD770看起来也不错，MTL能不能给大家带来惊喜就看the king了，raja我看好你哟

DDK350 · 发表于 2023-3-1 21:53

真是苦笑不得！还算合格不？

可以抱的萝卜 · 发表于 2023-3-1 21:57

7700G，12 CU加3D V-Cache，这可太棒了

FelixIvory · 发表于 2023-3-1 22:07

这不zen4+的8940hs已经有着落了。

qiuhepeng · 发表于 2023-3-1 22:10

zen4的硬解如何

T.JOHN · 发表于 2023-3-1 22:14

本帖最后由 T.JOHN 于 2023-3-1 22:17 编辑

DDK350 发表于 2023-3-1 21:53
真是苦笑不得！还算合格不？

你们可能不知道只用2cu在f1 22暴打32eu是什么概念，我们一般人只会用六个字形容这种集显，“amd yes”。
我经常说一句，当年伦勃朗薄纱长者湖珠玉在前，如今凤凰薄纱迅龙湖也不是问题。
埋伏蓝厂一手，这个zen4不能加双cache，也不用加双cache，139ks死定了。
反手给他一个超级加倍24cu，闷声发大财，他也超级加倍192eu，但是不用怕，彗星湖赢不了我。zen5+rnda3，王炸，很牛逼的构架。如果能在apu上配上3d cache，那将是绝杀，可惜加不得。

darkness66201 · 发表于 2023-3-1 22:18

3dv cache看起来能耗比高是因为频率低了，但是更多的缓存同样会占功耗和面积，笔记本上与其给3dv cache，不如给核心，或者频率，又或者更多cu，甚至多给点续航，或者降价，都比给cache追求一点点游戏性能靠谱吧

DDK350 · 发表于 2023-3-1 22:18

T.JOHN 发表于 2023-3-1 22:14
你们可能不知道只用2cu在f1 22暴打32eu是什么概念，我们一般人只会用六个字形容这种集显，“amd yes”。
...

问题是解码功能呢？5700G解4K都很难说全格式流畅

T.JOHN · 发表于 2023-3-1 22:19

qiuhepeng 发表于 2023-3-1 22:10
zen4的硬解如何

残废，没法和蓝厂比，蓝厂绿厂红厂分别三个档次

T.JOHN · 发表于 2023-3-1 22:20

DDK350 发表于 2023-3-1 22:18
问题是解码功能呢？5700G解4K都很难说全格式流畅

论坛讨论过很多次了这个2cu就是rnda的解码器，那是远远无法满足chh用户需求的

aibo · 发表于 2023-3-1 22:21

从ppt进化成gif了

T.JOHN · 发表于 2023-3-1 22:26

darkness66201 发表于 2023-3-1 22:18
3dv cache看起来能耗比高是因为频率低了，但是更多的缓存同样会占功耗和面积，笔记本上与其给3dv cache，不 ...

面积没增大，否则哪能叫3d，因为没有用足面积，还需要导热假体填充平面。笔记本讲究甜点频率，性能受功耗限制，尤其轻薄本。有3d cache大幅提升游戏性能对用户是好的。就是成本不划算，毕竟酥麻不会单独开这种不赚钱的项目，7950x的3d cache只是epyc的泔水而已，立项最初目的是hpc乃至超算。

panzerlied · 发表于 2023-3-1 22:28

我点进来之前以为你要说Zen4增加了缓存的利用率这件事情。

T.JOHN · 发表于 2023-3-1 22:31

panzerlied 发表于 2023-3-1 22:28
我点进来之前以为你要说Zen4增加了缓存的利用率这件事情。

这种事情我一般得等phoronix的测试才知道哪些项目相比zen3有提高

darkness66201 · 发表于 2023-3-1 22:49

T.JOHN 发表于 2023-3-1 22:26
面积没增大，否则哪能叫3d，因为没有用足面积，还需要导热假体填充平面。笔记本讲究甜点频率，性能受功耗 ...

我说的面积是制造面积，不是平面面积，不管是2D还是3D，又不能无中生有

gihu · 发表于 2023-3-1 22:50

DDK350 发表于 2023-3-1 22:18
问题是解码功能呢？5700G解4K都很难说全格式流畅

5700G 的vega8 不支持av1解码，最高4K 60fps vp9解码，但有视频硬件插帧功能，去年看世界杯直播时用potplayer看24fps插帧到75fps感觉还是很爽的

inSeek · 发表于 2023-3-1 22:55

没理解，为啥CCD里的L3变大后能提升IOD里的RDNA2？

gihu · 发表于 2023-3-1 23:04

inSeek 发表于 2023-3-1 22:55
没理解，为啥CCD里的L3变大后能提升IOD里的RDNA2？

我猜有两点：
1.核显没有独立显存，使用主板上的内存延时大，带宽有限。而ccd里的L3虽然比不上gpu里的无限缓存，但还是走了基板上的infinity fabric总线，延时更低，而且游戏时cpu占用的带宽可能也不大，让给iod里的rdna用；
2.iGPU运行游戏时显卡和cpu的部分数据是共享的，不用再到内存里调用，直接在L3存取，效率在某些场景下会大大提升，但某些gpu和cpu共享数据少的游戏提升就比较有限。

inSeek · 发表于 2023-3-1 23:12

gihu 发表于 2023-3-1 23:04
我猜有两点：
1.核显没有独立显存，使用主板上的内存延时大，带宽有限。而ccd里的L3虽然比不上gpu里的无 ...

你说的第一点我不大认同，因为这就意味着GPU的访存路径是：
IOD iGPU <-> IF <-> CCD L3 <-> IF <-> IOD IMC <-> RAM
Intel这边的iGPU可以用L3是因为，iGPU挂在ringbug上，而L3也挂在ringbus上，也就是说iGPU和CPU核心，对于L3是同一层的...
如果AMD X3D的iGPU真如上面这样子访存，对缓存CCD是灾难...

还有一种可能是这缓存CCD的IF对于iGPU是后端总线。对就是K7年代那种东西。我觉得不大可能。因为这意味着整个Cache构架是黑科技上的黑科技...

你说的第2点是建立在第1点成立的基础上的，没确认真的这么黑科技前，不展开了-。-

gihu · 发表于 2023-3-1 23:23

inSeek 发表于 2023-3-1 23:12
你说的第一点我不大认同，因为这就意味着GPU的访存路径是：
IOD iGPU IF CCD L3 IF IOD IMC RAM
Int ...

有没有可能没有3D cache的7950x的rdna2也是走的你说这个路径: "IOD iGPU <-> IF <-> CCD L3 <-> IF <-> IOD IMC <-> RAM"，只是因为3Dcache的存在，这个cache翻了3倍，所以性能提升了，就这么简单。

inSeek · 发表于 2023-3-1 23:33

gihu 发表于 2023-3-1 23:23
有没有可能没有3D cache的7950x的rdna2也是走的你说这个路径: "IOD iGPU IF CCD L3 IF IOD IMC RAM" ...

没可能啊，你没想过这么走的话，CCD L3 Cache <-> IF <-> iGPU间的带宽才多少？
占满不给CCD留一丝的情况下，也就70-80GB/s吧？实际得有QoS，不然CPU直接裂开。这个时候给iGPU的可能就一半。
这就除了延迟低点外，还没直接访存带宽高啊。
而对于GPU，那点延迟差别没那么重要啊。

而且CCD有两颗，iGPU到底走其中一颗，还是走俩？
只走一颗，那被走的那颗CPU性能明显裂开？
同时，CCD的L3还能被iGPU读写。这cache的协议得多复杂？

Hesperus · 发表于 2023-3-1 23:48

可以把3缓考虑再做大点然后移到ccd外和iodie一样单独封装…… 那不就是HBM显存嘛

AxIaTErN · 发表于 2023-3-1 23:51

这么看ps5 pro如果上3dv cache，性能可以爆炸了

darkness66201 · 发表于 2023-3-1 23:54

inSeek 发表于 2023-3-1 23:12
你说的第一点我不大认同，因为这就意味着GPU的访存路径是：
IOD iGPU IF CCD L3 IF IOD IMC RAM
Int ...

为什么我感觉只是单纯的增大了L3之后，大幅度减少了cpu对内存带宽的占用，使得gpu可用带宽大幅度上升而已……

inSeek · 发表于 2023-3-1 23:57

darkness66201 发表于 2023-3-1 23:54
为什么我感觉只是单纯的增大了L3之后，大幅度减少了cpu对内存带宽的占用，使得gpu可用带宽大幅度上升而已 ...

你可以打开HWINFO看玩游戏的时候IMC的读写流量...一般就个位数Gbps...-。-

LambdaDelta · 发表于 2023-3-2 00:01

T.JOHN 发表于 2023-3-1 22:14
你们可能不知道只用2cu在f1 22暴打32eu是什么概念，我们一般人只会用六个字形容这种集显，“amd yes”。
...

别，都按CU算，intel这也就两个CU而已

gihu · 发表于 2023-3-2 00:02

darkness66201 发表于 2023-3-1 23:54
为什么我感觉只是单纯的增大了L3之后，大幅度减少了cpu对内存带宽的占用，使得gpu可用带宽大幅度上升而已 ...

还真有可能是这个原因，如果是这样的话，那些对独显游戏性能进行的测试中，是否强制关闭核显也会很大的影响独显的最终测试结果

HZJ · 发表于 2023-3-2 00:04

这提升倍数说明了即使是2CU，内存带宽（也就是核显显存带宽）也是瓶颈？
就像24楼说的，3DV大幅度减少了cpu对内存带宽的占用，使得gpu可用带宽大幅度上升。
所以，以前常说现在的核显太弱，提升内存带宽并不能带来多少提升的观点可能是错误的？如果上面的猜测是正确的话。

inSeek · 发表于 2023-3-2 00:10

HZJ 发表于 2023-3-2 00:04
这提升倍数说明了即使是2CU，内存带宽（也就是核显显存带宽）也是瓶颈？
就像24楼说的，3DV大幅度减少了cpu ...

不可能啊。都有现成的工具看玩游戏时CPU IMC的吞吐量的啊，绝对不高的啊。
而且你想，要是2CU需要80GB/s带宽的话，80CU的6900岂不是要6.4TB/s才够？而6900算上无限缓存提供的带宽，我记得就2TB/s+

LambdaDelta · 发表于 2023-3-2 00:16

inSeek 发表于 2023-3-2 00:10
不可能啊。都有现成的工具看玩游戏时CPU IMC的吞吐量的啊，绝对不高的啊。
而且你想，要是2CU需要80GB/s ...

读写带宽和请求数量不能划等号

账号		自动登录	找回密码
密码			加入我们

[CPU] AMD: zen4的3d cache是这么用的，比zen3不知道高到哪里去了

点评

评分