找回密码
 加入我们
搜索
      
查看: 14696|回复: 43

[CPU] AMD: zen4的3d cache是这么用的,比zen3不知道高到哪里去了

[复制链接]
发表于 2023-3-1 21:49 | 显示全部楼层 |阅读模式
source: https://www.pcmag.com/reviews/amd-ryzen-9-7950x3d
我说苏妈你能不能别砍APU的L3?学学别人intel 5775c来个APUx3D版本,能耗比爆杀intel用在laptop上岂不美哉?
另外32EU的UHD770看起来也不错,MTL能不能给大家带来惊喜就看the king了,raja我看好你哟
发表于 2023-3-1 21:53 | 显示全部楼层
真是苦笑不得!还算合格不?
发表于 2023-3-1 21:57 | 显示全部楼层
7700G,12 CU加3D V-Cache,这可太棒了
发表于 2023-3-1 22:07 来自手机 | 显示全部楼层
这不zen4+的8940hs已经有着落了。
发表于 2023-3-1 22:10 来自手机 | 显示全部楼层
zen4的硬解如何
 楼主| 发表于 2023-3-1 22:14 来自手机 | 显示全部楼层
本帖最后由 T.JOHN 于 2023-3-1 22:17 编辑
DDK350 发表于 2023-3-1 21:53
真是苦笑不得!还算合格不?


你们可能不知道只用2cu在f1 22暴打32eu是什么概念,我们一般人只会用六个字形容这种集显,“amd yes”。
我经常说一句,当年伦勃朗薄纱长者湖珠玉在前,如今凤凰薄纱迅龙湖也不是问题。
埋伏蓝厂一手,这个zen4不能加双cache,也不用加双cache,139ks死定了。
反手给他一个超级加倍24cu,闷声发大财,他也超级加倍192eu,但是不用怕,彗星湖赢不了我。zen5+rnda3,王炸,很牛逼的构架。如果能在apu上配上3d cache,那将是绝杀,可惜加不得。

点评

从现在开始这里就叫amd广场  发表于 2023-3-1 23:02

评分

参与人数 1邪恶指数 +10 收起 理由
银月 + 10 就是NB

查看全部评分

发表于 2023-3-1 22:18 | 显示全部楼层
3dv cache看起来能耗比高是因为频率低了,但是更多的缓存同样会占功耗和面积,笔记本上与其给3dv cache,不如给核心,或者频率,又或者更多cu,甚至多给点续航,或者降价,都比给cache追求一点点游戏性能靠谱吧
发表于 2023-3-1 22:18 | 显示全部楼层
T.JOHN 发表于 2023-3-1 22:14
你们可能不知道只用2cu在f1 22暴打32eu是什么概念,我们一般人只会用六个字形容这种集显,“amd yes”。
...

问题是解码功能呢?5700G解4K都很难说全格式流畅
 楼主| 发表于 2023-3-1 22:19 来自手机 | 显示全部楼层
qiuhepeng 发表于 2023-3-1 22:10
zen4的硬解如何

残废,没法和蓝厂比,蓝厂 绿厂 红厂分别三个档次
 楼主| 发表于 2023-3-1 22:20 来自手机 | 显示全部楼层
DDK350 发表于 2023-3-1 22:18
问题是解码功能呢?5700G解4K都很难说全格式流畅

论坛讨论过很多次了这个2cu就是rnda的解码器,那是远远无法满足chh用户需求的
发表于 2023-3-1 22:21 | 显示全部楼层
从ppt进化成gif了
 楼主| 发表于 2023-3-1 22:26 来自手机 | 显示全部楼层
darkness66201 发表于 2023-3-1 22:18
3dv cache看起来能耗比高是因为频率低了,但是更多的缓存同样会占功耗和面积,笔记本上与其给3dv cache,不 ...

面积没增大,否则哪能叫3d,因为没有用足面积,还需要导热假体填充平面。笔记本讲究甜点频率,性能受功耗限制,尤其轻薄本。有3d cache大幅提升游戏性能对用户是好的。就是成本不划算,毕竟酥麻不会单独开这种不赚钱的项目,7950x的3d cache只是epyc的泔水而已,立项最初目的是hpc乃至超算。
发表于 2023-3-1 22:28 | 显示全部楼层
我点进来之前以为你要说Zen4增加了缓存的利用率这件事情。
 楼主| 发表于 2023-3-1 22:31 来自手机 | 显示全部楼层
panzerlied 发表于 2023-3-1 22:28
我点进来之前以为你要说Zen4增加了缓存的利用率这件事情。

这种事情我一般得等phoronix的测试才知道哪些项目相比zen3有提高
发表于 2023-3-1 22:49 来自手机 | 显示全部楼层
T.JOHN 发表于 2023-3-1 22:26
面积没增大,否则哪能叫3d,因为没有用足面积,还需要导热假体填充平面。笔记本讲究甜点频率,性能受功耗 ...

我说的面积是制造面积,不是平面面积,不管是2D还是3D,又不能无中生有
发表于 2023-3-1 22:50 | 显示全部楼层
DDK350 发表于 2023-3-1 22:18
问题是解码功能呢?5700G解4K都很难说全格式流畅

5700G 的vega8 不支持av1解码,最高4K 60fps vp9解码,但有视频硬件插帧功能,去年看世界杯直播时用potplayer看24fps插帧到75fps感觉还是很爽的
发表于 2023-3-1 22:55 | 显示全部楼层
没理解,为啥CCD里的L3变大后能提升IOD里的RDNA2?
发表于 2023-3-1 23:04 | 显示全部楼层
inSeek 发表于 2023-3-1 22:55
没理解,为啥CCD里的L3变大后能提升IOD里的RDNA2?

我猜有两点:
1.核显没有独立显存,使用主板上的内存延时大,带宽有限。而ccd里的L3虽然比不上gpu里的无限缓存,但还是走了基板上的infinity fabric总线,延时更低,而且游戏时cpu占用的带宽可能也不大,让给iod里的rdna用;
2.iGPU运行游戏时显卡和cpu的部分数据是共享的,不用再到内存里调用,直接在L3存取,效率在某些场景下会大大提升,但某些gpu和cpu共享数据少的游戏提升就比较有限。
发表于 2023-3-1 23:12 | 显示全部楼层
gihu 发表于 2023-3-1 23:04
我猜有两点:
1.核显没有独立显存,使用主板上的内存延时大,带宽有限。而ccd里的L3虽然比不上gpu里的无 ...

你说的第一点我不大认同,因为这就意味着GPU的访存路径是:
IOD iGPU <-> IF <-> CCD L3 <-> IF <-> IOD IMC <-> RAM
Intel这边的iGPU可以用L3是因为,iGPU挂在ringbug上,而L3也挂在ringbus上,也就是说iGPU和CPU核心,对于L3是同一层的...
如果AMD X3D的iGPU真如上面这样子访存,对缓存CCD是灾难...

还有一种可能是这缓存CCD的IF对于iGPU是后端总线。对就是K7年代那种东西。我觉得不大可能。因为这意味着整个Cache构架是黑科技上的黑科技...

你说的第2点是建立在第1点成立的基础上的,没确认真的这么黑科技前,不展开了-。-
发表于 2023-3-1 23:23 | 显示全部楼层
inSeek 发表于 2023-3-1 23:12
你说的第一点我不大认同,因为这就意味着GPU的访存路径是:
IOD iGPU  IF  CCD L3  IF  IOD IMC  RAM
Int ...

有没有可能没有3D cache的7950x的rdna2也是走的你说这个路径: "IOD iGPU <-> IF <-> CCD L3 <-> IF <-> IOD IMC <-> RAM", 只是因为3Dcache的存在,这个cache翻了3倍,所以性能提升了,就这么简单。
发表于 2023-3-1 23:33 | 显示全部楼层
gihu 发表于 2023-3-1 23:23
有没有可能没有3D cache的7950x的rdna2也是走的你说这个路径: "IOD iGPU  IF  CCD L3  IF  IOD IMC  RAM" ...

没可能啊,你没想过这么走的话,CCD L3 Cache <-> IF <-> iGPU间的带宽才多少?
占满不给CCD留一丝的情况下,也就70-80GB/s吧?实际得有QoS,不然CPU直接裂开。这个时候给iGPU的可能就一半。
这就除了延迟低点外,还没直接访存带宽高啊。
而对于GPU,那点延迟差别没那么重要啊。

而且CCD有两颗,iGPU到底走其中一颗,还是走俩?
只走一颗,那被走的那颗CPU性能明显裂开?
同时,CCD的L3还能被iGPU读写。这cache的协议得多复杂?
发表于 2023-3-1 23:48 | 显示全部楼层
可以把3缓考虑再做大点 然后移到ccd外和iodie一样单独封装…… 那不就是HBM显存嘛
发表于 2023-3-1 23:51 | 显示全部楼层
这么看ps5 pro如果上3dv cache,性能可以爆炸了
发表于 2023-3-1 23:54 来自手机 | 显示全部楼层
inSeek 发表于 2023-3-1 23:12
你说的第一点我不大认同,因为这就意味着GPU的访存路径是:
IOD iGPU  IF  CCD L3  IF  IOD IMC  RAM
Int ...

为什么我感觉只是单纯的增大了L3之后,大幅度减少了cpu对内存带宽的占用,使得gpu可用带宽大幅度上升而已……
发表于 2023-3-1 23:57 | 显示全部楼层
darkness66201 发表于 2023-3-1 23:54
为什么我感觉只是单纯的增大了L3之后,大幅度减少了cpu对内存带宽的占用,使得gpu可用带宽大幅度上升而已 ...

你可以打开HWINFO看玩游戏的时候IMC的读写流量...一般就个位数Gbps...-。-
发表于 2023-3-2 00:01 | 显示全部楼层
T.JOHN 发表于 2023-3-1 22:14
你们可能不知道只用2cu在f1 22暴打32eu是什么概念,我们一般人只会用六个字形容这种集显,“amd yes”。
...

别,都按CU算,intel这也就两个CU而已
发表于 2023-3-2 00:02 | 显示全部楼层
darkness66201 发表于 2023-3-1 23:54
为什么我感觉只是单纯的增大了L3之后,大幅度减少了cpu对内存带宽的占用,使得gpu可用带宽大幅度上升而已 ...

还真有可能是这个原因,如果是这样的话,那些对独显游戏性能进行的测试中,是否强制关闭核显也会很大的影响独显的最终测试结果
发表于 2023-3-2 00:04 | 显示全部楼层
这提升倍数说明了即使是2CU,内存带宽(也就是核显显存带宽)也是瓶颈?
就像24楼说的,3DV大幅度减少了cpu对内存带宽的占用,使得gpu可用带宽大幅度上升。
所以,以前常说现在的核显太弱,提升内存带宽并不能带来多少提升的观点可能是错误的?如果上面的猜测是正确的话。
发表于 2023-3-2 00:10 | 显示全部楼层
HZJ 发表于 2023-3-2 00:04
这提升倍数说明了即使是2CU,内存带宽(也就是核显显存带宽)也是瓶颈?
就像24楼说的,3DV大幅度减少了cpu ...

不可能啊。都有现成的工具看玩游戏时CPU IMC的吞吐量的啊,绝对不高的啊。
而且你想,要是2CU需要80GB/s带宽的话,80CU的6900岂不是要6.4TB/s才够?而6900算上无限缓存提供的带宽,我记得就2TB/s+
发表于 2023-3-2 00:16 | 显示全部楼层
inSeek 发表于 2023-3-2 00:10
不可能啊。都有现成的工具看玩游戏时CPU IMC的吞吐量的啊,绝对不高的啊。
而且你想,要是2CU需要80GB/s ...

读写带宽和请求数量不能划等号
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

Archiver|手机版|小黑屋|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806 上海市互联网违法与不良信息举报中心

GMT+8, 2025-2-1 03:52 , Processed in 0.014562 second(s), 6 queries , Gzip On, Redis On.

Powered by Discuz! X3.5 Licensed

© 2007-2024 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表