找回密码
 加入我们
搜索
      
查看: 26899|回复: 55

[CPU] 一张图讨论一下所谓的“CPU瓶颈”

[复制链接]
发表于 2022-12-6 10:33 | 显示全部楼层 |阅读模式
本帖最后由 shawnwinton 于 2022-12-6 19:10 编辑

这几年好几代CPU,无论是intel还是AMD,国内做评测以及电脑商人口中都会来一句:“CPU瓶颈”,我一开始也被洗脑这么认为,直到最近越想越不对:为什么,没有接近100%占用的CPU(通常在50%以下),会出现瓶颈?大家觉得不奇怪吗?

1:CPU瓶颈 基本上被指在1080P下 GPU占用率上不去。(我自己认为无法达到98%以上)

2:很多测试发现,即便CPU主频有效提高(比如ZEN4),瓶颈依然无法有效消除,GPU占用依然无法有效提高。

3:AMD真正能和iu较量的游戏CPU是58X3D,但进入DDR5时代,ZEN4显然很失败,13代很出色(除了功耗)

各位有没有发现,上述2、3条中,有一个基本事实:数据传输效率,也就是内存和CPU之间的效率。

翻译一下:AMD ZEN2开始不断增加三缓,直到58X3D超大三缓,相当于“在内存和CPU之间又建立了一套高速储存设备”,大幅降低对内存的依赖(但不是完全不依赖),所以ZEN3有了和对面PK的能力,但实话说,也没有完全能赢,顶多算有来回,这一点得益于Intel很好的内存效率(高频内存收益大延迟低)。而到了DDR5时代,ZEN4 有一个最严重的缺陷:FLCK,导致DDR5内存效率“大幅度”不如13代,以至于大三缓的优势被抵消,这就是为什么虽然ZEN4主频提高那么多,游戏仍然拉的原因。

下面这张图,虽然这个湾的大家都有争议吧,但是可以参考。各位可以看看GPU占用率,可以证明58X3D超大三缓(数据传输效率的提升)对于消除GPU瓶颈才是最重要的,而不是所谓的“CPU瓶颈”——58X3D的IPC相比ZEN4要弱,却依靠CPU和内存之间额外的有效储存环节(即超大三缓)实现性能飞跃,充分利用了CPU原有的性能(占用到了31%是最高的),减少浪费。

换言之,把DDR5内存超起来的13代,估计在AMD解决flck之前,AMD都无法正面抗衡。

CPU-PJ.jpg

发表于 2022-12-6 10:43 | 显示全部楼层
只有真正在用zen4 的用户才知道性能比zen3 强太多了,而且无视5800x3d,这种内存写入减半的玩意
发表于 2022-12-6 10:49 | 显示全部楼层
楼主你去看看 4090 的 CPU 横向对比

就知道的确是存在 CPU “瓶颈”

==========

只要显卡足够强大,CPU 就会拖后腿
发表于 2022-12-6 10:49 来自手机 | 显示全部楼层
增加了我买58x3d的信心,但一直没出手

我现在手握5800x加b550,另外富裕一套4代内存,显卡也有旧货可用,明夏刚需一台电脑,留的也需要保留

请问一下是买个58x3d,再买个一般的b550,还是冲5代内存的新平台

预算有限,偶尔3a,不网游
发表于 2022-12-6 10:52 来自手机 | 显示全部楼层
等一个明年的7000x3d看看游戏性能是不是真能超13代
 楼主| 发表于 2022-12-6 10:56 | 显示全部楼层
yubeii 发表于 2022-12-6 10:49
楼主你去看看 4090 的 CPU 横向对比

就知道的确是存在 CPU “瓶颈”

说实话,简单的归类到“CPU瓶颈”,我认为算对,但是不完全对,只是不准确。毕竟大缓存也是CPU里带的,且内存控制器也在cpu里
发表于 2022-12-6 10:58 | 显示全部楼层
本帖最后由 momoka 于 2022-12-6 11:00 编辑

红字没啥好奇怪的,我司某个知名游戏,长期只能占用2,3个线程,换句话说,就是拿AMD FX8核心,或者肥龙2 6核心,都远远无法满载,但是这不妨碍同期的3770K,4790K   fps比AMD几乎翻倍。


虽然说的比较极端,lz是不是觉得FX 8核心没有满载,就没有cpu瓶颈阿
 楼主| 发表于 2022-12-6 10:58 | 显示全部楼层
tmxkkk 发表于 2022-12-6 10:49
增加了我买58x3d的信心,但一直没出手

我现在手握5800x加b550,另外富裕一套4代内存,显卡也有旧货可用, ...

580X 3A足够,主要看你分辨率,高分辨率换U没意义不是很大
发表于 2022-12-6 11:05 | 显示全部楼层
我5800X打2077和大表哥2帧数明显比朋友13代低,越吃U的场景差距越明显,我大表哥2画质都手动拉到4K全最高了,2077开4K光追DLSS质量甚至有时候显卡占用率都上不去。。。
还有典中典2042只能120帧出头
发表于 2022-12-6 11:06 | 显示全部楼层

5800X3D 这种要看脸的玩具,买新不买旧 不香吗?D4 平台除了高频低延迟的高价货,比不上D5 的
屏幕截图 2022-12-06 110055_调整大小.png
屏幕截图 2022-12-06 105952_调整大小.png
屏幕截图 2022-12-06 110018_调整大小.png

屏幕截图 2022-12-06 110029_调整大小.png
屏幕截图 2022-12-06 110136_调整大小.png



 楼主| 发表于 2022-12-6 11:07 | 显示全部楼层
toddler 发表于 2022-12-6 11:06
5800X3D 这种要看脸的玩具,买新不买旧 不香吗?D4 平台除了高频低延迟的高价货,比不上D5 的

没错 我是说比不了D5
发表于 2022-12-6 11:09 | 显示全部楼层
shawnwinton 发表于 2022-12-6 11:07
没错 我是说比不了D5

zen4 D5平台秒杀老D4 5800X3D
发表于 2022-12-6 11:10 来自手机 | 显示全部楼层
toddler 发表于 2022-12-6 11:06
5800X3D 这种要看脸的玩具,买新不买旧 不香吗?D4 平台除了高频低延迟的高价货,比不上D5 的



X3D牛逼基本是网游上,吃鸡,CSOL,wow等,3A大作也就古墓丽影之类个别几个有优势,按需购买就是了
发表于 2022-12-6 11:13 | 显示全部楼层
momoka 发表于 2022-12-6 10:58
红字没啥好奇怪的,我司某个知名游戏,长期只能占用2,3个线程,换句话说,就是拿AMD FX8核心,或者肥龙2 6 ...

真相了
发表于 2022-12-6 11:13 | 显示全部楼层
不同的游戏瓶颈不同。吃cpu算力的58x3d大缓存用处不大。对内存延迟敏感的大缓存就有优势
发表于 2022-12-6 11:14 | 显示全部楼层
cpu瓶颈其实更多的都是单线程瓶颈

这时候看cpu占用率可以很低
 楼主| 发表于 2022-12-6 11:14 | 显示全部楼层
momoka 发表于 2022-12-6 10:58
红字没啥好奇怪的,我司某个知名游戏,长期只能占用2,3个线程,换句话说,就是拿AMD FX8核心,或者肥龙2 6 ...

这么说不太对
当GPU占用率100%的时候,继续提升显卡,帧数会继续提高对吧,直到占用率下降,才能消除GPU瓶颈。
那为什么,同样的理论大家却都不用在CPU身上
发表于 2022-12-6 11:19 | 显示全部楼层
tmxkkk 发表于 2022-12-6 10:49
增加了我买58x3d的信心,但一直没出手

我现在手握5800x加b550,另外富裕一套4代内存,显卡也有旧货可用, ...

不网游,那买58x3d?3a都只是偶尔,这台动脑定位是啥
 楼主| 发表于 2022-12-6 11:20 | 显示全部楼层
aibo 发表于 2022-12-6 11:14
cpu瓶颈其实更多的都是单线程瓶颈

这时候看cpu占用率可以很低

现在很少有大作是只用1个核的,监控一下,核心使用基本在9成以上
发表于 2022-12-6 11:20 | 显示全部楼层
yubeii 发表于 2022-12-6 10:49
楼主你去看看 4090 的 CPU 横向对比

就知道的确是存在 CPU “瓶颈”

看测试4090跑2077这种3A大作4K高特效加个光追,瓶颈还是在GPU上。。。。。
现在主流GPU跑3A更是在GPU上了,现在基本上没CPU瓶颈的游戏。哪怕是13代i5,随便带个60fps还是没问题的。。
发表于 2022-12-6 11:23 | 显示全部楼层
shawnwinton 发表于 2022-12-6 11:20
现在很少有大作是只用1个核的,监控一下,核心使用基本在9成以上




多线程优化也不会和不能把所有线程都平均分配到所有核心。

可能线程A需要8G才能让显卡满载
线程B只需要5G
线程C只需要3G

然后根据权重再得出一个最终的帧数。
你很难得到一个纯线性的结果。
但是各种经验和实践上还是,单线程强则强。
发表于 2022-12-6 11:29 | 显示全部楼层
本帖最后由 momoka 于 2022-12-6 11:45 编辑
shawnwinton 发表于 2022-12-6 11:14
这么说不太对
当GPU占用率100%的时候,继续提升显卡,帧数会继续提高对吧,直到占用率下降,才能消除GPU ...


因为游戏程序里,cpu没有那么容易满载,编程困难,有些线程很难拆分,尤其网游。虽然这方面我不太懂,但似乎公司的程序猿表示他们也没办法

这东西有难度和成本,和GPU占用100%完全不是一个等级的。
发表于 2022-12-6 11:33 | 显示全部楼层
现代计算机最大的瓶颈永远是IO(每一级IO的速度等级都是差了几倍往上走的,L1到L2到L3),计算电路反而是其次。
要明白一个事情,计算是很快的,过一遍电路就出结果了,但是保存结果,然后基于这个结果再往下算。这个过程中,保存结果,读取结果就是特么最费劲的。
13代的DDR5是可以拉到很高的速度,内存吞吐很高,但是跟3d L3 cache那个速度和延迟是没法比的,都是几倍量级的差距,唯一的问题就是容量。
但是目前根据RDNA2和5800x3d,还有3090及4090的L2容量差距,游戏所需要的Cache容量,的确是多多益善。
两个ccd的7900x3d,32+32+64+64,恐怕要带来一些质变。
发表于 2022-12-6 11:44 来自手机 | 显示全部楼层
主要是我的钱包瓶颈了

点评

哈哈 逐个字的看 看到你这里瞬间笑场  发表于 2022-12-6 22:25
发表于 2022-12-6 11:49 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
发表于 2022-12-6 11:51 | 显示全部楼层
除了城市天际线,没有感觉到升级CPU对游戏帧数有什么实质性提升
 楼主| 发表于 2022-12-6 11:51 | 显示全部楼层
lionsee123 发表于 2022-12-6 11:33
现代计算机最大的瓶颈永远是IO(每一级IO的速度等级都是差了几倍往上走的,L1到L2到L3),计算电路反而是其 ...

非常感谢,我也是相似的推断
L3的容量是致命伤同意,性能差距也同意,但解决办法依然是不能只靠L3,内存效率依然很重要,甚至重要性要大于CPU-L3之间的交互,L3和内存之间也会不断交换数据。
2个CCD的79X3D我还是持谨慎态度,主要是不共享3缓在架构上回到ZEN2了?共享这一点比较重要。
发表于 2022-12-6 12:46 | 显示全部楼层
shawnwinton 发表于 2022-12-6 11:51
非常感谢,我也是相似的推断
L3的容量是致命伤同意,性能差距也同意,但解决办法依然是不能只靠L3,内存 ...

……那你知道79x3d一个CCD共享多少L3吗
发表于 2022-12-6 13:01 | 显示全部楼层
FLCK是什么鬼
发表于 2022-12-6 13:04 | 显示全部楼层
不是所有游戏都能多线程全部用得上的。
CPU瓶颈一般是指的单线程能力。
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

Archiver|手机版|小黑屋|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806 上海市互联网违法与不良信息举报中心

GMT+8, 2025-4-13 10:29 , Processed in 0.015276 second(s), 8 queries , Gzip On, Redis On.

Powered by Discuz! X3.5 Licensed

© 2007-2024 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表