找回密码
 加入我们
搜索
      
楼主: nApoleon

[CPU] 万众期待?

[复制链接]
发表于 2024-10-28 16:12 | 显示全部楼层
AlcatrazX 发表于 2024-10-27 09:33
其实还有一点需要注意,现在还在DIY PC的个人(非商业)用户,到底有多少是以打游戏为第一目的。我个人感觉 ...

个人用户剪视频苹果方便多了何必pc
发表于 2024-10-28 17:23 | 显示全部楼层
yy323818 发表于 2024-10-26 13:17
3D在1080P下提升看着比较大的原因是显卡没瓶颈。现在分辨率在4K的情况下,显卡计算量吞吐量增加了4倍,显卡 ...

4K即便是显卡瓶颈,X3D的提升应该也没多少吧,缓存的需求应该会高很多,X3D的缓存不够用了
 楼主| 发表于 2024-10-28 17:24 | 显示全部楼层
pcgsf22 发表于 2024-10-28 16:12
个人用户剪视频苹果方便多了何必pc

我有M1的Mac Mini,而且还是定制的顶配,讲真,为了剪片买Mac是真的傻...重复投资也投资一点都不低...日常的PC是什么都能干都要干,而不是挑三拣四地干...
发表于 2024-10-28 17:27 | 显示全部楼层
初音空岛 发表于 2024-10-28 17:23
4K即便是显卡瓶颈,X3D的提升应该也没多少吧,缓存的需求应该会高很多,X3D的缓存不够用了 ...

4K/2K/1080P,有区别的主要是显卡,绝大数情况下,CPU的负载并不会增加。而且随着帧率的降低,CPU的负载反而会下降。
发表于 2024-10-28 17:31 | 显示全部楼层
nApoleon 发表于 2024-10-28 17:24
我有M1的Mac Mini,而且还是定制的顶配,讲真,为了剪片买Mac是真的傻...重复投资也投资一点都不低...日常的 ...

轮大是专业自媒体可能觉得mac不够灵活,但对我们业余视频玩家,mac开箱即用,广色域管理,对hdr和h265良好支持,对prores格式支持,高效省电等等都很友好。而且很多公司工作电脑就是mac都没必要额外再买一台
 楼主| 发表于 2024-10-28 19:10 | 显示全部楼层
pcgsf22 发表于 2024-10-28 17:31
轮大是专业自媒体可能觉得mac不够灵活,但对我们业余视频玩家,mac开箱即用,广色域管理,对hdr和h265良 ...

真不是.
我家里是PC+M1,实际上我平时自己的视频很少剪,真剪,也都是手机拍的,这种情况PC里的视频剪辑软件随便什么都能处理,毫无压力和难度.
但我装机的视频都是编辑专业剪的,最初也试过Mac OS,不行,只能剪简单的,插件少,特效少,于是就回归PC用PR,但凡上手了那就一点没有压力的.
电脑这种事情,PC什么都能干,我还没遇到非得Mac不可的情况...
发表于 2024-10-28 21:45 | 显示全部楼层
Illidan2004 发表于 2024-10-28 15:19
相比当年3299的10700K    2549的9700X
不觉得983 3开头的官方定价有什么问题   具体应该多少价格  市场能 ...


官价3当然没问题,我也没指望刚上市能便宜到哪去,但是3在我这就是没性价比
发表于 2024-10-29 15:51 | 显示全部楼层
nApoleon 发表于 2024-10-26 10:35
然后游戏高个百分之个位数,最后贵个几百,黄牛再炒一下溢价过千,最后买的人觉得自己玩游戏体验无比流畅… ...

这就有话说了,如果你玩无畏契约,并且用的540hz显示器,你会发现14900k配8200内存,竞技模式依然300多~400多帧跑不满显示器,甚至偶尔出现200多, 这时候你换7800x3d,稳稳定住540,只稍微有点抖动,就知道为什么万众期待了。
总之确实期待9800x3D。

FPS玩家专属。
发表于 2024-10-29 15:52 | 显示全部楼层
tinnybat 发表于 2024-10-29 15:51
这就有话说了,如果你玩无畏契约,并且用的540hz显示器,你会发现14900k配8200内存,竞技模式依然300多~4 ...

这时候你恨不得把intel的破垃圾踩碎。。。
发表于 2024-10-29 17:51 | 显示全部楼层
gihu 发表于 2024-10-28 17:27
4K/2K/1080P,有区别的主要是显卡,绝大数情况下,CPU的负载并不会增加。而且随着帧率的降低,CPU的负载 ...

我描述错了,我想说的是4K下CPU瓶颈 显卡无瓶颈(假如用的RTX9080),X3D的提升会比1080P下小很多,显卡无瓶颈时提升分辨率,是会小幅度提升CPU占用率的,意味着对CPU的要求变高了
发表于 2024-10-29 18:22 | 显示全部楼层
初音空岛 发表于 2024-10-29 17:51
我描述错了,我想说的是4K下CPU瓶颈 显卡无瓶颈(假如用的RTX9080),X3D的提升会比1080P下小很多,显卡 ...

游戏里面fps帧率的计算是由cpu计算的帧生成时间+显卡计算的真生成时间之和的倒数求得的。
显卡只要没有瓶颈,就可以不断的减少帧生成时间,这个时候cpu也得降低帧生成时间来应对,避免显卡等待。这种情况下,无论1k,2k,4k画面,但凡显卡平均帧生成时间小于或等于cpu的帧生成时间,不同cpu的性能就会出现比较明显的差距。

提升画面分辨率并不是唯一榨取显卡性能手段,更高的显示特效(由显卡负责生成的),更复杂的细节,也会提升显卡的负载,只是不如分辨率提升来的明显而已。
发表于 2024-11-1 15:44 | 显示全部楼层
gihu 发表于 2024-10-29 18:22
游戏里面fps帧率的计算是由cpu计算的帧生成时间+显卡计算的真生成时间之和的倒数求得的。
显卡只要没有瓶 ...

我这并不是希望给显卡提升压力,我是希望给cpu提升压力,缓存毕竟大小有限,当压力大的时候,缓存被击穿,缓存的优势就会降低,内存速度和主频的优势就会体现
发表于 2024-11-1 16:00 | 显示全部楼层
初音空岛 发表于 2024-11-1 15:44
我这并不是希望给显卡提升压力,我是希望给cpu提升压力,缓存毕竟大小有限,当压力大的时候,缓存被击穿 ...

并不是所有数据都会放到L3缓存里去的。举个例子,跟纹理/3D特效有关的数据,一般都是交给显卡处理的,这些数据大多放在显存里,真的需要预读取,一般也是通过pcie x16接口从内存中直接读取。现在的PCIe的带宽是远小于DDR5内存带宽的,所以也没啥关系。
一般装CPU cache里的数据,都是一些游戏角色的属性/技能/行动轨迹这类的,这个跟画面的分辨率并无关系,而且这类数据容量一般特别小,所以才会有网游上百个角色大乱斗情况下,x3D比非x3d处理器有巨大优势的情况。
你说真要给cpu提升压力,那也就只有极少数情况下,L3 cache溢出,一般这都是各种科学计算的专用软件才会有的。但即使是这类软件,多64M的L3还是有巨大的优势。因为你要知道,从最早的机械硬盘划一部分内存作为write back cache到后来的L2/L3cache,缓存的目的就是缓解下一级数据储存机构性能不足的问题,更大更快的缓存对于提升下一级储存效率的效果肯定是要好于直接提升下一级存储机构的性能——除非内存的速度能跟L3接近一个级别,例如苹果M系列ultra这种,直接内存的读写带宽做到x86 L3 cache 1/3的性能
发表于 2024-11-1 16:03 | 显示全部楼层
gihu 发表于 2024-11-1 16:00
并不是所有数据都会放到L3缓存里去的。举个例子,跟纹理/3D特效有关的数据,一般都是交给显卡处理的,这 ...

显卡不能直接读内存,并不是统一寻址。还是要CPU拿到数据,copy进显存的
发表于 2024-11-1 16:06 | 显示全部楼层
8owd8wan 发表于 2024-11-1 16:03
显卡不能直接读内存,并不是统一寻址。还是要CPU拿到数据,copy进显存的

你忘了有AMD的SAM技术,在Nvidia上叫resize bar
发表于 2024-11-1 16:07 | 显示全部楼层
本帖最后由 8owd8wan 于 2024-11-1 16:09 编辑
gihu 发表于 2024-11-1 16:06
你忘了有AMD的SAM技术,在Nvidia上叫resize bar


早年AMD提出APU,确实推统一寻址。但到现在,实际应用开发到底没这么做吧。
具体做引擎开发的同学,可以确认一下?我不做游戏,不清楚。。但用cuda的时候,依然还是手工拷贝来拷贝去,烦死。。。
发表于 2024-11-1 16:18 | 显示全部楼层
pcgsf22 发表于 2024-10-28 17:31
轮大是专业自媒体可能觉得mac不够灵活,但对我们业余视频玩家,mac开箱即用,广色域管理,对hdr和h265良 ...

业余玩家用剪映不就行了嘛。。。。
发表于 2024-11-1 16:23 | 显示全部楼层
8owd8wan 发表于 2024-11-1 16:07
早年AMD提出APU,确实推统一寻址。但到现在,实际应用开发到底没这么做吧。
具体做引擎开发的同学,可以 ...

我理解错你的意思了,前面我打的文字有歧义,应该是显卡通过cpu从内存经过pcie总线读取数据,瓶颈在于PCIE x16的总线而非内存带宽。
你说的APU统一寻址,应该在PS5和XBX的专用处理器上早就实现了吧?这两者的zen2架构cpu,是没有专用内存的,只有GDDR6显存
发表于 2024-11-1 17:55 | 显示全部楼层
本帖最后由 8owd8wan 于 2024-11-1 17:57 编辑
gihu 发表于 2024-11-1 16:23
我理解错你的意思了,前面我打的文字有歧义,应该是显卡通过cpu从内存经过pcie总线读取数据,瓶颈在于PCI ...


是的。
应该说,当年一开始,第一代APU,就推统一寻址技术。CPU-GPU纳入统一的内存管理,合力做通用计算,理念真的先进。
但PC上显然失败了。反而是Cuda这种“DSP加速”的老思维,更容易实现并被大家接纳。

不过,Playstation和XBOX上,应该就是统一寻址。做过相关平台开发的坛友,应该可以确认吧。
发表于 2024-11-1 18:05 | 显示全部楼层
8owd8wan 发表于 2024-11-1 17:55
是的。
应该说,当年一开始,第一代APU,就推统一寻址技术。CPU-GPU纳入统一的内存管理,合力做通用计算 ...


统一地址空间主要是开发友好, 并不能带来明显的性能收益, 前面你们也说了只要读写 cache 之外的东西就得走内存
pc 上搞这玩意的难点在于不同现代 cpu 和 gpu 之间的 cache coherence, 需要有东西牵头红蓝绿厂, 但搞这玩意又没性能收益....
发表于 2024-11-1 18:11 | 显示全部楼层
xy. 发表于 2024-11-1 18:05
统一地址空间主要是开发友好, 并不能带来明显的性能收益, 前面你们也说了只要读写 cache 之外的东西就得 ...

对,也就是开发时候舒服一些做异构计算。
不用像cuda那样来回拷贝内存,还得精心调试优化,初哥刚搞时,内存拷贝回传处理上粗糙些,用cuda还能更慢。。。
但如你所说,哪怕开发起来容易些的统一寻址,真正性能收益完全依赖于特定计算目标的特定优化,意义真心不大
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

Archiver|手机版|小黑屋|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806 上海市互联网违法与不良信息举报中心

GMT+8, 2024-11-27 00:34 , Processed in 0.012327 second(s), 5 queries , Gzip On, Redis On.

Powered by Discuz! X3.5 Licensed

© 2007-2024 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表