找回密码
 加入我们
搜索
      
楼主: 赫敏

[CPU] 赢!全大核至强6重回性能王座

[复制链接]
发表于 2024-9-25 21:23 | 显示全部楼层
大头吃小头 发表于 2024-9-25 21:05
不错了 amd该降价了吧 等着zen4大船

AMD一直不贵。。。批单的EPYC一直低。。。
9654早期那批 多报单项目流出来的 谭里人不是证明过。。。还是有保修的
不过牙膏批单价格也低  超微那边还都是牙膏U 就是价格足够低
发表于 2024-9-25 21:24 | 显示全部楼层
gihu 发表于 2024-9-25 19:24
拿就64核EPYC打 128核XEON吧。
不过讲真,128核XEON能打过带3D vcache的EPYC,已经很不容易了 ...


牙膏这个缓存也不低。。。我记得6代的缓存是300多一个 2颗也有700来着
后面还要继续堆 大家都堆。。。反正自己厂
发表于 2024-9-25 21:29 | 显示全部楼层
AMD靠着3D cache和台积电作弊,最终还是被Intel打下阵来
发表于 2024-9-25 21:38 | 显示全部楼层

zen5的EPYC还没出啊
发表于 2024-9-25 21:39 | 显示全部楼层
kmdkai 发表于 2024-9-25 09:55
问题是10月ZEN5 EPYC就要出了,某些方面大约能比ZEN4接近翻倍性能,intel如何应对? ...

288C啊......不就是核战吗?
发表于 2024-9-25 21:39 | 显示全部楼层
用户 发表于 2024-9-25 10:27
别说zen5,intel用自家工艺能和zen4拼订单也已经是烧高香了。

intel 3 不比n4p差啊,而且良率算不错的
 楼主| 发表于 2024-9-25 21:49 | 显示全部楼层
momo77989724 发表于 2024-9-25 08:24
牙膏这个缓存也不低。。。我记得6代的缓存是300多一个 2颗也有700来着
后面还要继续堆 大家都堆。。。反 ...

504MB L3
发表于 2024-9-26 09:52 来自手机 | 显示全部楼层
momo77989724 发表于 2024-9-25 21:24
牙膏这个缓存也不低。。。我记得6代的缓存是300多一个 2颗也有700来着
后面还要继续堆 大家都堆。。。反 ...

膏厂的服务器级别u差的还不止是cache,总线上也差好多,这次有这么大进步猜想是改良总线了,至少可以和infinite fabric切磋了
发表于 2024-9-26 11:00 | 显示全部楼层
500W。。。。
那不就是128c vs 96c 然后500W vs 400W 还是上一代Zen4
不过相比之下已经进步很大了,之前都是双路干单路,还干不赢
发表于 2024-9-26 15:19 | 显示全部楼层
周喆 发表于 2024-9-25 20:59
9754这么弱,只比9654高了一丁点,看来还是高密度库把频率压的太狠了

zen4c 和zen4还是有差距的
发表于 2024-9-26 15:22 | 显示全部楼层
lacsiess 发表于 2024-9-25 21:39
288C啊......不就是核战吗?

288c记得是144核的atom双 socket,估计 在196核的zen5c面前毫无胜算
发表于 2024-9-26 15:34 | 显示全部楼层
gihu 发表于 2024-9-26 15:22
288c记得是144核的atom双 socket,估计 在196核的zen5c面前毫无胜算

如果有Skymont性能的288C 应该还是很猛的
发表于 2024-9-26 15:41 | 显示全部楼层
Illidan2004 发表于 2024-9-26 15:34
如果有Skymont性能的288C 应该还是很猛的

就算skymont IPC比起zen5c还是差多了,而且算上频率上的差距可能更大
发表于 2024-9-26 15:51 | 显示全部楼层
周喆 发表于 2024-9-25 20:59
9754这么弱,只比9654高了一丁点,看来还是高密度库把频率压的太狠了

官方定价已经告诉你了
发表于 2024-9-26 16:50 | 显示全部楼层
gihu 发表于 2024-9-26 15:22
288c记得是144核的atom双 socket,估计 在196核的zen5c面前毫无胜算


堆288C的小核,算力不够数量来凑
发表于 2024-9-26 17:11 来自手机 | 显示全部楼层
lacsiess 发表于 2024-9-26 08:50
堆288C的小核,算力不够数量来凑

然而按功率密度性能比还是会输 大dc还是会用脚选
发表于 2024-9-26 17:23 | 显示全部楼层
gihu 发表于 2024-9-26 09:52
膏厂的服务器级别u差的还不止是cache,总线上也差好多,这次有这么大进步猜想是改良总线了,至少可以和in ...

mesh什么时候比IF差了?IF那套实质multi-ring牙膏又不是没用过,从IVB-EX用到BWD-EP,发现超过20c延迟的问题解决不了才去用mesh的。mesh的问题是频率不如ring好拉,所以从EMR开始堆L3,透过更大的L3去解决L3因为和mesh的频率绑定导致速度上不去的问题。
发表于 2024-9-26 17:31 | 显示全部楼层
gihu 发表于 2024-9-25 19:24
拿就64核EPYC打 128核XEON吧。
不过讲真,128核XEON能打过带3D vcache的EPYC,已经很不容易了 ...


非共享的cache算总量没意义的...if下remote cache延迟比内存都高, 3d vcache epyc有意义的数值一样是96M
发表于 2024-9-26 17:46 | 显示全部楼层
等AMD祭出EPYX X3D的旗舰型号呗。
AMD的多die封装可以暴力堆核了
而且还不是新款今年ZEN5C ZEN5X3D 一个可以暴力堆核一个可以目标3GL3了
发表于 2024-9-26 17:48 | 显示全部楼层
5d5588cf 发表于 2024-9-26 17:23
mesh什么时候比IF差了?IF那套实质multi-ring牙膏又不是没用过,从IVB-EX用到BWD-EP,发现超过20c延迟的 ...

mesh什么时候比IF强了?IF啥时候变multi-ring了? IF是连接ccd之间以及ccd和IOD之间的总线,ring bus是DIE内部核间通讯的总线,根本不是一回事。
就烦你这种半桶水乱晃的
发表于 2024-9-26 17:55 | 显示全部楼层
zhuifeng88 发表于 2024-9-26 17:31
非共享的cache算总量没意义的...if下remote cache延迟比内存都高, 3d vcache epyc有意义的数值一样是96M ...

算到每个核心,Granite Rapids每个核心也就4M不到的L3,比起EPYC-X的12M,还是差远了。而且Mesh总线一样也无法通吃全部L3,甚至跨区域的核心间通讯效率还不如IF总线。就不知道6代xeon的mesh总线效率是否有所提升
发表于 2024-9-26 18:17 | 显示全部楼层
gihu 发表于 2024-9-26 17:48
mesh什么时候比IF强了?IF啥时候变multi-ring了? IF是连接ccd之间以及ccd和IOD之间的总线,ring bus是DI ...

我说的是IF那套,而不是IF本身。因为我习惯把Intel的system agent当成ring/mesh的其中一部分,没说清楚是我的错。问题在于system agent到ring/mesh的带宽不比IF到ring的表现差。然后IF不是单纯的CCD和I/O die之间的fabric,SDF一样是IF的一部分。
发表于 2024-9-26 18:23 | 显示全部楼层
本帖最后由 zhuifeng88 于 2024-9-26 18:28 编辑
gihu 发表于 2024-9-26 17:55
算到每个核心,Granite Rapids每个核心也就4M不到的L3,比起EPYC-X的12M,还是差远了。而且Mesh总线一样 ...


不是算平均的, 是算每核心可以没额外penalty访问的范围...
实际性能敏感的任务大都是多个核心协同处理同一个working set, 直接按核心数算平均那是各跑各的...又不是开一堆单核虚拟机用这么算
没额外penalty访问的范围gnr开snc是168M不开snc是完整的504M, 最坏延迟开snc是20-30ns, 不开是30-40ns, epyc是96M, 10-20ns, 出96M立刻上升到100ns以上
另外哪来的跨区域效率mesh不如if, 带宽两头差不多, 最坏情况的l1/l1脏命中是60-80ns对比100-120ns(单socket)
发表于 2024-9-26 18:46 | 显示全部楼层
gihu 发表于 2024-9-26 15:41
就算skymont IPC比起zen5c还是差多了,而且算上频率上的差距可能更大

而且我不知道为什么你会用LNL这种没有L3,uncore还会降频,内存延迟更高,对内存延迟更敏感的Skymont,来推算CWF上有几百MB L3的Darkmont的PPC。LNL上的Skymont的int PPC已经比RPL-P Gracemont这种用JEDEC DDR5的还低,快和Haswell差不多了。然后我也不知道你是基于什么证据认为Turin Dense的频率会高于CWF。同样1W/c的情况下Skymont是3.3GHz,而Zen 5 dense只有2.0GHz。就当LPE Skymont是占了没有L3和ring/mesh agent的便宜好了,假设on-ring版的Skymont L3和ring agent要吃掉0.5w,那么0.5w下的Skymont还是能跑到3.0GHz,而STX上的Zen 5 dense IPC仅仅比一堆debuff的LNL Skymont高了20%。
发表于 2024-9-26 18:52 | 显示全部楼层
别争了,这上面的CPU跟这里99.99999999999999999999999%的人都没关系


发表于 2024-9-26 18:59 | 显示全部楼层
cx533 发表于 2024-9-26 18:52
别争了,这上面的CPU跟这里99.99999999999999999999999%的人都没关系

那你有点低估CHH了
闲鱼9654  也就1W多一颗。。。在这论坛大概率 一个帖子里有2个人有的
发表于 2024-9-26 19:39 | 显示全部楼层
128打96???
发表于 2024-9-26 19:47 | 显示全部楼层


坐下, 前代amd96打outel60, 现实不需要讲武德
发表于 2024-9-26 20:17 | 显示全部楼层
5d5588cf 发表于 2024-9-26 18:46
而且我不知道为什么你会用LNL这种没有L3,uncore还会降频,内存延迟更高,对内存延迟更敏感的Skymont,来 ...

你别忘了,zen5c可是有SMT的,144core @2 socket面对的可是384 thread的zen 5c,这个和笔记本上测试单核IPC可不是一回事
发表于 2024-9-26 20:19 | 显示全部楼层
zhuifeng88 发表于 2024-9-26 19:47
坐下, 前代amd96打outel60, 现实不需要讲武德

前代amd 96打outel的可不止是60,60x2照打不误,所以我说granite rapids进步很大
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

Archiver|手机版|小黑屋|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806 上海市互联网违法与不良信息举报中心

GMT+8, 2024-11-27 23:57 , Processed in 0.013038 second(s), 5 queries , Gzip On, Redis On.

Powered by Discuz! X3.5 Licensed

© 2007-2024 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表