赢！全大核至强6重回性能王座

momo77989724 · 发表于 2024-9-25 21:23

大头吃小头发表于 2024-9-25 21:05
不错了 amd该降价了吧等着zen4大船

AMD一直不贵。。。批单的EPYC一直低。。。
9654早期那批多报单项目流出来的谭里人不是证明过。。。还是有保修的
不过牙膏批单价格也低超微那边还都是牙膏U 就是价格足够低

momo77989724 · 发表于 2024-9-25 21:24

gihu 发表于 2024-9-25 19:24
拿就64核EPYC打 128核XEON吧。
不过讲真，128核XEON能打过带3D vcache的EPYC，已经很不容易了 ...

牙膏这个缓存也不低。。。我记得6代的缓存是300多一个 2颗也有700来着
后面还要继续堆大家都堆。。。反正自己厂

HZJ · 发表于 2024-9-25 21:29

AMD靠着3D cache和台积电作弊，最终还是被Intel打下阵来

ykdo · 发表于 2024-9-25 21:38

wjm47196 发表于 2024-9-25 07:48
zen5出来了比zen4

zen5的EPYC还没出啊

lacsiess · 发表于 2024-9-25 21:39

kmdkai 发表于 2024-9-25 09:55
问题是10月ZEN5 EPYC就要出了，某些方面大约能比ZEN4接近翻倍性能，intel如何应对？ ...

288C啊......不就是核战吗?

kupanda2021 · 发表于 2024-9-25 21:39

用户发表于 2024-9-25 10:27
别说zen5，intel用自家工艺能和zen4拼订单也已经是烧高香了。

intel 3 不比n4p差啊，而且良率算不错的

赫敏 · 发表于 2024-9-25 21:49

momo77989724 发表于 2024-9-25 08:24
牙膏这个缓存也不低。。。我记得6代的缓存是300多一个 2颗也有700来着
后面还要继续堆大家都堆。。。反 ...

504MB L3

gihu · 发表于 2024-9-26 09:52

momo77989724 发表于 2024-9-25 21:24
牙膏这个缓存也不低。。。我记得6代的缓存是300多一个 2颗也有700来着
后面还要继续堆大家都堆。。。反 ...

膏厂的服务器级别u差的还不止是cache，总线上也差好多，这次有这么大进步猜想是改良总线了，至少可以和infinite fabric切磋了

默兜 · 发表于 2024-9-26 11:00

500W。。。。
那不就是128c vs 96c 然后500W vs 400W

还是上一代Zen4
不过相比之下已经进步很大了，之前都是双路干单路，还干不赢

gihu · 发表于 2024-9-26 15:19

周喆发表于 2024-9-25 20:59
9754这么弱，只比9654高了一丁点，看来还是高密度库把频率压的太狠了

zen4c 和zen4还是有差距的

gihu · 发表于 2024-9-26 15:22

lacsiess 发表于 2024-9-25 21:39
288C啊......不就是核战吗?

288c记得是144核的atom双 socket，估计在196核的zen5c面前毫无胜算

Illidan2004 · 发表于 2024-9-26 15:34

gihu 发表于 2024-9-26 15:22
288c记得是144核的atom双 socket，估计在196核的zen5c面前毫无胜算

如果有Skymont性能的288C 应该还是很猛的

gihu · 发表于 2024-9-26 15:41

Illidan2004 发表于 2024-9-26 15:34
如果有Skymont性能的288C 应该还是很猛的

就算skymont IPC比起zen5c还是差多了，而且算上频率上的差距可能更大

aasa0001 · 发表于 2024-9-26 15:51

周喆发表于 2024-9-25 20:59
9754这么弱，只比9654高了一丁点，看来还是高密度库把频率压的太狠了

官方定价已经告诉你了

lacsiess · 发表于 2024-9-26 16:50

gihu 发表于 2024-9-26 15:22
288c记得是144核的atom双 socket，估计在196核的zen5c面前毫无胜算

堆288C的小核,算力不够数量来凑

YsHaNg · 发表于 2024-9-26 17:11

lacsiess 发表于 2024-9-26 08:50
堆288C的小核,算力不够数量来凑

然而按功率密度性能比还是会输大dc还是会用脚选

5d5588cf · 发表于 2024-9-26 17:23

gihu 发表于 2024-9-26 09:52
膏厂的服务器级别u差的还不止是cache，总线上也差好多，这次有这么大进步猜想是改良总线了，至少可以和in ...

mesh什么时候比IF差了？IF那套实质multi-ring牙膏又不是没用过，从IVB-EX用到BWD-EP，发现超过20c延迟的问题解决不了才去用mesh的。mesh的问题是频率不如ring好拉，所以从EMR开始堆L3，透过更大的L3去解决L3因为和mesh的频率绑定导致速度上不去的问题。

zhuifeng88 · 发表于 2024-9-26 17:31

gihu 发表于 2024-9-25 19:24
拿就64核EPYC打 128核XEON吧。
不过讲真，128核XEON能打过带3D vcache的EPYC，已经很不容易了 ...

非共享的cache算总量没意义的...if下remote cache延迟比内存都高, 3d vcache epyc有意义的数值一样是96M

MikuLuka · 发表于 2024-9-26 17:46

等AMD祭出EPYX X3D的旗舰型号呗。
AMD的多die封装可以暴力堆核了
而且还不是新款今年ZEN5C ZEN5X3D 一个可以暴力堆核一个可以目标3GL3了

gihu · 发表于 2024-9-26 17:48

5d5588cf 发表于 2024-9-26 17:23
mesh什么时候比IF差了？IF那套实质multi-ring牙膏又不是没用过，从IVB-EX用到BWD-EP，发现超过20c延迟的 ...

mesh什么时候比IF强了？IF啥时候变multi-ring了？ IF是连接ccd之间以及ccd和IOD之间的总线，ring bus是DIE内部核间通讯的总线，根本不是一回事。
就烦你这种半桶水乱晃的

gihu · 发表于 2024-9-26 17:55

zhuifeng88 发表于 2024-9-26 17:31
非共享的cache算总量没意义的...if下remote cache延迟比内存都高, 3d vcache epyc有意义的数值一样是96M ...

算到每个核心，Granite Rapids每个核心也就4M不到的L3，比起EPYC-X的12M，还是差远了。而且Mesh总线一样也无法通吃全部L3，甚至跨区域的核心间通讯效率还不如IF总线。就不知道6代xeon的mesh总线效率是否有所提升

5d5588cf · 发表于 2024-9-26 18:17

gihu 发表于 2024-9-26 17:48
mesh什么时候比IF强了？IF啥时候变multi-ring了？ IF是连接ccd之间以及ccd和IOD之间的总线，ring bus是DI ...

我说的是IF那套，而不是IF本身。因为我习惯把Intel的system agent当成ring/mesh的其中一部分，没说清楚是我的错。问题在于system agent到ring/mesh的带宽不比IF到ring的表现差。然后IF不是单纯的CCD和I/O die之间的fabric，SDF一样是IF的一部分。

zhuifeng88 · 发表于 2024-9-26 18:23

本帖最后由 zhuifeng88 于 2024-9-26 18:28 编辑

gihu 发表于 2024-9-26 17:55
算到每个核心，Granite Rapids每个核心也就4M不到的L3，比起EPYC-X的12M，还是差远了。而且Mesh总线一样 ...

不是算平均的, 是算每核心可以没额外penalty访问的范围...
实际性能敏感的任务大都是多个核心协同处理同一个working set, 直接按核心数算平均那是各跑各的...又不是开一堆单核虚拟机用这么算
没额外penalty访问的范围gnr开snc是168M不开snc是完整的504M, 最坏延迟开snc是20-30ns, 不开是30-40ns, epyc是96M, 10-20ns, 出96M立刻上升到100ns以上
另外哪来的跨区域效率mesh不如if, 带宽两头差不多, 最坏情况的l1/l1脏命中是60-80ns对比100-120ns(单socket)

5d5588cf · 发表于 2024-9-26 18:46

gihu 发表于 2024-9-26 15:41
就算skymont IPC比起zen5c还是差多了，而且算上频率上的差距可能更大

而且我不知道为什么你会用LNL这种没有L3，uncore还会降频，内存延迟更高，对内存延迟更敏感的Skymont，来推算CWF上有几百MB L3的Darkmont的PPC。LNL上的Skymont的int PPC已经比RPL-P Gracemont这种用JEDEC DDR5的还低，快和Haswell差不多了。然后我也不知道你是基于什么证据认为Turin Dense的频率会高于CWF。同样1W/c的情况下Skymont是3.3GHz，而Zen 5 dense只有2.0GHz。就当LPE Skymont是占了没有L3和ring/mesh agent的便宜好了，假设on-ring版的Skymont L3和ring agent要吃掉0.5w，那么0.5w下的Skymont还是能跑到3.0GHz，而STX上的Zen 5 dense IPC仅仅比一堆debuff的LNL Skymont高了20%。

cx533 · 发表于 2024-9-26 18:52

别争了，这上面的CPU跟这里99.99999999999999999999999%的人都没关系

momo77989724 · 发表于 2024-9-26 18:59

cx533 发表于 2024-9-26 18:52
别争了，这上面的CPU跟这里99.99999999999999999999999%的人都没关系

那你有点低估CHH了
闲鱼9654 也就1W多一颗。。。在这论坛大概率一个帖子里有2个人有的

tjmxxo · 发表于 2024-9-26 19:39

128打96？？？

zhuifeng88 · 发表于 2024-9-26 19:47

tjmxxo 发表于 2024-9-26 19:39
128打96？？？

坐下, 前代amd96打outel60, 现实不需要讲武德

gihu · 发表于 2024-9-26 20:17

5d5588cf 发表于 2024-9-26 18:46
而且我不知道为什么你会用LNL这种没有L3，uncore还会降频，内存延迟更高，对内存延迟更敏感的Skymont，来 ...

你别忘了，zen5c可是有SMT的，144core @2 socket面对的可是384 thread的zen 5c，这个和笔记本上测试单核IPC可不是一回事

gihu · 发表于 2024-9-26 20:19

zhuifeng88 发表于 2024-9-26 19:47
坐下, 前代amd96打outel60, 现实不需要讲武德

前代amd 96打outel的可不止是60，60x2照打不误，所以我说granite rapids进步很大

账号		自动登录	找回密码
密码			加入我们

[CPU] 赢！全大核至强6重回性能王座