为285K的 lion cove 大核意难平 - 第2页 - 电脑讨论(新) - Chiphell - 分享与交流用户体验

k-dsg 发表于 2024-10-18 19:38

手持5900x想温度低一点风扇别那么吵都不知道换哪个

fycmouse 发表于 2024-10-18 19:38

唉，14+++++太久了，再加上印度裔高管一胡闹，估计要好久才能恢复哦。

groups 发表于 2024-10-18 19:44

牙膏大核不敢超了，怕缩肛，所以提升有限。小核还能超，所以提升较大。

af_x_if 发表于 2024-10-18 21:16

k-dsg 发表于 2024-10-18 19:38
手持5900x想温度低一点风扇别那么吵都不知道换哪个

换分体水……

赫敏发表于 2024-10-19 00:00

本帖最后由赫敏于 2024-10-18 11:02 编辑

gihu 发表于 2024-10-18 04:34
你是认真的？L0 当成L1，L1当成L2，L2不说，直接比L3？L3是可以全核共享的，没必要算到每个核心，i9，U9 ...

都不要L3那规模差距就更大了，远不是P核多了2MB L2能弥补的

赫敏发表于 2024-10-19 00:02

fycmouse 发表于 2024-10-18 06:25
总体构架多少年都没啥变化了，不是一个菜就能说清楚的

尾大不掉，小核是全新设计就一直加宽直到完全取代大核

当然要加上大核那一堆内存子系统面积功耗也不会有现在这么好看

fndroe 发表于 2024-10-19 00:06

k-dsg 发表于 2024-10-18 19:38
手持5900x想温度低一点风扇别那么吵都不知道换哪个

9950x 待机45-50，我直接放弃了，之前从127转到macstudio，室温25左右，英特尔和mac都能做到30来度的静音待机。幸亏前几天被轮大拦住没上9950x，否则迟早忍受不了待机温度换回i

用户发表于 2024-10-19 02:52

sekiroooo 发表于 2024-10-18 13:35
阴特尔的架构工程师不至于那么菜吧。。。。

Jim Keller的采访里说intel的工程师比管理层更该裁("engineering team needs a reset ... more than management")。另一个提到的细节是intel的以色列团队（大核团队）对新的CAD工具非常抵触，总体上还在使用20多年前的开发流程。

sekiroooo 发表于 2024-10-19 07:55

用户发表于 2024-10-19 02:52
Jim Keller的采访里说intel的工程师比管理层更该裁("engineering team needs a reset ... more than mana ...

设计芯片不是用EDA工具吗😁。你说他菜 13 14代如果不缩肛就用着落后工艺也是能刚工艺先进的 7000锐龙的。多title封装的15代发力点感觉很怪

赫敏发表于 2024-10-19 08:00

本帖最后由赫敏于 2024-10-18 19:05 编辑

sekiroooo 发表于 2024-10-18 18:55
设计芯片不是用EDA工具吗😁。你说他菜 13 14代如果不缩肛就用着落后工艺也是能刚工艺先进的 7000锐龙 ...

有人觉得老版本office好用，启动快。有的人到处找win10 ltsc

kupanda2021 发表于 2024-10-19 11:06

allensakura 发表于 2024-10-18 17:46
zen5应该只能算4+4，单一线程只用到4宽，另外4宽给smt用，不算真正的8宽

有opcache撑着，单线程时4宽解码影响不大

opcache 64set 16路能存6k 指令或者融合指令，到8宽dispatch

opcache 实际效率和利用率都提升了，spec int绝大多数环境下

x86 解码器宽度对性能影响不大

前端延迟瓶颈和zen5拉长流水线导致的分支预测失效slot损失影响更大

前端延迟影响因素太复杂， l1i实现又不公开。

至于双解码要在单线程测试中产生作用，那架构就不该叫zen了，

半导体工艺没大提升，靠架构也就是现在这样了。

allensakura 发表于 2024-10-19 11:14

af_x_if 发表于 2024-10-18 19:20
分支应该也可以，E核压根没有多线程呢，还不是用多组解码器。
而且有了微码缓存以后发射数一般不从解码宽 ...

其实我比较的对象是苹果的M系列
不过实在找不到精确的核心大小与电晶体数量对比
在我看来ZEN5依然是抠门的小核心低成本设计，能多代跟intel大核有来有回甚至有所胜出真不知道该说intel啥好.....

allensakura 发表于 2024-10-19 11:22

kupanda2021 发表于 2024-10-19 11:06
有opcache撑着，单线程时4宽解码影响不大

opcache 64set 16路能存6k 指令或者融合指令，到8宽dispatch

x86上限如果僅止於此，那真的是该放弃的时候了

7970Raymond 发表于 2024-10-19 11:36

panzerlied 发表于 2024-10-18 14:42
我会把questionable 翻译成，难说。

这已经是韩译英了，不知道原文是啥

panzerlied 发表于 2024-10-19 11:46

7970Raymond 发表于 2024-10-19 11:36
这已经是韩译英了，不知道原文是啥

韩国论坛点进去发现点不进去，看不到原文。

fycmouse 发表于 2024-10-19 13:18

allensakura 发表于 2024-10-19 11:22
x86上限如果僅止於此，那真的是该放弃的时候了

x86上限高的很的，但是越来越封闭的it环境却算是无意中判了它的死刑，只是有点可惜哦，多少人的努力。

af_x_if 发表于 2024-10-19 15:38

fycmouse 发表于 2024-10-19 13:18
x86上限高的很的，但是越来越封闭的it环境却算是无意中判了它的死刑，只是有点可惜哦，多少人的努力。 ...

各指令集架构上限没有明显区别，但是X86的实现成本更高。

5d5588cf 发表于 2024-10-19 20:57

我不太懂Lion cove晶体管多Zen 5一倍的这种说法是怎么来的。Lion cove算上L1.5，再加上ht版需要的1.1x晶体管，core w/o L2的晶体管数量也就290-320MTr。Zen 5就算用半吞吐版AVX512 FPU来比，core w/o L2的也要350MTr。要是算L2，Lion cove也是只有440-490MTr，而Zen 5则是480MTr。Golden cove和Lion cove这两代的core w/o L2的规模增长实际上只比Skylake到Sunny cove多一点。
而X86 PPA比不过ARM的根本问题在于对频率和带宽，以及通用性的需要。20级的pipeline所需的晶体管，更强的BPU和以及更大的带宽吞吐则是要更多更耗费面积的sram。像Crestmont这种只有128bit*2 FPU以及比Conroe还要略短的pipeline，L1带宽也明显低于P-core的架构，core w/o L2的晶体管数量比a18 E-core这个目前arm晶体管效率最高，且pipeline连10级都不到的架构还要少30-40%，而没有L3的LPE Crestmont在fp ipc上和A18 E相若，仅在int上输了10%。
至于服务器PPA的问题更多是在于mesh以及各种如AMX之类的ASIC上。牙膏的直到明年年底才有真正意义上的Broadwell-EP精神续作。而SKL-X到目前的GNR更像是在卖ASIC送CPU。

Mufasa 发表于 2024-10-19 21:13

kozaya 发表于 2024-10-18 15:42
二缓对游戏几乎毫无帮助
增加的6~8M L2
改成增加L3

Intel现在一级缓存是跑整数运算用得多，二级缓存跑浮点运算用得多。

增加了L0以后，反而变得更加复杂。。。。

至于三缓，二级缓存没有足量的情况下，去加三缓得不偿失。

sekiroooo 发表于 2024-10-20 08:47

Mufasa 发表于 2024-10-19 21:13
Intel现在一级缓存是跑整数运算用得多，二级缓存跑浮点运算用得多。

增加了L0以后，反而变得更加复杂。 ...

是的，15代大核是猛加整数运算部分的ALU+AGU(6+6)的规格，浮点运算部分还是配2FMA+2FADD的规格。甚至专门为整数部分配置了专门的memory和store 调度器
Amd这边是整数，浮点都加大

踢鸡鸡 发表于 2024-10-20 11:38

为一个美国公司的产品意难平，你也是人才。

Cyberpangk 发表于 2024-10-20 11:45

fycmouse 发表于 2024-10-18 19:38
唉，14+++++太久了，再加上印度裔高管一胡闹，估计要好久才能恢复哦。

Raja the King：？我何德何能？信了我的PPT请我来做垃圾显卡的不是白人？

Mufasa 发表于 2024-10-20 19:33

sekiroooo 发表于 2024-10-20 08:47
是的，15代大核是猛加整数运算部分的ALU+AGU(6+6)的规格，浮点运算部分还是配2FMA+2FADD的规格。甚至专 ...

可能是拿桌面用户当小白鼠吧。

试验成功了，这种整数运算强的架构，可以移植到云计算服务器那边。

但我还是觉得这个L0有点莫名其妙。
如果说是指令解码以后的微代码单独给个缓存，还有点道理。
微代码缓存叫L0，未解码的指令缓存是L1
但Intel偏偏是给数据部分加了个L0
那么是不是空闲出来的L1可以被浮点运算使用？未知

页: 1 [2]

Chiphell - 分享与交流用户体验's Archiver