英特尔介绍第六代至强处理器两种核心架构，专攻高性能与高能效

ym168 发表于 2023-8-29 21:56

在一年一度的Hot Chips会议期间，英特尔揭秘了其第六代至强数据中心处理器的架构变化，并详细讲解了其新一代架构、E核和P核处理器技术，包括内存I/O子系统的设计改进，并披露2023~2025年的最新产品路线图，不过英特尔并未公布关于这两款至强处理器的具体规格。

英特尔宣布将在明年推出两款采用Intel 3工艺的第六代至强处理器，代号分别为Granite Rapids和Sierra Forest，前者为为计算密集型和人工智能工作负载优化的高性能核心（P核）处理器，后者则针对高密度和横向扩展工作负载优化的高能效核心（E核）处理器。

尽管英特尔计划在一代中提供两个截然不同的至强处理器，但二者将共享相同的平台，这意味着同样的插槽、内存、固件，以及相同的基于小芯片的设计理念等。在芯片的架构设计上，Granite和Sierra均基于chiplets设计，通过英特尔的EMIB封装技术将计算和I/O小芯片组结合起来。虽然这并不是英特尔在至强处理器上的首次运用，但这是chiplets设计的一次演变，它使用了不同的计算和IO chiplets，而不是将其他“完整”的至强chiplets拼接在一起。

值得注意的是，英特尔首次证实了第六代至强可扩展平台具有自启动功能，使其成为真正的SoC。由于英特尔在I/O芯片中集成了运行所需的所有I/O功能，因此无需外部芯片（或 FPGA）即可运行这些处理器。这使得英特尔的至强系列处理器在功能上更接近于AMD的EPYC系列处理器，后者在此前就已具备类似的自启动功能了。

通道数量和内存带宽上，第六代至强也有不小的进步，支持12条内存通道，并可根据现有计算芯片的数量和功能进行扩展。并且将率先支持全新MCR DIMM，本质上是将两组/列内存芯片组合在一起，以使进出DIMM的有效带宽加倍。英特尔表示，凭借更高的内存总线速度和更多的内存通道，该平台的带宽是当前第四代至强处理器的2.8倍。

至于 I/O，最高配置的第六代至强处理器将能够提供达136条的PCIe通道，以及多达6 个UPI链路（总共 144 个通道）用于多插槽连接。在I/O方面，该平台支持 PCIe 5.0以及更新后的CXL 2.0标准。与英特尔此前的大核至强的一样，Granite Rapids处理器将可扩展至8个插槽。而Sierra Forest则只能扩展到2个插槽，英特尔表示，这主要是考虑到CPU内核的数量以及英特尔希望客户使用的情况不同。

当然，第六代至强处理器最大的不同是引入高能效核心（E-Core），这是英特尔首次尝试为至强处理器提供E核。英特尔第六代至强可扩展处理器将提供P核和E核两种版本的核心架构，二者均基于Intel 3工艺打造，其中P核至强Granite Rapids针对计算密集型和AI工作负载的性能进行了优化，E核至强Sierra Forest针对高密度和横向扩展工作负载的能效进行了优化。

两种架构所拥有指令集也略有区别。P核Granite Rapids依旧是采用此前的至强架构，对每核性能进行了优化并提高了能效，新软件功能包括支持用于AI/ML的FP16的高级矩阵扩展（AMX）、长度256位的内存加密秘钥、Code SW预取和取指分支提示、单线程MBA+L2高速缓存分配技术/代码和数据优先级（CAT/CDP）；同时Granite Rapid的微架构对性能也进行优化，包括：64KB、16路指令高速缓存（I-cache），改进分支预测和错误恢复，3-cycle浮点乘法，更好的内存请求和预取能力。与当前的第四代至强相比，其容量是前者的2倍，浮点乘法也从4/5个周期减少到3个周期。

E核Sierra Forest则采用英特尔全新的至强架构，拥有优化的能效吞吐量性能，软件功能支持BF16、FP16转换，并支持HLAT、CMPccXADD、LAM、LASS、AVX-IFMA、AVX-DOT-PROD-INT8等。该处理器将拥有144个核心，可提供双插槽配置。在微架构上，Sierra Forest也进行了优化和改进，包括64kB 指令缓存、6-wide解码器、5-wide分配器、8-wide retire、2核或4核共享4MB L2。

英特尔表示，与当前第四代至强处理器Sapphire Rapids相比，基于E核打造的至强处理器Sierra Forest在云计算领域可将机架密度提高250%，将每瓦性能提高240%。全P核的Granite Rapids处理器经过优化，可为高性能核心需求和通用计算工作负载提供支持。Granite Rapids将进一步增强处理器的AI性能，内置加速器可提高特定工作负载的性能和效率。英特尔称，Granite Rapids可以为混合人工智能工作提供2到3倍的更高性能表现。

E核至强处理器Sierra Forest预计将在2024年上半年正式推出，而P核至强处理器Granite Rapids将紧随其后登场。

https://www.expreview.com/89847.html

沙悟净@蓝领 发表于 2023-8-29 22:03

本帖最后由沙悟净@蓝领于 2023-8-29 22:08 编辑

全大核，全小核，intel为什么不出大小核至强？[偷笑]

Sagitar2009 发表于 2023-8-29 23:02

沙悟净@蓝领发表于 2023-8-29 22:03
全大核，全小核，intel为什么不出大小核至强？

[偷笑]为什么要帮AMD

Ownab 发表于 2023-8-30 09:55

沙悟净@蓝领发表于 2023-8-29 22:03
全大核，全小核，intel为什么不出大小核至强？

服务器一般都是单一任务 , 不存在混合场景, 多场景会做分布式部署

赫敏发表于 2023-8-30 11:41

沙悟净@蓝领发表于 2023-8-29 09:03
全大核，全小核，intel为什么不出大小核至强？

说实话小英真要出大小核服务器我真用。大部分要求实时性强的业务其实都是需要强单线程+偶尔多线程，2+8或者4+8这种大小核配比做节点非常适合

jamic 发表于 2023-8-31 14:02

都第六代了 [晕倒]

枫血狂圣 发表于 2023-8-31 20:07

OS跑在小核上，大核跑服务还是不错的

k-dsg 发表于 2023-9-1 09:07

赫敏发表于 2023-8-30 11:41
说实话小英真要出大小核服务器我真用。大部分要求实时性强的业务其实都是需要强单线程+偶尔多线程，2+8或 ...

使用场景太少了。

赫敏发表于 2023-9-1 09:41

本帖最后由赫敏于 2023-8-31 22:09 编辑

k-dsg 发表于 2023-8-31 20:07
使用场景太少了。

并不少。单个节点来说100%场景都是适用的，Intel大小核的缺点不是大核不够多而是小核不够多。而且小核指令集欠缺拖累大核要阉指令集造成浪费，解决这两个问题（其实根本不难，下代小核甚至都带amx）结果就是真香

按单节点来看是典型的web或者数据单个虚拟机，多节点scaling是典型的MPP结构

darkness66201 发表于 2023-9-1 10:38

赫敏发表于 2023-8-30 11:41
说实话小英真要出大小核服务器我真用。大部分要求实时性强的业务其实都是需要强单线程+偶尔多线程，2+8或 ...

直接八路，60*2+144*6之类的搭配不就好了[偷笑]

赫敏发表于 2023-9-1 11:10

本帖最后由赫敏于 2023-8-31 22:12 编辑

darkness66201 发表于 2023-8-31 21:38
直接八路，60*2+144*6之类的搭配不就好了

八路只是充个门面，实际早死光了。出货99%以上都是单+双，阿里的分布式数据库甚至逻辑上搞一万路，每路一核。物理机几核都无所谓的

页: [1]

Chiphell - 分享与交流用户体验's Archiver

英特尔介绍第六代至强处理器 两种核心架构，专攻高性能与高能效

英特尔介绍第六代至强处理器两种核心架构，专攻高性能与高能效