ym168 发表于 2023-8-29 21:56

英特尔介绍第六代至强处理器 两种核心架构,专攻高性能与高能效

在一年一度的Hot Chips会议期间,英特尔揭秘了其第六代至强数据中心处理器的架构变化,并详细讲解了其新一代架构、E核和P核处理器技术,包括内存I/O子系统的设计改进,并披露2023~2025年的最新产品路线图,不过英特尔并未公布关于这两款至强处理器的具体规格。   



英特尔宣布将在明年推出两款采用Intel 3工艺的第六代至强处理器,代号分别为Granite Rapids和Sierra Forest,前者为为计算密集型和人工智能工作负载优化的高性能核心(P核)处理器,后者则针对高密度和横向扩展工作负载优化的高能效核心(E核)处理器。   



尽管英特尔计划在一代中提供两个截然不同的至强处理器,但二者将共享相同的平台,这意味着同样的插槽、内存、固件,以及相同的基于小芯片的设计理念等。在芯片的架构设计上,Granite和Sierra均基于chiplets设计,通过英特尔的EMIB封装技术将计算和I/O小芯片组结合起来。虽然这并不是英特尔在至强处理器上的首次运用,但这是chiplets设计的一次演变,它使用了不同的计算和IO chiplets,而不是将其他“完整”的至强chiplets拼接在一起。   

值得注意的是,英特尔首次证实了第六代至强可扩展平台具有自启动功能,使其成为真正的SoC。由于英特尔在I/O芯片中集成了运行所需的所有I/O功能,因此无需外部芯片(或 FPGA)即可运行这些处理器。这使得英特尔的至强系列处理器在功能上更接近于AMD的EPYC系列处理器,后者在此前就已具备类似的自启动功能了。   



通道数量和内存带宽上,第六代至强也有不小的进步,支持12条内存通道,并可根据现有计算芯片的数量和功能进行扩展。并且将率先支持全新MCR DIMM,本质上是将两组/列内存芯片组合在一起,以使进出DIMM的有效带宽加倍。英特尔表示,凭借更高的内存总线速度和更多的内存通道,该平台的带宽是当前第四代至强处理器的2.8倍。   

至于 I/O,最高配置的第六代至强处理器将能够提供达136条的PCIe通道,以及多达6 个UPI链路(总共 144 个通道)用于多插槽连接。在I/O方面,该平台支持 PCIe 5.0以及更新后的CXL 2.0标准。与英特尔此前的大核至强的一样,Granite Rapids处理器将可扩展至8个插槽。而Sierra Forest则只能扩展到2个插槽,英特尔表示,这主要是考虑到CPU内核的数量以及英特尔希望客户使用的情况不同。   

当然,第六代至强处理器最大的不同是引入高能效核心(E-Core),这是英特尔首次尝试为至强处理器提供E核。英特尔第六代至强可扩展处理器将提供P核和E核两种版本的核心架构,二者均基于Intel 3工艺打造,其中P核至强Granite Rapids针对计算密集型和AI工作负载的性能进行了优化,E核至强Sierra Forest针对高密度和横向扩展工作负载的能效进行了优化。   



两种架构所拥有指令集也略有区别。P核Granite Rapids依旧是采用此前的至强架构,对每核性能进行了优化并提高了能效,新软件功能包括支持用于AI/ML的FP16的高级矩阵扩展(AMX)、长度256位的内存加密秘钥、Code SW预取和取指分支提示、单线程MBA+L2高速缓存分配技术/代码和数据优先级(CAT/CDP);同时Granite Rapid的微架构对性能也进行优化,包括:64KB、16路指令高速缓存(I-cache),改进分支预测和错误恢复,3-cycle浮点乘法,更好的内存请求和预取能力。与当前的第四代至强相比,其容量是前者的2倍,浮点乘法也从4/5个周期减少到3个周期。



E核Sierra Forest则采用英特尔全新的至强架构,拥有优化的能效吞吐量性能,软件功能支持BF16、FP16转换,并支持HLAT、CMPccXADD、LAM、LASS、AVX-IFMA、AVX-DOT-PROD-INT8等。该处理器将拥有144个核心,可提供双插槽配置。在微架构上,Sierra Forest也进行了优化和改进,包括64kB 指令缓存、6-wide解码器、5-wide分配器、8-wide retire、2核或4核共享4MB L2。



英特尔表示,与当前第四代至强处理器Sapphire Rapids相比,基于E核打造的至强处理器Sierra Forest在云计算领域可将机架密度提高250%,将每瓦性能提高240%。全P核的Granite Rapids处理器经过优化,可为高性能核心需求和通用计算工作负载提供支持。Granite Rapids将进一步增强处理器的AI性能,内置加速器可提高特定工作负载的性能和效率。英特尔称,Granite Rapids可以为混合人工智能工作提供2到3倍的更高性能表现。

E核至强处理器Sierra Forest预计将在2024年上半年正式推出,而P核至强处理器Granite Rapids将紧随其后登场。

https://www.expreview.com/89847.html

沙悟净@蓝领 发表于 2023-8-29 22:03

本帖最后由 沙悟净@蓝领 于 2023-8-29 22:08 编辑

全大核,全小核,intel为什么不出大小核至强?[偷笑]

Sagitar2009 发表于 2023-8-29 23:02

沙悟净@蓝领 发表于 2023-8-29 22:03
全大核,全小核,intel为什么不出大小核至强?

[偷笑]为什么要帮AMD

Ownab 发表于 2023-8-30 09:55

沙悟净@蓝领 发表于 2023-8-29 22:03
全大核,全小核,intel为什么不出大小核至强?

服务器一般都是单一任务 , 不存在混合场景, 多场景会做分布式部署

赫敏 发表于 2023-8-30 11:41

沙悟净@蓝领 发表于 2023-8-29 09:03
全大核,全小核,intel为什么不出大小核至强?

说实话小英真要出大小核服务器我真用。大部分要求实时性强的业务其实都是需要强单线程+偶尔多线程,2+8或者4+8这种大小核配比做节点非常适合

jamic 发表于 2023-8-31 14:02

都第六代了 [晕倒]

枫血狂圣 发表于 2023-8-31 20:07

OS跑在小核上,大核跑服务还是不错的

k-dsg 发表于 2023-9-1 09:07

赫敏 发表于 2023-8-30 11:41
说实话小英真要出大小核服务器我真用。大部分要求实时性强的业务其实都是需要强单线程+偶尔多线程,2+8或 ...

使用场景太少了。

赫敏 发表于 2023-9-1 09:41

本帖最后由 赫敏 于 2023-8-31 22:09 编辑

k-dsg 发表于 2023-8-31 20:07
使用场景太少了。

并不少。单个节点来说100%场景都是适用的,Intel大小核的缺点不是大核不够多而是小核不够多。而且小核指令集欠缺拖累大核要阉指令集造成浪费,解决这两个问题(其实根本不难,下代小核甚至都带amx)结果就是真香

按单节点来看是典型的web或者数据单个虚拟机,多节点scaling是典型的MPP结构

darkness66201 发表于 2023-9-1 10:38

赫敏 发表于 2023-8-30 11:41
说实话小英真要出大小核服务器我真用。大部分要求实时性强的业务其实都是需要强单线程+偶尔多线程,2+8或 ...

直接八路,60*2+144*6之类的搭配不就好了[偷笑]

赫敏 发表于 2023-9-1 11:10

本帖最后由 赫敏 于 2023-8-31 22:12 编辑

darkness66201 发表于 2023-8-31 21:38
直接八路,60*2+144*6之类的搭配不就好了

八路只是充个门面,实际早死光了。出货99%以上都是单+双,阿里的分布式数据库甚至逻辑上搞一万路,每路一核。物理机几核都无所谓的
页: [1]
查看完整版本: 英特尔介绍第六代至强处理器 两种核心架构,专攻高性能与高能效