找回密码
 加入我们
搜索
      
查看: 8278|回复: 10

[PC硬件] 英特尔介绍第六代至强处理器 两种核心架构,专攻高性能与高能效

[复制链接]
发表于 2023-8-29 21:56 | 显示全部楼层 |阅读模式
在一年一度的Hot Chips会议期间,英特尔揭秘了其第六代至强数据中心处理器的架构变化,并详细讲解了其新一代架构、E核和P核处理器技术,包括内存I/O子系统的设计改进,并披露2023~2025年的最新产品路线图,不过英特尔并未公布关于这两款至强处理器的具体规格。     

hotchips 2023 press briefing final_111.jpg

英特尔宣布将在明年推出两款采用Intel 3工艺的第六代至强处理器,代号分别为Granite Rapids和Sierra Forest,前者为为计算密集型和人工智能工作负载优化的高性能核心(P核)处理器,后者则针对高密度和横向扩展工作负载优化的高能效核心(E核)处理器。     

hotchips 2023 press briefing final_051.jpg

尽管英特尔计划在一代中提供两个截然不同的至强处理器,但二者将共享相同的平台,这意味着同样的插槽、内存、固件,以及相同的基于小芯片的设计理念等。在芯片的架构设计上,Granite和Sierra均基于chiplets设计,通过英特尔的EMIB封装技术将计算和I/O小芯片组结合起来。虽然这并不是英特尔在至强处理器上的首次运用,但这是chiplets设计的一次演变,它使用了不同的计算和IO chiplets,而不是将其他“完整”的至强chiplets拼接在一起。   

值得注意的是,英特尔首次证实了第六代至强可扩展平台具有自启动功能,使其成为真正的SoC。由于英特尔在I/O芯片中集成了运行所需的所有I/O功能,因此无需外部芯片(或 FPGA)即可运行这些处理器。这使得英特尔的至强系列处理器在功能上更接近于AMD的EPYC系列处理器,后者在此前就已具备类似的自启动功能了。   

hotchips 2023 press briefing final_061.jpg

通道数量和内存带宽上,第六代至强也有不小的进步,支持12条内存通道,并可根据现有计算芯片的数量和功能进行扩展。并且将率先支持全新MCR DIMM,本质上是将两组/列内存芯片组合在一起,以使进出DIMM的有效带宽加倍。英特尔表示,凭借更高的内存总线速度和更多的内存通道,该平台的带宽是当前第四代至强处理器的2.8倍。   

至于 I/O,最高配置的第六代至强处理器将能够提供达136条的PCIe通道,以及多达6 个UPI链路(总共 144 个通道)用于多插槽连接。在I/O方面,该平台支持 PCIe 5.0以及更新后的CXL 2.0标准。与英特尔此前的大核至强的一样,Granite Rapids处理器将可扩展至8个插槽。而Sierra Forest则只能扩展到2个插槽,英特尔表示,这主要是考虑到CPU内核的数量以及英特尔希望客户使用的情况不同。   

当然,第六代至强处理器最大的不同是引入高能效核心(E-Core),这是英特尔首次尝试为至强处理器提供E核。英特尔第六代至强可扩展处理器将提供P核和E核两种版本的核心架构,二者均基于Intel 3工艺打造,其中P核至强Granite Rapids针对计算密集型和AI工作负载的性能进行了优化,E核至强Sierra Forest针对高密度和横向扩展工作负载的能效进行了优化。   

hotchips 2023 press briefing final_071.jpg

两种架构所拥有指令集也略有区别。P核Granite Rapids依旧是采用此前的至强架构,对每核性能进行了优化并提高了能效,新软件功能包括支持用于AI/ML的FP16的高级矩阵扩展(AMX)、长度256位的内存加密秘钥、Code SW预取和取指分支提示、单线程MBA+L2高速缓存分配技术/代码和数据优先级(CAT/CDP);同时Granite Rapid的微架构对性能也进行优化,包括:64KB、16路指令高速缓存(I-cache),改进分支预测和错误恢复,3-cycle浮点乘法,更好的内存请求和预取能力。与当前的第四代至强相比,其容量是前者的2倍,浮点乘法也从4/5个周期减少到3个周期。

hotchips 2023 press briefing final_081.jpg

E核Sierra Forest则采用英特尔全新的至强架构,拥有优化的能效吞吐量性能,软件功能支持BF16、FP16转换,并支持HLAT、CMPccXADD、LAM、LASS、AVX-IFMA、AVX-DOT-PROD-INT8等。该处理器将拥有144个核心,可提供双插槽配置。在微架构上,Sierra Forest也进行了优化和改进,包括64kB 指令缓存、6-wide解码器、5-wide分配器、8-wide retire、2核或4核共享4MB L2。

hotchips 2023 press briefing final_091.jpg

英特尔表示,与当前第四代至强处理器Sapphire Rapids相比,基于E核打造的至强处理器Sierra Forest在云计算领域可将机架密度提高250%,将每瓦性能提高240%。全P核的Granite Rapids处理器经过优化,可为高性能核心需求和通用计算工作负载提供支持。Granite Rapids将进一步增强处理器的AI性能,内置加速器可提高特定工作负载的性能和效率。英特尔称,Granite Rapids可以为混合人工智能工作提供2到3倍的更高性能表现。

E核至强处理器Sierra Forest预计将在2024年上半年正式推出,而P核至强处理器Granite Rapids将紧随其后登场。  

https://www.expreview.com/89847.html

评分

参与人数 1邪恶指数 +10 收起 理由
醉酒棕熊 + 10

查看全部评分

发表于 2023-8-29 22:03 | 显示全部楼层
本帖最后由 沙悟净@蓝领 于 2023-8-29 22:08 编辑

全大核,全小核,intel为什么不出大小核至强?
发表于 2023-8-29 23:02 | 显示全部楼层
沙悟净@蓝领 发表于 2023-8-29 22:03
全大核,全小核,intel为什么不出大小核至强?

为什么要帮AMD
发表于 2023-8-30 09:55 | 显示全部楼层
沙悟净@蓝领 发表于 2023-8-29 22:03
全大核,全小核,intel为什么不出大小核至强?

服务器一般都是单一任务 , 不存在混合场景, 多场景会做分布式部署
发表于 2023-8-30 11:41 | 显示全部楼层
沙悟净@蓝领 发表于 2023-8-29 09:03
全大核,全小核,intel为什么不出大小核至强?

说实话小英真要出大小核服务器我真用。大部分要求实时性强的业务其实都是需要强单线程+偶尔多线程,2+8或者4+8这种大小核配比做节点非常适合
发表于 2023-8-31 14:02 | 显示全部楼层
都第六代了
发表于 2023-8-31 20:07 | 显示全部楼层
OS跑在小核上,大核跑服务还是不错的
发表于 2023-9-1 09:07 | 显示全部楼层
赫敏 发表于 2023-8-30 11:41
说实话小英真要出大小核服务器我真用。大部分要求实时性强的业务其实都是需要强单线程+偶尔多线程,2+8或 ...

使用场景太少了。
发表于 2023-9-1 09:41 来自手机 | 显示全部楼层
本帖最后由 赫敏 于 2023-8-31 22:09 编辑
k-dsg 发表于 2023-8-31 20:07
使用场景太少了。


并不少。单个节点来说100%场景都是适用的,Intel大小核的缺点不是大核不够多而是小核不够多。而且小核指令集欠缺拖累大核要阉指令集造成浪费,解决这两个问题(其实根本不难,下代小核甚至都带amx)结果就是真香

按单节点来看是典型的web或者数据单个虚拟机,多节点scaling是典型的MPP结构
发表于 2023-9-1 10:38 | 显示全部楼层
赫敏 发表于 2023-8-30 11:41
说实话小英真要出大小核服务器我真用。大部分要求实时性强的业务其实都是需要强单线程+偶尔多线程,2+8或 ...

直接八路,60*2+144*6之类的搭配不就好了
发表于 2023-9-1 11:10 | 显示全部楼层
本帖最后由 赫敏 于 2023-8-31 22:12 编辑
darkness66201 发表于 2023-8-31 21:38
直接八路,60*2+144*6之类的搭配不就好了


八路只是充个门面,实际早死光了。出货99%以上都是单+双,阿里的分布式数据库甚至逻辑上搞一万路,每路一核。物理机几核都无所谓的
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

Archiver|手机版|小黑屋|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806 上海市互联网违法与不良信息举报中心

GMT+8, 2024-12-30 02:11 , Processed in 0.014234 second(s), 7 queries , Gzip On, Redis On.

Powered by Discuz! X3.5 Licensed

© 2007-2024 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表