找回密码
 加入我们
搜索
      
查看: 6052|回复: 10

[PC硬件] 英特尔公布Sapphire Rapids与EPYC Genoa性能对比, AI方面领先极大

[复制链接]
发表于 2023-6-13 20:50 | 显示全部楼层 |阅读模式
随着第四代英特尔至强可扩展处理器在2023年1月的正式推出,英特尔通过其业界领先的加速器引擎在性能方面取得了重大进展,并在AI、数据分析、科学计算(HPC)等关键工作负载方面提高了每瓦性能。其中,第四代至强的快速出货、被全球客户的广泛采用,以及在广泛商业应用场景中的多元化关键工作负载上表现出的领先性能,均已引起业界关注。

Xeon_Gen4_01.jpg

在经过数周严格、全面的比较测试后,英特尔分享了至强可扩展处理器芯片与AMD EPYC Genoa更为全面的性能对比。目前,市场上最常部署的解决方案是基于中等核数所提供的,在该领域中,每核性能、功耗以及吞吐量是关键的性能指标。基于此,英特尔将其32核的第四代至强Platinum 8462Y+处理器与竞争对手最佳、主流的32核EPYC 9354处理器进行了比较。

Xeon_Gen4_03.jpg

AI性能基准测试,英特尔宣称至强Platinum 8462Y+与AMD EPYC 9354相比性能提高了7.11倍。所有基准测试均表明至强Platinum 8462Y+不仅在整体性能上领先,在每瓦性能指标上也领先。这些工作负载利用Sapphire Rapids上的英特尔AMX高级矩阵扩展,可提升分类、自然语言处理、推荐器和检测等特定AI任务。

Xeon_Gen4_02.jpg

接下来是更广泛的工作负载项目,从SPECint到MySQL Casandra、MongoDB,还包括使用英特尔加速器引擎的工作负载,如Microsoft SQL、GROMACS、LAMMPS、NAMD、Monte Carlo等,与AMD第四代EPYC Genoa相比最高性能提升可达2.52倍,而最高每瓦性能可提高251%。在存储和特定于HPC.的基准测试中可以看到最大的性能提升。通用工作负载性能表现其实不如EPYC Genoa,而微服务和数据服务则比对手提高了20%到30%。

Xeon_Gen4_04.jpg

TCO总体拥有成本方面,英特尔表示能用更少的服务器数量达到与对手40套服务器同样的性能,因此能耗也更低,整体使用成本更低,在PostGreSQL数据库负载场景最多可节省8%,而Microsoft SQL 2022+ QAT Backup数据库负载则可节约35%,在BlackScholes HPC负载可节省38%,DLRM AI推荐场景可节省61%,BertLarge AI自然语言处理节省了高达79%。

Xeon_Gen4_05.jpg

英特尔还拿了56核旗舰并封装了HBM内存的至强Max 9480与AMD最强的96核EPYC 9654进行了对比,进行了纯HPC工作负载比较,在地球系统建模、能源与制造等,展现出高于竞争对手40%的性能优势。

https://www.expreview.com/88796.html
发表于 2023-6-13 21:43 | 显示全部楼层
56C打96C有点反直觉,所以到底能信多少?
建议按照phoronix的习惯把所有软件版本和编译参数列出来给大家看看
发表于 2023-6-13 22:08 | 显示全部楼层
本帖最后由 赫敏 于 2023-6-13 09:09 编辑
jcd_chh 发表于 2023-6-13 08:43
56C打96C有点反直觉,所以到底能信多少?
建议按照phoronix的习惯把所有软件版本和编译参数列出来给 ...


都是用加速器和amx指令在比
发表于 2023-6-13 22:31 | 显示全部楼层
56核对96核,价格还贵了大概一倍?
发表于 2023-6-14 01:42 来自手机 | 显示全部楼层
AMD:阁下说得没错,但是今晚我就掏出MI300,阁下又打算如何应对呢
发表于 2023-6-14 07:07 | 显示全部楼层
也就只能活在这短暂的梦里了,哎,英特尔真的是把自己作死了
发表于 2023-6-14 09:22 | 显示全部楼层
AI有本事和A100和H100去比,谁还用CPU算
这里的GROMACS,早在三年前就转GPU加速了
发表于 2023-6-14 09:53 来自手机 | 显示全部楼层
darkness66201 发表于 2023-6-14 01:42
AMD:阁下说得没错,但是今晚我就掏出MI300,阁下又打算如何应对呢

MI300软件生态不如cpu成熟吧。现在用nvidia的gpu我还遇到sparse tensor的einsum无法gpu加速的问题
发表于 2023-6-14 11:43 | 显示全部楼层
买了intel这套还得把代码全改一遍来适配他的加速器 就挺乐的
发表于 2023-6-14 12:06 来自手机 | 显示全部楼层
用户 发表于 2023-6-14 09:53
MI300软件生态不如cpu成熟吧。现在用nvidia的gpu我还遇到sparse tensor的einsum无法gpu加速的问题 ...

8490h也是靠加速器,不是纯cpu算,更何况,在绝对的算力优势面前,软件生态就无所谓了,不然哪有cuda的崛起,毕竟论生态任何专用处理器都不可能超过通用处理器。而且,mi300是ai和hpc专用,封闭环境影响会小很多。
发表于 2023-6-14 17:56 | 显示全部楼层
sss668800 发表于 2023-6-14 09:22
AI有本事和A100和H100去比,谁还用CPU算
这里的GROMACS,早在三年前就转GPU加速了 ...

在某些场景下,只进行 inference,有 AMX/AVX 单元的 CPU 在价格上有一定的……优势。
您需要登录后才可以回帖 登录 | 加入我们

本版积分规则

Archiver|手机版|小黑屋|Chiphell ( 沪ICP备12027953号-5 )沪公网备310112100042806 上海市互联网违法与不良信息举报中心

GMT+8, 2024-11-16 00:02 , Processed in 0.011333 second(s), 6 queries , Gzip On, Redis On.

Powered by Discuz! X3.5 Licensed

© 2007-2024 Chiphell.com All rights reserved.

快速回复 返回顶部 返回列表