|
稳定又切实的进步
▲ 借用一张 AMD 发布会上的路线图,AMD 从 Zen 架构 CPU 诞生以来,不断在 CPU 架构与 生产工艺上优化着 Zen 系列的架构,比如:
Zen+ 架构对于 Zen 架构的修补,制造工艺也从 Zen 的台积电 14nm 工艺提升到 Zen+ 的 12nm 工艺。
Zen2 架构对于前后端的暴力翻倍堆叠,以及引入了最先进的 TAGE 作为二级分支预测,让 AMD CPU 第一次对 intel CPU 实现了分支预测能力的反超,AMD CPU 的性能也越来越多得到了用户的认可。引入了 FP256 浮点运算,制造工艺也从 Zen+ 的台积电 12nm 工艺提升到台积电 7nm 工艺。
Zen3 CPU 每个 CCX 由原先的 4C,在规格上翻倍为 8C,从而实现了每个 CCX 物理核心翻倍,每个核心可调用的共享 L3 从 16MB 提升至 32MB, 解决了 8 核心 CPU 以下跨 CCX 通讯延迟的问题,让 AMD CPU 的延迟进一步降低,甚至超越了同期发布的 intel 产品,助力 AMD 登上当时的 CPU 性能巅峰。
每一次架构的进步与 bios 的优化,让 CPU 的性能更强,也解决了过往的一些 BUG ,这些让AMD CPU 越来越稳定,越来越好用。这一切让 AMD 也在服务器市场站稳了脚跟。
而隔壁,本来去年(2021年)年底就准备发布的全大核无核显的 Sapphire Rapids 还忙着修 BUG 延期到明年,都已经修到第 12 个步进了(A0, A1, B0, C0, C1, C2, D0, E0, E2, E3, E4, E5),修复了 500 多个 BUG......至于民用级,反正玩家蓝屏都是 Win 11 背锅,让 Win11 背上了 BUG 11 的骂名,做系统的巨硬最新的 Surface 都只用 11 代很能说明问题了。
▲ Zen 4 最为出色的提升之一,就是把 CPU 的全核心频率提升至 5GHz 以上,而 R9 的两款 CPU ——7900X 与 7950X 更是突破了全核心 5.2G,最高核心频率达到了 5.7GHz(7950X)与 5.6G (7900X),AMD 终于在频率上与 intel 站在了同一水平线上。
而对于两款 Zen4 Ryzen 9 CPU 而言,还承担着 AMD 对于未来 CPU 兼顾节能降耗与高性能的商用实践性探索——同构异频 CCX 设计,R9 CPU 由两块 CCD 通过 I/O Die 连接起来,两块 CCX 运行在不同频率。比起大小核的设计方案,同构异频 CCD 设计方案能够简化调度设计,程序调用也更加简单,无需考虑不同架构核心带来的指令集差别,进而提高系统运行稳定性与兼容性,当然也提高 AMD Zen4 产品的良品率。
经过大神实测,无论是 Window 11 还是 Linux Kernel 5.15,还是 Window 10,Zen4 都能将任务优先指派给高频内核。如果任务较多时,指派给低频内核也影响不大,因为,都是 Zen4 架构的核心,并且 CPU 加速频率都超过 5.2G。
▲ 如果使用华硕主板,可以进入 bios,按“F7”进入高级模式,来到 “AI Tweaker”界面,进入“AI Features”界面。因为系统进入 bios 之后,AMD CPU 在默频时会自动运行在 CPU 核心 Core 所能运行的最高频率,并且自动运行空指令 nop,以保证 CPU 全速运行,这样我们就能查看每个 CCX(CCD)跟 Core 的运行情况。
可以看到 R9 7900x 的 Core #0 ~ Core #5 运行在 5555 MHz~5605 MHz,这 6 个 Core 率属于 CCD 0 ,属于高频 CCD。而且可以发现 AMD 已经能通过负载对每个单独的 Core 进行精细化控制频率与精细化精确的电压,在保证高能效比的情况下尽可能提高单核性能。
Core #6 ~ Core #11 则运行在 5325 MHz ~ 5350 MHz 的频率范围,电压也相对低一些。这 6 个 Core 率属于 CCD 1 ,是高能效比的低频 CCD,运行时功耗跟发热也会更低。
▲ 往下翻可以看到主板标注的 CCD0 与 CCD1 的最高加速频率与电压有差异,这就会造成两个 CCD 实际功耗跟发热在重负载的情况下会有明显的区别,通过同构异频 CCD 设计,R9 7900X 能够在需要单核性能强的应用时,直接让高频 CCD 来干活,而任务负载多的情况下,利用同样出色 Zen4 架构的略低频 CCD (实际上超过 5.32G 的最高加速频率了)来提升能效比,做到高性能与负载的均衡,降低调度难度。
▲ 此外,AMD 在 Zen 4 架构的 CPU 上还将总线频率 FCLK 频率独立出来了,从此超频内存与 FCLK 无关,这样能保证 CPU 获得稳定的传输性能,而不是过去的与内存频率相关。当内存频率为 DDR5 6000 时,Zen4 CPU 与内存、主板等整套平台将获得最佳甜品性能点。
▲ 如果熟悉 AMD 平台的朋友们一定知道,之前 AMD 对于内存 A-XMP 的标准是蹭 intel 的 XMP。在更换到 AM5 接口并且更换最新的 I/O Die 之后,AMD 决定推出完全适应自身架构的 EXPO 技术,并且将该技术免费开放。使用 AMD EXPO 技术后,主板将自动读取 EXPO 超频优化参数,方便广大玩家。
官方宣称可以最高提升 11%的游戏流畅度体验,AMD还要求内存厂商,所有符合EXPO标准的内存产品,必须提供一份详细的报告,包括组件、完整时序表、软硬件稳定性信息等等,方便玩家识别选购。
▲ 对于 Zen4 架构的 CPU 为什么能带来那么显著的性能提升?得益于:
改进分支预测、同时扩大分支预测的范围,二级缓存 L2 与三级缓存 L3 支持更多命中失败 (outstanding miss),可以减少流水线的停顿,增加缓存回填带宽,提升整体效率。减少分支预测失败带来的惩罚。
增大OP指令作缓存、增大指令退役队列、增大整数/浮点寄存器文件、加深核心缓冲吞吐、改进载入/存储单元、
增大二级缓存,不但容量翻了一番,每核心从 512KB 来到 1MB,还提升了速度。
浮点单元支持 AVX-512指令,不过是 AMD 相比于 intel ,采用更灵活的拆分成两个 256-bit 指令来执行,这样既避免了执行AVX-512指令时发热过大、频率下降的情况出现,同时又可以节省芯片面积,降低设计难度,并且可以针对目前因为真正长达512-bit的指令并不多的情况。加入AVX-512指令集后,Zen4架构的FP32浮点推理多线程性能可提升1.31倍,VNNI INT8整数推理多线程性能可提升2.47倍!
▲ 此外,新的台积电 6nm 工艺 I/O Die ,首次集成了 PCIe 5.0 控制器,可提供 28 条通道,可拆分为一路 x16、三路 x4 。首次集成DDR5内存控制器,内存的甜品频率是 DDR5 6000,首次支持 USB Type-C 接口,支持USB BIOS Flashback,可通过 U 盘和 USB 接口直接刷新 BIOS 。
接口更换为 AM5 接口,首次从 PGA 针脚式改成 LGA 触点式,使得 CPU 与主板之间的电气连接性能更好,最大功耗空间放宽到 230W ,配合上台积电 5nm 工艺,造就了 Zen 4 CPU 全体上 5G 的功臣。
AMD 承诺 AM5 接口接口规划支持到 2025 年乃至更远,同时 AM5 跟 AM4 的处理器封装尺寸、主板插座尺寸和孔距的技术参数基本一致(高度上略有差别,但影响不大),能够兼容绝大部分的 AM4 散热器。
说了那么多,来看实物吧。
|
评分
-
查看全部评分
|