RDNA4 shader engine外的提升以及下一代展望

新加坡妖王 发表于 2025-3-1 10:57

由NAVI48的dieshot可以看出，shader engine （计算单元CU、纹理单元TMU、ROP光栅单元）外，最大的提升应该就是巨大的指令前端（包含L2、几何指令、ACE、DMA、HWS等），其次就是IFC以及控制器。
先看指令前端，NAVI48的指令前端面积高达约48mm2 @ TSMC N4P （平均晶体管密度151MTrs/mm2）。而NAVI31的指令前端面积只有24.5mm2 @ TSMC N5P （平均晶体管密度150MTrs/mm2），NAVI21的指令前端面积只有31mm2 @ TSMC N7P （平均晶体管密度51.5MTrs/mm2）。也就是说NAVI48的指令前端相对于NAVI31规模翻倍，这样的话规模上升带来的边际效益就很小了。
再看IFC缓存以及内存子系统。NAVI48升级到了64M第三代IFC缓存，显存控制器控制IFC和GDDR6 PHY，用于提升显存带宽。

对于下一代UDNA GPU，目前的展望有以下两种，工艺预计是TSMC N3E或N3P：
1. UDNA radeon 显卡和MI400X计算卡用的是同一个GPU die，游戏显卡重新回到RDNA3的chiplet模式：
低端1GPU+2MCD（40~48CU，128bit GDDR7）
中端2GPU+4MCD（80~96CU，256bit GDDR7）
高端3GPU+6MCD（120~144CU，384bit GDDR7）
旗舰GPU 4GPU+8MCD（160~192CU，512bit GDDR7）

2. UDNA radeon GPU和MI400X走两条路线，游戏显卡聚焦游戏玩家，没有很高端的型号。对于高端游戏GPU，可能基于NAVI48继续提升：
维持NAVI48的指令前端不变或稍微增加规模，以应对频率、规模提升。
内存子系统提升到64M第四代IFC+256bit GDDR7显存，可能会提供3D缓存支持
计算单元维持4SE，单个SE提升到20CU，总规模提升到80CU，频率提升到3.3GHz左右。提升AI性能，并支持更高级的光追。
预计这样的话性能是NAVI48的1.4倍。

zhuershi 发表于 2025-3-1 11:03

页: [1]

Chiphell - 分享与交流用户体验's Archiver

RDNA4 shader engine外的提升以及下一代展望