新加坡妖王 发表于 2025-3-1 10:57

RDNA4 shader engine外的提升以及下一代展望

由NAVI48的dieshot可以看出,shader engine (计算单元CU、纹理单元TMU、ROP光栅单元)外,最大的提升应该就是巨大的指令前端(包含L2、几何指令、ACE、DMA、HWS等),其次就是IFC以及控制器。
先看指令前端,NAVI48的指令前端面积高达约48mm2 @ TSMC N4P (平均晶体管密度151MTrs/mm2)。而NAVI31的指令前端面积只有24.5mm2 @ TSMC N5P (平均晶体管密度150MTrs/mm2),NAVI21的指令前端面积只有31mm2 @ TSMC N7P (平均晶体管密度51.5MTrs/mm2)。也就是说NAVI48的指令前端相对于NAVI31规模翻倍,这样的话规模上升带来的边际效益就很小了。
再看IFC缓存以及内存子系统。NAVI48升级到了64M第三代IFC缓存,显存控制器控制IFC和GDDR6 PHY,用于提升显存带宽。

对于下一代UDNA GPU,目前的展望有以下两种,工艺预计是TSMC N3E或N3P:
1. UDNA radeon 显卡和MI400X计算卡用的是同一个GPU die,游戏显卡重新回到RDNA3的chiplet模式:
低端1GPU+2MCD(40~48CU,128bit GDDR7)
中端2GPU+4MCD(80~96CU,256bit GDDR7)
高端3GPU+6MCD(120~144CU,384bit GDDR7)
旗舰GPU 4GPU+8MCD(160~192CU,512bit GDDR7)

2. UDNA radeon GPU和MI400X走两条路线,游戏显卡聚焦游戏玩家,没有很高端的型号。对于高端游戏GPU,可能基于NAVI48继续提升:
维持NAVI48的指令前端不变或稍微增加规模,以应对频率、规模提升。
内存子系统提升到64M第四代IFC+256bit GDDR7显存,可能会提供3D缓存支持
计算单元维持4SE,单个SE提升到20CU,总规模提升到80CU,频率提升到3.3GHz左右。提升AI性能,并支持更高级的光追。
预计这样的话性能是NAVI48的1.4倍。

zhuershi 发表于 2025-3-1 11:03

页: [1]
查看完整版本: RDNA4 shader engine外的提升以及下一代展望