12 月 7 日消息,AMD 在推出旗舰 MI300X 加速卡之外,还宣布 Instinct MI300A APU 已进入量产阶段,预估明年开始交付,上市后有望成为世界上最快的 HPC 解决方案。
AMD Instinct MI300A 加速器以创新的 AMD CDNA 架构为基础,经优化可实现百万兆次级性能和节能,是创新的针对 HPC 和 AI 的加速处理器 (APU),提供 24 个“Zen 4”CPU 核心和 128 GB 的 CPU 与 GPU 共享的 HBM3 内存,带来非凡的性能。
AMD Instinct MI300A APU 结合了 Zen 4、CDNA 3 和第 4 代 Infinity 架构和互联技术,其部分性能如下:
- FP64 精度下,最高算力 61 TFLOPS
- FP32 精度下,最高算力 122 TFLOPS
- 最高 128 GB HBM3 内存
- 1460 亿个晶体管
MI300A 的封装和 MI300X 非常相似,不过前者使用了 TCO 优化的内存容量和 Zen 4 内核。
每个活动 die 有 2 个 CDNA 3 GCD,提供单独的缓存和核心 IP 池。每个 CCD 有 8 个内核和 16 个线程,因此活动芯片上总共有 24 个内核和 48 个线程。还有 24 MB 的 L2 缓存(每个内核 1 MB)和一个单独的缓存池(每个 CCD 32 MB)。
在 GPU 方面,AMD 基于 CDNA 3 架构共支持了 228 个计算单元,相当于 14592 个内核。也就是说,每个 GPU 小芯片有 38 个计算单元。
简要总结下 AMD Instinct MI300 加速器的突出功能
- 首款集成 CPU+GPU 封装
- 瞄准百万兆次级超级计算机市场
- 1460 亿个晶体管
- 最多 24 个 Zen 4 核心
- CDNA 3 GPU 架构
- 228 个计算单元(14,592 个内核)
- 最高 128 GB HBM3 内存
- 最多 8 个 Chiplets + 8 个存储器堆栈(5nm + 6nm 工艺)
性能
AMD 再次将 MI300A 与 H100 进行了比较,得益于统一的内存布局、GPU 性能以及整体内存容量和带宽,在 OpenFOAM 测试中,性能是 H100 的 4 倍。
AMD 还证实,Instinct MI300A APU 现已出货,还将用于为下一代 El-Capitan 超级计算机提供动力,该超级计算机预计将提供高达 2 Exaflops 的计算能力。