AMD: KI-Beschleuniger MI300A und MI300X machen Nvidia Konkurrenz
Bisher war Nvidia mit seiner Hopper-H100-Serie führend auf dem Gebiet der KI-Beschleuniger. Doch mit den kürzlich auf AMDs "Advancing AI"-Veranstaltung vorgestellten KI-Beschleunigern Instinct HI300A und Instinct HI300X könnte der Hardware-Hersteller aus dem kalifornischen Santa Clara dem Platzhirsch Nvidia ernsthafte Konkurrenz machen.
Der reine KI-Beschleuniger MI300X kann im Verbund mit bis zu acht Einheiten betrieben werden und ist für generative KI sowie Large-Language-Model (LLM)-Training ausgelegt. Für den Betrieb des MI300X ist eine dedizierte CPU erforderlich, während der AMD Instinct MI300A stattdessen als Accelerated Processing Unit (APU) daherkommt. Die APU MI300A basiert auf der CDNA-3-Architektur mit acht GPU-Kernen sowie CPU-Kernen auf Zen-4-Basis, um eine hohe Leistung für High Performance Computing (HPC) und KI-Workloads zu gewährleisten.
Hochleistungs-KI-Beschleuniger Instinct MI300X für AI-Sprachmodelle
Im Vergleich zur Vorgängergeneration MI250X soll die MI300X-Serie laut AMD fast 40 Prozent mehr Recheneinheiten (304 GPU-CUs), die anderthalbfache Speicherkapazität und die 1,7-fache theoretische maximale Speicherbandbreite bieten. Dank der neuen CDNA-3-Architektur unterstützt der KI-Beschleuniger MI300X das 8-Bit-Floating-Point-Format (FP8), das speziell für Berechnungen in neuronalen Netzen entwickelt wurde.
Die MI300X-Beschleuniger nutzen High-Bandwith-Memory-3 (HBM3)-Speicher mit einer Kapazität von 192 GB und einer maximalen Speicherbandbreite von 5,4 TB/s, die als 3D-Stack implementiert sind. Basierend auf der Open-Compute-Plattform (OCP) können bis zu acht AMD Instinct MI300X Beschleuniger miteinander verbunden werden, was eine HBM3-Speicherkapazität von insgesamt 1,5 TB ergibt.
AMD Instinct MI300A für High Performance Computing
Die AMD Instinct MI300A ist eine Accelerated Processing Unit (APU) für High-Performance-Computing und KI mit 24 Zen 4 x86-Kernen und 228 GPU-CPUs mit 128 GB HBM-3-Speicher. AMD gibt in einer Pressemitteilung eine rund 1,9-fache Leistung pro Watt bei FP32-Berechnungen im Vergleich zum Vorgängermodell MI250X an. Der KI-Beschleuniger MI300A bietet zudem die 3D-Packaging-Technologie, die auch beim MI300X zum Einsatz kommt.
Quelle(n)
AMD (Pressemitteilung)