Elon Musks xAI aktiviert den Colossus: Trainingscluster mit 100.000 H100-GPUs geht online
Der Nvidia Hopper H100-Grafikprozessor, der Ende September 2022 auf den Markt kam, treibt derzeit die leistungsstärksten KI-Trainingssysteme der Welt an. Am vergangenen Wochenende überholte Elon Musks KI-Firma xAI mit ihrem neuen Trainingssystem „Colossus 100k H100“ die Konkurrenz. Dieses System, das innerhalb von 122 Tagen online ging, verwendet beeindruckende 100.000 H100-GPUs. Die Hauptkonkurrenten sind Google mit 90.000 GPUs, OpenAI mit 80.000 und Meta mit 70.000 GPUs. Microsoft und Nvidia belegen die nächsten Plätze mit 60.000 bzw. 50.000 GPUs
Allerdings strebt Elon Musk bereits nach mehr und hat angekündigt, die Kapazität des xAI-Systems in naher Zukunft zu verdoppeln. Laut Musk soll die Anzahl der GPUs innerhalb weniger Monate auf 200.000 ansteigen, wobei 50.000 der neuen H200-Chips verwendet werden. Er nannte jedoch kein konkretes Ziel für diese rasche Expansion.
Bei der Gründung von xAI im Jahr 2023 erklärte Musk, dass das Ziel des Unternehmens darin bestehe, „die wahre Natur des Universums zu verstehen“. Es bleibt abzuwarten, welche Ergebnisse diese ehrgeizigen Anstrengungen bringen werden. Die H200-Chips, die vermutlich bald zum Einsatz kommen, haben bereits einen Nachfolger: den Nvidia Blackwell, der 36,2 % mehr Spitzenleistung und 66,7 % höhere Bandbreite im Vergleich zum H200 bietet.
Derzeit kann xAI das Colossus-System noch uneingeschränkt nutzen, aber dies könnte sich bald ändern. Der kalifornische Gouverneur Gavin Newsom plant, möglicherweise ab nächsten Monat ein KI-Sicherheitsgesetz zu verabschieden. Wer sich für das Thema KI-Sicherheit interessiert, könnte von Chris Ategekas Buch Safeguarding Humanity: A Comprehensive Guide to AI Safety profitieren, das für 9,08 Euro als Taschenbuch erhältlich ist.
Quelle(n)
Elon Musk (on Twitter/X)