Elon Musks xAI hat die Grok-3-Familie von führenden KI-Großsprachmodellen auf den Markt gebracht, die in standardisierten KI-Benchmarks in der Regel besser abschneiden als andere KIs.
Die Grok-3-Modelle wurden auf dem Colossus-Supercomputer-Cluster des Unternehmens trainiert, das 100.000 Nvidia Hopper Tensor Core GPUs nutzt. Bereitgestellt wurden ein Paar Standard- und Mini-Modelle (Grok 3 Beta und Grok 3 Mini Beta) sowie ein Paar von Reasoning-Modellen (Grok 3 Beta (Think) und Grok 3 Mini Beta (Think)).
Diese nicht-logisch-denkenden Modelle übertreffen in der Regel die bisherigen Spitzenreiter der KI-Charts wie OpenAI GPT-4o und DeepSeek-V3. Ein Grund dafür ist, dass sie über ein Kontextfenster mit einer Million Token verfügen, das es der KI ermöglicht, riesige Mengen an Text zu verarbeiten. Dies verbessert die Fähigkeit der Modelle, die richtige Antwort aus einer Vielzahl von Quellen zu synthetisieren. Dennoch beantworten die Beta-Modelle von Grok 3 Fragen zur Faktensuche weiterhin mit einer Genauigkeit von weniger als 50 % (SimpleQA-Benchmark), sodass Menschen auch in Zukunft noch gefragt sein werden.
Die Rechenmodelle von Grok 3 durchdenken komplexe Aufforderungen Schritt für Schritt, sodass der Benutzer den Denkprozess der KI nachvollziehen kann. Dies ermöglicht es der KI, Probleme wie ein Experte zu bearbeiten, indem sie kleinere Teilprobleme löst und die Ergebnisse zu einer vollständigen Antwort kombiniert. Durch die Auswahl des DeepSearch-Agenten oder der Suchoption wird Grok 3 angewiesen, das Internet weit und breit zu durchsuchen und einen Code-Interpreter zu verwenden, bevor es Berichte erstellt, die die Ergebnisse zusammenfassen. Die Modelle von Grok 3 (Think) erzielen im Vergleich zu anderen KI-Lösungen besonders gute Ergebnisse bei der Lösung mathematischer Probleme, der Beantwortung von Multiple-Choice-Fragen auf Hochschulniveau und der Ausführung von Codierungsaufgaben.
xAI plant, Grok 3 in den kommenden Monaten auf einem Supercomputer-Cluster mit 200.000 GPUs weiter zu optimieren, um die Leistung weiter zu steigern. Grok 3 ist jetzt für alle Nutzer auf X und Grok.com verfügbar. Kostenlose Nutzer könnten auf Nutzungsbeschränkungen stoßen, während zahlende Nutzer Zugang zu erweiterten Funktionen haben.