Notebookcheck Logo

Grok 3 von xAI setzt neue Maßstäbe in der KI-Leistung

xAI bringt mit der Grok 3-Familie eine hochmoderne KI auf den Markt. (Bildquelle: xAI)
xAI bringt mit der Grok 3-Familie eine hochmoderne KI auf den Markt. (Bildquelle: xAI)
Die neuesten großen xAI-Sprachmodelle haben die Benchmark-Charts angeführt, da sie in der Lage sind, das Internet nach Informationen zu durchsuchen, komplexe Probleme zu durchdenken und Eingaben mit einem Kontextfenster von einer Million Token zu verarbeiten. Die Grok-3-Modelle haben dabei in den meisten Benchmarks sowohl OpenAI GPT-4o als auch DeepSeek-V3 übertroffen.

Elon Musks xAI hat die Grok-3-Familie von führenden KI-Großsprachmodellen auf den Markt gebracht, die in standardisierten KI-Benchmarks in der Regel besser abschneiden als andere KIs.

Die Grok-3-Modelle wurden auf dem Colossus-Supercomputer-Cluster des Unternehmens trainiert, das 100.000 Nvidia Hopper Tensor Core GPUs nutzt. Bereitgestellt wurden ein Paar Standard- und Mini-Modelle (Grok 3 Beta und Grok 3 Mini Beta) sowie ein Paar von Reasoning-Modellen (Grok 3 Beta (Think) und Grok 3 Mini Beta (Think)).

Diese nicht-logisch-denkenden Modelle übertreffen in der Regel die bisherigen Spitzenreiter der KI-Charts wie OpenAI GPT-4o und DeepSeek-V3. Ein Grund dafür ist, dass sie über ein Kontextfenster mit einer Million Token verfügen, das es der KI ermöglicht, riesige Mengen an Text zu verarbeiten. Dies verbessert die Fähigkeit der Modelle, die richtige Antwort aus einer Vielzahl von Quellen zu synthetisieren. Dennoch beantworten die Beta-Modelle von Grok 3 Fragen zur Faktensuche weiterhin mit einer Genauigkeit von weniger als 50 % (SimpleQA-Benchmark), sodass Menschen auch in Zukunft noch gefragt sein werden.

Die Rechenmodelle von Grok 3 durchdenken komplexe Aufforderungen Schritt für Schritt, sodass der Benutzer den Denkprozess der KI nachvollziehen kann. Dies ermöglicht es der KI, Probleme wie ein Experte zu bearbeiten, indem sie kleinere Teilprobleme löst und die Ergebnisse zu einer vollständigen Antwort kombiniert. Durch die Auswahl des DeepSearch-Agenten oder der Suchoption wird Grok 3 angewiesen, das Internet weit und breit zu durchsuchen und einen Code-Interpreter zu verwenden, bevor es Berichte erstellt, die die Ergebnisse zusammenfassen. Die Modelle von Grok 3 (Think) erzielen im Vergleich zu anderen KI-Lösungen besonders gute Ergebnisse bei der Lösung mathematischer Probleme, der Beantwortung von Multiple-Choice-Fragen auf Hochschulniveau und der Ausführung von Codierungsaufgaben.

xAI plant, Grok 3 in den kommenden Monaten auf einem Supercomputer-Cluster mit 200.000 GPUs weiter zu optimieren, um die Leistung weiter zu steigern. Grok 3 ist jetzt für alle Nutzer auf X und Grok.com verfügbar. Kostenlose Nutzer könnten auf Nutzungsbeschränkungen stoßen, während zahlende Nutzer Zugang zu erweiterten Funktionen haben.

Die ELO-Werte der Chatbot-Arena für die KI Grok 3 machen sie zur leistungsfähigsten der Welt. (Bildquelle: xAI)
Die ELO-Werte der Chatbot-Arena für die KI Grok 3 machen sie zur leistungsfähigsten der Welt. (Bildquelle: xAI)
Grok 3 Beta und Grok 3 Mini Beta übertreffen im Schnitt OpenAIs GPT-4o und DeepSeek-V3 in standardisierten KI-Benchmarks. (Bildquelle: xAI)
Grok 3 Beta und Grok 3 Mini Beta übertreffen im Schnitt OpenAIs GPT-4o und DeepSeek-V3 in standardisierten KI-Benchmarks. (Bildquelle: xAI)
Grok 3 Beta (Think) und Grok 3 Mini Beta (Think) übertreffen generell alle anderen getesteten KI-Modelle. (Bildquelle: xAI)
Grok 3 Beta (Think) und Grok 3 Mini Beta (Think) übertreffen generell alle anderen getesteten KI-Modelle. (Bildquelle: xAI)
static version load dynamic
Loading Comments
Diesen Artikel kommentieren / Antworten
Teilen Sie diesen Artikel, um uns zu unterstützen. Jeder Link hilft!
Mail Logo
> Notebook Test, Laptop Test und News > News > Newsarchiv > News 2025-02 > Grok 3 von xAI setzt neue Maßstäbe in der KI-Leistung
Autor: David Chien, 21.02.2025 (Update: 21.02.2025)