Grok 3 von xAI setzt neue Maßstäbe in der KI-Leistung

xAI bringt mit der Grok 3-Familie eine hochmoderne KI auf den Markt. (Bildquelle: xAI)

Die neuesten großen xAI-Sprachmodelle haben die Benchmark-Charts angeführt, da sie in der Lage sind, das Internet nach Informationen zu durchsuchen, komplexe Probleme zu durchdenken und Eingaben mit einem Kontextfenster von einer Million Token zu verarbeiten. Die Grok-3-Modelle haben dabei in den meisten Benchmarks sowohl OpenAI GPT-4o als auch DeepSeek-V3 übertroffen.

David Chien (übersetzt von Carmen Pol), Veröffentlicht am 21.02.2025 🇺🇸 🇫🇷 ...

AI Software Launch

Elon Musks xAI hat die Grok-3-Familie von führenden KI-Großsprachmodellen auf den Markt gebracht, die in standardisierten KI-Benchmarks in der Regel besser abschneiden als andere KIs.

Die Grok-3-Modelle wurden auf dem Colossus-Supercomputer-Cluster des Unternehmens trainiert, das 100.000 Nvidia Hopper Tensor Core GPUs nutzt. Bereitgestellt wurden ein Paar Standard- und Mini-Modelle (Grok 3 Beta und Grok 3 Mini Beta) sowie ein Paar von Reasoning-Modellen (Grok 3 Beta (Think) und Grok 3 Mini Beta (Think)).

Diese nicht-logisch-denkenden Modelle übertreffen in der Regel die bisherigen Spitzenreiter der KI-Charts wie OpenAI GPT-4o und DeepSeek-V3. Ein Grund dafür ist, dass sie über ein Kontextfenster mit einer Million Token verfügen, das es der KI ermöglicht, riesige Mengen an Text zu verarbeiten. Dies verbessert die Fähigkeit der Modelle, die richtige Antwort aus einer Vielzahl von Quellen zu synthetisieren. Dennoch beantworten die Beta-Modelle von Grok 3 Fragen zur Faktensuche weiterhin mit einer Genauigkeit von weniger als 50 % (SimpleQA-Benchmark), sodass Menschen auch in Zukunft noch gefragt sein werden.

Die Rechenmodelle von Grok 3 durchdenken komplexe Aufforderungen Schritt für Schritt, sodass der Benutzer den Denkprozess der KI nachvollziehen kann. Dies ermöglicht es der KI, Probleme wie ein Experte zu bearbeiten, indem sie kleinere Teilprobleme löst und die Ergebnisse zu einer vollständigen Antwort kombiniert. Durch die Auswahl des DeepSearch-Agenten oder der Suchoption wird Grok 3 angewiesen, das Internet weit und breit zu durchsuchen und einen Code-Interpreter zu verwenden, bevor es Berichte erstellt, die die Ergebnisse zusammenfassen. Die Modelle von Grok 3 (Think) erzielen im Vergleich zu anderen KI-Lösungen besonders gute Ergebnisse bei der Lösung mathematischer Probleme, der Beantwortung von Multiple-Choice-Fragen auf Hochschulniveau und der Ausführung von Codierungsaufgaben.

xAI plant, Grok 3 in den kommenden Monaten auf einem Supercomputer-Cluster mit 200.000 GPUs weiter zu optimieren, um die Leistung weiter zu steigern. Grok 3 ist jetzt für alle Nutzer auf X und Grok.com verfügbar. Kostenlose Nutzer könnten auf Nutzungsbeschränkungen stoßen, während zahlende Nutzer Zugang zu erweiterten Funktionen haben.

Die ELO-Werte der Chatbot-Arena für die KI Grok 3 machen sie zur leistungsfähigsten der Welt. (Bildquelle: xAI)

Grok 3 Beta und Grok 3 Mini Beta übertreffen im Schnitt OpenAIs GPT-4o und DeepSeek-V3 in standardisierten KI-Benchmarks. (Bildquelle: xAI)

Grok 3 Beta (Think) und Grok 3 Mini Beta (Think) übertreffen generell alle anderen getesteten KI-Modelle. (Bildquelle: xAI)

Quelle(n)

xAI blog, xAI Colossus AI Supercomputer

Verwandte Artikel

X-KI stöhnt auf Wunsch (Bildquelle Imagen3)

Grok macht auf S3xy - die X-KI kommt im Sprachmodus mit etlichen Einstellungen und stöhnt auf Wunsch 26.02.2025

Mit der LLMjacking-Methode zielen Cyberkriminelle auf KI-Modelle ab um Schaden anzurichten (Quelle: Pixabay).

LLMjacking: Cyberkriminelle nehmen KI ins Visier 24.02.2025

DeepSeek fällt aufgrund der Verarbeitung personenbezogener Daten in den Anwendungsbereich des irischen Datenschutzgesetzes (Bildquelle: Generiert mit DALL-E 3)

Irische Behörde prüft DeepSeeks Datenverarbeitung 31.01.2025

Das KI-Modell Qwen 2.5 siegt über Deepseek (Bildquelle: KI-generiert)

Alibabas KI-Modell Qwen 2.5 Max übertrifft Deepseek 30.01.2025

Chinas OpenSource KI DeepSeek - eine Bedrohung für OpenAI (Bildquelle Imagen3)

Chinas Open-Source-KI DeepSeek ist eine ernsthafte Bedrohung für ChatGPT und Co 27.01.2025

Die offizielle Website von OpenAI Sora zeigt KI-generierte Videos (Bildquelle: Own)

OpenAI Sora: Text-zu-Video-Generator feiert pünktlichen Launch 11.12.2024

Offline-KI-gesteuerte Verarbeitung bald verfügbar (Bildquelle: Generiert mit DALL-E 3)

Cloudfreie KI Funktionen für mobile Endgeräte, dank SlimLM mit Adobe Unterstützung 22.11.2024

Obwohl die Zukunft noch unklar ist, ist die KI-Forschung in Kalifornien bisher nicht eingeschränkt (Bildquelle: Generiert mit DALL-E 3)

Kalifornien lässt KI noch etwas länger unreguliert 30.09.2024

Genmab-Mitarbeiter bei der Arbeit (Bildquelle: Genmab)

Das Biotech-Unternehmen Genmab startet eine „AI Everywhere“-Initiative, die von ChatGPT-Enterprise unterstützt wird 20.09.2024

OpenAI-CEO Sam Altman (Bildquelle: Korea Metro)

OpenAI wird angeblich mit 139,5 Milliarden Euro bewertet, während Verhandlungen über eine Investition von 6,045 Milliarden Euro laufen 12.09.2024

Sicheres KI-System (Bildquelle: Generiert mit DALL-E 3)

Ex-OpenAI-Forschungschef sichert 1 Mrd. Dollar für die Entwicklung sicherer KI-Systeme 05.09.2024

Nvidia Hopper H100 GPU (Bildquelle: Nvidia)

Elon Musks xAI aktiviert den Colossus: Trainingscluster mit 100.000 H100-GPUs geht online 05.09.2024

Loading Comments

Diesen Artikel kommentieren / Antworten

LK835ST: Neuer und heller Laser-Pro...

Acer 14-Zoll-Chromebook mit Intel-C...

Autor des Originals: David Chien - Tech Writer - 549 Artikel auf Notebookcheck veröffentlicht seit 2023

Ich habe bei Activision, UCLA, Anime Expo und anderen gearbeitet und gesehen, wie Technologie eingesetzt wird, um Leben zu retten, Spiele zu entwickeln und fantastische 3D VR/AR-Welten zu schaffen. Bei neuen Technologien gibt es immer etwas, das mir Spaß macht, und alle meine Freunde wenden sich stets an mich, um das Beste für ihre Bedürfnisse zu finden. Daher freue ich mich, meine Erfahrung bei Notebookcheck einzubringen.

Übersetzer: Carmen Pol - Translator - 624 Artikel auf Notebookcheck veröffentlicht seit 2023

Nachdem ich den größten Teil meiner frühen Jahre in Deutschland verbracht hatte, wurde meine Erziehung als zweisprachiges Kind erleichtert. Im Jahr 2007 fand ich mich wöchentlich gezwungen, mein Windows-Betriebssystem neu zu installieren ... Also besorgte ich mir eines Tages ein MacBook Black. Es war während dieser Zeit, dass ich eine tiefe Wertschätzung für Technologie entwickelte, die mein Leben erheblich verbesserte.

Teilen Sie diesen Artikel, um uns zu unterstützen. Jeder Link hilft!

> Notebook Test, Laptop Test und News > News > Newsarchiv > News 2025-02 > Grok 3 von xAI setzt neue Maßstäbe in der KI-Leistung

Autor: David Chien, 21.02.2025 (Update: 21.02.2025)