Elon Musks xAI startet Grok 4 und erklärt es zur intelligentesten KI aller Zeiten

Elon Musks KI-Unternehmen, xAI, hat Grok 4 vorgestellt, sein neuestes und leistungsstärkstes künstliches Intelligenzmodell (KI) bis jetzt, und behauptet, dass es nun in den Bereichen akademische Fähigkeiten, logisches Denken und Programmierung führend ist.

Musk ließ sich nicht zurückhalten und nannte es während eines Livestreams auf X (ehemals Twitter) am späten Mittwochabend die “intelligenteste KI der Welt”.

Neben Grok 4 hat xAI auch Grok 4 Heavy eingeführt, eine fortschrittlichere Variante, die mehrere KI-Agenten nutzt, die wie eine virtuelle “Studiengruppe” zusammenarbeiten, um komplexe Aufgaben zu lösen. Die Veröffentlichung kommt auch mit einem neuen Premium-Abonnementplan: SuperGrok Heavy, der den Zugang zu diesem leistungsstarken Modell für 300 $ pro Monat bietet.

Benchmark-Kämpfe: Grok gegen die Wettbewerber

Laut xAI haben sowohl Grok 4 als auch sein verbessertes Pendant, Grok 4 Heavy, bedeutende Konkurrenten wie Googles Gemini 2.5 Pro und OpenAIs o3-high in einer Vielzahl von führenden KI-Leistungsbenchmarks übertroffen:

Letzte Prüfung der Menschheit (HLE): - Grok 4 erzielte 4 % ohne Werkzeuge und übertraf Gemini 2.5 Pro (21,6 %) und o3-high (21 %).
Grok 4 Heavy, mit Werkzeugen, erreichte 4 %, weit vor Geminis 26,9 %.
ARC-AGI-2 (Mustererkennungstest): - Grok 4 erzielte 2 %, fast doppelt so viel wie das nächstbeste Modell, Claude Opus 4.
MMLU (massive Multitasking-Sprachverständnis): - Grok 4 erreichte eine Genauigkeit von 6 % und einen Intelligenzindex von 73 und führte die Charts an.

„Grok 4 ist das erste Mal, dass eine KI in meiner Erfahrung in der Lage war, schwierige, reale Ingenieurfragen zu lösen, bei denen die Antworten nirgendwo im Internet oder in Büchern zu finden sind. Und es wird viel besser werden“, postete Musk auf X.

Im Bereich STEM und Programmierung scheint das Modell sogar noch stärker zu sein:

Grok 4 Heavy erzielte 100 % im AIME, einem anspruchsvollen Mathematiktest auf Gymnasialniveau, während Grok 4 98,8 % erreichte.
Bei GPQA erzielte Grok 4 87,5 %, während die Grok 4 Heavy-Variante mit 88,9 % leicht besser abschnitt.
Für Programmierer kündigte xAI die kommende Grok 4 Code an, die im August 2025 auf den Markt kommen soll und bereits eine Genauigkeit von 72–75 % im SWE-bench zeigt.

Während er PhDs mit Grok 4 verglich, sagte Musk, dass „Grok 4 postgradual ist, wie PhD-Niveau, in allem. Besser als PhD – keine Ausnahmen. Die meisten PhDs würden scheitern, wo Grok 4 bestehen würde.“

Obwohl er zugab, dass es immer noch Schwierigkeiten mit gesundem Menschenverstand hat und keine neuen Technologien oder neue Physik erfunden hat – „noch“ – aber das ist nur eine Frage der Zeit.

Neue Preisgestaltung

Die Preisgestaltung für die Grok 4 API wird die gleiche sein wie die ihres Vorgängers – 3 $ pro Million Eingabetokens und 15 $ pro Million Ausgabetokens (0,75 $ pro 1M zwischengespeicherten Eingabetokens).

Die größere Überraschung liegt jedoch in der aktualisierten Abonnementreihe von xAI:

Kostenloses Niveau gibt Benutzern eingeschränkten Zugang zu Grok 3.
SuperGrok-Plan (30 $/Monat) freischaltet den Zugang zu sowohl Grok 3 als auch dem neuen Grok 4.
SuperGrok Heavy (300 $/Monat) bietet v ollen Zugang zu Grok 4 Heavy, Grok 4 und Grok 3 sowie frühzeitige Einblicke in kommende Funktionen.

Grok 4 im Wettbewerb mit GPT-5?

xAIs Bestreben, den KI-Bereich zu dominieren, kommt kurz vor der erwarteten Einführung von OpenAIs GPT-5 später in diesem Sommer. Während die starke Leistung von Grok 4 schwer zu ignorieren ist, bleibt die Frage, ob Unternehmen und Kunden die jüngsten Kontroversen übersehen und Musks Plattform wählen.

Erhalte neue Beiträge in deinem Posteingang.