Grok 3: Funktionen, Zugang, O1 und R1 im Vergleich & mehr

Erfahre mehr über Grok 3, das neueste KI-Modell von xAI, und finde heraus, wie es im Vergleich zu o1 von OpenAI und R1 von DeepSeek abschneidet.

Aktualisierte 18. Feb. 2025 · 8 Min. Lesezeit

Nachdem Elon Musk letzte Woche ein Angebot zum Kauf von OpenAI gemacht hatte, veröffentlichte er Grok 3 über sein Unternehmen xAI und nannte es "die derzeit leistungsfähigste KI der Welt". Wenn die Benchmarks der Live-Demo stimmen, könnte er Recht haben.

Grok 3 betritt das wachsende Feld der Argumentationsmodelle und konkurriert mit OpenAIs o1 und DeepSeek's R1. Im Gegensatz zu allgemeinen Modellen wie chatGPT, die direkt Antworten generieren, zeigen Denkmodelle ihren Denkprozess, indem sie Probleme Schritt für Schritt aufschlüsseln, bevor sie zu einer Schlussfolgerung kommen.

Es sieht jedoch so aus, als würde xAI Grok 3 sowohl als Denkmodell als auch als generalistische KI positionieren. Wenn der Denkmodus ausgeschaltet ist (mehr dazu später), funktioniert er wie ein GPT-4o oder ein Claude 3.5 Sonnet - schnell, unterhaltsam und für allgemeine Aufgaben geeignet. Aber wenn du den Denkmodus aktivierst, wird es zu einem Denkmodell.

Wenn du keine Zeit hattest, dir die einstündige Live-Demo von Grok 3 anzusehen, mach dir keine Sorgen - ich werde das Wesentliche für dich zusammenfassen.

KI-Upskilling für Einsteiger

Lerne die Grundlagen von KI und ChatGPT von Grund auf.

KI kostenlos lernen

Was ist Grok 3?

Grok 3 ist das neueste KI-Modell von xAI, das als direkter Konkurrent zu o1 von OpenAI und R1 von DeepSeek positioniert ist. Das xAI-Team behauptet, dass es 10 bis 15 Mal leistungsfähiger ist als Grok 2. Und basierend auf den Benchmarks, die in der Demo präsentiert wurden, könnte es tatsächlich mit den besten Modellen auf dem Markt mithalten.

Quelle: xAI

Wie unterscheiden sich die Argumentationsmodelle?

Wenn du ChatGPT, Claude oder Gemini benutzt hast, weißt du, wie die meisten KI-Modelle funktionieren: Du stellst eine Frage, sie generieren eine Antwort, und das war's.

Reasoning-Modelle wie Grok 3 verfolgen einen anderen Ansatz. Anstatt sofort eine Antwort auszuspucken, schlüsseln sie Probleme Schritt für Schritt auf, zeigen ihre Zwischenüberlegungen und verfeinern sogar ihre Ergebnisse, bevor sie eine endgültige Antwort präsentieren. Das macht sie besonders leistungsfähig für Aufgaben wie Mathematik, Programmieren und das Lösen von Problemen in der realen Welt.

Quelle: xAI

Grok 3 Mini

Nicht jede Aufgabe erfordert die umfassende Argumentation von Grok 3. Grok 3 mini ist auf Geschwindigkeit und geringeren Rechenaufwand optimiert, behält aber trotzdem die Denkfähigkeiten von Grok 3 bei.

Grok 3 mini kann besonders für Entwickler nützlich sein, die ihre Ausgaben für die Verwendung von Token bei der Nutzung der API optimieren wollen.

Wir könnten auch zu Grok 3 Mini wechseln, um eine schnellere Antwort im Chat-Interface zu erhalten. Anhand der Benchmarks wird es nicht viele Fragen geben, die er nicht beantworten kann.

Grok 3 Denkmodus

Der Denkmodus ist eine optionale Einstellung, die den mehrstufigen Denkprozess von Grok 3 aktiviert. Anstatt direkt eine Antwort zu geben, zerlegt es Probleme in kleinere Schritte, prüft verschiedene Lösungen und verfeinert seine Antwort, bevor es ein endgültiges Ergebnis ausgibt.

Dieser Modus ist besonders nützlich für komplexe Problemlösungen, mathematische Beweise, Programmieraufgaben und logikbasierte Aufgaben. Sie ahmt das strukturierte Denken des Menschen nach und ist damit ideal für Situationen, in denen die Qualität des Denkens wichtiger ist als die Geschwindigkeit.

Soweit ich das beurteilen kann, positioniert xAI Grok 3 sowohl als Denkmodell als auch als allgemeines Modell. Wenn der Denkmodus ausgeschaltet ist, verhält er sich eher wie GPT-4o oder Claude 3.5 Sonnet-schnell, unterhaltsam und für den allgemeinen Gebrauch optimiert. Aber wenn der Denkmodus aktiviert ist, schaltet er in den Denkmodus um und zerlegt komplexe Probleme Schritt für Schritt.

Dieser hybride Ansatz wird noch deutlicher, wenn man sich die Benchmarks ansieht. xAI hat Grok 3 nicht nur mit Reasoning-Modellen wie OpenAIs O1 oder DeepSeek R1 verglichen, sondern auch mit generalistischen Modellen wie GPT-4o, DeepSeek-V3 und Claude 3.5 Sonnet. Das deutet darauf hin, dass sie in beiden Kategorien konkurrieren wollen und sich nicht nur auf eine beschränken.

Quelle: xAI

Grok 3 Big Brain Modus

Der Big Brain-Modus ist die Hochleistungseinstellung von Grok 3, die zusätzliche Rechenressourcen für anspruchsvolle Aufgaben zur Verfügung stellt.

Wenn diese Funktion aktiviert ist, braucht Grok 3 länger, um Abfragen zu bearbeiten, liefert aber eine höhere Genauigkeit, tiefere Einblicke und detailliertere Antworten. Dieser Modus ist besonders nützlich für wissenschaftliche Forschung, vielschichtige KI-Aufgaben und hochkomplexe Problemlösungsszenarien, bei denen die Standardinferenz nicht ausreicht.

Grok 3 DeepSearch

DeepSearch ist das in xAI integrierte Recherchetool, mit dem Grok 3 das Internet durchsucht, Quellen verifiziert und Informationen in Echtzeit zusammenfasst, bevor es eine Antwort gibt.

Im Gegensatz zu herkömmlichen KI-Modellen, die sich auf vortrainierte Daten stützen, zieht DeepSearch frische Informationen heran und ist damit ideal für Nachrichten, Markttrends, technische Recherchen und Faktenchecking. Dieser Modus positioniert Grok 3 als Konkurrent zu Geminis Deep Research und OpenAI's Deep Research.

Quelle: xAI

Wie wurde Grok 3 entwickelt?

Grok 3 basiert auf umfangreichen Infrastruktur-Upgrades, neuen Trainingstechniken und einer massiven Steigerung der Rechenleistung. Im Gegensatz zu seinen Vorgängern, die auf relativ begrenzter Hardware trainiert wurden, hat xAI jetzt einen der größten KI-Trainingscluster der Welt aufgebaut, um die Entwicklung von Grok 3 zu unterstützen.

Quelle: xAI

Colossus: Der maßgeschneiderte Supercomputer von xAI

Eine der größten Herausforderungen beim Training umfangreicher KI-Modelle ist die Verfügbarkeit von Rechenleistung. Um dies zu umgehen, hat xAI einen eigenen Supercomputer-Cluster namens Colossus gebaut (du kannst das Lagerhaus auf dem Bild oben sehen).

In der ersten Phase, die in nur 122 Tagen abgeschlossen wurde, kamen 100.000 H100-GPUs zum Einsatz, was ihn zu einem der größten KI-Trainingscluster der Welt macht.

In der zweiten Phase verdoppelte xAI die Rechnerkapazität in weiteren 92 Tagen. Diese Infrastruktur ermöglicht ein kontinuierliches Training, d.h. Grok 3 wird in Echtzeit verbessert, wenn mehr Benutzer damit interagieren.

Von Grok 0 bis Grok 3

Grok 1 wurde im November 2023 veröffentlicht, und obwohl sie Persönlichkeit hatte, war sie nicht annähernd so gut wie GPT-4o oder Claude 3.5 Sonnet. Grok 2 folgte nur wenige Monate später und wies erhebliche Verbesserungen auf, blieb aber immer noch hinter den Spitzenmodellen zurück.

Quelle: xAI

Grok 3 markiert jedoch einen viel größeren Sprung. Das Team behauptet, dass Grok 3 10-15 Mal leistungsfähiger ist als Grok 2, sowohl dank verbesserter Modelle als auch dank einer drastischen Steigerung der Trainingsberechnungen.

Grok 3 Benchmarks

xAI behauptet, Grok 3 sei eines der leistungsstärksten KI-Modelle, die es bisher gibt, und die Benchmarks aus der Live-Demo lassen vermuten, dass es tatsächlich mit den Besten mithalten kann. Schauen wir uns die Ergebnisse in den Bereichen Mathematik, Naturwissenschaften und Code an, um zu sehen, wie es im Vergleich zu GPT-4o, Claude 3.5 Sonnet, Gemini-2 Pro und DeepSeek-V3 sowie zu anderen Reasoning-Modellen wie O1 und DeepSeek-R1 abschneidet.

Leistung gegenüber generalistischen Modellen

Der erste Satz von Benchmarks vergleicht Grok 3 und Grok 3 Mini mit anderen Allzweckmodellen.

Quelle: xAI

Grok 3 führt in allen Kategorien mit großem Abstand, aber Mathematik, Wissenschaft und Programmierung machen nur einen Bruchteil der Anwendungsfälle des Generalistenmodells aus - die Menschen verlassen sich auch beim Schreiben, Analysieren von Berichten, beim Kundensupport und vielem mehr auf das Modell.

Es wäre interessant zu sehen, wie Grok 3 bei Benchmarks wie MMLU (breites Wissen über 57 Themen), BBH (komplexes Denken und abstraktes Problemlösen) oder TruthfulQA (Genauigkeit bei der Beantwortung mehrdeutiger oder kontroverser Fragen) abschneidet, um ein vollständigeres Bild seiner Fähigkeiten in der Praxis zu bekommen.

Leistung gegenüber Argumentationsmodellen

Wenn die Denkfähigkeiten von Grok 3 voll ausgeschöpft werden - das heißt, wenn der Denkmodus und der Big-Brain-Modus aktiviert sind -, steigt die Leistung des Modells deutlich an. Dieser zweite Satz von Benchmarks vergleicht Grok 3 Reasoning Beta und Grok 3 mini Reasoning mit anderen fortgeschrittenen Denkmodellen, darunter O1, DeepSeek-R1 und Gemini-2 Flash Thinking.

Quelle: xAI

Die Denkfähigkeiten von Grok 3 lassen seine Matheleistung auf 93-96 steigen, ein gewaltiger Sprung gegenüber dem Generalistenmodus (52).

Auch in den Bereichen Naturwissenschaften und Kodierung verbessert sich das Ergebnis deutlich und übertrifft o1, DeepSeek-R1 und Gemini-2 Flash Thinking.

Grok 3 mini Reasoning schneidet bei Denkaufgaben genauso gut ab wie die volle Grok 3 (oder sogar noch besser - zugegeben, die Grafik ist mit den farbigen Ebenen etwas verwirrend), was bedeutet, dass auch die kleinere Variante beim Lösen komplexer Probleme konkurrenzfähig ist.

Wie kann ich auf Grok 3 zugreifen?

xAI führt Grok 3 schrittweise ein und erwartet eine breitere Verfügbarkeit in den kommenden Monaten. Wir werden Grok 3 in einer chatbasierten Schnittstelle und über die API nutzen können.

Chat-basierte Schnittstelle

Das Modell ist derzeit in X (früher Twitter) integriert und für Premium+ Abonnenten verfügbar. Die Nutzerinnen und Nutzer können mit ihm direkt auf der Plattform chatten, ähnlich wie bei früheren Grok-Versionen. Du findest den Grok-Button im Menü auf der linken Seite:

Jenseits von X, xAI hat begonnen grok.comeine eigenständige Weboberfläche, auf der die Nutzer/innen mit dem Modell außerhalb der Social Media-Plattform interagieren können. Der Zugang zu Grok über diese Website ist in der EU und Großbritannien noch nicht verfügbar.

Außerdem gibt es eine eigene mobile Appdie aber nur auf iOS verfügbar ist.

Grok 3 API

Zum Zeitpunkt der Veröffentlichung dieses Artikels ist Grok 3 noch nicht über die API veröffentlicht worden, aber es wird wahrscheinlich bald verfügbar sein. Werfen Sie ein Auge auf die Modelle-Seite für die neuesten Updates.

Fazit

Grok 3 ist mit Sicherheit die bisher ehrgeizigste Veröffentlichung von xAI, aber ich bin gespannt, wie sie sich außerhalb ihrer eigenen Demo-Benchmarks schlägt. Im Moment sieht es wie ein solides Denkmodell aus, das mit OpenAI und DeepSeek beim Lösen von mehrstufigen Problemen konkurriert.

Der hybride Ansatz, bei dem zwischen schnellen, dialogorientierten Antworten und tiefergehenden Überlegungen im Denkmodus gewechselt werden kann, macht auf dem Papier Sinn. Aber ich würde gerne sehen, wie gut es über Mathematik, Programmierung und Naturwissenschaften hinaus verallgemeinert werden kann, vor allem bei Aufgaben wie Schreiben, Zusammenfassen und Recherchieren in der realen Welt.

Welche zukünftigen Entwicklungen sind für Grok 3 geplant?

Gibt es geografische Einschränkungen für den Zugang zu Grok 3?

Welche Abo-Optionen gibt es für den Zugang zu Grok 3?

Ist Grok 3 in der Lage, multimodale Eingaben zu verarbeiten?

Themen

Künstliche Intelligenz

Große Sprachmodelle

Lerne KI mit diesen Kursen!

Lernpfad

KI-Grundlagen für Unternehmen

0 Min.

Beschleunige deinen Einstieg in die KI, meistere ChatGPT und entwickle eine umfassende KI-Strategie.

Siehe Details

Kurs starten

Lernpfad

OpenAI Grundlagen

0 Min.

Beginne mit der Erstellung von KI-Systemen mit Modellen von OpenAI. Lerne, wie du die OpenAI-API nutzt, um die GPT- und Whisper-Modelle von OpenAI aufzurufen.

Siehe Details

Kurs starten

Lernpfad

Llama-Grundlagen

0 Min.

Experimentiere mit Llama 3, um Inferenzen auf vortrainierten Modellen durchzuführen, sie auf benutzerdefinierten Datensätzen abzustimmen und die Leistung zu optimieren.

Siehe Details

Kurs starten

Verwandt

Der Blog

Top 30 Generative KI Interview Fragen und Antworten für 2024

Dieser Blog bietet eine umfassende Sammlung von Fragen und Antworten zu generativen KI-Interviews, die von grundlegenden Konzepten bis hin zu fortgeschrittenen Themen reichen.

Hesam Sheikh Hassani

15 Min.

Der Blog

Lehrer/innen und Schüler/innen erhalten das Premium DataCamp kostenlos für ihre gesamte akademische Laufbahn

Keine Hacks, keine Tricks. Schüler/innen und Lehrer/innen, lest weiter, um zu erfahren, wie ihr die Datenerziehung, die euch zusteht, kostenlos bekommen könnt.

Nathaniel Taylor-Leach

4 Min.

Der Blog

Die 20 besten Snowflake-Interview-Fragen für alle Niveaus

Bist du gerade auf der Suche nach einem Job, der Snowflake nutzt? Bereite dich mit diesen 20 besten Snowflake-Interview-Fragen vor, damit du den Job bekommst!

Nisha Arya Ahmed

15 Min.

Der Blog

Q2 2023 DataCamp Donates Digest

DataCamp Donates hat im zweiten Quartal 2023 über 20.000 Stipendien an unsere gemeinnützigen Partner vergeben. Erfahre, wie fleißige benachteiligte Lernende diese Chancen in lebensverändernde berufliche Erfolge verwandelt haben.

Nathaniel Taylor-Leach

Der Blog

2022-2023 DataCamp Classrooms Jahresbericht

Zu Beginn des neuen Schuljahres ist DataCamp Classrooms motivierter denn je, das Lernen mit Daten zu demokratisieren. In den letzten 12 Monaten sind über 7.650 neue Klassenzimmer hinzugekommen.

Nathaniel Taylor-Leach

8 Min.

Mehr anzeigen Mehr anzeigen

KI-Upskilling für Einsteiger

Was ist Grok 3?

Wie unterscheiden sich die Argumentationsmodelle?

Grok 3 Mini

Grok 3 Denkmodus

Grok 3 Big Brain Modus

Grok 3 DeepSearch

Wie wurde Grok 3 entwickelt?

Colossus: Der maßgeschneiderte Supercomputer von xAI

Von Grok 0 bis Grok 3

Grok 3 Benchmarks

Leistung gegenüber generalistischen Modellen

Leistung gegenüber Argumentationsmodellen

Wie kann ich auf Grok 3 zugreifen?

Chat-basierte Schnittstelle

Grok 3 API

Fazit

FAQs

Welche Abo-Optionen gibt es für den Zugang zu Grok 3?

Ist Grok 3 in der Lage, multimodale Eingaben zu verarbeiten?

Top 30 Generative KI Interview Fragen und Antworten für 2024

Lehrer/innen und Schüler/innen erhalten das Premium DataCamp kostenlos für ihre gesamte akademische Laufbahn

Die 20 besten Snowflake-Interview-Fragen für alle Niveaus

Q2 2023 DataCamp Donates Digest

2022-2023 DataCamp Classrooms Jahresbericht

.css-1531qan{-webkit-text-decoration:none;text-decoration:none;color:inherit;}KI-Grundlagen für Unternehmen

OpenAI Grundlagen

Llama-Grundlagen

Top 30 Generative KI Interview Fragen und Antworten für 2024

Lehrer/innen und Schüler/innen erhalten das Premium DataCamp kostenlos für ihre gesamte akademische Laufbahn

Die 20 besten Snowflake-Interview-Fragen für alle Niveaus

Q2 2023 DataCamp Donates Digest

2022-2023 DataCamp Classrooms Jahresbericht

KI-Grundlagen für Unternehmen