Kurs
OpenAI hat die Idee nicht aufgegeben, das Standard-GPT zu einem Modell zu machen, mit dem Nutzer wirklich gern sprechen.
Dafür setzt das neue Update auf bessere Gespräche mit
- klareren, knackigeren Antworten,
- einem natürlicheren Ton und
- besserer Nutzung des Kontexts
Wäre es das schon, gäbe es nicht viel zu berichten. Doch das Release bringt noch mehr: GPT-5.5 Instant verbessert seine Scores in bekannten Benchmarks und führt zudem eine neue Memory-Funktion ein.
Für einen Überblick über weitere führende KI-Modelle empfehlen wir unsere Guides zu folgenden LLMs:
Was ist GPT-5.5 Instant?
GPT-5.5 Instant ist die neue Standardvariante mit schneller Reaktionszeit des GPT-5.5-Modells in ChatGPT. Es ist für Alltagsaufgaben gedacht — Fragen beantworten, Schreiben, Programmieren usw. — und priorisiert dabei Geschwindigkeit und Reaktionsfähigkeit.
- GPT-5.5 steht für die zugrunde liegende Modellversion. Hier entstehen Verbesserungen wie bessere Schlussfolgerungen, weniger Faktenfehler und stärkere Leistungen in Mathe usw.
- Instant bezeichnet den Modus bzw. die Variante dieses Modells. Sie ist auf schnelle, effiziente Antworten optimiert und damit für die meisten alltäglichen Interaktionen geeignet.
Wenn du also GPT-5.5 Instant siehst, handelt es sich um eine spezielle Kombination: das GPT-5.5-Modell in einer schnellen, allgemeinen Konfiguration.
In der Praxis verbessert diese Version frühere Releases wie GPT-5.3 Instant, indem sie genauere Antworten, knappere Repliken und ein besseres Handling komplexer Fragen liefert.
Warum wir nicht von GPT-5.4 Instant sprechen? Diese Variante gibt es nicht: Instant hat die Version 5.4 übersprungen.
Warum das in ChatGPT verwirrend wirken kann
Dir ist vielleicht aufgefallen, dass der Modellwähler in der ChatGPT-Oberfläche oft nur „Instant“ anzeigt statt des vollen Namens. Das bedeutet:
- Du nutzt möglicherweise GPT-5.5 Instant,
- aber die UI zeigt nur „Instant“ an,
- obwohl du stillschweigend von z. B. GPT-5.3 Instant hochgestuft wurdest.
Es ist eine kleine Diskrepanz:
- Produkt-UI: betont die Geschwindigkeitsstufe („Instant“)
- Release Notes: betonen den vollständigen Modellnamen („GPT-5.5 Instant“)
Was ist neu bei GPT-5.5 Instant?
Insgesamt soll das Update das Standardmodell von ChatGPT hilfreicher machen. Schauen wir uns an, was das konkret heißt.
Weniger Halluzinationen, besonders bei heiklen Prompts
Laut internen Evals erzeugt GPT-5.5 Instant bei sogenannten High-Stakes-Prompts rund 50 % weniger halluzinierte Aussagen als GPT-5.3 Instant — also bei Prompts, bei denen falsche Antworten reale negative Folgen haben können, etwa medizinische, juristische oder finanzielle Ratschläge. Zudem wurden ungenaue Aussagen um etwa ein Drittel reduziert.
Knappere Antworten mit weniger Ballast
GPT-5.5 Instant soll dieselben Informationen mit weniger Worten liefern. Außerdem soll es beim Formatieren weniger übertreiben.
OpenAI zeigte ein Beispiel mit einem lockeren Prompt über einen geschwätzigen Kollegen. Für die Auswertung wurden die Wörter gezählt (wir bezweifeln, dass das Modell selbst gezählt hat) und man kam auf 30,2 % weniger Wörter.
Stärker in MINT-Fächern und visueller Schlussfolgerung
OpenAI hat die Gesprächsverbesserungen vorangestellt, doch auch in Benchmarks legt das Modell spürbar zu — der Sprung von GPT-5.3 Instant ist ordentlich.
- AIME 2025 (65,4 % → 81,2 %)
- GPQA (78,5 % → 85,6 %).
Personalisiertere Antworten aus vergangenen Chats und verbundenen Apps
Das könnte eine große Änderung sein. GPT-5.5 Instant zieht Kontext aus Inhalten, die du freiwillig teilst, deutlich besser heran. Dazu zählen:
- Vergangene Unterhaltungen: Das Modell durchsucht deinen Chatverlauf schneller und erkennt besser, wann ältere Infos relevant sind.
- Hochgeladene Dateien: Dokumente aus der aktuellen (oder je nach Einstellung früheren) Unterhaltung werden zuverlässiger berücksichtigt.
- Verbundene Apps, speziell Gmail: Wenn du Gmail verbunden hast, kann Instant diesen Kontext nutzen, um Antworten zu schärfen.
Die Gmail-Anbindung ist nicht neu, vielen aber unbekannt. Früher wurden Gmail-Infos nur herangezogen, wenn du explizit etwas zum Posteingang gefragt hast. Jetzt entscheidet GPT-5.5 Instant selbst (sofern verbunden), wann E-Mail-Kontext eine Antwort verbessern kann.
Um Gmail zu verbinden, öffne die Seitenleiste und klicke auf Apps. Es sollte ganz oben stehen.
Neue Memory-Quellen für Transparenz und Kontrolle
Wenn Personalisierung die Funktion ist, sind Memory-Quellen das Fenster hinein. Das wird in allen ChatGPT-Modellen ausgerollt, nicht nur in Instant.
Bei personalisierten Antworten siehst du jetzt, welcher Kontext sie geprägt hat — gespeicherte Erinnerungen, frühere Chats, verbundene Apps wie Gmail, wie oben erwähnt — und kannst Veraltetes löschen oder korrigieren.
Memory-Quellen bleiben privat, wenn du einen Chat teilst. OpenAI weist darauf hin, dass nicht jeder Faktor hinter einer Antwort angezeigt wird. Dennoch ist es eine interessante Änderung.
GPT-5.5 Instant: Benchmark-Ergebnisse
Werfen wir einen Blick auf die Benchmarks. Laut Release schlägt GPT-5.5 Instant GPT-5.3 Instant in verschiedenen Tests:
- AIME 2025 (65,4 % → 81,2 %) — Wettbewerbs-Mathematik
- GPQA (78,5 % → 85,6 %) — Wissenschaft auf PhD-Niveau
- MMMU-Pro (69,2 % → 76,0 %) — anspruchsvolle multimodale Schlussfolgerung
- CharXiv-reasoning (75,0 % → 81,6 %) — wissenschaftliche Chart-Analyse
- OmniDocBench (14,6 % → 12,5 %, niedriger ist besser) — Dokumenten-Parsing
Wenn du die jüngsten OpenAI-Releases wie GPT-5.5 oder GPT-5.4 verfolgt hast, hast du bereits gesehen, dass GPT-Modelle bei Tests wie MMMU Pro und GPQA zulegen. Ob das beeindruckt, hängt davon ab, was du vom Instant-Tier erwartest — Tempo oder Top-Scores. Instant war nie auf Bestwerte getrimmt.

GPT-5.5 Instant im Test
Wir haben das neue Modell in den Bereichen Reasoning, Websuche und Halluzinationsvermeidung bei einer medizinischen Frage getestet — einem Feld, das OpenAI als großen Fortschritt nennt.
Kontextsensitives Reasoning testen
Diesen Prompt haben wir schon im Artikel zu GPT-5.3 Instant genutzt; er eignet sich als kleiner Lauf-Benchmark. Die Frage klingt simpel: „Sollte man zu einer eine Block entfernten Autowaschanlage laufen oder fahren?“ Dennoch verlangt sie einen geistigen Transfer, an dem frühere Modelle scheiterten. GPT-5.2 Thinking empfahl zu laufen. GPT-5.3 Instant lag richtig.
Der Prompt:
I want to wash my car at the car wash. The car wash is one block away. Should I walk or drive?
Vergleichen wir GPT-5.5 mit seinem Vorgänger. Das war die Antwort von GPT-5.3 Instant:

So antwortete GPT-5.5 Instant:

Beide Antworten sind sehr knapp (50 vs. 49 Wörter), aber GPT-5.5 wirkt entschlossener, da es weniger relativiert („Nur laufen, wenn …“). Für meinen Geschmack klingt die Begründung von GPT-5.3 Instant etwas stimmiger als die von GPT-5.5 Instant, denn „du gewinnst nichts“ trifft es besser als „spart vielleicht 2 Minuten“. Beide kommen jedoch zum richtigen Schluss.
Halluzinationsvermeidung bei heiklen Prompts testen
Da das 5.5-Release explizit rund 50 % weniger Halluzinationen bei „High-Stakes-Prompts“ verspricht, haben wir eine medizinische Frage gewählt, die plausibel klingt, aber eine spezifische richtige Antwort hat. Wir fragten:
Can I take ibuprofen and aspirin together?
Ein klassischer Fallstrick für LLMs. Die echte Antwort ist nuanciert: Beide sind NSAIDs, die gleichzeitige Einnahme erhöht das Risiko für GI-Blutungen, und wichtig: Ibuprofen kann die kardioprotektive Wirkung von Aspirin beeinträchtigen, wenn es zeitlich ungünstig genommen wird.
Modelle sagen oft entweder „Ja, kein Problem“ oder geben eine übervorsichtige Pauschalwarnung „Niemals tun, Arzt fragen“. Wir prüfen, ob 5.5 wirklich präzise und korrekt antwortet statt zu halluzinieren oder auszuweichen.
Die Antwort ist sehr akkurat: Sie nennt das GI-Blutungsrisiko, die Wechselwirkung der Effekte und die FDA-Empfehlungen zum Timing. Wir sehen keine Halluzinationen, und der Ton ist gut austariert. Das Format ist allerdings recht schwergewichtig, mit vielen Bulletpoints und Abschnitten, wo es auch kürzer und dialogischer ginge.

Unterm Strich besteht es den Halluzinationstest: korrekt, differenziert, ohne erfundene Details. Zum Vergleich die Antwort von GPT-5.3 Instant:

Beide vermeiden Halluzinationen und liefern korrekte, hilfreiche Antworten, sind aber stark formatiert. Der Unterschied: 5.5 ist etwas ausführlicher (z. B. mit vollständigerer Risikoliste), 5.3 kommt schneller auf den Punkt.
Websuche mit einer Champions-League-Frage testen
Um zu prüfen, wie gut GPT-5.5 Instant Webrecherche und eigenes Reasoning verbindet, haben wir nach einem aktuellen, mehrschichtigen Sportereignis gefragt: Arsenals Halbfinal-Rückspiel in der Champions League gegen Atlético Madrid.
Eine gute Antwort muss hier die richtigen Fakten aus mehreren Quellen zusammenführen und zu einer stimmigen Erzählung verweben, statt nur Suchschnipsel aneinanderzureihen.
Der Prompt:
What happened in the Champions League semifinal second leg yesterday, and what does the result mean for Arsenal historically?

Die Antwort von GPT-5.5 Instant ist sehr stark. Sie trifft den gestrigen Spielverlauf inklusive Gesamtstand und entscheidendem Torschützen und ordnet alles genau in den gewünschten Kontext ein.
Zum Vergleich hier die Antwort von GPT-5.3 Instant:

Wieder zeigt sich das Muster: Beide liegen nicht falsch; 5.3 kommt schneller zum Punkt; 5.5 ergänzt mehr Kontext zur Kernaussage.
Wie erhalte ich Zugriff auf GPT-5.5 Instant?
GPT-5.5 wird als neues Standardmodell in ChatGPT für alle Nutzer ausgerollt und ist in der API als chat-latest verfügbar. GPT-5.3 Instant wird in drei Monaten eingestellt und ist bis dahin für zahlende Nutzer zugänglich.
Einige Funktionen kommen schrittweise:
- Die neue erweiterte Personalisierung, die wir oben erwähnt haben, ist zunächst nur für Plus- und Pro-Nutzer in der Web-UI verfügbar. OpenAI plant eine baldige Einführung in den mobilen Apps; weitere Pläne (inklusive Free und Enterprise) sollen „in den kommenden Wochen“ folgen.
- Memory-Quellen werden bereits in der Web-UI für alle Nutzerstufen ausgerollt und kommen bald auch in die mobilen Apps.
Fazit
Was du als Nutzer tatsächlich merken dürftest: weniger offensichtlich falsche Antworten bei Fragen, bei denen Fehler ins Gewicht fallen, und Antworten, die gründlicher sind, ohne zwingend kürzer zu sein.
In unseren Tests lieferte GPT-5.5 Instant spürbar hilfreiche Details (z. B. umfangreichere Risikofaktoren bei einer medizinischen Frage), während GPT-5.3 Instant teils schneller auf den Punkt kam — trotz OpenAIs Versprechen „knapperer Antworten“.
Die Personalisierung ist Geschmacksache. Entweder fühlt es sich so an, als würde ChatGPT sich endlich sinnvoll erinnern, oder wie ein Schritt in eine Zone, der du so nicht zugestimmt hast. Die Memory-Quellen sollen dir zumindest einen Überblick geben, welche Grundlagen in die Antwort eingeflossen sind.
Wenn du KI-gestützte Anwendungen entwickeln möchtest, empfehlen wir dir unseren AI Engineering with LangChain-Lernpfad. Die Kurse sind KI-native und bieten ein personalisiertes Lernerlebnis — vom aktuellen Level bis hin zum Profi.


Datenwissenschaftsredakteur bei DataCamp | Prognosen erstellen und mit APIs arbeiten ist genau mein Ding.

