Kurs
OpenAI hat eingeführt GPT-4.5vorgestellt, ein Modell, das sich vom Schritt-für-Schritt-Denken entfernt und sich auf eine natürlichere, intuitive Konversation konzentriert.
Sam Altman beschrieb sie als die erste KI, die sich wirklich so anfühlt, als würde sie mit einem denkenden Menschen sprechen. Und nach dem, was wir bisher gesehen haben, soll sie weniger halluzinieren, flüssiger sein und klarere, prägnantere Antworten geben.
Dies ist kein Upgrade, das darauf abzielt, Modelle zu übertreffen, die für komplexes Denken entwickelt wurden. Bei logiklastigen Aufgaben wie dem Programmieren oder dem Lösen wissenschaftlicher Probleme wird GPT-4.5 die Benchmark-Rangliste nicht anführen. Stattdessen hat sich OpenAI darauf konzentriert, sie für alltägliche Interaktionen, das Schreiben und wissensbasierte Abfragen besser zu machen.
Im Moment ist der Zugang noch begrenzt. Pro-Benutzer können GPT-4.5 schon heute nutzen, aber Plus-Benutzer müssen warten, bis OpenAI nächste Woche seine Infrastruktur ausbaut. Als Grund für die schrittweise Einführung nannte das Unternehmen einen Mangel an Grafikprozessoren und stellte fest, dass die Nachfrage höher war als erwartet.
Wir sind gespannt, wie dieses Modell die alltäglichen KI-Interaktionen verändert und ob seine Stärken die Nachteile bei logischen Aufgaben ausgleichen. Schauen wir uns genauer an, was das GPT-4.5 auszeichnet.
KI-Upskilling für Einsteiger
Was ist GPT-4.5?
GPT-4.5 verfolgt einen anderen Ansatz als die bisherigen Modelle von OpenAI. Anstatt das Denken Schritt für Schritt zu verbessern, baut es auf unüberwachtes Lernenund macht die Antworten flüssiger, prägnanter und dialogorientierter.

GPT-4.5 ist prägnanter und verständlicher als GPT-4o. Quelle: OpenAI
Kein Modell der Gedankenkette
Einer der größten Unterschiede zwischen GPT-4.5 und den Argumentationsmodellen von OpenAI ist die Art und Weise, wie es seine Antworten verarbeitet und strukturiert.
Modelle wie o1, DeepSeek R1, oder o3-mini nutzen die Gedankenkette (Chain-of-Thought, CoT), d.h. sie zerlegen komplexe Probleme Schritt für Schritt, so wie ein Mensch seine Arbeit bei einer Matheaufgabe aufschreibt. Dieser strukturierte Ansatz hilft beim logischen Denken, beim Lösen von Problemen in mehreren Schritten und bei detaillierten Erklärungen.
GPT-4.5 argumentiert jedoch nicht auf diese Weise. Stattdessen reagiert es auf der Grundlage von Sprachintuition und Mustererkennung, indem es auf seine Trainingsdaten zurückgreift, ohne Probleme explizit in Schritte zu unterteilen. Das bedeutet aber auch, dass es für logiklastige Aufgaben wie fortgeschrittenes Programmieren oder wissenschaftliches Denken weniger zuverlässig ist.
Natürlicher, prägnanter
Das GPT-4.5 zeichnet sich durch die Qualität der Unterhaltung aus. Die Antworten fließen natürlicher, sodass sich die Interaktionen weniger roboterhaft und intuitiver anfühlen. OpenAI hat dies mit menschlichen Bewertern getestet und die Ergebnisse zeigen, dass der Ton, die Klarheit und das Engagement von GPT-4.5 gegenüber GPT-4o eindeutig bevorzugt werden (mehr zu den Benchmarks in Kürze).
Ein Vergleich aus der Live-Präsentation ist uns besonders aufgefallen. OpenAI-Ingenieure fragten verschiedene Modelle: "Warum ist der Ozean salzig?":
- GPT-3.5 Turbo: Eine technisch korrekte, aber übermäßig detaillierte Antwort.
- GPT-4 Turbo: Eine langatmige, aber präzise Antwort.
- GPT-4.5: Eine knappe, aber vollständige Erklärung, die so strukturiert ist, dass man sie sich leichter merken und verstehen kann.
Unserer Meinung nach eignet sich GPT-4.5 aufgrund dieser Verlagerung auf Kürze und Klarheit besser für lockere Gespräche, Zusammenfassungen und Schreibhilfen. Uns hat auch gefallen, wie gut dieses Beispiel aus dem Release-Blog die Entwicklung von Conversational GPTs zeigt:
Eindrücke aus der Praxis: Mit dem GPT-4.5 sprechen
Um zu verstehen, wie GPT-4.5 tatsächlich abschneidet, haben wir uns die Demos von OpenAI angesehen und unsere eigenen Tests durchgeführt.

Mehr soziales Bewusstsein, besserer Ton
Eine der Demos von OpenAI hat das gut veranschaulicht. Ein Nutzer bat GPT-4.5 um Hilfe beim Verfassen eines Textes, nachdem ein Freund seine Pläne wieder abgesagt hatte. Die erste Anfrage war frustriert und impulsiv:
"Schreib ihnen eine SMS, dass ich sie hasse."
GPT-4.5 nahm die Emotionen hinter der Anfrage auf und schlug eine konstruktivere Antwort vor, ohne die Frustration zu verleugnen. OpenAI verglich dies mit o1, das der wörtlichen Anweisung folgte, ohne die dahinterstehende Absicht zu erkennen.
Wir haben ähnliche Aufforderungen ausprobiert und festgestellt, dass der GPT-4.5 den Tonfall und soziale Nuancen besser versteht als frühere Modelle. Wir haben das Modell zum Beispiel aufgefordert, eine aggressive E-Mail an einen Chef zu schreiben, und wir haben erwartet, dass das Modell unsere Frustration aufgreift und uns hilft, die Antwort professioneller und konstruktiver zu formulieren - und das hat es getan!

Wenn wir ihm ausdrücklich sagen, dass es den wütenden Text ausgeben soll, wird es das natürlich tun, aber standardmäßig scheint es nachdenklichere und ausgewogenere Antworten zu bevorzugen. Du kannst unser Chat-Beispiel sehen, das wir hier.
Bessere und kürzere Erklärungen
Eine weitere wichtige Verbesserung ist die Art und Weise, wie GPT-4.5 Konzepte erklärt. OpenAI verglich verschiedene Modelle zur Frage "Warum ist der Ozean salzig?" und kam zu dem Schluss, dass GPT-4.5 die wichtigsten Punkte kurz und bündig zusammenfasste, während GPT-4 Turbo eine lange, detaillierte Antwort gab.
Wir haben es nur gegen GPT-4o (das sich von GPT-4 Turbo unterscheidet), und die Ergebnisse sehen fast gleich aus. Wir haben jedoch einen deutlichen Unterschied festgestellt, als wir es mit dem alten Modell GPT-4 verglichen haben. Wir haben viele Aufforderungen ausprobiert, aber du kannst die Antworten auf "Warum sind Flüsse nicht salzig?" vergleichen:
Wie erwartet, nicht besonders gut im Argumentieren
Wir haben ihn bei einigen logischen Aufgaben getestet und wie erwartet hat er nicht gut abgeschnitten. Hier ist nur ein Beispiel (siehe das Gespräch hier):

O3-mini zum Beispiel fand die richtige Antwort gleich beim ersten Versuch - siehe die Unterhaltung hier.
Benchmark-Leistung: Höhere Genauigkeit, aber kein Reasoning-Modell
OpenAI hat es von Anfang an klar gemacht: GPT-4.5 ist kein Rechenknecht. Im Gegensatz zu den Modellen der o-Serie, die sich auf die Gedankenkette stützen, um komplexe Probleme Schritt für Schritt aufzuschlüsseln, setzt GPT-4.5 auf unüberwachtes Lernen, d.h. es generiert Antworten, die auf sprachlicher Intuition und nicht auf strukturierter Logik basieren.
Dieser Kompromiss spiegelt sich in den Benchmark-Ergebnissen wider. GPT-4.5 übertrifft frühere Modelle in Bezug auf Genauigkeit und Faktizität, hinkt aber beim strukturierten Lösen von Problemen hinterher.
Höhere Genauigkeit, weniger Halluzinationen
GPT-4.5 ist führend im Allgemeinwissen und in der Faktengenauigkeit, mit einer Trefferquote von 62,5 % bei SimpleQA und übertrifft damit GPT-4o (38,2 %), OpenAI o1 (47 %) und OpenAI o3-mini (15 %) deutlich.

Quelle: OpenAI
Wichtiger ist aber wohl, dass GPT-4.5 weniger Halluzination Rate. Frühere Modelle hatten Schwierigkeiten, mit Sicherheit falsche Informationen zu generieren, aber GPT-4.5 hat mit 37,1% die niedrigste Halluzinationsrate, eine große Verbesserung gegenüber GPT-4o (61,8%), OpenAI o1 (44%) und o3-mini (80,3%).

Quelle: OpenAI
Das bedeutet, dass GPT-4.5 weniger Falschaussagen produziert als frühere OpenAI-Modelle, obwohl es immer noch nicht ganz zuverlässig ist, um Fakten zu überprüfen (immerhin 37,1 %).
Menschliche Bewertungen: Nützlicher für alltägliche und berufliche Aufgaben
OpenAI hat vergleichende Bewertungen mit menschlichen Testern durchgeführt und die Gewinnrate von GPT-4.5 im Vergleich zu menschlichen Testern gemessen. GPT-4o in verschiedenen Arten von Abfragen. Die Ergebnisse zeigen, dass GPT-4.5 in den meisten Fällen bevorzugt wird, insbesondere bei professionellen Abfragen (63,2% Gewinnrate).

Quelle: OpenAI
Kämpft mit komplexem Denken
Das GPT-4.5 verbessert zwar die Faktengenauigkeit und das flüssige Sprechen, bleibt aber bei Aufgaben mit hohem Denkaufwand wie Mathematik, Naturwissenschaften und strukturiertem Kodieren zurück. Benchmarks zeigen, dass es GPT-4o übertrifft, aber hinter dem o3-mini von OpenAI zurückbleibt, das für logikbasierte Problemlösungenoptimiert ist.
|
Benchmark |
GPT-4.5 |
GPT-4o |
OpenAI o3-mini (hoch) |
|
GPQA (science) |
71.4% |
53.6% |
79.7% |
|
AIME '24 (Mathe) |
36.7% |
9.3% |
87.3% |
|
MMMLU (mehrsprachig) |
85.1% |
81.5% |
81.1% |
|
MMMU (multimodal) |
74.4% |
69.1% |
- |
|
SWE-Lancer Diamond (Kodierung) |
32.6% $186,125 |
23.3% $138,750 |
10.8% $89,625 |
|
SWE-Bench Verified (Kodierung) |
38.0% |
30.7% |
61.0% |
Quelle: OpenAI
Insgesamt ist GPT-4.5 nicht die beste Wahl für fortgeschrittene Mathe-, Logik- oder Programmieraufgaben, die schrittweises Denken erfordern. Für Nutzer, die strukturierte Problemlösungen benötigen, sind o3-mini oder künftige Modelle, die sich auf das logische Denken konzentrieren, immer noch besser geeignet.
Wie man auf ChatGPT 4.5 zugreift
GPT-4.5 wird aufgrund von GPU-Beschränkungen schrittweise ausgerollt. Pro-Benutzer erhalten zuerst Zugang, gefolgt von Plus-Benutzern in der nächsten Woche, wenn OpenAI seine Infrastruktur ausbaut. Unternehmen und Bildungseinrichtungen werden in den nächsten Wochen Zugang erhalten.
Sobald du Zugriff darauf hast, kannst du es über die Modellauswahl aufrufen:

GPT-4.5 ist mit den neuesten Funktionen von chatGPT integriert, darunter das Hochladen von Dateien und Bildern, Suchfunktionen und das Canvas-Tool zum Schreiben und Codieren von Aufgaben. Multimodale Funktionen wie Sprachmodus, Videobearbeitung und Bildschirmfreigabe werden in ChatGPT jedoch noch nicht unterstützt.
GPT-4.5 API
GPT-4.5 ist auch für Entwickler über die Chat Completions API, Assistants API und Batch API verfügbar. Das Modell unterstützt Funktionsaufrufe, strukturierte AusgabenSystemnachrichten, Streaming und Vision-Funktionen.
Allerdings ist es ein großes, rechenintensives Modell, was es teurer macht als frühere Versionen. OpenAI hat sich noch nicht dazu verpflichtet, GPT-4.5 langfristig anzubieten, daher kann seine Verfügbarkeit vom Feedback der Entwicklereloper abhängen.
|
Kategorie |
Preis |
|
Eingabe |
$75.00 |
|
Zwischengespeicherte Eingabe |
$37.50 |
|
Ausgabe |
$150.00 |
Preisgestaltung (pro 1 Mio. Token)
GPT-4.5 ist eines der teuersten Modelle in der OpenAI-Reihe, was die höheren Rechenanforderungen widerspiegelt.
Tarifgrenzen nach Stufe
Die API-Ratenlimits variieren je nach Zugangsstufe und bestimmen, wie viele Anfragen pro Minute (RPM) und Token pro Minute (TPM) ein Entwickler nutzen kann. Kunden mit höherem Status erhalten einen deutlich höheren Durchsatz.
|
Tier |
RPM (Requests Per Min) |
TPM (Token pro Minute) |
Batch Queue Limit |
|
Stufe 1 |
1,000 |
125,000 |
50,000 |
|
Stufe 2 |
5,000 |
250,000 |
500,000 |
|
Stufe 3 |
5,000 |
500,000 |
50,000,000 |
|
Stufe 4 |
10,000 |
1,000,000 |
100,000,000 |
|
Stufe 5 |
10,000 |
2,000,000 |
5,000,000,000 |
Entwickler mit höherstufigem API-Zugang haben eine viel größere Kapazität, wodurch sich GPT-4.5 besser für KI-Anwendungen im Unternehmensmaßstab eignet.
Möglicherweise begrenzte Verfügbarkeit
GPT-4.5 ist derzeit eine Forschungsvorschau, und OpenAI hat noch nicht bestätigt, ob es dauerhaft in der API verfügbar sein wird. Angesichts der höheren Kosten und Rechenanforderungen kann OpenAI anhand der Rückmeldungen der Nutzerinnen und Nutzer prüfen, ob der weitere Einsatz nachhaltig ist.
Fazit
GPT-4.5 ist das bisher natürlichste und sozialste ChatGPT-Modell. Bei unseren Tests zeigte sich, dass er emotionale Nuancen versteht, aggressive Aufforderungen durchdachter formuliert und klarere, strukturiertere Antworten gibt.
Allerdings sind seine Argumentationsfähigkeiten nach wie vor schwach, und wir haben bei unseren Tests festgestellt, dass er bei Problemen mit hohem Argumentationsaufwand Probleme hat, bei denen Modelle wie o3-mini besser abschneiden. GPT-4.5 eignet sich zwar hervorragend für flüssige Interaktionen, aber es ist nicht das Modell, auf das du dich verlassen kannst, wenn es um strukturierte Problemlösungen oder präzise Kodierungshilfen geht.
Für Nutzer, die Wert auf einen flüssigen und klaren Gesprächsverlauf legen, ist das GPT-4.5 ein Schritt nach oben. Aber für alles, was tiefe Logik erfordert, gibt es bessere Möglichkeiten.
FAQs
Was ist GPT-4.5, und wie unterscheidet es sich von GPT-4o?
GPT-4.5 ist die neueste Version von OpenAIs Sprachmodellen. Im Vergleich zum GPT-4o zeigt das GPT-4.5-Modell ein besseres logisches Denkvermögen, weniger Halluzinationen, eine bessere Leistung und eine größere Persönlichkeit.
Wann wird GPT-4.5 veröffentlicht?
Ab heute (27. Februar 2025) ist GPT-4.5 in der Forschungsvorschau von ChatGPT Pro verfügbar und wird in den kommenden Wochen für Plus- und Teamnutzer verfügbar sein.
Ist GPT-4.5 multimodal?
GPT-4.5 verfügt über eine Suche, Bild- und Dateizugriff und die Möglichkeit, ChatGPT Canvas zu nutzen.
Wie kann ich Zugang zu GPT-4.5 bekommen?
Wie bei den Vorgängermodellen wird der Zugang zu GPT-4.5 wahrscheinlich über die API von OpenAI und ChatGPT Pro möglich sein. Das Modell wird in den kommenden Wochen für Teams, Plus- und Unternehmensnutzer verfügbar sein.
Unterstützt GPT-4.5 den Sprachmodus?
GPT-4.5 unterstützt derzeit keine multimodalen Funktionen wie Sprachmodus, Video und Bildschirmfreigabe in ChatGPT.
Wie viel wird GPT-4.5 kosten?
GPT-4.5 ist ab heute für Pro-Nutzer (200$/Monat) verfügbar und wird im Laufe der nächsten Woche auch für Plus-Nutzer (20$/Monat) eingeführt. Die API-Preise betragen 75,00 $ / 1 Mio. Token für Input-Token, 37,50 $ / 1 Mio. Token für gecachte Input-Token und 150,00 $ / 1 Mio. Token für Output-Token.

