Alles, was wir über GPT-5 wissen

Erfahre, wie sich GPT-5 zu einem einheitlichen System mit fortschrittlichen Funktionen entwickeln wird, das im Sommer 2025 erscheinen soll, basierend auf der aktuellen Roadmap von OpenAI und der GPT-Geschichte.

Aktualisiert 21. Feb. 2025 · 8 Min. lesen

Seit dem Start von ChatGPT im November 2022 sind mehr als zwei Jahre vergangen. Als ich diesen Artikel am 14. Februar 2024 schrieb, war es etwas mehr als ein Jahr her, und OpenAI war immer noch eine dominierende Kraft in der KI. Seitdem hat sich das Feld weiterentwickelt und Google's Gemini, Anthropic's Claude und Meta's LLaMA sind zu wichtigen Konkurrenten geworden.

Am 12. Februar 2025 veröffentlichte Sam Altman eine Roadmap auf X, in der er Details zu GPT-4.5 und GPT-5 bekannt gab und Pläne zur Vereinfachung der OpenAI-Angebote unter dem Konzept der "magic unified intelligence" skizzierte. Ich aktualisiere diesen Artikel auf der Grundlage dieser Informationen.

Dieser Artikel untersucht GPT-5 und kombiniert Altmans jüngste Aussagen mit der Entwicklung der früheren Modelle von OpenAI.

Was ist GPT-5?

Generative Pre-trained Transformer oder GPT ist eine Reihe von großen Sprachmodellen (LLM), die von OpenAI entwickelt wurden und sowohl die ML- als auch die KI-Branche maßgeblich beeinflusst haben.

GPT wurde entwickelt, um menschenähnlichen Text zu verstehen und zu generieren, der auf den Eingaben basiert, die es erhält. Diese Modelle werden anhand großer Datensätze trainiert. Die GPT-Modellfamilie hat maßgeblich dazu beigetragen, LLM-basierte Anwendungen zu popularisieren und neue Maßstäbe für die Möglichkeiten der natürlichen Sprachverarbeitung, der Generierung und darüber hinaus zu setzen.

Das GPT-5 ist die nächste Generation der GPT-Serie. Einige von euch fragen sich vielleicht, was die nächste Iteration bedeutet. Werfen wir einen Blick auf die bisherige Geschichte der GPT-Modelle:

GPT-1

2018 führte OpenAI mit GPT-1 das Konzept des generativen Pre-Trainings ein, das eine Transformator-Architektur nutzt, um das Verständnis natürlicher Sprache zu verbessern. Dieses Modell, das in der Arbeit "Improving Language Understanding by Generative Pre-Training" beschrieben wird, diente als Proof-of-Concept und wurde nicht öffentlich veröffentlicht.

GPT-2

Ein Jahr später veröffentlichte OpenAI GPT-2, das erhebliche Verbesserungen bei der Texterstellung aufwies. GPT-2 war in der Lage, kurze Textpassagen zu generieren, was ein bemerkenswerter Fortschritt gegenüber seinem Vorgänger war. Sie war öffentlich verfügbar und ermöglichte ein breiteres Experimentieren in der Community für maschinelles Lernen.

GPT-3

Mit der Veröffentlichung von GPT-3 im Jahr 2020 hat OpenAI sein Modell erheblich vergrößert und verfügt nun über 100 Mal mehr Parameter als GPT-2. Diese Erweiterung ermöglichte es GPT-3, viel längere und zusammenhängendere Texte zu produzieren und bei verschiedenen Aufgaben beeindruckende Leistungen zu erbringen. Die Einführung von ChatGPT, einer konversationsorientierten Version der GPT-3.5-Reihe, zeigte die bemerkenswerte Fähigkeit des Modells, menschenähnlichen Text zu erzeugen, und erreichte in nur zwei Monaten 100 Millionen Nutzer/innen.

GPT-4

Das GPT-4, die neueste Generation der Serie, verbessert die Fähigkeiten seiner Vorgänger weiter. Mit einem noch größeren Datensatz und mehr Parametern verbessert GPT-4 das natürliche Sprachverständnis und die Generierungsfähigkeiten von GPT-3. Es zeigt eine verbesserte Leistung bei der Erstellung kohärenter, kontextbezogener Texte über längere Passagen und ein besseres Verständnis komplexer Gesprächssituationen.

Zu den Fortschritten von GPT-4 gehören ein differenzierteres Verständnis von Zusammenhängen, eine verbesserte Sachlichkeit und eine Verringerung der Erzeugung voreingenommener oder schädlicher Inhalte. Sie wird in verschiedenen Anwendungen eingesetzt, von fortschrittlichen Konversationsagenten bis hin zu anspruchsvollen Werkzeugen für die Erstellung von Inhalten, was ihre Vielseitigkeit und die kontinuierliche Weiterentwicklung von KI-gestützten Technologien zur Verarbeitung natürlicher Sprache unterstreicht.

Im November 2023 stellte OpenAI den GPT-4 Turbo mit Vision vor, der mehrere Funktionen aktualisierte. Im Mai 2024 wurde dann der GPT-4o eingeführt, ein multimodales Modell, das noch höhere Geschwindigkeiten und niedrigere Kosten bietet. Mehr über die Entwicklung der GPT-Familie erfährst du in unserem früheren Artikel über GPT-4.

GPT-5

Laut Altmans X-Post vom 12. Februar 2025 wird GPT-5 die nächste Entwicklung der Generative Pre-trained Transformer-Serie sein. Die jüngste Roadmap von Altman enthält klare Details zu GPT-5 und zeigt, dass es kein eigenständiges Modell sein wird, sondern ein System, das die Modelle der GPT-Serie und der o-Serie, wie z.B. o3, integriert.

Wir wissen, dass GPT-4 erhebliche Verbesserungen gegenüber seinen Vorgängern aufwies, vor allem in Bezug auf seine Fähigkeit zum logischen Denken. Das GPT-4o, das im Mai 2024 veröffentlicht wird, bleibt zwar auf das Wissen vor dem Ausbildungsstopp beschränkt, bietet aber erweiterte logische und multimodale Fähigkeiten. Ich erwarte, dass GPT-5 auf diesen Fortschritten aufbaut und die Überlegungen von o3 sowie zusätzliche Tools, wie in der Roadmap beschrieben, einbezieht.

Wann wird die GPT-5 veröffentlicht?

In einem Gespräch von Sam Altman mit Bill Gates im Januar 2024 erhielt Gates die Bestätigung, dass die Arbeit am GPT-5 begonnen hatte, ohne einen Hinweis darauf zu geben, wann das Erscheinungsdatum sein könnte.

In Altmans X-Post vom 12. Februar 2025 heißt es, dass GPT-5 in "Monaten" erscheinen wird, was auf einen Start im Sommer 2025 hindeutet. Der Entwicklungszyklus von GPT-4, einschließlich Schulung, Entwicklung und Tests, dauerte mehr als zwei Jahre und wird Anfang 2023 veröffentlicht, nachdem ChatGPT im November 2022 debütiert hat. Das GPT-4o, das im Mai 2024 eingeführt wurde, war ein weiteres Update.

Altmans Fahrplan beschleunigt die Veröffentlichung des GPT-5 auf Mitte 2025 und bestätigt, dass der GPT-4.5 mit dem Codenamen Orion in "Wochen" ab dem 12. Februar 2025, wahrscheinlich im März 2025, als Vorläufer starten wird.

Welche Funktionen können wir vom GPT-5 erwarten?

Da die Veröffentlichung von GPT-5 ein oder zwei Jahre in der Zukunft liegt, basieren die meisten Vorhersagen über seine Fortschritte auf aktuellen Trends, die von Google und Open-Source-KI-Initiativen geprägt sind. Diese Entwicklungen geben uns wertvolle Einblicke in die zukünftige Richtung der Branche.

Es gibt jedoch einige erste Hinweise, die direkt vom OpenAI-Kernteam kommen. Während des Interviews mit Gates betonte Altman, dass sich die Bemühungen von OpenAI auf die Verbesserung der Denkfähigkeiten und die Integration von Videoverarbeitungsfunktionen konzentrieren werden.

Versuchen wir also, uns einen Überblick zu verschaffen, und besprechen wir einige der wichtigsten Verbesserungen, die von GPT-5 erwartet werden.

Parameter Größe

Die genaue Größe des GPT-4 wird nicht bekannt gegeben, Schätzungen gehen aber von etwa 1,5 Billionen aus. GPT-5 ist kein eigenständiges Modell, sondern ein System, das mehrere Architekturen integriert, darunter auch die Argumentationsfähigkeiten von o3. Ich gehe davon aus, dass die Kapazität eher diesen kombinierten Ansatz widerspiegeln wird als eine einfache Erhöhung der Parameter.

Wenn sich diese Entwicklung fortsetzt, könnte das GPT-5 die Grenzen der aktuellen LLMs neu definieren und eine noch nie dagewesene Größe bieten.

Multimodalität

Das GPT-4o verarbeitet derzeit Sprache, Bilder und Text. Altmans Roadmap bestätigt, dass GPT-5 Sprach-, Canvas- und Suchfunktionen enthalten wird, wobei die Möglichkeit der Videoverarbeitung auf der Grundlage früherer Andeutungen in seinem Gespräch mit Bill Gates im Januar 2024 besteht. Dies wird die multimodalen Fähigkeiten von OpenAI verbessern und entspricht den Trends, die bei Konkurrenten wie Googles Gemini zu beobachten sind.

Vom Chatbot zum Agenten

Der Übergang von Chatbots zu vollständig autonomen Agenten ist eine weitere spannende Entwicklung. Stell dir vor, du könntest einer GPT-gesteuerten App einfache Aufgaben oder Jobs zuweisen. Das könnte tatsächlich Realität werden, wenn OpenAI weiterhin Dienste von Drittanbietern integriert. Wir haben bereits die Einführung von Custom GPTs und Operator gesehen, und das wird sich wahrscheinlich noch weiterentwickeln.

Diese neue Funktion ermöglicht es dem GPT-5, sich mit verschiedenen Diensten zu verbinden und nahtlos Aktionen in der Welt auszuführen, indem er im Namen der Nutzer/innen handelt und Aufgaben ohne direkte menschliche Aufsicht erledigt. Wir könnten zum Beispiel einen autonomen Agenten bitten, unsere Lebensmittel auf der Grundlage unserer eigenen Ernährungspräferenzen einzukaufen.

Bessere Genauigkeit

Das aktuelle Modell GPT-4 ist 40% besser als sein Vorgänger GPT-3. Mit der Integration der o3-Gedankenkette in GPT-5 wird die Zuverlässigkeit und das kontextuelle Verständnis weiter verbessert und die Fehlerquote bei verschiedenen Anwendungen reduziert.

Vergrößerte Kontextfenster

Eine der Grenzen der aktuellen Modelle ist die Größe des Kontextfensters, das sie für die Generierung von Antworten berücksichtigen können. Da GPT-5 mit einer größeren Datenmenge trainiert werden könnte, wird erwartet, dass es über ein erweitertes Kontextfenster verfügt, das es ihm ermöglicht, größere Textabschnitte zu verstehen und zu referenzieren, was zu kohärenteren und kontextuell relevanten Ergebnissen führt.

Kostengünstige Nutzung der OpenAI API

Mit dem Aufkommen neuerer Modelle werden auch die Kosten für die Nutzung der OpenAI-API sinken, so dass Technologien wie GPT-4o leichter zugänglich werden.

Diese Demokratisierung des Zugangs könnte eine Innovationswelle auslösen, die es einer größeren Zahl von Entwicklern und Organisationen ermöglicht, fortschrittliche KI in ihre Anwendungen zu integrieren.

Sobald sie billiger und zugänglicher wird, könnten die GPT-Modelle komplexe Aufgaben wie Codierung oder Forschung besser bewältigen. Wenn du die OpenAI-API noch nicht ausprobiert hast, empfehle ich dir dringend, den DataCamp-Leitfaden zur OpenAI-API zu befolgen, um einen Eindruck davon zu bekommen.

Fazit

Sam Altmans Fahrplan vom 12. Februar 2025 enthält konkrete Details zum GPT-5 und geht damit über die Spekulationen hinaus, die frühere Diskussionen geprägt haben. Er bestätigt, dass GPT-4.5 in einigen Wochen auf den Markt kommen wird, gefolgt von GPT-5 in einigen Monaten, das im Sommer 2025 mit einem einheitlichen Systemansatz veröffentlicht werden soll. Ich sehe dies als einen wichtigen Schritt in der Entwicklung von OpenAI, der fortschrittliche Funktionen und einen abgestuften Zugang für unterschiedliche Bedürfnisse bietet.

Wenn du wissen willst, was die GPT-Modelle alles zu bieten haben, fang mit unserem Kurs Einführung in ChatGPT an oder, wenn du bereits mit dem Modell vertraut bist, mit unserem Webinar über die erweiterte Datenanalyse von ChatGPT.

Author

Josep Ferrer

Josep ist Data Scientist und Projektmanager beim katalanischen Fremdenverkehrsamt und nutzt Daten, um die Erfahrungen von Touristen in Katalonien zu verbessern. Sein Fachwissen umfasst das Management von Datenspeicherung und -verarbeitung, gekoppelt mit fortschrittlichen Analysen und der effektiven Kommunikation von Datenerkenntnissen.

Er ist auch ein engagierter Pädagoge, der den Big-Data-Masterstudiengang an der Universität von Navarra unterrichtet und regelmäßig aufschlussreiche Artikel über Datenwissenschaft auf Medium und KDNuggets veröffentlicht.

Er hat einen BS in technischer Physik von der Polytechnischen Universität von Katalonien und einen MS in intelligenten interaktiven Systemen von der Universität Pompeu Fabra.

Derzeit engagiert er sich leidenschaftlich dafür, datenbezogene Technologien durch die Medium-Publikation ForCode'Sake einem breiteren Publikum zugänglich zu machen.

Themen

Künstliche Intelligenz

OpenAI

ChatGPT

Große Sprachmodelle

Beginne deine KI-Reise noch heute!

Kurs

ChatGPT verstehen

1 Std.

424.6K

Dieser Kurs erklärt, wie du ChatGPT effektiv nutzt, was beim Prompting zu beachten ist und welche Anwendungsfälle es in Unternehmen gibt.

Details anzeigen

Kurs starten

Kurs

Arbeiten mit der OpenAI-API

3 Std.

141.9K

Entwickle deine ersten KI-gestützten Anwendungen mit der API von OpenAI und lerne zugrunde liegende Funktionen von ChatGPT & Co. kennen.

Details anzeigen

Kurs starten

Kurs

Einführung in Embeddings mit der OpenAI API

3 Std.

20.5K

Schalte fortgeschrittene KI-Anwendungen wie semantische Suche und Empfehlungsmaschinen mit dem Einbettungsmodell von OpenAI frei!

Details anzeigen

Kurs starten

Verwandt

Blog

Arten von KI-Agenten: Ihre Rollen, Strukturen und Anwendungen verstehen

Lerne die wichtigsten Arten von KI-Agenten kennen, wie sie mit ihrer Umgebung interagieren und wie sie in verschiedenen Branchen eingesetzt werden. Verstehe einfache reflexive, modellbasierte, zielbasierte, nutzenbasierte, lernende Agenten und mehr.

Blog

Q2 2023 DataCamp Donates Digest

DataCamp Donates hat im zweiten Quartal 2023 über 20.000 Stipendien an unsere gemeinnützigen Partner vergeben. Erfahre, wie fleißige benachteiligte Lernende diese Chancen in lebensverändernde berufliche Erfolge verwandelt haben.

Nathaniel Taylor-Leach

Tutorial

Python-Tutorial zum Verknüpfen von Zeichenfolgen

Lerne verschiedene Methoden zum Verknüpfen von Zeichenfolgen in Python kennen, mit Beispielen, die jede Technik zeigen.

DataCamp Team

Tutorial

Python Switch Case Statement: Ein Leitfaden für Anfänger

Erforsche Pythons match-case: eine Anleitung zu seiner Syntax, Anwendungen in Data Science und ML sowie eine vergleichende Analyse mit dem traditionellen switch-case.

Matt Crabtree

Mehr anzeigen Mehr anzeigen

Was ist GPT-5?

GPT-1

GPT-2

GPT-3

GPT-4

GPT-5

Wann wird die GPT-5 veröffentlicht?

Welche Funktionen können wir vom GPT-5 erwarten?

Parameter Größe

Multimodalität

Vom Chatbot zum Agenten

Bessere Genauigkeit

Vergrößerte Kontextfenster

Kostengünstige Nutzung der OpenAI API

Fazit

Arten von KI-Agenten: Ihre Rollen, Strukturen und Anwendungen verstehen

Q2 2023 DataCamp Donates Digest

Python-Tutorial zum Verknüpfen von Zeichenfolgen

Python Switch Case Statement: Ein Leitfaden für Anfänger

.css-1531qan{-webkit-text-decoration:none;text-decoration:none;color:inherit;}ChatGPT verstehen

Arbeiten mit der OpenAI-API

Einführung in Embeddings mit der OpenAI API

Arten von KI-Agenten: Ihre Rollen, Strukturen und Anwendungen verstehen

Q2 2023 DataCamp Donates Digest

Python-Tutorial zum Verknüpfen von Zeichenfolgen

Python Switch Case Statement: Ein Leitfaden für Anfänger

ChatGPT verstehen