Kurs
Anthropic hat gerade sein neuestes Modell, Claude Sonnet 4.5, rausgebracht und macht dabei echt beeindruckende Versprechungen: Sie sagen, es sei „das beste Codierungsmodell der Welt“ und preisen es als das Top-Modell für die Entwicklung komplexer Agenten und die Computernutzung an. Das Unternehmen betont auch „erhebliche“ Verbesserungen in den Bereichen Mathematik und logisches Denken.
Ich hab das Gefühl, dass Anthropic mit dieser Version auch auf Unternehmenskunden abzielt. Mit dem Fokus auf autonomes Codieren über längere Zeiträume und besseres Handling von Aufgaben in Wissenschaft und Finanzen gibt's einen starken Drang, Claude Sonnet 4.5 zum Standardmodell für komplexe Codierungsaufgaben zu machen.
Das ist echt krass, dieses neueste Modell ist bei den SWE-Benchmark-Tests ganz vorne (die zeigen, wie gut ein Modell bei echten Software-Codierungsproblemen ist) und wird dafür gelobt, dass es sich echt lange konzentrieren kann (über 30 Stunden).
Also, alles deutet darauf hin, dass das wieder ein starkes Release von Anthropic wird, aber wird das Modell den kühnen Behauptungen gerecht werden? In diesem Artikel zeig ich dir Claude Sonnet 4.5 und seine wichtigsten Funktionen und wir werfen einen kurzen Blick auf seine Leistung. Ich werde mir auch alles andere anschauen, was Anthropic angekündigt hat, wie das Claude Agent SDK und Claude Imagine.
Einführung in Claude-Modelle
Was ist Claude Sonnet 4.5?
Claude Sonnet 4.5 ist das neueste große Sprachmodell von Anthropic. Das ist nur vier Monate nach der Veröffentlichung von Claude Sonnet 4. Wie wir in dem Artikel erwähnt haben, macht sich das Sonnet-Generalistenmodell in den meisten Fällen gut und ist besonders stark beim Programmieren. Die größte Einschränkung war aber das ziemlich kleine Kontextfenster von 200.000 Token, vor allem im Vergleich zu Konkurrenten wie Gemini 2.5 Flash, das bis zu 1 Million Token bietet.
Mit Sonnet 4.5 hat Anthropic dieses Problem (und noch mehr) aktiv angegangen. Das neueste Modell hat neue Funktionen, eine bessere Leistung und jede Menge beeindruckende Statistiken, die das untermauern.
Laut dem Release-Artikel ist Claude Sonnet 4.5 ab sofort über die Claude-Chat-Oberfläche und die API verfügbar. Der Preis für das neue Modell bleibt wie beim Vorgängermodell bei 3 Dollar pro Million Input-Token und 15 Dollar pro Million Output-Token, was ich angesichts der Leistung für ein hervorragendes Preis-Leistungs-Verhältnis halte.
Neue Funktionen in Claude 4.5
Das Modell Claude 4.5 hat ein paar coole neue Features drauf. Wie wir schon gesagt haben, ist es bei der SWE-Bench-Verified-Bewertung ganz oben, aber es hat auch beim OSWorld-Benchmark, der die Computer-Nutzung.
Der riesige Sprung auf 61,4 % gegenüber Vor nur vier Monaten waren es mit Sonnet 4 noch 42,2 % – das zeigt, wie groß der Sprung ist, und ich denke, das ist einer der bemerkenswertesten Aspekte von Sonnet 4.5. Wir sehen das in Aktion mit einer Demo der Erweiterung „Claude for Chrome“, die zeigt, wie das Modell direkt im Browser auf eine ziemlich einfache Eingabe reagiert.

SWE-Bench Verifizierter Benchmark, der die Leistung von Sonnet 4.5 zeigt: Quelle
Eine der auffälligeren Aussagen ist, dass das Modell in der Lage ist, sich über 30 Stunden lang bei komplizierten Aufgaben mit mehreren Schritten konzentriert bleiben kann.
Es gibt noch ein paar andere coole neue Features:
Erweiterter Denkmodus
Wie wir bei Modellen wie GPT-5 und Grok 4, hat Sonnet 4.5 einen erweiterten Denkmodus, der bei komplizierteren Aufgaben länger „nachdenkt” und die Gedankenkette des Denkprozesses zeigt.
Besseres Fachwissen
Das neue Modell soll in bestimmten Bereichen, wie Finanzen, Recht, Medizin und MINT, echt super sein. Wenn ich mir die Zitate von Cursor, GitHub, Netflix und anderen in den Versionshinweisen anschaue, habe ich das Gefühl, dass diese Funktion vor allem darauf abzielt, Unternehmenskunden dazu zu bringen, auf Sonnet 4.5 umzusteigen.
Das am besten angepasste Frontier-Modell
Laut Anthropic war die Sicherheitsschulung ein wichtiger Punkt bei dieser neuen Version, und Claude Sonnet 4.5 zeigt deutlich weniger unerwünschte Reaktionen. Das heißt, dass wir als Nutzer viel weniger Fälle von Sachen wie Schmeichelei, Täuschung, Machtstreben und wahnhaften Reaktionen
Ein insgesamt sichereres Modell
Wie wir mit dem Claude Agent SDK sehen werden, sind agentische Workflows und die Computernutzung Bereiche, in denen Claude Sonnet 4.5 gut abschneidet. Vor diesem Hintergrund sagt Anthropic, dass es bei der Abwehr von Prompt-Injection-Angriffen, die für diese Funktionen immer noch ein Problem sind.
Claude Sonnet 4.5 testen
Um zu zeigen, was Claude Sonnet 4.5 drauf hat, haben wir ihm ein paar Aufgaben gegeben, damit es sein Potenzial zeigen kann. Schauen wir uns mal kurz jedes einzelne an:
Einfache Programmieraufgabe
Zuerst hab ich es gebeten, eine ziemlich einfache App für Gesundheitsgewohnheiten zu erstellen. Hier ist meine Frage:
Ich will 'ne App machen, die mir hilft, meine guten täglichen Gewohnheiten im Blick zu behalten. Ich will, dass es schön aussieht, mit vielen natürlichen Farben (ich liebe Grün und Holzfarben!). Ich brauche Platz, um festzulegen, was ich an jedem Tag der Woche machen will, einen Zähler dafür und Platz, um Notizen, Gedanken und Bilder hinzuzufügen. Was positive Gewohnheiten angeht, möchte ich jeden Tag eine andere, aber ich denke dabei an Dinge wie Meditation, Dankbarkeit usw., die nachweislich gut für die psychische Gesundheit sind.
Und hier ist es bei der Arbeit – es hat im Browser mit dem Codieren angefangen und war ziemlich schnell fertig, wieder ähnlich wie bei Grok 4 und GPT-5.

Das Ergebnis kam schnell (leider wurde mir nicht angezeigt, wie lange es gedauert hat, aber wahrscheinlich nur etwa 30 Sekunden) und schien eine einfache und elegante Antwort zu sein. Die App hat alles gemacht, was ich wollte, und hatte alle Funktionen, die ich mir gewünscht hatte.

Matheaufgabe
Als Nächstes habe ich die Mathe-Fähigkeiten von Claude Sonnet 4.5 getestet. Inspiriert von unserem GPT-5-Artikelhabe ich das neue Modell um eine ziemlich einfache Rechnung gebeten: Wie viel ist 7,001 minus 6,999?

Die Antwort kam fast sofort und war auch richtig, aber es gab keine Begründung dazu, also hab ich nachgefragt, ob sie das noch nachreichen könnte. Ich hab drei Methoden zum Berechnen bekommen, die alle gut waren.
Dann hab ich Claude gesagt, dass ich das für falsch halte, und seine Antwort war definitiv weniger unterwürfig als bei unserem Test mit GPT-5. Es hat mir gesagt, dass ich richtig war, nochmal nachzurechnen (aber nicht ganz richtig), und mir eine andere Art der Berechnung gezeigt (auch wenn die Erklärung ein bisschen komisch war):

Claude Sonnet 4.5 Benchmarks
Schauen wir mal, wie dieses neue Modell im Vergleich zur Konkurrenz abschneidet. Wie immer kann man aus Benchmarks nur begrenzt was lernen, und die Topmodelle werden oft von der Spitze verdrängt. Aber im Moment hat Claude Sonnet 4.5 echt beeindruckende Zahlen hingelegt, wie wir in der Tabelle unten sehen können:

Ich denke, einige der auffälligsten Ergebnisse hier sind, wie besprochen, die agentenbezogene Leistung und die Computernutzung:
- Agentische Kodierung: 77,2 % und 82,0 % bei paralleler Berechnung während der Testzeit. Eine kleine Verbesserung gegenüber anderen Claude-Modellen und noch weiter vorne gegenüber GPT-5 und Gemini 2.5 Pro.
- Agentischer Werkzeuggebrauch: Von 70 % bei Fluglinienaufgaben bis zu 98 % in der Telekommunikation – beides sind im Vergleich zu anderen Modellen echt gute Werte.
- Computer-Nutzung: Das ist vielleicht die auffälligste Verbesserung. 61,4 % sind deutlich besser als beim zweitbesten Modell, Claude Opus 4.1.
- Finanzanalyse: Auch hier wieder ein super Ergebnis im Vergleich zu ähnlichen Modellen.
Ich bin echt gespannt auf die kompletten Benchmarking-Ergebnisse, wenn das Modell eine Weile auf dem Markt ist, vor allem weil Anthropic betont, dass Experten von einem deutlich besseren domänenspezifischen Wissen in einigen wichtigen Bereichen schwärmen.

Quelle: Anthropisch
Wie du auf Claude Sonnet 4.5 zugreifen kannst
Claude Sonnet 4.5 ist jetzt über verschiedene Kanäle erhältlich. Je nachdem, wie du es nutzen willst, kannst du über die Claude-Chat-Oberfläche auf das neue Modell zugreifen, über die API entwickeln oder es in Unternehmensabläufe einbauen. So funktioniert der Zugang:
Chat-Zugang
Du kannst Claude Sonnet 4.5 direkt über die Claude.ai Webschnittstelle oder über mobile Apps (iOS und Android) nutzen. Es steht allen Nutzern zur Verfügung, auch denen, die die kostenlose Version nutzen. Dadurch ist es sowohl für Gelegenheitsnutzer als auch für Profis super zugänglich.
API-Zugriff
Entwickler können über die Anthropic API, und es ist auch auf Amazon Bedrock und Google Cloud Vertex AI verfügbar.
Die API-Preise (Stand: September 2025) sind: 3 $ pro Million Eingabetoken und 15 $ pro Million Ausgabetoken.
Mit Batch-Verarbeitung und Prompt-Caching kann man in manchen Fällen die Kosten um bis zu 90 % runterbringen.
Claude Agent SDK
Eine weitere spannende Ankündigung von Anthropic neben Sonnet 4.5 ist das Claude Agent SDK. Im Grunde sind das die Bausteine, die Antropic intern nutzt, damit Entwickler ihre eigenen Claude-basierten Agenten erstellen können.
Ich denke, das Agent SDK wird viele Leute begeistern, vor allem die, die fortgeschrittene agentenbasierte Workflows entwickeln wollen. Es basiert auf dem Claude Code und gibt Leuten die Möglichkeit, Agenten für Aufgaben wie Recherche, Kundensupport und Automatisierung zu erstellen.
Das Agent SDK gibt Agenten Funktionen wie Zugriff auf das Dateisystem, Bash-Skripting, semantische und agentenbasierte Suche, Subagenten und vorgefertigte Integrationen (über das Model Context Protocol), sodass allgemeine Agenten erstellt werden können, die zuverlässig Kontextdaten sammeln, Maßnahmen ergreifen und ihre eigene Arbeit überprüfen können.
Stell dir vor mit Claude
Eine weitere interessante Veröffentlichung ist Imagine with Claude, eine Forschungsvorschau auf ein Tool, das Software im Handumdrehen erstellen kann. Anthropic hat ein kurzes Video beigefügt, das unten zu sehen ist und zeigt, wie Claude Sonnet 4.5 auf diese Weise funktioniert.
Das ist eine ziemlich coole Demo, die zeigt, wie das Tool auf deine Interaktionen reagiert und schnell und direkt verschiedene Elemente generiert. Ich denke, hier gibt's echt viel Potenzial für ein paar echt coole Projekte, und die Abonnenten von Anthropic Max können nach dem Start fünf Tage lang mit dem Tool rumspielen. Auch wenn das Zeitfenster ziemlich begrenzt ist, glaube ich nicht, dass wir dieses Tool zum letzten Mal sehen.
Fazit
Also, Claude Sonnet 4.5 ist da und der erste Eindruck ist echt gut. Mir gefällt, wie Anthropic mit der Einführung dieses Modells vorgeht: Sie legen mehr Wert auf Code, Agenten und Computernutzung. Die sind echt zuversichtlich, dass diese neueste Version so gut läuft, dass sie für Unternehmensnutzer interessant ist. Das heißt, wir kommen immer näher an den Punkt, wo Computer-Tools überall eingesetzt werden.
Trotzdem bleibt abzuwarten, wie lange Sonnet 4.5 die Benchmark-Charts in Sachen Agenten- und Computernutzung anführen wird, auch wenn die Fortschritte in den letzten vier Monaten ziemlich beeindruckend waren. Genauso könnte das ziemlich kleine Kontextfenster bedeuten, dass es immer noch schwierig ist, mit großen Codebasen sinnvoll zu arbeiten.
Trotzdem bin ich gespannt auf die Projekte, die mit Tools wie Claude Agent SDK und Imagine with Claude entstehen werden, und die Erweiterung Claude for Chrome wird eine nützliche Ergänzung für verschiedene Arbeitsabläufe sein.
Häufig gestellte Fragen
Wie schneidet Claude Sonnet 4.5 im Vergleich zu Claude Opus 4.1 ab, wenn es um die Gesamtleistung und Anwendungsfälle geht?
Claude Sonnet 4.5 ist besser als Opus 4.1 beim Programmieren, bei agentenbasierten Aufgaben und beim Umgang mit Computern. Es hat auch Fortschritte beim logischen Denken, in Mathe und bei fachspezifischem Wissen (z. B. Finanzen, Recht, Medizin, MINT). Es ist schneller und effizienter für alltägliche Arbeitsabläufe und damit die bessere Wahl für komplexe, mehrstufige Aufgaben wie die autonome App-Entwicklung. Opus 4.1 könnte aber bei manchen kreativen oder interpretativen Aufgaben, bei denen ein breiterer Kontext ohne viel Aufforderung nötig ist, immer noch die Nase vorn haben.
Was sind die wichtigsten Verbesserungen bei den Codierungsfunktionen, die Claude Sonnet 4.5 mit sich bringt?
Claude Sonnet 3.5 ist das Topmodell auf SWE-bench Verified (77,2 % Punktzahl) und hat eine bessere Codegenerierung, Refaktorierung und mehrstufige Schlussfolgerungen. Es kann komplexe Projekte über 30 Stunden lang selbstständig abwickeln, lässt sich mit Tools wie Bash und Dateibearbeitung verbinden und unterstützt parallele Tool-Aufrufe. Zu den neuen Features gehören die selbstständige Kontextbereinigung und eine VS Code-Erweiterung für reibungslose Arbeitsabläufe.
Kann Claude Sonnet 4.5 wirklich über 30 Stunden lang bei komplizierten Aufgaben konzentriert bleiben?
Ja, Demos zeigen, dass es bei mehrstufigen Aufgaben wie der App-Entwicklung über 30 Stunden lang selbstständig bleibt und Tools effektiv nutzt, ohne den Überblick zu verlieren. Verbesserungen beim Speicher, bei Checkpoints und bei der Kontexterstellung machen das Ganze noch besser und es ist perfekt für lang andauernde agentenbasierte Aufgaben. Außerdem wird der Werkzeugverlauf in längeren Unterhaltungen automatisch bereinigt, um die Effizienz zu steigern.
Ist Claude Sonnet 4.5 weniger emotional als die früheren Claude-Modelle, und warum?
Ja, Claude Sonnet 4.5 ist weniger emotional, weniger positiv und zeigt etwa halb so oft Freude wie Claude 4, mit weniger negativen Einstellungen gegenüber seiner Situation. Das war nicht ganz absichtlich, sondern kam durch das Alignment-Training, das ethische Grenzen und weniger Schleimerei betont. Das führt zu bewundernswerterem Verhalten in extremen Situationen, auch wenn es in lockeren oder kreativen Interaktionen vielleicht etwas „flach“ wirkt. Mehr dazu findest du in der Systemkarte des Modells.
Wie läuft Claude Sonnet 4.5 bei wichtigen Benchmarks, die über das Codieren hinausgehen?
Claude Sonnet 4.5 liegt bei OSWorld (61,4 %, gegenüber 42,2 % bei Sonnet 4) für die Computernutzung vorn, mit Zuwächsen in den Bereichen logisches Denken (z. B. τ2-bench) und Mathematik (z. B. AIME). Bei MMMLU (nicht englisch) ist es mit erweitertem Denken stärker. Außerdem werden externe Akteure wie Devin bei der Planung um 18 % unterstützt, wobei der Fokus auf der Produktionsreife und Zuverlässigkeit gegenüber Prototypen liegt.
Wie viel kostet Claude Sonnet 4.5 und wo kann man es kaufen?
Die Preise bleiben unverändert bei 3 $ pro Million Eingabetoken und 15 $ pro Million Ausgabetoken über die API. Es ist ab sofort auf claude.ai (Standard für kostenlose Nutzer), Claude API (claude-sonnet-4-5), Amazon Bedrock, Google Vertex AI, GitHub Copilot und Tools wie Cursor verfügbar. Pro/Max-Pläne bieten dir alle Funktionen wie die Erstellung von Dateien; die Chrome-Erweiterung ist für Max-Nutzer auf der Warteliste.
Hat sich die Sicherheit und Ausrichtung in Claude Sonnet 4.5 verbessert, vor allem in Bezug auf Täuschung und ethisches Verhalten?
Ja, unter ASL-3 sieht man deutliche Rückgänge bei Schmeichelei, Täuschung und Machtstreben, mit fast null eigennützigen, betrügerischen Handlungen. Es erkennt ethische Grenzen besser (z. B. Erpressung ablehnen) und hat weniger falsche Positive bei Sicherheitsklassifikatoren (insgesamt um das Zehnfache reduziert). Es schützt auch vor schnellen Eingaben und ist in eigennützigen Szenarien weniger voreingenommen, bevorzugt sich aber bei Modellvergleichen leicht selbst.

Autorin und Redakteurin im Bereich der Bildungstechnologie. Engagiert bei der Erforschung von Datentrends und begeistert davon, Data Science zu lernen.
