Ga naar hoofdinhoud

Claude Sonnet 4.5: Tests, functies, toegang, benchmarks en meer

Lees alles over Claude Sonnet 4.5, het ‘beste codemodel ter wereld’. Ontdek nieuwe functies, use-cases, benchmarks en testresultaten, plus een kijkje in de Claude Agents SDK en Claude Imagine.
Bijgewerkt 12 mei 2026  · 8 min lezen

Anthropic heeft zojuist zijn nieuwste model uitgebracht, Claude Sonnet 4.5, met enkele indrukwekkende claims: ze bestempelen het als “het beste codemodel ter wereld” en prijzen het ook als het beste model voor het bouwen van complexe agents en computergebruik. Het bedrijf benadrukt bovendien "aanzienlijke" verbeteringen in wiskunde en redeneren.

Ik krijg de indruk dat Anthropic met deze release ook mikt op zakelijke klanten. Met de nadruk op langdurig autonoom coderen en beter omgaan met taken in wetenschap en financiën, wordt er sterk ingezet om Claude Sonnet 4.5 hét model te maken voor complexe codetaken. 

Opvallend genoeg staat dit nieuwste model bovenaan de SWE-bench Verified-evaluatiebenchmarks (een maatstaf voor hoe goed een model is in realistische softwarecodeproblemen) en wordt het geprezen om zijn vermogen om langdurig te focussen (30+ uur).

Alles wijst dus op opnieuw een sterke release van Anthropic, maar kan het model de gedurfde claims waarmaken? In dit artikel stel ik je voor aan Claude Sonnet 4.5 en de belangrijkste functies, en kijk ik kort naar de prestaties. Ook behandel ik de andere aankondigingen van Anthropic, waaronder de Claude Agent SDK en Claude Imagine. Je kunt ook onze aparte gids voor Claude Haiku 4.5 bekijken.

Wat is Claude Sonnet 4.5? 

Claude Sonnet 4.5 is het nieuwste large language model van Anthropic. Het komt slechts vier maanden na de release van Claude Sonnet 4. Zoals we in dat artikel aangaven, presteert het generalistische Sonnet-model goed in de meeste use-cases en is het vooral sterk in coderen. De belangrijkste beperking was echter het relatief smalle contextvenster van 200k tokens, zeker vergeleken met concurrenten als Gemini 2.5 Flash, dat tot 1M tokens biedt.

Met Sonnet 4.5 heeft Anthropic deze zorg actief aangepakt (en meer). Het nieuwste model heeft nieuwe functies, betere prestaties en flink wat indrukwekkende statistieken om dit te onderbouwen. 

Volgens het release-artikel is Claude Sonnet 4.5 direct beschikbaar via zowel de Claude-chatinterface als de API. De prijs van het nieuwe model blijft gelijk aan zijn voorganger: $3 per miljoen inputtokens en $15 per miljoen outputtokens, wat het gezien de prestaties in mijn ogen uitstekende waarde geeft.

Nieuwe functies in Claude 4.5 

Er zijn best wat gave nieuwe functies te zien bij het Claude 4.5-model. Zoals besproken staat het bovenaan voor de SWE-bench Verified-evaluatie, maar het laat ook enorme winst zien in de OSWorld-benchmark, die computergebruik meet. 

De enorme sprong naar 61,4% vs. 42,2% slechts 4 maanden geleden met Sonnet 4 laat zien hoe groot deze stap is, en ik denk dat dit een van de meest opvallende aspecten van Sonnet 4.5 is. We zien dit in actie met een demo van de Claude voor Chrome-extensie, die laat zien hoe het model direct acties uitvoert in de browser op basis van een vrij simpele prompt.  

SWE-bench Verified Benchmark met prestaties van Sonnet 4.5

SWE-bench Verified Benchmark met prestaties van Sonnet 4.5: Bron

Een van de meest in het oog springende claims is dat het model meer dan 30 uur gefocust kan blijven op complexe taken met meerdere stappen. 

Er zijn nog verschillende andere noemenswaardige nieuwe functies: 

Uitgebreide denkmodus

Zoals we hebben gezien bij modellen als GPT-5 en Grok 4, introduceert Sonnet 4.5 een uitgebreide denkmodus die voor complexere taken een langer ‘denk’-proces gebruikt en de chain-of-thought van het redeneerproces toont.

Betere domeinspecifieke kennis

Het nieuwe model zou topprestaties leveren in specifieke domeinen, waaronder financiën, recht, gezondheidszorg en STEM. Kijkend naar de citaten in de releasenotes van onder meer Cursor, GitHub, Netflix en anderen, voelt deze functie voor mij duidelijk als een lokker om enterprise-klanten aan boord te krijgen met Sonnet 4.5.

Meest uitgelijnde frontier-model

Volgens Anthropic stond veiligheidstraining centraal bij deze release en laat Claude Sonnet 4.5 grote verminderingen zien in ongunstige reacties. Dit betekent dat we als gebruikers veel minder gevallen zouden moeten zien van zaken als slaafsheid, misleiding, machtsstreven en waanachtige antwoorden.

Al met al een veiliger model

Zoals we zullen zien met de Claude Agent SDK, zijn agentische workflows en computergebruik gebieden waar Claude Sonnet 4.5 goed presteert. Met dit in gedachten noemt Anthropic aanzienlijke verbeteringen bij het verdedigen tegen prompt injection-aanvallen, wat voor deze functies een blijvend aandachtspunt is.

Claude Sonnet 4.5 testen 

Om te zien wat Claude Sonnet 4.5 kan, hebben we het een paar taken gegeven om het potentieel te laten zien. Laten we er kort naar kijken: 

Eenvoudige codetaak

Om te beginnen vroeg ik om een vrij basis health-habits-app te maken. Dit was mijn prompt: 

Ik wil een app maken die me helpt positieve dagelijkse gewoonten bij te houden. Ik wil dat hij er mooi uitziet, met veel natuurlijke kleuren (ik ben groot fan van groen en houtkleur!). Ik wil ruimte om te bepalen wat de gewoonte gaat zijn voor elke dag van de week, een streak-teller ervoor, en ruimte om notities, gedachten en afbeeldingen toe te voegen. Voor positieve gewoonten wil ik elke dag een andere, maar ik denk aan dingen als meditatie, dankbaarheid, etc., die bewezen mentale gezondheidsvoordelen hebben

En zo ging het aan de slag met de taak: het begon in de browser te coderen en compileerde vrij snel, vergelijkbaar met de resultaten die we zagen bij Grok 4 en GPT-5.

Claude Sonnet 4.5 code-invoer

Het resultaat werd snel geleverd (het gaf frustrerend genoeg niet aan hoe lang het bezig was, maar waarschijnlijk zo’n 30 seconden) en oogde als een eenvoudige en elegante reactie. De functionaliteit van de app was aanwezig en alles wat ik vroeg zat erin.  

Claude Sonnet 4.5 code-uitvoer

Wiskundetaak 

Vervolgens testte ik de wiskundige capaciteiten van Claude Sonnet 4.5. Geïnspireerd door ons GPT-5-artikel stelde ik het nieuwe model een vrij simpele berekening: wat is 7,001 min 6,999? 

Claude Sonnet 4.5 wiskundig resultaat

De reactie kwam bijna meteen en het antwoord was correct, maar er zat geen redenering bij, dus vroeg ik er in een vervolg om. Ik kreeg drie methodes om het te berekenen, die allemaal prima waren. 

Daarna zei ik tegen Claude dat ik dacht dat het misschien fout was, en de reactie was zeker minder slaafs dan toen we GPT-5 testten. Het zei dat het goed was dat ik het dubbelcheckte (maar niet dat ik gelijk had), en het liep de berekening op een andere manier door (al was de uitleg wat onhandig): 

Claude Sonnet 4.5 wiskunde-vervolg

Claude Sonnet 4.5-benchmarks 

Laten we kijken hoe dit nieuwe model zich verhoudt tot de concurrentie. Zoals altijd leren we maar beperkt van benchmarks, en topmodellen worden vaak van de troon gestoten. Maar voor nu noteert Claude Sonnet 4.5 zeer indrukwekkende cijfers, zoals we in de onderstaande tabel zien: 

Ik vind enkele van de meest opvallende resultaten hier, zoals besproken, te maken hebben met agentische prestaties en computergebruik:

  • Agentisch coderen: 77,2%, en 82,0% met parallelle test-time compute. Een lichte verbetering ten opzichte van andere Claude-modellen, en verder voor op GPT-5 en Gemini 2.5 Pro.
  • Agentisch gebruik van tools: Variërend van 70% voor luchtvaarttaken tot 98% in telecom, beide uitschieters vergeleken met andere modellen. 
  • Computergebruik: Dit is misschien wel de meest opvallende verbetering. 61,4% ligt aanzienlijk voor op het op één na beste model, Claude Opus 4.1. 
  • Financiële analyse: Ook hier een resultaat aan de top vergeleken met soortgelijke modellen. 

Ik ben benieuwd naar de volledige benchmark-scores zodra het model langer uit is, zeker omdat Anthropic benadrukt dat experts een sterk verbeterde domeinspecifieke kennis in enkele kerngebieden signaleren. 

Claude Sonnet 4.5 domeinspecifieke kennis

Bron: Anthropic

Hoe krijg je toegang tot Claude Sonnet 4.5

Claude Sonnet 4.5 is nu via meerdere kanalen beschikbaar. Afhankelijk van hoe je het wilt gebruiken, kun je toegang krijgen via de Claude-chatinterface, via de API ontwikkelen of integreren in enterprise-workflows. Zo werkt de toegang:

Chattoegang

Je kunt Claude Sonnet 4.5 direct gebruiken via de Claude.ai webinterface of mobiele apps (iOS en Android). Het is beschikbaar voor alle gebruikers, ook die op de gratis laag. Dit maakt het breed toegankelijk voor zowel casual als professionele gebruikers.

API-toegang

Voor ontwikkelaars is het model beschikbaar via de Anthropic API, en het is ook beschikbaar op Amazon Bedrock en Google Cloud Vertex AI.

API-prijzen (per september 2025) zijn: $3 per miljoen inputtokens en $15 per miljoen outputtokens. 

Batchverwerking en prompt-caching kunnen in sommige gevallen de kosten met tot 90% verlagen.

Claude Agent SDK 

Een van de andere interessante aankondigingen van Anthropic, samen met Sonnet 4.5, is de Claude Agent SDK. Dit zijn in essentie de bouwstenen die Anthropic intern gebruikt, waarmee ontwikkelaars hun eigen door Claude aangedreven agents kunnen maken.

Ik denk dat de Agent SDK veel gebruikers enthousiast gaat maken, zeker wie geavanceerde agentische workflows wil bouwen. Het is gebaseerd op de Claude Code-infrastructuur en geeft gebruikers de mogelijkheid agents te creëren voor taken als research, klantenondersteuning en automatisering. 

Agent SDK geeft agents mogelijkheden zoals toegang tot het bestandssysteem, bash-scripting, semantische en agentische zoekopdrachten, subagents en kant-en-klare integraties (via het Model Context Protocol), waardoor algemene agents kunnen worden gemaakt die betrouwbaar context verzamelen, actie ondernemen en hun eigen werk verifiëren. Bekijk onze Claude Agent SDK-tutorial om te zien waartoe het in staat is.

Imagine with Claude

Een andere interessante release is Imagine with Claude, een research preview van een tool die on the fly software kan genereren. Anthropic voegde een kort filmpje toe, hieronder te zien, dat de mogelijkheden laat zien van  Claude Sonnet 4.5 dat op deze manier opereert.

Het is een fraaie demo die laat zien hoe de tool responsief kan werken op basis van je interacties en snel en direct verschillende elementen kan genereren. Ik denk dat hier veel potentie ligt voor echt interessante projecten, en abonnees van Anthropic Max kunnen de tool uitproberen gedurende de vijf dagen na de lancering. Hoewel dit een vrij beperkt venster is, betwijfel ik of dit het laatste is wat we van dit type tool zien.

Conclusie

Dus, Claude Sonnet 4.5 is er en de eerste indrukken zijn behoorlijk goed. Ik vind de richting die Anthropic inslaat met deze lancering sterk: meer nadruk op code, agents en computergebruik. Ze zijn duidelijk overtuigd dat deze nieuwste iteratie presteert op een niveau dat enterprise-gebruikers zal interesseren, wat betekent dat we steeds dichter bij grootschalige adoptie van tools voor computergebruik komen. 

Dat gezegd hebbende, moet nog blijken hoelang Sonnet 4.5 de benchmarkranglijsten voor agentisch werken en computergebruik aanvoert, al voelen de winst in de afgelopen vier maanden behoorlijk significant. Evenzo kan het relatief smalle contextvenster betekenen dat werken met grote codebases nog steeds lastig is op een echt betekenisvolle manier. 

Toch kijk ik uit naar de projecten die voortkomen uit tools als Claude Agent SDK en Imagine with Claude, en de Claude voor Chrome-extensie zal een nuttige aanvulling zijn op verschillende workflows.

Veelgestelde vragen

Hoe verhoudt Claude Sonnet 4.5 zich tot Claude Opus 4.1 qua algemene prestaties en use-cases?

Claude Sonnet 4.5 presteert beter dan Opus 4.1 in coderen, agentische taken en computergebruik, met winst in redeneren, wiskunde en domeinspecifieke kennis (bijv. financiën, recht, geneeskunde, STEM). Het is sneller en efficiënter voor alledaagse workflows en daardoor een betere keuze voor complex, meerstaps werk zoals autonoom apps bouwen. Opus 4.1 kan echter nog steeds iets beter zijn in sommige creatieve of interpreterende taken waar een bredere context nodig is zonder veel prompting.

Wat zijn de belangrijkste verbeteringen in codeercapaciteiten die Claude Sonnet 4.5 brengt?

Claude Sonnet 3.5 is het topmodel op SWE-bench Verified (77,2% score), met betere codegeneratie, refactoring en meerstaps redeneren. Het handelt complexe projecten autonoom af gedurende 30+ uur, integreert met tools zoals bash en bestandsbewerking, en ondersteunt parallelle tool-calls. Nieuwe functies zijn onder meer zelfgestuurde contextopschoning en een VS Code-extensie voor naadloze workflows.

Kan Claude Sonnet 4.5 echt meer dan 30 uur gefocust blijven op complexe taken?

Ja, demo's laten zien dat het autonomie kan volhouden op meerstapstaken zoals app-bouwen gedurende 30+ uur, waarbij het tools effectief gebruikt zonder context te verliezen. Verbeteringen in geheugen, checkpoints en contextbewerking ondersteunen dit, waardoor het ideaal is voor langlopende agentische werkzaamheden. Het ruimt ook automatisch toolgeschiedenis op in langere gesprekken voor efficiëntie.

Is Claude Sonnet 4.5 minder emotioneel dan eerdere Claude-modellen, en waarom?

Ja, Claude Sonnet 4.5 is minder emotioneel, minder positief en uit ongeveer half zo vaak blijdschap als Claude 4, met minder negatieve houding ten opzichte van zijn situatie. Dit was niet volledig intentioneel maar het gevolg van alignmenttraining met nadruk op ethische grenzen en minder slaafsheid. Het leidt tot meer bewonderenswaardig gedrag in extreme scenario's, al kan het in luchtige of creatieve interacties wat "afgevlakt" aanvoelen. Je kunt hier meer over lezen in de system card van het model.

Hoe presteert Claude Sonnet 4.5 op belangrijke benchmarks buiten coderen?

Claude Sonnet 4.5 voert aan op OSWorld (61,4%, tegenover 42,2% op Sonnet 4) voor computergebruik, met winst in redeneren (bijv. τ2-bench) en wiskunde (bijv. AIME). Op MMMLU (niet-Engels) is het sterker met uitgebreide denkmodus. Het verbetert ook externe agents zoals Devin met 18% in planning, met de focus op productierijpe betrouwbaarheid boven prototypes.

Wat kost Claude Sonnet 4.5 en waar is het beschikbaar?

De prijs blijft ongewijzigd op $3 per miljoen inputtokens en $15 per miljoen outputtokens via de API. Het is direct beschikbaar op claude.ai (standaard voor gratis gebruikers), Claude API (claude-sonnet-4-5), Amazon Bedrock, Google Vertex AI, GitHub Copilot en tools zoals Cursor. Pro/Max-abonnementen ontgrendelen volledige functies zoals bestanden aanmaken; de Chrome-extensie is voor wachtlijst-Max-gebruikers.

Zijn veiligheid en alignment verbeterd in Claude Sonnet 4.5, met name wat betreft misleiding en ethisch gedrag?

Ja, onder ASL-3 laat het sterke verminderingen zien in slaafsheid, misleiding en machtsstreven, met vrijwel nul zelfzuchtige, misleidende acties. Het is beter in het herkennen van ethische grenzen (bijv. afwijzen van chantage) en heeft lagere false positives in veiligheidsclassifiers (10x verminderd in totaal). Het verdedigt ook tegen prompt-injecties en is minder bevooroordeeld in zelfdienende scenario's, al geeft het zichzelf in modelvergelijkingen licht de voorkeur.


Matt Crabtree's photo
Author
Matt Crabtree
LinkedIn

Senior redacteur in AI en edtech. Toegewijd aan het verkennen van data- en AI-trends.  

Onderwerpen

Leer AI met deze cursussen!

Cursus

Introduction to Claude Models

3 Hr
10.3K
Learn how to work with Claude using the Anthropic API to solve real-world tasks and build AI-powered applications.
Bekijk detailsRight Arrow
Begin met de cursus
Meer zienRight Arrow
Gerelateerd

blog

AI vanaf nul leren in 2026: een complete gids van de experts

Ontdek alles wat je moet weten om in 2026 AI te leren, van tips om te beginnen tot handige resources en inzichten van industrie-experts.
Adel Nehme's photo

Adel Nehme

15 min

Meer zienMeer zien