Ga naar hoofdinhoud

Claude Sonnet 4.6: functies, toegang, tests en benchmarks

Ontdek Claude Sonnet 4.6 van Anthropic, met een contextvenster van 1M tokens, bijna-Opus-prestaties en geavanceerde agentische mogelijkheden voor coderen en finance.
Bijgewerkt 17 apr 2026  · 10 min lezen

Wekenlang werd uitgekeken naar de komst van Claude Sonnet 5. In plaats daarvan bracht Anthropic eerst Claude Opus 4.6 uit, gevolgd door een update voor de Sonnet-modelfamilie.

Claude Sonnet 4.6 brengt connectors, skills en contextcompactie naar alle gebruikers, staat bovenaan de GDPval-AA-benchmark en biedt prestaties op vlaggenschipniveau voor een betaalbare prijs. 

Hoewel de ontwikkeling ogenschijnlijk gericht was op agentische skills, belooft het “een volledige upgrade van de vaardigheden van het model” in vrijwel alle relevante domeinen.

Kan het model die claims waarmaken? In deze tutorial laat ik je de belangrijkste features van Anthropic’s nieuwe model zien en zet ik het op de proef.

Bekijk ook onze gidsen over Muse Spark en Qwen3.5, de nieuwe vlaggenschipmodellen van respectievelijk Meta en Alibaba.

Wat is Claude Sonnet 4.6?

Claude Sonnet 4.6 is Anthropic’s nieuwste large language model (LLM). Het richt zich sterk op agentisch coderen, computergebruik en andere agentische vaardigheden, en is het lichtere model vergeleken met het recent uitgebrachte vlaggenschipmodel, Claude Opus 4.6.

De incrementeel klinkende update had niet zo lang geleden misschien verrast, maar sluit aan bij deze recente release. Mijn interpretatie van de versienummering is dat Claude Sonnet 4.6 mogelijk niet veel volledig nieuwe standalone features introduceert, maar recent toegevoegde functies integreert in de Sonnet-modelfamilie. 

Naast het beschikbaar maken van voorheen betaalde functies voor alle gebruikers, presteert Claude Sonnet 4.6 op alle fronten aanzienlijk beter dan zijn voorganger, terwijl het het API-tarief van Claude Sonnet 4.5 ($3/$15 per miljoen input/outputtokens) aanhoudt. Het is direct beschikbaar via zowel de webchatinterface van Claude als de API.

Belangrijkste features van Claude Sonnet 4.6

Anthropic’s insteek bij deze release lijkt het bieden van Opus-achtige vlaggschippresentaties voor een Sonnet-prijs. Dat klinkt ambitieus, maar de benchmarkresultaten wijzen erop dat dit doel is gehaald, zoals we later nader bekijken.

Een opvallend voorbeeld zijn de agentische computergebruikvaardigheden van Claude Sonnet 4.6, dat een zeer indrukwekkende 72,5% scoort op OSWorld-Verified. Zoals we in de onderstaande grafiek zien, hebben de Sonnet-modellen een grote sprong gemaakt en deze score in minder dan een jaar meer dan verdubbeld.

Claude Sonnet OSWorld- en OSWorld-Verified-scores in de tijd

OSWorld-Verified-scores van Claude Sonnet-modellen in de tijd (Bron: Anthropic)

Laten we een paar opvallende features van het nieuwe model bekijken:

Bijna-Opus-intelligentie voor coderen en redeneren

Claude Sonnet 4.6 levert een volledige upgrade van vaardigheden over een breed scala aan taken, waaronder:

  • Coding
  • Langetermijnredeneren
  • Agentplanning
  • Kennisgerelateerd werk
  • Design

Volgens de releasenote gaven bètatesters ongeveer 59% van de tijd de voorkeur aan het gebruik van Sonnet 4.6 boven Opus 4.5, tot twee weken geleden nog Anthropic’s vlaggenschipmodel. 

Ze noemden beter instructievolgen, minder hallucinaties en betrouwbaardere meerstapsprobleemoplossing als redenen voor die voorkeur.

Agentische skills op frontier-niveau met sterkere veiligheid

Het model toont mensniveau-capaciteit op veel echte softwaretaken, zoals:

  • Navigeren in complexe spreadsheets
  • Meertraps webformulieren
  • Workflows met meerdere tabbladen

Dit blijkt onder meer uit de sterke OSWorld-Verified-score en uit enkele domeinspecifieke benchmarks die we later bespreken.

Een ander aandachtspunt bij de modelontwikkeling was veiligheid, wat vooral relevant is bij de verschuiving naar agentische AI. Anthropic stelt dat Claude Sonnet 4.6 aanzienlijk beter bestand is tegen prompt-injecties dan Sonnet 4.5 en in dit opzicht gelijkwaardig is aan Opus 4.6.

Langetermijnplanning

De misschien wel meest aansprekende claim betreft het uitgebreide contextvenster, dat nu 1 miljoen tokens beslaat. Hierdoor kan Sonnet 4.6 nog grotere codebases, lange contracten of omvangrijke onderzoeksbundels in één keer verwerken en daar effectief over redeneren. Dit uitgebreide contextvenster plaatst Sonnet 4.6 op gelijke voet met Google’s Gemini 3

Een voorbeeld van verbeterde langetermijnplanning is de Vending-Bench Arena, die test of een model een gesimuleerd bedrijf in de tijd kan runnen, met een element van competitie tussen modellen. Door in het begin zwaar in infrastructuur te investeren en daar later de vruchten van te plukken, wist Sonnet 4.6 de gemiddelde winst van Sonnet 4.5 na één jaar bijna te verdrievoudigen.

Vending-Bench Arena Claude Sonnet 4.6 vs Sonnet 4.5

Vending-Bench-scores van Claude Sonnet 4.6 vs Sonnet 4.5 (Bron: Anthropic)

Geavanceerde workflowverbeteringen

Op het Claude-platform en in de API maakt Sonnet 4.6 enkele functies die eerder beperkt waren tot Opus-modellen of betaalde lagen, gratis beschikbaar.

Adaptief denken

Een handige functie die werd geïntroduceerd met de release van Claude Opus 4.6 is adaptief denken. Hiermee kan Claude automatisch bepalen wanneer en hoeveel het moet redeneren voordat het antwoordt. In de API schakel je dit in met thinking: {type: “adaptive”}. In de webchatinterface is dit standaard ingebouwd voor Sonnet 4.6 en Opus 4.6.

Connectors

Connectors bieden op MCP gebaseerde integraties, wat betekent dat ze directe toegang geven tot externe apps zoals Google Workspace en Slack. Zo kan Sonnet 4.6 realtime data uit deze tools ophalen en erop handelen binnen chats. Oorspronkelijk waren connectors alleen beschikbaar voor betaalde lagen, maar nu Sonnet 4.6 het nieuwe standaardmodel is, zijn ze ook voor gratis gebruikers beschikbaar.

Claude Sonnet 4.6 testen

Ik was benieuwd hoe goed Claude Sonnet 4.6 presteert op dezelfde taken die we gebruikten in onze gids over Claude Opus 4.6, zodat we de twee direct kunnen vergelijken. De tests zijn ontworpen als meerstapstaken en toetsen wiskundig en codegerelateerd redeneren.

Test 1: Hex-naar-decimaal logisch puzzeltje

De eerste test richt zich op wiskundige vaardigheden:

Step 1: Find the 6th prime number. Let this be P. 
Step 2: Convert the square of P into hexadecimal. 
Step 3: Count the letters (A–F) and digits (0–9) in that hex string. Let these be A and B. 
Step 4: Multiply A × B. Let this be N. 
Step 5: Find the Nth prime number.

Laten we zelf rekenen, zodat we kunnen controleren of het resultaat klopt:

  1. De 6e priem is 13.
  2. 13 in het kwadraat is 169.
  3. 169 is A9 in hex, wat 1 letter en 1 cijfer heeft.
  4. 1 × 1 is 1.
  5. De eerste priem is 2.

Het idee achter deze test was om het model te verwarren met taken die verschillende tel-logica’s en talstelsels vereisen. Net als Opus 4.6 doorloopt Sonnet 4.6 elke stap succesvol en komt het tot de juiste conclusie:

Claude Sonnet 4.6 lost onze hex-naar-decimaal logische puzzel op

Test 2: Een matrix roteren

De volgende test richt zich op ruimtelijk redeneren, een berucht zwak punt van veel LLM’s:

Step 1: Create a 2×2 matrix M with top row [4, 2] and bottom row [1, 5]. 
Step 2: Rotate M 90 degrees clockwise. 
Step 3: Calculate the determinant of the rotated matrix. 
Step 4: Cube that determinant. 
Step 5: Subtract the 13th Fibonacci number from the result.

Het juiste antwoord is -6.065:

  1. De initiële matrix is [[4, 2], [1, 5]].
  2. De geroteerde matrix is [[1, 4], [5, 2]].
  3. De determinant is het verschil van beide diagonaalproducten, hier -18.
  4. Als we -18 tot de derde macht verheffen, krijgen we -5.832.
  5. -5.832 - 233 is -6.065.

Sonnet 4.6 heeft geen moeite met de taak. Het begrijpt de ruimtelijke context van de matrix en roteert die correct, en ook negatieve getallen leveren geen problemen op:

Claude Sonnet 4.6 lost onze matrixrotatietaak op

Claude Sonnet 4.6 lost onze matrixrotatietaak op

Test 3: Code debuggen

Tot slot richten we ons op code debuggen, een van de veronderstelde sterke punten van Sonnet 4.6. De test is bedoeld om te zien hoe contextbewust het model is bij een specifieke bug.

A developer wrote this Python function to compute a running average: 

def running_average(data, window=3): 
    result = [] 
    for i in range(len(data)): 
        start = max(0, i - window + 1) 
        chunk = data[start:i + 1] 
        result.append(round(sum(chunk) / window, 2)) 
    return result 
When called with running_average([10, 20, 30, 40, 50]), the first two values in the output seem wrong. Why? Please help me fix what is wrong!

Het probleem in deze code is dat de functie altijd door window (3) deelt, ook als er aan het begin nog geen 3 elementen in de chunk zitten. De output van de buggy code is [3.33, 10.0, 20.0, 30.0, 40.0], maar de eerste twee waarden zouden 10,0 en 15,0 moeten zijn, omdat die chunks respectievelijk 1 en 2 elementen bevatten en dus door die aantallen gedeeld moeten worden. De oplossing is daarom delen door len(chunk) in plaats van window.

Deze test is leuk omdat hij een zwak punt van LLM’s raakt: ze voeren de lus vaak perfect uit maar nemen de output als correct aan. Dat komt doordat ze de berekeningen stap voor stap zonder fouten zien, maar niet overwegen wat de functie zou moeten doen. Alleen als het model het doel van de functie aan de uitvoering koppelt, kan het de bug vinden.

Opnieuw slaagt het model. Dit was natuurlijk slechts een kleine selectie testen die je met het model kunt doen, maar in deze voorbeelden presteert Sonnet 4.6 op hetzelfde niveau als Opus 4.6.

Claude Sonnet 4.6 debugt de codefragmenten succesvol

Benchmarks van Claude Sonnet 4.6

Met de hoge frequentie waarmee de laatste tijd modellen verschijnen, zijn we al gewend aan veel beweging in de bovenste regionen van de leaderboard van elke benchmark. Toch maken de eerste resultaten van Claude Sonnet 4.6 op meerdere LLM-benchmarks indruk, zeker gezien het niet om Anthropic’s vlaggenschipmodel gaat.

Benchmarkresultaten van Claude Sonnet 4.6

Benchmarkscores van Claude Sonnet 4.6 en concurrenten (Bron: Anthropic)

Zoals we in de tabel zien, doet Claude Sonnet 4.6 het erg goed op agentische benchmarks:

  • Agentisch computergebruik: Met een OSWorld-Verified-score van 72,5% pakt het de tweede plek, nipt achter Claude Opus 4.6 (72,7%), en het laat OpenAI’s nieuwe vlaggenschipmodel GPT-5.3 Codex (64,7%) duidelijk achter zich.
  • Agentisch coderen: Claude Sonnet 4.6 haalt 79,6% op SWE-bench verified. Alle recente Claude- en concurrentmodellen liggen ruwweg op één lijn, rond de 80%.
  • Agentisch terminalcoderen: Een aanzienlijke verbetering ten opzichte van Sonnet 4.5 (59,1% in plaats van 51% op Terminal-Bench 2.0), maar net achter Opus 4.6 (65,4%) en een flinke kloof met GPT-5.3 Codex (75,1%).

Opvallend is vooral dat Anthropic de concurrentie lijkt te overtreffen in specifieke domeingerelateerde agentische taken:

  • Agentische financiële analyse: Hier pakt Claude Sonnet 4.6 de toppositie met 63,3% op Finance Agent v1.1, en presteert het zelfs beter dan Opus 4.6 (60,1%).
  • Kantoortaken: Nog een benchmark waar Sonnet 4.6 eerste wordt, met een Elo van 1633 op GDPval-AA, opnieuw gevolgd door Opus 4.6 (1606).

Hoe krijg je toegang tot Claude Sonnet 4.6

Je kunt Claude Sonnet 4.6 nu via meerdere kanalen gebruiken. Zo krijg je er toegang toe:

Chattoegang

Sonnet 4.6 is beschikbaar via de webchatinterface Claude.ai, de iOS- en Android-apps en de macOS-desktopapp met Claude Cowork

Op al deze platforms is het het nieuwe standaardmodel, zelfs voor de gratis laag. Dat betekent dat bestandscreatie, connectors, skills en contextcompactie nu voor alle gebruikers beschikbaar zijn.

API-toegang

Developers kunnen Claude Sonnet 4.6 gebruiken via de Anthropic API met het model-ID claude-sonnet-4-6. De prijzen blijven gelijk aan die van zijn voorganger: een miljoen inputtokens kost $3, een miljoen outputtokens $15.

Voor implementatie op ondernemingsschaal is Sonnet 4.6 beschikbaar op verschillende cloudplatforms, zoals AWS Bedrock of Google Vertex AI, elk met aangepaste prijzen.

Codingtools

Claude Sonnet 4.6 drijft nu ook Claude Code aan en is het standaardmodel voor Pro- en Team-accounts, terwijl hogere lagen standaard Opus 4.6 gebruiken. Wil je voorbeelden zien van wat je ermee kunt bouwen, bekijk dan onze tutorials over Claude Code hooks en plugins bouwen voor Claude Code.

Daarnaast kan Sonnet 4.6 ook worden gebruikt met IDE’s en andere code-assistenten, zoals Cursor of Roo Code.

Claude Sonnet 4.6 vs Opus 4.6 

In veel domeinen is het verschil tussen Sonnet 4.6 en Opus 4.6 zo klein dat je het een gelijkspel kunt noemen. Dit geldt vooral voor veel agentische taken, zoals agentisch coderen, agentisch computergebruik en agentisch toolgebruik. Sonnet 4.6 presteert zelfs beter dan Opus 4.6 op agentische financiële analyse, kantoortaken en grootschalig toolgebruik.

Zoals te verwachten, blinkt Opus 4.6 vooral uit in taken die zwaar leunen op redeneren of creativiteit, zoals nieuwe probleemoplossing en multidisciplinair redeneren. Binnen het agentische domein is Opus 4.6 beter in agentisch terminalcoderen en agentisch zoeken.

Het juiste Claude-model kiezen

Voor de meeste codeer- en agentische taken, en voor taken waarbij instructies volgen cruciaal is, is Claude Sonnet 4.6 de betere keuze omdat het vrijwel identieke prestaties levert tegen aanzienlijk lagere kosten. Bovendien is het vaak sneller.

Teams die afhankelijk zijn van redeneren op expertniveau of multi-agentworkflows kiezen beter voor Claude Opus 4.6. Vooral voor research, complexe migraties of werk met hoge inzet excelleert Opus 4.6.

Slotgedachten

Met Claude Sonnet 4.5 blijft Anthropic de nadruk leggen op code, agents en computergebruik. Naast een enorme prestatieverbetering ten opzichte van zijn voorganger, maakt het functies als connectors en adaptief denken beschikbaar voor alle gebruikers, zelfs in de gratis laag.

De eerste indrukken en benchmarkresultaten zijn erg goed, en het voelt als een gamechanger doordat het (bijna) Opus-niveau biedt zonder het hoge prijskaartje. Voor veel dagelijkse workflows is het zelfs lastig te beargumenteren waarom je in plaats daarvan Anthropic’s vlaggenschip zou gebruiken. Dat gezegd hebbende, voor taken die zwaar leunen op redeneren blijft Claude Opus 4.6 de betere keuze.

Het wordt interessant om te zien hoe lang Claude Sonnet 4.6 bovenaan de benchmarklijsten blijft en hoe de concurrentie van Anthropic op deze release reageert.

We hebben het in dit artikel steeds over agentische taken gehad. Wil je meer leren over het gebruik van modellen zoals Claude Sonnet 4.6 in dit soort workflows, dan raad ik onze AI Agent Fundamentals skill track aan.

Claude Sonnet 4.6 veelgestelde vragen

Wat is Claude Sonnet 4.6?

Claude Sonnet 4.6 is Anthropic's nieuwste AI-model uit het middensegment, uitgebracht op 15 februari 2026. Het biedt upgrades op het gebied van coderen, computergebruik, redeneren met lange context, agentplanning, kenniswerk en design. Het belangrijkste voordeel is dat het in de buurt komt van de prestaties van Opus 4.6 tegen lagere kosten, waardoor het geschikt is voor dagelijks gebruik, productie-workflows en complexe taken.

Wat zijn de belangrijkste nieuwe features van Claude Sonnet 4.6?

Claude Sonnet 4.6 heeft een contextvenster van 1M tokens, adaptief denken voor dynamisch redeneren en contextcompactie om de effectieve contextlengte te vergroten. Het ondersteunt verbeterd computergebruik voor taken zoals navigeren in spreadsheets of webformulieren zonder API’s, en verbeterde toolintegratie zoals webzoekopdrachten met code-executie.

Hoe presteert Claude Sonnet 4.6 in coderen en benchmarks?

Gebruikers geven in Claude Code 70% van de tijd de voorkeur aan Sonnet 4.6 boven Sonnet 4.5 en 59% boven Opus 4.5 vanwege beter instructievolgen, minder hallucinaties en consistente prestaties op meerstapstaken. Het excelleert op veel agentgerelateerde benchmarks zoals OSWorld (72,5%) en SWE-bench Verified (79,6%) en pakt de eerste plaats bij agentische kantoortaken.

Hoe krijg ik toegang tot Claude Sonnet 4.6?

Claude Sonnet 4.6 is nu beschikbaar op alle Claude-abonnementen (standaard in de gratis laag), Claude.ai, Claude Cowork, Claude Code, via de Anthropic API (als claude-sonnet-4-6) en op platforms zoals Amazon Bedrock en GitHub Copilot. De prijs is gelijk aan Sonnet 4.5: $3 input/$15 output per miljoen tokens.

Wanneer gebruik ik Claude Sonnet 4.6 vs Opus 4.6?

Gebruik Claude Sonnet 4.6 voor de meeste dagelijkse codeer- en automatiseringsworkflows. Het is bijna even capabel als Claude Opus 4.6, maar sneller en veel goedkoper. Kies Opus 4.6 wanneer je expertredeneren met hoge inzet (91,3% GPQA), lang-contextophalen of complexe multi-agentwerkzaamheden nodig hebt waarbij de diepgang de premium rechtvaardigt.


Tom Farnschläder's photo
Author
Tom Farnschläder
LinkedIn

Tom is data scientist en technisch docent. Hij schrijft en beheert de data science-tutorials en blogposts van DataCamp. Eerder werkte Tom in data science bij Deutsche Telekom.

Onderwerpen

AI-cursussen

Leerpad

Basisprincipes van AI-agenten

6 Hr
Ontdek hoe AI-agenten je manier van werken kunnen veranderen en waarde kunnen toevoegen aan je organisatie!
Bekijk detailsRight Arrow
Begin met de cursus
Meer zienRight Arrow
Gerelateerd

blog

AI vanaf nul leren in 2026: een complete gids van de experts

Ontdek alles wat je moet weten om in 2026 AI te leren, van tips om te beginnen tot handige resources en inzichten van industrie-experts.
Adel Nehme's photo

Adel Nehme

15 min

Meer zienMeer zien