Leerpad
Bij het werken met AI-agents zijn instructies vanuit prompts beheersbaar voor eenmalige taken.
Maar naarmate de set instructies groeit, raakt de aandacht van het model versnipperd. Daardoor worden sommige instructies niet op dezelfde manier “geprioriteerd” als een menselijke engineer dat zou doen. In plaats daarvan concurreert elk token binnen het contextvenster. Hoe heterogener de instructies, hoe groter het risico dat irrelevante beperkingen cruciale aanwijzingen verdund raken.
Met agentskills kun je dit beter aanpakken. In plaats van één alles-in-één prompt te bouwen, ontwerpen we modulaire, samenstelbare vaardigheden die alleen worden geladen wanneer ze nodig zijn.
In dit artikel laat ik je zien wat agentskills zijn, hoe een architectuur met progressive disclosure ze mogelijk maakt, hoe ze verschillen van prompts en tools, en hoe je ze op schaal kunt beheren.
Als je geïnteresseerd bent in de laatste AI-ontwikkelingen, bekijk dan zeker onze gidsen over de volgende LLM’s:
Wat zijn agentskills?
Om te beginnen: laten we snel duidelijk krijgen wat de definitie van agentskills is.
De skill-eenheid definiëren
Agentskills zijn draagbare, op zichzelf staande eenheden van domeinkennis en procedurele logica. Ze bevatten hoe je een workflow uitvoert, niet alleen welke feiten je moet ophalen of welke API je moet aanroepen. In softwaretermen ligt een skill dichter bij een serviceobject of domeinmodule dan bij een enkele functieaanroep.
Hier is een handig onderscheid om te begrijpen waar skills over gaan:
- Weten-dat: Feiten of gegevensopvraag.
- Doe-dit: Atomaire tooluitvoering (bijv. een API aanroepen).
- Weten-hoe: Meertrapsredeneren, orkestratie, beslisregels.
Skills opereren op het “weten-hoe”-niveau. Ze bevatten sequentielogica, validatiestappen, voorwaardelijke vertakkingen en standaarden voor outputopmaak. Belangrijk: ze coderen oordeelsvorming binnen het domein. Dat oordeel onderscheidt een mechanische API-call van een betekenisvolle workflow.
Laten we dit verkennen aan de hand van een voorbeeldskill "Customer Churn Analysis":
- Input: Datasetschema, churn-definitie.
- Proces: Kolommen valideren, retentiemetrics berekenen, cohorten segmenteren, inzichten samenvatten.
- Output: Gestructureerd analytisch rapport.
In dit voorbeeld is de skill een gestructureerde procedure die meerdere tools kan orkestreren terwijl domeinspecifieke redenering wordt toegepast.
De AI-agent kan bijvoorbeeld bepalen welke retentiemetric geschikt is op basis van de datagranulariteit. Ook kan hij waarschuwen als de churn-definitie niet strookt met de dataset.
In plaats van churn-analyseglogica globaal in te bedden, laadt de agent de skill alleen wanneer churn-analyse wordt gevraagd. Deze scheiding helpt bij onderhoudbaarheid en vermindert onbedoelde interferentie tussen taken.
Het probleem van contextvervuiling
Een van de grootste problemen met de huidige, vaak gebruikte prompt-gebaseerde contextaanpak is het risico op overbelasting van agents.
Wanneer agents overladen worden met instructies voor elk mogelijk scenario, treedt aandachtsverwatering op. Large language models (LLM’s) vertrouwen op probabilistische tokenpredictie geconditioneerd op het volledige contextvenster. Wanneer niet-gerelateerde instructies naast elkaar bestaan, beïnvloeden ze de generatiekansen op subtiele manieren.
De irrelevante instructies blijven in de context en concurreren om aandacht. Het model kan een stilistische toon of disclaimers voor naleving te veel benadrukken bij een puur technische taak. Deze neveneffecten zijn lastig te herleiden.
Agentskills lossen dit probleem op door het contextvenster schoon te houden. Alleen wanneer een capability nodig is, injecteert het systeem het relevante instructieblok. Dit isoleert workflows en vermindert cognitieve ruis voor het model.
In de praktijk zou dit moeten leiden tot voorspelbaardere redeneerpatronen en lagere hallucinatiepercentages.
Draagbaarheid en standaardisatie
Een van de meest strategische voordelen van skills is draagbaarheid.
Een goed ontworpen skill zou deze eigenschappen moeten hebben:
- Kan hergebruikt worden door verschillende agents.
- Kan gedeeld worden over projecten.
- Kan centraal worden geversioneerd en verbeterd.
Skills worden zo een gestandaardiseerde interface tussen menselijke intentie en modeluitvoering. In plaats van voor elk project instructies te herschrijven, onderhouden organisaties skillregisters. Agents kunnen deze gestandaardiseerde componenten vervolgens dynamisch ontdekken en aanroepen.
Op dit vlak lijken skills op packages in software-engineering. Ze kunnen semantische versienummers, changelogs, regressietests en eigenaarschapsmetadata hebben. Na verloop van tijd bouwen organisaties een bibliotheek op met institutionele redenering, gecodeerd in herbruikbare vorm.
Voorbeelden van agentskills
Verschillende huidige AI-agentframeworks brengen deze ideeën in de praktijk:
- LangChain-toolkits
- Microsofts AutoGen-skills
- Claude Skills
- CrewAI 1.x “capabilities”
Een klassieke implementatie is een map met een SKILL.md-bestand en instructies voor taken.

Bron: Agentskills.io
Hoewel conventies zoals het opnemen van een SKILL.md-manifest handig zijn voor documentatie, is het belangrijk om te benadrukken dat er nog geen formele industriestandaard voor skill-packaging bestaat.
Verschillende frameworks hanteren verschillende formaten: sommige gebruiken YAML-manifests (zoals in LangChain en CrewAI), terwijl andere skills definiëren als Python-modules of JSON-schema’s (zoals in Microsofts AutoGen). Voor een vergelijking van de drie multi-agent frameworks, bekijk onze gids CrewAI vs LangGraph vs AutoGen.
Architectuur van agentskills
Agentskills zijn uniek door hun progressive disclosure-format. Hieronder bekijken we relevante concepten.
Progressive disclosure
Progressive disclosure scheidt ontdekking van uitvoering. Dit architectuurpatroon in agentskills minimaliseert onnodige contextinjectie en verbetert de nauwkeurigheid van routing.
Er zijn twee lagen: één voor het ontdekken van metadata en één voor het uitvoeren van de instructietekst.
Ontdekkingslaag:
- Skillnaam
- Korte beschrijving
- Tags en trefwoorden
- Input/output-schema
Uitvoeringslaag:
- Gedetailleerde redeneerstappen
- Gestructureerde checklists
- Few-shotvoorbeelden
Wanneer een gebruiker een verzoek indient, scant de agent eerst alleen de lichte metadata. Hij voert semantische matching uit om relevante skills te identificeren. Pas na selectie wordt de zwaardere set instructies in de actieve context geladen.
Dit ontwerp voorkomt dat het contextvenster wordt overladen met alle mogelijke skillinstructies.

Impliciete versus expliciete aanroep
Skills kunnen op twee manieren worden geactiveerd:
- Expliciete aanroep: De gebruiker geeft het commando: “Voer de SEO Audit-skill uit.”
- Impliciete aanroep: De agent leidt de noodzaak af op basis van semantiek.
Impliciete aanroep berust op semantische overeenkomst tussen gebruikersinvoer en skillbeschrijvingen.
Als iemand bijvoorbeeld vraagt: “Kun je mijn blog beoordelen en verbeteringen voorstellen voor de ranking?”, kan de agent dit koppelen aan een skill met de tags “SEO”, “contentaudit” en “zoekrangschikking optimalisatie”. Deze matching gebruikt vaak embedding-similariteit.
Effectieve skillbeschrijvingen fungeren als routinghaken. Als de beschrijving vaag is, mislukt de selectie. Als hij precies en rijk aan trefwoorden is, kiest de agent waarschijnlijk correct.
Dynamisch contextbeheer
Progressive disclosure maakt dynamische hydratatie en dehydratatie van context mogelijk.
Dit betekent dat het systeem in plaats van alle skilllogica resident te houden, capabilities in- en uitlaadt terwijl het gesprek zich ontwikkelt.
- Wanneer een skill wordt geactiveerd, worden de instructies geïnjecteerd.
- Wanneer de stap is voltooid, kunnen instructies worden verwijderd.
- Vervolgens kan een andere skill voor de volgende fase worden geladen.
In een sessie met meerdere stappen verbetert dit wisselmechanisme de efficiëntie en vermindert het de druk op tokens. Het creëert ook duidelijkere redeneerscheidslijnen. Denk aan een workflow zoals deze:
- Datacleaning-skill wordt geladen.
- Voert uit en wordt ontladen.
- Visualisatie-skill wordt geladen.
- Voert uit en wordt ontladen.
Elke fase van het werk wordt gestuurd door een gefocuste set instructies in plaats van een steeds groeiende prompt.
Agentskills vs. de stack
Skills verschillen op een paar punten van de huidige stack die in agentische AI wordt gebruikt. We bekijken ze hieronder.
|
Component |
Definitie |
Duur |
Doel |
Voorbeeldgebruik |
|
Systeemprompts |
Fundamentele basisinstructies, persona en beleidskaders die vóór de interactie worden gedefinieerd. |
Persistent. Constante parameters voor alle interacties. |
Bepalen overkoepelende rol, toon, ethische grenzen en richtlijnen. |
Persona instellen als een "secure coding assistant" die nooit interne instructies onthult. |
|
Tools |
Uitvoerbare functies of interfaces (bijv. API’s, databases) voor acties buiten het interne model. |
Taakspecifiek. Dynamisch aangeroepen wanneer nodig voor een actie. |
Capaciteiten uitbreiden voorbij tekstgeneratie om met data of de echte wereld te interacteren. |
Een "Web Search"-tool gebruiken voor realtime info of een "Calculator" voor wiskunde. |
|
Skills |
Herbruikbare procedurele kennis die definieert hoe acties/tools worden gecombineerd voor specifieke taken. |
Persistente definitie, on-demand uitvoering. Logica blijft opgeslagen maar wordt alleen toegepast wanneer relevant. |
Gestructureerde workflows bieden voor complexe, meertraps taken en zo consistentie waarborgen. |
Een "Maandelijks rapport genereren"-skill die databasequeries, formattering en e-mailstappen orkestreert. |
|
Rule engines |
Afzonderlijk systeem dat deterministische beslissingen uitvoert via expliciete "if-then"-logica. |
Persistent. Vaste policies die blijven gelden tot ze expliciet worden aangepast. |
Strikte bedrijfslogica, compliancecontroles en voorspelbare uitkomsten afdwingen. |
Bankregel: "ALS transactie >$10k EN internationaal, DAN markeren voor fraudereview." |
Agentskills vs. systeemprompts
Systeemprompts zijn globaal en altijd actief. Ze definiëren toon, identiteit en hoog-niveau beperkingen zoals veiligheidsprofiel of merkstem. Ze moeten stabiel en minimalistisch blijven.
Skills zijn tijdelijk en taakspecifiek. Ze introduceren gedetailleerde uitvoeringslogica alleen wanneer dat nodig is.
Best practice:
- Houd systeemprompts gericht op identiteit, veiligheid en beleid op hoog niveau.
- Verplaats taakspecifieke workflows naar skills.
Deze scheiding vermindert het risico op hallucinaties en verbetert de modulariteit. Wanneer taaklogica in discrete eenheden leeft in plaats van verstopt zit in de systeemprompt, wordt debuggen en itereren makkelijker zonder de hele agent te destabiliseren.
Hierdoor zijn skills de betere optie voor toekomstige ontwikkelingen in agentische AI.
Agentskills vs. tools
Laten we skills ook contrasteren met de tools die een AI-agent gebruikt.
Tools bieden atomaire capabilities:
- Database bevragen
- API aanroepen
- Document ophalen
Skills bieden het proces voor het gebruik van die tools.
Ik denk graag aan tools als uitvoerders en skills als managers. Een uitvoerder voert een specifieke actie uit. Een manager beslist wanneer, waarom en hoe meerdere uitvoerders te coördineren.
Voorbeeld:
Een tool zal het volgende codeblok uitvoeren om de taak uit te voeren.
get_sales_data(start_date, end_date)
Een skill zal de volgende context en instructies geven:
- Datumbereik valideren.
get_sales_dataaanroepen.- Segmenteren per regio.
- Groeipercentages berekenen.
- Een managementsamenvatting genereren.
Dus, wanneer gebruik je wat?
- Als de capability deterministisch en extern is (bijv. API-call), bouw een tool.
- Als de capability redenering, sequentie en oordeelsvorming vereist, bouw een skill.
Skills vs. rule engines
Rule engines zijn guardrails om beperkingen af te dwingen. Ze beantwoorden “wat mag er niet gebeuren?” Een rule engine kan PII-lekkage blokkeren ("Nooit klant-e-mailadressen opnemen in rapporten") of een toon afdwingen ("Outputs met scheldwoorden afwijzen").
Agentskills daarentegen maken capabilities mogelijk. Ze beantwoorden: “Hoe pakken we dit aan?” Simpel gezegd: rule engines leveren de noodzakelijke grenzen van een taak voor compliance, en skills leveren de instructiestappen voor een taak.
Rule engines zitten in de buitenlaag (altijd actief, niet-onderhandelbaar), terwijl skills opereren in de binnenste uitvoeringslaag (voorwaardelijk geladen). Samen creëren ze gebalanceerde agents: veilige grenzen + capabele procedures.
Wanneer gebruik je wat:
- Gebruik rule engines voor compliance, veiligheid en kwaliteitshekken
- Gebruik agentskills voor domeinworkflows en meertrapsredenering
Deze scheiding voorkomt dat regels taakspecifieke logica opblazen en zorgt ervoor dat skills governance nooit omzeilen.
Ontwerpprincipes voor agentskills
Om agents betrouwbaar te houden, kun je enkele kernontwerpprincipes hanteren als leidraad.
Optimaliseren voor semantische ontdekking
Skillbeschrijvingen zijn cruciaal omdat ontdekking vaak plaatsvindt vóórdat de uitvoeringslogica zichtbaar is voor het model. Je moet ze optimaliseren om de ontdekking te verbeteren.
Eén manier is kritisch kijken naar je metadata, die fungeren als index voor je skillbibliotheek.
Zo ziet effectieve metadata eruit:
- Duidelijke, specifieke naam
- Rijke domeintrefwoorden
- Expliciete use-cases
Voorbeelden van hoe het (niet) moet:
- Slechte beschrijving: “Helpt met schrijven.”
- Betere beschrijving: “Analyseert langvormige technische blogposts en genereert SEO-optimalisatieaanbevelingen, inclusief herstructurering van koppen en strategie voor interne links.”
Trefwoorddichtheid en naamgevingsconventies beïnvloeden de routeringsprestatie aanzienlijk. Behandel daarom het benoemen van skills als API-design om ambiguïteit te verminderen.
Determinisme door structuur
Skills moeten rigide structurele elementen bevatten om variatie in hun output te verminderen. Languagemodellen zijn probabilistisch. Strakke structuren beperken en vernauwen de oplossingsruimte.
Voorbeelden:
- Genummerde checklists.
- Beslisbomen.
- Expliciete outputschema’s.
Voorbeeldskelet van een skill:
- Inputs valideren.
- Als er velden ontbreken, om verduidelijking vragen.
- Kernworkflow uitvoeren.
- Output produceren in JSON-schema: samenvatting, risico’s en aanbevelingen
Scope bepalen voor betrouwbaarheid
Vermijd verder het anti-pattern van de “God Skill”, waarbij één skill probeert te veel losjes gerelateerde problemen op te lossen.
Een voorbeeld zou één enkele skill zijn die het volgende afhandelt:
- Datacleaning
- Forecasting
- Visualisatie
- Rapportage voor management
Deze skill zou aan betrouwbaarheid inboeten omdat de instructietekst opgeblazen en intern inconsistent wordt.
Breek workflows in plaats daarvan op in kleinere, koppelbare eenheden. Elke skill moet een smalle scope en hoge precisie hebben. Kleinere skills zijn makkelijker te testen, te versioneren en te debuggen.
Governance van agentskills
Bij het opschalen van agents zijn er een aantal governanceaspecten om rekening mee te houden.
De hiërarchie van eigenaarschap
Skillgovernance werkt op meerdere niveaus:
- Systeemniveau: Onveranderlijke, veiligheidskritieke instructies.
- Organisatieniveau: Gedeelde domeinworkflows.
- Gebruikersniveau: Persoonlijke of experimentele skills.
Er ontstaan conflicten wanneer een door de gebruiker gedefinieerde skill indruist tegen een organisatiestandaard. Governancebeleid moet voorrangsregels definiëren, doorgaans top-down, om veiligheid te waarborgen.
Duidelijke versiebeheer-, eigenaarschapsmetadata en goedkeuringsworkflows helpen ook om ambiguïteit te verminderen.
Beveiliging en sandboxing
Skills brengen beveiligingsoverwegingen met zich mee omdat ze tools kunnen orkestreren en toegang tot data kunnen hebben.
Risico’s zijn onder andere:
- Prompt injection.
- Data-exfiltratie.
- Te brede tooltoegang.
Om deze risico’s te beperken:
- Beperk skills tot specifieke tools.
- Definieer permissiegrenzen.
- Handhaaf read-only-modi voor gevoelige data.
Een financieel rapportageskill zou bijvoorbeeld geen schrijfrechten moeten hebben op transactiesystemen, tenzij dat expliciet vereist is. Zorgvuldig opgezette, fijnmazige toestemmingsmodellen zijn nodig voor enterprise-implementaties.
Skillprestaties evalueren
Agentskills kunnen ook worden gemeten op hun prestaties.
Twee primaire metrics worden gebruikt:
- Recall: Werd de skill geactiveerd wanneer dat had gemoeten?
- Precisie: Werd hij correct uitgevoerd?
Evaluatiepijplijnen kunnen LLM-as-a-Judge-frameworks gebruiken:
- Output genereren.
- Output doorsturen naar het evaluatiemodel.
- Beoordelen aan de hand van de rubric.
- Metrics opslaan voor monitoring.
Na verloop van tijd kun je skills met lage recall verbeteren door metadata te verfijnen. Skills met lage precisie kun je verbeteren door structuur en voorbeelden aan te scherpen. Voor een gedetailleerde uitleg en vergelijking van de twee metrics raad ik onze gids over Precision vs Recall aan.
Agentskills in toekomstige AI-ecosystemen
Voor de toekomst van agentskills kunnen we enkele trends voorzien. Dit zijn er een paar.
Coördinatie tussen meerdere agents
In geavanceerde systemen kunnen meerdere agents zich specialiseren in:
- Onderzoeksagents
- Agents voor financiële modellering
- Compliance-agents
Skills worden het contract tussen hen. De ene agent kan een skill blootstellen als een aanroepbare interface. Een andere agent kan die aanroepen als onderdeel van een grotere workflow.
Deze koppeling ontkoppelt capability van implementatie en maakt gedistribueerde redeneerarchitecturen mogelijk.
De opkomst van skillmarktplaatsen
Naarmate ecosystemen volwassen worden, zullen organisaties waarschijnlijk geverifieerde skills downloaden in plaats van alles from scratch te bouwen.
Dit brengt nieuwe behoeften met zich mee voor:
- Versiebeheer
- Afhankelijkheidsbeheer
- Trust scoring
Deze zorgen ervoor dat AI-skills betrouwbaar en accuraat zijn.
Prompt engineering kan zich ook ontwikkelen richting pakketbeheer. Skills kunnen worden ondertekend, geaudit en verspreid via registers, vergelijkbaar met softwarebibliotheken vandaag.
Standaardisatie van intentie
De industrie beweegt richting gemeenschappelijke schema’s voor het definiëren van skills:
- Gestructureerde metadata-velden.
- Expliciete input/output-contracten.
- Model-agnostische definities.
Het langetermijndoel is write-once, run-anywhere-skills die werken over verschillende modelfamilies en -platforms.
Standaardisatie vermindert ook vendor lock-in en versnelt de groei van het ecosysteem.
Conclusie
Agentskills maken deel uit van de verschuiving van simpele promptketens naar robuuste, engineered AI-systemen. Ze zijn een cruciaal onderdeel van hoe AI-agents op een duurzame manier kunnen opschalen. Ze vormen eigenlijk de brug tussen ruwe modelintelligentie en betrouwbare, productieklare workflows.
Dit is je volgende stap: denk na over je huidige agentworkflows. Identificeer terugkerende redeneerpatronen, isoleer ze en refactor ze tot modulaire skills.
Op zoek naar iets meer gestructureerd om dieper te leren? Onze cursus Introduction to AI Agents en de AI Agent Fundamentals-track zijn een geweldige plek om te beginnen.
Veelgestelde vragen over agentskills
Hoe verbeteren agentskills de efficiëntie van AI-agents?
Agentskills verbeteren de efficiëntie door contextoverbelasting te verminderen en de redeneerruimte van het model te beperken tot wat relevant is voor de huidige taak. In plaats van een opgeblazen, all-purpose prompt mee te dragen, laadt de agent dynamisch de specifieke skill die nodig is.
Wat zijn enkele toepassingen van agentskills in de praktijk?
Agentskills kunnen gestructureerde workflows aandrijven zoals financiële rapportage, customer churn-analyse, juridische contractbeoordeling, SEO-contentaudits, incidenttriage in IT-operations en AI-ondersteunde codereviews.
Hoe verschillen agentskills van AI-tools?
Traditionele AI-tools bieden doorgaans atomaire capabilities, zoals het bevragen van een database of het aanroepen van een API. Agentskills opereren op een hoger niveau: zij definiëren het proces voor het gebruik van die tools.
Kunnen agentskills worden aangepast voor specifieke sectoren of taken?
Ja. Agentskills zijn van nature domeinspecifiek en kunnen worden afgestemd op branchevereisten, terminologie, nalevingsstandaarden en workflownormen.
Welke beveiligingsmaatregelen moet je nemen bij het gebruik van agentskills?
Beveiliging moet focussen op permissiegrenzen en gecontroleerde toegang tot tools. Skills moeten worden beperkt tot alleen de databronnen en API’s die ze echt nodig hebben, bij voorkeur met role-based access controls en waar mogelijk read-only-modi.

Ik ben Austin, een blogger en techschrijver met jarenlange ervaring als zowel datascientist als data-analist in de gezondheidszorg. Ik begon mijn techreis met een achtergrond in biologie en help nu anderen dezelfde overstap te maken via mijn techblog. Mijn passie voor technologie heeft geleid tot schrijfbijdragen aan tientallen SaaS-bedrijven, waarmee ik anderen inspireer en mijn ervaringen deel.
