TDD-cyclus voor Claude Code skills
Definitie
De toepassing van test-driven development op het schrijven van Claude Code skills: eerst een pressure scenario met een subagent laten falen zonder skill, dan een minimale skill schrijven die faalmodi adresseert, dan loopholes dichten. Gebaseerd op de superpowers:writing-skills methodiek.
Context
Skills in Claude Code zijn reference-documenten die Claude instrueren hoe een taak aan te pakken. Zonder test-dwang produceert dat papieren regels die in praktijk niet gevolgd worden. De TDD-mapping voor skills vervangt traditionele unit tests door subagent-runs: een test case is een prompt die een subagent faalstate reproduceert.
Kernpunten
TDD-mapping voor skills
| TDD-begrip | Skill-equivalent |
|---|---|
| Test case | Pressure scenario uitgevoerd met subagent |
| Production code | SKILL.md document |
| Test fails (RED) | Subagent overtreedt regel zonder skill geladen |
| Test passes (GREEN) | Subagent volgt de regel met skill geladen |
| Refactor | Nieuwe rationalisaties identificeren en expliciet dichten |
RED-fase
- Schrijf minimaal 3 scenarios die het faaldomein dekken (normale taak, tijdsdruk, meerdere gecombineerde pressures)
- Dispatch een subagent met schone context zonder de skill
- Noteer letterlijke rationalisaties die ze gebruiken om niet-te-voldoen
- Dit is de enige manier om te weten welke loopholes de skill moet sluiten
GREEN-fase
- Schrijf de SKILL.md die specifiek de rationalisaties uit RED adresseert
- Niet meer dan dat. Geen hypothetische edge cases.
- Gebruik frontmatter met
name,description(begin met “Use when…”), onder 1024 chars - Nooit de workflow in de description samenvatten. Dat zorgt dat Claude de description volgt en de body skipt.
REFACTOR-fase
- Test opnieuw met nieuwe scenarios die meer druk combineren
- Vind nieuwe rationalisaties, voeg expliciete counters toe
- Bouw een rationalisatietabel in de skill met “Excuse | Reality” kolommen
- Voeg “Red Flags” lijst toe: gedachten die betekenen dat je de regel gaat overtreden
Iron Law
Geen skill zonder falende test eerst. Geldt ook voor edits: niet aanpassen zonder eerst een nieuwe testcase te hebben die de huidige versie laat falen.
Pragmatische shortcut
Voor een MVP-release mag je de formele RED-fase vervangen door een agent-test op de eerste productie-dogfood: dispatch een subagent die alleen de output van de skill krijgt en vraag waar hij vastloopt. Dat levert concrete gaps op zonder de 3x subagent-run cost van een strikte RED. De trade-off: je vangt minder rationalisaties omdat je de baseline-pressure niet meet. Verantwoord documenteren in tests/baseline-results.md waarom je deze shortcut nam.
Skill-typen bepalen test-vorm
- Discipline-enforcing (TDD, verificatie): pressure scenarios met tijd + sunk cost + autoriteit
- Technique (how-to): applicatie scenarios, kan de subagent de techniek reproduceren
- Pattern (mentaal model): herkenning scenarios, ziet de subagent wanneer te toepassen
- Reference (API docs): retrieval scenarios, kan de subagent de juiste info vinden en gebruiken
Verbanden
- Zie ook: wiki-slash-commands-vs-skills
- Zie ook: wiki-agent-entrypoint-conventies
- Gerelateerd project: project-handoff-skill
Bronnen
- Anthropic. (2026). superpowers:writing-skills (ingebouwde Claude Code skill). Zie
~/.claude/plugins/cache/claude-plugins-official/superpowers/ - Cialdini, R. (2021). Influence: The Psychology of Persuasion. (Geciteerd in skill-documentatie over rationalisatie-patronen.)