TDD-cyclus voor Claude Code skills

Definitie

De toepassing van test-driven development op het schrijven van Claude Code skills: eerst een pressure scenario met een subagent laten falen zonder skill, dan een minimale skill schrijven die faalmodi adresseert, dan loopholes dichten. Gebaseerd op de superpowers:writing-skills methodiek.

Context

Skills in Claude Code zijn reference-documenten die Claude instrueren hoe een taak aan te pakken. Zonder test-dwang produceert dat papieren regels die in praktijk niet gevolgd worden. De TDD-mapping voor skills vervangt traditionele unit tests door subagent-runs: een test case is een prompt die een subagent faalstate reproduceert.

Kernpunten

TDD-mapping voor skills

TDD-begripSkill-equivalent
Test casePressure scenario uitgevoerd met subagent
Production codeSKILL.md document
Test fails (RED)Subagent overtreedt regel zonder skill geladen
Test passes (GREEN)Subagent volgt de regel met skill geladen
RefactorNieuwe rationalisaties identificeren en expliciet dichten

RED-fase

  • Schrijf minimaal 3 scenarios die het faaldomein dekken (normale taak, tijdsdruk, meerdere gecombineerde pressures)
  • Dispatch een subagent met schone context zonder de skill
  • Noteer letterlijke rationalisaties die ze gebruiken om niet-te-voldoen
  • Dit is de enige manier om te weten welke loopholes de skill moet sluiten

GREEN-fase

  • Schrijf de SKILL.md die specifiek de rationalisaties uit RED adresseert
  • Niet meer dan dat. Geen hypothetische edge cases.
  • Gebruik frontmatter met name, description (begin met “Use when…”), onder 1024 chars
  • Nooit de workflow in de description samenvatten. Dat zorgt dat Claude de description volgt en de body skipt.

REFACTOR-fase

  • Test opnieuw met nieuwe scenarios die meer druk combineren
  • Vind nieuwe rationalisaties, voeg expliciete counters toe
  • Bouw een rationalisatietabel in de skill met “Excuse | Reality” kolommen
  • Voeg “Red Flags” lijst toe: gedachten die betekenen dat je de regel gaat overtreden

Iron Law

Geen skill zonder falende test eerst. Geldt ook voor edits: niet aanpassen zonder eerst een nieuwe testcase te hebben die de huidige versie laat falen.

Pragmatische shortcut

Voor een MVP-release mag je de formele RED-fase vervangen door een agent-test op de eerste productie-dogfood: dispatch een subagent die alleen de output van de skill krijgt en vraag waar hij vastloopt. Dat levert concrete gaps op zonder de 3x subagent-run cost van een strikte RED. De trade-off: je vangt minder rationalisaties omdat je de baseline-pressure niet meet. Verantwoord documenteren in tests/baseline-results.md waarom je deze shortcut nam.

Skill-typen bepalen test-vorm

  • Discipline-enforcing (TDD, verificatie): pressure scenarios met tijd + sunk cost + autoriteit
  • Technique (how-to): applicatie scenarios, kan de subagent de techniek reproduceren
  • Pattern (mentaal model): herkenning scenarios, ziet de subagent wanneer te toepassen
  • Reference (API docs): retrieval scenarios, kan de subagent de juiste info vinden en gebruiken

Verbanden

Bronnen

  • Anthropic. (2026). superpowers:writing-skills (ingebouwde Claude Code skill). Zie ~/.claude/plugins/cache/claude-plugins-official/superpowers/
  • Cialdini, R. (2021). Influence: The Psychology of Persuasion. (Geciteerd in skill-documentatie over rationalisatie-patronen.)

Sessie-herkomst