Duplicate task detection via graphify
Definitie
Taken met identieke scope maar verschillende nummering (bijv. door hernummering bij een projectsprint) verschijnen in graphify als semantically_similar_to-edges met hoge confidence score. Scores >= 0.85 zijn kandidaten voor archivering.
Context
Bij het uitbreiden van een backlog ontstaan ongemerkt verdubbelingen: taken die al bestonden worden opnieuw aangemaakt onder een ander nummer, of dezelfde taak wordt vanuit twee invalshoeken geformuleerd. Trefwoordzoekopdrachten missen dit als de titel net anders is. Graphify pikt het op via semantische vergelijking.
Ontdekt bij een graphify-run op de centrale backlog (2026-05-08).
Kernpunten
Detectiepatroon
Na een /graphify [pad-naar-backlog] run: zoek in het rapport of de graaf op semantically_similar_to-edges met score >= 0.85.
# Snel opzoeken via Python
import json
from pathlib import Path
data = json.loads(Path('graphify-out/graph.json').read_text())
dupes = [(e['source'], e['target'], e.get('confidence_score',0))
for e in data['links']
if e.get('relation') == 'semantically_similar_to' and e.get('confidence_score',0) >= 0.85]
dupes.sort(key=lambda x: -x[2])Score-interpretatie
| Score | Betekenis |
|---|---|
| 0.95 | Bijna zeker dezelfde taak, andere naam/nummer |
| 0.85 | Sterk overlappende scope, beoordeel handmatig |
| 0.75 | Verwant, maar mogelijk aparte taken |
Gevonden duplicaten (backlog 2026-05-08)
| Paar | Score | Actie |
|---|---|---|
| TASK-024 / TASK-110: Scroll snap magnetisch | 0.95 | TASK-024 archiveren |
| TASK-102 / TASK-116: Hugo pipeline jimvandenbreemen.nl | 0.95 | TASK-102 archiveren |
| TASK-106 / TASK-120: Atelier D-12 Push + PR | 0.85 | TASK-106 archiveren |
| TASK-098 / TASK-112: vault.publication_status MCP tool | 0.85 | TASK-098 archiveren |
De 1xx-nummers zijn de actuele versies (Atelier D-serie hernummering).
Valkuil: score 0.85 is niet altijd een duplicaat
vault.publish MCP tool en Publish UI scoren 0.85 maar zijn twee kanten van dezelfde feature, geen duplicaten. Controleer altijd de taakomschrijvingen voor archivering.
Cross-community bruggen als merge-signaal
Taken die meerdere communities verbinden zijn vaak de schakel bij toekomstige project-merges. TASK-122 (OSINT sprint 1) verbond Vault UI, Atelier Pipelines en Eindredacteur Skills, wat de geplande merge van OSINT naar Atelier bevestigde.
Verbanden
- Zie ook: wiki-graphify-integratie-kennisbank — graphify workflow
- Zie ook: wiki-backlog-md-workflow — backlog-beheer