Duplicate task detection via graphify

Definitie

Taken met identieke scope maar verschillende nummering (bijv. door hernummering bij een projectsprint) verschijnen in graphify als semantically_similar_to-edges met hoge confidence score. Scores >= 0.85 zijn kandidaten voor archivering.

Context

Bij het uitbreiden van een backlog ontstaan ongemerkt verdubbelingen: taken die al bestonden worden opnieuw aangemaakt onder een ander nummer, of dezelfde taak wordt vanuit twee invalshoeken geformuleerd. Trefwoordzoekopdrachten missen dit als de titel net anders is. Graphify pikt het op via semantische vergelijking.

Ontdekt bij een graphify-run op de centrale backlog (2026-05-08).

Kernpunten

Detectiepatroon

Na een /graphify [pad-naar-backlog] run: zoek in het rapport of de graaf op semantically_similar_to-edges met score >= 0.85.

# Snel opzoeken via Python
import json
from pathlib import Path
data = json.loads(Path('graphify-out/graph.json').read_text())
dupes = [(e['source'], e['target'], e.get('confidence_score',0))
         for e in data['links']
         if e.get('relation') == 'semantically_similar_to' and e.get('confidence_score',0) >= 0.85]
dupes.sort(key=lambda x: -x[2])

Score-interpretatie

ScoreBetekenis
0.95Bijna zeker dezelfde taak, andere naam/nummer
0.85Sterk overlappende scope, beoordeel handmatig
0.75Verwant, maar mogelijk aparte taken

Gevonden duplicaten (backlog 2026-05-08)

PaarScoreActie
TASK-024 / TASK-110: Scroll snap magnetisch0.95TASK-024 archiveren
TASK-102 / TASK-116: Hugo pipeline jimvandenbreemen.nl0.95TASK-102 archiveren
TASK-106 / TASK-120: Atelier D-12 Push + PR0.85TASK-106 archiveren
TASK-098 / TASK-112: vault.publication_status MCP tool0.85TASK-098 archiveren

De 1xx-nummers zijn de actuele versies (Atelier D-serie hernummering).

Valkuil: score 0.85 is niet altijd een duplicaat

vault.publish MCP tool en Publish UI scoren 0.85 maar zijn twee kanten van dezelfde feature, geen duplicaten. Controleer altijd de taakomschrijvingen voor archivering.

Cross-community bruggen als merge-signaal

Taken die meerdere communities verbinden zijn vaak de schakel bij toekomstige project-merges. TASK-122 (OSINT sprint 1) verbond Vault UI, Atelier Pipelines en Eindredacteur Skills, wat de geplande merge van OSINT naar Atelier bevestigde.

Verbanden

Sessie-herkomst