Parsing-Architektur
Parsing-Architektur
Architekturprinzipien – gemeinsam gestaltet zwischen Ahoiiiiiiii (menschlicher Kurator) und Geniestreich (KI‑Cokurator/Assistenz / Skript‑Generator):
Leitprinzip
Constraint-basierter sequenzieller Scan statt komplexer Regex-Kaskaden – für Robustheit, Lesbarkeit und Corporate Consistency.
Ablauf Quellenverzeichnis
- H2-Überschrift → enthält “Beitrag”?
- Beitragsnummer X.Y extrahieren.
- Absatz “[n]” → Referenzstart.
- Folgeabsätze ohne URL → Quickinfo sammeln.
- Erster Absatz mit URL → speichere erste URL, stoppe Quickinfo-Beschaffung, ignoriere nachfolgende Absätze bis zur nächsten Referenz/H2.
Ablauf Kapiteldatei
- H2 mit “Beitrag” → Beitragsnummer X.Y erkennen.
- Übereinstimmung X mit Kapitelordner? (Qualitätsprüfung)
- Fließtext: referenzierte “[n]” gegen Mapping prüfen → ggf. Link/Tooltip.
- Fußabsatz “[n]” → alle Links im Absatz mit title=Quickinfo & href=URL versorgen.
Vorteile
- Deterministische Endpunkte („erste URL beendet Quickinfo“).
- Minimale Seiteneffekte: Transformiert nur innerhalb bestätigter Beitrag X.Y Abschnitte.
- Einfach erweiterbar (zusätzliche Qualitätstests ohne Kernumbau).
Anti-Pattern Vermeidung
- Kein “Greedy Regex”.
- Kein stilles Autokorrigieren.
- Kein frühzeitiger Abbruch bei inhaltlichen Fehlern (Fatals werden gesammelt).
Revisionen:
- 2025-11-09 Initialfassung
- 2025-11-09 Terminologie vereinheitlicht