Parsing-Architektur

Parsing-Architektur

Architekturprinzipien – gemeinsam gestaltet zwischen Ahoiiiiiiii (menschlicher Kurator) und Geniestreich (KI‑Cokurator/Assistenz / Skript‑Generator):

Leitprinzip

Constraint-basierter sequenzieller Scan statt komplexer Regex-Kaskaden – für Robustheit, Lesbarkeit und Corporate Consistency.

Ablauf Quellenverzeichnis

H2-Überschrift → enthält “Beitrag”?
Beitragsnummer X.Y extrahieren.
Absatz “[n]” → Referenzstart.
Folgeabsätze ohne URL → Quickinfo sammeln.
Erster Absatz mit URL → speichere erste URL, stoppe Quickinfo-Beschaffung, ignoriere nachfolgende Absätze bis zur nächsten Referenz/H2.

Ablauf Kapiteldatei

H2 mit “Beitrag” → Beitragsnummer X.Y erkennen.
Übereinstimmung X mit Kapitelordner? (Qualitätsprüfung)
Fließtext: referenzierte “[n]” gegen Mapping prüfen → ggf. Link/Tooltip.
Fußabsatz “[n]” → alle Links im Absatz mit title=Quickinfo & href=URL versorgen.

Vorteile

Deterministische Endpunkte („erste URL beendet Quickinfo“).
Minimale Seiteneffekte: Transformiert nur innerhalb bestätigter Beitrag X.Y Abschnitte.
Einfach erweiterbar (zusätzliche Qualitätstests ohne Kernumbau).

Anti-Pattern Vermeidung

Kein “Greedy Regex”.
Kein stilles Autokorrigieren.
Kein frühzeitiger Abbruch bei inhaltlichen Fehlern (Fatals werden gesammelt).

Revisionen:

2025-11-09 Initialfassung
2025-11-09 Terminologie vereinheitlicht