Parsing-Architektur

Architekturprinzipien – gemeinsam gestaltet zwischen Ahoiiiiiiii (menschlicher Kurator) und Geniestreich (KI‑Cokurator/Assistenz / Skript‑Generator):

Leitprinzip

Constraint-basierter sequenzieller Scan statt komplexer Regex-Kaskaden – für Robustheit, Lesbarkeit und Corporate Consistency.

Ablauf Quellenverzeichnis

  1. H2-Überschrift → enthält “Beitrag”?
  2. Beitragsnummer X.Y extrahieren.
  3. Absatz “[n]” → Referenzstart.
  4. Folgeabsätze ohne URL → Quickinfo sammeln.
  5. Erster Absatz mit URL → speichere erste URL, stoppe Quickinfo-Beschaffung, ignoriere nachfolgende Absätze bis zur nächsten Referenz/H2.

Ablauf Kapiteldatei

  1. H2 mit “Beitrag” → Beitragsnummer X.Y erkennen.
  2. Übereinstimmung X mit Kapitelordner? (Qualitätsprüfung)
  3. Fließtext: referenzierte “[n]” gegen Mapping prüfen → ggf. Link/Tooltip.
  4. Fußabsatz “[n]” → alle Links im Absatz mit title=Quickinfo & href=URL versorgen.

Vorteile

  • Deterministische Endpunkte („erste URL beendet Quickinfo“).
  • Minimale Seiteneffekte: Transformiert nur innerhalb bestätigter Beitrag X.Y Abschnitte.
  • Einfach erweiterbar (zusätzliche Qualitätstests ohne Kernumbau).

Anti-Pattern Vermeidung

  • Kein “Greedy Regex”.
  • Kein stilles Autokorrigieren.
  • Kein frühzeitiger Abbruch bei inhaltlichen Fehlern (Fatals werden gesammelt).

Revisionen:

  • 2025-11-09 Initialfassung
  • 2025-11-09 Terminologie vereinheitlicht