{% extends 'admin/base.html.twig' %} {% block title %}Neues Indexierungsprofil{% endblock %} {% block body %}

Neues Indexierungsprofil

Zurück
Wichtiger Hinweis:
Änderungen am Indexierungsprofil beeinflussen die Struktur des Vektor-Indexes (Chunking, Embedding, Scoring). Nach Aktivierung ist ein vollständiger Global Reindex erforderlich.
Chunking-Konfiguration

Definiert, wie Dokumente in semantische Textabschnitte (Chunks) zerlegt werden. Diese Struktur beeinflusst Retrieval-Qualität, Kontextstabilität und Indexgröße.

Maximale Wortanzahl pro Chunk.

Kleinere Werte: Mehr Chunks, höhere Granularität, präziseres Retrieval.
Größere Werte: Weniger Chunks, mehr Kontext pro Treffer.

Empfehlung für Produkt- und Wissensdaten: 600–1000.
Anzahl überlappender Wörter zwischen zwei Chunks.

Verhindert Kontextabbrüche an Chunk-Grenzen.
Typischer Bereich: 10–20 % der Chunk Size.
Embedding-Konfiguration

Definiert das Modell zur Vektorisierung der Textabschnitte. Embeddings bestimmen die semantische Ähnlichkeitsberechnung im FAISS-Index.

Das Embedding-Modell erzeugt numerische Vektoren aus Text. Modellwechsel erfordert zwingend einen Global Reindex.
Muss exakt zur Dimension des gewählten Embedding-Modells passen. Falsche Werte führen zu inkonsistentem Vektorindex.
Scoring & Retrieval

Definiert die Bewertungslogik für Retrieval-Ergebnisse. Änderungen wirken sich direkt auf die Gewichtung von Keyword- und Vektor-Treffern aus.

Versionskennzeichnung der Scoring-Logik.

Eine Erhöhung erzwingt:
  • Neuaufbau des NDJSON-Index
  • Vollständigen FAISS-Rebuild
Gewährleistet reproduzierbare Retrieval-Ergebnisse.

Governance-Hinweis: Ein Indexierungsprofil ist versioniert und deterministisch. Änderungen sollten nur geplant erfolgen, da sie die komplette Wissensstruktur neu generieren.
{% endblock %}