Files
MtoRagSystem/MATRIX_PARAMS.md
2026-02-26 19:45:58 +01:00

3.7 KiB

Tabelle 1: Alle Parameter, die Retrieval beeinflussen (mit Kurz-Erklärung)

Ebene Ort Parameter Standard / aktuell Zweck / Einfluss
Config ModelGenerationConfig retrievalMaxChunks (dein Wert) Wie viele Chunks maximal ans LLM gehen (Output-Limit).
Config ModelGenerationConfig retrievalVectorTopK (dein Wert) Wie viele Vector-Hits initial geholt werden (Recall-Breite).
Retriever NdjsonHybridRetriever HARD_MAX_CHUNKS 200 Harte Obergrenze für retrievalMaxChunks (Safety-Limit).
Retriever NdjsonHybridRetriever HARD_MAX_VECTORK 200 Harte Obergrenze für retrievalVectorTopK/topK (Safety-Limit).
Retriever NdjsonHybridRetriever VECTOR_SCORE_THRESHOLD 0.40 Qualitäts-Gate: Vector-Treffer darunter werden verworfen (stärkster Präzisionshebel).
Retriever NdjsonHybridRetriever List-Mode TopK max(vectorTopKBase*3, 80) Bei Listenfragen wird TopK stark erhöht für bessere Dokumentabdeckung.
Retriever NdjsonHybridRetriever isListQuery() Heuristik Aktiviert Dokument-Ranking statt reinem Chunk-Ranking.
Retriever NdjsonHybridRetriever Dedup-Normalisierung whitespace-normalized Entfernt Duplikate im finalen Chunk-Set.
Tags TagRoutingService DEFAULT_TOPK 8 Anzahl der geprüften Tag-Vector-Hits.
Tags TagRoutingService MIN_BEST_SCORE 0.10 (empf. 0.25) Ab welchem Tag-Score ein Bonus aktiviert wird.
Tags TagRoutingService MAX_CANDIDATE_DOCS 200 Maximale Anzahl Dokumente, die als Tag-Kandidaten gelten dürfen.
Tags NdjsonHybridRetriever TAG_SCORE_BONUS z. B. 0.08 Bonus auf Vector-Score bei Tag-Match (nur Ranking, kein Gate).
Query QueryCleaner clean($prompt) implizit Beeinflusst Embedding stark (Token-Normalisierung/Entfernung).
Vector VectorSearchClient search($query, topK) implizit Liefert Roh-Scores und Trefferverteilung (Basis des Rankings).
Tag Vector TagVectorSearchClient search($query, DEFAULT_TOPK) implizit Bestimmt, ob und welche Tags matchen (Bonus-Aktivierung).

Tabelle 2: Auswirkungen bei Änderung der Parameter

Parameter Wenn erhöht Wenn gesenkt Typischer Effekt / Risiko
retrievalMaxChunks Mehr Kontext, höhere Antworttiefe Kompaktere Antworten, evtl. Wissensverlust Zu hoch → Token/Noise-Risiko
HARD_MAX_CHUNKS Erlaubt größere Kontexte Strenger Kontext-Limit Sicherheitsparameter
retrievalVectorTopK Mehr Recall, breitere Kandidatenbasis Weniger Recall, präziser aber evtl. Lücken Zu hoch → mehr Noise
HARD_MAX_VECTORK Größere Suchräume möglich Strenger begrenzt Sicherheitsparameter
VECTOR_SCORE_THRESHOLD Höhere Präzision, weniger schwache Treffer Mehr Treffer, aber mehr Rauschen Zu niedrig → Bonus wirkt stärker
List-Mode TopK Bessere Listenabdeckung Listen evtl. unvollständig Zu hoch → Noise
isListQuery Häufigerer Dokumentmodus Seltener Dokumentmodus Fehlklassifikation möglich
QueryCleaner Aggressivität Stabilere Suche, weniger Noise Mehr Originalbegriffe Zu aggressiv → Informationsverlust
DEFAULT_TOPK (Tags) Mehr Tag-Kandidaten Weniger Tag-Kandidaten Zu hoch → Bonus häufiger aktiv
MIN_BEST_SCORE Bonus seltener (nur starke Tag-Matches) Bonus häufiger (auch schwache Matches) Haupthebel gegen „Tags zu mächtig“
MAX_CANDIDATE_DOCS Mehr Dokumente erhalten Bonus Weniger Dokumente erhalten Bonus Zu hoch → Bonus verwässert
TAG_SCORE_BONUS Tags pushen Ranking stärker Tags pushen kaum Zu hoch → Dominanz-Risiko
Dedup-Normalisierung Weniger Dopplungen Mehr Redundanz Beeinflusst Vielfalt, nicht Relevanz