marek/MtoRagSystem

Files

team2 12f2a48f88 optimite tag logic boost

2026-02-26 19:45:58 +01:00

3.7 KiB

Raw Blame History

Tabelle 1: Alle Parameter, die Retrieval beeinflussen (mit Kurz-Erklärung)

Ebene	Ort	Parameter	Standard / aktuell	Zweck / Einfluss
Config	ModelGenerationConfig	retrievalMaxChunks	(dein Wert)	Wie viele Chunks maximal ans LLM gehen (Output-Limit).
Config	ModelGenerationConfig	retrievalVectorTopK	(dein Wert)	Wie viele Vector-Hits initial geholt werden (Recall-Breite).
Retriever	NdjsonHybridRetriever	HARD_MAX_CHUNKS	200	Harte Obergrenze für retrievalMaxChunks (Safety-Limit).
Retriever	NdjsonHybridRetriever	HARD_MAX_VECTORK	200	Harte Obergrenze für retrievalVectorTopK/topK (Safety-Limit).
Retriever	NdjsonHybridRetriever	VECTOR_SCORE_THRESHOLD	0.40	Qualitäts-Gate: Vector-Treffer darunter werden verworfen (stärkster Präzisionshebel).
Retriever	NdjsonHybridRetriever	List-Mode TopK	max(vectorTopKBase*3, 80)	Bei Listenfragen wird TopK stark erhöht für bessere Dokumentabdeckung.
Retriever	NdjsonHybridRetriever	isListQuery()	Heuristik	Aktiviert Dokument-Ranking statt reinem Chunk-Ranking.
Retriever	NdjsonHybridRetriever	Dedup-Normalisierung	whitespace-normalized	Entfernt Duplikate im finalen Chunk-Set.
Tags	TagRoutingService	DEFAULT_TOPK	8	Anzahl der geprüften Tag-Vector-Hits.
Tags	TagRoutingService	MIN_BEST_SCORE	0.10 (empf. 0.25)	Ab welchem Tag-Score ein Bonus aktiviert wird.
Tags	TagRoutingService	MAX_CANDIDATE_DOCS	200	Maximale Anzahl Dokumente, die als Tag-Kandidaten gelten dürfen.
Tags	NdjsonHybridRetriever	TAG_SCORE_BONUS	z. B. 0.08	Bonus auf Vector-Score bei Tag-Match (nur Ranking, kein Gate).
Query	QueryCleaner	clean($prompt)	implizit	Beeinflusst Embedding stark (Token-Normalisierung/Entfernung).
Vector	VectorSearchClient	search($query, topK)	implizit	Liefert Roh-Scores und Trefferverteilung (Basis des Rankings).
Tag Vector	TagVectorSearchClient	search($query, DEFAULT_TOPK)	implizit	Bestimmt, ob und welche Tags matchen (Bonus-Aktivierung).

Tabelle 2: Auswirkungen bei Änderung der Parameter

Parameter	Wenn erhöht	Wenn gesenkt	Typischer Effekt / Risiko
retrievalMaxChunks	Mehr Kontext, höhere Antworttiefe	Kompaktere Antworten, evtl. Wissensverlust	Zu hoch → Token/Noise-Risiko
HARD_MAX_CHUNKS	Erlaubt größere Kontexte	Strenger Kontext-Limit	Sicherheitsparameter
retrievalVectorTopK	Mehr Recall, breitere Kandidatenbasis	Weniger Recall, präziser aber evtl. Lücken	Zu hoch → mehr Noise
HARD_MAX_VECTORK	Größere Suchräume möglich	Strenger begrenzt	Sicherheitsparameter
VECTOR_SCORE_THRESHOLD	Höhere Präzision, weniger schwache Treffer	Mehr Treffer, aber mehr Rauschen	Zu niedrig → Bonus wirkt stärker
List-Mode TopK	Bessere Listenabdeckung	Listen evtl. unvollständig	Zu hoch → Noise
isListQuery	Häufigerer Dokumentmodus	Seltener Dokumentmodus	Fehlklassifikation möglich
QueryCleaner Aggressivität	Stabilere Suche, weniger Noise	Mehr Originalbegriffe	Zu aggressiv → Informationsverlust
DEFAULT_TOPK (Tags)	Mehr Tag-Kandidaten	Weniger Tag-Kandidaten	Zu hoch → Bonus häufiger aktiv
MIN_BEST_SCORE	Bonus seltener (nur starke Tag-Matches)	Bonus häufiger (auch schwache Matches)	Haupthebel gegen „Tags zu mächtig“
MAX_CANDIDATE_DOCS	Mehr Dokumente erhalten Bonus	Weniger Dokumente erhalten Bonus	Zu hoch → Bonus verwässert
TAG_SCORE_BONUS	Tags pushen Ranking stärker	Tags pushen kaum	Zu hoch → Dominanz-Risiko
Dedup-Normalisierung	Weniger Dopplungen	Mehr Redundanz	Beeinflusst Vielfalt, nicht Relevanz