Files
MtoRagSystem/config/retriex/language.yaml
team 1 c00cb3a9b9 p28
2026-05-04 08:38:53 +02:00

157 lines
2.7 KiB
YAML

# Language-level retrieval configuration.
# Defaults are intentionally identical to the previous PHP list.
parameters:
retriex.stopwords.config:
words:
- mit
- der
- die
- das
- ein
- eine
- einer
- eines
- den
- dem
- des
- und
- oder
- aber
- sowie
- ich
- du
- er
- sie
- es
- wir
- ihr
- halt
- eben
- auch
- schon
- noch
- mal
- bitte
- danke
- also
- nun
- tja
- dann
- danach
- davor
- hier
- dort
- heute
- gestern
- morgen
- könnte
- kannst
- kann
- würde
- würdest
- würden
# Central language cleanup structure for RetrieX 1.5.3+.
# Legacy key `words` above remains the runtime-compatible default list.
# Cleanup profiles are the preferred home for generic language noise.
# Domain configs should only keep domain-specific overrides.
protected_terms:
- nicht
- kein
- keine
- welche
- testomat
- indikator
- indikatortyp
- ph
- rx
- th
- tc
- '0,02'
stopword_groups:
de_core:
- der
- die
- das
- den
- dem
- des
- ein
- eine
- einer
- eines
- und
- oder
- mit
- für
- fuer
- ist
- sind
- kann
- können
- koennen
conversation:
- bitte
- mal
- gerne
- gern
- auch
- noch
- nochmal
- dazu
- davon
- also
- danke
phrase_groups:
user_instruction:
- ich suche
- suche nach
- zeige mir
- zeig mir
- gib mir
- gebe mir
- nenne mir
- habt ihr
- gibt es
- suche im shop
meta_term_groups:
presentation:
- tabelle
- tabellarisch
- liste
- übersicht
- uebersicht
- auflistung
cleanup_profiles:
commerce_query:
stopword_groups:
- de_core
- conversation
phrase_groups:
- user_instruction
protected_term_groups:
- protected_terms
rag_evidence:
stopword_groups:
- de_core
- conversation
protected_term_groups:
- protected_terms
shop_context_fallback:
stopword_groups:
- de_core
- conversation
phrase_groups:
- user_instruction
meta_term_groups:
- presentation
protected_term_groups:
- protected_terms