This commit is contained in:
team 1
2026-05-04 15:37:33 +02:00
parent c4bf41cd47
commit 16e3d0a0ae
8 changed files with 173 additions and 131 deletions

View File

@@ -211,13 +211,6 @@ parameters:
# Legacy/domain override list. Generic German stopwords are provided by
# language cleanup profile `rag_evidence`. Keep RAG/product-role terms here.
stop_terms:
- suche
- suchen
- finde
- finden
- zeige
- einen
- einem
- ohne
- messen
- messung
@@ -471,31 +464,8 @@ parameters:
- grenzwerte
- grenzwerten
- welche
- welcher
- welches
- welchem
- welchen
- gut
- geeignet
- was
- wie
- wo
- kann
- koennen
- können
- konnte
- könnte
- ich
- mir
- wir
- man
- nutzen
- benutzen
- verwenden
- verwende
- nehmen
- zur
- zum
- messen
- gemessen
meta_only_terms:
@@ -507,21 +477,6 @@ parameters:
- kostet
- shopsuche
- shop-suche
- suche
- suchen
- such
- finde
- find
- zeige
- zeig
- im
- in
- nach
- danach
- damit
- dafür
- dafuer
- hierzu
language_preservation:
enabled: true
language_markers:

View File

@@ -25,7 +25,6 @@ parameters:
# language cleanup profile `commerce_query`. Keep only commerce-specific or
# historically sensitive phrases here.
phrases_to_remove:
- suche
- welches gerät
- welche gerät
- welches modell
@@ -43,58 +42,22 @@ parameters:
- geeigent
- verfügbarkeit
- verfuegbarkeit
- empfiehl
- antwort
- kurze
- ich
# Legacy/domain override list. Generic German stopwords and conversation
# filler terms are provided by language cleanup profile `commerce_query`.
filter_search_tokens:
- zusätzlich
- stattdessen
- preiswerte
- lösung
- größer
- würde
- welchem
- mein
- zeige
- zeig
- such
- suche
- finde
- find
- mir
- von
- im
- in
- welche
- welcher
- welches
- welchen
- zur
- geeignet
- geeigent
- verfügbarkeit
- verfuegbarkeit
- prüfe
- pruefe
- sowie
- seine
- seinen
- seiner
- seinem
- seines
- siene
- sienen
- siener
- sienem
- sienes
- gebe
- gib
- nenne
- nenn
- preis
- preise
- preisen

View File

@@ -82,6 +82,7 @@ parameters:
- commerce_query
- rag_evidence
- shop_context_fallback
- retrieval_reference_cleanup
required_profile_terms:
commerce_query:
stopwords:

View File

@@ -81,17 +81,37 @@ parameters:
- eine
- einer
- eines
- einen
- einem
- und
- oder
- aber
- sowie
- mit
- für
- fuer
- von
- vom
- im
- in
- nach
- zur
- zum
- ist
- sind
- wird
- werden
- wurde
- kann
- können
- koennen
- kannst
- könnte
- koennte
- würde
- wuerde
- würden
- wuerden
conversation:
- bitte
- mal
@@ -105,6 +125,76 @@ parameters:
- also
- danke
pronouns:
- ich
- mir
- mein
- meine
- meinen
- meiner
- meinem
- meines
- seine
- seinen
- seiner
- seinem
- seines
- siene
- sienen
- siener
- sienem
- sienes
user_instruction_terms:
- suche
- such
- suchen
- finde
- find
- finden
- zeige
- zeig
- gebe
- gib
- nenne
- nenn
- empfiehl
- prüfe
- pruefe
response_style:
- antwort
- kurze
- kurz
- zusätzlich
- zusaetzlich
- stattdessen
question_terms:
- welcher
- welches
- welchem
- welchen
- was
- wie
- wo
usage_terms:
- nutzen
- benutzen
- verwenden
- verwende
- nehmen
reference_fillers:
- danach
- damit
- dafür
- dafuer
- hierzu
phrase_groups:
user_instruction:
- ich suche
@@ -127,11 +217,29 @@ parameters:
- uebersicht
- auflistung
retrieval_reference:
- vorherige
- vorheriger
- nutzerfrage
- aktuelle
- folgefrage
- frage
- antwort
- technische
- referenzanker
- referenzaufloesung
- referenzauflösung
- faktenquelle
cleanup_profiles:
commerce_query:
stopword_groups:
- de_core
- conversation
- pronouns
- user_instruction_terms
- response_style
phrase_groups:
- user_instruction
protected_term_groups:
@@ -141,6 +249,18 @@ parameters:
stopword_groups:
- de_core
- conversation
- user_instruction_terms
protected_term_groups:
- protected_terms
retrieval_reference_cleanup:
stopword_groups:
- de_core
- conversation
- question_terms
meta_term_groups:
- retrieval_reference
protected_term_groups:
- protected_terms
@@ -148,6 +268,12 @@ parameters:
stopword_groups:
- de_core
- conversation
- pronouns
- user_instruction_terms
- question_terms
- usage_terms
- reference_fillers
- response_style
phrase_groups:
- user_instruction
meta_term_groups:

View File

@@ -90,56 +90,10 @@ parameters:
- code
- wert
- werte
generic_exact_selection_cleanup_profile: retrieval_reference_cleanup
generic_exact_selection_tokens:
- vorherige
- vorheriger
- nutzerfrage
- aktuelle
- folgefrage
- frage
- antwort
- technische
- referenzanker
- referenzaufloesung
- referenzauflösung
- faktenquelle
- keine
- welche
- welcher
- welches
- welchem
- welchen
- wird
- werden
- wurde
- kann
- koennen
- können
- mit
- der
- die
- das
- den
- dem
- ein
- eine
- einer
- eines
- ist
- sind
- was
- wie
- wo
- zum
- zur
- fuer
- für
- durch
- von
- vom
- und
- oder
- auch
generic_product_tokens:
- produkt
- produkte