This commit is contained in:
team 1
2026-05-01 17:40:48 +02:00
parent 17cb098235
commit ad7cac72be
19 changed files with 1084 additions and 157 deletions

View File

@@ -0,0 +1,65 @@
# Governance and regression guardrail configuration.
# These values are intentionally YAML-owned so developer-policy checks do not
# reintroduce domain-specific guardrail terms as PHP-only defaults.
parameters:
retriex.governance.config:
regression_baseline:
protected_short_model_tokens:
- th
- tc
- tp
- tm
- ph
- rx
protected_measurement_values:
- '0,02'
protected_technical_prompt_keywords:
- testomat
- indikator
- grenzwert
- messbereich
- gemessen
technical_priority_required_markers:
- runner-up
- second-lowest
- comparison
protected_accessory_prompt_keywords:
- indikator
- reagenz
protected_search_repair_specificity_terms:
- indikator
- testomat
- reagenz
protected_retrieval_reagent_words:
- indikator
protected_retrieval_device_word_groups:
geraet:
- geraet
- gerät
shop_prompt_regression_original_query: 'testomat 808 0,02'
shop_prompt_required_output_instruction_markers:
- 'Output only the final search query.'
- 'Output format:'
shop_query_meta_guard_terms:
- shop
- suche
shop_query_context_fallback_filter_terms:
- welchem
- kann
- messen
vocabulary:
protected_short_model_tokens:
- th
- tc
- tp
- tm
- ph
- rx
language:
protected_stopword_terms:
- nicht
- kein
- welche
- testomat
- indikator
- '0,02'

View File

@@ -40,6 +40,17 @@ parameters:
- zubehör
- zubehoer
- ersatzteil
non_product_commerce_signals:
- shop
- alle
- kunde
- online
- kaufen
- kostet
- suche
- such
- finde
- finden
advisory_signals:
- passt
- eignet
@@ -132,6 +143,32 @@ parameters:
- '/\bzubehör\b/u'
- '/\bzubehoer\b/u'
- '/\bersatzteil(?:e)?\b/u'
technical_factual_knowledge:
signal_label: technical_factual_knowledge_query
question_marker_patterns:
- '/\bwas\s+ist\b/u'
- '/\bwelche?r?s?\b/u'
- '/\bwie\s+(hoch|niedrig|klein|gross|groß)\b/u'
- '/\bniedrigste[rsn]?\b/u'
- '/\bkleinste[rsn]?\b/u'
- '/\bhöchste[rsn]?\b/u'
- '/\bhoechste[rsn]?\b/u'
fact_patterns:
- '/\bgrenzwert(?:e|en|es)?\b/u'
- '/\bmessbereich(?:e|en|s)?\b/u'
- '/\bwasserhärte\b/u'
- '/\bwasserhaerte\b/u'
- '/\bresthärte\b/u'
- '/\bresthaerte\b/u'
- '/\bgesamthärte\b/u'
- '/\bgesamthaerte\b/u'
- '/\bauflösung\b/u'
- '/\baufloesung\b/u'
- '/\bindikator(?:en|s)?\b/u'
- '/\btestomat(?:en|s)?\b/u'
- '/\büberwach(?:t|en|ung)\b/u'
- '/\bueberwach(?:t|en|ung)\b/u'
- '/\bmess(?:en|ung|bar|wert)\b/u'
patterns:
sku_like: '/\b\d{4,10}\b/u'
price_value_template: '/\b\d+(?:[.,]\d+)?\s*(?:{price_pattern})\b/u'

View File

@@ -209,6 +209,11 @@ parameters:
- ph-indikatoren
- ph indikatoren
direct_main_device_request_patterns:
- '/\b(welcher|welches|welche)\s+[^?.!,;]{0,40}(testomat|messgerät|messgeraet|analysegerät|analysegeraet|gerät|geraet|analysator)\b/u'
- '/\b(suche|finde|empfiehl|empfehle)\s+[^?.!,;]{0,40}(testomat|messgerät|messgeraet|analysegerät|analysegeraet|gerät|geraet|analysator)\b/u'
- '/\b(testomat|messgerät|messgeraet|analysegerät|analysegeraet|gerät|geraet|analysator)\s+[^?.!,;]{0,40}(messen|misst|überwachen|ueberwachen|kann|für|fuer)\b/u'
measurement_evidence_guard:
intro_rules:
- '- This block is generated from the current user question and is stricter than broad product-selection wording.'

View File

@@ -26,6 +26,120 @@ parameters:
focused_product_min_score: 10.0
focused_product_min_gap: 4.0
focused_product_max_chunks: 4
catalog_list_shortcut_patterns:
- '/\balle\b/u'
- '/\bliste\b/u'
- '/\bauflistung\b/u'
- '/\buebersicht\b/u'
- '/\bübersicht\b/u'
- '/\bsortiment\b/u'
- '/\bwelche\b.*\b(gibt|verfügbar|verfuegbar|existieren)\b/u'
- '/\bzeige\b.*\b(produkte|geraete|geräte|modelle|artikel)\b/u'
- '/\bwas\b.*\b(gibt es|verfügbar|verfuegbar)\b/u'
exact_selection_token_variant_prefixes:
indikator:
- indikator
- indikatortyp
grenzwert:
- grenzwert
messbereich:
- messbereich
testomat:
- testomat
exact_selection_indicator_question_tokens:
- indikator
- indikatortyp
- reagenz
- reagens
exact_selection_indicator_question_phrases:
- mit welchem
- womit
exact_selection_indicator_table_heading_patterns:
- '/verf(?:ü|ue)gbare\s+indikatortypen|indikatortypen|indikatorvarianten/iu'
exact_selection_indicator_table_header_patterns:
- '/\|\s*(?:typ|indikator)\s*\|\s*(?:grenzwert|messbereich|bereich)/iu'
exact_selection_indicator_table_row_patterns:
- '/\|\s*[A-Z]{0,4}\s*\d{2,4}\s*[A-Z]?\s*\|\s*\d/iu'
exact_selection_indicator_table_required_primary_terms:
- indikator
exact_selection_indicator_table_required_context_terms:
- grenzwert
- messbereich
- bereich
exact_detail_tokens:
- indikator
- indikatoren
- indikatortyp
- indikatortypen
- reagenz
- reagens
- grenzwert
- messbereich
- bereich
- wasserhaerte
- wasserhärte
- resthaerte
- resthärte
- haerte
- härte
- aufloesung
- auflösung
- schnittstelle
- relais
- fehlercode
- code
- wert
- werte
generic_exact_selection_tokens:
- vorherige
- vorheriger
- nutzerfrage
- aktuelle
- folgefrage
- frage
- antwort
- technische
- referenzanker
- referenzaufloesung
- referenzauflösung
- faktenquelle
- keine
- welche
- welcher
- welches
- welchem
- welchen
- wird
- werden
- wurde
- kann
- koennen
- können
- mit
- der
- die
- das
- den
- dem
- ein
- eine
- einer
- eines
- ist
- sind
- was
- wie
- wo
- zum
- zur
- fuer
- für
- durch
- von
- vom
- und
- oder
- auch
generic_product_tokens:
- produkt
- produkte