This commit is contained in:
team 1
2026-04-24 18:54:25 +02:00
parent 372a6797fa
commit c439fb99d6
12 changed files with 1126 additions and 336 deletions

View File

@@ -10,3 +10,236 @@ parameters:
retriex.commerce.search_repair.enabled: true
retriex.commerce.search_repair.max_queries: 3
retriex.commerce.search_repair.min_primary_results_without_repair: 2
# Shop matching and presentation configuration.
# Defaults are intentionally identical to the previous PHP values.
retriex.shop_matching.config:
top_product_log_limit: 3
device_query_keywords:
- analysegerät
- analysegeraet
- analysegeräte
- analysegeraete
- messgerät
- messgeraet
- messgeräte
- messgeraete
- analysator
- analysatoren
- analyzer
- gerät
- geraet
- geräte
- geraete
- monitor
- monitore
- controller
- gerät für
- geraet fuer
- geräte für
- geraete fuer
- system
- systeme
- anlage
- anlagen
accessory_query_keywords:
- zubehör
- zubehor
- reagenz
- reagenzien
- reagent
- indikator
- indikatoren
- indicator
- kit
- set
- ersatz
- ersatzteil
- ersatzteile
- verbrauchsmaterial
- consumable
- dazu
- passend
- passende
- passendes
- nachfüll
- nachfuell
- refill
- filter
- pumpenkopf
- motorblock
- service set
- serviceset
- service-set
accessory_product_keywords:
- reagenz
- reagenzien
- reagent
- indikator
- indikatoren
- indicator
- kit
- set
- verbrauchsmaterial
- consumable
- zubehör
- zubehor
- ersatz
- ersatzteil
- ersatzteile
- nachfüll
- nachfuell
- refill
- lösung
- loesung
- solution
- teststreifen
- test strip
- filter
- pumpenkopf
- motorblock
- service set
- serviceset
- service-set
device_product_keywords:
- analysegerät
- analysegeraet
- analysegeräte
- analysegeraete
- messgerät
- messgeraet
- messgeräte
- messgeraete
- analysator
- analysatoren
- analyzer
- monitor
- monitore
- controller
- online-analysator
- online analysator
- online-analysegerät
- online analysegeraet
- online-analysegeräte
- online analysegeraete
- online analyzer
- online monitor
- system
- systeme
- anlage
- anlagen
- gerät
- geraet
- geräte
- geraete
device_focus_keywords:
- geräte
- geraete
- gerät
- geraet
- analysegerät
- analysegeraet
- messgerät
- messgeraet
- analysator
- controller
- monitor
accessory_focus_keywords:
- indikator
- indikatoren
- reagenz
- reagenzien
- zubehör
- zubehor
- ersatzteil
- ersatzteile
- verbrauchsmaterial
- service set
- serviceset
- filter
- pumpenkopf
- motorblock
accessory_focus_variant_map:
indikator: [indikator, indikatoren]
indikatoren: [indikator, indikatoren]
reagenz: [reagenz, reagenzien]
reagenzien: [reagenz, reagenzien]
ersatzteil: [ersatzteil, ersatzteile]
ersatzteile: [ersatzteil, ersatzteile]
service set: [service set, serviceset, service-set]
serviceset: [service set, serviceset, service-set]
service-set: [service set, serviceset, service-set]
scores:
exact_product_number_phrase: 160
exact_product_name_phrase: 90
exact_manufacturer_match: 40
brand_contained_in_name: 20
name_token_overlap_weight: 6
product_number_token_overlap_weight: 10
corpus_token_overlap_weight: 2
name_number_overlap_weight: 18
product_number_number_overlap_weight: 28
corpus_number_overlap_weight: 8
size_match: 12
availability_bonus: 1
device_query_device_product_bonus: 60
device_query_accessory_penalty: 120
accessory_query_accessory_product_bonus: 30
accessory_query_device_product_bonus: 10
patterns:
contains_digit: '/\d/u'
matching_cleanup: '/[^\p{L}\p{N}]+/u'
whitespace_collapse: '/\s+/u'
token_split: '/[^\p{L}\p{N}]+/u'
padding:
prefix: ' '
suffix: ' '
price:
normalization_search: ['€', ' ', '.']
normalization_replace: ['', '', '']
decimals: 2
decimal_separator: ','
thousands_separator: '.'
suffix: ' €'
custom_fields:
primary: migration_Backup_product_attr1
secondary: migration_Backup_product_attr2
use_cases: migration_Backup_product_attr4
languages: migration_Backup_product_attr5
text:
primary_secondary_separator: ': '
use_cases_label: 'Einsatzgebiete: '
languages_label: 'Sprachen: '
custom_field_join_separator: ' | '
description:
empty_line_pattern: '/^[ \t]*\R/m'
whitespace_cleanup_pattern: '/[ \t]{2,}/'
max_length: 1500
seo:
relative_prefix: '/'
highlight:
available_label: Verfügbar
unavailable_label: Nicht verfügbar
product_number_prefix: 'Produktnummer: '
image:
missing_placeholder: no-image
deduplication:
separator: '|'

View File

@@ -0,0 +1,52 @@
# Language-level retrieval configuration.
# Defaults are intentionally identical to the previous PHP list.
parameters:
retriex.stopwords.config:
words:
- mit
- der
- die
- das
- ein
- eine
- einer
- eines
- den
- dem
- des
- und
- oder
- aber
- sowie
- ich
- du
- er
- sie
- es
- wir
- ihr
- halt
- eben
- auch
- schon
- noch
- mal
- bitte
- danke
- also
- nun
- tja
- dann
- danach
- davor
- hier
- dort
- heute
- gestern
- morgen
- könnte
- kannst
- kann
- würde
- würdest
- würden

View File

@@ -0,0 +1,16 @@
# Query enrichment vocabulary.
# Defaults are intentionally identical to the previous PHP mapping.
parameters:
retriex.query_enrichment.config:
max_expansions: 4
rules:
Wasserhärte: Resthärte
Gerät: Modell
Indikator: Chemie
Seminar: Webinar
Schulung: Seminar
Indikatoren: Indikator
Wasserhärte-Grenzwert: Resthärte
Resthärte-Grenzwert: Wasserhärte
Grenzwert: Überwachungsbereich
store: shop

View File

@@ -1,7 +1,7 @@
# Current 1.4.2 retrieval constants documented as configuration inventory.
# In this round these values are exposed by config dump/validation; the retriever logic remains unchanged.
# Active retrieval configuration.
# Defaults are intentionally identical to the frozen 1.4.2 constants.
parameters:
retriex.retrieval.inventory:
retriex.retrieval.config:
hard_max_chunks: 6
hard_max_vectork: 18
hard_max_keywordk: 36
@@ -26,3 +26,142 @@ parameters:
focused_product_min_score: 10.0
focused_product_min_gap: 4.0
focused_product_max_chunks: 4
generic_product_tokens:
- produkt
- produkte
- produktkarte
- titel
- geraet
- gerät
- messgeraet
- messgerät
- wasser
- haerte
- härte
- resthaerte
- resthärte
- analyse
- analysator
- automat
- online
- messung
- messen
- preis
- preise
- kosten
- info
- infos
- passend
- richtige
- richtiges
- geeignet
- geeignete
- welche
- welcher
- welches
- brauche
- suche
important_short_model_tokens: [th, tc, tp, tm, ph, rx]
family_descriptor_tokens:
- evo
- eco
- self
- clean
- mini
- pro
- plus
- basic
- lab
- inline
- compact
- panel
- sc
looks_like_reagent_tokens:
- indikator
- reagenz
- reagens
- laborchemikalie
- chemikalie
- sicherheitsdatenblatt
- sdb
- msds
- ufi
- gebinde
- flasche
- ersatzteil
- zubehoer
- zubehör
- service set
- filtereinsatz
- kerzenfilter
- druckregler
looks_like_safety_docs:
- sicherheitsdatenblatt
- sdb
- msds
- gefahrenbewertung
- gefahrenpiktogramm
- signalwort
- lagerung
- transport
- clp
- kennzeichnung
- h290
- pbt
- vpvb
looks_like_reagent_words:
- indikator
- reagenz
- reagens
- chemie
- chemikalie
- sdb
- sicherheitsdatenblatt
- msds
- flasche
- gebinde
looks_like_document_words:
- datenblatt
- dokument
- pdf
- handbuch
- manual
- beschreibung
- sdb
- sicherheitsdatenblatt
- msds
looks_like_safety_words:
- gefahr
- gefahrgut
- clp
- h290
- sicherheit
- kennzeichnung
- transport
- lagerung
- piktogramm
looks_like_device_words:
- geraet
- gerät
- messgeraet
- messgerät
- analysator
- automat
- messung
- messen
- ueberwachung
- überwachung
- online
- monitor
# Backwards-compatible name for existing config diagnostics.
retriex.retrieval.inventory: '%retriex.retrieval.config%'