From da374edcf4c4663d024703f7f3a168cffff6d634 Mon Sep 17 00:00:00 2001 From: team 1 Date: Tue, 5 May 2026 09:33:35 +0200 Subject: [PATCH] new config --- CONFIG_PARAMS.md | 208 +++++++++++++++++++++++++++++++---- config/retriex/commerce.yaml | 8 +- 2 files changed, 194 insertions(+), 22 deletions(-) diff --git a/CONFIG_PARAMS.md b/CONFIG_PARAMS.md index 0ceb51e..cd823d1 100644 --- a/CONFIG_PARAMS.md +++ b/CONFIG_PARAMS.md @@ -315,26 +315,194 @@ | `views.prompt.*` | Vocabulary-Projektionen für PromptBuilder-Keywords. | | `maps.shop.accessory_focus_variants` | Variantenmapping für Zubehörfokus, z. B. unterschiedliche Schreibweisen. | -## **Pflegekompass** +## **1\. Wichtigste Stellschrauben für Antwortqualität** -Wenn du künftig etwas ändern willst, wäre die Zuordnung so: +| Datei | Parameter / Bereich | Wirkung | +| ----- | ----- | ----- | +| `config/retriex/prompt.yaml` | `retriex.prompt.config.budget.*` | Steuert Prompt-Budget, Historie, Output-Reserve und Sicherheitsreserve. Wichtig, wenn Antworten Quellen verlieren oder zu wenig Kontext bekommen. | +| `prompt.yaml` | `retriex.prompt.config.shop_results.max_results_in_prompt` | Anzahl der Shop-Treffer, die überhaupt ins LLM-Prompt gelangen. Sehr wichtiger Hebel für Shop-Antworten. | +| `prompt.yaml` | `retriex.prompt.config.shop_results.detailed_max_count` | Wie viele Shop-Treffer detailliert in den Prompt geschrieben werden. | +| `prompt.yaml` | `retriex.prompt.config.shop_results.header_lines` | Regeln, wie das LLM Shopdaten behandeln darf. Wichtig gegen Vermischung von Gerät/Zubehör/Preis/URL. | +| `prompt.yaml` | `retriex.prompt.config.technical_product_keyword_match_threshold` | Schwelle, ab wann eine Anfrage als technische Produktfrage behandelt wird. | +| `prompt.yaml` | `retriex.prompt.config.technical_product_keywords` | Begriffe für technische Antwortlogik. | +| `prompt.yaml` | `retriex.prompt.config.accessory_request_keywords` | Begriffe für Zubehör-/Indikator-/Reagenzfragen. | +| `prompt.yaml` | `retriex.prompt.config.role_guard.*` | Gerät-vs-Zubehör-Abgrenzung im Prompt. Sehr wichtig gegen falsche Produkttypen. | +| `prompt.yaml` | `retriex.prompt.config.measurement_evidence_guard.*` | Messparameter-Beweislogik, z. B. pH, Redox, freies Chlor. Wichtig gegen erfundene Eignungen. | +| `prompt.yaml` | `retriex.prompt.config.measurement_evidence_guard.parameters[]` | Konkrete Messparameter mit `request_terms`, `positive_terms`, `negative_context_terms`, `non_equivalent_terms`. Sehr direkter Qualitätshebel. | +| `prompt.yaml` | `retriex.prompt.config.output_priority.*` | Priorität der Antwort: fachliche Fakten, Shopdaten, technische Regeln. | +| `prompt.yaml` | `retriex.prompt.config.numeric_value_focus.*` | Verhalten bei niedrigstem/höchstem Grenzwert, exakten Zahlenwerten, Messbereichen. | +| `prompt.yaml` | `retriex.prompt.config.fallback_escalation.*` | Was bei unsicherer Evidenz, fehlenden Daten oder nur semantischen Treffern gesagt werden darf. | +| `prompt.yaml` | `retriex.prompt.config.response_format.*` | Struktur der Antwort, Shop-/Nicht-Shop-Regeln, Zubehörregeln. | +| `prompt.yaml` | `retriex.prompt.config.fact_grounding.*` | Regeln gegen Halluzination, falsche Kombination von Quellen und falsche Shop-/RAG-Vermischung. | +| `prompt.yaml` | `retriex.prompt.config.language.rules` | Sprachverhalten der Antwort. | +| `prompt.yaml` | `retriex.prompt.config.parameter_parsing.*` | Zerlegung von Messparametern wie pH/Redox/Chlor. | +| `config/retriex/model.yaml` | `retriex.model.default_temperature` | Kreativität. Für technische Antworten eher niedrig halten. | +| `model.yaml` | `retriex.model.default_top_k` | Sampling-Breite des LLM. | +| `model.yaml` | `retriex.model.default_top_p` | Nucleus-Sampling. | +| `model.yaml` | `retriex.model.default_repeat_penalty` | Wiederholungsverhalten. | +| `model.yaml` | `retriex.model.default_num_ctx` | Kontextfenster. Wichtig bei langen RAG-/Shop-Prompts. | +| `model.yaml` | `retriex.model.default_retrieval_max_chunks` | Default-Anzahl genutzter Chunks. | +| `model.yaml` | `retriex.model.default_retrieval_vector_top_k` | Default-Vektor-Kandidatenzahl. | -| Ziel | Zuständige YAML | -| ----- | ----- | -| Shop-Suche erkennt Frage nicht | `agent.yaml`, `commerce.yaml`, ggf. `intent.yaml` | -| „suche im Shop“ verliert Kontext | `agent.yaml → shop_prompt.*`, `follow_up_context.*`, `language.yaml → shop_context_fallback` | -| pH/Redox/ORP wird entfernt | `language.yaml → protected_terms`, `agent.yaml → current_input_preservation`, `governance.yaml` | -| Gerät wird als Zubehör gewertet | `vocabulary.yaml`, `commerce.yaml → shop_matching.role_guard/scores`, `prompt.yaml → role_guard` | -| Zubehör wird falsch priorisiert | `vocabulary.yaml`, `commerce.yaml → shop_matching`, `search_repair.yaml` | -| RAG findet falsches Dokument | `retrieval.yaml`, `query_enrichment.yaml`, `vocabulary.yaml` | -| Folgefrage wird nicht verstanden | `agent.yaml → follow_up_context.*` | -| Antwort halluziniert technische Eignung | `prompt.yaml → measurement_evidence_guard`, `fact_grounding`, `fallback_escalation` | -| UI-/Status-/Buttontexte ändern | `agent.yaml → production_ui`, `messages`, `source_labels`, `html` | -| Prompt-Regeln ändern | `prompt.yaml` | -| Stopwords/Cleanup ändern | `language.yaml` | -| Regression-/Audit-Schutz ändern | `governance.yaml` | -| Vector-Service / FAISS / Tagrouting ändern | `vector.yaml` | -| Modellparameter ändern | `model.yaml` | -| Indexing-Größe ändern | `index.yaml` | -| Pfade/Runtime-Dateien ändern | `runtime.yaml` | +## **2\. Wichtigste Stellschrauben für RAG-Suchergebnisse** +| Datei | Parameter / Bereich | Wirkung | +| ----- | ----- | ----- | +| `config/retriex/retrieval.yaml` | `retriex.retrieval.config.hard_max_chunks` | Maximale Chunks in der finalen Auswahl. Einer der wichtigsten Antwort-/Kontexthebel. | +| `retrieval.yaml` | `hard_max_vectork` | Maximale Vektor-Kandidaten. | +| `retrieval.yaml` | `hard_max_keywordk` | Maximale Keyword-Kandidaten. | +| `retrieval.yaml` | `vector_score_threshold` | Mindestscore für Vektortreffer. | +| `retrieval.yaml` | `threshold_floor` / `threshold_ceil` | Dynamischer Score-Korridor. | +| `retrieval.yaml` | `list_bonus` | Bonus für Listen-/Tabellenähnliche Treffer. Wichtig für Produktlisten/Grenzwerte. | +| `retrieval.yaml` | `rrf_k` | Stärke des Reciprocal-Rank-Fusion-Verhaltens. | +| `retrieval.yaml` | `keyword_topk_multiplier` | Erweitert Keyword-Kandidatenset. | +| `retrieval.yaml` | `keyword_score_threshold` | Mindestscore für Keyword-Treffer. | +| `retrieval.yaml` | `keyword_rrf_weight` | Gewichtung Keyword-Treffer gegen Vektortreffer. | +| `retrieval.yaml` | `scoped_vector_rrf_weight` | Gewichtung scoped Vector Retrieval. | +| `retrieval.yaml` | `scoped_keyword_rrf_weight` | Gewichtung scoped Keyword Retrieval. | +| `retrieval.yaml` | `empty_rrf_fallback_topn` | Fallback, wenn RRF leer bleibt. | +| `retrieval.yaml` | `max_chunks_per_doc` | Verhindert, dass ein Dokument zu stark dominiert. | +| `retrieval.yaml` | `min_chunk_distance` | Abstand zwischen Chunks desselben Dokuments. | +| `retrieval.yaml` | `dominant_doc_window`, `dominant_doc_min_hits`, `dominant_doc_max_chunks` | Dominantes Dokument erkennen und begrenzen/gewichten. | +| `retrieval.yaml` | `exact_document_max_chunks` | Maximalzahl bei exakter Dokumentfokussierung. | +| `retrieval.yaml` | `focused_product_window`, `focused_product_min_score`, `focused_product_min_gap`, `focused_product_max_chunks` | Produktfokus-Logik. Kritisch für Testomat-/Indikator-Fälle. | +| `retrieval.yaml` | `catalog_list_shortcut_patterns` | Erkennung von Listen-/Katalogfragen. | +| `retrieval.yaml` | `exact_selection_*` | Exakte Auswahlfragen, z. B. Indikator/Grenzwert/Messbereich/Testomat. | +| `retrieval.yaml` | `exact_detail_tokens` | Detailfrage-Erkennung. | +| `retrieval.yaml` | `generic_exact_selection_cleanup_profile` | Cleanup-Profil für exakte Auswahl. | +| `retrieval.yaml` | `generic_product_tokens` | Generische Produktbegriffe, die beim Retrieval anders behandelt werden. | +| `retrieval.yaml` | `important_short_model_tokens` | Geschützte Kurzmodell-/Parameter-Tokens wie `pH`, `TH`, `RX`. Sehr wichtig. | +| `retrieval.yaml` | `family_descriptor_tokens` | Produktfamilien-Zusätze wie EVO/ECO/PLUS usw. | +| `retrieval.yaml` | `looks_like_reagent_*`, `looks_like_safety_*`, `looks_like_document_*`, `looks_like_device_*` | Dokument-/Produktrollen-Erkennung im Retrieval. | +| `config/retriex/vector.yaml` | `retriex.vector.search.min_score` | Mindestscore der Vektorsuche. | +| `vector.yaml` | `retriex.vector.search.max_limit` | Maximal abrufbare Vektortreffer. | +| `vector.yaml` | `retriex.vector.tags.min_score` | Mindestscore Tag-Suche. | +| `vector.yaml` | `retriex.vector.tags.default_limit` / `max_limit` | Anzahl Tag-Treffer. | +| `vector.yaml` | `retriex.vector.tag_routing.default_topk` | Top-K für Tag-Routing. | +| `vector.yaml` | `retriex.vector.tag_routing.min_best_score` | Mindestscore für beste Tag-Zuordnung. | +| `vector.yaml` | `retriex.vector.tag_routing.max_score_drop_from_best` | Wie stark schlechtere Tags noch mitgenommen werden. | +| `vector.yaml` | `retriex.vector.tag_routing.max_routing_tags` | Maximal verwendete Routing-Tags. | +| `vector.yaml` | `retriex.vector.tag_routing.max_candidate_docs` | Maximal aus Tags abgeleitete Kandidatendokumente. | +| `vector.yaml` | `multi_tag_bonus_per_extra_tag`, `max_multi_tag_bonus` | Bonus für mehrere passende Tags. | +| `config/retriex/index.yaml` | `retriex.index.chunk_size` | Chunk-Größe beim Ingest. Nur nach Reindex wirksam. | +| `index.yaml` | `retriex.index.chunk_overlap` | Chunk-Überlappung. Nur nach Reindex wirksam. | +| `index.yaml` | `retriex.index.embedding_model` | Embedding-Modell. Sehr großer Hebel, aber nur mit Reindex. | +| `index.yaml` | `retriex.index.embedding_dimension` | Passend zum Embedding-Modell. | +| `config/retriex/query_enrichment.yaml` | `retriex.query_enrichment.config.max_expansions` | Maximale Query-Erweiterungen. | +| `query_enrichment.yaml` | `retriex.query_enrichment.config.rules.*` | Synonym-/Erweiterungsregeln, z. B. Wasserhärte → Resthärte. | + +## **3\. Shop-Suche und Shop-Ranking** + +| Datei | Parameter / Bereich | Wirkung | +| ----- | ----- | ----- | +| `config/retriex/commerce.yaml` | `retriex.commerce.max_shop_results` | Maximale Shop-Treffer aus Shopware. | +| `commerce.yaml` | `retriex.commerce.search_repair.enabled` | Erweiterte Shop-Suche aktivieren/deaktivieren. | +| `commerce.yaml` | `retriex.commerce.search_repair.max_queries` | Anzahl Repair-Suchqueries. | +| `commerce.yaml` | `retriex.commerce.search_repair.min_primary_results_without_repair` | Ab wann keine Repair-Suche nötig ist. | +| `commerce.yaml` | `retriex.commerce_query.config.cleanup_profile` | Language-Cleanup-Profil für Shopqueries. | +| `commerce.yaml` | `retriex.commerce_query.config.known_brands` | Markenerkennung. | +| `commerce.yaml` | `phrases_to_remove` | Entfernt unnötige Phrasen aus Shopqueries. | +| `commerce.yaml` | `filter_search_tokens` | Entfernt irrelevante Tokens aus Shopqueries. | +| `commerce.yaml` | `search_control_tokens` | Tokens, die Shop-/Suchabsicht anzeigen. | +| `commerce.yaml` | `search_token_corrections` | Tippfehlerkorrekturen für Shopquery. | +| `commerce.yaml` | `search_token_canonical_map` | Vereinheitlichung von Tokens, z. B. indicators → indikator. | +| `commerce.yaml` | `semantic_shop_search_tokens` | Produkt-/Zubehörbegriffe für semantische Shop-Suche. | +| `commerce.yaml` | `limits.max_shop_search_tokens` | Maximale Tokenzahl der Shopquery. | +| `commerce.yaml` | `limits.direct_product_max_tokens` | Begrenzung direkter Produktsuchen. | +| `commerce.yaml` | `patterns.*` | Regex-Erkennung für Preis, Modell, Zubehör, Historienbezug, Messwerte. | +| `commerce.yaml` | `retriex.commerce_reference_resolver.config.conversation_product_patterns` | Produktanker aus dem Chatverlauf. | +| `commerce.yaml` | `retriex.commerce_reference_resolver.config.focus_term_patterns` | Fokusbegriffe wie Indikator, Reagenz, Zubehör, Filter. | +| `commerce.yaml` | `retriex.shop_matching.config.vocabulary_views.*` | Verknüpfung zu Vocabulary-Listen für Geräte-/Zubehörrollen. | +| `commerce.yaml` | `retriex.shop_matching.config.role_guard.*` | Zubehör bei Gerätefragen filtern oder ambigue Treffer behalten. | +| `commerce.yaml` | `retriex.shop_matching.config.scores.*` | Direktes Shop-Ranking: Produktnummer, Name, Hersteller, Token-Overlap, Größenmatch, Verfügbarkeit, Geräte-/Zubehörbonus/-Penalty. | +| `commerce.yaml` | `retriex.shop_matching.config.description.max_length` | Länge der Shopbeschreibung im Such-/Promptkontext. | +| `commerce.yaml` | `retriex.shop_matching.config.deduplication.separator` | Dedupe-Key-Aufbau. | +| `config/retriex/search_repair.yaml` | `strict_requested_accessory_code_repair` | Strenge Repair-Logik für angefragte Zubehörcodes. | +| `search_repair.yaml` | `prefer_prompt_anchored_model_for_requested_accessory_code` | Modellanker aus Prompt bevorzugen. | +| `search_repair.yaml` | `direct_product_attribute_lookup.*` | Direkte Attributsuchen wie „Anschlusskabel pH/Redox länger 20m“. | +| `search_repair.yaml` | `requested_accessory_code_*` | Fallback-Queries und Kontextfenster für Indikator-/Reagenz-Codes. | +| `search_repair.yaml` | `specific_model_candidate_patterns` | Modellkandidaten-Erkennung. | +| `search_repair.yaml` | `model_candidate_exclude_terms` | Ausschlussbegriffe für falsche Modellanker. | +| `search_repair.yaml` | `scores.*` | Gewichtung der Repair-Rankinglogik. | +| `search_repair.yaml` | `patterns.*` | Regex-Erkennung für Modelle, Zubehörcodes, Zubehör-/Bundle-Begriffe. | +| `config/retriex/agent.yaml` | `retriex.agent.config.product_search_knowledge_chunk_limit` | Anzahl Knowledge-Chunks bei Produktsuche. | +| `agent.yaml` | `advisory_product_search_knowledge_chunk_limit` | Knowledge-Chunks bei beratender Produktsuche. | +| `agent.yaml` | `commerce_history_budget_chars` | Wie viel Verlauf für Commerce-Kontext genutzt wird. | +| `agent.yaml` | `shop_prompt.*` | LLM-Regeln zur Erzeugung der Shop-Suchquery. Sehr wichtiger Hebel. | +| `agent.yaml` | `shop_prompt.current_input_preservation.*` | Bewahrt aktuelle Eingabetokens wie pH/Redox/ORP. | +| `agent.yaml` | `shop_prompt.product_attribute_query_cleanup.*` | Cleanup für direkte Attribut-/Zubehörsuchen. | +| `agent.yaml` | `shop_prompt.context_anchor_enrichment.*` | Ergänzt Shopquery aus Verlaufskontext. | +| `agent.yaml` | `shop_prompt.meta_query_guard.*` | Löst „suche im shop“ über Verlauf auf. | +| `agent.yaml` | `shop_prompt.rag_anchor_enrichment.*` | Reichert Shopquery mit RAG-Produktankern an, z. B. bei exakten Messwerten. | +| `agent.yaml` | `shop_prompt.language_preservation.*` | Verhindert unerwünschte Übersetzung in Shopqueries. | + +## **4\. Intent- und Routing-Optimierung** + +| Datei | Parameter / Bereich | Wirkung | +| ----- | ----- | ----- | +| `config/retriex/intent.yaml` | `retriex.intent.commerce.config.strong_signals` | Starke Shop-/Commerce-Signale. | +| `intent.yaml` | `non_product_commerce_signals` | Commerce-Signale ohne Produktsuche. | +| `intent.yaml` | `advisory_signals` | Beratungssignale. | +| `intent.yaml` | `advisory_product_selection_patterns` | Muster für Produktauswahlfragen. | +| `intent.yaml` | `price_terms`, `color_terms`, `size_*` | Preis-/Farb-/Größenfilter-Erkennung. | +| `intent.yaml` | `support_diagnostic_patterns` | Support-/Diagnosefragen abgrenzen. | +| `intent.yaml` | `explicit_commerce_intent_patterns` | Explizite Shopabsicht. | +| `intent.yaml` | `technical_factual_knowledge.*` | Erkennung technischer Wissensfragen, damit nicht alles in Shoplogik läuft. | +| `intent.yaml` | `scores.*` | Gewichtung von Commerce-/Advisory-/SKU-/Preis-/Modell-Signalen. | +| `intent.yaml` | `retriex.intent.catalog.config.*` | Tag-/Katalogintent-Schwellen: `min_score`, `ambiguity_delta`, Limits. | +| `intent.yaml` | `retriex.intent.light.config.*` | Leichte Listen-/Mengenfrage-Erkennung. | +| `intent.yaml` | `retriex.intent.sales.config.*` | Sales-/ROI-/Vergleichs-/Einwand-Intent. | +| `agent.yaml` | `input_normalization.*` | Vor-Normalisierung der Nutzereingabe. | +| `agent.yaml` | `input_normalization.fuzzy_routing.*` | Tippfehlerrobustes Routing für Shop-/Produkt-/Messbegriffe. | +| `agent.yaml` | `follow_up_context.strong_reference_patterns` | Folgefrage-Erkennung. | +| `agent.yaml` | `follow_up_context.explicit_commercial_signal_terms` | Folgefrage wird zu Shop-/Preis-/Commerce-Kontext. | +| `agent.yaml` | `follow_up_context.commercial_table_follow_up.*` | Tabellen-/Preisfolgefragen. | +| `agent.yaml` | `follow_up_context.reference_anchor.*` | Verlaufanker wie Testomat-Modell oder Härtewert. | + +## **5\. Sprachbereinigung und Vocabulary** + +| Datei | Parameter / Bereich | Wirkung | +| ----- | ----- | ----- | +| `config/retriex/language.yaml` | `retriex.stopwords.config.words` | Allgemeine Stopwords. | +| `language.yaml` | `protected_terms` | Begriffe, die niemals generisch entfernt werden dürfen. Sehr wichtig für `pH`, `RX`, `TH`, `0,02`, Testomat usw. | +| `language.yaml` | `normalization.*` | Umlaut-/ASCII-/Separator-/Dash-Normalisierung. | +| `language.yaml` | `stopword_groups.*` | Sprach-, Dialog-, Pronomen-, Frage- und Bedienwörter. | +| `language.yaml` | `phrase_groups.user_instruction` | Entfernt Phrasen wie „ich suche“, „zeige mir“. | +| `language.yaml` | `meta_term_groups.*` | Präsentations-/Meta-Begriffe wie Tabelle, Liste, Übersicht. | +| `language.yaml` | `cleanup_profiles.commerce_query` | Cleanup für Shopqueries. | +| `language.yaml` | `cleanup_profiles.rag_evidence` | Cleanup für RAG-Evidenzprüfung. | +| `language.yaml` | `cleanup_profiles.retrieval_reference_cleanup` | Cleanup für Retrieval-Referenzen. | +| `language.yaml` | `cleanup_profiles.shop_context_fallback` | Cleanup für Verlauf-Fallback bei Shop-Folgefragen. | +| `config/retriex/vocabulary.yaml` | `classes.device` | Zentrale Gerätebegriffe. | +| `vocabulary.yaml` | `classes.accessory` | Zentrale Zubehörbegriffe. | +| `vocabulary.yaml` | `views.shop.device_query` | Begriffe für Geräte-Shopqueries. | +| `vocabulary.yaml` | `views.shop.accessory_query` | Begriffe für Zubehör-Shopqueries. | +| `vocabulary.yaml` | `views.shop.accessory_product` | Erkennung von Zubehörprodukten. | +| `vocabulary.yaml` | `views.shop.device_product` | Erkennung von Geräteprodukten. | +| `vocabulary.yaml` | `views.shop.device_focus` | Fokus auf Geräte. | +| `vocabulary.yaml` | `views.shop.accessory_focus` | Fokus auf Zubehör. | +| `vocabulary.yaml` | `views.retrieval.*` | Retrieval-Vokabular: generische Produkttokens, Kurzmodell-Tokens, Reagenz-/Safety-/Device-Erkennung. | +| `vocabulary.yaml` | `views.search_repair.*` | Vocabulary für Search-Repair und direkte Produktsuchen. | +| `vocabulary.yaml` | `views.prompt.technical_product_keywords` | Prompt-Vocabulary für technische Fragen. | +| `vocabulary.yaml` | `views.prompt.accessory_request_keywords` | Prompt-Vocabulary für Zubehörfragen. | +| `vocabulary.yaml` | `maps.shop.accessory_focus_variants` | Varianten/Normalisierung von Zubehörfokusbegriffen. | + +## **6\. Sekundär relevant, aber nicht primär zum Tuning** + +| Datei | Parameter / Bereich | Einschätzung | +| ----- | ----- | ----- | +| `config/retriex/governance.yaml` | `retriex.governance.config.regression_baseline.*` | Nicht direkt zur Antwortoptimierung, sondern Schutz gegen Regressionen. Nur ändern, wenn Tests/Guardrails bewusst angepasst werden. | +| `governance.yaml` | `core_pattern_audit.*` | Developer-/Audit-Regeln, keine direkte Suchqualität. | +| `config/retriex/runtime.yaml` | `retriex.context.config.max_visible_regular_lines`, `max_full_lines` | Kann beeinflussen, wie viel Kontext sichtbar/ausgegeben wird, aber kein primärer Rankinghebel. | +| `runtime.yaml` | Pfade zu Knowledge/Index/Locks | Infrastruktur, nicht Antwortqualität. | +| `config/retriex/vector.yaml` | Host, Port, Script-Pfade, Timeouts | Betrieb/Performance, nicht fachliche Qualität. | +| `config/retriex/commerce.yaml` | `shop_timeout`, API-URL, Access-Key | Verfügbarkeit/Performance der Shopdaten, nicht Rankingqualität. | +| `config/retriex/agent.yaml` | `messages`, `production_ui`, `source_labels`, `html` | UX-/Anzeige-Texte, nicht fachliche Antwortoptimierung. | + +## **Empfohlene Tuning-Reihenfolge** + +Für bessere Suchergebnisse zuerst `retrieval.yaml`, `vector.yaml`, `query_enrichment.yaml`, `language.yaml` und `vocabulary.yaml` anfassen. + +Für bessere Shop-Suche zuerst `agent.yaml` → `shop_prompt.*`, dann `commerce.yaml` → `commerce_query.*` / `shop_matching.*`, danach `search_repair.yaml`. + +Für bessere Antwortqualität zuerst `prompt.yaml` → `fact_grounding`, `measurement_evidence_guard`, `output_priority`, `numeric_value_focus`, `response_format`, danach `model.yaml`. diff --git a/config/retriex/commerce.yaml b/config/retriex/commerce.yaml index 2f6934a..05a3cf6 100644 --- a/config/retriex/commerce.yaml +++ b/config/retriex/commerce.yaml @@ -48,6 +48,7 @@ parameters: filter_search_tokens: - preiswerte - lösung + - reinigungslösung - größer - welchem - welche @@ -128,6 +129,9 @@ parameters: - pumpenkopf - motorblock - lösung + - reinigungslösung + - reinigungsloesung + - clean - loesung - solution - teststreifen @@ -143,8 +147,8 @@ parameters: - system normalization: - search: ['€'] - replace: [' euro '] + search: ['€','euro'] + replace: [' EUR '] text: trim_characters: