Files
MtoRagSystem/RETRIEX_PATCH_10_RETRIEVAL_CONFIG_YAML_ONLY_README.md
2026-04-30 20:10:56 +02:00

1.7 KiB

RetrieX Patch 10 - NdjsonHybridRetrieverConfig YAML-only

Ziel

Dieser Patch entfernt die verbliebenen PHP-Defaults aus NdjsonHybridRetrieverConfig.

Die Retrieval-Werte liegen bereits in config/retriex/retrieval.yaml. PHP liest diese Werte jetzt als Pflichtkonfiguration und wirft bei fehlenden oder ungültigen Werten klare Exceptions, statt still auf PHP-Konstanten zurückzufallen.

Geändert

  • src/Config/NdjsonHybridRetrieverConfig.php

YAML-only

Umgestellt wurden:

  • Retrieval-Limits und Thresholds
  • RRF-/Keyword-Gewichte
  • Dominant-/Focused-Document-Werte
  • Retrieval-Tokenlisten:
    • generic_product_tokens
    • important_short_model_tokens
    • family_descriptor_tokens
    • looks_like_reagent_tokens
    • looks_like_safety_docs
    • looks_like_reagent_words
    • looks_like_document_words
    • looks_like_safety_words
    • looks_like_device_words

Nicht geändert

  • keine Änderung an retrieval.yaml
  • keine Änderung an Retrieval-Algorithmus oder Scoring-Logik
  • keine Änderung an PromptBuilder
  • keine Änderung an Commerce/Shop
  • keine Änderung an AgentRunner
  • keine Änderung an SSE/Frontend

Wichtig

Die YAML-Werte waren bereits vorhanden. Der Patch entfernt nur die PHP-Fallback-Ebene.

Nach dem Einspielen prüfen

php bin/console cache:clear
php bin/console mto:agent:config:validate
php bin/console mto:agent:config:audit-source --details
php bin/console mto:agent:regression:test

Erwartung:

  • NdjsonHybridRetrieverConfig taucht nicht mehr als yaml_with_php_fallback auf.
  • Die Regression bleibt grün, insbesondere:
    • important_short_model_token_th/tc/tp/tm/ph/rx
    • retrieval_reagent_word_indikator
    • retrieval_device_word_geraet
    • Testomat-808-/Indikator-300-Baseline