+
+
Was steuert die Modell-Konfiguration?
+
+
+ Die Modell-Konfiguration definiert die vollständige
+ Generierungsumgebung des Agents. Sie trennt strikt zwischen:
+
+
+
+ - LLM-Verhalten (Sampling & Kontext)
+ - Retrieval-Parameter (Vektor-Wissen)
+ - Streaming-Modus
+
+
+
LLM Sampling
+
+
+ Parameter wie Temperature, TopK und TopP beeinflussen die
+ kreative Varianz der Antwort. Repeat Penalty steuert Wiederholungen,
+ während numCtx die maximale Kontextgröße des Modells festlegt.
+
+
+
Retrieval Vector Wissen
+
+
+ Retrieval-Parameter bestimmen, wie viele Chunks aus dem
+ NDJSON-Vektorindex geladen werden und wie viele
+ Top-K Kandidaten aus der FAISS-Suche berücksichtigt werden.
+ Diese Werte beeinflussen die Wissensbreite der Antwort,
+ nicht deren Kreativität.
+
+
+
Architektur-Prinzip
+
+
+ Das Retrieval ist deterministisch und vom LLM getrennt.
+ Das Modell erhält ausschließlich die vorselektierten
+ Chunks als Kontext. Änderungen hier verändern die
+ Wissensbasis der Antwort — nicht den gespeicherten Index.
+ Pro Modell kann genau eine Konfiguration aktiv sein.
+
+
+