{% extends 'admin/base.html.twig' %} {% block title %}KI Modell-Generierung{% endblock %} {% block body %}
Die Modell-Konfiguration definiert die vollständige Generierungsumgebung des Agents. Sie trennt strikt zwischen:
Parameter wie Temperature, TopK und TopP beeinflussen die
kreative Varianz der Antwort. Repeat Penalty steuert Wiederholungen,
während numCtx die maximale Kontextgröße des Modells festlegt.
Retrieval-Parameter bestimmen, wie viele Chunks aus dem NDJSON-Vektorindex geladen werden und wie viele Top-K Kandidaten aus der FAISS-Suche berücksichtigt werden. Diese Werte beeinflussen die Wissensbreite der Antwort, nicht deren Kreativität.
Das Retrieval ist deterministisch und vom LLM getrennt. Das Modell erhält ausschließlich die vorselektierten Chunks als Kontext. Änderungen hier verändern die Wissensbasis der Antwort — nicht den gespeicherten Index. Pro Modell kann genau eine Konfiguration aktiv sein.
| LLM Modell | Profil-Version | Streaming | LLM Sampling | Retrieval Vector Wissen | Status | Aktionen |
|---|---|---|---|---|---|---|
| {{ config.modelName }} | v{{ config.version }} | {% if config.stream %} Streaming {% else %} Blocking {% endif %} |
Temperature: {{ config.temperature }}
TopK: {{ config.topK }}
TopP: {{ config.topP }}
Repeat Penalty: {{ config.repeatPenalty }}
NumCtx: {{ config.numCtx }}
|
Chunks: {{ config.retrievalMaxChunks }}
VectorK: {{ config.retrievalVectorTopK }}
|
{% if config.active %} Aktiv {% else %} Inaktiv {% endif %} | Test Retrieval {% if not config.active and is_granted('ROLE_SUPER_ADMIN') %} {% else %} — {% endif %} |
| Keine Konfiguration vorhanden. | ||||||