optimize ux
This commit is contained in:
@@ -5,7 +5,7 @@
|
||||
{% block body %}
|
||||
|
||||
<div class="d-flex justify-content-between align-items-center mb-4">
|
||||
<h1 class="h3 mb-0">KI Modell-Generierung</h1>
|
||||
<h1 class="h3 mb-0"><i class="bi bi-rocket-takeoff-fill"></i> KI Modell-Generierung</h1>
|
||||
|
||||
{% if is_granted('ROLE_SUPER_ADMIN') %}
|
||||
<a href="{{ path('admin_model_config_create') }}"
|
||||
@@ -18,49 +18,54 @@
|
||||
{# ========================================================= #}
|
||||
{# MODEL CONFIG DESCRIPTION #}
|
||||
{# ========================================================= #}
|
||||
<div class="card bg-black border-secondary text-light mb-4 shadow-sm">
|
||||
<div class="card-body">
|
||||
<div class="card bg-dark border-secondary text-light mb-4 shadow-sm">
|
||||
<div class="card-body row">
|
||||
|
||||
<h5 class="text-info mb-3">Was steuert die Modell-Konfiguration?</h5>
|
||||
<div class="col-lg-6">
|
||||
<h5 class="text-info mb-3">Was steuert die Modell-Konfiguration?</h5>
|
||||
|
||||
<p class="small text-light mb-3">
|
||||
Die Modell-Konfiguration definiert die vollständige
|
||||
Generierungsumgebung des Agents. Sie trennt strikt zwischen:
|
||||
</p>
|
||||
<p class="small text-light mb-3">
|
||||
Die Modell-Konfiguration definiert die vollständige
|
||||
Generierungsumgebung des Agents. Sie trennt strikt zwischen:
|
||||
</p>
|
||||
|
||||
<ul class="small text-light mb-3">
|
||||
<li>LLM-Verhalten (Sampling & Kontext)</li>
|
||||
<li>Retrieval-Parameter (Vektor-Wissen)</li>
|
||||
<li>Streaming-Modus</li>
|
||||
</ul>
|
||||
<ul class="small text-light mb-3">
|
||||
<li>LLM-Verhalten (Sampling & Kontext)</li>
|
||||
<li>Retrieval-Parameter (Vektor-Wissen)</li>
|
||||
<li>Streaming-Modus</li>
|
||||
</ul>
|
||||
|
||||
<h6 class="text-info mt-3">LLM Sampling</h6>
|
||||
<h6 class="text-info mt-3">LLM Sampling</h6>
|
||||
|
||||
<p class="small text-light mb-3">
|
||||
Parameter wie Temperature, TopK und TopP beeinflussen die
|
||||
kreative Varianz der Antwort. Repeat Penalty steuert Wiederholungen,
|
||||
während <code>numCtx</code> die maximale Kontextgröße des Modells festlegt.
|
||||
</p>
|
||||
<p class="small text-light mb-3">
|
||||
Parameter wie Temperature, TopK und TopP beeinflussen die
|
||||
kreative Varianz der Antwort. Repeat Penalty steuert Wiederholungen,
|
||||
während <code>numCtx</code> die maximale Kontextgröße des Modells festlegt.
|
||||
</p>
|
||||
</div>
|
||||
|
||||
<h6 class="text-info mt-3">Retrieval Vector Wissen</h6>
|
||||
<div class="col-lg-6">
|
||||
<h6 class="text-info mt-3">Retrieval Vector Wissen</h6>
|
||||
|
||||
<p class="small text-light mb-3">
|
||||
Retrieval-Parameter bestimmen, wie viele Chunks aus dem
|
||||
NDJSON-Vektorindex geladen werden und wie viele
|
||||
Top-K Kandidaten aus der FAISS-Suche berücksichtigt werden.
|
||||
Diese Werte beeinflussen die Wissensbreite der Antwort,
|
||||
nicht deren Kreativität.
|
||||
</p>
|
||||
<p class="small text-light mb-3">
|
||||
Retrieval-Parameter bestimmen, wie viele Chunks aus dem
|
||||
NDJSON-Vektorindex geladen werden und wie viele
|
||||
Top-K Kandidaten aus der FAISS-Suche berücksichtigt werden.
|
||||
Diese Werte beeinflussen die Wissensbreite der Antwort,
|
||||
nicht deren Kreativität.
|
||||
</p>
|
||||
|
||||
<h6 class="text-info mt-3">Architektur-Prinzip</h6>
|
||||
<h6 class="text-info mt-3">Architektur-Prinzip</h6>
|
||||
|
||||
<p class="small text-light mb-0">
|
||||
Das Retrieval ist deterministisch und vom LLM getrennt.
|
||||
Das Modell erhält ausschließlich die vorselektierten
|
||||
Chunks als Kontext. Änderungen hier verändern die
|
||||
Wissensbasis der Antwort — nicht den gespeicherten Index.
|
||||
Pro Modell kann genau eine Konfiguration aktiv sein.
|
||||
</p>
|
||||
</div>
|
||||
|
||||
<p class="small text-light mb-0">
|
||||
Das Retrieval ist deterministisch und vom LLM getrennt.
|
||||
Das Modell erhält ausschließlich die vorselektierten
|
||||
Chunks als Kontext. Änderungen hier verändern die
|
||||
Wissensbasis der Antwort — nicht den gespeicherten Index.
|
||||
Pro Modell kann genau eine Konfiguration aktiv sein.
|
||||
</p>
|
||||
|
||||
</div>
|
||||
</div>
|
||||
@@ -75,7 +80,7 @@
|
||||
<th>Profil-Version</th>
|
||||
<th>Streaming</th>
|
||||
<th>LLM Sampling</th>
|
||||
<th class="text-warning">Retrieval Vector Wissen</th>
|
||||
<th class="">Retrieval Vector Wissen</th>
|
||||
<th>Status</th>
|
||||
<th class="text-end">Aktionen</th>
|
||||
</tr>
|
||||
@@ -186,10 +191,10 @@
|
||||
Hinweis: Änderungen wirken sich unmittelbar auf Sampling- und Retrieval-Parameter
|
||||
des aktiven Modells aus. Pro Modell kann nur eine Version aktiv sein.
|
||||
</div>
|
||||
|
||||
<hr>
|
||||
<h2 class="h4 mb-4">Agent Live Test</h2>
|
||||
|
||||
<div class="card bg-black border-info">
|
||||
<div class="card bg-black border-secondary">
|
||||
<div class="card-body p-0">
|
||||
<iframe
|
||||
src="/index.html?admin_test=1"
|
||||
|
||||
Reference in New Issue
Block a user