remove direct chnuk search. only vector search

2026-02-18 14:46:55 +01:00
parent 12a5ab0bb3
commit ce03c65aca
6 changed files with 94 additions and 152 deletions
--- a/templates/admin/model_config/create.html.twig
+++ b/templates/admin/model_config/create.html.twig
@@ -31,7 +31,7 @@
                               placeholder="z. B. qwen3:latest"
                               required>
                        <div class="form-text text-secondary">
-                            Exakter Modellname wie im Endpunkt konfiguriert.
+                            Exakter Modellname wie im KI-Endpunkt konfiguriert (z. B. Ollama oder API).
                        </div>
                    </div>

@@ -42,26 +42,31 @@
                                   type="checkbox"
                                   name="stream"
                                   value="1"
-                                   id="streamSwitch">
+                                   id="streamSwitch" checked>
                            <label class="form-check-label" for="streamSwitch">
                                Streaming aktivieren
                            </label>
                        </div>
+                        <div class="form-text text-secondary ms-3">
+                            Aktiviert Token-Streaming im Chat (empfohlen für bessere UX).
+                        </div>
                    </div>

                    <!-- Temperature -->
                    <div class="col-md-4">
                        <label class="form-label">Temperature</label>
                        <input type="number"
-                               step="0.1"
+                               step="0.05"
                               min="0"
                               max="2"
                               name="temperature"
-                               value="0.1"
+                               value="0.35"
                               class="form-control bg-dark text-light border-secondary"
                               required>
                        <div class="form-text text-secondary">
-                            Niedrige Werte = deterministisch (empfohlen für RAG).
+                            Steuert die Kreativität der Antworten.
+                            Niedrige Werte (0.2–0.4) erzeugen stabile, sachliche Ergebnisse – empfohlen für RAG-Systeme.
+                            Höhere Werte führen zu freieren, weniger deterministischen Antworten.
                        </div>
                    </div>

@@ -71,9 +76,14 @@
                        <input type="number"
                               min="1"
                               name="top_k"
-                               value="20"
+                               value="40"
                               class="form-control bg-dark text-light border-secondary"
                               required>
+                        <div class="form-text text-secondary">
+                            Begrenzt die Anzahl der wahrscheinlichsten Token, aus denen das Modell auswählt.
+                            Niedrigere Werte = konservativer, höhere Werte = flexibler.
+                            20–50 ist für Wissenssysteme üblich.
+                        </div>
                    </div>

                    <!-- Top P -->
@@ -84,9 +94,14 @@
                               min="0"
                               max="1"
                               name="top_p"
-                               value="0.8"
+                               value="0.9"
                               class="form-control bg-dark text-light border-secondary"
                               required>
+                        <div class="form-text text-secondary">
+                            Nucleus Sampling: Das Modell berücksichtigt nur Token,
+                            deren kumulative Wahrscheinlichkeit innerhalb dieses Werts liegt.
+                            0.8–0.95 bietet eine gute Balance zwischen Stabilität und Natürlichkeit.
+                        </div>
                    </div>

                    <!-- Repeat Penalty -->
@@ -97,9 +112,13 @@
                               min="0"
                               max="5"
                               name="repeat_penalty"
-                               value="1.05"
+                               value="1.1"
                               class="form-control bg-dark text-light border-secondary"
                               required>
+                        <div class="form-text text-secondary">
+                            Bestraft Wortwiederholungen. Werte leicht über 1.0 (z. B. 1.1–1.15)
+                            verhindern Schleifen und redundante Antworten.
+                        </div>
                    </div>

                    <!-- Num Ctx -->
@@ -109,11 +128,13 @@
                               min="512"
                               max="32768"
                               name="num_ctx"
-                               value="4096"
+                               value="8192"
                               class="form-control bg-dark text-light border-secondary"
                               required>
                        <div class="form-text text-secondary">
-                            Muss zum Modell passen. Zu hohe Werte können Performance beeinflussen.
+                            Maximale Kontextlänge in Tokens (Systemprompt + Benutzerfrage + Retrieval-Chunks).
+                            Muss vom Modell unterstützt werden.
+                            Höhere Werte ermöglichen größere Wissenskontexte, erhöhen jedoch Speicher- und Rechenbedarf.
                        </div>
                    </div>