remove direct chnuk search. only vector search

This commit is contained in:
team 1
2026-02-18 14:46:55 +01:00
parent 12a5ab0bb3
commit ce03c65aca
6 changed files with 94 additions and 152 deletions

View File

@@ -31,7 +31,7 @@
placeholder="z. B. qwen3:latest"
required>
<div class="form-text text-secondary">
Exakter Modellname wie im Endpunkt konfiguriert.
Exakter Modellname wie im KI-Endpunkt konfiguriert (z. B. Ollama oder API).
</div>
</div>
@@ -42,26 +42,31 @@
type="checkbox"
name="stream"
value="1"
id="streamSwitch">
id="streamSwitch" checked>
<label class="form-check-label" for="streamSwitch">
Streaming aktivieren
</label>
</div>
<div class="form-text text-secondary ms-3">
Aktiviert Token-Streaming im Chat (empfohlen für bessere UX).
</div>
</div>
<!-- Temperature -->
<div class="col-md-4">
<label class="form-label">Temperature</label>
<input type="number"
step="0.1"
step="0.05"
min="0"
max="2"
name="temperature"
value="0.1"
value="0.35"
class="form-control bg-dark text-light border-secondary"
required>
<div class="form-text text-secondary">
Niedrige Werte = deterministisch (empfohlen für RAG).
Steuert die Kreativität der Antworten.
Niedrige Werte (0.20.4) erzeugen stabile, sachliche Ergebnisse empfohlen für RAG-Systeme.
Höhere Werte führen zu freieren, weniger deterministischen Antworten.
</div>
</div>
@@ -71,9 +76,14 @@
<input type="number"
min="1"
name="top_k"
value="20"
value="40"
class="form-control bg-dark text-light border-secondary"
required>
<div class="form-text text-secondary">
Begrenzt die Anzahl der wahrscheinlichsten Token, aus denen das Modell auswählt.
Niedrigere Werte = konservativer, höhere Werte = flexibler.
2050 ist für Wissenssysteme üblich.
</div>
</div>
<!-- Top P -->
@@ -84,9 +94,14 @@
min="0"
max="1"
name="top_p"
value="0.8"
value="0.9"
class="form-control bg-dark text-light border-secondary"
required>
<div class="form-text text-secondary">
Nucleus Sampling: Das Modell berücksichtigt nur Token,
deren kumulative Wahrscheinlichkeit innerhalb dieses Werts liegt.
0.80.95 bietet eine gute Balance zwischen Stabilität und Natürlichkeit.
</div>
</div>
<!-- Repeat Penalty -->
@@ -97,9 +112,13 @@
min="0"
max="5"
name="repeat_penalty"
value="1.05"
value="1.1"
class="form-control bg-dark text-light border-secondary"
required>
<div class="form-text text-secondary">
Bestraft Wortwiederholungen. Werte leicht über 1.0 (z. B. 1.11.15)
verhindern Schleifen und redundante Antworten.
</div>
</div>
<!-- Num Ctx -->
@@ -109,11 +128,13 @@
min="512"
max="32768"
name="num_ctx"
value="4096"
value="8192"
class="form-control bg-dark text-light border-secondary"
required>
<div class="form-text text-secondary">
Muss zum Modell passen. Zu hohe Werte können Performance beeinflussen.
Maximale Kontextlänge in Tokens (Systemprompt + Benutzerfrage + Retrieval-Chunks).
Muss vom Modell unterstützt werden.
Höhere Werte ermöglichen größere Wissenskontexte, erhöhen jedoch Speicher- und Rechenbedarf.
</div>
</div>