remove direct chnuk search. only vector search
This commit is contained in:
@@ -31,7 +31,7 @@
|
||||
placeholder="z. B. qwen3:latest"
|
||||
required>
|
||||
<div class="form-text text-secondary">
|
||||
Exakter Modellname wie im Endpunkt konfiguriert.
|
||||
Exakter Modellname wie im KI-Endpunkt konfiguriert (z. B. Ollama oder API).
|
||||
</div>
|
||||
</div>
|
||||
|
||||
@@ -42,26 +42,31 @@
|
||||
type="checkbox"
|
||||
name="stream"
|
||||
value="1"
|
||||
id="streamSwitch">
|
||||
id="streamSwitch" checked>
|
||||
<label class="form-check-label" for="streamSwitch">
|
||||
Streaming aktivieren
|
||||
</label>
|
||||
</div>
|
||||
<div class="form-text text-secondary ms-3">
|
||||
Aktiviert Token-Streaming im Chat (empfohlen für bessere UX).
|
||||
</div>
|
||||
</div>
|
||||
|
||||
<!-- Temperature -->
|
||||
<div class="col-md-4">
|
||||
<label class="form-label">Temperature</label>
|
||||
<input type="number"
|
||||
step="0.1"
|
||||
step="0.05"
|
||||
min="0"
|
||||
max="2"
|
||||
name="temperature"
|
||||
value="0.1"
|
||||
value="0.35"
|
||||
class="form-control bg-dark text-light border-secondary"
|
||||
required>
|
||||
<div class="form-text text-secondary">
|
||||
Niedrige Werte = deterministisch (empfohlen für RAG).
|
||||
Steuert die Kreativität der Antworten.
|
||||
Niedrige Werte (0.2–0.4) erzeugen stabile, sachliche Ergebnisse – empfohlen für RAG-Systeme.
|
||||
Höhere Werte führen zu freieren, weniger deterministischen Antworten.
|
||||
</div>
|
||||
</div>
|
||||
|
||||
@@ -71,9 +76,14 @@
|
||||
<input type="number"
|
||||
min="1"
|
||||
name="top_k"
|
||||
value="20"
|
||||
value="40"
|
||||
class="form-control bg-dark text-light border-secondary"
|
||||
required>
|
||||
<div class="form-text text-secondary">
|
||||
Begrenzt die Anzahl der wahrscheinlichsten Token, aus denen das Modell auswählt.
|
||||
Niedrigere Werte = konservativer, höhere Werte = flexibler.
|
||||
20–50 ist für Wissenssysteme üblich.
|
||||
</div>
|
||||
</div>
|
||||
|
||||
<!-- Top P -->
|
||||
@@ -84,9 +94,14 @@
|
||||
min="0"
|
||||
max="1"
|
||||
name="top_p"
|
||||
value="0.8"
|
||||
value="0.9"
|
||||
class="form-control bg-dark text-light border-secondary"
|
||||
required>
|
||||
<div class="form-text text-secondary">
|
||||
Nucleus Sampling: Das Modell berücksichtigt nur Token,
|
||||
deren kumulative Wahrscheinlichkeit innerhalb dieses Werts liegt.
|
||||
0.8–0.95 bietet eine gute Balance zwischen Stabilität und Natürlichkeit.
|
||||
</div>
|
||||
</div>
|
||||
|
||||
<!-- Repeat Penalty -->
|
||||
@@ -97,9 +112,13 @@
|
||||
min="0"
|
||||
max="5"
|
||||
name="repeat_penalty"
|
||||
value="1.05"
|
||||
value="1.1"
|
||||
class="form-control bg-dark text-light border-secondary"
|
||||
required>
|
||||
<div class="form-text text-secondary">
|
||||
Bestraft Wortwiederholungen. Werte leicht über 1.0 (z. B. 1.1–1.15)
|
||||
verhindern Schleifen und redundante Antworten.
|
||||
</div>
|
||||
</div>
|
||||
|
||||
<!-- Num Ctx -->
|
||||
@@ -109,11 +128,13 @@
|
||||
min="512"
|
||||
max="32768"
|
||||
name="num_ctx"
|
||||
value="4096"
|
||||
value="8192"
|
||||
class="form-control bg-dark text-light border-secondary"
|
||||
required>
|
||||
<div class="form-text text-secondary">
|
||||
Muss zum Modell passen. Zu hohe Werte können Performance beeinflussen.
|
||||
Maximale Kontextlänge in Tokens (Systemprompt + Benutzerfrage + Retrieval-Chunks).
|
||||
Muss vom Modell unterstützt werden.
|
||||
Höhere Werte ermöglichen größere Wissenskontexte, erhöhen jedoch Speicher- und Rechenbedarf.
|
||||
</div>
|
||||
</div>
|
||||
|
||||
|
||||
Reference in New Issue
Block a user