new layouts
This commit is contained in:
@@ -12,6 +12,13 @@
|
||||
</a>
|
||||
</div>
|
||||
|
||||
<div class="alert alert-warning border-warning bg-dark text-light mb-4">
|
||||
<strong>Wichtiger Hinweis:</strong><br>
|
||||
Änderungen am Indexierungsprofil beeinflussen die Struktur des Vektor-Indexes
|
||||
(Chunking, Embedding, Scoring). Nach Aktivierung ist ein vollständiger
|
||||
Global Reindex erforderlich.
|
||||
</div>
|
||||
|
||||
<div class="card bg-black border-secondary text-light">
|
||||
<div class="card-body">
|
||||
|
||||
@@ -22,18 +29,20 @@
|
||||
|
||||
<div class="row g-4">
|
||||
|
||||
<!-- ===================== -->
|
||||
<!-- Chunking Section -->
|
||||
<!-- ===================== -->
|
||||
<!-- ================================================= -->
|
||||
<!-- CHUNKING -->
|
||||
<!-- ================================================= -->
|
||||
<div class="col-12">
|
||||
<h5 class="text-info">Chunking</h5>
|
||||
<h5 class="text-info">Chunking-Konfiguration</h5>
|
||||
<hr class="border-secondary">
|
||||
<p class="text-secondary small">
|
||||
Definiert, wie Dokumente in semantische Textabschnitte (Chunks) zerlegt werden.
|
||||
Diese Struktur beeinflusst Retrieval-Qualität, Kontextstabilität und Indexgröße.
|
||||
</p>
|
||||
</div>
|
||||
|
||||
<div class="col-md-6">
|
||||
<label class="form-label">
|
||||
Chunk Size
|
||||
</label>
|
||||
<label class="form-label">Chunk Size</label>
|
||||
<select name="chunk_size"
|
||||
class="form-select bg-dark text-light border-secondary"
|
||||
required>
|
||||
@@ -44,14 +53,18 @@
|
||||
{% endfor %}
|
||||
</select>
|
||||
<div class="form-text text-secondary">
|
||||
Größere Werte = weniger Chunks, mehr Kontext pro Chunk.
|
||||
Maximale Wortanzahl pro Chunk.
|
||||
<br><br>
|
||||
<strong>Kleinere Werte:</strong> Mehr Chunks, höhere Granularität, präziseres Retrieval.
|
||||
<br>
|
||||
<strong>Größere Werte:</strong> Weniger Chunks, mehr Kontext pro Treffer.
|
||||
<br><br>
|
||||
Empfehlung für Produkt- und Wissensdaten: 600–1000.
|
||||
</div>
|
||||
</div>
|
||||
|
||||
<div class="col-md-6">
|
||||
<label class="form-label">
|
||||
Chunk Overlap
|
||||
</label>
|
||||
<label class="form-label">Chunk Overlap</label>
|
||||
<select name="chunk_overlap"
|
||||
class="form-select bg-dark text-light border-secondary"
|
||||
required>
|
||||
@@ -62,64 +75,83 @@
|
||||
{% endfor %}
|
||||
</select>
|
||||
<div class="form-text text-secondary">
|
||||
Überlappung zwischen Chunks zur Kontextstabilisierung.
|
||||
Anzahl überlappender Wörter zwischen zwei Chunks.
|
||||
<br><br>
|
||||
Verhindert Kontextabbrüche an Chunk-Grenzen.
|
||||
<br>
|
||||
Typischer Bereich: 10–20 % der Chunk Size.
|
||||
</div>
|
||||
</div>
|
||||
|
||||
<!-- ===================== -->
|
||||
<!-- Embedding Section -->
|
||||
<!-- ===================== -->
|
||||
<div class="col-12 mt-4">
|
||||
<h5 class="text-info">Embedding</h5>
|
||||
<!-- ================================================= -->
|
||||
<!-- EMBEDDING -->
|
||||
<!-- ================================================= -->
|
||||
<div class="col-12 mt-5">
|
||||
<h5 class="text-info">Embedding-Konfiguration</h5>
|
||||
<hr class="border-secondary">
|
||||
<p class="text-secondary small">
|
||||
Definiert das Modell zur Vektorisierung der Textabschnitte.
|
||||
Embeddings bestimmen die semantische Ähnlichkeitsberechnung im FAISS-Index.
|
||||
</p>
|
||||
</div>
|
||||
|
||||
<div class="col-md-6">
|
||||
<label class="form-label">
|
||||
Embedding Model
|
||||
</label>
|
||||
<label class="form-label">Embedding Model</label>
|
||||
<select name="embedding_model"
|
||||
class="form-select bg-dark text-light border-secondary"
|
||||
required>
|
||||
<option value="all-MiniLM-L6-v2">
|
||||
all-MiniLM-L6-v2 (384)
|
||||
all-MiniLM-L6-v2 (384 Dimensionen)
|
||||
</option>
|
||||
</select>
|
||||
<div class="form-text text-secondary">
|
||||
Das Embedding-Modell erzeugt numerische Vektoren aus Text.
|
||||
Modellwechsel erfordert zwingend einen Global Reindex.
|
||||
</div>
|
||||
</div>
|
||||
|
||||
<div class="col-md-6">
|
||||
<label class="form-label">
|
||||
Embedding Dimension
|
||||
</label>
|
||||
<label class="form-label">Embedding Dimension</label>
|
||||
<input type="number"
|
||||
name="embedding_dimension"
|
||||
value="384"
|
||||
class="form-control bg-dark text-light border-secondary"
|
||||
readonly>
|
||||
<div class="form-text text-secondary">
|
||||
Muss mit dem Embedding-Modell übereinstimmen.
|
||||
Muss exakt zur Dimension des gewählten Embedding-Modells passen.
|
||||
Falsche Werte führen zu inkonsistentem Vektorindex.
|
||||
</div>
|
||||
</div>
|
||||
|
||||
<!-- ===================== -->
|
||||
<!-- Scoring Section -->
|
||||
<!-- ===================== -->
|
||||
<div class="col-12 mt-4">
|
||||
<h5 class="text-info">Scoring</h5>
|
||||
<!-- ================================================= -->
|
||||
<!-- SCORING -->
|
||||
<!-- ================================================= -->
|
||||
<div class="col-12 mt-5">
|
||||
<h5 class="text-info">Scoring & Retrieval</h5>
|
||||
<hr class="border-secondary">
|
||||
<p class="text-secondary small">
|
||||
Definiert die Bewertungslogik für Retrieval-Ergebnisse.
|
||||
Änderungen wirken sich direkt auf die Gewichtung von Keyword- und
|
||||
Vektor-Treffern aus.
|
||||
</p>
|
||||
</div>
|
||||
|
||||
<div class="col-md-6">
|
||||
<label class="form-label">
|
||||
Scoring Version
|
||||
</label>
|
||||
<label class="form-label">Scoring Version</label>
|
||||
<input type="number"
|
||||
name="scoring_version"
|
||||
value="1"
|
||||
class="form-control bg-dark text-light border-secondary"
|
||||
readonly>
|
||||
<div class="form-text text-secondary">
|
||||
Erhöhung erzwingt Global Reindex.
|
||||
Versionskennzeichnung der Scoring-Logik.
|
||||
<br><br>
|
||||
Eine Erhöhung erzwingt:
|
||||
<ul class="mt-2">
|
||||
<li>Neuaufbau des NDJSON-Index</li>
|
||||
<li>Vollständigen FAISS-Rebuild</li>
|
||||
</ul>
|
||||
Gewährleistet reproduzierbare Retrieval-Ergebnisse.
|
||||
</div>
|
||||
</div>
|
||||
|
||||
@@ -139,7 +171,9 @@
|
||||
</div>
|
||||
|
||||
<div class="mt-4 small text-secondary">
|
||||
Hinweis: Änderungen am Indexierungsprofil wirken sich auf die Struktur des
|
||||
Vektor-Indexes aus. Nach Aktivierung ist ein vollständiger Reindex erforderlich.
|
||||
Governance-Hinweis:
|
||||
Ein Indexierungsprofil ist versioniert und deterministisch.
|
||||
Änderungen sollten nur geplant erfolgen, da sie die komplette
|
||||
Wissensstruktur neu generieren.
|
||||
</div>
|
||||
{% endblock %}
|
||||
|
||||
Reference in New Issue
Block a user