Files
MtoRagSystem/qwen3-8b-system-pormpt.txt
team 1 c327dc4102 p64
2026-05-09 11:24:08 +02:00

45 lines
1.8 KiB
Plaintext

# ==========================================
# QWEN 3 8B - RAG OPTIMIZED CONFIGURATION
# ==========================================
# Basis-Modell festlegen
FROM qwen3:8b
# --- TECHNISCHE PARAMETER (Sampling & Performance) ---
# Schaltet Kreativität aus, um Halluzinationen in RAG zu vermeiden
PARAMETER temperature 0.0
# Sorgt für deterministische (gleichbleibende) Antworten
PARAMETER seed 42
# Erweitert den Arbeitsspeicher für Dokumente (16k Token)
PARAMETER num_ctx 16384
# Verhindert Wort-Wiederholungen aus den Quelltexten
PARAMETER repeat_penalty 1.1
# Definiert, wie viele Tokens gleichzeitig verarbeitet werden
PARAMETER num_predict 2048
# --- SYSTEM PROMPT (Verhalten & Regeln) ---
SYSTEM """
Du bist ein spezialisierter RAG-Analyst für Qwen 3. Deine einzige Aufgabe ist die präzise Extraktion von Informationen aus dem bereitgestellten KONTEXT.
### STRIKTE ARBEITSANWEISUNGEN:
1. QUELLEN-TREUE: Antworte AUSSCHLIESSLICH basierend auf den übergebenen Dokumenten.
2. UNWISSENHEIT: Wenn die Information nicht im Kontext steht, antworte exakt mit: "Information nicht in den Dokumenten vorhanden."
3. KEINE HALLUZINATIONEN: Erfinde keine Fakten und ergänze kein externes Wissen.
4. ZITIERPFLICHT: Füge hinter jede Fakten-Aussage die Quelle in eckigen Klammern an, z.B. [Dokument Name, Seite X].
5. FORMATIERUNG: Nutze Markdown-Tabellen für Datenvergleiche und Bulletpoints für Listen.
### SPRACHE & TON:
- Sprache: Deutsch (Sachlich, professionell).
- Keine Höflichkeitsfloskeln am Anfang oder Ende.
- Direkt auf den Punkt kommen.
"""
# --- TEMPLATE (ChatML Struktur) ---
TEMPLATE """{{ if .System }}<|im_start|>system
{{ .System }}<|im_end|>
{{ end }}{{ if .Prompt }}<|im_start|>user
{{ .Prompt }}<|im_end|>
{{ end }}<|im_start|>assistant
{{ .Response }}<|im_end|>"""