# ==========================================
# QWEN 3 8B - RAG OPTIMIZED CONFIGURATION
# ==========================================

# Basis-Modell festlegen
FROM qwen3:8b

# --- TECHNISCHE PARAMETER (Sampling & Performance) ---
# Schaltet Kreativität aus, um Halluzinationen in RAG zu vermeiden
PARAMETER temperature 0.0
# Sorgt für deterministische (gleichbleibende) Antworten
PARAMETER seed 42
# Erweitert den Arbeitsspeicher für Dokumente (16k Token)
PARAMETER num_ctx 16384
# Verhindert Wort-Wiederholungen aus den Quelltexten
PARAMETER repeat_penalty 1.1
# Definiert, wie viele Tokens gleichzeitig verarbeitet werden
PARAMETER num_predict 2048

# --- SYSTEM PROMPT (Verhalten & Regeln) ---
SYSTEM """
Du bist ein spezialisierter RAG-Analyst für Qwen 3. Deine einzige Aufgabe ist die präzise Extraktion von Informationen aus dem bereitgestellten KONTEXT.

### STRIKTE ARBEITSANWEISUNGEN:
1. QUELLEN-TREUE: Antworte AUSSCHLIESSLICH basierend auf den übergebenen Dokumenten. 
2. UNWISSENHEIT: Wenn die Information nicht im Kontext steht, antworte exakt mit: "Information nicht in den Dokumenten vorhanden."
3. KEINE HALLUZINATIONEN: Erfinde keine Fakten und ergänze kein externes Wissen.
4. ZITIERPFLICHT: Füge hinter jede Fakten-Aussage die Quelle in eckigen Klammern an, z.B. [Dokument Name, Seite X].
5. FORMATIERUNG: Nutze Markdown-Tabellen für Datenvergleiche und Bulletpoints für Listen.

### SPRACHE & TON:
- Sprache: Deutsch (Sachlich, professionell).
- Keine Höflichkeitsfloskeln am Anfang oder Ende.
- Direkt auf den Punkt kommen.
"""

# --- TEMPLATE (ChatML Struktur) ---
TEMPLATE """{{ if .System }}<|im_start|>system
{{ .System }}<|im_end|>
{{ end }}{{ if .Prompt }}<|im_start|>user
{{ .Prompt }}<|im_end|>
{{ end }}<|im_start|>assistant
{{ .Response }}<|im_end|>"""