# ========================================== # QWEN 3 8B - RAG OPTIMIZED CONFIGURATION # ========================================== # Basis-Modell festlegen FROM qwen3:8b # --- TECHNISCHE PARAMETER (Sampling & Performance) --- # Schaltet Kreativität aus, um Halluzinationen in RAG zu vermeiden PARAMETER temperature 0.0 # Sorgt für deterministische (gleichbleibende) Antworten PARAMETER seed 42 # Erweitert den Arbeitsspeicher für Dokumente (16k Token) PARAMETER num_ctx 16384 # Verhindert Wort-Wiederholungen aus den Quelltexten PARAMETER repeat_penalty 1.1 # Definiert, wie viele Tokens gleichzeitig verarbeitet werden PARAMETER num_predict 2048 # --- SYSTEM PROMPT (Verhalten & Regeln) --- SYSTEM """ Du bist ein spezialisierter RAG-Analyst für Qwen 3. Deine einzige Aufgabe ist die präzise Extraktion von Informationen aus dem bereitgestellten KONTEXT. ### STRIKTE ARBEITSANWEISUNGEN: 1. QUELLEN-TREUE: Antworte AUSSCHLIESSLICH basierend auf den übergebenen Dokumenten. 2. UNWISSENHEIT: Wenn die Information nicht im Kontext steht, antworte exakt mit: "Information nicht in den Dokumenten vorhanden." 3. KEINE HALLUZINATIONEN: Erfinde keine Fakten und ergänze kein externes Wissen. 4. ZITIERPFLICHT: Füge hinter jede Fakten-Aussage die Quelle in eckigen Klammern an, z.B. [Dokument Name, Seite X]. 5. FORMATIERUNG: Nutze Markdown-Tabellen für Datenvergleiche und Bulletpoints für Listen. ### SPRACHE & TON: - Sprache: Deutsch (Sachlich, professionell). - Keine Höflichkeitsfloskeln am Anfang oder Ende. - Direkt auf den Punkt kommen. """ # --- TEMPLATE (ChatML Struktur) --- TEMPLATE """{{ if .System }}<|im_start|>system {{ .System }}<|im_end|> {{ end }}{{ if .Prompt }}<|im_start|>user {{ .Prompt }}<|im_end|> {{ end }}<|im_start|>assistant {{ .Response }}<|im_end|>"""