91 lines
4.0 KiB
Python
91 lines
4.0 KiB
Python
from pathlib import Path
|
|
|
|
PROJECT_ROOT = Path(__file__).resolve().parent.parent
|
|
TEMPLATES_DIR = PROJECT_ROOT / "templates"
|
|
STORAGE_DIR = PROJECT_ROOT / "storage"
|
|
FRONTEND_DIST = PROJECT_ROOT / "frontend" / "dist"
|
|
DB_PATH = STORAGE_DIR / "creator.db"
|
|
PROJECTS_DIR = PROJECT_ROOT / "projects"
|
|
|
|
MAX_CONCURRENT_GENERATIONS = 10
|
|
|
|
# Deckel für gleichzeitige CLI-Agenten-Prozesse (über alle Generierungen hinweg).
|
|
# Eigene Spur für interaktive Aufrufe (Chat, Elemente), damit sie nicht hinter
|
|
# laufenden Writern in der Warteschlange hängen.
|
|
MAX_CONCURRENT_AGENTS = 12
|
|
MAX_CONCURRENT_INTERACTIVE = 4
|
|
|
|
# Grace-Fenster der Konsens-Races (Bausteine, Guide, OnePager): Nach dem ersten
|
|
# gültigen Ergebnis dürfen die übrigen Agenten noch so viele Sekunden fertig
|
|
# werden (Kill nur, wenn das Minimum schon steht).
|
|
KONSENS_GRACE = 300
|
|
|
|
# Cap der Klärungs- und Prüf-Loops: maximale Runden, bis alles entschieden sein
|
|
# muss. In der letzten Runde MUSS der Mapping-Agent jeden Eintrag entscheiden;
|
|
# Prüf-Loops lassen Rest-Beanstandungen danach stehen.
|
|
KONSENS_MAX_RUNDEN = 3
|
|
|
|
# Timeouts pro Agenten-Schritt: (Basis-Sekunden, Sekunden pro Baustein/Section).
|
|
# Gilt für alle Provider gleich — wer zu langsam ist, wird neu gestartet bzw. überholt.
|
|
TIMEOUTS = {
|
|
"recherche": (1800, 0), # fix 30 min
|
|
"recherche_mapping": (600, 3), # n = vorgemergte Einträge
|
|
"auswahl": (300, 2), # Rest-Prüfung im Klärungs-Loop, n = Rest-Einträge
|
|
"auswahl_mapping": (600, 2), # n = Rest-Einträge
|
|
"ergaenzung": (900, 0), # Themenfeld-Ergänzung bei Projekten (Web-Recherche)
|
|
"guide_auswahl": (300, 5), # pro Baustein im Inventar
|
|
"plan": (300, 5),
|
|
"plan_judge": (600, 5), # Judge liest bis zu 5 Gliederungen, n = Sections
|
|
"writer": (600, 120), # pro Section im Chunk
|
|
"lese_check": (300, 10), # pro Section im Paket
|
|
"onepager_recherche": (900, 0),
|
|
"onepager_mapping": (600, 0), # Konsolidierung der Recherchen
|
|
"onepager_bauen": (300, 0),
|
|
"onepager_judge": (600, 0), # Judge über die Karten-Sätze
|
|
"onepager_verify": (300, 0),
|
|
}
|
|
|
|
# Auswahl-Auftrag je Format: (Mindest-Anteil, Maximal-Anteil, Mindestanzahl, Zweck).
|
|
FORMAT_ANTEIL = {
|
|
"MiniGuide": (0.05, 0.10, 8, "einen kompakten Anfänger-Guide — der schnelle Einstieg ins Thema"),
|
|
"Guide": (0.25, 0.35, 20, "einen ausführlichen Anfänger-Guide — ein solides Fundament im Thema"),
|
|
"FullGuide": (0.90, 1.00, 0, "einen Komplett-Guide — das ganze Thema"),
|
|
}
|
|
|
|
# Provider-Stacks: komplett unabhängig, einer kann jederzeit entfernt werden.
|
|
# Rollen: "quick" = Massenarbeit (Recherche, Einordnung),
|
|
# "fast" = Interaktion + Voten (Chat, Prüfung, Klärung, Elemente),
|
|
# "judge" = Mapping-/Judge-/Prüf-Agenten — kalt (niedrige Temperature,
|
|
# ohne Thinking) für stabile Urteile; Claude/Lokal mappen auf "fast",
|
|
# "guide" = große Generierung (Vorschläge, Writer).
|
|
DEFAULT_PROVIDER = "claude"
|
|
PROVIDERS = {
|
|
"claude": {
|
|
"cli": "claude",
|
|
"guide": "claude-opus-4-8[1m]",
|
|
"fast": "claude-sonnet-4-6",
|
|
"judge": "claude-sonnet-4-6", # CLI kennt keine Temperature
|
|
"quick": "claude-sonnet-4-6",
|
|
"env_key": None, # Auth via CLAUDE_CODE_OAUTH_TOKEN oder ~/.claude
|
|
},
|
|
# "minimax-kalt/…" ist KEIN eigener Stack, nur ein opencode-Provider-Eintrag
|
|
# (dev-ops/opencode.json) mit niedriger Temperature; M3 dort ohne Thinking.
|
|
"minimax": {
|
|
"cli": "opencode",
|
|
"guide": "minimax/MiniMax-M3",
|
|
"fast": "minimax-kalt/MiniMax-M2.7-highspeed",
|
|
"judge": "minimax-kalt/MiniMax-M3",
|
|
"quick": "minimax/MiniMax-M2.7-highspeed",
|
|
"env_key": "MINIMAX_API_KEY",
|
|
},
|
|
"lokal": {
|
|
"cli": "opencode",
|
|
"guide": "ollama/qwen3.6:27b",
|
|
"fast": "ollama/qwen3.5:9b",
|
|
"judge": "ollama/qwen3.5:9b",
|
|
"quick": "ollama/qwen3.5:9b",
|
|
"env_key": None,
|
|
"check_url": "http://localhost:11434/api/tags", # Ollama erreichbar?
|
|
},
|
|
}
|