update
This commit is contained in:
@@ -26,6 +26,7 @@ VERTIEFUNG_TIMEOUT = 600
|
||||
CHAT_TIMEOUT = 240
|
||||
PRUEFUNG_TIMEOUT = 120 # kurze JSON-Turns; deckelt die Serien-Latenz pro Prüfungs-Schritt
|
||||
KRITIK_MAX_RUNDEN = 2 # Generator → Kritiker → ggf. Neu, höchstens so oft
|
||||
MAX_NACHFRAGEN = 2 # mündliche Prüfung: höchstens so viele Folgefragen, dann Urteil erzwingen
|
||||
|
||||
|
||||
def score_berechnen(
|
||||
@@ -114,14 +115,20 @@ def _frage_schema(data) -> dict | None:
|
||||
|
||||
|
||||
def _bewertung_schema(data) -> dict | None:
|
||||
"""{"feedback": str, "bewertung": "gut"|"schlecht", "bestanden": bool} · sonst None."""
|
||||
"""{"status": "gut"|"schlecht"|"nachfrage", "feedback": str, "frage": str, "bestanden": bool}.
|
||||
|
||||
Bei status "nachfrage" muss `frage` (die Folgefrage) gefüllt sein. · sonst None.
|
||||
"""
|
||||
if not isinstance(data, dict):
|
||||
return None
|
||||
feedback = str(data.get("feedback", "")).strip()
|
||||
bewertung = data.get("bewertung")
|
||||
if not feedback or bewertung not in ("gut", "schlecht"):
|
||||
status = data.get("status")
|
||||
frage = str(data.get("frage", "")).strip()
|
||||
if not feedback or status not in ("gut", "schlecht", "nachfrage"):
|
||||
return None
|
||||
return {"feedback": feedback, "bewertung": bewertung, "bestanden": data.get("bestanden") is True}
|
||||
if status == "nachfrage" and not frage:
|
||||
return None
|
||||
return {"status": status, "feedback": feedback, "frage": frage, "bestanden": data.get("bestanden") is True}
|
||||
|
||||
|
||||
async def _gen_call(name: str, role: str, schema, provider: str, **kwargs) -> dict | None:
|
||||
@@ -154,7 +161,7 @@ def _kritik_block(vorversion: str, probleme: list[str]) -> str:
|
||||
|
||||
|
||||
def _bewertung_text(bew: dict) -> str:
|
||||
return f"Bewertung: {bew['bewertung']}\nFeedback: {bew['feedback']}"
|
||||
return f"Bewertung: {bew['status']}\nFeedback: {bew['feedback']}"
|
||||
|
||||
|
||||
async def _frage_mit_kritik(
|
||||
@@ -186,12 +193,14 @@ async def _frage_mit_kritik(
|
||||
|
||||
async def _bewertung_mit_kritik(
|
||||
topic: str, baustein: str, section_block: str, vertiefung_block: str,
|
||||
frage: str, transcript: str, gute_antworten: int, provider: str,
|
||||
frage: str, transcript: str, gute_antworten: int, rest_nachfragen: int, provider: str,
|
||||
) -> dict | None:
|
||||
"""Antwort zur Frage bewerten, vom Kritiker prüfen lassen, bei Fehlurteil neu.
|
||||
"""Antwort beurteilen: gut/schlecht (mit Kritiker) ODER nachfrage (Folgefrage, ohne Kritiker).
|
||||
|
||||
`frage` ankert, welche Frage geprüft wird; der Dialog (transcript) liefert die
|
||||
Antwort und eine etwaige Diskussion — so kann eine Re-Bewertung das Argument sehen.
|
||||
`frage` ankert die geprüfte Frage; der Dialog liefert Antwort + etwaige Folgefragen.
|
||||
`rest_nachfragen` = wie viele Folgefragen noch erlaubt sind (0 → muss entscheiden).
|
||||
Eine „nachfrage" wird sofort zurückgegeben (kein Verdikt zu prüfen). Verdikte
|
||||
durchlaufen den Kritiker-Loop wie bisher.
|
||||
"""
|
||||
kritik_block = "(keine)"
|
||||
bew = None
|
||||
@@ -200,10 +209,13 @@ async def _bewertung_mit_kritik(
|
||||
"Baustein-Bewertung", "judge", _bewertung_schema, provider,
|
||||
topic=topic, baustein=baustein, section_block=section_block,
|
||||
vertiefung_block=vertiefung_block, frage=frage, transcript=transcript,
|
||||
gute_antworten=gute_antworten, noetig=NOETIG, kritik_block=kritik_block,
|
||||
gute_antworten=gute_antworten, noetig=NOETIG, rest_nachfragen=rest_nachfragen,
|
||||
kritik_block=kritik_block,
|
||||
)
|
||||
if bew is None:
|
||||
return None
|
||||
if bew["status"] == "nachfrage":
|
||||
return bew # Folgefrage → kein Kritiker, keine Wertung
|
||||
probleme = await _kritik_call(
|
||||
"Baustein-Bewertung-Kritik", provider,
|
||||
topic=topic, baustein=baustein, section_block=section_block,
|
||||
@@ -239,19 +251,26 @@ async def pruefung_frage(
|
||||
|
||||
async def pruefung_bewertung(
|
||||
topic: str, baustein: str, section: str, vertiefung: str | None,
|
||||
frage: str, messages: list[dict], gute_antworten: int, provider: str = DEFAULT_PROVIDER,
|
||||
frage: str, messages: list[dict], gute_antworten: int, nachfrage_runde: int = 0,
|
||||
provider: str = DEFAULT_PROVIDER,
|
||||
) -> dict | None:
|
||||
"""Aktion 'antwort': Antwort zur Frage bewerten (Evaluator + Kritiker).
|
||||
"""Aktion 'antwort': Antwort beurteilen (Evaluator + Kritiker).
|
||||
|
||||
Gibt {"feedback", "bewertung", "bestanden"} · None bei Fehler.
|
||||
Gibt {"status": gut|schlecht|nachfrage, "feedback", "frage", "bestanden"} · None bei Fehler.
|
||||
`nachfrage_runde` = bisherige Folgefragen dieser Frage; bei erschöpftem Budget wird
|
||||
ein erneutes „nachfrage" zu „schlecht" gezwungen (der Lerner konnte es nicht zeigen).
|
||||
"""
|
||||
try:
|
||||
section_block, vertiefung_block = _bloecke(section, vertiefung)
|
||||
transcript = _transcript(messages) if messages else "(leer)"
|
||||
return await _bewertung_mit_kritik(
|
||||
rest = max(0, MAX_NACHFRAGEN - nachfrage_runde)
|
||||
bew = await _bewertung_mit_kritik(
|
||||
topic, baustein, section_block, vertiefung_block,
|
||||
frage.strip() or "(keine Frage übergeben)", transcript, gute_antworten, provider,
|
||||
frage.strip() or "(keine Frage übergeben)", transcript, gute_antworten, rest, provider,
|
||||
)
|
||||
if bew and bew["status"] == "nachfrage" and rest <= 0:
|
||||
return {"status": "schlecht", "feedback": bew["feedback"], "frage": "", "bestanden": False}
|
||||
return bew
|
||||
except Exception:
|
||||
log.warning("[%s] Bewertung fehlgeschlagen (%s)", topic, baustein, exc_info=True)
|
||||
return None
|
||||
|
||||
@@ -195,6 +195,7 @@ class BausteinPruefungRequest(BaseModel):
|
||||
frage: str = Field(default="", max_length=2000) # aktuell geprüfte Frage (für diskussion/antwort)
|
||||
letzte_bewertung: str = Field(default="", max_length=2000) # Feedback der letzten Bewertung (Kontext für diskussion)
|
||||
score_vor_frage: int = 0 # Score, als die Frage gestellt wurde → driftfreies (Re-)Bewerten
|
||||
nachfrage_runde: int = 0 # bisherige Folgefragen dieser Frage (mündliche Prüfung)
|
||||
tier2: bool = False # ganzer Guide absolviert (alle ≥3) → −1 bei falsch, Deckel 10
|
||||
tier3: bool = False # ganzer Guide verstanden (alle ≥10) → Meisterpfad, −2 bei falsch, Deckel 25
|
||||
messages: list[ChatMessage] = [] # Dialog bisher; leer = erste Frage
|
||||
|
||||
@@ -243,14 +243,20 @@ async def baustein_pruefung_route(req: BausteinPruefungRequest):
|
||||
if not req.frage.strip():
|
||||
raise HTTPException(400, "Antwort braucht eine laufende Frage")
|
||||
data = await pruefung_bewertung(
|
||||
req.topic, req.baustein, req.section, vertiefung, req.frage, msgs, gute, provider=req.provider,
|
||||
req.topic, req.baustein, req.section, vertiefung, req.frage, msgs, gute,
|
||||
nachfrage_runde=req.nachfrage_runde, provider=req.provider,
|
||||
)
|
||||
if data is None:
|
||||
raise HTTPException(502, "Bewertung fehlgeschlagen — bitte erneut versuchen")
|
||||
|
||||
# Mündliche Prüfung: noch unklar → Folgefrage stellen, KEINE Wertung, kein Score.
|
||||
if data["status"] == "nachfrage":
|
||||
return {"frage": data["frage"], "feedback": data["feedback"], "bewertung": None,
|
||||
"gute_antworten": gute, "absolviert": absolviert, "verstanden": verstanden, "gemeistert": gemeistert}
|
||||
|
||||
# Score driftfrei aus dem Basis-Score rechnen (Re-Bewertung ersetzt das vorige Ergebnis).
|
||||
score = score_berechnen(
|
||||
req.score_vor_frage, data["bewertung"] == "gut", req.tier2, req.tier3, absolviert, gemeistert,
|
||||
req.score_vor_frage, data["status"] == "gut", req.tier2, req.tier3, absolviert, gemeistert,
|
||||
)
|
||||
gute = await set_baustein_score(req.topic, req.baustein, score)
|
||||
if score >= NOETIG and not absolviert:
|
||||
@@ -263,7 +269,7 @@ async def baustein_pruefung_route(req: BausteinPruefungRequest):
|
||||
if score >= MEISTERN and not gemeistert:
|
||||
await set_baustein_gemeistert(req.topic, req.baustein)
|
||||
gemeistert = True
|
||||
return {"feedback": data["feedback"], "bewertung": data["bewertung"], "gute_antworten": gute, "absolviert": absolviert, "verstanden": verstanden, "gemeistert": gemeistert}
|
||||
return {"feedback": data["feedback"], "bewertung": data["status"], "gute_antworten": gute, "absolviert": absolviert, "verstanden": verstanden, "gemeistert": gemeistert}
|
||||
|
||||
|
||||
# --- Guides ---
|
||||
|
||||
Reference in New Issue
Block a user