update
This commit is contained in:
@@ -21,8 +21,10 @@ PRÜFE GEGEN DIESE KRITERIEN:
|
||||
- Kein Ablese-Test: Wurde eine sachlich RICHTIGE Antwort als "schlecht" gewertet, nur weil sie nicht den Guide-Begriff nutzt oder über den Guide hinausgeht → Fehlurteil. Korrekte Synonyme und gleichbedeutende Begriffe müssen "gut" sein.
|
||||
- Asymmetrie: Weltwissen darf nur zum ANERKENNEN richtiger Antworten dienen, nie zum strengeren Fordern.
|
||||
- "schlecht" ist nur fair, wenn die Antwort sachlich falsch ist oder dem Material widerspricht.
|
||||
- KEIN Durchwinken: Wurde eine sachlich FALSCHE oder dem Material widersprechende Antwort als "gut" gewertet → Fehlurteil. Prüfe die Antwort SELBST auf Korrektheit (gegen Material UND Logik), nicht nur die Fairness — in BEIDE Richtungen.
|
||||
- Widerspruchs-Check: Widerspricht sich das Feedback selbst (bejaht die Antwort UND nennt zugleich die Gegen-Lösung) oder passt es nicht zur Bewertung → Fehlurteil.
|
||||
|
||||
Beanstande NUR echte Fehlurteile. Ist die Bewertung fair und materialtreu, ist sie in Ordnung.
|
||||
Beanstande NUR echte Fehlurteile. Ist die Bewertung fair, korrekt und materialtreu, ist sie in Ordnung.
|
||||
|
||||
Gib NUR JSON aus (kein weiterer Text):
|
||||
- Bewertung in Ordnung: {{"ok": true}}
|
||||
|
||||
Reference in New Issue
Block a user