{% extends 'admin/base.html.twig' %} {% block title %}RetrieX Eval Suite{% endblock %} {% block body %}
Die Admin-Runs schreiben typspezifische Reports nach
tests/evals/reports/<type>-last-run.json
und zusätzlich den bekannten last-run.json.
php bin/console mto:agent:eval:run {{ type }}
| Status | Case | Dauer | Failures / Details | ||||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| {% if result.passed|default(false) %} PASS {% else %} FAIL {% endif %} |
{{ result.case_id|default('') }}
{{ result.type|default('') }}
{% set casePrompt = result.prompt|default(result.details.prompt|default('')) %}
{% if casePrompt %}
Prompt:
{% endif %}
{% set historyRows = result.details.history|default([]) %}
{% if historyRows is not empty %}
{{ casePrompt }} Kontext / History anzeigen
{% for turn in historyRows %}
Vorheriger Prompt:
{{ turn.prompt|default('') }}
{% if turn.answer_preview|default('') %}
Antwort-Auszug:
{{ turn.answer_preview }}
{% endif %}
|
{{ result.duration_ms|default(0) }} ms |
{% if result.failures|default([]) is not empty %}
Keine Fehler.
{% endif %}
{% set documentRefs = result.details.document_refs|default([]) %}
{% if documentRefs is not empty %}
Gefundene Dokumente
Treffer / Chunks anzeigen
JSON-Details anzeigen{{ result.details|default({})|json_encode(constant('JSON_PRETTY_PRINT')) }}
|
||||||||||||||||
| Dieser Report enthält keine Resultate. | |||||||||||||||||||