Files

team 1 51bc781826 new mds

2026-04-15 10:49:21 +02:00

15 KiB

Raw Blame History

RetrieX – Installationsanleitung

Stand: 15.04.2026
Quelle: aktuelle rag.zip (Single Source of Truth)

Diese Anleitung beschreibt die codebasierte Neuinstallation des aktuellen Systems. Sie ersetzt ältere Installationsstände. Alle Angaben unten wurden an den tatsächlich vorhandenen Dateien, Services, Commands und Pfaden aus dem ZIP ausgerichtet.

1. Architektur des aktuellen Stands

RetrieX besteht aktuell aus diesen Hauptbausteinen:

Symfony 7.4 auf PHP 8.2+
Doctrine ORM + Doctrine Migrations
MariaDB/MySQL als operative Datenbank
Python-Vektorlayer mit faiss-cpu, sentence-transformers, fastapi, uvicorn
Ollama-kompatibler LLM-Endpunkt über AI_LLM_API_URL
NDJSON + FAISS im Dateisystem unter var/knowledge
Adminoberfläche für Dokumente, Ingest-Profile, System Prompt, Modellkonfiguration und Jobs
SSE-Streaming für den Browser-Chat

Wichtige Betriebsordner im aktuellen Code:

var/knowledge/ → NDJSON, FAISS-Indizes, Uploads
var/log/ → System-, Agent- und Ingest-Logs
var/run/ → PID-Dateien des Python-Services
var/locks/ → Ingest-Lock
python/vector/ → Python-Control-, Search- und Service-Skripte

2. Wichtige Korrekturen gegenüber älteren Installationsständen

Die frühere INSTALL.md passt nicht mehr zum aktuellen Code. Für den aktuellen Stand gelten insbesondere diese Punkte:

Der Wissensspeicher liegt unter var/knowledge/, nicht unter var/vector/.
Der Python-Code liegt unter python/vector/, nicht unter vector/.
Die Python-Abhängigkeiten kommen aus der Datei requirements.txt im Projektroot.
Der korrekte Rebuild-Befehl ist mto:agent:system:rebuild --hard, nicht mto:agent:ingest:global.
Das LLM-Modell kommt nicht mehr aus einer AI_LLM_MODEL-Umgebungsvariable, sondern aus der aktiven ModelGenerationConfig in der Adminoberfläche.
Für den Chat sind zwingend nötig:
- ein aktiver System Prompt
- eine aktive ModelGenerationConfig
- mindestens ein erfolgreich indexiertes Dokument für wissensbasiertes Retrieval
Die Upload-UI erwähnt mehrere Dateitypen, der aktuelle Extractor-Code unterstützt jedoch faktisch nur PDF.

3. Systemvoraussetzungen

3.1 Betriebssystem

3.2 PHP

Erforderlich:

PHP 8.2 oder höher

Benötigte bzw. praktisch notwendige Extensions aus dem aktuellen Projektstand:

ctype
curl
dom
iconv
libxml
pdo
pdo_mysql
mbstring
zip

Prüfen:

php -v
php -m

3.3 Composer

Prüfen:

composer --version

Falls Composer nicht global vorhanden ist, kann lokal installiert werden. Für den regulären Betrieb ist ein globaler Composer aber sinnvoll.

3.4 Datenbank

Der aktuelle Projektstand ist praktisch auf MariaDB/MySQL ausgerichtet.

3.5 Python

Erforderlich:

Python 3.10 oder höher
python3-venv
python3-pip

Installation:

sudo apt install python3 python3-venv python3-pip

Prüfen:

python3 --version

3.6 Ollama oder kompatibler Generate-Endpunkt

RetrieX spricht den LLM-Endpunkt über AI_LLM_API_URL an. Erwartet wird ein Ollama-kompatibler /api/generate-Endpoint.

Beispiel mit Ollama:

curl -fsSL https://ollama.com/install.sh | sh

Ein Modell muss lokal vorhanden sein, zum Beispiel:

ollama pull qwen3

oder ein projektspezifisches Modell, falls vorhanden.

Verfügbarkeit prüfen:

curl http://127.0.0.1:11434/api/tags

Wichtig: Welches Modell tatsächlich benutzt wird, bestimmt später die aktive ModelGenerationConfig im Admin, nicht eine .env-Variable.

3.7 Optional: Shopware Store API

Der Commerce-Pfad ist im aktuellen Code standardmäßig aktiviert. Für produktbezogene Anfragen nutzt das System optional die Shopware Store API.

Dafür werden diese Variablen verwendet:

SHOPWARE_STORE_API_BASE_URL
SHOPWARE_SALES_CHANNEL_ACCESS_KEY
SHOPWARE_STORE_API_MAX_RESULT

Wenn keine Shopware-Suche gewünscht ist, sollte der Commerce-Pfad vor produktivem Einsatz bewusst deaktiviert oder sauber konfiguriert werden.

4. Projekt bereitstellen

ZIP entpacken und ins Projekt wechseln:

unzip rag.zip -d retriex
cd retriex

Alternativ über Repository-Checkout, falls das Projekt aus Git bereitgestellt wird.

5. PHP-Abhängigkeiten installieren

composer install --no-interaction

Für Produktion:

composer install --no-dev --optimize-autoloader --no-interaction

Erst nach diesem Schritt funktionieren bin/console und die Symfony-Commands.

6. Umgebung konfigurieren

6.1 Grundregel

Lokale oder serverbezogene Overrides sollten in .env.local gepflegt werden, nicht direkt in der committeten .env.

6.2 Minimale `.env.local`

Beispiel für einen lokalen oder servernahen MariaDB-Betrieb:

APP_ENV=prod
APP_SECRET=change-me

DATABASE_URL="mysql://db:db@127.0.0.1:3306/db?serverVersion=10.11.0-mariadb&charset=utf8mb4"
MESSENGER_TRANSPORT_DSN=doctrine://default?auto_setup=0

AI_LLM_API_URL=http://127.0.0.1:11434/api/generate
AI_LLM_TIMEOUT=600
AI_HISTORY_DIR=var/agent-history
AI_DEBUG=false
AI_LOG_PROMPT=false
AI_LOG_CONTEXT=false

SHOPWARE_STORE_API_BASE_URL="https://example.invalid"
SHOPWARE_SALES_CHANNEL_ACCESS_KEY="replace-me"
SHOPWARE_STORE_API_MAX_RESULT=25

Hinweise:

APP_ENV=prod ist im aktuellen .env bereits voreingestellt.
DATABASE_URL muss auf MariaDB/MySQL zeigen.
AI_LLM_API_URL muss auf einen funktionierenden /api/generate-Endpoint zeigen.
AI_LLM_TIMEOUT=600 ist mit dem aktuellen Code konsistent.
AI_LLM_MODEL wird nicht verwendet.

6.3 Shopware deaktivieren, wenn nicht benötigt

Im aktuellen Code ist mto.commerce.enabled in config/services.yaml auf true gesetzt. Wer die Shopware-Suche nicht einsetzen will, sollte vor produktivem Einsatz bewusst einen dieser Wege wählen:

gültige Shopware-Zugangsdaten hinterlegen, oder
config/services.yaml gezielt anpassen und Commerce deaktivieren.

Für reine Wissens- und Dokumentinstallation ist die Shopware-Anbindung nicht zwingend, sollte aber nicht unklar halbkonfiguriert bleiben.

7. Datenbank initialisieren

Migrationen ausführen:

php bin/console doctrine:migrations:migrate --no-interaction

Damit werden unter anderem diese zentralen Tabellen angelegt:

user
document
document_version
ingest_job
system_prompt
ingest_profile
model_generation_config
knowledge_tag
document_tag
tag_rebuild_job

8. Python-Umgebung aufbauen

8.1 Virtuelle Umgebung anlegen

python3 -m venv .venv
source .venv/bin/activate

8.2 Python-Abhängigkeiten installieren

Manuell:

pip install --upgrade pip
pip install -r requirements.txt

Alternativ nach angelegter .venv über den Symfony-Wrapper:

php bin/console mto:agent:vector:control --install

Wichtig: Der Wrapper erwartet bereits eine existierende .venv. Er erzeugt sie nicht selbst.

9. Vector Service starten

Start:

php bin/console mto:agent:vector:control --start

Status prüfen:

php bin/console mto:agent:vector:control --status

Optionaler Reload:

php bin/console mto:agent:vector:control --reload

Der Service startet aktuell standardmäßig auf:

Host: 0.0.0.0
Port: 8090

Der PHP-Code spricht standardmäßig gegen:

http://127.0.0.1:8090

10. Admin-Benutzer anlegen

Ohne Admin-Benutzer lässt sich das System nicht fertig konfigurieren.

CLI-Befehl:

php bin/console mto:agent:user:create

Der Command fragt interaktiv ab:

E-Mail
Passwort
Rolle

Für die Erstinstallation ist typischerweise sinnvoll:

ROLE_SUPER_ADMIN

11. Anwendung starten

Für einen einfachen lokalen Test:

php -S 127.0.0.1:8000 -t public

Danach sind typischerweise relevant:

Chat-Frontend: http://127.0.0.1:8000/
Admin-Login: http://127.0.0.1:8000/admin/login

Für Produktion sollte stattdessen ein regulärer Webserver genutzt werden, zum Beispiel Nginx + PHP-FPM.

12. Pflicht-Initialisierung im Admin

Nach der technischen Grundinstallation ist das System noch nicht vollständig betriebsbereit. Es müssen im Admin zwingend Inhalte angelegt werden.

12.1 System Prompt anlegen und aktivieren

Pfad im Admin:

/admin/system/prompt

Ohne aktiven System Prompt wirft der PromptBuilder zur Laufzeit einen Fehler.

12.2 ModelGenerationConfig anlegen und aktivieren

Pfad im Admin:

/admin/model-config/

Ohne aktive ModelGenerationConfig schlägt das Retrieval fehl, weil NdjsonHybridRetriever explizit eine aktive Konfiguration verlangt.

Sinnvolle Minimalwerte für einen stabilen Start:

Modellname: exakt wie im Ollama-Endpunkt verfügbar, z. B. qwen3:latest
Streaming: aktiv
Temperature: 0.2 bis 0.4
Top K: 40
Top P: 0.9
Repeat Penalty: 1.1
num_ctx: 8192
Retrieval Max Chunks: 25
Retrieval Vector Top K: 25

12.3 Optional: Ingest-Profil anlegen

Pfad im Admin:

/admin/ingest-profiles/

Wenn kein Profil aktiv ist, fällt das System auf die Parameter aus config/services.yaml zurück:

Chunk Size: 800
Chunk Overlap: 100
Embedding Model: intfloat/multilingual-e5-base
Embedding Dimension: 768
Scoring Version: 1

Das ist für einen ersten Start ausreichend. Ein eigenes Ingest-Profil ist also optional, solange man die Fallback-Werte bewusst akzeptiert.

13. Erste Dokumente ingestieren

13.1 Wichtiger Format-Hinweis

Die Upload-Maske nennt mehrere Formate, aber der aktuelle Extractor-Code enthält nur einen PdfExtractor. Für einen sicheren Erstbetrieb sollten daher aktuell nur PDF-Dateien hochgeladen werden.

13.2 Erstes Dokument hochladen

Pfad im Admin:

/admin/documents/new

Beim Upload passiert im aktuellen Code folgendes:

Datei wird nach var/knowledge/uploads verschoben.
Dokument und Version 1 werden in der DB angelegt.
Die neue Version wird aktiv gesetzt.
Ein Ingest-Job vom Typ DOCUMENT_VERSION_ACTIVATE wird erstellt.
Der Job wird asynchron per exec() gestartet.

13.3 Wenn `exec()` deaktiviert ist

Der Admin-Flow für Upload, Aktivierung und Löschen setzt im aktuellen Code Hintergrundstarts über exec() voraus.

Ist exec() serverseitig deaktiviert, werden Jobs zwar angelegt, aber nicht automatisch ausgeführt. In diesem Fall muss der Job manuell gestartet werden:

php bin/console mto:agent:ingest:run <jobId>

Die jobId ist in der Job-Ansicht im Admin nachvollziehbar.

14. Rebuild und Konsistenzprüfung

14.1 Vollständiger System-Rebuild

Sobald aktive Dokumente vorhanden sind, kann ein vollständiger Rebuild ausgeführt werden:

php bin/console mto:agent:system:rebuild --hard

Dieser Ablauf umfasst aktuell:

globalen Reindex der aktiven Dokumente
Tag-Export und Tag-Index-Rebuild
Reload des Vector Service
Health-Checks

Wichtig: Der Befehl bricht absichtlich ab, wenn keine aktiven Dokumente vorhanden sind.

14.2 Vector Health prüfen

php bin/console mto:agent:vector:health

Mögliche gesunde Zustände:

OK_EMPTY → noch keine Wissensdaten vorhanden
OK → NDJSON und FAISS konsistent

14.3 Tag Health prüfen

php bin/console mto:agent:tag:health

15. Wichtige Commands im aktuellen Stand

php bin/console mto:agent:user:create
php bin/console mto:agent:vector:control --install
php bin/console mto:agent:vector:control --start
php bin/console mto:agent:vector:control --status
php bin/console mto:agent:vector:control --reload
php bin/console mto:agent:vector:rebuild
php bin/console mto:agent:vector:health
php bin/console mto:agent:ingest:run <jobId>
php bin/console mto:agent:ingest:version <versionId> <userId>
php bin/console mto:agent:system:rebuild --hard
php bin/console mto:agent:tags:export
php bin/console mto:agent:tags:rebuild
php bin/console mto:agent:tag:health
php bin/console mto:agent:chat
php bin/console mto:agent:test:shop-search "deine Anfrage"

16. Minimaler Go-Live-Check

Eine Installation ist im aktuellen Stand erst dann wirklich lauffähig, wenn alle folgenden Punkte erfüllt sind:

Composer-Abhängigkeiten installiert
Datenbankmigrationen erfolgreich durchgelaufen
.env.local korrekt gesetzt
.venv vorhanden und Python-Abhängigkeiten installiert
Vector Service läuft auf Port 8090
Admin-Benutzer existiert
aktiver System Prompt vorhanden
aktive ModelGenerationConfig vorhanden
mindestens ein PDF erfolgreich ingestiert
mto:agent:vector:health liefert OK oder OK_EMPTY
Chat-Frontend und Admin-Login sind erreichbar

17. Häufige Fehlerbilder

17.1 `No active system prompt configured.`

Ursache: Es existiert kein aktiver System Prompt.

Lösung: Im Admin unter /admin/system/prompt eine Version speichern und aktivieren.

17.2 `No active ModelGenerationConfig found.`

Ursache: Es existiert keine aktive Modellkonfiguration.

Lösung: Im Admin unter /admin/model-config/ eine Konfiguration anlegen und aktivieren.

17.3 Vector Service startet nicht

Typische Ursachen:

.venv fehlt
Python-Pakete fehlen
Port 8090 ist schon belegt
uvicorn ist nicht in der virtuellen Umgebung installiert

Prüfen:

php bin/console mto:agent:vector:control --status

17.4 Rebuild bricht mit „no active documents found“ ab

Ursache: Es wurde noch kein aktives Dokument erfolgreich angelegt.

Lösung: Zuerst ein PDF hochladen und ingestieren, danach den Rebuild erneut starten.

17.5 Upload klappt, Ingest startet aber nicht

Ursache: exec() ist auf dem Server deaktiviert.

Lösung: Job manuell mit mto:agent:ingest:run <jobId> starten oder Serverkonfiguration anpassen.

17.6 Dokument-Ingest schlägt bei Nicht-PDF fehl

Ursache: Der aktuelle Code enthält nur einen PdfExtractor.

Lösung: Für den aktuellen Stand ausschließlich PDFs ingestieren oder Extractor-Layer erweitern.

18. Empfohlene Produktionshinweise

Für stabilen produktiven Betrieb sind sinnvoll:

Nginx oder Apache vor Symfony/PHP-FPM
eigener Service-Start für den Python-Vector-Service
eigener Service für Ollama
Backup von Datenbank und var/knowledge/
Monitoring der Logs unter var/log/
bewusstes Governance-Handling für Ingest-Profile, System Prompts und Model-Konfigurationen

19. Ergebnis

Nach erfolgreicher Installation bietet der aktuelle Stand von RetrieX:

dokumentenbasierte Wissensverwaltung
versionierte Dokumente
asynchronen Ingest über Jobs
NDJSON als Wissensspeicher
FAISS-basiertes Retrieval
optionales Tag-Routing
optionalen Shopware-Commerce-Pfad
browserbasierten SSE-Chat
Symfony-Adminoberfläche für Betrieb und Governance

15 KiB Raw Blame History Unescape Escape

RetrieX – Installationsanleitung

1. Architektur des aktuellen Stands

2. Wichtige Korrekturen gegenüber älteren Installationsständen

3. Systemvoraussetzungen

3.1 Betriebssystem

3.2 PHP

3.3 Composer

3.4 Datenbank

3.5 Python

3.6 Ollama oder kompatibler Generate-Endpunkt

3.7 Optional: Shopware Store API

4. Projekt bereitstellen

5. PHP-Abhängigkeiten installieren

6. Umgebung konfigurieren

6.1 Grundregel

6.2 Minimale .env.local

6.3 Shopware deaktivieren, wenn nicht benötigt

7. Datenbank initialisieren

8. Python-Umgebung aufbauen

8.1 Virtuelle Umgebung anlegen

8.2 Python-Abhängigkeiten installieren

9. Vector Service starten

10. Admin-Benutzer anlegen

11. Anwendung starten

12. Pflicht-Initialisierung im Admin

12.1 System Prompt anlegen und aktivieren

12.2 ModelGenerationConfig anlegen und aktivieren

12.3 Optional: Ingest-Profil anlegen

13. Erste Dokumente ingestieren

13.1 Wichtiger Format-Hinweis

13.2 Erstes Dokument hochladen

13.3 Wenn exec() deaktiviert ist

14. Rebuild und Konsistenzprüfung

14.1 Vollständiger System-Rebuild

14.2 Vector Health prüfen

14.3 Tag Health prüfen

15. Wichtige Commands im aktuellen Stand

16. Minimaler Go-Live-Check

17. Häufige Fehlerbilder

17.1 No active system prompt configured.

17.2 No active ModelGenerationConfig found.

17.3 Vector Service startet nicht

17.4 Rebuild bricht mit „no active documents found“ ab

17.5 Upload klappt, Ingest startet aber nicht

17.6 Dokument-Ingest schlägt bei Nicht-PDF fehl

18. Empfohlene Produktionshinweise

19. Ergebnis

15 KiB

Raw Blame History

6.2 Minimale `.env.local`

13.3 Wenn `exec()` deaktiviert ist

17.1 `No active system prompt configured.`

17.2 `No active ModelGenerationConfig found.`