Ein KI RAG-System mit SQL-, Vektor- und Graph-Datenbank

KI-
Gemeinschaft

Ein professionelles KI-RAG-System für kleine und mittelständische Unternehmen zur Verarbeitung von Millionen Dokumenten, Emails, Support-Tickets und Informationen

Karl Kratz

Ein RAG-System (Retrieval-Augmented Generation) mit SQL, Vektor und Graph-Datenbank

Dieses Dokument beschreibt den Aufbau eines Systems, das Wissen aus Dokumenten aufnimmt, strukturiert, durchsuchbar macht und auf Basis dieses Wissens Fragen beantwortet. Das System skaliert von wenigen Texten bis zu Millionen Dokumenten und erzeugt dabei zum Beispiel Zusammenhänge, die in den einzelnen Dokumenten nicht sichtbar sind.

Das System kombiniert drei Datenbank-Typen (relational, vektoriell, graphbasiert), ein lokales Sprachmodell, automatische Entitätserkennung und eine hybride Suchstrategie. Es läuft vollständig auf einem eigenen Server, ohne externe Cloud-Dienste.

DokumentTitel + Text
Chunkingabsatzbasiert
Embeddingpassage: 1024-dim
MariaDBDocs, Chunks, Entitäten
SpaCy NERPER/ORG/LOC
ArangoDBKnoten + Kanten
LLM Relationenqwen3:8b
QdrantVektoren

Pro-Tipp: Der eine oder andere könnte auf die Idee kommen, einfach die ganze Seite herunterzuladen und es via Claude Code a) nachbauen zu lassen und b) für die eigenen Bedürfnisse anpassen zu lassen. ;-)

Viel Spaß beim Lesen und liebe Grüße, Karl

Inhaltsverzeichnis

Problemraum und Zielbild

Lokales Sprachmodell

Grundlagen der Suche

Datenarchitektur

Die Ingest-Pipeline

Dokumente verwalten

Erster RAG

Suche verbessern

HTTP-Schnittstelle und Sicherheit

Knowledge Graph

Produktivsystem

Referenz und Evaluation

Code-Referenz

Evaluation

Zugang eingeschränkt

Dieser Inhalt ist exklusiv für Mitglieder der KI-Gemeinschaft.

Zur KI-Gemeinschaft