RAG-Lookup

RAG-Lookup ist die Suche nach relevanten Dokumenten in einer Vektordatenbank.

RAG-Lookup bezeichnet den Retrieval-Schritt innerhalb eines RAG-Systems (Retrieval-Augmented Generation). Dabei wird die Eingabe des Nutzers verwendet, um relevante Dokumente oder Textpassagen aus einer Wissensbasis zu finden, bevor das Sprachmodell eine Antwort generiert.

Der typische Ablauf beginnt mit der Umwandlung der Nutzeranfrage in einen Embedding-Vektor. Dieser Vektor wird mit den zuvor berechneten Embeddings der gespeicherten Dokumente verglichen, meist über eine Vektordatenbank wie Pinecone, Weaviate oder ChromaDB. Die ähnlichsten Dokumente werden zurückgegeben - typischerweise die Top-k-Ergebnisse basierend auf Kosinus-Ähnlichkeit oder einem vergleichbaren Distanzmaß.

Die Qualität des Lookups bestimmt maßgeblich die Qualität der Gesamtantwort. Findet der Lookup die falschen Dokumente, generiert das Sprachmodell eine Antwort auf falscher Grundlage. Einflussfaktoren sind das verwendete Embedding-Modell, die Chunk-Größe der Dokumente, die Indexierungsstrategie und eventuelle Vorfilterung durch Metadaten.

Fortgeschrittene Ansätze kombinieren semantische Suche mit Keyword-Suche (Hybrid Search) oder verwenden einen Reranker, der die Ergebnisse des initialen Lookups nachsortiert.


Karl Kratz · 14.11.2025 (aktualisiert 15.03.2026)

Technologie Künstliche Intelligenz Rag