KI & Automation
Was ist Retrieval?
Retrieval ist der Schritt bei RAG, in dem relevante Dokumente aus einer Datenbank geholt werden, bevor die KI antwortet. Die Qualität des Retrievals bestimmt die Antwortqualität.
Retrieval ist der erste aktive Schritt in einem RAG-System (Retrieval-Augmented Generation). Bevor die KI antwortet, holt das System die relevantesten Dokumente oder Textstücke aus einer Wissensdatenbank. Diese werden dann zusammen mit der Frage an das Sprachmodell übergeben.
Der Name sagt es: Retrieval bedeutet Abrufen, Wiederfinden. Das System sucht nicht nach dem exakt passenden Dokument, sondern nach dem inhaltlich relevantesten.
Wie Retrieval technisch funktioniert
Die Suchanfrage wird in einen Vektor umgewandelt. Dieser Vektor wird mit allen gespeicherten Vektoren in der Wissensdatenbank verglichen. Die ähnlichsten Einträge werden zurückgegeben, typischerweise die Top-3 bis Top-10.
Die Ähnlichkeitsmessung erfolgt über Metriken wie Cosine-Similarity oder Dot-Product. Cosine-Similarity misst den Winkel zwischen zwei Vektoren und ist unabhängig von deren Länge, was sie für Text-Embeddings ideal macht.
Warum Retrieval-Qualität alles ist
Ein gutes Sprachmodell mit schlechtem Retrieval liefert schlechte Ergebnisse. Die KI kann nur antworten, was sie als Kontext bekommt. Wenn das Retrieval die falschen Dokumente zurückgibt, arbeitet das Modell mit falschen Grundlagen.
Das Retrieval verbessern bedeutet: Chunk-Größe optimieren, bessere Embeddings verwenden, Hybrid-Retrieval einsetzen (Kombination aus semantischer und Keyword-Suche), Reranking-Modelle nachschalten, die die ersten Ergebnisse nochmals nach Relevanz sortieren.
Reranking ist ein oft unterschätzter Schritt. Ein einfaches Cross-Encoder-Modell, das die Top-10-Retrieval-Ergebnisse nochmals bewertet und sortiert, kann die Antwortqualität messbar verbessern, ohne das Hauptmodell zu verändern.
In unseren RAG-Projekten messen wir Retrieval-Qualität mit einem separaten Evaluation-Set aus bekannten Fragen und erwarteten Dokumenten. Die Rate, mit der das richtige Dokument in den Top-3-Ergebnissen landet, ist unser Hauptmetrik. Mehr unter KI-Implementierung. Jetzt Termin buchen.
Lass uns herausfinden, was bei dir möglich ist.
Kostenlos, unverbindlich, ohne Verkaufsdruck. Wir schauen uns gemeinsam an, wo du stehst, was dich bremst und was die nächsten sinnvollen Schritte wären.