Optimiertes Agentic RAG-System

Heute befassen wir uns erneut mit dem RAG-System – einer Methode, die KI-Agenten direkten Zugriff auf Deine Dokumente und Datenbanken ermöglicht und sie zu Experten für Deine Wissensbasis macht.
Was ist RAG?
RAG (Retrieval Augmented Generation) kombiniert die Stärken von Vektorensuche und Textgenerierung, um relevante Informationen aus Deiner Wissensbasis abzurufen und in Antworten einzubinden. Dadurch wird die KI in die Lage versetzt, komplexe Fragestellungen zu bearbeiten und präzise Ergebnisse zu liefern.
Herausforderungen des klassischen RAG
- Unvollständiger Kontext: Oft werden nur Teile der nötigen Informationen abgerufen – insbesondere bei komplexen Tabellen oder umfangreichen Dokumenten.
- Fehlzuordnung von Dokumenten: Beispielsweise kann es vorkommen, dass bei der Zusammenfassung einer Besprechung Notizen eines falschen Termins berücksichtigt werden, obwohl das Datum im Titel klar ersichtlich ist.
- Mangelnder Zusammenhang: RAG fokussiert sich zu stark auf einzelne Dokumente und verpasst dabei den übergeordneten Kontext, der für fundierte Analysen oft unverzichtbar ist.
Die Lösung: Agentic RAG
Agentic RAG erweitert das klassische Konzept um zusätzliche Werkzeuge, die es der KI ermöglichen, ihre Wissensbasis gezielt zu durchsuchen und den Kontext besser zu erfassen:
- Verfeinerte Lookups: Falls der erste Abruf nicht ausreichend ist, kann die KI den Suchvorgang anpassen und erneut versuchen, die relevanten Informationen zu finden.
- Dokumentenauflistung und -auswahl: Die KI kann eine Übersicht aller verfügbaren Dokumente erstellen und anhand von Titeln oder Datumsangaben gezielt das passende Dokument auswählen.
- SQL-Abfragen für Tabellendaten: Besonders bei tabellarischen Daten ermöglichen individuelle SQL-Queries präzise Auswertungen, zum Beispiel zur Ermittlung des Monats mit dem höchsten Umsatz.

So funktioniert das System
- RAG-Pipeline:
- Inhaltsextraktion: Je nach Dateityp (CSV, PDF, Google Doc etc.) wird der Inhalt unterschiedlich verarbeitet. Bei Tabellen erfolgt zusätzlich die Speicherung in einer Datenbank, sodass sowohl Textanalysen als auch SQL-Abfragen möglich sind.
- Chunking und Embedding: Der Text wird in kleinere Abschnitte unterteilt und mittels eines Embedding-Modells in einen Vektorraum übertragen, was eine präzise Suche ermöglicht.
- KI-Agent:
- Multi-Tool-Ansatz: Der Agent startet mit einem klassischen RAG-Lookup. Scheitert dieser, nutzt er alternative Werkzeuge, wie das Auflisten von Dokumenten oder das Abrufen vollständiger Datei-Inhalte.
- SQL-Abfragen: Bei tabellarischen Daten werden spezifische SQL-Queries erstellt, um z. B. den Monat mit den meisten neuen Kunden zu ermitteln.
- Fehlertransparenz: Wird keine passende Antwort gefunden, informiert die KI den Nutzer offen – anstatt ungenaue Ergebnisse zu liefern.
Import und Vorbereitung: Dateien aus Quellen wie OneDrive/Google Drive oder lokale Ordner werden regelmäßig erfasst. Vor einem Update werden alte Daten entfernt, um eine saubere Basis zu schaffen.
Fazit
Das optimierte, agentische RAG-System kombiniert klassische Vektorensuche mit zusätzlichen Werkzeugen, um den gesamten Kontext Deiner Wissensbasis umfassend zu nutzen. Probleme wie fehlender Kontext, falsche Dokumentenauswahl und unzureichende Analyse von Tabellen werden so effektiv umgangen. Mit diesem Ansatz wird die KI zu einem zuverlässigen Partner, der präzise und fundiert auf Deine Fragen eingeht.