RAG-Wissensdatenbank: 15 Jahre Firmenhistorie in Sekunden

RAG-System auf eigenen Servern macht 15 Jahre Firmenwissen in unter einer Sekunde durchsuchbar. DSGVO-konform.

PythonLangChainPostgreSQL + pgvectorFastAPIDocker

RAG-Wissensdatenbank: 15 Jahre Firmenhistorie in Sekunden – Projektvorschau

Case Study

Das Problem

Ein etabliertes Beratungsunternehmen mit über 15 Jahren Geschichte stand vor einem klassischen Wissensproblem: Jahrzehnte an Projekterfahrung, Methodenwissen und Kundeninsights waren in E-Mail-Silos, Dateiservern und den Köpfen einzelner Beratender gefangen. Neue Mitarbeitende brauchten Monate, um sich einzuarbeiten. Erfahrene Beratende verbrachten Stunden damit, alte Projektunterlagen zu suchen.

Die vorhandene Suchfunktion im Dateiserver lieferte nur Treffer auf Dateinamen — nicht auf Inhalte. Wer nicht wusste, wo ein Dokument liegt, fand es nicht. Gleichzeitig hatte das Unternehmen strenge Datenschutzanforderungen: Kundendaten durften die eigene Infrastruktur nicht verlassen.

Unser Ansatz

Blueprint-Phase: Wissenslandkarte

Wir kartierten die vorhandenen Wissensquellen: E-Mail-Archive (Exchange), Dateiserver (SMB-Shares), ein Wiki (Confluence) und persönliche Notizen in OneNote. Für jede Quelle definierten wir Konnektoren und Indexierungsstrategien.

Brain-Phase: RAG-Architektur

Die zentrale Designentscheidung: Vollständig on-premise. Kein Cloud-LLM, keine externen APIs. Wir wählten ein Open-Source-Sprachmodell, das auf unternehmenseigener Hardware läuft. Die Vektordatenbank (pgvector) wurde in die bestehende PostgreSQL-Infrastruktur integriert.

Hands-Phase: Schrittweise Indexierung

Die Indexierung erfolgte quellenweise. Jede neue Datenquelle wurde separat angebunden, getestet und validiert, bevor die nächste hinzukam. So konnten wir die Retrievalqualität pro Quelle optimieren.

Architektur

Dokumenten-Konnektoren

Spezialisierte Konnektoren für jede Datenquelle: Exchange-Connector für E-Mails und Anhänge, SMB-Connector für Dateiserver-Dokumente, Confluence-API-Connector für Wiki-Seiten. Jeder Konnektor extrahiert Text, Metadaten und Beziehungen.

Vektordatenbank

PostgreSQL mit pgvector-Extension speichert Embedding-Vektoren direkt neben den Quelldokumenten. Hybrid-Suche kombiniert semantische Ähnlichkeit mit Keyword-Matching für optimale Ergebnisse.

RAG-Pipeline

Nutzeranfragen werden in Echtzeit verarbeitet: Embedding-Generierung, Vektorsuche, Re-Ranking der Ergebnisse und Antwortgenerierung mit Quellenangaben. Das Sprachmodell sieht nur die relevanten Dokumentausschnitte — nie die gesamte Wissensbasis.

Zugriffssteuerung

Das System respektiert bestehende Berechtigungen: Nutzer sehen nur Dokumente, auf die sie auch im Quellsystem Zugriff haben. Die Berechtigungsprüfung erfolgt bei jeder Anfrage in Echtzeit.

Ergebnisse

Zugriff in unter 1 Sekunde — 15 Jahre Firmenwissen sofort durchsuchbar
Vollständig on-premise — keine Daten verlassen die Unternehmensinfrastruktur
DSGVO-konform — Open-Source-Modell ohne externe API-Aufrufe
Quellenangaben — jede Antwort verweist auf die Originaldokumente
Bestehende Berechtigungen — Zugriffsrechte werden automatisch respektiert
Schnelleres Onboarding — neue Berater finden relevantes Wissen vom ersten Tag an

Ähnliche Herausforderung?

Ihr Unternehmenswissen ist in Silos verstreut oder Sie brauchen eine DSGVO-konforme Wissenslösung? Wir bauen RAG-Systeme auf Ihrer eigenen Infrastruktur. Sprechen Sie mit uns oder erfahren Sie mehr über unsere Daten-Infrastruktur.

Ergebnis

Zugriff auf 15 Jahre Firmenhistorie in <1 Sekunde, vollständig on-premise

Ende der Case Study

Lass uns sprechen

Interesse an einem ähnlichen Projekt?.

Jamin Mahmood-Wiebe

Managing Director

LinkedIn WhatsApp

Termin buchen

WhatsAppSchnell & direkt