Das Problem
Ein etabliertes Beratungsunternehmen mit über 15 Jahren Geschichte stand vor einem klassischen Wissensproblem: Jahrzehnte an Projekterfahrung, Methodenwissen und Kundeninsights waren in E-Mail-Silos, Dateiservern und den Köpfen einzelner Beratender gefangen. Neue Mitarbeitende brauchten Monate, um sich einzuarbeiten. Erfahrene Beratende verbrachten Stunden damit, alte Projektunterlagen zu suchen.
Die vorhandene Suchfunktion im Dateiserver lieferte nur Treffer auf Dateinamen — nicht auf Inhalte. Wer nicht wusste, wo ein Dokument liegt, fand es nicht. Gleichzeitig hatte das Unternehmen strenge Datenschutzanforderungen: Kundendaten durften die eigene Infrastruktur nicht verlassen.
Unser Ansatz
Blueprint-Phase: Wissenslandkarte
Wir kartierten die vorhandenen Wissensquellen: E-Mail-Archive (Exchange), Dateiserver (SMB-Shares), ein Wiki (Confluence) und persönliche Notizen in OneNote. Für jede Quelle definierten wir Konnektoren und Indexierungsstrategien.
Brain-Phase: RAG-Architektur
Die zentrale Designentscheidung: Vollständig on-premise. Kein Cloud-LLM, keine externen APIs. Wir wählten ein Open-Source-Sprachmodell, das auf unternehmenseigener Hardware läuft. Die Vektordatenbank (pgvector) wurde in die bestehende PostgreSQL-Infrastruktur integriert.
Hands-Phase: Schrittweise Indexierung
Die Indexierung erfolgte quellenweise. Jede neue Datenquelle wurde separat angebunden, getestet und validiert, bevor die nächste hinzukam. So konnten wir die Retrievalqualität pro Quelle optimieren.
Architektur
Dokumenten-Konnektoren
Spezialisierte Konnektoren für jede Datenquelle: Exchange-Connector für E-Mails und Anhänge, SMB-Connector für Dateiserver-Dokumente, Confluence-API-Connector für Wiki-Seiten. Jeder Konnektor extrahiert Text, Metadaten und Beziehungen.
Vektordatenbank
PostgreSQL mit pgvector-Extension speichert Embedding-Vektoren direkt neben den Quelldokumenten. Hybrid-Suche kombiniert semantische Ähnlichkeit mit Keyword-Matching für optimale Ergebnisse.
RAG-Pipeline
Nutzeranfragen werden in Echtzeit verarbeitet: Embedding-Generierung, Vektorsuche, Re-Ranking der Ergebnisse und Antwortgenerierung mit Quellenangaben. Das Sprachmodell sieht nur die relevanten Dokumentausschnitte — nie die gesamte Wissensbasis.
Zugriffssteuerung
Das System respektiert bestehende Berechtigungen: Nutzer sehen nur Dokumente, auf die sie auch im Quellsystem Zugriff haben. Die Berechtigungsprüfung erfolgt bei jeder Anfrage in Echtzeit.
Ergebnisse
- Zugriff in unter 1 Sekunde — 15 Jahre Firmenwissen sofort durchsuchbar
- Vollständig on-premise — keine Daten verlassen die Unternehmensinfrastruktur
- DSGVO-konform — Open-Source-Modell ohne externe API-Aufrufe
- Quellenangaben — jede Antwort verweist auf die Originaldokumente
- Bestehende Berechtigungen — Zugriffsrechte werden automatisch respektiert
- Schnelleres Onboarding — neue Berater finden relevantes Wissen vom ersten Tag an
Ähnliche Herausforderung?
Ihr Unternehmenswissen ist in Silos verstreut oder Sie brauchen eine DSGVO-konforme Wissenslösung? Wir bauen RAG-Systeme auf Ihrer eigenen Infrastruktur. Sprechen Sie mit uns oder erfahren Sie mehr über unsere Daten-Infrastruktur.

