Die Architektur kombiniert bewährte RAG-Infrastruktur mit einem gepflegten Wissensgraphen und einem kuratierten Wiki-Layer. RAG beantwortet Fragen aus aktuellen Quellen. Der Graph zeigt Beziehungen. Das Wiki hält verdichtetes, geprüftes Wissen dauerhaft fest. Zusammen entsteht ein System, das nicht nur abfragt, sondern lernt.
1. Quellen- und Connector-Schicht
Das System startet mit den Orten, an denen Wissen bereits entsteht: Dokumentenablagen, CRM, ERP, Ticketsystem, E-Mail-Archive, Projektordner, Transkripte, Datenbanken und agentische Arbeitsprotokolle. Jede Quelle bekommt Metadaten: Eigentümer, Abteilung, Vertraulichkeit, Aktualitätsdatum, Gültigkeitsbereich und Zugriffsrechte. Dadurch wird später nicht nur gefragt „Was passt semantisch?“, sondern auch „Darf diese Person diese Quelle sehen?“ und „Ist diese Information noch frisch?“.
2. Ingestion und Normalisierung
Dokumente werden extrahiert, versioniert, bereinigt und in fachliche Abschnitte zerlegt. Strukturierte Daten behalten ihre Tabellen- und Entitätslogik. Unstrukturierte Quellen erhalten semantische Chunks, Zusammenfassungen und Quellenanker. Jede Verarbeitung schreibt Provenance mit: Originalquelle, Hash, Datum, Parser-Version und verantwortliche Pipeline.
3. Hybrid Retrieval
Die Suchschicht kombiniert klassische Volltextsuche, Vektorsuche und Re-Ranking. Exakte Begriffe wie Kundennamen, Vertragsklauseln oder Produktcodes müssen zuverlässig gefunden werden. Semantische Suche findet ähnliche Konzepte. Re-Ranking priorisiert die wirklich hilfreichen Treffer. Für kleinere Systeme reicht oft PostgreSQL mit pgvector. Für größere oder spezialisierte Retrieval-Szenarien eignen sich Qdrant, Weaviate, Pinecone oder vergleichbare Vektordatenbanken.
4. Wissensgraph und LLM-Wiki
Der entscheidende Unterschied zum normalen RAG-System liegt hier. Wichtige Entitäten, Konzepte, Projekte, Kunden, Prozesse und Entscheidungen werden in einem Graphen verknüpft. Zusätzlich pflegt ein LLM Wiki-Seiten, die Quellen zusammenfassen, Widersprüche markieren und Analysen dauerhaft speichern. Gute Antworten fließen zurück in das System. Das Company Brain baut dadurch über Zeit Substanz auf.
5. Agenten- und Anwendungsschicht
Das Company Brain wird über konkrete Arbeitsflächen nutzbar: Suchassistent, Angebotsassistent, Onboarding-Assistent, Entscheidungs-Copilot, Projektgedächtnis, Sales-Research, Support-Antworten oder Company-OS-Dashboards. Agenten greifen nicht frei auf alles zu, sondern über berechtigte Tools, geprüfte Retrieval-APIs und klare Schreibregeln.
6. Governance, Evaluation und Pflege
Ein Company Brain braucht Wartung. Das System prüft tote Links, veraltete Quellen, widersprüchliche Aussagen, doppelte Entitäten, fehlende Besitzer und schwache Antwortqualität. Regelmäßige Evaluationssets testen, ob Antworten korrekt, vollständig und ausreichend belegt sind. So bleibt das Gehirn lebendig, ohne dass Menschen manuell Wiki-Gärtner spielen müssen.