# Datenfluss im aiStudio

Die folgende Grafik bietet eine detaillierte Übersicht über die Datenverarbeitung innerhalb des aiStudios, wobei besonderes Augenmerk auf den Weg der Informationen von der Quelle bis zur Ausgabe gelegt wird. Der Prozess beginnt mit einer umfassenden Datenbasis, die Websiteinhalte, Dokumente und Themenkatalogeinträge umfasst. Diese Daten werden in aiStudio hochgeladen oder durch Webcrawling erfasst. Anschließend werden die Daten durch den Embedder vektorisiert, um sie für die weitere Verarbeitung vorzubereiten.

Die vektorisierten Daten werden in einer Vektordatenbank gespeichert, die als Grundlage für die Suche und den Abruf von relevanten Inhalten dient. Wenn ein Nutzer über den Chat eine Frage oder einen Input gibt, wird dieser an das Backend weitergeleitet. Das Backend nutzt die Vektordatenbank, um passende Textabschnitte (Chunks) zu finden und abzurufen. Diese Chunks werden zusammen mit dem ursprünglichen Prompt an die LLMs (Large Language Models) gesendet, die für die Generierung der Antwort verantwortlich sind.

Die generierte Antwort wird dem Nutzer im Chat angezeigt. Zusätzlich werden die Konversationsdaten in einer separaten Konversationsdatenbank gespeichert, um den Verlauf der Interaktionen zu dokumentieren und für zukünftige Verbesserungen zu nutzen. Das System ist DSGVO-konform und wird in der EU gehostet.