Wissen
Transparenz ist für uns bei Intric zentral. Wenn du ein Dokument in Wissen hochlädst, sorgen spezifische Prozesse für deine Privatsphäre und Datensouveränität in der gesamten Kette — vom Datei-Upload bis zu einem durchsuchbaren Wissensindex.
Der Prozess vom Datei-Upload bis zu einem indizierten, durchsuchbaren Dokument erfolgt durch eine sichere Interaktion zwischen der Intric-Plattform (wo deine Daten verarbeitet und gespeichert werden) und dem Embedding-Modell, das du ausgewählt hast (z. B. Berget oder OpenAI).
Schritt für Schritt: So werden deine Daten verarbeitet
Alle Übertragungen zwischen Intric und seinen Unterauftragsverarbeitern erfolgen über sichere, verschlüsselte Verbindungen.
Schritt 1 — Nutzer lädt eine Datei in Intric hoch
Der Nutzer lädt ein Dokument (z. B. PDF, DOCX oder Textdatei) über die Weboberfläche oder API von Intric hoch.
Daten, die an Intrics Server gesendet werden:
- Der vollständige binäre Inhalt der Datei
- Dateiname und Metadaten (Größe, Dateityp)
Die Datei wird über eine verschlüsselte Verbindung (HTTPS) an die Server von Intric übertragen. In diesem Schritt werden keine Daten an externe Dienste weitergeleitet.
Schritt 2 — Intric verarbeitet und speichert das Dokument
Intric extrahiert den Textinhalt aus der Datei, speichert das Original sicher und bereitet den Inhalt für die Indexierung vor. Die gesamte Verarbeitung in diesem Schritt erfolgt intern auf Intrics Servern.
Was passiert:
- Textinhalt wird aus dem Dokument extrahiert (PDF, DOCX usw.)
- Die rohe Originaldatei wird in Intrics Objektspeicher (S3) in Schweden gespeichert
- Extrahierter Text, Metadaten und Seitenstruktur werden in Intrics Datenbank (PostgreSQL) gespeichert
- Der Text wird in kleinere Segmente (Chunks) aufgeteilt, um semantische Suche zu ermöglichen
In diesem Schritt verlässt nichts den Intric-Server — alle Verarbeitung und Speicherung erfolgt intern auf der Plattform.
Schritt 3 — Intric sendet Textinhalt an das Embedding-Modell
In diesem Schritt wird der Textinhalt jedes Chunks an das konfigurierte Embedding-Modell gesendet, um in durchsuchbare Vektoren umgewandelt zu werden.
Daten, die von Intrics Server gesendet werden:
- Der Textinhalt jedes Chunks (tatsächlicher Dokumententext — keine Hashes oder anonymisierten Daten)
Was beim Embedding-Modell passiert: Ein numerischer Vektor (eine Liste von Gleitkommazahlen) wird ausschließlich auf Basis des bereitgestellten Textes generiert. Das Embedding-Modell hat keinerlei Kontext über die Identität des Nutzers oder der Organisation.
Schritt 4 — Antwort an Intric
Die Antwort des Embedding-Modells (die Vektoren für jeden Chunk) wird an Intrics Server gesendet, der die Informationen verschlüsselt in seiner Datenbank empfängt und speichert.
Daten, die vom Embedding-Modell an Intric gesendet werden:
- Die numerischen Vektoren für jeden Text-Chunk (für die semantische Suche)
Unmittelbar nachdem das Ergebnis an Intric zurückgesendet wurde, werden sowohl die Eingabe des Nutzers als auch der generierte Output vom Server des Embedding-Modells gelöscht.
Schritt 5 — Nutzer kann die Datei in Wissen verwenden
Das Dokument wird durchsuchbar und kann in deinen Wissenssammlungen in Intric verwendet werden.
Daten, die auf Intrics Servern gespeichert werden:
- Extrahierter Volltext und Seitenstruktur
- Text-Chunks mit zugehörigen Embedding-Vektoren
- Datei-Metadaten (Name, Größe, Dateityp, Zeitstempel)
Die Embedding-Vektoren werden zusammen mit dem ursprünglichen Chunk-Text in Intrics Datenbank in Schweden gespeichert, gehostet von einem schwedischen Unterauftragsverarbeiter.
Datenaustausch und Privatsphäre
Zum Schutz deiner und der Privatsphäre deiner Organisation wenden wir das Prinzip der Datenminimierung an. Das bedeutet, der Unterauftragsverarbeiter erhält nur Zugriff auf den Inhalt, der für die Aufgabenerfüllung absolut notwendig ist — keine Benutzeridentität verlässt je deine Infrastruktur.
Wir haben in allen Verträgen mit Sprachmodell-Unterauftragsverarbeitern strenge Klauseln zur Null-Datenspeicherung. Das garantiert, dass an das Embedding-Modell gesendete Inhalte nach der Rückgabe der Vektoren nie vom Anbieter gespeichert werden und die Informationen nicht zum Training ihrer AI-Modelle verwendet werden.
In der folgenden Tabelle siehst du genau, welche Daten an den Unterauftragsverarbeiter gesendet werden und was Intrics Server nicht verlässt.
| An das Embedding-Modell gesendet | Nicht an das Embedding-Modell gesendet |
|---|---|
|
|
Datenspeicherung und -löschung
Die gesamte Dateispeicherung und Indexierung erfolgt auf der Infrastruktur von Intric in Schweden — kein externer Dienst speichert deine Dokumente, extrahierten Texte oder Vektoren.
Wenn ein Dokument aus Wissen gelöscht wird, werden alle Teile entfernt — die Originaldatei, extrahierter Text, Chunks und Vektoren. Im Audit-Log können Administratoren sehen, wann Dokumente hochgeladen und gelöscht wurden und von wem.