Kunskap
Transparens är centralt för oss på Intric. När du laddar upp ett dokument till Knowledge finns specifika processer för att säkerställa din integritet och datasuveränitet genom hela kedjan — från filuppladdning till sökbart kunskapsindex.
Processen från din filuppladdning till ett indexerat, sökbart dokument sker genom en säker interaktion mellan Intrics plattform (där din data bearbetas och lagras) och den embedding-modell du valt (t.ex. Berget eller OpenAI).
Steg-för-steg: Så hanteras din data
All överföring mellan Intric och dess underbiträden sker över säkra och krypterade anslutningar.
Steg 1 — Användaren laddar upp en fil till Intric
Användaren laddar upp ett dokument (t.ex. en PDF, DOCX eller textfil) via Intrics webbgränssnitt eller API.
Data som skickas till Intrics server:
- Filens fullständiga binära innehåll
- Filnamn och metadata (storlek, filtyp)
Filen överförs över en krypterad anslutning (HTTPS) till Intrics servrar. Ingen data skickas vidare till externa tjänster i detta steg.
Steg 2 — Intric bearbetar och lagrar dokumentet
Intric extraherar textinnehållet ur filen, lagrar originalet säkert och förbereder innehållet för indexering. I detta steg sker all bearbetning internt på Intrics servrar.
Vad som händer:
- Textinnehåll extraheras ur dokumentet (PDF, DOCX, etc.)
- Den råa originalfilen lagras i Intrics objektlagring (S3) i Sverige
- Extraherad text, metadata och sidstruktur sparas i Intrics databas (PostgreSQL)
- Texten delas upp i mindre segment (chunks) för att möjliggöra semantisk sökning
Inget lämnar Intrics server i det här steget — all bearbetning och lagring sker internt på plattformen.
Steg 3 — Intric skickar textinnehåll till embedding-modellen
I detta steg skickas textinnehållet från varje chunk till den konfigurerade embedding-modellen för att omvandlas till sökbara vektorer.
Data som skickas från Intrics server:
- Textinnehållet i varje chunk (faktisk dokumenttext — inte hashar eller anonymiserad data)
Vad som händer hos embedding-modellen: En numerisk vektor (en lista med flyttal) genereras utifrån enbart den text som tillhandahållits. Embedding-modellen har noll kontext om användarens eller organisationens identitet.
Steg 4 — Svar till Intric
Embedding-modellens svar (vektorerna för varje chunk) skickas till Intrics server som tar emot och lagrar informationen krypterat i sin databas.
Data som skickas från embedding-modellen till Intric:
- De numeriska vektorerna för varje textchunk (för semantisk sökning)
Omedelbart efter att resultatet skickats tillbaka till Intric raderas både användarens input och det genererade utfallet från embedding-modellens server.
Steg 5 — Användaren kan använda filen i Kunskap
Dokumentet blir sökbart och kan användas i dina kunskapssamlingar i Intric.
Data som lagras på Intrics servrar:
- Extraherad fulltext och sidstruktur
- Textchunks med tillhörande embedding-vektorer
- Metadata om filen (namn, storlek, filtyp, tidpunkt)
Embedding-vektorerna lagras tillsammans med den ursprungliga chunk-texten i Intrics databas i Sverige hos ett svenskt underbiträde.
Datadelning och integritet
För att skydda din och din organisations integritet tillämpar vi principen om dataminimering. Det innebär att underleverantören endast får tillgång till det innehåll som är absolut nödvändigt för att utföra uppgiften - ingen användaridentitet lämnar någonsin din infrastruktur.
Vi har strikta nolldatalagringsklausuler i våra avtal med våra underleverantörer av språkmodeller. Det garanterar att innehåll som skickats till embedding-modellen varken sparas av leverantören efter att vektorerna returnerats, eller att informationen används för att träna deras AI-modeller.
I tabellen nedan ser du exakt vilken data som skickas till underleverantören och vad som inte lämnar Intrics servrar.
| Skickas till embedding-modellen | Skickas inte till embedding-modellen |
|---|---|
|
|
Datalagring och gallring
All fillagring och indexering sker på Intrics infrastruktur i Sverige — ingen extern tjänst lagrar dina dokument, extraherad text eller vektorer.
När ett dokument raderas från Knowledge tas samtliga delar bort — originalfil, extraherad text, chunks och vektorer. I granskningsloggen kan administratörer se när dokument laddas upp och raderas, samt av vem.