Conoscenza
La trasparenza è centrale per noi di Intric. Quando carichi un documento in Conoscenza, processi specifici garantiscono la tua privacy e la sovranità sui tuoi dati in tutta la catena — dal caricamento del file a un indice di conoscenza ricercabile.
Il processo dal caricamento del file a un documento indicizzato e ricercabile avviene attraverso un’interazione sicura tra la piattaforma Intric (dove i tuoi dati vengono elaborati e archiviati) e il modello di embedding che hai selezionato (ad esempio Berget o OpenAI).
Passo dopo passo: Come vengono elaborati i tuoi dati
Tutti i trasferimenti tra Intric e i suoi sub-responsabili avvengono tramite connessioni sicure e crittografate.
Passaggio 1 — L’utente carica un file in Intric
L’utente carica un documento (ad esempio PDF, DOCX o file di testo) tramite l’interfaccia web o l’API di Intric.
Dati inviati ai server di Intric:
- Il contenuto binario completo del file
- Nome del file e metadati (dimensione, tipo di file)
Il file viene trasferito tramite una connessione crittografata (HTTPS) ai server di Intric. Nessun dato viene inoltrato a servizi esterni in questa fase.
Passaggio 2 — Intric elabora e archivia il documento
Intric estrae il contenuto testuale dal file, archivia l’originale in modo sicuro e prepara il contenuto per l’indicizzazione. Tutta l’elaborazione in questa fase avviene internamente sui server di Intric.
Cosa accade:
- Il contenuto testuale viene estratto dal documento (PDF, DOCX, ecc.)
- Il file originale grezzo viene archiviato nell’object storage di Intric (S3) in Svezia
- Testo estratto, metadati e struttura della pagina vengono salvati nel database di Intric (PostgreSQL)
- Il testo viene suddiviso in segmenti più piccoli (chunk) per abilitare la ricerca semantica
Nulla lascia il server di Intric in questa fase — tutta l’elaborazione e l’archiviazione avviene internamente sulla piattaforma.
Passaggio 3 — Intric invia il contenuto testuale al modello di embedding
In questo passaggio, il contenuto testuale di ogni chunk viene inviato al modello di embedding configurato per essere convertito in vettori ricercabili.
Dati inviati dal server di Intric:
- Il contenuto testuale di ogni chunk (testo effettivo del documento — non hash o dati anonimizzati)
Cosa accade nel modello di embedding: Un vettore numerico (un elenco di numeri in virgola mobile) viene generato esclusivamente sulla base del testo fornito. Il modello di embedding non ha alcun contesto sull’identità dell’utente o dell’organizzazione.
Passaggio 4 — Risposta a Intric
La risposta del modello di embedding (i vettori per ogni chunk) viene inviata al server di Intric, che riceve e memorizza le informazioni crittografate nel suo database.
Dati inviati dal modello di embedding a Intric:
- I vettori numerici per ogni chunk di testo (per la ricerca semantica)
Immediatamente dopo che il risultato è stato restituito a Intric, sia l’input dell’utente che l’output generato vengono eliminati dal server del modello di embedding.
Passaggio 5 — L’utente può utilizzare il file in Conoscenza
Il documento diventa ricercabile e può essere utilizzato nelle tue raccolte di conoscenza in Intric.
Dati memorizzati sui server di Intric:
- Testo completo estratto e struttura della pagina
- Chunk di testo con vettori di embedding associati
- Metadati del file (nome, dimensione, tipo di file, timestamp)
I vettori di embedding vengono archiviati insieme al testo del chunk originale nel database di Intric in Svezia, ospitato da un sub-responsabile svedese.
Condivisione dei dati e privacy
Per proteggere la tua privacy e quella della tua organizzazione, applichiamo il principio della minimizzazione dei dati. Ciò significa che il sub-responsabile ottiene accesso solo al contenuto assolutamente necessario per svolgere il compito — nessuna identità utente lascia mai la tua infrastruttura.
Abbiamo clausole rigide di zero conservazione dei dati in tutti i contratti con i sub-responsabili dei modelli linguistici. Ciò garantisce che il contenuto inviato al modello di embedding non venga mai salvato dal fornitore dopo la restituzione dei vettori, né le informazioni vengano utilizzate per addestrare i loro modelli AI.
Nella tabella seguente puoi vedere esattamente quali dati vengono inviati al sub-responsabile e cosa non lascia i server di Intric.
| Inviato al modello di embedding | Non inviato al modello di embedding |
|---|---|
|
|
Conservazione ed eliminazione dei dati
Tutta l’archiviazione di file e l’indicizzazione avviene sull’infrastruttura di Intric in Svezia — nessun servizio esterno archivia i tuoi documenti, testi estratti o vettori.
Quando un documento viene eliminato da Conoscenza, tutte le parti vengono rimosse — il file originale, il testo estratto, i chunk e i vettori. Nel log di audit, gli amministratori possono vedere quando i documenti vengono caricati ed eliminati, e da chi.