Tietokanta
Läpinäkyvyys on meille Intricillä keskeistä. Kun lataat asiakirjan Tietokantaan, erityiset prosessit suojaavat yksityisyyttäsi ja datasi hallintaoikeutta koko ketjussa — tiedoston lataamisesta hakukelpoiseen tietohakemistoon.
Prosessi tiedoston lataamisesta indeksoituun, hakukelpoiseen asiakirjaan tapahtuu turvallisessa vuorovaikutuksessa Intric-alustan (jossa dataasi käsitellään ja tallennetaan) ja valitsemasi embedding-mallin (esim. Berget tai OpenAI) välillä.
Askel askeleelta: Miten dataasi käsitellään
Kaikki siirrot Intricin ja sen alikäsittelijöiden välillä tapahtuvat turvallisten, salattujen yhteyksien kautta.
Vaihe 1 — Käyttäjä lataa tiedoston Intriciin
Käyttäjä lataa asiakirjan (esim. PDF, DOCX tai tekstitiedosto) Intricin verkkokäyttöliittymän tai API:n kautta.
Intricin palvelimelle lähetetty data:
- Tiedoston täydellinen binäärisisältö
- Tiedostonimi ja metatiedot (koko, tiedostotyyppi)
Tiedosto siirretään salatun yhteyden (HTTPS) kautta Intricin palvelimille. Tässä vaiheessa dataa ei välitetä ulkoisille palveluille.
Vaihe 2 — Intric käsittelee ja tallentaa asiakirjan
Intric poimii tiedostosta tekstisisällön, tallentaa alkuperäisen turvallisesti ja valmistelee sisällön indeksointia varten. Kaikki käsittely tässä vaiheessa tapahtuu sisäisesti Intricin palvelimilla.
Mitä tapahtuu:
- Tekstisisältö poimitaan asiakirjasta (PDF, DOCX jne.)
- Raaka alkuperäistiedosto tallennetaan Intricin objektitallennukseen (S3) Ruotsissa
- Poimittu teksti, metatiedot ja sivurakenne tallennetaan Intricin tietokantaan (PostgreSQL)
- Teksti jaetaan pienempiin osiin (chunks) semanttisen haun mahdollistamiseksi
Tässä vaiheessa mikään ei poistu Intricin palvelimelta — kaikki käsittely ja tallennus tapahtuu sisäisesti alustalla.
Vaihe 3 — Intric lähettää tekstisisällön embedding-mallille
Tässä vaiheessa jokaisen osan tekstisisältö lähetetään konfiguroituun embedding-malliin muunnettavaksi hakukelpoisiksi vektoreiksi.
Intricin palvelimelta lähetetty data:
- Jokaisen osan tekstisisältö (todellinen asiakirjateksti — ei tiivistelmiä eikä anonymisoitua dataa)
Mitä embedding-mallissa tapahtuu: Numeerinen vektori (lista liukuluvuista) generoidaan yksinomaan annetun tekstin perusteella. Embedding-mallilla ei ole lainkaan kontekstia käyttäjän tai organisaation henkilöllisyydestä.
Vaihe 4 — Vastaus Intricille
Embedding-mallin vastaus (vektorit jokaiselle osalle) lähetetään Intricin palvelimelle, joka vastaanottaa ja tallentaa tiedot salattuna tietokantaansa.
Embedding-mallilta Intricille lähetetty data:
- Numeeriset vektorit jokaiselle tekstiosalle (semanttista hakua varten)
Välittömästi kun tulos on lähetetty takaisin Intricille, sekä käyttäjän syöte että generoitu tulos poistetaan embedding-mallin palvelimelta.
Vaihe 5 — Käyttäjä voi käyttää tiedostoa Tietokannassa
Asiakirjasta tulee hakukelpoinen ja sitä voidaan käyttää tietokokoelmissasi Intricissä.
Intricin palvelimille tallennettu data:
- Poimittu kokonaisteksti ja sivurakenne
- Tekstiosat niihin liittyvine embedding-vektoreineen
- Tiedoston metatiedot (nimi, koko, tiedostotyyppi, aikaleima)
Embedding-vektorit tallennetaan yhdessä alkuperäisen osan tekstin kanssa Intricin tietokantaan Ruotsissa, jota isännöi ruotsalainen alikäsittelijä.
Tietojen jakaminen ja yksityisyys
Sinun ja organisaatiosi yksityisyyden suojaamiseksi sovellamme dataminimisaation periaatetta. Tämä tarkoittaa, että alikäsittelijä saa pääsyn vain tehtävän suorittamiseen ehdottoman välttämättömään sisältöön — käyttäjän henkilöllisyys ei koskaan poistu infrastruktuuristasi.
Meillä on tiukat nolladatansäilytysklausulit kaikissa sopimuksissamme kielimallin alikäsittelijöiden kanssa. Tämä takaa, että embedding-mallille lähetettyä sisältöä ei koskaan tallenneta toimittajan toimesta vektoreiden palautuksen jälkeen, eikä tietoja käytetä heidän tekoälymalliensa kouluttamiseen.
Alla olevassa taulukossa näet tarkalleen, mitä dataa lähetetään alikäsittelijälle ja mitä ei poistu Intricin palvelimilta.
| Embedding-mallille lähetetty | Ei lähetetty embedding-mallille |
|---|---|
|
|
Tietojen säilytys ja poistaminen
Kaikki tiedostotallennus ja indeksointi tapahtuu Intricin infrastruktuurissa Ruotsissa — mikään ulkoinen palvelu ei tallenna asiakirjojasi, poimittuja tekstejä tai vektoreita.
Kun asiakirja poistetaan Tietokannasta, kaikki osat poistetaan — alkuperäinen tiedosto, poimittu teksti, osat ja vektorit. Tarkastuslokissa järjestelmänvalvojat voivat nähdä, milloin asiakirjoja on ladattu ja poistettu, ja kenen toimesta.