Tietokanta
Läpinäkyvyys on meille Intricillä keskeistä. Kun lataat asiakirjan Tietokantaan, erityiset prosessit suojaavat yksityisyyttäsi ja datasi hallintaoikeutta koko ketjussa — tiedoston lataamisesta hakukelpoiseen tietohakemistoon.
Prosessi tiedoston lataamisesta indeksoituun, hakukelpoiseen asiakirjaan tapahtuu turvallisessa vuorovaikutuksessa Intric-alustan (jossa dataasi käsitellään ja tallennetaan) ja valitsemasi embedding-mallin (esim. Berget tai OpenAI) välillä.
Askel askeleelta: Miten dataasi käsitellään
Osio nimeltä “Askel askeleelta: Miten dataasi käsitellään”Kaikki siirrot Intricin ja sen alikäsittelijöiden välillä tapahtuvat turvallisten, salattujen yhteyksien kautta.
Vaihe 1 — Käyttäjä lataa tiedoston Intriciin
Osio nimeltä “Vaihe 1 — Käyttäjä lataa tiedoston Intriciin”Käyttäjä lataa asiakirjan (esim. PDF, DOCX tai tekstitiedosto) Intricin verkkokäyttöliittymän tai API:n kautta.
Intricin palvelimelle lähetetty data:
- Tiedoston täydellinen binäärisisältö
- Tiedostonimi ja metatiedot (koko, tiedostotyyppi)
Tiedosto siirretään salatun yhteyden (HTTPS) kautta Intricin palvelimille. Tässä vaiheessa dataa ei välitetä ulkoisille palveluille.
Vaihe 2 — Intric käsittelee ja tallentaa asiakirjan
Osio nimeltä “Vaihe 2 — Intric käsittelee ja tallentaa asiakirjan”Intric poimii tiedostosta tekstisisällön, tallentaa alkuperäisen turvallisesti ja valmistelee sisällön indeksointia varten. Kaikki käsittely tässä vaiheessa tapahtuu sisäisesti Intricin palvelimilla.
Mitä tapahtuu:
- Tekstisisältö poimitaan asiakirjasta (PDF, DOCX jne.)
- Raaka alkuperäistiedosto tallennetaan Intricin objektitallennukseen (S3) Ruotsissa
- Poimittu teksti, metatiedot ja sivurakenne tallennetaan Intricin tietokantaan (PostgreSQL)
- Teksti jaetaan pienempiin osiin (chunks) semanttisen haun mahdollistamiseksi
Tässä vaiheessa mikään ei poistu Intricin palvelimelta — kaikki käsittely ja tallennus tapahtuu sisäisesti alustalla.
Vaihe 3 — Intric lähettää tekstisisällön embedding-mallille
Osio nimeltä “Vaihe 3 — Intric lähettää tekstisisällön embedding-mallille”Tässä vaiheessa jokaisen osan tekstisisältö lähetetään konfiguroituun embedding-malliin muunnettavaksi hakukelpoisiksi vektoreiksi.
Intricin palvelimelta lähetetty data:
- Jokaisen osan tekstisisältö (todellinen asiakirjateksti — ei tiivistelmiä eikä anonymisoitua dataa)
Mitä embedding-mallissa tapahtuu: Numeerinen vektori (lista liukuluvuista) generoidaan yksinomaan annetun tekstin perusteella. Embedding-mallilla ei ole lainkaan kontekstia käyttäjän tai organisaation henkilöllisyydestä.
Vaihe 4 — Vastaus Intricille
Osio nimeltä “Vaihe 4 — Vastaus Intricille”Embedding-mallin vastaus (vektorit jokaiselle osalle) lähetetään Intricin palvelimelle, joka vastaanottaa ja tallentaa tiedot salattuna tietokantaansa.
Embedding-mallilta Intricille lähetetty data:
- Numeeriset vektorit jokaiselle tekstiosalle (semanttista hakua varten)
Välittömästi kun tulos on lähetetty takaisin Intricille, sekä käyttäjän syöte että generoitu tulos poistetaan embedding-mallin palvelimelta.
Vaihe 5 — Käyttäjä voi käyttää tiedostoa Tietokannassa
Osio nimeltä “Vaihe 5 — Käyttäjä voi käyttää tiedostoa Tietokannassa”Asiakirjasta tulee hakukelpoinen ja sitä voidaan käyttää tietokokoelmissasi Intricissä.
Intricin palvelimille tallennettu data:
- Poimittu kokonaisteksti ja sivurakenne
- Tekstiosat niihin liittyvine embedding-vektoreineen
- Tiedoston metatiedot (nimi, koko, tiedostotyyppi, aikaleima)
Embedding-vektorit tallennetaan yhdessä alkuperäisen osan tekstin kanssa Intricin tietokantaan Ruotsissa, jota isännöi ruotsalainen alikäsittelijä.
Tietojen jakaminen ja yksityisyys
Osio nimeltä “Tietojen jakaminen ja yksityisyys”Sinun ja organisaatiosi yksityisyyden suojaamiseksi sovellamme dataminimisaation periaatetta. Tämä tarkoittaa, että alikäsittelijä saa pääsyn vain tehtävän suorittamiseen ehdottoman välttämättömään sisältöön — käyttäjän henkilöllisyys ei koskaan poistu infrastruktuuristasi.
Meillä on tiukat nolladatansäilytysklausulit kaikissa sopimuksissamme kielimallin alikäsittelijöiden kanssa. Tämä takaa, että embedding-mallille lähetettyä sisältöä ei koskaan tallenneta toimittajan toimesta vektoreiden palautuksen jälkeen, eikä tietoja käytetä heidän tekoälymalliensa kouluttamiseen.
Alla olevassa taulukossa näet tarkalleen, mitä dataa lähetetään alikäsittelijälle ja mitä ei poistu Intricin palvelimilta.
| Embedding-mallille lähetetty | Ei lähetetty embedding-mallille |
|---|---|
|
|
Tietojen säilytys ja poistaminen
Osio nimeltä “Tietojen säilytys ja poistaminen”Kaikki tiedostotallennus ja indeksointi tapahtuu Intricin infrastruktuurissa Ruotsissa — mikään ulkoinen palvelu ei tallenna asiakirjojasi, poimittuja tekstejä tai vektoreita.
Kun asiakirja poistetaan Tietokannasta, kaikki osat poistetaan — alkuperäinen tiedosto, poimittu teksti, osat ja vektorit. Tarkastuslokissa järjestelmänvalvojat voivat nähdä, milloin asiakirjoja on ladattu ja poistettu, ja kenen toimesta.