Miten tekoäly oppii?
Johdanto
Osio nimeltä “Johdanto”🎯 Oppimistavoitteet
- Ymmärtää ero perinteisen ohjelmoinnin ja koneoppimisen välillä
- Tietää, miten tekoälyä “koulutetaan” sen sijaan, että se “ohjelmoidaan”
- Ymmärtää neuraaliverkkojen perusperiaate
- Tuntea, miksi data on ratkaisevaa tekoälyn suorituskyvylle
Ymmärtääksesi, miten tekoäly toimii, täytyy ensin ymmärtää, miten perinteiset tietokoneohjelmat toimivat – ja miksi koneoppiminen on jotain perustavanlaatuisesti erilaista.
Perinteinen ohjelmointi ja koneoppiminen perustuvat täysin erilaisiin periaatteisiin. Tämä ero ratkaisee, mitkä ongelmat ylipäätään ovat ratkaistavissa tietokoneiden avulla.
Säännöistä esimerkkeihin: perustavanlaatuinen ero
Perinteinen ohjelmointi
Osio nimeltä “Perinteinen ohjelmointi”Ohjelmoija kirjoittaa tarkat ohjeet:
JOS lämpötila on yli 25 astetta Näytä "Ulkona on lämmin"JOS lämpötila on 15–25 astetta Näytä "Ulkona on miellyttävää"JOS lämpötila on alle 15 astetta Näytä "Ulkona on kylmä"Jokainen sääntö, jokainen skenaario täytyy määritellä etukäteen. Tämä toimii erinomaisesti tehtävissä, joilla on selkeät säännöt.
Mutta joitakin tehtäviä ei voi ohjelmoida säännöillä
Osio nimeltä “Mutta joitakin tehtäviä ei voi ohjelmoida säännöillä”Yritä kirjoittaa tarkat säännöt:
- Kissan tunnistamiseen kuvasta (onko sillä turkki? Terävät korvat? Mutta muillakin eläimillä on niitä…)
- Sen määrittämiseen, onko teksti positiivinen vai negatiivinen (ironia hankaloittaa kaiken…)
- Sen tunnistamiseen, onko joku vihainen, iloinen vai surullinen äänen perusteella
Ei ole yksinkertaista sääntöä, joka toimisi aina – liikaa vaihtelua, liikaa vivahteita. Tässä koneoppiminen astuu kuvaan.
Sen sijaan, että yritämme kirjoittaa sääntöjä, annamme tekoälyjärjestelmälle tuhansia tai miljoonia esimerkkejä – ja annamme sen löytää mallit itse.
Koneoppiminen: oppii esimerkeistä sääntöjen sijaan
Esimerkki: kissojen tunnistaminen
Osio nimeltä “Esimerkki: kissojen tunnistaminen”Perinteinen ohjelmointi (käytännössä mahdotonta): “Kissalla on neljä jalkaa, terävät korvat, viikset…” – Miten koodaa “söpö”? Miten erottaa kissa ketusta?
Koneoppiminen:
- Anna tekoälylle 100 000 kissankuvaa (merkitty “kissa”)
- Anna tekoälylle 100 000 kuvaa muista eläimistä (merkitty “ei kissa”)
- Anna järjestelmän löytää pikselien mallit, jotka erottavat kissat muista eläimistä
- Testaa uusilla kuvilla, joita järjestelmä ei ole koskaan nähnyt – se tunnistaa kissat suurella tarkkuudella
Kukaan ihminen ei kirjoittanut sääntöjä. Tekoäly on löytänyt mallit itse esimerkkien kautta.
Miten koulutusprosessi käytännössä etenee? Käymme sen läpi vaihe vaiheelta arkipäiväisellä esimerkillä.
Miten koulutus toimii: konkreettinen esimerkki
Tehtävä: kouluta tekoäly erottamaan roskapostiviestit tavallisista viesteistä.
Vaihe 1: kerää dataa
Osio nimeltä “Vaihe 1: kerää dataa”Keräämme 10 000 viestiä, joista 5 000 on roskapostia ja 5 000 on laillisia. Jokainen viesti on merkitty – tätä kutsutaan merkityksi dataksi.
Vaihe 2: tekoäly löytää mallit
Osio nimeltä “Vaihe 2: tekoäly löytää mallit”Järjestelmä analysoi viestit ja havaitsee malleja:
- Roskapostiviestit sisältävät usein sanat “ilmainen”, “voita”, “klikkaa tästä”
- Roskapostiviestissä on useammin kirjoitusvirheitä
- Roskapostiviestit tulevat useammin tuntemattomilta lähettäjiltä
- Lailliset viestit sisältävät usein nimesi tervehdyksessä
Tekoäly luo matemaattisen mallin näiden mallien perusteella.
Vaihe 3: testaa uusilla viesteillä
Osio nimeltä “Vaihe 3: testaa uusilla viesteillä”Annamme tekoälylle viestejä, joita se ei ole koskaan nähnyt. Se käyttää malliaan arvaamiseen: roskapostia vai ei?
Vaihe 4: paranna mallia
Osio nimeltä “Vaihe 4: paranna mallia”Jos tekoäly arvaaa väärin, mallia säädetään. Tätä toistetaan, kunnes tekoäly on riittävän hyvä.
Tulos: tekoäly, joka osaa luokitella uudet viestit ilman, että kukaan on kirjoittanut sääntöjä kuten “jos viesti sisältää sanan ‘ilmainen’, merkitse roskapostiksi”.
Tehokkain koneoppimisen tyyppi käyttää neuraalivverkoja – löyhästi aivojen toiminnasta inspiroituneita.
Neuraaliverkot: inspiraatio aivoista
Miten aivot toimivat?
Osio nimeltä “Miten aivot toimivat?”Aivoissasi on miljardeja hermosoluia (neuroneita) kytkettynä toisiinsa. Kun näet kissan, tietyt neuronit lähettävät signaaleja toisilleen, ja yhdessä ne muodostavat mallin “kissa”. Mitä enemmän näet kissoja, sitä vahvemmiksi nämä yhteydet kasvavat.
Keinotekoiset neuraaliverkot tekevät jotain vastaavaa – järjestelmä koostuu kerroksista keinotekoisia “neuroneita” (matemaattisia funktioita) kytkettynä toisiinsa.
Yksinkertaistettu esimerkki – kuvantunnistus:
Osio nimeltä “Yksinkertaistettu esimerkki – kuvantunnistus:”- Ensimmäinen kerros: tunnistaa yksinkertaisia yksityiskohtia (reunat, viivat, värierot)
- Toinen kerros: yhdistää nämä muodoiksi (ympyrät, kolmiot)
- Kolmas kerros: yhdistää muodot osiksi (korvat, nenä, tassu)
- Viimeinen kerros: yhdistää osat objekteiksi (“tämä on kissa”)
Jokainen kerros oppii yhä monimutkaisempia malleja yhdistämällä edellisen kerroksen tulokset.
Syvät neuraaliverkot sisältävät monia kerroksia (tästä “syvä” oppiminen – deep learning englanniksi). Tämä mahdollistaa erittäin monimutkaisten mallien oppimisen.
Ehkä tärkein oivallus koneoppimisesta ei koske algoritmeja tai laitteistoa – vaan dataa.
Data on avain – Garbage in, garbage out
Tekoäly on yhtä hyvä kuin data, jolla sitä on koulutettu.
- Jos koulutat tekoälyn tunnistamaan koiria mutta näytät vain kultainennoutajan kuvia, se ei ehkä tunnista mäyräkoiraa tai saksanpaimenkoiraa
- Jos koulutat tekoälyn virheitä täynnä olevilla teksteillä, se oppii kirjoittamaan virheellisesti
- Jos koulutat tekoälyn datalla, jossa on ennakkoluuloja, tekoäly oppii ennakkoluulot
Esimerkkejä tosielämästä:
Osio nimeltä “Esimerkkejä tosielämästä:”- Tekoäly, joka koulutetaan historiallisella rekrytointidatalla (jossa useimmat johtajat olivat miehiä), oppi syrjimään naispuolisia hakijoita
- Tekoäly, joka koulutetaan tunnistamaan kasvoja pääasiassa vaaleaihoisista henkilöistä, toimi huonommin tummaihoisten henkilöiden kanssa
- Tekoäly, joka koulutetaan lääketieteellisillä tutkimuksilla, joissa oli pääasiassa miespuolisia osallistujia, oli heikompi diagnosoimaan naisten sairauksia
Tämä ei johdu siitä, että tekoäly on “paha” – se vain oppii datasta malleja. Jos data on vinoutunutta, tekoälystä tulee vinoutunut. Tätä kutsutaan vinoumaksi (bias) ja se on yksi tekoälyn suurimmista ongelmista.
Koneoppiminen ei ole yksi tekniikka – on erilaisia lähestymistapoja sen mukaan, millainen ongelma ratkaistaan.
Kolme koneoppimisen tyyppiä
Ohjattu oppiminen (Supervised Learning)
Osio nimeltä “Ohjattu oppiminen (Supervised Learning)”Tekoäly oppii esimerkeistä, joilla on oikeat vastaukset.
- Anna sille 10 000 kuvaa merkittyinä “kissa” tai “koira”
- Se oppii eron ja osaa sitten luokitella uusia kuvia
Käytetään: kuvantunnistukseen, roskapostisuodatukseen, diagnostiikkatukeen
Ohjaamaton oppiminen (Unsupervised Learning)
Osio nimeltä “Ohjaamaton oppiminen (Unsupervised Learning)”Tekoäly saa dataa ilman vastauksia ja löytää mallit itse.
- Anna sille 10 000 asiakasprofiilia ilman merkintöjä
- Se löytää samankaltaisten asiakkaiden ryhmiä – segmenttejä, joita et ehkä tiennyt olevan
Käytetään: mallien löytämiseen, asiakkaiden ryhmittelyyn, poikkeavuuksien havaitsemiseen
Vahvistusoppiminen (Reinforcement Learning)
Osio nimeltä “Vahvistusoppiminen (Reinforcement Learning)”Tekoäly oppii kokeilemalla ja saamalla palautetta – kuten koiran kouluttaminen.
- Järjestelmä kokeilee erilaisia asioita
- Saa “palkinnon” hyvistä valinnoista, “rangaistuksen” huonoista
- Oppii, mitkä toiminnot johtavat parhaisiin tuloksiin
Käytetään: peli-tekoälyyn, robotiikkaan, itseohjautuviin autoihin
Yhteenveto
Osio nimeltä “Yhteenveto”Tässä kokoamme osion tärkeimmät oivallukset ennen kuin siirryt tietovisaan.
- Perinteinen ohjelmointi perustuu tarkkoihin sääntöihin. Koneoppiminen antaa tekoälyn oppia malleja esimerkeistä sääntöjen sijaan
- Tekoälyä koulutetaan antamalla tuhansia tai miljoonia esimerkkejä ja löytämällä tilastollisia malleja – kukaan ei kirjoita sääntöjä, järjestelmä löytää ne itse
- Neuraaliverkot ovat aivoista inspiroituneet ja koostuvat kerroksista, jotka oppivat yhä monimutkaisempia malleja. Deep learning tarkoittaa monia kerroksia ja kykyä oppia erittäin monimutkaisia yhteyksiä
- Data on ratkaisevaa: tekoäly on yhtä hyvä kuin sen koulutusdata – huono tai vinoutunut data tuottaa huonon tai vinoutuneen tekoälyn (vinouma)
Testaa tietosi
4 kysymystä · 100 % oikein läpäistäksesi · Tarkista vastaukset lopussa