Kuvittele itsesi keskustelemassa ystäväsi kanssa. Kuvittele nyt ystäväsi nauhoittamassa tätä keskusteluanne puhelimensa ääninauhurilla. Kuvittele tämän jälkeen katsovasi keskusteluanne seuraavana päivänä videota itsestäsi puhumassa omalla äänelläsi asioista, joista et ole koskaan ääneen puhunut. Tervetuloa tähän päivään – kuvittelit juuri täysin mahdollisen skenaarion tekoälyn rikastamassa maailmassamme.
Tänään tiistaina 10.9.2019 otettiin ensiaskeleet Jarko Korpelan filosofian kurssin opiskelijoiden tekoälyn etiikkaa käsittelevässä projektissa Joensuun yhteiskoulun lukiolla, kun vieraaksemme saapuivat nuorempi tutkija Ville Vestman Itä-Suomen yliopistosta ja SmartICT-projektipäällikkö, lehtori Petri Laitinen Karelia amk:sta. Opiskelijat tekevät tällä filosofian kurssilla tekoälyä eettisestä näkökulmasta tarkastelevia esitelmiä, joten vierailijoiden esitykset tekoälyyn ja sen sovelluksiin liittyen toimivat vähintäänkin mainioina inspiraationlähteinä heidän omalle tulevalle työlleen.

Filosofian kurssin opiskelijoita, jotka tekevät kurssilla tekoälyn etiikkaa käsitteleviä esitelmiä. Kuva: Kimmo Kuikka
What’s in a speaker?
Ville aloitti esityksensä kysymällä yleisöltä, mitä kaikkea ihmisen puheesta voi tunnistaa, jos kuulija ei näe puhujaa ollenkaan. Yleisimpiä opiskelijoiden tarjoamia vastauksia olivat tietenkin sukupuoli ja murre. Kun asiaa tarkasteltiin hieman syvemmin, opittiin, että puheesta voidaan havaita monia muitakin seikkoja esimerkiksi ihmisen vireystilaan liittyen; puheääni juuri heräämisen jälkeen on varmastikin hyvin erilainen kuin esimerkiksi urheilutapahtumia innoissaan selostettaessa. Heti perään saimme myös kuulla, että haastavaksi edellä mainittujen asioiden – tai puhujan henkilöllisyyden – luotettavan tunnistamisen tekoälyllä tekevät erilaiset variaatiot puheessa esimerkiksi tunnetilasta johtuen. Murteet, kielet, taustahäly, mikrofonin äänenlaatu, äänenpakkausalgoritmit sekä akustinen ympäristö vaikuttavat myös paljon siihen, kuinka luotettavaa tietoa puheesta saadaan irti.

Mitä puheesta voidaan tunnistaa? Kuva: Kimmo Kuikka
Syväoppiminen, neuroverkot ja niiden opettaminen
Ville itse tutkii juuri puhujantunnistusta, joten seuraavaksi tarkastelimme puhujan- ja puheentunnistusteknologian kehittymistä viimeisten parinkymmenen vuoden aikana. Huomasimme, että kehitys on ollut todella vauhdikasta syväoppimisen tulon myötä 2010-luvulta alkaen. Syväoppimisessa käytetään matemaattisia malleja, syviä neuroverkkoja, ja entistä laajamittaisempi syväoppiminen on mahdollistunut sillä, että tutkijoilla ja ohjelmistokehittäjillä on pääsy big dataan isojen yritysten (esim. Facebook) kiihtyneen tiedonkeruun myötä. Lisäksi nykyisin neuroverkkojen laskutoimituksissa käytetään näytönohjaimia tietokoneen prosessorin sijasta, mikä on paljon tehokkaampaa.
Ville havainnollisti syväoppimisen käsitettä hiensoti kertomalla meille kuulijoille, että näitä edellä mainittuja neuroverkkoja opetetaan keräämällä dataa esimerkiksi siitä, miltä koira näyttää ja syöttämällä mahdollisimman paljon tätä kerättyä dataa neuroverkkoon. Tämän jälkeen datasta pystytään melko suurella todennäköisyydellä määrittämään se, mikä myöhemmin neuroverkon viimeiselle kerrokselle (sovellukselle) esitetyistä kuvista esittää koiraa. Saimme myös kuulla, että neuroverkkojen oppimiskyky on kuitenkin rajallinen ja täysin itsenäistä oppimista tuskin suuremmalti tapahtuu; neuroverkot oppivat sen, mitä niille halutaan opettaa. Tässä vaiheessa kuulijoiden villeimmät mielikuvat Terminaattorit-elokuvien kaltaisesta koneiden kapinasta väistyivät ainakin hetkellisesti hieman kauemmas taka-alalle. Samassa yhteydessä Ville kertoi vielä, että dataa tullaan tulevaisuudessa keräämään yhä enemmän automaattisesti, jotta neuroverkkoja voidaan opettaa mahdollisimman suureen dataan pohjaten.
Kiehtovat sovellukset ja kimurantit tulevaisuudenkuvat
Seuraavaksi Ville esitteli pitkälti hänen itsensä kehittelemän puhujantunnistussovelluksen toimintaa Youtuben tietokannan perusteella. Sovellus vertaa kuulemaansa ääntä tietokantaan ja antaa viisi ehdotusta siitä, kuka olet tai keneltä kuulostat. Tässä linkki vastaavanlaiseen Celebsoundalike-sovellukseen.
Esityksen loppupuolella tarkastelussa olivat muun muassa deepfake-videot, joilla voidaan rekonstruoida joku poliitikko puhumaan videolla täysin totuudenvastaisia asioita. Tämä kirvoitti keskustelua muun muassa tulevista USA:n presidentinvaaleista ja ulkopuolisten vaikutusyrityksistä kyseisiin vaaleihin liittyen. Näimme myös esimerkin NVidian kehittelemästä sovelluksesta, jossa tekoälyllä voidaan generoida täysin uusia kasvoja ottamalla tietyt piirteet jostain referenssikasvosta ja kaikki loput jostain toisesta. Tulevaisuudennäkymistä tekoälyn sovelluksien loputtomassa horisontissa kuulimme Villen ajatuksia itseohjautuvista autoista (hankalampi toteuttaa kuin edellä kuvaillut luokittelu- tai generointitehtävät) ja siitä, kuinka tutkimuksen puolella on jatkuva kilpajuoksu väärennökset mahdollistavien tekoälysovellusten kehittäjien ja tekoälyllä luodun väärennöksen tunnistamisen sovellusten kehittäjien välillä. Aivan aamupäivän vierailun lopuksi keskustelimme vielä siitä, miten pitkälle annamme tämän valtaisaa tahtia eteenpäin puskevan tekoälyn hyödyntämisen mennä, ja tuleeko kehitys hidastumaan tai jopa loppumaan jossain kohtaa (lähi)tulevaisuudessa?
“Toisitko vettä?”
Päivän toinen vieraamme Petri Laitinen aloitti oman esityksensä kysymällä, mitä koneen tarvitsisi tietää osatakseen tuoda vaikkapa vettä sitä pyydettäessä. “Toisitko vettä” on helppo pyyntö ihmiselle, mutta miten on koneen laita? Kysymys sai aikaan hämmentyneen hiljaisuuden kuulijoiden joukossa, joten oli aika katsoa Beetzin tutkimusryhmän video Rosie ja James -roboteista paistamassa lettuja. Videon katsomisen jälkeen ymmärsimme, että hyvin yksinkertaisenkin käskyn toteutuminen vaatii usean tieteenalan osaamisen yhdistämistä, lukemattomia eri vaiheita, internethakuja sekä eri järjestelmien, ihmisen ja robotin välistä kommunikointia, jotta joustava, käskynmukainen toiminta robotilta onnistuisi.
Lettujen paistosta päästiin esineiden internetiin ja automatisoituun datankeruun tulevaisuuteen, mistä jo aamupäivän vieraamme Ville puhui omassa esityksessään. Lopuksi Petri kertoi Karelia ammattikorkeakoulun peliohjelmoinnin suuntautumismahdollisuuksista, ja siitä, että tulevaisuuden pelisuunnittelijat saattavat työllistyä mitä erilaisimmille aloille aina rakennussuunnittelusta autonkorjaukseen VR:n ja AR:n vallatessa koulutusalaa koko ajan kiihtyvällä tahdilla.
Pysykäähän kuulolla syksyn FinEduAI-kuulumisista ja vinkatkaa tästä blogista kaverillekin! Tekoälyn etiikasta sitten lisää opiskelijoiden esitelmien valmistumisen jälkeen!
-Niina
Julkaistu kategoriassa