• Ei tuloksia

Monitieteellinen näkökulma selittämiseen

2.2 Selitettävyys (explainability) ja XAI

2.2.1 Monitieteellinen näkökulma selittämiseen

Selityksiä voidaan muodostaa monella tapaa ja niillä voidaan saavuttaa merkittävää hyötyä niin kehittäjien, tekoälyä valvovien tahojen, kuin käyttäjienkin näkökulmasta.

T. Miller ym. (2017) esittävät, että useimmiten tekoälyn selitettävyyttä kehitettäessä ei hyödynnetä nykyaikaista tieteellistä ymmärrystä siitä, kuinka ihmiset muodostavat ja ymmärtävät selityksiä muissa tilanteissa. Ongelmana on paitsi kehittäjien mahdollisesti todellisuudesta eriävät ajatukset hyvästä selityksestä. Lisäksi kehittäjät ovat luonnolli-sesti tekoälyn asiantuntijoita, mikä voi vaikeuttaa toimivien selitysten muodostamista tiedoiltaan vaihtelevalle käyttäjäkunnalle (T. Miller ym., 2017). T. Miller (2019) jatkaa esittelemällä tätä monitieteellistä lähestymistapaa tekoälyn selitettävyyteen. T. Miller

(2019) esittelee tärkeimmät selityksiin liittyvät teoriat filosofisen, psykologisen ja kogni-tiotieteellisen kirjallisuuden pohjalta ja yhdistää tätä tietoa tekoälyn tekemien päätösten selittämiseen. Tämä alaluvun tavoitteena on avata tätä näkökulmaa selitettävyyteen.

Kuva 2.2 esittää, kuinka selitettävä tekoäly (XAI) voidaan T. Millerin (2019) mukaan sijoittaa usean tieteenalan risteyskohtaan. Se sisältää elementtejä tekoälyn sekä ihmisen ja tietokoneen vuorovaikutuksen tutkimuksesta ja ihmistieteistä. T. Miller (2019) tiivistää havaintonsa neljään pääkohtaan:

1. Selitykset ovat vertailevia. Selitys muodostetaan usein suhteessa johonkin vastak-kaiseen esimerkkiin (englanniksi käytetään termiäcounterfactual). Ihmiset eivät siis yleensä kysy miksi asia P tapahtui, vaan miksi asia P tapahtui sen sijaan, että olisi tapahtunut asia Q.

2. Selitykset valitaan useiden mahdollisten selitysten joukosta. Valintaan vaikuttavat selittäjän kognitiiviset painotukset ja vinoumat (bias). Ihmiset ovat taipuvaisia valitsemaan tapahtumalle yhdestä kahteen selitystä riippumatta siitä, montako mahdollista syytä asialle on. Selityksen vastaanottaja ei myöskään odota selityksen sisältävän kaikkia mahdollisia syitä tapahtuneelle.

3. Todennäköisyyksillä ei todennäköisesti ole merkitystä (sanaleikki Millerin). Se-litettäessä asiaa ihmiselle, tilastollisten todennäköisyyksien hyödyntäminen on usein epätyydyttävää, ellei siihen liitetä kausaalista selitystä, joka avaa tilastollista yleistystä.

4. Selitykset muodostuvat sosiaalisesti. Tiedon siirtäminen selittämällä tapahtunutta tapahtuu vuorovaikutuksessa. Selityksen muodostamiseen vaikuttavat selittäjän oletukset siitä, mitä selityksen kohde ajattelee tilanteesta tai asioista yleisesti.

Tällaisia oletuksia käytetään valitsemaan selitys, joka todennäköisemmin on selityksen kohteesta ymmärrettävä ja hyväksyttävä.

Kuva 2.2:XAI:n suhde muihin tutkimus- ja tieteenaloihin (T. Miller, 2019).

Ihmisillä on myös T. Millerin (2019) mukaan monia eri syitä pyytää selitystä jollekin asialle tai tapahtumalle. Ehkä yksinkertaisin on silkka uteliaisuus, mutta selityksiä voidaan kysyä esimerkiksi toisen ymmärryksen testaamiseksi kouluympäristössä. Yksi selitysten keskeinen funktio on mahdollistaa asioiden oppiminen. Selitysten avulla pa-rannamme ymmärrystämme asioista ja ihmisistä ja pystymme muodostamaan asioiden ennakointia helpottavia malleja (Heider, 1982). Wilkenfeld ja Lombrozo (2015) esittävät selittämisen itsessään olevan merkittävässä roolissa oppimisessa. Selitysten muodosta-minen muuttaa käsitystämme väitteen todennäköisyydestä. Myös epäonnistunut yritys selittää jotakin asiaa parantaa Wilkenfeldin ja Lombrozon (2015) mukaan ymmärrystä selityksen kohteesta.

Malle (2006) esittää kaksi pääsyytä ihmisten arkipäiväisille selityksille (tarkoittaen tiettyjen tapahtumien selittämistä sosiaalisessa kanssakäymisessä erotuksena tieteellisten ilmiöiden selittämisestä):

1. Merkitysten löytämiseksi. Selityksien avulla yhteensovitetaan ristiriitaisia tai epäjohdonmukaisia tietomalleja.

2. Sosiaalisen kanssakäymisen hallitsemiseksi. Selityksillä luodaan jaettua ymmär-rystä selitettävästä asiasta. Lisäksi selityksillä voidaan pyrkiä muuttamaan toisten ihmisten uskomuksia ja vaikutelmia asioista sekä pyrkiä vaikuttamaan toisten tunteisiin ja käytökseen.

Tekoälyn selittämisen kannalta olennaista on usein juuri jaetun ymmärryksen luominen.

Pyrimme luomaan ainakin jollain tasolla yhteisen ymmärryksen järjestelemän tuot-tamasta tuloksesta järjestelmän ja selitystä vastaanottavan ihmisen välille (T. Miller, 2019). Wilkenfeld ja Lombrozo (2015) huomauttavat selityksillä olevan myös muita funktioita, kuten suostuttelu ja syyllisyyden määrittäminen. Lisäksi joissain tilanteissa selittäjän ja selityksen vastaanottajan tavoitteet eriävät. Näin käy esimerkiksi tilan-teessa, jossa selittäjä yrittää taivutella vastaanottavan osapuolen tekemään jotain tai pyörtämään mielipiteensä. T. Miller (2019) liittää tämän ajatuksen tekoälyn päätösten selittämiseen: Voimme nähdä tekoälyn selityksen tavoitteena luottamuksen tuottami-sen. Tällöin suostutteluprosessi tuloksen oikeudellisuudesta voi muodostua selityksen kannalta olennaisemmaksi kuin todellisten syiden välittäminen. Tällaisessa tilantees-sa selittäjän tavoite (luottamuksen muodostaminen) eroaa selityksen vastaanottajan tavoitteesta (päätöksen ymmärtäminen) (T. Miller, 2019). Tässä voidaan nähdä myös mahdollisia ongelmia, joihin palataan tutkielman etiikkaa käsittelevässä alaluvussa 4.1.

T. Millerin (2019) mukaan tiettyyn lopputulokseen johtaneen kausaliteettiketjun esittä-minen ei välttämättä muodosta selitystä, ja Miller esittääkin kausaliteetin ymmärtämisen vain osana tekoälyn selittämistä. Tämä perustuu aiemmin todettuun tekoälyjärjestelmien vaikeaan ymmärrettävyyteen. Johonkin päätökseen johtanut tapahtumien ketju voi olla periaatteessa selvä, mutta se ei tarkoita, että tämän ketjun esittäminen olisi käyttäjälle ymmärrettävä selitys.

T. Miller (2019) esittää selitysten vertailevan luonteen monitieteellisen lähestymistavan keskeisenä antina tekoälyn selitettävyydelle. Ihmisten muodostamia selityksiä käsittele-vän kirjallisuuden mukaan ihmiset pyytävät ainoastaan kontrastiivisia selityksiä, koska täydelliset selitykset olisivat kognitiivisesti liian raskaita käsiteltäväksi. Toisaalta voi-daan myös väittää, että tekoälyn selittämisessä kausaliteettiketjut voivat olla arkielämää hallittavampia tekoälyn toimiessa korkeammalla abstraktion tasolla. Tämä ei kuitenkaan T. Millerin (2019) mukaan poista ihmisten näennäisen luontaista tarvetta vertaileville selityksille, jotka koetaan yleensä paremmiksi ja intuitiivisemmiksi. Tämä selittämisen piirre tuo sekä haasteita että mahdollisuuksia tekoälyn tekemien päätösten selittämiseen.

Haastavaa on haetun kontrastin määrittäminen. Ihmisten hakiessa tällaista selitystä, kont-rasti jätetään usein implisiittiseksi kysymällä vain miksi asia X tapahtui. Lipton (1990) esittää, että tällainen kysymyksenasettelu voidaan ymmärtää tarkoittamaan "Miksi X,

sen sijaan että ei-X?". Lipton (1990) lisää tosin tällaisen negaation tarkoittavan samaa kuin kaikkien mahdollisten syiden selittäminen, joka edellä todettiin epätoivottavaksi.

Lipton (1990) korostaa, että vertailevan selityksen muodostaminen on lähtökohtaisesti helpompaa kuin täyden kausaliteettiketjun selittäminen, sillä vertailu vaatii vain kahden tapauksen erojen tunnistamisen. Kaikkia syitä ei ole edes tarpeellista tietää, oli kyseessä sitten laskennallinen tai ihmisen tuottama selitys. Haasteen vertailevaan selittämiseen tuo halutun (tai toimivan) vastakkaisen tilanteen määritys. Yksi tapa päätellä mahdollisesti sopiva kontrasti on tunnistaa epänormaalit tapaukset yleisemmistä, "Miksi X, eikä normaali tapaus Y?". T. Miller (2019) käyttää esimerkkinä tilannetta, jossa positiivisen syöpädiagnoosin kohdalla ei kysytäkään miksi diagnoosi ei ollut negatiivinen, vaan tilannetta verrataan yhteen tai useampaan "stereotyyppiseen"negatiiviseen tapaukseen.

Epänormaalien tulosten määrittämisen haastavuus vaihtelee riippuen selitettävästä mallista (T. Miller, 2019). Jos haluttu kontrasti voidaan saada selityksen vastaanottajalta, se toisaalta myös osoittaa mitä kohtaa vastaanottaja ei ymmärtänyt (T. Miller, 2019).

Selitystä muodostettaessa selityksen valintaan vaikuttavat monet tekijät, kuten jo maini-tut kontrastit ja selityksen poikkeaminen normaalista. Hilton ym. (2005) esittävät kaksi akselia, joilla selityksiä voidaan vertailla niitä valittaessa: normaali vs. epänormaali ja tahallinen vs. tahaton. T. Miller (2019) esittää esimerkiksi tilanteen, jossa valitsemme selitystä Challenger-sukkulan räjähdykselle vuonna 1986. Valitsemme todennäköisem-min selitykseksi "sukkulassa oli käytetty viallisia tiivisteitä", kuin "ilmakehässä oli happea"(T. Miller, 2019). Kumpikin kyllä selittää osaltaan räjähdystä, mutta epänormaali tilanne selittää tapahtuman paremmin. Toisaalta merkitystä on myös sillä, oliko kyseessä tietoinen, tahaton vai luonnollinen tapahtuma. Hilton ym. (2005) tutkimuksessa koehen-kilöt valitsivat selityksiä jäisestä tiestä johtuneelle auto-onnettomuudelle. Tahallinen veden levittäminen tielle nähtiin tahatonta tien kastelemista parempana selityksenä, joka puolestaan nähtiin parempana kuin luonnollinen syy eli sateen kastelema tie.

Eri syiden vastuu tietystä tapahtumasta voidaan määrittää myös formaalimmin, mitä voidaan hyödyntää parempien selityksien muodostamisessa (T. Miller, 2019). Chockler ja Halpern (2004) esittävät mallin, jossa syyn C vastuu tapahtumasta E voidaan määrittää muutosten määrällä, jonka tilanne vaatisi, jotta tapahtuma E ei tapahtuisi. Jos N on muutosten minimimäärä, C:n vastuu E:n tapahtumisesta on 1/N+1. Jos N=0, C on täysin vastuussa E:stä. Enemmän tapahtuneesta vastaava syy vaatisi siis vähemmän muutoksia tapahtuman E välttämiseksi. Vaikka kyseinen malli arvioikin lähtökohtaisesti eri syiden vastuuta, sitä voidaan hyödyntää myös arvioitaessa yksilöiden vastuuta ryhmän sisällä.

Gerstenberg ja Lagnado (2010) toteuttivat kokeen, jossa koehenkilöt laskivat ryhmissä kuvan sisältämien kolmioiden määrää. Joukkueiden paremmuus määräytyi kollektiivisen tuloksen perusteella, jonka jälkeen osallistujat arvioivat toisten osallistujien vastuun

joukkueen tuloksesta. Tutkimuksessa Chocklerin ja Halpernin (2004) esittämä malli oli vertailluista paras ennakoimaan koehenkilöiden arvioita vastuista. Malli ennakoi kilpailijoiden arviot tarkemmin kuin kilpaileva malli, joka ennakoi kilpaijoiden arvioita hyödyntäen tietoa siitä, kuinka tarkasti kilpailijat olivat tosiasiassa vastanneet.

Lipton (1990) esittää selityksen välttämättömyyden olevan selityksen riittävyyttä tär-keämpi: Hyönteislajin siivet kasvavat tietyssä lämpötilassa normaalia pidemmiksi johtuen joko mutaatiosta X tai mutaatiosta Y. Kumpikin mutaatioista on riittävä selitys hyönteisyksilön pidemmille siiville. Tietty lämpötila on kuitenkin välttämätön tämän tapahtuman kannalta, kun taas mutaatioista kumpi vain voi olla vastuussa pidemmistä siivistä. Ihmiset hyväksyvät lämpötilan selitykseksi helpommin tämän välttämättömyy-den takia. Tämä pätee, vaikka tietäisimme kumpi mutaatiosta on tässä tapauksessa aiheuttanut muutoksen fenotyypissä. Woodward (2006) esittää toisaalta ihmisten suo-sivan selityksiä, jotka aikaansaavat selitettävän ilmiön ilman muita syitä. Jos otamme edelliseen esimerkkiin mukaan mutaation Z, joka aiheuttaa pidempien siipien kasvun riippumatta lämpötilasta, ajaisi se selityksenä lämpötilan ja jommankumman muun mutaation yhdistelmän ohi (T. Miller, 2019). Tämän voidaan yhdistää myös ajatukseen yksinkertaisempien selityksien tehokkuudesta (T. Miller, 2019).

Arvioitaessa selityksiä vastaanottajan näkökulmasta voidaan hyödyntää Thagardin (1989) esittämää teoriaa selitysten koherenssista (T. Miller, 2019). Teoria sisältää seitsemän periaatetta siitä, kuinka selitykset liittyvät aiempiin käsityksiin selitettävästä asiasta. Esimerkkinä näistä periaatteista: jos jokin ryhmä ominaisuuksia P selittää ominaisuuden Q on kaikkien ominaisuuksien P oltava koherentteja ominaisuuden Q kanssa. Tarkoittaen, että ihmiset hyväksyvät selityksen helpommin, jos se myötäilee heidän aiempia käsityksiään asiasta. Lisäksi Thagard (1989) esittää yksinkertaisempien eli vähemmän syitä sisältävien selitysten olevan helpommin hyväksyttäviä. Samoin yleispätevämmät (general) eli useampia tapauksia tapahtumia selittävät selitykset hyväksytään helpommin (Thagard, 1989).

Read ja Marcus-Newhall (1993) testasivat Thagardin (1989) esittämiä periaatteita yksin-kertaisista ja yleispätevämmistä selityksistä (T. Miller, 2019). Koeasetelmassa osallistujat arvioivat erilaisille tarinoille muodostettujen erilaisten selityksien todennäköisyyttä ja laatua. Esimerkkitarinassa esiintyi hahmo, jolla oli kolme lääketieteellistä ongelmaa (painonnousu, väsymys, pahoinvointi). Näille tarjottiin kapeita selityksiä (liikunnan lopettaminen painonnousulle, mononukleoosi väsymykselle, vatsatauti pahoinvoinnille), kattavia selityksiä (esimerkissä henkilön raskaus selittäisi kaikki kolme vaivaa) sekä yhdistettyjä selityksiä (kolme yksittäistä syytä yhdistettynä). Periaatteiden mukaisesti osallistujat pitivät yksinkertaisia, vähemmän eri syitä sisältäviä perusteluja parempina (tässä tapauksessa raskaus) kuin monimutkaisempia (kolmen selityksen yhdistelmä).

Todennäköisyydellä voidaan T. Millerin (2019) mukaan tarkoittaa selitysten kohdalla kahta asiaa: Todennäköisyys voi tarkoittaa sitä todennäköisyyttä, jolla selitys on tosi tai todennäköisyyden hyödyntämisestä selityksen muodostamisessa. Kuten aiemmin todet-tiin, kummallakin on vähemmän merkitystä kuin saattaisimme kuvitella. Tilastollisten todennäköisyyksien käyttäminen itsessään selityksien muodostamisessa ei ole kovin tehokasta, sillä ihmiset haluavat tietää syitä tapahtumille. Esimerkkinä ilmiöstä T. Miller (2019) käyttää opiskelijaa, joka on saanut tentistä vain 50 prosenttia pisteistä ja haluaa tälle selityksen. Se tosiasia, että suurin osa opiskelijoista saavutti saman pistemäärän ei ole erityisen tyydyttävä selitys. Selitys paranee jos siihen voidaan liittää syy sille, miksi suurin osa opiskelijoista sai vain puolet pisteistä. Selitystä vaativan opiskelijan kannalta olisi kuitenkin vielä hyödyllisempää selittää miksi juuri hän sai tämän pistemäärän. Jos tilastollisia yleistyksiä halutaan hyödyntää selityksien muodostamisessa, on tarpeen selittää myös näihin yleistyksiin johtavat syyt (T. Miller, 2019).

Selityksen laatuun vaikuttaa myös se todennäköisyys, jolla annettu selitys on totta (T.

Miller, 2019). Hilton ym. (2005) kuitenkin osoittavat, ettei kaikkein todennäköisin tai

"tosin"selitys ole välttämättä paras. Kaikista todennäköisintä, varmimmin totta, selitystä ei siis kannata esittää parhaana selityksenä (T. Miller, 2019). Esimerkiksi aiemmassa Challenger-esimerkissä hapen läsnäolo ilmakehässä on Hilton ym. (2005) mukaan oletettu (presupposed) eli selittäjä olettaa vastaanottajan jo tietävän asian.

Todennäköisyyksillä on kuitenkin merkitystä, joskin muita esiteltyjä tekijöitä vähemmän (T. Miller, 2019). Lombrozo (2007) testasi todennäköisyyksien merkitystä toistamalla vastaavan kokeen kuin Read ja Marcus-Newhall (1993). Lombrozo (2007) argumentoi koehenkilöiden valinneen yksinkertaisempia syitä useiden syiden yhdistelmien sijaan, koska heillä ei Read ja Marcus-Newhall (1993) kokeessa ollut tietoa eri syiden esiinty-vyyksistä tai todennäköisyyksistä. Lombrozo (2007) testasi tilannetta, jossa erillisille syille (Read ja Marcus-Newhall (1993) esimerkissä mononukleoosi, vatsatauti ja liikun-nan lopettaminen) ilmoitettiin korkeammat todennäköisyydet kuin yksinkertaisemmalle vaihtoehdolle (Read ja Marcus-Newhall (1993) esimerkissä raskaus, joka selittäisi useita oireita). Tämä lisäsi monimutkaisemman selityksen houkuttavuutta koehenkilöi-den silmissä, mutta vain jos nämä tokoehenkilöi-dennäköisyydet olivat huomattavasti korkeampia.

Lombrozo (2007) testasi myös vastaavaa tilannetta, jossa erillisten syiden yhdistet-ty todennäköisyys oli laskettu valmiiksi. Tämä kavensi entisestään houkuttavuuseroa yksinkertaisemman ja monimutkaisemman, mutta todennäköisemmän, selityksen välillä.

Lähestyessämme tekoälyn selitettävyyttä ihmisten toisilleen muodostamien selitysten kautta emme voi jättää huomioimatta selittämisen sosiaalista aspektia (T. Miller, 2019). Hilton ym. (2005) kuvaavat kausaalisen selittämisen ennen kaikkea sosiaalisen vuorovaikutuksen muotona, jossa joku selittää jotain jollekulle. Koska selittäminen

tapahtuu keskustelun muodossa seuraa se myös keskustelun sääntöjä (Hilton ym., 2005). Hilton ym. (2005) jakavat selityksen kahteen vaiheeseen: ensimmäisessä selittäjä diagnosoi syyn selitettävälle tapahtumalle ja toisessa esittää diagnoosinsa tulokset selityksen vastaanottajalle. Jälkimmäinen osa seuraa Hilton ym. (2005) mukaan niin sanottuja Gricen maksiimeja (Grice, 1975) onnistuneelle keskustelulle: laatu, määrä, relevanssi ja tavat. Gricen maksiimit mallintavat ihmisten toimintaa keskustelussa, jolla on yhteinen päämäärä (cooperative conversation). Päämäärä voi olla esimerkiksi tiedon vaihtaminen tai viihtyminen. T. Miller (2019) tiivistää maksiimit karkeasti näin: sano vain mitä uskot, sano vain niin paljon tarpeellista, sano vain se, mikä on relevanttia ja sano nämä asiat miellyttävällä tavalla.

Keskusteluun pohjautuva malli tekoälyn selittämiselle on houkutteleva vaihtoehto useista syistä (T. Miller, 2019). Keskustelu voi T. Millerin (2019) mukaan toimia esitystapana hyvin erilaisille selitettäville asioille, oli kyse sitten ihmisten tai älykkäiden agenttien toiminnoista, tunteista, tapahtumista tai algoritmisista päätöksistä. Vaikka puhummekin keskusteluista, niitä kuvaavat mallit eivät ole riippuvaisia vuorovaikutuksen muodosta (T. Miller, 2019): Tekoälyn tuloksia voi olla helpompi selittää visuaalisessa muodossa ja erilaisten visuaalisten objektien kanssa voi myös vuorovaikuttaa lisätiedon saamiseksi.

Esimerkiksi Gricen maksiimit pätevät myös visualisointien kohdalla. Vuorovaikutteinen selittäminen ratkaisee myös tiettyjä ongelmia, joita pelkkä ilmoitettu selitys voi aiheuttaa.

Esimerkiksi mitä tapahtuu, jos vastaanottaja ei ymmärrä tai hyväksy annettua selitystä?

Kysymysten vastaanottaminen auttaa myös selvittämään mitä vastaanottaja ei ymmärtänyt tai mitä tämä haluaa tietää. Ajatus keskustelupohjaisesta tekoälyn selittämisestä ei ole mitenkään uusi. Esimerkiksi Cawsey (1991) kuvailee järjestelmää, joka selittää dialogin muodossa monimutkaisia asioita. Järjestelmä vastaa kysymyksiin ja muodostaa mallia siitä, mitä asioita vastaanottaja on jo ymmärtänyt.

Monitieteellisellä lähestymistavalla voidaan siis löytää useita eri näkökulmia selitysten muodostamiseen ja arviointiin. Tutkielman analyysiosiossa tarkastellaan AutoML-ratkaisujen muodostamia selityksiä tämän linssin läpi. Seuraavassa alaluvussa esitellään lisäksi joitain toteutettuja tapoja muodostaa selityksiä, jotka pyrkivät vastaamaan ainakin osaan näistä havainnoista.