• Ei tuloksia

Pearlin kausaalimalli

Kausaalimallin avulla voidaan kuvata kiinnostuksen kohteena olevien tujien välisiä funktionaalisia suhteita. Lisäksi malli mahdollistaa sen muut-tujiin kohdistuvien ulkopuolisten toimintojen eli interventioiden vaikutusten määrittämisen alimallien avulla, joissa intervention kohteena olevat funktiot asetetaan vakioiksi. Probabilistinen kausaalimalli yhdistää kausaaliset oletuk-set sekä tilastollisen informaation todennäköisyysjakauman muodossa. Judea Pearl määritteli sekä deterministisen kausaalimallin että sen probabilistisen laajennuksen (ks. Pearl, 2009, sivut 203-205), joita käsitellään tässä luvussa.

Määritelmä (Kausaalimalli, Pearl (2009) 7.1.1). Kausaalimalli on kolmikko M =hU,V,Fi,

missä:

1. Uon joukko havaitsemattomia taustamuuttujia, jotka määräytyvät mal-lin ulkopuolisista tekijöistä.

2. V={V1, V2, . . . , Vn}on joukko havaittuja muuttujia, jotka määräytyvät mallin sisältämistä muuttujista, eli joukon UV alkioista.

3. F={fV1, fV2, . . . , fVn} on sellainen joukko funktioita, että jokainen fVi

on kuvaus joukolta U∪(V \Vi) joukolle Vi, ja joukko F muodostaa kuvauksen joukolta U joukkoon V. Toisin sanoen jokainen funktio fVi määrää muuttujanVi arvon yksikäsitteisesti ehdolla joukonU∪Vmuut muuttujat, ja joukolla F on yksikäsitteinen ratkaisu. Joukko F voi-daan esittää symbolisesti kirjoittamallavi =fVi(paVi, uVi), i= 1, . . . , n, missä pai on jokin realisaatio yksikäsitteisestä minimaalisesta joukosta PAViV\Vi, joka on riittävä funktion fVi määrittelemiseksi. Vastaa-vasti uVi on jokin realisaatio yksikäsitteisestä minimaalisesta joukosta UViU, joka on riittävä funktion fVi määrittelemiseksi.

Vaatimus siitä, että joukkoF muodostaa kuvauksen joukolta Ujoukkoon V tarkoittaa tässä sitä, että on olemassa yksikäsitteinen joukko funktioita G={gV1, . . . , gVn}, missä jokainen funktio gVi määrittää muuttujan Vi arvon havaitsemattomien muuttujien avulla. Siis jos u on joukkoon U kuuluvien muuttujien arvoista muodostettu vektori, niin on oltava

vi =gVi(u), kaikilla i= 1, . . . , n.

Joukon Fyksikäsitteisellä ratkaisulla tarkoitetaan tällöin juuri joukkoa G.

Jokaista kausaalimallia M vastaa suunnattu graafi G = hW,Ei, jonka solmujoukko W sisältää solmun jokaista mallin M havaittua ja havaitsema-tonta muuttujaa kohden. GraafinGsärmäjoukkoEmääräytyy kausaalimallin M muuttujienV ja U välisistä funktionaalisista suhteista. JoukkoE sisältää

särmän solmustaX solmuunY josXPAY eli jokaiseen solmuun Vi saapuu särmä kaikista solmuista, jotka tarvitaan tätä vastaavan funktion fVi määrit-tämiseen. Joukko E sisältää särmät solmusta U jokaiseen solmuun Vi, jolle UUVi.

Kausaalimallin määritelmässä havaitsemattomille muuttujille ei aseteta mitään rajoitteita. Havaitsemattomista muuttujista voi siis lähteä mielival-taisen monta särmää kausaalimallia vastaavassa graafissa. Jos jokaisesta ha-vaitsemattomasta muuttujasta lähtee täsmälleen kaksi särmää, on kausaa-limalli semi-Markov-kausaalimalli. Verma (1993) osoitti, että mikä tahansa kausaalimalli, joka sisältää havaitsemattomia muuttujia, on muunnettavissa semi-Markov-kausaalimalliksi. Tästä syystä voidaan jatkossa rajoittua tilan-teisiin, joissa kaikki havaitsemattomat muuttujat vastaavat joitakin kahden havaitun muuttujan välisiä sekoittavia tekijöitä.

Kun kausaalimallia vastaava graafi on silmukaton, on joukon G olemas-saolo ja yksikäsitteisyys taattu. Funktiot gVi voidaan tällöin muodostaa funk-tioiden fVi avulla, kun jokaisen solmun Vi paikalle sijoitetaan tätä vastaava esitysfVi(paVi, uVi). Havaitut muuttujat saadaan tällä tavalla lopulta esitettyä vain havaitsemattomien muuttujien avulla, kun sijoitukset aloitetaan solmuis-ta, joilla ei ole lainkaan vanhempia. Tällaisilla solmuilla symbolinen esitys saa muodon fVi(uVi), sillä solmun Vi vanhempia kuvaava joukko PAVi on tyh-jä joukko. Sijoituksia voidaan nyt jatkaa rekursiivisesti korvaamalla jokaisen muuttujan symbolisessa esityksessä esiintyvät vanhemmat niiden symbolisilla esityksillä. Koska ensimmäisellä tasolla esiintyvät solmut, joilla ei ole lainkaan vanhempia, on saatu esitettyä vain havaitsemattomien muuttujien avulla, vä-littyy tämä ominaisuus myös kaikille tällaisten solmujen jälkeläisille.

Havaitsemattomaan muuttujaan liittyvät särmät kuvataan graafeissa kat-koviivoilla, kuten kuvassa 3.

Kuva 3: Havaitsemattoman muuttujan merkintätapa

Usein havaitsemattomat muuttujat kuitenkin jätetään merkitsemättä graafiin, mikä yksinkertaistaa kausaalimallien esittämistä huomattavasti. Sen sijaan tällaisessa tilanteessa sanotaan, että solmujen X ja Y välillä on kaksisuun-tainen särmä, joka kuvaa havaitsemattoman muuttujan vaikutusta. Jatkossa kuvan 3 merkintätavan sijaan käytetään siis kaksisuuntaisia särmiä, kuten kuvassa 4.

Kuva 4: Kaksisuuntaisen särmän merkintätapa

Tätä merkintätapaa käyttävät esimerkiksi Huang ja Valtorta (2006), Shpit-ser ja Pearl (2006b) ja Tian (2002). On syytä huomata, että kahden särmän välinen kaksisuuntainen särmä ei ole sama asia kuin jos graafi sisältäisi solmu-ja yhdistävät kaksi yksisuuntaista särmää, sillä nämä muodostaisivat graafiin silmukan, mikä ei ole sallittua.

Kaksisuuntaisten särmien yhteydessä on myös tavallista, että havaitse-mattomia muuttujia ei sisällytetä suoraan kausaalimallia vastaavan graafin G=hW,Eisolmujoukkoon W. Käytännössä tämä tarkoittaa sitä, että edel-lä määritellyn kausaalimallia M vastaavan graafin G solmujoukoksi ilmoite-taan ainoasilmoite-taan joukko, joka sisältää solmun jokaista joukon V muuttujaa kohden. Todellisuudessa havaitsemattomat muuttujat ovat osa graafin sol-mujoukkoa, mutta niitä ei määritellä eksplisiittisesti, vaan niiden olemassao-lo on implisiittisesti määritelty kaksisuuntaisten särmien avulla. Vastaavasti särmäjoukon E voidaan ajatella sisältävän myös kaksisuuntaisia särmiä, kun ne mielletään kahtena havaitsemattomaan muuttujaan liittyvänä yksisuun-taisena särmänä. Laajennetaan nyt kausaalimallin käsitettä määrittelemällä havaitsemattomille muuttujille yhteisjakauma.

Määritelmä (Probabilistinen kausaalimalli, Pearl (2009) 7.1.6). Probabilis-tinen kausaalimalli on pari

M =hMD, P(U)i,

missä MD on (deterministinen) kausaalimalli ja P(U) on muuttujajoukon U yhteisjakauma.

Jatkossa kausaalimallilla tarkoitetaan nimenomaan probabilistista semi-Markov-kausaalimallia ilman erillistä mainintaa. Havaitsemattomien muuttu-jien yhteisjakauma P(U) ja funktiot F määrittävät luonnollisesti myös ha-vaittujen muuttujien yhteisjakauman P(V). KausaalimallinM ja sitä vastaa-van graafin Gvälillä on täten yhteys myös todennäköisyysjakauman P kaut-ta, missä P =P(v1, . . . , vn, u1, . . . , uk) määrittää havaittujen ja havaitsemat-tomien muuttujien yhteisjakauman. Havaitsemattomat muuttujat oletetaan riippumattomiksi, eli P(U) =QiP(Ui).

Määritelmä(Kausaalinen Markov-ehto). Olkoot graafiGja todennäköisyys-jakauma P. Sanotaan, että Gja P toteuttavatkausaalisen Markov-ehdon jos

P = missä P a(.)G sisältää myös havaitsemattomat vanhemmat.

Oletus havaitsemattomien muuttujien riippumattomuudesta tarkoittaa käy-tännössä sitä, että määritelty kausaalimalli on riittävä kuvaamaan havaittujen muuttujien välisiä kausaalisia suhteita. Jos jotkin havaitsemattomat muuttu-jat U1, . . . , UlUolisivatkin toisistaan riippuvia, olisi niillä oltava jokin yh-teinen syy, joka ei ole mukana määritellyssä kausaalimallissa. Mallia olisi nyt laajennettava siten, että riippuvuusrakenteet havaitaan tarpeeksi kattavasti, jotta oletus havaitsemattomien muuttujien riippumattomuudesta on mielekäs.

Kun kausaalinen Markov-ehto toteutuu, voidaan graafinGja todennäköisyys-jakaumanP riippumattomuusominaisuudet yhdistää toisiinsa seuraavan mää-ritelmän avulla.

Määritelmä(d-separoituvuus, Pearl (2009) 1.2.3). Olkoot polkuH =hV,Ei ja solmujoukko ZV. Polku H on solmujoukon Z d-separoima graafissa G, jos ja vain jos

1. H sisältää ketjun IMJ tai haarukanIMJ, missä MZ ja I, JV.

2. Hsisältää käänteisen haarukanIMJ, missäDe(M)GZ=∅eli yksikään solmunM jälkeläisistä ei kuulu joukkoon Z graafissaGsolmu M mukaan lukien, jaI, JV.

Erilliset muuttujajoukot X ja Y ovat solmujoukon Z d-separoimia graafissa G, jos kaikki polut joukosta X joukkoonY ovat solmujoukon Z d-separoimia graafissa G.

Jos erilliset muuttujajoukotXjaYovat solmujoukonZd-separoimia graa-fissa G, niin muuttujajoukko X on riippumaton muuttujajoukosta Y ehdolla Z graafissaG jokaisen jakauman P suhteen, jolle G ja P toteuttavat kausaa-lisen Markov-ehdon. Tämä riippumattomuus ja d-separoituvuus graafissa G voidaan esittää merkinnällä (X |= Y |Z)G (Dawid, 1979).