Edellä on käsitelty yksittäisen eli yksiulotteisen satunnaismuuttujan
mo-mentteja.Käytännönsovelluksissaollaankuitenkinuseinkiinnostuneita
kah-den tai useamman satunnaismuuttujan keskinäisistä riippuvuuksista. Tästä
syystä laajennammekäsittelynkoskemaan satunnaismuuttujienyhdistettyjä
momentteja,taimoniulotteisensatunnaismuuttujanmomentteja. Aloitetaan
esittelemällä lauseelle 3.2.3 analoginen tulos, joka tässä yhteydessä jätetään
todistamatta.
Lause3.3.1. Olkoon
(X 1 , . . . , X n )
n-ulotteinensatunnaismuuttuja,jaolkoonE[g(X 1 , . . . , X n )]
olemassa. TällöinEnnen käsittelyn ulottamista n-ulotteisten satunnaismuuttujien muihin
momentteihinotetaankatsaustilanteeseen,jossaollaankiinnostuneita
satun-naismuuttujientapahtumienyhtäaikaisestasattumisestajasen
todennäköisyy-destä.
Määritelmä 3.3.2. Satunnaismuuttujien
X
jaY
sanotaanolevanyhteisestijatkuvia, jos kaikille reaaliluvuille
x
jay
on olemassa funktiof (x, y)
, jonkakaikillereaalilukuparijoukoille
C ⊂ R 2 onvoimassa yhtälö.
P { (X, Y ) ∈ C } = Z
C
f(x, y)dxdy.
Funktiota
f (x, y)
kutsutaan satunnaismuuttujienX
jaY
yhdistetyksi ti-heysfunktioksi.On olemassa tilanteita, joissa tarkastellaan kahta eri
satunnaismuuttu-jaa yhdessä, mutta niillä ei ole vaikutusta toisiinsa. Tällöin tilanne vastaa
määritelmän 2.2.5 tilannetta,eli:
Määritelmä3.3.3. Olkoonsatunnaismuuttujilla
X
jaY
yhdistetty tiheysfunk-tiof (x, y)
, sekä reunatiheysfunktiotf X (x)
jaf Y (y)
. SatunnaismuuttujiaX
ja
Y
sanotaan tilastollisestiriippumattomiksijos ja vain josf(x, y) = f X (x)f Y (y)
kaikille
x ∈ X, y ∈ Y
.Lauseen 3.3.1 ja määritelmän 3.3.3 nojalla kahden riippumattoman
sa-tunnaismuuttujan odotusarvolle saadaanseuraava lauseke.
Propositio 3.3.4. Jos satunnaimuuttujat
X 1 ja X 2 ovat riippumattomia,
niin mielivaltaisillefunktioille g
ja h
on voimassa yhtälö
g
jah
on voimassa yhtälöE[g(X)h(Y )] = Eg(X)Eh(Y ).
Määritelmä3.3.5. Olkoon
(X 1 , X 2 )
kaksiulotteinensatunnaismuuttuja. Mää-ritelläänkaikilleei-negatiivisillekokonaisluvuillen 1 , n 2 luku
µ n 1 ,n 2 = E { (X 1 − EX 1 ) n 1 (X 2 − EX 2 ) n 2 }
olettaen, että odotusarvo on olemassa. Lukua
µ n 1 ,n 2 kutsutaan
satunnais-muuttujien
(X 1 , X 2 )
yhdistetyksi keskusmomentiksi , jonka kertaluokka onn 1 + n 2.
Esimerkki3.3.6. OlkoonX
= (X 1 , X 2 )
kaksiulotteinensatunnaismuuttuja.Määritelmän 3.3.5 nojalla
i.
µ 1,0 = µ 0,1 = 0
. Osoitetaan, ettäµ 1,0 = 0
.Nytµ 1,0 = E { (X 1 − EX 1 ) 1 (X 2 − EX 2 ) 0 }
= E { (X 1 − EX 1 ) · 1 }
= EX 1 − EX 1 = 0.
Vastaavastivoidaanosoittaa, että
µ 0,1 = 0
.ii.
µ 2,0 = V ar(X 1 )
jaµ 0,2 = V ar(X 2 )
. Kuten edellä, niin kohdassa ii.riittää näyttää vain toinen tapaus. Osoitetaan, että
µ 2,0 = V ar(X 1 )
.Tällöin
µ 2,0 = E { (X 1 − EX 1 ) 2 (X 2 − EX 2 ) 0 }
= E { (X 1 − EX 1 ) 2 · 1 }
= V ar(X 1 ).
iii.
µ 1,1 = E { (X 1 − EX 1 )(X 2 − EX 2 ) }
. Tällaistatoisen kertaluokan,µ 1,1,
yhdistettyä keskusmomenttia kutsutaan satunnaismuuttujien
X 1 , X 2
kovarianssiksi, ja se merkitään
cov(X 1 , X 2 )
.Esimerkin 3.3.6 kohdassa iii. esitetty määritelmä kovarianssille voidaan
laskea auki, jolloin saadaan käyttökelpoisempi yhtälö kovarianssin
määrit-tämiseksi.
Cov(X 1 , X 2 ) = E { (X 1 − EX 1 )(X 2 − EX 2 ) }
= E[X 1 X 2 − EX 1 X 2 − X 1 EX 2 + EX 1 EX 2 ]
= E(X 1 X 2 ) − EX 1 EX 2 − EX 1 EX 2 + EX 1 EX 2
= E(X 1 X 2 ) − EX 1 EX 2 .
Proposition3.3.4nojalla
Cov(X 1 , X 2 ) = 0
,jossatunnaismuuttujatX 1 , X 2
ovat riippumattomia. Kuitenkaan ei voida sanoa, että satunnaismuuttujat
ovat riippumattomia, jos niiden kovarianssi on nolla. Katso esimerkiksi [8,
th. 5.3.11℄.
Edelläesiteltykovarianssi tuleekäyttöönesimerkiksi laskettaessa kahden
mielivaltaisensatunnaismuuttujansumman varianssia.
V ar(X 1 + X 2 ) = E
[X 1 + X 2 − E(X 1 + X 2 )] 2
= E
[X 1 + X 2 − EX 1 − EX 2 ] 2
= E
[(X 1 − EX 1 ) + (X 2 − EX 2 )] 2
= E
(X 1 − EX 1 ) 2 + (X 2 − EX 2 ) 2 +2(X 1 − EX 1 )(X 2 − EX 2 )
= E
(X 1 − EX 1 ) 2 + E
(X 2 − EX 2 ) 2 +2E
(X 1 − EX 1 )(X 2 − EX 2 )
= V ar(X 1 ) + V ar(X 2 ) + 2Cov(X 1 , X 2 ).
Satunnaismuuttujien summan varianssi on siis yksittäisten varianssien
summa lisättynä kahdella kovarianssilla. Odotusarvot
EX 1 , EX 2 ∈ R
, ja voivat numeroarvoltaan vaihdella suuresti. Tällöin myös kovarianssin arvovoivaihdellasuuresti. Tällaisellatiedollavoiollahankalavertailla
esimerkik-sisitäkumpisatunnaismuuttuja,
A
vaiB
,korreloienemmän satunnaismuut-tujanC
kanssa. Tätä varten määritellään kerroin, jonka avulla vertailu on-nistuu.Määritelmä3.3.7. Satunnaismuuttujien
X 1 , X 2korrelaatiokerroin on muo-toa
ρ(X 1 , X 2 ) = Cov(X 1 , X 2 ) σ(X 1 )σ(X 2 ) .
Määritelmän 3.3.7 korrelaatiokertoimella on loistava ominaisuus, jonka
vuoksi sen käyttö on hyödyllistä vertailtaessa korrelaatioiden suuruuksia.
Kerroin saa nimittäinarvoja vain väliltä
[ − 1, 1]
.Lause 3.3.8. Korrelaatiokertoimelle
ρ
onosoitettavissaseuraavat ominaisu-udet:1.
− 1 ≤ ρ(X 1 , X 2 ) ≤ 1
2.
ρ(X 1 , X 2 ) = 1 ⇔ X σ(X 2 −EX 2 ) 2 = X σ(X 1 −EX 1
1 )
3.
ρ(X 1 , X 2 ) = − 1 ⇔ X σ(X 2 −EX 2 ) 2 = − X σ(X 1 −EX 1 ) 1
Todistus. Todistetaan tässä kohta 1. Muut kohdat katso [8,s. 123℄.
1. Oletetaan,ettäsatunnaismuuttujilla
X 1 , X 2onolemassavarianssitσ X 2 1 , σ X 2 2.
Korrelaatiokerroinmittaasatunnaismuuttujienlineaaristasuhdetta.Tämä
tarkoittaa sitä, positiivisella kertoimella muuttujan
X 1 kasvaessa myös X 2
kasvaa,javastaavastinegatiivisellakertoimellapäinvastoin.Lisäksimitä
lähem-mäsvälinpäätepisteitäkerroinon,niinsitävoimakkaampionriippuvuus,kun
taas arvo
0
indikoi riippumattomuutta.Luvun lopuksiesitälläänsatunnaismuuttujienehdollinenodotusarvo.Työssä
tutkitaan selitettävää muuttujaa
X
selittävillä muuttujillaY i, ja erityisesti
selitetään odotusarvoa EX
muuttujillaY i.
Määritelmä 3.4.1. Jos ehdollinen kertymäfunktio
F X|Y (x | y)
on jatkuva,niinsatunnaismuuttujan
X
ehdollinen odotusarvo ehdollaY
onE[X | Y = y] =
Z ∞
−∞
xf X |Y (x | y)dx
Huomioitavaaon,ettäodotusarvo
E[X | Y = y]
onvainpaljasluku,muttaE(X | Y )
onsatunnaismuuttuja.Lause3.4.2. Olettaen,ettäsuuretovatolemassa,niinmielivaltaisillediskreeteille
satunnaismuuttujille on voimassa yhtälö
EX = E[E(X | Y )].
Luvussa2.2esiteltymääritelmä2.2.1ehdollinentodennäköisyys on
sovel-lettevissa myös satunnaismuuttujien odotusarvoille. Oletetaan, että
satun-naismuuttujilla
X
jaY
on yhdistetty todennäköisyysjakauma. Tällöin sat-unnaismuuttujalleX
on määritelty ehdollinen todennäköisyysfunktiop X |Y
ehdolla
Y = y
siten,ettäp X|Y (x | y) = P { X = x | Y = y } = p(xy)
p Y (y) .
(3.4)Todistus. Lauseen todistamiseksionosoitettava,että ehto
EX = X
y
E[X | Y = y]P { Y = y }
X
y
E[X | Y = y]P { Y = y } = X
y
X
x
xP { X = x | Y = y } P { Y = y }
= X
y
X
x
x P { X = x, Y = y }
P { Y = y } P { Y = y }
= X
y
X
x
xP { X = x, Y = y }
= X
x
x X
y
P { X = x, Y = y }
= X
x
xP { X = x }
= EX
Lauseen 3.4.2 osoittama ominaisuus on vastaava kuin luvussa 2.2
es-itetyllä yhtälöllä 2.2. Nimittäin,satunnaismuuttujan
X
odotusarvo voidaanmääritellä niiden satunnaismuuttujan
Y
tapahtumien todennäköisyyksien 'painotettuna odotusarvona', joilleX
on ehdollistettu.Tässä luvussa on lyhyt kuvaus työssä käytetystä menetelmästä, eli
regres-sioanalyysista.Lisäksi esitellääntässä työssä käytetyt, regression tuottaman
mallinarviointiintarvittavatkäsitteet.Luvunteoriaonperäisinviitteistä[5℄,
[9℄, [12℄, [13℄, [15℄, [17℄, [19℄ ja [23℄
4.1 Menetelmä
Regressioanalyysi on tilastollinenmenetelmä, jolla estimoidaan paras
mah-dollinenselittävienmuuttujien
x iyhdistelmäennustettaessaselitettävää
muut-tujaa y
. Matematiikassa vastaavaa menetelmää kutsutaan nimellä
pienim-män neliösumman menetelmä. Tämäntyönmallinnuksessakäytetään
erityi-sesti lineaaristaregressiota. Yksinkertainen lineaarinen regressioonmuotoa
y = β 0 + β 1 x,
missä
y
onselitettävämuuttuja,x
onselittävämuuttuja jaβ 0 , β 1, jotkaovat
sovitettavatparametrit.Usean selittäjänregressiossa selittäviämuuttujiaon
useampia. Yleisesti kirjoitettuna
y = β 0 + β 1 x 1 + . . . + β p x p .
Puhuttaessa lineaarisesta regressiosta tarkoitetaan parametrien
lineaari-suutta,jokaonyksiniinkutsutuistaGauss-Markovinehdoista,jotkakuvaavat
ideaalisenregressiomallin.Lineaarisuusoletusvoidaanesittäämyös
ehdollise-na todennäköisyytenä
E(Y |X ) = X β,
missä
X
tarkoittaa kaikkien selittävien muuttujien muodostamaa matriisia jaβ
on parametrivektori. Tällöin yksittäisen selittävän muuttujanX i
yk-sikkömuutos onvakio
β i koko tarkastelujaksonyli. Toisin sanoen
∂E(Y |X )
∂X i
= β i .
Reaalimaailmanilmiöitätutkittaessa onhuomioitava,ettäluotumallion
aina (karkea) kuvaus alkuperäisestä ilmiöstä. Tämä tarkoittaa, että kaikkia
ilmiöönliittyviätekijöitäei ole edes mahdollista saati mielekästä sisällyttää
vatussaregressiossa tällaistavirheen mahdollisuuttaei oleotettuhuomioon.
Sitä kutsutaan tällön deterministiseksi.
Edellinen merkitsee siis sitä, että luodun mallin arvot eroavat tutkitun
aineiston havaintoarvoista. Tämä ei kuitenkaan tarkoita etteikö mielekästä
mallia olisi löydettävissä. On tyydyttävä malliin, joka on mahdollisimman
lähellä alkuperäistä aineistoa.Kun malliei täysin vastaa alkuperäistä
tilan-netta,niinsiihensanotaansisältyvänvirhettä.Kunhavaintopiste
y ion
etäisyy-den
r
päässämallin arvostay ˆ i, eli
r i = | y i − y ˆ i | ,
(4.1)niinparametri
r
onmallinsisältämävirhe1,jotakutsutaanjäännökseksi,eng.residual.
Ylimääräytyvä, eli ei-deterministinen, usean selittäjän regressio
kirjoite-taan muodossa
y = β 0 + β 1 x 1 + . . . + β p x p + r.
Jättämälläylläolevasta yhtälöstäpoisjäännöstermi
r
saadaanyhtälössä 4.1esiintyvä
y ˆ
,eliˆ
y = β 0 + β 1 x 1 + . . . + β p x p .
Mahdollisimmanhyväänmalliinpäästään minimoimallajäännös
r
.Jään-nöksen matriisiyhtälöonmuotoa
r = Y − X β.
Jäännösvektorin
r
pituus määritetäänEukleideen vektorinormillak r k 2 =
jota minimoidaan.Tästä ilmeisestinimitys pienin neliösumma.
Huomautus 4.1.1. Euklidinennormi on arkielämästäkaikille tuttu
etäisyys-mitta, missäkahden tasonpisteen
x 1 , x 2 välinen etäisyys y
onmääritetty
nii-den neliöiden summanneliöjuurena, eli
y = q
x 2 1 + x 2 2 .
1
Tilastollinen virhe tarkoittaamittaustuloksen jatutkittavan suureen 'todellisen'
ar-von erotusta, eikäse ole mittaajan havaittavissa.Jäännös on mallin antaman arvon ja
mittaustuloksen välinenerotus.
Normion yleistettävissä
n
-ulotteisiinavaruuksiin, jolloinse saa muodony = q
x 2 1 + x 2 2 + . . . + x 2 n .
Määritelmä 4.1.2. Olkoon
X β = Y
ylimääräytyväjoukkoyhtälöitä,missäX
onm × n
matriisi,m > n
. Pienimmän neliösumman menetelmä minimoi Euklidisennorminjäännösvektorinr
.Toisinsanoenβ
onoptimointiongelmanmin β k r k 2 = min
β k Y − X β k 2
ratkaisu.
Lause 4.1.3. Jos matriisin
X
sarakevektorit ovat lineaarisesti riippumatto-mia, niinmatriisi( X T X ) −1 on olemassa, jolloin optimointi ongelmalla
min β k Y − X β k 2
on yksikäsitteinen ratkaisu
X T X β = X T Y.
Todistus sivuutetaan, katso [9, s. 235 -236℄.
Otetaan seuraavaksi yksinkertainen esimerkki pienimmän neliösumman
käytöstä.
Esimerkki 4.1.4. Olkoon havaintoaineistona kolme tason pistettä
z 1 = (1, 6), z 2 = (2, 7)
jaz 3 = (3, 10)
. Oletetaan, että mitattua ilmiötä voidaankuvata suoralla
y = β 0 + β 1 · x
.Jäännöksen matriisiyhtälösaa siten muodonr = Y − X β =
Lauseen4.1.3nojallavirheterminminimisaadaanyksikäsitteisestiratkaistua,
josmatriisin
A
sarakevektoritovatlineaarisestiriippumattomia,eli( X T X ) −1
on olemassa.Huomataan, että tässä tapauksessa näin on. Tällöin
X T =
Matriisi
( X T X ) −1 on olemassa ja, ratkaisemalla esimerkiksi Gauss-Jordan -menetelmällä,on muotoa
( X T X ) −1 = 7
3 − 1
− 1 1 2
.
Yhtälöryhmän
X T X β = X T Y
ratkaisuksi saadaanβ = ( X T X ) −1 X T Y = 11
2 3
.
Ilmiötäparhaiten kuvaavasuoranyhtälö onsiismuotoa
y = 2x + 11 3 .
Kuva 5: Havaintopisteet
z i , i = 1, 2, 3
sekä PNS-sovitettu suoray
.Näinonsaatu jäännösvektori
r =
1/3
− 2/3 2/3
,
jolloinsen pituus
k r k 2 = 1
.Luvun lopuksi esitelläänjo edellä mainitutGauss-Markov ehdot.
Määritelmä4.1.5. SeuraaviaehtojakutsutaanGauss-Markovehdoiksi
use-an selittäjänregressiossa.
y = β 0 + β 1 x 1 + . . . + β k x k + r,
missä
β 0 , β 1 , . . . , β kovattuntemattomiaparametreja,jar
on"näkymätön"
satunnainen virhetermi.
2. Satunnaisotanta: On olemassa satunnaisotos, jossa on
n
havaintoa,{ (x i1 , x i2 , . . . , x in , y i ) : i = 1, 2, . . . , n }
, jotkaseuraavatoletuksesta 1.3. ei-Kollineaariset muuttujat: Selittävät muuttuja eivät saa olla
vakioi-ta, eikä yksikään selittävä muuttuja saa ollatäydellisessä lineaarisessa
riippuvuussuhteessa toiseenselittävään muuttujaan.
4. Ehdollinen odotusarvo: Virhetermin
r
ehdollinen odotusarvo on nollakaikillaselittävien muuttujanarvoilla.Toisin sanoen
E(r | x 1 , x 2 , . . . , x k ) = 0.
5. Homoskedastisuus:Virhetermin
r
varianssionvakiokaikillaselittävien muuttujan arvoilla,eliV ar(r | x 1 , x 2 , . . . , x k ) = σ 2 .
Nämä ehdot ovat olettamuksia, jotka toteutuessaan kuvaavat ideaalisen
regressiomallin.Koskatodellisuuseiuseinkaanvastaateoriaa,niinnäitä
olet-tamuksia eipidetä ehdottomina,vaan sellaisina, joitakohtion hyväpyrkiä.
4.2 Mallin arviointi
Edelläesitettypienimmänneliösummanmatemaattinentarkastelueiota
kan-taa saadunmallintilastollisistaominaisuuksista.Mallinhyvyyttä arvioidaan
erilaisilla tilastollisilla suureilla. Tässä työssä tehtyjä sovitteita on arvioitu
kolmen erisuureen avulla.Ne ovatselitysaste,
R 2, t-testi ja F-statistiikka.
4.2.1 Varianssien vertailu
Muokkaamallayhtälöä 4.1saadaanhavaintoarvo
y i kirjoitettuasovitetun
ar-vony ˆ i ja jäännöstermin r i summana
r i summana
y i = ˆ y i + ˆ r i .
Määritelmän 4.1.5 mukaan jäännöksen ehdollinen odotusarvo
E(r | x i ) = 0
,ja koska
Cov(ˆ y i , r) = E(ˆ y i r) = 0
([23, s. 29 - 34℄), niin tutkittaessa pienim-män neliösumman ominaisuuksia, sovitetta ja virhetermiä voidaankäsitel-lä erikseen. Määritelläännytsuureita, joiden avulla kyetään tarkastelemaan
regressiomallinhyvyyttä.
Määritelmä4.2.1. Olkoon
y
havaintoaineistonkeskiarvo,y i
havaintoasineis-ton i
:s havainto,y ˆ i selitetty arvo i
sekä r i jäännös havainnollei
. Olkoon
i
sekär i jäännös havainnollei
. Olkoon
LyhenneSSTtuleesanoistatotal sumofsquares,jasemittaa
havaintoaineis-ton vaihtelua. SSE, eli explained sum of squares, mittaa selitettyjen arvojen
vaihtelua,jaSSR, residualsum of squares, onniinsanottu
jäännösneliösum-ma. SST voidaan aina ilmaistatermien SSE ja SSR summana, eli
SST = SSE + SSR.
(4.5)Tätä yhtälöä käytetään hyväksi määritettäessä sitä kuinka hyvin
selit-tävät muuttuja kuvaavat selitettäväa muuttujaa. Olettaen, että SST
6 = 0
,niinyhtälö4.5 voidaan jakaa termilläSST, jolloinsaadaanaikaiseksi yhtälö
1 = SSE
SST + SSR SST .
Määritelmä 4.2.2. Regressiomallin selitysaste
R 2 määritelläänyhtälönä
R 2 = SSE
SST = 1 − SSR SST .
Jos termit SST ja SSE jaetaan luvulla
n − 1
, niin saadaan sekäalku-peräisenettä selitettyjen arvojen varianssit. Mallinselitysaste voidaan siten
tulkita aineiston selitettyjen ja havaittujen arvojen varianssien suhteeksi.
Yksittäisen parametrin merkitsevyyden arvioimiseenkäytetään niin
kutsut-tuat-testiä.Merkitsevyystesteillätutkitaanmallinparametrien
luotettavuut-ta. Yleensä testit perustuvat suuriin aineistoihin, jotka ovat likimain
nor-maalijakautuneita. Kuitenkin luotettavuustestejä tehdään myös aineistoille,
jotka ovat "vähemmän"normaalijakautuneita.Tällöin testiin sovelletaan
lu-vussa3.2esitettyäStudent'injakaumaa.Jakaumamuistuttaa
normaalijakau-maa, mutta sillä on suurempi vaihteluväli. Aineiston koosta riippuen sillä
sanotaan olevan vapausaste
n − 1
, missän
on havaintoarvojen lukumäärä.Mitä suurempi
n
, sitälähempänä jakaumaon normaalijakaumaa.Määritelmä 4.2.3. Olkoon
β 0 ja β 1 yksinkertaisen regression tuottamat
parametrit.Tällöinkyseistenparametrienstandardivirheetsaadaanyhtälöistä
se b 0 = ˆ σ s
1
n + x 2
P (x i − x) 2 (4.6)
se b 1 = σ ˆ
pP (x i − x) 2 ,
(4.7)missä
σ ˆ
onaineistostaestimoituvaihteluväli.Vaihteluvälivoidaanlaskea esi-merkiksi yhtälöstä 4.4 siten, ettäσ ˆ 2 = SSR n − 2 ,
missä
n
onhavaintojen lukumäärä.Standardivirheitä käytetään parametriarvojen luottamusvälien
määrit-tämisessä.
Määritelmä 4.2.4. Parametrien
β 0 jaβ 1 luottamusvälit ovatmuotoa
b 0 ± t ∗ se b 0 (4.8)
b 1 ± t ∗ se b 1 ,
(4.9)missä
t ∗ onvapausasteenn − 2
omaavanStudent'in jakaumanargumentti,eli
määrittelyjoukonalkio, kriitiselläarvolla(1 − c)/2
. c
ontestaukseen valittu
luottamustaso,esimerkiksi 95tai 99%
halutaan tarkastella parametrin merkitsevyyttä arvon
β 1 molemminpuolin.
Tällöin kyseessä on niinsanottukaksipuoleinen t-testi, katso Kuva 6.Tämä
menetelmä onollutkäytössä myöhemminesitetyissä merkitsevyystestien
tu-loksissa. Joskus on mielekästä tarkastella vain toispuoleisia raja-arvoja,
jol-loinkriittinen arvo määritellääntoisin.
Kuva6:Erään Studentin jakaumankriittisetarvot (2.228)kaksipuoleisessa
t-testissä valitulla luottamusvälillä . Keskellä oleva valkoinen alue kattaa
jakaumanpinta-alasta%:a ja keltaisethännäterikseen alan
(1 − c)/2
%:a.Luottamusvälinmäärittelyäkäytetäänsilloinkunhalutaan testata
hypo-teesia
H 0 : β 1 = 0
. Tällöinlasketaanarvot = b 1
se b 1
.
Jos arvo
t
on itseisarvoltaan suurempi kuint ∗, niin tällöin hypoteesi H 0
hylätään,jatarkasteltuparametriontilastollisestimerkitsevä.Vastaava
tarkas-telu tehdään hypoteesille
H 0 : β 0 = 0
.Huomautus 4.2.5. Hypoteesilla tarkoitetaan yleisesti jotain väitettä, jonka
totuusarvostaollaankiinnostuneita.Tämäntyönkannaltaonolennaista
esit-tää niin kutsuttu nollahypoteesi
H 0 : β j = 0
sekä vaihtoehtohypoteesiH a : β j 6 = 0
. JoshypoteesiaH 0 ei hylätä, niin tällöin parametrilla eikatsota
ole-vantilastollista merkitsevyyttä, jolloin parametri β j, selittävä muuttuja x j,
x j,
hylätään mallista.Jos
H 0 hylätään,niinhypoteesiH a valitaan,ja parametri
β j ontätentilastollisestimerkitsevä.Hypoteeseihineitässäperehdytäyhtään tämän tarkemmin.
Usean selittävän muuttujan regressiossa jokaiselle parametrille
β j
laske-taan myös omat standardivirheet. Vakion virheyhtälö on sama kuin
Määri-telmässä 4.2.3.
Määritelmä 4.2.6. Regressiokertoimen
β j standardivirhe saadaanyhtälön
se b j = σ ˆ
q SST j (1 − R j 2 )
nojalla,missä
SST j on selittävän muuttujan X j total sum of squares, ja R 2 j
R 2 j
on osittaisselitysaste 2
muuttujalle
X j. Vaihteluväli ˆ σ
saadaan tällä kertaa
yhtälöstä
σ ˆ 2 = SSR n − k − 1 ,
missä
p
onselittävien(riippumattomien)muuttujienlukumäärä.Parametrin
β jluottamusvälisaadaanvastaavallayhtälölläkuinMääritelmässä
4.2.4. Tällöin Student'in jakauman vapausaste on kuitenkin n − k − 1 = n − (p + 1)
. Huomataan, että vapausaste määritellään havaintoarvojen ja
etsittävien parametrienlukumäärän erotuksena. Jos selittäviämuuttujia on
yksi, niin vapausasteeksi saadaan
n − 2
kuten Määritelmässä 4.2.4. Hypo-teesinH 0 : β j = 0
arviointi toteutetaankuten edellä on esitetty.4.2.3 Mallin merkitsevyys
Edellä tarkasteltiin yksittäisen parametriestimaatinmerkitsevyyttä. Tämän
lisäksionmielekästätarkastellamallinmerkitsevyyttämyöskokonaisuutena.
Tällöin tarkastellaan yhtäaikaa kaikkien muuttujien parametriestimaatteja.
Nollahypoteesiväittämäsaa tällöin muodon
H 0 = β k−q+1 = 0, . . . , β k = 0,
jokapoissulkeeselittäviämuuttujiaregressiostamäärän
q
.Nollahypoteesion totta vainsilloin, joskaikki tarkastellutparametrit ovattilastollisestimerki-tyksettömiä. Vaihtoehtohypoteesi toteutuu, jos edes yhden parametrin arvo
on nollastapoikkeava. Tarkasteltavaksijäi niinkutsuttu rajoitettumalli 3
2
Osittaisselitysasteenmääritelmääeitässäesitetä.Kiinnostuneillevinkiksitutkia
kir-jallisuutta, jossa käsitellään usean selittäjän regressiota,eng. multiple linear regression,
tai internetistähakusanallapartialoeientof determination
3
Alkuperäiseenmalliinviitataantermillärajoittamatonmalli
y = β 0 + β 1 x 1 + · · · + β k−q x k−q + r.
Määritelmä 4.2.7. Regressiomallin F-statistiikka määritelläänyhtälönä
F ≡ (SSR r − SSR ur )/q SSR ur /(n − k − 1) ,
missä alaviite
r
tarkoittaa rajoitettua ja alaviiteur
rajoittamatonta, alku-peräistä,mallia.Saatua tulosta verrataan jakaumaan
F q,n−k−1 valitulla luottamustasolla, ja verrataan saatua tulosta kriitiseen arvoon. Jos saatu tulos on suurempi
kuin kriittinenarvo,niinnollahypoteesi voidaanhylätä.
Huomautus 4.2.8. Määritelmässä3.2.14F-jakaumamääriteltiin
parametreil-la
n 1 , n 2. Määritelmän 4.2.7 mukaisesti laskettua arvoa F
verrataan siis
sel-laiseen F-jakaumaan, joka määritellään siten, että jakauman ensimmäisen
parametriarvoon
q
ja toinenn − k − 1
.Tässä luvussa määritelläänpankkien kohtaamat riskitja tarkastellaan
vaka-varaisuusriskiltäsuojautumiseenkehitettyäriskimittaasekätarkastellaansen
hyviä ja huonoja puolia. Luvun lopuksi kerrotaan lyhyesti eurooppalaisesta
pankkisäätelykomiteasta, joka muun muassa suosittelee kyseisen riskimitan
käyttöönottoa.Lähteinäluvunkirjoittamiseenonkäytettyseuraaviaviitteitä:
[1℄, [2℄, [3℄, [7℄, [10℄, [14℄ ja [21℄.
5.1 Vakavaraisuusriski
Tuloslaskelma kuvaa yrityksen rahavirtoja, eli yritykseen tulleiden ja sieltä
poistuneiden rahojen määriä, esimerkiksi tilikauden tai kvartaalin ajalta.
Kaikkivirratsummattunayhteensaadaanyrityksenkyseisentilikauden
voit-totaitappio.Pankin tuloslaskelmastalöytyviävirtojaonmuunmuassa
kor-kotulot ja -menotsekä niinsanotutalaskirjaukset, elisijoituksista koituneet
tappiot.Tase puolestaanesittääpankinvarallisuudenjollakintietyllä
hetkel-lä.Tällöinkirjataanylösmuunmuassapankinmyöntämienlainojen,käteisen
varallisuuden tai talletusten kokonaismäärät. Taseesta ei siten selviä miten
esimerkiksitalletustenkokonaismääräonvaihdellutedellisestä
tarkasteluhet-kestä. Tuloslaskelma ja tase ovat yhteydessä toisiinsa siten, että kunkin
ti-likaudenvoitto tai tappio lisätääntaseen omaan pääomaan. Aineiston
tase-eristä tarkemmin luvussa 6.1
Viitteessä [14℄ pankkitoiminnalle on määritelty neljäerilaista riskiä,
joi-ta se kohtaa tavoitellessaan voittoja osakkeenomistajien varallisuuden
kas-vattamiseksi. Nämä ovat luottoriski, korkoriski, operationaalinen riski sekä
likviditeettiriski.Tämä luokittelueioleyksikäsitteinen vaan kirjallisuudessa
luokitteluja on useita erilaisia. Kuitenkin kaikki pankin, ja muidenkin
yri-tysten, riskitonjohdettavissa niidentaseistaja tuloslaskelmista.Nämäovat
vakavaraisuus- sekä liiketoimintariski.
Liiketoimintariski on tuloslaskelmaan kuuluva riski. Esimerkiksi,
korko-riskirealisoituutuloslaskelmaan,josanto-jaottolainauskoronvälinenerotus
pienenee. Suuriosa säästä- ja osuusliikepankkien luotoista on pitkäaikaisia
ja kiinteäkorkoisia, esimerkiksi asuntolainoja. Jos näiden lainojen rahoitus
hoidetaan lyhyillä javaihtuvakorkoisillarahoitusratkaisuilla,ja
markkinako-rko nouseemerkittävästi.
Tasesiisesittääpankin(yrityksen)varallisuustilannetta.Täten
vakavarai-suusriski liittyy pankin (yrityksen) taseeseen. Vakavaraisuusriskiin sisältyy
teutuessa pankinvaratalenevatsuhteessa velkoihin,esimerkiksi
luottotappi-oiden muodossa. On myös muita vakavaraisuuteen liittyviä riskien
realisoi-tumistapoja,joihinedelläesiteltyäluokitteluaonvaikeampisoveltaa.
Tälläi-nen onesimerkiksi taseenulkopuolisistaerissä,kuten
johdannaissopimuksis-sa, piilevätriskit.
5.2 Vähimmäisomavaraisuusaste
Rahoituslaitoksenonmahdollistalisätätuotto-odotuksiaanvipuvaikutuksen
avulla,kuinmitä sen oma pääomamahdollistaa.Vipuvaikutuksen
luomisel-le on kolme vaihtoehtoa. Taseen vipuvaikutus on yleisimmin tunnettu ja
käytetty muoto. Se syntyy kunyrityksen varallisuusylittääoman pääoman.
Pankeilletämäyleensätarkoittaalainoittamistaomaapääomaasuuremmalla
määrällä.Taloudellinenvipuvaikutus tarkoittaapankinaltistumistasellaisille
varallisuuden arvon muutoksille, jotka ovat suurempia kuin siitä maksettu
määrä. Sisäsyntyinen vipuvaikutus tarkoittaa tilannetta, jossa positiosta on
enemmän vastattavaa kuinonsen markkina-arvo.
Viime vuosien nanssikriisin alkulähteenä pidetään pankkisektorin
luo-maa liiallistavipuvaikutusta,sekä taseeseen että taseen ulkopuolisiinosiin.
Tästä syystäomavaraisuusaste onnostettu Baselinpankkivalvontakomitean
(Basel Committee of Banking Supervision, BCBS) toimesta yhdeksi
uudek-sisäännellyksitunnusluvuksi,jollavastaavatkriisitvoitaisiintulevaisuudessa
välttää.BCBS:ntavoitteenaonluodaomavaraisuusasteenlaskemiselle
kansal-lisista laeista ja kirjanpitotavoista riippumaton määritelmä, jolloin se olisi
kansainvälisesti vertailukelpoinen. Muun muassa Euroopan parlamentti on
ottanutkantaa päätöslauselmassaanomavaraisuusasteen sääntelynpuolesta.
Käytännössäomavaraisuusasteelleasetetaanjokinalaraja,jatällöinkäytetään
termiä vähimmäisomavaraisuusaste.
Mitenomavaraisuusastesittenonmääritelty?Koskaseonsäännelty
suu-re, niin määritelmä riippuu aina sääntelijän päätöksestä, eli siitä mitä
sii-hen halutaan sisällyttää. Yhteistä määritelmilleonse, että
omavaraisuusas-teen halutaan olevan ei-riskiperustainen suure. Laskennassa ei siis käytetä
minkäänlaisia kertoimia eri varallisuus- tai velkaerien suhteellisten riskien
huomioimiseksi.BCBS:nraportissa189onyksityiskohtaisetohjeet
omavarai-suusasteen laskemisen perusteista, sekä ehdotus 3 % vähimmäisvaateesta
vuosien2013-2017välisenäaikanatoteutettavalletestijaksolle.Ehdoissa
ote-taan huomioonsekä taseeseen kuuluvat erät että monia taseen ulkopuolisia
Maailmanpankin julkaiseman tiedotteen mukaan omavaraisuusaste
las-ketaan jakamalla pankin Tier 1-varallisuus pankin sovitetulla varal
lisuudel-la, merkitään
Ass adj, elikokonaisvarallisuudella,jostaonvähennetty aineet-tomathyödykkeet
4
.Tier1varallisuussisältääomanpääomanlisättynäpankin
reserveilläsekä vähennettynäaineettomilla hyödykkeillä.Yhtälönä edellinen
on muotoa
OA = T ier1 Ass adj
=
oma pääoma +reservit - aineettomathyödykkeet Varat -aineettomat hyödykkeet.
(5.1)Vähimmäisomavaraisuusasteon ollut jo käytössä muun muassa
Pohjois-Amerikassa. Sen käyttöä on sovellettu eri tavalla niin Yhdysvalloissa kuin
Kanadassa. Lisäksi ensimmäisen maana euroopassa sen käyttöönotosta on
päättänyt Sveitsi. Yhdysvalloissa käytössä oleva malliyksinkertaisesti vaatii
pankilla olevanomaa pääomaa5 % varallisuudestaan. Erityisen
mielenkiin-toista on se, että nykyinen rahoituskriisi sai alkunsa juuri Yhdysvalloista,
jossa vähimmäisomavaraisuusasteen sääntely onjo ollut käytössä.
5.2.1 Vahvuudet
LuottoluokitusyhtiöStandard&Poors:nmukaanvähimmäisomavaraisuusaste
voi ollahyödyllinen lisäväline pankkien riskiarviointiin, erityisesti
riskipääo-manmittaamiseen.Tämävaatiivarallisuusmitaltalaajaamuttatarkkaa
mää-rittelyä,jolloinuseattaloudensuhdeluvuttulevatkansainvälisesti
vertailukel-poisemmiksi.Lisäksi pankkitoiminnanläpinäkyvyys ja erilaisten aineistojen
julkisuus ovat elintärkeitä vähimmäisomavaraisuusasteen hyödyllisyydelle.
Vähimmäisomavaraisuusastevoi ollasäätelijöidentoivoma vastasyklinen
suhdeluku. Ajatuksena on luoda pankeille pääomavaateita, jotka kasvavat
taloudellisestihyvinä aikoina javastaavastipienenevättaantumassa.Tämän
tarkoituksenaonhillitäluotonantoataloudellisenbuuminaikanayrittäen
es-tää markkinoiden niin kutsuttua ylikuumenemista. Omavaraisuusasteen on
empiirisesti kuitenkin todettu olevanmyötäsyklinen.Noususuhdanteessa
ra-hapolitiikka on usein liian löysää, jolloin pankit kasvattavat taseitaan, eli
4
Aineettomiinhyödykkeisiinluetaanmukaanliikearvo,ohjelmistokulutsekä
laskennal-liset verosaamiset. Liikearvo on arvio yrityksen tuotto- ja substanssiarvon erotuksesta,
eikäsitätässähuomioida.Ohjelmistokulutkuuluvattase-eräänaineettomathyödykkeet,ja
laskennallisetverosaamisetonomaeränsä,katsoluku6.1
usaste pienenee. Vastaavastihuonoinaaikoina lainoitus-ja sijoitustoimintaa
vähennetään tappioiden pelossa, joka taas kasvattaa omavaraisuusastetta.
Valvontaviranomaisetvoivatyrittäävaikuttaamyötäsyklisyydenpoistamiseen
esimerkiksi muuttamalla vähimmäisomavaraisuusasteen kriteereitä
talousti-lanteen mukaan tai asettamalla esimerkiksi pitkän aikavälin tavoitetasoja.
Viranomaisten ratkaisujen, kuten lainsäädännön muutoksien, tarkoituksena
onestääkriisientoistuminen,muttauudistuksissavoimyöspiilläuusien
krii-sien siemen.
5.2.2 Heikkoudet
VOA eiolelopullinenratkaisuetsittäessä työkalujauusienpankkikriisien
es-tämiseksi.Senheikkouksiksionesitettyuseitaväitteitä.Ehdotettumääritelmä
VOA:lle ei erottele pankkien varallisuuksia riskien mukaan, joka voi tuoda
mukanaan epätoivottuja kannustimia. Ilman erillisiä sääntelymekanismeja,
kuten BASEL I ja II, pankit saattavatesimerkiksi kasvattaa taseitaan
riski-pitoisemmilla tuotteillasuurempientuottojen toivossa.
Toiseksi VOA eisisällätaseen ulkopuolisiaeriälainkaan. Onarvioitu,
et-täOBS vipuvaikutusonhuomattava,silläne ovatjoissaintapauksissa olleet
yhtäsuuriakuintaseenvastattavaa-osa.Esimerkkitällaisistaonmuun
muas-sa johdannaisriskit, joiden tulisi olla avainasemassa vivuttamisen
määrit-telyssä. Onkin mielenkiintoistaVOA:en kannalta, että nykyinen talouskriisi
onlähtöisinYhdysvalloista,jossaVOA onollutkäytössäjo pidemmänaikaa.
onlähtöisinYhdysvalloista,jossaVOA onollutkäytössäjo pidemmänaikaa.