Usean satunnaismuuttujan momentit

Edellä on käsitelty yksittäisen eli yksiulotteisen satunnaismuuttujan

mo-mentteja.Käytännönsovelluksissaollaankuitenkinuseinkiinnostuneita

kah-den tai useamman satunnaismuuttujan keskinäisistä riippuvuuksista. Tästä

syystä laajennammekäsittelynkoskemaan satunnaismuuttujienyhdistettyjä

momentteja,taimoniulotteisensatunnaismuuttujanmomentteja. Aloitetaan

esittelemällä lauseelle 3.2.3 analoginen tulos, joka tässä yhteydessä jätetään

todistamatta.

Lause3.3.1. Olkoon

(X 1 , . . . , X n )

n-ulotteinensatunnaismuuttuja,jaolkoon

E[g(X 1 , . . . , X n )]

^olemassa. ^Tällöin

Ennen käsittelyn ulottamista n-ulotteisten satunnaismuuttujien muihin

momentteihinotetaankatsaustilanteeseen,jossaollaankiinnostuneita

satun-naismuuttujientapahtumienyhtäaikaisestasattumisestajasen

todennäköisyy-destä.

Määritelmä 3.3.2. Satunnaismuuttujien

X

^ja

Y

^sanotaan^olevan^yhteisesti

jatkuvia, jos kaikille reaaliluvuille

x

^ja

y

^on ^olemassa ^funktio

f (x, y)

^, ^jonka

kaikillereaalilukuparijoukoille

C ⊂ R ²

onvoimassa yhtälö.

P { (X, Y ) ∈ C } = Z

C

f(x, y)dxdy.

Funktiota

f (x, y)

^kutsutaan satunnaismuuttujien

X

^ja

Y

yhdistetyksi ti-heysfunktioksi.

On olemassa tilanteita, joissa tarkastellaan kahta eri

satunnaismuuttu-jaa yhdessä, mutta niillä ei ole vaikutusta toisiinsa. Tällöin tilanne vastaa

määritelmän 2.2.5 tilannetta,eli:

Määritelmä3.3.3. Olkoonsatunnaismuuttujilla

X

^ja

Y

^yhdistetty tiheysfunk-tio

f (x, y)

^, ^sekä reunatiheysfunktiot

f X (x)

^ja

f Y (y)

^. Satunnaismuuttujia

X

Y

^sanotaan tilastollisestiriippumattomiksijos ja vain jos

f(x, y) = f _X (x)f _Y (y)

kaikille

x ∈ X, y ∈ Y

Lauseen 3.3.1 ja määritelmän 3.3.3 nojalla kahden riippumattoman

sa-tunnaismuuttujan odotusarvolle saadaanseuraava lauseke.

Propositio 3.3.4. Jos satunnaimuuttujat

X 1

^ja

X 2

^ovat riippumattomia, niin mielivaltaisillefunktioille

g

^ja

h

^on ^voimassa ^yhtälö

E[g(X)h(Y )] = Eg(X)Eh(Y ).

Määritelmä3.3.5. Olkoon

(X 1 , X 2 )

kaksiulotteinensatunnaismuuttuja. Mää-ritelläänkaikilleei-negatiivisillekokonaisluvuille

n 1 , n 2

^luku

µ n 1 ,n 2 = E { (X 1 − EX 1 ) ⁿ ¹ (X 2 − EX 2 ) ⁿ ² }

olettaen, että odotusarvo on olemassa. Lukua

µ n 1 ,n 2

^kutsutaan

satunnais-muuttujien

(X ₁ , X ₂ )

yhdistetyksi keskusmomentiksi , jonka kertaluokka on

n 1 + n 2

Esimerkki3.3.6. OlkoonX

= (X ₁ , X ₂ )

kaksiulotteinensatunnaismuuttuja.

Määritelmän 3.3.5 nojalla

µ 1,0 = µ 0,1 = 0

^. Osoitetaan, että

µ 1,0 = 0

^.^Nyt

µ 1,0 = E { (X 1 − EX 1 ) ¹ (X 2 − EX 2 ) ⁰ }

= E { (X 1 − EX 1 ) · 1 }

= EX 1 − EX 1 = 0.

Vastaavastivoidaanosoittaa, että

µ 0,1 = 0

ii.

µ 2,0 = V ar(X 1 )

^ja

µ 0,2 = V ar(X 2 )

^. ^Kuten ^edellä, ⁿⁱⁱⁿ ^kohdassa ^ii.

riittää näyttää vain toinen tapaus. Osoitetaan, että

µ _2,0 = V ar(X ₁ )

Tällöin

µ 2,0 = E { (X 1 − EX 1 ) ² (X 2 − EX 2 ) ⁰ }

= E { (X 1 − EX 1 ) ² · 1 }

= V ar(X 1 ).

iii.

µ 1,1 = E { (X 1 − EX 1 )(X 2 − EX 2 ) }

^. ^Tällaista^toisen kertaluokan,

µ 1,1

yhdistettyä keskusmomenttia kutsutaan satunnaismuuttujien

X 1 , X 2

kovarianssiksi, ja se merkitään

cov(X 1 , X 2 )

Esimerkin 3.3.6 kohdassa iii. esitetty määritelmä kovarianssille voidaan

laskea auki, jolloin saadaan käyttökelpoisempi yhtälö kovarianssin

määrit-tämiseksi.

Cov(X ₁ , X ₂ ) = E { (X ₁ − EX ₁ )(X ₂ − EX ₂ ) }

= E[X ₁ X ₂ − EX ₁ X ₂ − X ₁ EX ₂ + EX ₁ EX ₂ ]

= E(X 1 X 2 ) − EX 1 EX 2 − EX 1 EX 2 + EX 1 EX 2

= E(X 1 X 2 ) − EX 1 EX 2 .

Proposition3.3.4nojalla

Cov(X 1 , X 2 ) = 0

^,^jossatunnaismuuttujat

X 1 , X 2

ovat riippumattomia. Kuitenkaan ei voida sanoa, että satunnaismuuttujat

ovat riippumattomia, jos niiden kovarianssi on nolla. Katso esimerkiksi [8,

th. 5.3.11℄.

Edelläesiteltykovarianssi tuleekäyttöönesimerkiksi laskettaessa kahden

mielivaltaisensatunnaismuuttujansumman varianssia.

V ar(X 1 + X 2 ) = E

[X 1 + X 2 − E(X 1 + X 2 )] ²

= E

[X 1 + X 2 − EX 1 − EX 2 ] ²

= E

[(X 1 − EX 1 ) + (X 2 − EX 2 )] ²

= E

(X 1 − EX 1 ) ² + (X 2 − EX 2 ) ² +2(X ₁ − EX ₁ )(X ₂ − EX ₂ )

= E

(X ₁ − EX ₁ ) ² + E

(X ₂ − EX ₂ ) ² +2E

(X 1 − EX 1 )(X 2 − EX 2 )

= V ar(X 1 ) + V ar(X 2 ) + 2Cov(X 1 , X 2 ).

Satunnaismuuttujien summan varianssi on siis yksittäisten varianssien

summa lisättynä kahdella kovarianssilla. Odotusarvot

EX 1 , EX 2 ∈ R

, ja voivat numeroarvoltaan vaihdella suuresti. Tällöin myös kovarianssin arvo

voivaihdellasuuresti. Tällaisellatiedollavoiollahankalavertailla

esimerkik-sisitäkumpisatunnaismuuttuja,

A

^vai

B

^,^korreloi^enemmän satunnaismuut-tujan

C

^kanssa. ^Tätä ^varten määritellään kerroin, jonka avulla vertailu on-nistuu.

Määritelmä3.3.7. Satunnaismuuttujien

X 1 , X 2

korrelaatiokerroin on muo-toa

ρ(X 1 , X 2 ) = Cov(X ₁ , X ₂ ) σ(X 1 )σ(X 2 ) .

Määritelmän 3.3.7 korrelaatiokertoimella on loistava ominaisuus, jonka

vuoksi sen käyttö on hyödyllistä vertailtaessa korrelaatioiden suuruuksia.

Kerroin saa nimittäinarvoja vain väliltä

[ − 1, 1]

Lause 3.3.8. Korrelaatiokertoimelle

ρ

^onosoitettavissaseuraavat ominaisu-udet:

− 1 ≤ ρ(X 1 , X 2 ) ≤ 1

ρ(X 1 , X 2 ) = 1 ⇔ ^X _σ(X ² ^−EX ₂ ₎ ² = ^X _σ(X ¹ ^−EX ¹

1 )

ρ(X 1 , X 2 ) = − 1 ⇔ ^X _σ(X ² ^−EX ₂ ₎ ² = − ^X _σ(X ¹ ^−EX ₁ ₎ ¹

Todistus. Todistetaan tässä kohta 1. Muut kohdat katso [8,s. 123℄.

1. Oletetaan,ettäsatunnaismuuttujilla

X 1 , X 2

^on^olemassa^varianssit

σ _X ² ₁ , σ _X ² ₂

Korrelaatiokerroinmittaasatunnaismuuttujienlineaaristasuhdetta.Tämä

tarkoittaa sitä, positiivisella kertoimella muuttujan

X 1

^kasv^aessa ^myös

X 2

kasvaa,javastaavastinegatiivisellakertoimellapäinvastoin.Lisäksimitä

lähem-mäsvälinpäätepisteitäkerroinon,niinsitävoimakkaampionriippuvuus,kun

taas arvo

0

^indikoi riippumattomuutta.

Luvun lopuksiesitälläänsatunnaismuuttujienehdollinenodotusarvo.Työssä

tutkitaan selitettävää muuttujaa

X

selittävillä muuttujilla

Y i

^, ^ja erityisesti selitetään odotusarvoa

EX

muuttujilla

Y i

Määritelmä 3.4.1. Jos ehdollinen kertymäfunktio

F _X|Y (x | y)

^on ^jatkuva,

niinsatunnaismuuttujan

X

^ehdollinen ^odotusarvo ^ehdolla

Y

^on

E[X | Y = y] =

Z ∞

−∞

xf X |Y (x | y)dx

Huomioitavaaon,ettäodotusarvo

E[X | Y = y]

^on^vain^paljas^luku,^mutta

E(X | Y )

^onsatunnaismuuttuja.

Lause3.4.2. Olettaen,ettäsuuretovatolemassa,niinmielivaltaisillediskreeteille

satunnaismuuttujille on voimassa yhtälö

EX = E[E(X | Y )].

Luvussa2.2esiteltymääritelmä2.2.1ehdollinentodennäköisyys on

sovel-lettevissa myös satunnaismuuttujien odotusarvoille. Oletetaan, että

satun-naismuuttujilla

X

^ja

Y

^on ^yhdistetty todennäköisyysjakauma. Tällöin sat-unnaismuuttujalle

X

^on ^määritelty ^ehdollinen todennäköisyysfunktio

p _X _|Y

ehdolla

Y = y

^siten,^että

p _X|Y (x | y) = P { X = x | Y = y } = p(xy)

p Y (y) .

^(3.4)

Todistus. Lauseen todistamiseksionosoitettava,että ehto

EX = X

y

E[X | Y = y]P { Y = y }

X

y

E[X | Y = y]P { Y = y } = X

y

X

x

xP { X = x | Y = y } P { Y = y }

= X

y

X

x

x P { X = x, Y = y }

P { Y = y } P { Y = y }

= X

y

X

x

xP { X = x, Y = y }

= X

x

x X

y

P { X = x, Y = y }

= X

x

xP { X = x }

= EX

Lauseen 3.4.2 osoittama ominaisuus on vastaava kuin luvussa 2.2

es-itetyllä yhtälöllä 2.2. Nimittäin,satunnaismuuttujan

X

^odotusarvo ^voidaan

määritellä niiden satunnaismuuttujan

Y

tapahtumien todennäköisyyksien 'painotettuna odotusarvona', joille

X

^on ehdollistettu.

Tässä luvussa on lyhyt kuvaus työssä käytetystä menetelmästä, eli

regres-sioanalyysista.Lisäksi esitellääntässä työssä käytetyt, regression tuottaman

mallinarviointiintarvittavatkäsitteet.Luvunteoriaonperäisinviitteistä[5℄,

[9℄, [12℄, [13℄, [15℄, [17℄, [19℄ ja [23℄

4.1 Menetelmä

Regressioanalyysi on tilastollinenmenetelmä, jolla estimoidaan paras

mah-dollinenselittävienmuuttujien

x _i

^yhdistelmäennustettaessaselitettävää muut-tujaa

y

^. Matematiikassa vastaavaa menetelmää kutsutaan nimellä pienim-män neliösumman menetelmä. Tämäntyönmallinnuksessakäytetään

erityi-sesti lineaaristaregressiota. Yksinkertainen lineaarinen regressioonmuotoa

y = β 0 + β 1 x,

missä

y

^onselitettävämuuttuja,

x

^on^selittävä^muuttuja ^ja

β 0 , β 1

^, ^jotka^ovat

sovitettavatparametrit.Usean selittäjänregressiossa selittäviämuuttujiaon

useampia. Yleisesti kirjoitettuna

y = β 0 + β 1 x 1 + . . . + β p x p .

Puhuttaessa lineaarisesta regressiosta tarkoitetaan parametrien

lineaari-suutta,jokaonyksiniinkutsutuistaGauss-Markovinehdoista,jotkakuvaavat

ideaalisenregressiomallin.Lineaarisuusoletusvoidaanesittäämyös

ehdollise-na todennäköisyytenä

E(Y |X ) = X β,

missä

X

^tarkoittaa ^kaikkien selittävien muuttujien muodostamaa matriisia ja

β

^on parametrivektori. Tällöin yksittäisen selittävän muuttujan

X i

yk-sikkömuutos onvakio

β i

^koko tarkastelujaksonyli. Toisin sanoen

∂E(Y |X )

∂X i

= β i .

Reaalimaailmanilmiöitätutkittaessa onhuomioitava,ettäluotumallion

aina (karkea) kuvaus alkuperäisestä ilmiöstä. Tämä tarkoittaa, että kaikkia

ilmiöönliittyviätekijöitäei ole edes mahdollista saati mielekästä sisällyttää

vatussaregressiossa tällaistavirheen mahdollisuuttaei oleotettuhuomioon.

Sitä kutsutaan tällön deterministiseksi.

Edellinen merkitsee siis sitä, että luodun mallin arvot eroavat tutkitun

aineiston havaintoarvoista. Tämä ei kuitenkaan tarkoita etteikö mielekästä

mallia olisi löydettävissä. On tyydyttävä malliin, joka on mahdollisimman

lähellä alkuperäistä aineistoa.Kun malliei täysin vastaa alkuperäistä

tilan-netta,niinsiihensanotaansisältyvänvirhettä.Kunhavaintopiste

y i

^on

etäisyy-den

r

^päässä^mallin ^arvosta

y ˆ _i

^, ^eli

r i = | y i − y ˆ i | ,

^(4.1)

niinparametri

r

^on^mallin^sisältämä^virhe¹^,^jota^kutsutaanjäännökseksi,eng.

residual.

Ylimääräytyvä, eli ei-deterministinen, usean selittäjän regressio

kirjoite-taan muodossa

y = β 0 + β 1 x 1 + . . . + β p x p + r.

Jättämälläylläolevasta yhtälöstäpoisjäännöstermi

r

^saadaan^yhtälössä ^4.1

esiintyvä

y ˆ

^,^eli

ˆ

y = β 0 + β 1 x 1 + . . . + β p x p .

Mahdollisimmanhyväänmalliinpäästään minimoimallajäännös

r

Jään-nöksen matriisiyhtälöonmuotoa

r = Y − X β.

Jäännösvektorin

r

^pituus määritetäänEukleideen vektorinormilla

k r k 2 =

jota minimoidaan.Tästä ilmeisestinimitys pienin neliösumma.

Huomautus 4.1.1. Euklidinennormi on arkielämästäkaikille tuttu

etäisyys-mitta, missäkahden tasonpisteen

x 1 , x 2

^välinen ^etäisyys

y

^on^määritetty

nii-den neliöiden summanneliöjuurena, eli

y = q

x ² ₁ + x ² ₂ .

Tilastollinen virhe tarkoittaamittaustuloksen jatutkittavan suureen 'todellisen'

ar-von erotusta, eikäse ole mittaajan havaittavissa.Jäännös on mallin antaman arvon ja

mittaustuloksen välinenerotus.

Normion yleistettävissä

n

-ulotteisiinavaruuksiin, jolloinse saa muodon

y = q

x ² ₁ + x ² ₂ + . . . + x ² _n .

Määritelmä 4.1.2. Olkoon

X β = Y

ylimääräytyväjoukkoyhtälöitä,missä

X

^on

m × n

^matriisi,

m > n

^. ^Pienimmän neliösumman menetelmä minimoi Euklidisennorminjäännösvektorin

r

^.^T^oisin^sanoen

β

^onoptimointiongelman

min β k r k ² = min

β k Y − X β k ²

ratkaisu.

Lause 4.1.3. Jos matriisin

X

sarakevektorit ovat lineaarisesti riippumatto-mia, niinmatriisi

( X ^T X ) ⁻¹

^on ^olemassa, ^jolloin ^optimointi ^ongelmal^la

min β k Y − X β k ²

on yksikäsitteinen ratkaisu

X ^T X β = X ^T Y.

Todistus sivuutetaan, katso [9, s. 235 -236℄.

Otetaan seuraavaksi yksinkertainen esimerkki pienimmän neliösumman

käytöstä.

Esimerkki 4.1.4. Olkoon havaintoaineistona kolme tason pistettä

z ₁ = (1, 6), z 2 = (2, 7)

^ja

z 3 = (3, 10)

^. ^Oletetaan, ^että ^mitattua ^ilmiötä ^voidaan

kuvata suoralla

y = β 0 + β 1 · x

^.^{Jäännöksen} matriisiyhtälösaa siten muodon

r = Y − X β =

Lauseen4.1.3nojallavirheterminminimisaadaanyksikäsitteisestiratkaistua,

josmatriisin

A

sarakevektoritovatlineaarisestiriippumattomia,eli

( X ^T X ) ⁻¹

on olemassa.Huomataan, että tässä tapauksessa näin on. Tällöin

X ^T =

Matriisi

( X ^T X ) ⁻¹

^on ^olemassa ^ja, ratkaisemalla esimerkiksi Gauss-Jordan -menetelmällä,on muotoa

( X ^T X ) ⁻¹ = ₇

3 − 1

− 1 ¹ ₂

.

Yhtälöryhmän

X ^T X β = X ^T Y

ratkaisuksi saadaan

β = ( X ^T X ) ⁻¹ X ^T Y = ₁₁

2 3

.

Ilmiötäparhaiten kuvaavasuoranyhtälö onsiismuotoa

y = 2x + ¹¹ ₃

Kuva 5: Havaintopisteet

z _i , i = 1, 2, 3

^sekä ^PNS^-sovitettu ^suora

y

Näinonsaatu jäännösvektori

r =



 1/3

− 2/3 2/3



 ,

jolloinsen pituus

k r k ² = 1

Luvun lopuksi esitelläänjo edellä mainitutGauss-Markov ehdot.

Määritelmä4.1.5. SeuraaviaehtojakutsutaanGauss-Markovehdoiksi

use-an selittäjänregressiossa.

y = β 0 + β 1 x 1 + . . . + β k x k + r,

missä

β 0 , β 1 , . . . , β k

^ovattuntemattomiaparametreja,ja

r

^on"näkymätön"

satunnainen virhetermi.

2. Satunnaisotanta: On olemassa satunnaisotos, jossa on

n

^havaintoa,

{ (x _i1 , x _i2 , . . . , x _in , y _i ) : i = 1, 2, . . . , n }

^, ^jotka^seuraavatoletuksesta 1.

3. ei-Kollineaariset muuttujat: Selittävät muuttuja eivät saa olla

vakioi-ta, eikä yksikään selittävä muuttuja saa ollatäydellisessä lineaarisessa

riippuvuussuhteessa toiseenselittävään muuttujaan.

4. Ehdollinen odotusarvo: Virhetermin

r

^ehdollinen ^odotusarvo ^on ^nolla

kaikillaselittävien muuttujanarvoilla.Toisin sanoen

E(r | x ₁ , x ₂ , . . . , x _k ) = 0.

5. Homoskedastisuus:Virhetermin

r

^varianssi^on^vakio^kaikillaselittävien muuttujan arvoilla,eli

V ar(r | x 1 , x 2 , . . . , x k ) = σ ² .

Nämä ehdot ovat olettamuksia, jotka toteutuessaan kuvaavat ideaalisen

regressiomallin.Koskatodellisuuseiuseinkaanvastaateoriaa,niinnäitä

olet-tamuksia eipidetä ehdottomina,vaan sellaisina, joitakohtion hyväpyrkiä.

4.2 Mallin arviointi

Edelläesitettypienimmänneliösummanmatemaattinentarkastelueiota

kan-taa saadunmallintilastollisistaominaisuuksista.Mallinhyvyyttä arvioidaan

erilaisilla tilastollisilla suureilla. Tässä työssä tehtyjä sovitteita on arvioitu

kolmen erisuureen avulla.Ne ovatselitysaste,

R ²

^, ^t-testi ^ja F-statistiikka.

4.2.1 Varianssien vertailu

Muokkaamallayhtälöä 4.1saadaanhavaintoarvo

y i

kirjoitettuasovitetun ar-von

y ˆ i

^ja jäännöstermin

r i

^summana

y i = ˆ y i + ˆ r i .

Määritelmän 4.1.5 mukaan jäännöksen ehdollinen odotusarvo

E(r | x i ) = 0

ja koska

Cov(ˆ y i , r) = E(ˆ y i r) = 0

^([23, ^s. ²⁹ ^- ^34℄), ⁿⁱⁱⁿ tutkittaessa pienim-män neliösumman ominaisuuksia, sovitetta ja virhetermiä voidaan

käsitel-lä erikseen. Määritelläännytsuureita, joiden avulla kyetään tarkastelemaan

regressiomallinhyvyyttä.

Määritelmä4.2.1. Olkoon

y

havaintoaineistonkeskiarvo,

y _i

havaintoasineis-ton

i

^:s ^havainto,

y ˆ i

^selitetty ^arvo

i

^sek^ä

r i

^jäännös havainnolle

i

^. ^Olkoon

LyhenneSSTtuleesanoistatotal sumofsquares,jasemittaa

havaintoaineis-ton vaihtelua. SSE, eli explained sum of squares, mittaa selitettyjen arvojen

vaihtelua,jaSSR, residualsum of squares, onniinsanottu

jäännösneliösum-ma. SST voidaan aina ilmaistatermien SSE ja SSR summana, eli

SST = SSE + SSR.

^(4.5)

Tätä yhtälöä käytetään hyväksi määritettäessä sitä kuinka hyvin

selit-tävät muuttuja kuvaavat selitettäväa muuttujaa. Olettaen, että SST

6 = 0

niinyhtälö4.5 voidaan jakaa termilläSST, jolloinsaadaanaikaiseksi yhtälö

1 = SSE

SST + SSR SST .

Määritelmä 4.2.2. Regressiomallin selitysaste

R ²

määritelläänyhtälönä

R ² = SSE

SST = 1 − SSR SST .

Jos termit SST ja SSE jaetaan luvulla

n − 1

^, ⁿⁱⁱⁿ ^saadaan ^sekä

alku-peräisenettä selitettyjen arvojen varianssit. Mallinselitysaste voidaan siten

tulkita aineiston selitettyjen ja havaittujen arvojen varianssien suhteeksi.

Yksittäisen parametrin merkitsevyyden arvioimiseenkäytetään niin

kutsut-tuat-testiä.Merkitsevyystesteillätutkitaanmallinparametrien

luotettavuut-ta. Yleensä testit perustuvat suuriin aineistoihin, jotka ovat likimain

nor-maalijakautuneita. Kuitenkin luotettavuustestejä tehdään myös aineistoille,

jotka ovat "vähemmän"normaalijakautuneita.Tällöin testiin sovelletaan

lu-vussa3.2esitettyäStudent'injakaumaa.Jakaumamuistuttaa

normaalijakau-maa, mutta sillä on suurempi vaihteluväli. Aineiston koosta riippuen sillä

sanotaan olevan vapausaste

n − 1

^, ^missä

n

^on havaintoarvojen lukumäärä.

Mitä suurempi

n

^, ^sitä^lähempänä ^jakauma^on normaalijakaumaa.

Määritelmä 4.2.3. Olkoon

β 0

^ja

β 1

yksinkertaisen regression tuottamat parametrit.Tällöinkyseistenparametrienstandardivirheetsaadaanyhtälöistä

se b 0 = ˆ σ s

1 n + x ²

P (x i − x) ²

^(4.6)

se b 1 = σ ˆ

pP (x i − x) ² ,

^(4.7)

missä

σ ˆ

^onaineistostaestimoituvaihteluväli.Vaihteluvälivoidaanlaskea esi-merkiksi yhtälöstä 4.4 siten, että

σ ˆ ² = SSR n − 2 ,

missä

n

^onhavaintojen lukumäärä.

Standardivirheitä käytetään parametriarvojen luottamusvälien

määrit-tämisessä.

Määritelmä 4.2.4. Parametrien

β 0

^ja

β 1

luottamusvälit ovatmuotoa

b ₀ ± t ^∗ se _b ₀

^(4.8)

b 1 ± t ^∗ se b 1 ,

^(4.9)

missä

t ^∗

^onvapausasteen

n − 2

^omaavan^Student'in ^jakaumanargumentti,eli määrittelyjoukonalkio, kriitiselläarvolla

(1 − c)/2

c

^ontestaukseen valittu luottamustaso,esimerkiksi 95tai 99%

halutaan tarkastella parametrin merkitsevyyttä arvon

β 1

^molemmin^puolin.

Tällöin kyseessä on niinsanottukaksipuoleinen t-testi, katso Kuva 6.Tämä

menetelmä onollutkäytössä myöhemminesitetyissä merkitsevyystestien

tu-loksissa. Joskus on mielekästä tarkastella vain toispuoleisia raja-arvoja,

jol-loinkriittinen arvo määritellääntoisin.

Kuva6:Erään Studentin jakaumankriittisetarvot (2.228)kaksipuoleisessa

t-testissä valitulla luottamusvälillä . Keskellä oleva valkoinen alue kattaa

jakaumanpinta-alasta%:a ja keltaisethännäterikseen alan

(1 − c)/2

^%:a.

Luottamusvälinmäärittelyäkäytetäänsilloinkunhalutaan testata

hypo-teesia

H 0 : β 1 = 0

^. ^Tällöin^lasketaan^arvo

t = b 1

se b 1

.

Jos arvo

t

^on itseisarvoltaan suurempi kuin

t ^∗

^, ⁿⁱⁱⁿ ^tällöin ^hypoteesi

H 0

hylätään,jatarkasteltuparametriontilastollisestimerkitsevä.Vastaava

tarkas-telu tehdään hypoteesille

H 0 : β 0 = 0

Huomautus 4.2.5. Hypoteesilla tarkoitetaan yleisesti jotain väitettä, jonka

totuusarvostaollaankiinnostuneita.Tämäntyönkannaltaonolennaista

esit-tää niin kutsuttu nollahypoteesi

H 0 : β j = 0

^sekä vaihtoehtohypoteesi

H a : β _j 6 = 0

^. ^Jos^hypoteesia

H ₀

^ei ^hylätä, ⁿⁱⁱⁿ ^tällöin parametrilla eikatsota ole-vantilastollista merkitsevyyttä, jolloin parametri

β j

^, ^selittävä ^muuttuja

x j

hylätään mallista.Jos

H 0

^hylätään,ⁿⁱⁱⁿ^hypoteesi

H a

^valitaan,^ja ^parametri

β _j

^on^tätentilastollisestimerkitsevä.Hypoteeseihineitässäperehdytäyhtään tämän tarkemmin.

Usean selittävän muuttujan regressiossa jokaiselle parametrille

β j

laske-taan myös omat standardivirheet. Vakion virheyhtälö on sama kuin

Määri-telmässä 4.2.3.

Määritelmä 4.2.6. Regressiokertoimen

β j

standardivirhe saadaanyhtälön

se b j = σ ˆ

q SST j (1 − R _j ² )

nojalla,missä

SST j

^on ^selittävän ^muuttujan

X j

^total ^sum ^of ^squares, ^ja

R ² _j

on osittaisselitysaste 2

muuttujalle

X _j

^. ^V^aihteluv^äli

ˆ σ

^saadaan ^tällä ^kertaa

yhtälöstä

σ ˆ ² = SSR n − k − 1 ,

missä

p

^onselittävien(riippumattomien)muuttujienlukumäärä.

Parametrin

β j

luottamusvälisaadaanvastaavallayhtälölläkuinMääritelmässä 4.2.4. Tällöin Student'in jakauman vapausaste on kuitenkin

n − k − 1 = n − (p + 1)

^. ^Huomataan, ^että ^vapausaste määritellään havaintoarvojen ja etsittävien parametrienlukumäärän erotuksena. Jos selittäviämuuttujia on

yksi, niin vapausasteeksi saadaan

n − 2

^kuten Määritelmässä 4.2.4. Hypo-teesin

H 0 : β j = 0

^arviointi toteutetaankuten edellä on esitetty.

4.2.3 Mallin merkitsevyys

Edellä tarkasteltiin yksittäisen parametriestimaatinmerkitsevyyttä. Tämän

lisäksionmielekästätarkastellamallinmerkitsevyyttämyöskokonaisuutena.

Tällöin tarkastellaan yhtäaikaa kaikkien muuttujien parametriestimaatteja.

Nollahypoteesiväittämäsaa tällöin muodon

H 0 = β k−q+1 = 0, . . . , β k = 0,

jokapoissulkeeselittäviämuuttujiaregressiostamäärän

q

^.Nollahypoteesion totta vainsilloin, joskaikki tarkastellutparametrit ovattilastollisesti

merki-tyksettömiä. Vaihtoehtohypoteesi toteutuu, jos edes yhden parametrin arvo

on nollastapoikkeava. Tarkasteltavaksijäi niinkutsuttu rajoitettumalli 3

Osittaisselitysasteenmääritelmääeitässäesitetä.Kiinnostuneillevinkiksitutkia

kir-jallisuutta, jossa käsitellään usean selittäjän regressiota,eng. multiple linear regression,

tai internetistähakusanallapartialoeientof determination

Alkuperäiseenmalliinviitataantermillärajoittamatonmalli

y = β 0 + β 1 x 1 + · · · + β k−q x k−q + r.

Määritelmä 4.2.7. Regressiomallin F-statistiikka määritelläänyhtälönä

F ≡ (SSR r − SSR ur )/q SSR ur /(n − k − 1) ,

missä alaviite

r

^tarkoittaa rajoitettua ja alaviite

ur

rajoittamatonta, alku-peräistä,mallia.

Saatua tulosta verrataan jakaumaan

F q,n−k−1

^valitulla luottamustasolla, ja verrataan saatua tulosta kriitiseen arvoon. Jos saatu tulos on suurempi

kuin kriittinenarvo,niinnollahypoteesi voidaanhylätä.

Huomautus 4.2.8. Määritelmässä3.2.14F-jakaumamääriteltiin

parametreil-la

n 1 , n 2

^. Määritelmän 4.2.7 mukaisesti laskettua arvoa

F

^verrataan ^siis

sel-laiseen F-jakaumaan, joka määritellään siten, että jakauman ensimmäisen

parametriarvoon

q

^ja ^toinen

n − k − 1

Tässä luvussa määritelläänpankkien kohtaamat riskitja tarkastellaan

vaka-varaisuusriskiltäsuojautumiseenkehitettyäriskimittaasekätarkastellaansen

hyviä ja huonoja puolia. Luvun lopuksi kerrotaan lyhyesti eurooppalaisesta

pankkisäätelykomiteasta, joka muun muassa suosittelee kyseisen riskimitan

käyttöönottoa.Lähteinäluvunkirjoittamiseenonkäytettyseuraaviaviitteitä:

[1℄, [2℄, [3℄, [7℄, [10℄, [14℄ ja [21℄.

5.1 Vakavaraisuusriski

Tuloslaskelma kuvaa yrityksen rahavirtoja, eli yritykseen tulleiden ja sieltä

poistuneiden rahojen määriä, esimerkiksi tilikauden tai kvartaalin ajalta.

Kaikkivirratsummattunayhteensaadaanyrityksenkyseisentilikauden

voit-totaitappio.Pankin tuloslaskelmastalöytyviävirtojaonmuunmuassa

kor-kotulot ja -menotsekä niinsanotutalaskirjaukset, elisijoituksista koituneet

tappiot.Tase puolestaanesittääpankinvarallisuudenjollakintietyllä

hetkel-lä.Tällöinkirjataanylösmuunmuassapankinmyöntämienlainojen,käteisen

varallisuuden tai talletusten kokonaismäärät. Taseesta ei siten selviä miten

esimerkiksitalletustenkokonaismääräonvaihdellutedellisestä

tarkasteluhet-kestä. Tuloslaskelma ja tase ovat yhteydessä toisiinsa siten, että kunkin

ti-likaudenvoitto tai tappio lisätääntaseen omaan pääomaan. Aineiston

tase-eristä tarkemmin luvussa 6.1

Viitteessä [14℄ pankkitoiminnalle on määritelty neljäerilaista riskiä,

joi-ta se kohtaa tavoitellessaan voittoja osakkeenomistajien varallisuuden

kas-vattamiseksi. Nämä ovat luottoriski, korkoriski, operationaalinen riski sekä

likviditeettiriski.Tämä luokittelueioleyksikäsitteinen vaan kirjallisuudessa

luokitteluja on useita erilaisia. Kuitenkin kaikki pankin, ja muidenkin

yri-tysten, riskitonjohdettavissa niidentaseistaja tuloslaskelmista.Nämäovat

vakavaraisuus- sekä liiketoimintariski.

Liiketoimintariski on tuloslaskelmaan kuuluva riski. Esimerkiksi,

korko-riskirealisoituutuloslaskelmaan,josanto-jaottolainauskoronvälinenerotus

pienenee. Suuriosa säästä- ja osuusliikepankkien luotoista on pitkäaikaisia

ja kiinteäkorkoisia, esimerkiksi asuntolainoja. Jos näiden lainojen rahoitus

hoidetaan lyhyillä javaihtuvakorkoisillarahoitusratkaisuilla,ja

markkinako-rko nouseemerkittävästi.

Tasesiisesittääpankin(yrityksen)varallisuustilannetta.Täten

vakavarai-suusriski liittyy pankin (yrityksen) taseeseen. Vakavaraisuusriskiin sisältyy

teutuessa pankinvaratalenevatsuhteessa velkoihin,esimerkiksi

luottotappi-oiden muodossa. On myös muita vakavaraisuuteen liittyviä riskien

realisoi-tumistapoja,joihinedelläesiteltyäluokitteluaonvaikeampisoveltaa.

Tälläi-nen onesimerkiksi taseenulkopuolisistaerissä,kuten

johdannaissopimuksis-sa, piilevätriskit.

5.2 Vähimmäisomavaraisuusaste

Rahoituslaitoksenonmahdollistalisätätuotto-odotuksiaanvipuvaikutuksen

avulla,kuinmitä sen oma pääomamahdollistaa.Vipuvaikutuksen

luomisel-le on kolme vaihtoehtoa. Taseen vipuvaikutus on yleisimmin tunnettu ja

käytetty muoto. Se syntyy kunyrityksen varallisuusylittääoman pääoman.

Pankeilletämäyleensätarkoittaalainoittamistaomaapääomaasuuremmalla

määrällä.Taloudellinenvipuvaikutus tarkoittaapankinaltistumistasellaisille

varallisuuden arvon muutoksille, jotka ovat suurempia kuin siitä maksettu

määrä. Sisäsyntyinen vipuvaikutus tarkoittaa tilannetta, jossa positiosta on

enemmän vastattavaa kuinonsen markkina-arvo.

Viime vuosien nanssikriisin alkulähteenä pidetään pankkisektorin

luo-maa liiallistavipuvaikutusta,sekä taseeseen että taseen ulkopuolisiinosiin.

Tästä syystäomavaraisuusaste onnostettu Baselinpankkivalvontakomitean

(Basel Committee of Banking Supervision, BCBS) toimesta yhdeksi

uudek-sisäännellyksitunnusluvuksi,jollavastaavatkriisitvoitaisiintulevaisuudessa

välttää.BCBS:ntavoitteenaonluodaomavaraisuusasteenlaskemiselle

kansal-lisista laeista ja kirjanpitotavoista riippumaton määritelmä, jolloin se olisi

kansainvälisesti vertailukelpoinen. Muun muassa Euroopan parlamentti on

ottanutkantaa päätöslauselmassaanomavaraisuusasteen sääntelynpuolesta.

Käytännössäomavaraisuusasteelleasetetaanjokinalaraja,jatällöinkäytetään

termiä vähimmäisomavaraisuusaste.

Mitenomavaraisuusastesittenonmääritelty?Koskaseonsäännelty

suu-re, niin määritelmä riippuu aina sääntelijän päätöksestä, eli siitä mitä

sii-hen halutaan sisällyttää. Yhteistä määritelmilleonse, että

omavaraisuusas-teen halutaan olevan ei-riskiperustainen suure. Laskennassa ei siis käytetä

minkäänlaisia kertoimia eri varallisuus- tai velkaerien suhteellisten riskien

huomioimiseksi.BCBS:nraportissa189onyksityiskohtaisetohjeet

omavarai-suusasteen laskemisen perusteista, sekä ehdotus 3 % vähimmäisvaateesta

vuosien2013-2017välisenäaikanatoteutettavalletestijaksolle.Ehdoissa

ote-taan huomioonsekä taseeseen kuuluvat erät että monia taseen ulkopuolisia

Maailmanpankin julkaiseman tiedotteen mukaan omavaraisuusaste

las-ketaan jakamalla pankin Tier 1-varallisuus pankin sovitetulla varal

lisuudel-la, merkitään

Ass adj

^, ^elikokonaisvarallisuudella,jostaonvähennetty aineet-tomathyödykkeet

.Tier1varallisuussisältääomanpääomanlisättynäpankin

reserveilläsekä vähennettynäaineettomilla hyödykkeillä.Yhtälönä edellinen

on muotoa

OA = T ier1 Ass adj

=

^oma ^pääoma ⁺^reservit ^- aineettomathyödykkeet Varat -aineettomat hyödykkeet

.

^(5.1)

Vähimmäisomavaraisuusasteon ollut jo käytössä muun muassa

Pohjois-Amerikassa. Sen käyttöä on sovellettu eri tavalla niin Yhdysvalloissa kuin

Kanadassa. Lisäksi ensimmäisen maana euroopassa sen käyttöönotosta on

päättänyt Sveitsi. Yhdysvalloissa käytössä oleva malliyksinkertaisesti vaatii

pankilla olevanomaa pääomaa5 % varallisuudestaan. Erityisen

mielenkiin-toista on se, että nykyinen rahoituskriisi sai alkunsa juuri Yhdysvalloista,

jossa vähimmäisomavaraisuusasteen sääntely onjo ollut käytössä.

5.2.1 Vahvuudet

LuottoluokitusyhtiöStandard&Poors:nmukaanvähimmäisomavaraisuusaste

voi ollahyödyllinen lisäväline pankkien riskiarviointiin, erityisesti

riskipääo-manmittaamiseen.Tämävaatiivarallisuusmitaltalaajaamuttatarkkaa

mää-rittelyä,jolloinuseattaloudensuhdeluvuttulevatkansainvälisesti

vertailukel-poisemmiksi.Lisäksi pankkitoiminnanläpinäkyvyys ja erilaisten aineistojen

julkisuus ovat elintärkeitä vähimmäisomavaraisuusasteen hyödyllisyydelle.

Vähimmäisomavaraisuusastevoi ollasäätelijöidentoivoma vastasyklinen

suhdeluku. Ajatuksena on luoda pankeille pääomavaateita, jotka kasvavat

taloudellisestihyvinä aikoina javastaavastipienenevättaantumassa.Tämän

tarkoituksenaonhillitäluotonantoataloudellisenbuuminaikanayrittäen

es-tää markkinoiden niin kutsuttua ylikuumenemista. Omavaraisuusasteen on

empiirisesti kuitenkin todettu olevanmyötäsyklinen.Noususuhdanteessa

ra-hapolitiikka on usein liian löysää, jolloin pankit kasvattavat taseitaan, eli

Aineettomiinhyödykkeisiinluetaanmukaanliikearvo,ohjelmistokulutsekä

laskennal-liset verosaamiset. Liikearvo on arvio yrityksen tuotto- ja substanssiarvon erotuksesta,

eikäsitätässähuomioida.Ohjelmistokulutkuuluvattase-eräänaineettomathyödykkeet,ja

laskennallisetverosaamisetonomaeränsä,katsoluku6.1

usaste pienenee. Vastaavastihuonoinaaikoina lainoitus-ja sijoitustoimintaa

vähennetään tappioiden pelossa, joka taas kasvattaa omavaraisuusastetta.

Valvontaviranomaisetvoivatyrittäävaikuttaamyötäsyklisyydenpoistamiseen

esimerkiksi muuttamalla vähimmäisomavaraisuusasteen kriteereitä

talousti-lanteen mukaan tai asettamalla esimerkiksi pitkän aikavälin tavoitetasoja.

Viranomaisten ratkaisujen, kuten lainsäädännön muutoksien, tarkoituksena

onestääkriisientoistuminen,muttauudistuksissavoimyöspiilläuusien

krii-sien siemen.

5.2.2 Heikkoudet

VOA eiolelopullinenratkaisuetsittäessä työkalujauusienpankkikriisien

es-tämiseksi.Senheikkouksiksionesitettyuseitaväitteitä.Ehdotettumääritelmä

VOA:lle ei erottele pankkien varallisuuksia riskien mukaan, joka voi tuoda

mukanaan epätoivottuja kannustimia. Ilman erillisiä sääntelymekanismeja,

kuten BASEL I ja II, pankit saattavatesimerkiksi kasvattaa taseitaan

riski-pitoisemmilla tuotteillasuurempientuottojen toivossa.

Toiseksi VOA eisisällätaseen ulkopuolisiaeriälainkaan. Onarvioitu,

et-täOBS vipuvaikutusonhuomattava,silläne ovatjoissaintapauksissa olleet

yhtäsuuriakuintaseenvastattavaa-osa.Esimerkkitällaisistaonmuun

muas-sa johdannaisriskit, joiden tulisi olla avainasemassa vivuttamisen

määrit-telyssä. Onkin mielenkiintoistaVOA:en kannalta, että nykyinen talouskriisi

onlähtöisinYhdysvalloista,jossaVOA onollutkäytössäjo pidemmänaikaa.

In document Pankin omavaraisuusasteen mallittaminen (sivua 24-0)

(X 1 , . . . , X n )

E[g(X 1 , . . . , X n )]

X

Y

x

y

f (x, y)

C ⊂ R 2

P { (X, Y ) ∈ C } = Z

C

f(x, y)dxdy.

f (x, y)

X

Y

X

Y

f (x, y)

f X (x)

f Y (y)

X

Y

f(x, y) = f X (x)f Y (y)

x ∈ X, y ∈ Y

X 1

X 2

g

h

E[g(X)h(Y )] = Eg(X)Eh(Y ).

(X 1 , X 2 )

n 1 , n 2

µ n 1 ,n 2 = E { (X 1 − EX 1 ) n 1 (X 2 − EX 2 ) n 2 }

µ n 1 ,n 2

(X 1 , X 2 )

n 1 + n 2

= (X 1 , X 2 )

µ 1,0 = µ 0,1 = 0

µ 1,0 = 0

µ 1,0 = E { (X 1 − EX 1 ) 1 (X 2 − EX 2 ) 0 }

= E { (X 1 − EX 1 ) · 1 }

= EX 1 − EX 1 = 0.

µ 0,1 = 0

µ 2,0 = V ar(X 1 )

µ 0,2 = V ar(X 2 )

µ 2,0 = V ar(X 1 )

µ 2,0 = E { (X 1 − EX 1 ) 2 (X 2 − EX 2 ) 0 }

= E { (X 1 − EX 1 ) 2 · 1 }

= V ar(X 1 ).

µ 1,1 = E { (X 1 − EX 1 )(X 2 − EX 2 ) }

µ 1,1

X 1 , X 2

cov(X 1 , X 2 )

Cov(X 1 , X 2 ) = E { (X 1 − EX 1 )(X 2 − EX 2 ) }

= E[X 1 X 2 − EX 1 X 2 − X 1 EX 2 + EX 1 EX 2 ]

= E(X 1 X 2 ) − EX 1 EX 2 − EX 1 EX 2 + EX 1 EX 2

= E(X 1 X 2 ) − EX 1 EX 2 .

Cov(X 1 , X 2 ) = 0

X 1 , X 2

V ar(X 1 + X 2 ) = E

[X 1 + X 2 − E(X 1 + X 2 )] 2

= E

[X 1 + X 2 − EX 1 − EX 2 ] 2

= E

[(X 1 − EX 1 ) + (X 2 − EX 2 )] 2

= E

(X 1 − EX 1 ) 2 + (X 2 − EX 2 ) 2 +2(X 1 − EX 1 )(X 2 − EX 2 )

= E

(X 1 − EX 1 ) 2 + E

(X 2 − EX 2 ) 2 +2E

(X 1 − EX 1 )(X 2 − EX 2 )

= V ar(X 1 ) + V ar(X 2 ) + 2Cov(X 1 , X 2 ).

EX 1 , EX 2 ∈ R

A

B

C

X 1 , X 2

ρ(X 1 , X 2 ) = Cov(X 1 , X 2 ) σ(X 1 )σ(X 2 ) .

[ − 1, 1]

ρ

− 1 ≤ ρ(X 1 , X 2 ) ≤ 1

C ⊂ R ²

f(x, y) = f _X (x)f _Y (y)

µ n 1 ,n 2 = E { (X 1 − EX 1 ) ⁿ ¹ (X 2 − EX 2 ) ⁿ ² }

(X ₁ , X ₂ )

= (X ₁ , X ₂ )

µ 1,0 = E { (X 1 − EX 1 ) ¹ (X 2 − EX 2 ) ⁰ }

µ _2,0 = V ar(X ₁ )

µ 2,0 = E { (X 1 − EX 1 ) ² (X 2 − EX 2 ) ⁰ }

= E { (X 1 − EX 1 ) ² · 1 }

Cov(X ₁ , X ₂ ) = E { (X ₁ − EX ₁ )(X ₂ − EX ₂ ) }

= E[X ₁ X ₂ − EX ₁ X ₂ − X ₁ EX ₂ + EX ₁ EX ₂ ]

[X 1 + X 2 − E(X 1 + X 2 )] ²

[X 1 + X 2 − EX 1 − EX 2 ] ²

[(X 1 − EX 1 ) + (X 2 − EX 2 )] ²

(X 1 − EX 1 ) ² + (X 2 − EX 2 ) ² +2(X ₁ − EX ₁ )(X ₂ − EX ₂ )

(X ₁ − EX ₁ ) ² + E

(X ₂ − EX ₂ ) ² +2E

ρ(X 1 , X 2 ) = Cov(X ₁ , X ₂ ) σ(X 1 )σ(X 2 ) .

ρ(X 1 , X 2 ) = 1 ⇔ ^X _σ(X ² ^−EX ₂ ₎ ² = ^X _σ(X ¹ ^−EX ¹

ρ(X 1 , X 2 ) = − 1 ⇔ ^X _σ(X ² ^−EX ₂ ₎ ² = − ^X _σ(X ¹ ^−EX ₁ ₎ ¹

σ _X ² ₁ , σ _X ² ₂

F _X|Y (x | y)

p _X _|Y

p _X|Y (x | y) = P { X = x | Y = y } = p(xy)

x _i