TKK (c) Ilkka Mellin (2004) 1
Johdatus tilastotieteeseen
Estimointimenetelmät
TKK (c) Ilkka Mellin (2004) 2
Todennäköisyysjakaumien parametrien estimointi Momenttimenetelmä
Normaalijakauman parametrien estimointi Eksponenttijakauman parametrien estimointi Bernoulli-jakauman parametrien estimointi Suurimman uskottavuuden menetelmä
Normaalijakauman parametrien estimointi Eksponenttijakauman parametrien estimointi Bernoulli-jakauman parametrien estimointi
Estimointimenetelmät
TKK (c) Ilkka Mellin (2004) 3
Estimointimenetelmät:
Mitä opimme? – 1/3
• Tilastollisen tutkimuksentavoitteena on tehdä johtopäätöksiä prosesseista, jotka generoivatreaalimaailman ilmiöitä koskevia havaintoja.
• Tavoitteeseen pyritään rakentamalla tutkimuksen kohteena olevaa ilmiötä koskevat havainnot generoineelle prosessille tilastollinen malli.
• Koska tilastollisissa tutkimusasetelmissa tutkimuksen kohteena olevia reaalimaailman ilmiöitä koskeviin havaintoihin liittyy aina satunnaisuuttatai epävarmuutta, tilastolliset mallit ovat luonteeltaan todennäköisyysmalleja.
• Tilastollinen malli havainnot generoineelle prosessille on täysin määrätty, jos havaintojentodennäköisyysjakaumatunnetaan.
TKK (c) Ilkka Mellin (2004) 4
Estimointimenetelmät:
Mitä opimme? – 2/3
• Havaintojen todennäköisyysjakaumanmääräävät jakauman karakteristisia ominaisuuksia kuvaavat parametrit, joiden arvoja ei sovellustilanteessa yleensä tunneta.
• Jos jakauman tuntemattomille parametreille ei löydetä hyviä estimaattejaeli arvioita, jakaumaa ei voida käyttää mallina tutkimuksen kohteena olevaa ilmiötä koskevat havainnot generoineelle prosessille.
• Tilastollisen tutkimuksen tärkeimpiä osatehtäviä on estimoida eli arvioida tutkimuksen kohteena olevaa ilmiötä koskevat havainnot generoineen prosessin mallina käytettävän todennäköisyysjakauman tuntemattomat parametrit ilmiötä koskevien havaintojen perusteella;
ks. lukua Estimointi.
Estimointimenetelmät:
Mitä opimme? – 3/3
• Havaintojen funktiota, joka tuottaa estimaattejaeli arvioita todennäköisyysjakauman tuntemattoman parametrin todelliselle arvolle, kutsutaan parametrin estimaattoriksi.
• Tilastotieteen tärkeimpiä osatehtäviä on hyvien estimaattoreiden johtaminentodennäköisyysjakauman parametreille.
• Parametrien estimaattoreiden johtamiseen käytetään tavallisesti joko suurimman uskottavuuden menetelmäätai momenttimenetelmää.
• Todennäköisyysjakauman tuntemattomien parametrien arvojen määräämistäkutsutaan tavallisesti piste-estimoinniksi.
• Jokaiseen todennäköisyysjakauman parametrin estimaattiin on aina syytä liittää luottamusväliksikutsuttu väli, joka sisältää parametrin todellisen arvon, tietyllä, soveltajan valittavissa olevalla todennäköisyydellä; ks. lukua Väliestimointi.
Estimointimenetelmät:
Esitiedot
• Esitiedot: ks. seuraavia lukuja:
Tilastollisten aineistojen kerääminen ja mittaaminen Tilastollisten aineistojen kuvaaminen
Otos ja otosjakaumat Estimointi
Satunnaismuuttujat ja todennäköisyysjakaumat Jakaumien tunnusluvut
Diskreettejä jakaumia Jatkuvia jakaumia
TKK (c) Ilkka Mellin (2004) 7
Estimointimenetelmät:
Lisätiedot
• Luottamusvälin määräämistätodennäköisyysjakaumien parametreille käsitellään luvussa
Väliestimointi
• Todennäköisyysjakaumien parametreja koskevien tilastollisten hypoteesien testaamistakäsitellään luvussa
Tilastolliset testit
• Jakaumaoletuksien testaamistakäsitellään luvussa
Yhteensopivuuden, homogeenisuuden ja riippumattomuuden testaaminen
TKK (c) Ilkka Mellin (2004) 8
>> Todennäköisyysjakaumien parametrien estimointi Momenttimenetelmä
Normaalijakauman parametrien estimointi Eksponenttijakauman parametrien estimointi Bernoulli-jakauman parametrien estimointi Suurimman uskottavuuden menetelmä
Normaalijakauman parametrien estimointi Eksponenttijakauman parametrien estimointi Bernoulli-jakauman parametrien estimointi
Estimointimenetelmät
TKK (c) Ilkka Mellin (2004) 9
Avainsanat Estimaatti Estimaattori Estimointi Havainto Havaintoarvo Otosjakauma Parametri Tilastollinen aineisto Tilastollinen malli Todennäköisyysjakauma Yksinkertainen satunnaisotos
Todennäköisyysjakaumien parametrien estimointi
TKK (c) Ilkka Mellin (2004) 10
Todennäköisyysjakaumien parametrien estimointi
Todennäköisyysjakaumat tilastollisten aineistojen kuvaajina
• Tilastollinen aineistokoostuu tutkimuksen kohteita kuvaavien muuttujien havaituista arvoista.
• Tilastollisissa tutkimusasetelmissa havaintoarvoihin liittyy aina epävarmuuttaja satunnaisuutta.
• Tilastollisissa tutkimusasetelmissa tutkimuksen kohteita kuvaavat muuttujat tulkitaan satunnaismuuttujiksi, jotka generoivatmuuttujien havaitut arvot.
• Tilastollinen mallitarkoittaa havaintoarvot generoineiden satunnaismuuttujien todennäköisyysjakaumaa.
TKK (c) Ilkka Mellin (2004) 11
Todennäköisyysjakaumien parametrien estimointi
Todennäköisyysjakaumien parametrit 1/2
• Tarkastellaan jotakin tutkimuksen kaikkien mahdollisten kohteiden muodostaman perusjoukon Salkioiden ominaisuutta kuvaavaa satunnaismuuttujaa X.
• Oletetaan, että satunnaismuuttuja Xnoudattaa toden- näköisyysjakaumaa, jonka pistetodennäköisyys- tai tiheysfunktio
f(x; θ)
riippuu parametristaθ.
• Merkintä:
~ ( ; ) X f x θ
TKK (c) Ilkka Mellin (2004) 12
Todennäköisyysjakaumien parametrien estimointi
Todennäköisyysjakaumien parametrit 2/2
• Satunnaismuuttujan Xpistetodennäköisyys- tai tiheysfunktio
f(x; θ)
kuvaa satunnaismuuttujanX todennäköisyysjakaumaa ja parametri θkuvaa jotakin jakauman karakteristista ominaisuutta.
• Koska parametrin θarvoa ei yleensä tunneta, tilastollisen tutkimuksen tärkeimpiä osatehtäviä on estimoidaeli arvioidatuntemattomalle parametrille θsopiva arvo jakaumasta f(x; θ) poimitun otoksen perusteella.
TKK (c) Ilkka Mellin (2004) 13
Todennäköisyysjakaumien parametrien estimointi
Yksinkertainen satunnaisotos
• Olkoon
X1, X2, … , Xn
yksinkertainen satunnaisotosjakaumasta, jonka pistetodennäköisyys- tai tiheysfunktio f(x; θ) riippuu parametrista θ.
• Tällöin havainnot X1, X2, … , Xnovat riippumattomia, identtisesti jakautuneita satunnaismuuttujia, joilla on sama pistetodennäköisyys-tai tiheysfunktio f(x; θ):
1, 2, ,
~ ( ; ) , 1, 2, ,
n i
X X X
X f x θ i n
⊥
=
…
…
TKK (c) Ilkka Mellin (2004) 14
Todennäköisyysjakaumien parametrien estimointi
Havainnot ja havaintoarvot
• Oletetaan, että satunnaismuuttujat (havainnot) X1, X2, … , Xn
saavat poimitussa otoksessahavaituiksi arvoikseenluvut x1, x2, … , xn
• Havaintoarvot x1, x2, … , xn
vaihtelevat satunnaisesti otoksesta toiseenjakaumasta f(x; θ)
saatavin todennäköisyyksin.
TKK (c) Ilkka Mellin (2004) 15
Todennäköisyysjakaumien parametrien estimointi
Estimaattorit ja estimaatit 1/2
• Oletetaan, että todennäköisyysjakauman f(x; θ)
parametrinθestimoimiseenkäytetään satunnaismuuttujien X1, X2, … , Xnfunktiota eli tunnuslukua
T= g(X1, X2, … , Xn)
• Tällöin funktiota T= g(X1, X2, … , Xn) kutsutaan parametrin θestimaattoriksija havaintoarvoista
x1, x2, … , xn
laskettua funktion garvoa t= g(x1, x2, … , xn)
kutsutaan parametrin θestimaatiksi.
TKK (c) Ilkka Mellin (2004) 16
Todennäköisyysjakaumien parametrien estimointi
Estimaattorit ja estimaatit 2/2
• Olkoon
T= g(X1, X2, … , Xn)
jakauman f(x; θ) parametrin θestimaattori.
• Tällöin estimaattorinThavaintoarvoista x1, x2, … , xn
laskettu arvo eli estimaatti t= g(x1, x2, … , xn)
on satunnaismuuttujan T arvon realisaatio otoksessa.
Todennäköisyysjakaumien parametrien estimointi
Estimaattoreiden johtaminen
• Hyvien estimaattoreiden johtaminentodennäköisyys- jakaumien tuntemattomille parametreille on teoreettisen tilastotieteen keskeisiä ongelmia.
• Tässä luvussa esitellään seuraavat estimaattoreiden johtamiseen käytettävät menetelmät:
– Momenttimenetelmä
– Suurimman uskottavuuden menetelmä
• Estimointimenetelmistä tärkein on suurimman uskottavuuden menetelmä, mutta seuraavassa käsitellään ensin momenttimenetelmää.
Todennäköisyysjakaumien parametrien estimointi
Piste-estimointi ja väliestimointi
• Todennäköisyysjakauman parametrin arvon estimointia kutsutaan usein piste-estimoinniksi.
• Parametrin estimaattiin on aina syytä liittää luottamus- väliksikutsuttu väli, joka sisältää estimoidun parametrin todellisen, mutta tuntemattoman arvon tietyllä, soveltajan valittavissa olevalla todennäköisyydellä.
• Luottamusvälin määräämistä kutsutaan väliestimoinniksi;
ks. lukua Väliestimointi.
TKK (c) Ilkka Mellin (2004) 19
Todennäköisyysjakaumien parametrien estimointi
>> Momenttimenetelmä
Normaalijakauman parametrien estimointi Eksponenttijakauman parametrien estimointi Bernoulli-jakauman parametrien estimointi Suurimman uskottavuuden menetelmä
Normaalijakauman parametrien estimointi Eksponenttijakauman parametrien estimointi Bernoulli-jakauman parametrien estimointi
Estimointimenetelmät
TKK (c) Ilkka Mellin (2004) 20
Avainsanat Bernoulli-jakauma Eksponenttijakauma Momenttiestimaattori Momenttimenetelmä Normaalijakauma
Momenttimenetelmä
TKK (c) Ilkka Mellin (2004) 21
Momenttimenetelmä
Momentit
• Olkoon
X1, X2, … , Xn
yksinkertainen satunnaisotosjakaumasta f(x; θ), jonka parametrinaon p-vektori
θ= (θ1, θ2, … , θp)
• Oletetaan, että jakaumalla f(x; θ) on kaikki (origo-) momentitkertalukuun psaakka (ks. lukua Jakaumien tunnusluvut):
E(Xik)=αk,k=1, 2, , ,… p i=1,2, ,…n
TKK (c) Ilkka Mellin (2004) 22
Momenttimenetelmä
Parametrien ja momenttien yhteys 1/2
• Oletetaan, että momenttien α1, α2, … , αp
ja parametrien θ1, θ2, … , θp
välillä on jatkuva bijektioeli kääntäen yksikäsitteinen kuvaus:
1 1 1 2
2 2 1 2
1 2
( , , , ) ( , , , ) (1)
( , , , )
p p
p p p
g g g
α θ θ θ
α θ θ θ
α θ θ θ
=
=
=
…
…
…
TKK (c) Ilkka Mellin (2004) 23
Momenttimenetelmä
Parametrien ja momenttien yhteys 2/2
• Tällöin parametrit θ1, θ2, … , θp
voidaan esittää momenttien α1, α2, … , αp
funktioina:
1 1 1 2
2 2 1 2
1 2
( , , , ) ( , , , ) (2)
( , , , )
p p
p p p
h h h
θ α α α
θ α α α
θ α α α
=
=
=
…
…
…
TKK (c) Ilkka Mellin (2004) 24
Momenttimenetelmä
Momenttiestimaattorit
• Estimoidaan momentit α1, α2, … , αpvastaavilla otos- momenteilla(ks. lukua Tilastollisten aineistojen kuvaaminen):
• Sijoittamalla estimaattorita1, a2, … , apmomenttien α1, α2, … , αppaikalle yhtälöihin (2), saadaan para- metrienθ1, θ2, … , θpmomenttiestimaattoriteli MM-estimaattorit
1
1 n k
k i
i
a X
n=
=
∑
1 1 1 2
2 2 1 2
1 2
ˆ ( , , , )
ˆ ( , , , )
(3)
ˆ ( , , , )
p p
p p p
h a a a
h a a a
h a a a
θ θ θ
= =
=
…
…
…
TKK (c) Ilkka Mellin (2004) 25
Momenttimenetelmä
Kommentteja
• Monet todennäköisyysjakaumat on parametroitu jakauman(origo-) momenteillatai keskusmomenteilla:
(i) Jos jakauman parametreina on jakauman (origo-) momentteja, vastaavat otosmomentitovat ko.
parametrien momenttiestimaattoreita.
(ii) Jos jakauman parametreina on jakauman keskus- momentteja, vastaavat otoskeskusmomentitovat ko.
parametrien momenttiestimaattoreita.
TKK (c) Ilkka Mellin (2004) 26
Momenttimenetelmä
Momenttiestimaattoreiden ominaisuudet
• Olkoon X1, X2, … , Xnyksinkertainen satunnaisotos jakaumasta fX(x; θ), jonka parametrinaon θ.
• Olkoon parametrin θmomenttiestimaattorieli MM- estimaattori.
• Hyvä estimaattori on harhaton, tyhjentävä, tehokasja tarkentuva(ks. lukua Estimointi).
• MM-estimaattori ei välttämättä täytä hyvän estimaattorin kriteereitä, joten momenttimenetelmää käytettäessä on aina erikseen varmistettava tuloksena saadun estimaattorin hyvyys.
θˆ
θˆ
TKK (c) Ilkka Mellin (2004) 27
Momenttimenetelmä
Momenttimenetelmä vs
suurimman uskottavuuden menetelmä
• Momenttimenetelmä ja suurimman uskottavuuden menetelmä eivät välttämättä tuota samoja estimaattoreita todennäköisyysjakauman parametreille.
• Monissa alkeellisissa tilanteissa menetelmät tuottavat kuitenkin samat estimaattorit.
• Momenttimenetelmä on menetelmistä vanhempi ja sen taustalla on naiivi analogia-periaate: Estimoidaan teoreettiset momentit vastaavilla otossuureilla.
• Suurimman uskottavuuden menetelmä on hyvin pitkälti syrjäyttänytmomenttimenetelmän estimaattoreiden johtamisessa.
TKK (c) Ilkka Mellin (2004) 28
Momenttimenetelmä
Esimerkkejä 1/2
• Olkoon
X1, X2, … , Xn
yksinkertainen satunnaisotosjakaumasta f(x; θ), jonka parametrinaon θ.
• Tarkastellaan seuraavien jakaumien parametrien
MM-estimointia eli estimointia momenttimenetelmällä (ks.
lukuja Diskreettejä jakaumiaja Jatkuvia jakaumia):
– Normaalijakauma – Eksponenttijakauma – Bernoulli-jakauma
Momenttimenetelmä
Esimerkkejä 2/2
• Huomautuksia:
– Normaalijakauman, eksponenttijakauman ja Bernoulli-jakauman parametrien estimointia suurimman uskottavuuden menetelmällä tarkastellaan myöhemmin tässä esityksessä.
– Normaalijakauman, eksponenttijakauman ja Bernoulli-jakauman tapauksessa momenttimenetelmä ja suurimman uskottavuuden menetelmä tuottavat parametreille samat estimaattorit.
– Estimaattoreiden ominaisuuksia käsitellään suurimman uskottavuuden menetelmän soveltamisen yhteydessä.
Normaalijakauman parametrien estimointi momenttimenetelmällä
Normaalijakauma ja sen parametrointi
• Satunnaismuuttuja Xnoudattaa normaalijakaumaa N(µ, σ2), jos sen tiheysfunktioon
• Normaalijakauman parametreinaovat jakauman odotusarvo
ja varianssi
2
2 1 1
( ; , ) exp
2 2
, 0
f xµ σ x µ
σ π σ
µ σ
−
= −
−∞ < < +∞ >
E( )X =µ Var( )X =σ2
TKK (c) Ilkka Mellin (2004) 31
Normaalijakauman parametrien estimointi momenttimenetelmällä
Normaalijakauman parametrien ja momenttien yhteys
• Määritellään satunnaismuuttujan X1. ja 2. momentti kaavalla
• Normaalijakauman parametrien µja σ2sekä momenttien α1ja α2välillä on seuraava bijektio:
(i) Parametrit lausuttuina momenttien funktioina:
(ii) Momentit lausuttuina parametrien funktioina:
1
2 2 2 2 2
2 1
E( )
Var( ) E[( ) ] E( ) X
X X X
µ α
σ µ µ α α
= =
= = − = − = −
1
2 2 2
2
E( ) E( )
X X
α µ
α σ µ
= =
= = +
E( k) , 1, 2
k X k
α = =
TKK (c) Ilkka Mellin (2004) 32
Normaalijakauman parametrien estimointi momenttimenetelmällä
Otos normaalijakaumasta
• Olkoon
X1, X2, … , Xn
yksinkertainen satunnaisotosnormaalijakaumasta N(µ, σ2)
• Tällöin havainnot X1, X2, … , Xnovat riippumattomia, samaa normaalijakaumaa
N(µ, σ2)
noudattavia satunnaismuuttujia.
TKK (c) Ilkka Mellin (2004) 33
Normaalijakauman parametrien estimointi momenttimenetelmällä
Normaalijakauman parametrien momenttiestimaattorit 1/2
• Määritellään havaintojen X1, X2, … , Xn1. ja 2.
otosmomenttikaavalla
• Siten normaalijakauman N(µ, σ2) parametrien µja σ2 MM-estimaattoriteli momenttiestimaattoritovat
1 1
2 2 2 2
2 1 1
1
ˆ 1 ˆ 1
n i i
n i i
a X
n
a a X a
n µ
σ
=
=
= =
= − = −
∑
∑
1
1 , 1, 2
n k
k i
i
a X k
n =
=
∑
=TKK (c) Ilkka Mellin (2004) 34
Normaalijakauman parametrien estimointi momenttimenetelmällä
Normaalijakauman parametrien momenttiestimaattorit 2/2
• Odotusarvon µmomenttiestimaattori
on havaintojen X1, X2, … , Xnaritmeettinen keskiarvo.
• Varianssin σ2momenttiestimaattori
on havaintojen X1, X2, … , Xnotosvarianssieli 2. keskusmomentti.
2 2 2 2 2
2 1 2
1 1
1 1
ˆ n i n ( i )
i i
a a X X X X m
n n
σ
= =
= − =
∑
− =∑
− =1 1
ˆ 1 n i
i
a X X
µ n
=
= =
∑
=TKK (c) Ilkka Mellin (2004) 35
Eksponenttijakauman parametrien estimointi momenttimenetelmällä
Eksponenttijakauma ja sen parametrointi
• Satunnaismuuttuja Xnoudattaa eksponenttijakaumaa Exp(λ), jos sen tiheysfunktioon
• Eksponenttijakauman ainoa parametri
voidaan tulkita sopivat ehdot toteuttavassa jono- tapahtumassa 1. tapahtuman odotusajaksitai tapahtuma- intensiteetiksi.
( ; ) exp( ) , 0 , 0
f xλ =λ −λx x≥ λ>
1 E( )X λ=
TKK (c) Ilkka Mellin (2004) 36
Eksponenttijakauman parametrien estimointi momenttimenetelmällä
Eksponenttijakauman parametrin ja 1. momentin yhteys
• Määritellään satunnaismuuttujan X1. momenttikaavalla
• Eksponenttijakauman parametrin λja 1. momentin α1
välillä on seuraava bijektio:
(i) Parametri λlausuttuna momentin α1funktiona:
(ii) Momentti α1lausuttuna parametrin λfunktiona:
1 E( )X
α =
1
1 1
E( )X λ= =α
1
E( )X 1 α = =λ
TKK (c) Ilkka Mellin (2004) 37
Eksponenttijakauman parametrien estimointi momenttimenetelmällä
Otos eksponenttijakaumasta
• Olkoon
X1, X2, … , Xn
yksinkertainen satunnaisotoseksponenttijakaumasta Exp(λ)
• Tällöin havainnot X1, X2, … , Xnovat riippumattomia, samaa eksponenttijakaumaa
Exp(λ)
noudattavia satunnaismuuttujia.
TKK (c) Ilkka Mellin (2004) 38
Eksponenttijakauman parametrien estimointi momenttimenetelmällä
Eksponenttijakauman parametrin momenttiestimaattori
• Määritellään havaintojen X1, X2, … , Xn1. otosmomentti kaavalla
• Siten eksponenttijakauman Exp(λ) parametrin λ MM-estimaattorieli momenttiestimaattorion
jossa
on havaintojen X1, X2, … , Xnaritmeettinen keskiarvo.
1
1 1
ˆ a X
λ= =
X=a1 1
1
1 n
i i
a X
n =
=
∑
TKK (c) Ilkka Mellin (2004) 39
Bernoulli-jakauman parametrien estimointi momenttimenetelmällä
Bernoulli-jakauma ja sen parametrointi
• Olkoon A tapahtuma, jonka todennäköisyys on p:
Pr(A) = p
• Määritellään satunnaismuuttuja Xseuraavasti:
• Satunnaismuuttuja Xnoudattaa Bernoulli-jakaumaa Ber(p) ja sen pistetodennäköisyysfunktioon
• Bernoulli-jakauman ainoa parametri pyhtyy jakauman odotusarvoon:
p= E(X)
( ; ) x(1 )1x, 0,1; 0 1 f x p =p −p − x= < <p
1, jos tapahtuu 0, jos ei tapahdu X A
A
=
TKK (c) Ilkka Mellin (2004) 40
Bernoulli-jakauman parametrien estimointi momenttimenetelmällä
Bernoulli-jakauman odotusarvoparametrin ja 1. momentin yhteys
• Määritellään satunnaismuuttujan X1. momenttikaavalla
• Bernoulli-jakauman odotusarvoparametrin pja 1. momentin α1välillä on seuraava bijektio:
(i) Parametri plausuttuna momentin α1funktiona:
p= E(X) = α1
(ii) Momentti α1lausuttuna parametrin pfunktiona:
α1= E(X) = p
1 E( )X
α =
Bernoulli-jakauman parametrien estimointi momenttimenetelmällä
Otos Bernoulli-jakaumasta
• Olkoon
X1, X2, … , Xn
yksinkertainen satunnaisotosBernoulli-jakaumasta Ber(p)
• Tällöin havainnot X1, X2, … , Xnovat riippumattomia, samaa Bernoulli-jakaumaa
Ber(p)
noudattavia satunnaismuuttujia.
Bernoulli-jakauman parametrien estimointi momenttimenetelmällä
Bernoulli-jakauman odotusarvoparametrin momenttiestimaattori 1/2
• Määritellään havaintojen X1, X2, … , Xn1. otosmomentti kaavalla
• Siten Bernoulli-jakauman Ber(p) odotusarvoparametrin p MM-estimaattorieli momenttiestimaattorion jossa
on havaintojen X1, X2, … , Xnaritmeettinen keskiarvo.
ˆ 1
p a= =X
X=a1 1
1
1 n
i i
a X
n =
=
∑
TKK (c) Ilkka Mellin (2004) 43
Bernoulli-jakauman parametrien estimointi momenttimenetelmällä
Bernoulli-jakauman odotusarvoparametrin momenttiestimaattori 2/2
• Koska
niin
jossa fon tapahtuman A frekvenssiotoksessa.
• Siten Bernoulli-jakauman odotusarvoparametrin p momenttiestimaattori
on tapahtuman A suhteellinen frekvenssi1 otoksessa.
ˆ 1 n i i
p X f
n = n
=
∑
=1, jos tapahtuu 0, jos ei tapahdu
i
X A
A
=
1 n
i i
X f
=
∑
=TKK (c) Ilkka Mellin (2004) 44
Todennäköisyysjakaumien parametrien estimointi Momenttimenetelmä
Normaalijakauman parametrien estimointi Eksponenttijakauman parametrien estimointi Bernoulli-jakauman parametrien estimointi
>> Suurimman uskottavuuden menetelmä Normaalijakauman parametrien estimointi Eksponenttijakauman parametrien estimointi Bernoulli-jakauman parametrien estimointi
Estimointimenetelmät
TKK (c) Ilkka Mellin (2004) 45
Avainsanat Bernoulli-jakauma Eksponenttijakauma Normaalijakauma Suurimman uskottavuuden
estimaattori Suurimman uskottavuuden
menetelmä
Suurimman uskottavuuden menetelmä
TKK (c) Ilkka Mellin (2004) 46
Suurimman uskottavuuden menetelmä
Uskottavuusfunktio 1/2
• Olkoon X1, X2, … , Xnyksinkertainen satunnaisotos jakaumasta f(x; θ), jonka parametrinaon θ.
• Koska havainnot X1, X2, … , Xnon oletettu tässä riippumattomiksi, niiden yhteisjakauman piste- todennäköisyys-tai tiheysfunktioon
jossa
on havaintoon Xiliittyvä pistetodennäköisyys- tai tiheysfunktio.
1 2
1 2
( , , , ; )
( ; ) ( ; ) ( ; )
n
n
f x x x
f x f x f x
θ
θ θ θ
= × × ×
…
( ; ) ,i 1,2, , f x θ i= …n
TKK (c) Ilkka Mellin (2004) 47
Suurimman uskottavuuden menetelmä
Uskottavuusfunktio 2/2
• Otoksen X1, X2, … , Xnuskottavuusfunktio on havaintojen
X1, X2, … , Xn
yhteisjakauman pistetodennäköisyys-tai tiheysfunktion f arvo pisteessä
x1, x2, … , xn
tulkittuna parametrinθarvojen funktioksi.
• Huomautus:
Uskottavuusfunktio Lsisältääkaiken informaation otoksesta.
1 2 1 2
( ; , , , )n ( , , , n; ) Lθ x x …x =f x x …x θ
TKK (c) Ilkka Mellin (2004) 48
Suurimman uskottavuuden menetelmä
Suurimman uskottavuuden estimaattori 1/2
• Olkoon
parametrin θarvo, joka maksimoi uskottavuusfunktion parametrin θsuhteen.
• Huomautus:
Uskottavuusfunktion Lmaksimin antava parametrin θarvo t on muuttujien (havaintoarvojen) x1, x2, … , xnfunktio.
1 2
( , , , )n
t=g x x …x
1 2
( ; , , , )n Lθ x x …x
TKK (c) Ilkka Mellin (2004) 49
Suurimman uskottavuuden menetelmä
Suurimman uskottavuuden estimaattori 2/2
• Sijoittamalla uskottavuusfunktion Lmaksimin parametrin θsuhteen antavassa lausekkeessa
muuttujien x1, x2, … , xn
paikalle havainnot X1, X2, … , Xn
saadaan parametrin θsuurimman uskottavuuden estimaattorieli SU-estimaattori
1 2
ˆ g X X( , , ,Xn)
θ= …
1 2
( , , , )n
t=g x x … x
TKK (c) Ilkka Mellin (2004) 50
Suurimman uskottavuuden menetelmä
Kommentteja
• Parametrin θsuurimman uskottavuuden estimaattori tuottaa parametrille θarvon, joka maksimoi poimitun otokseneli saatujen havaintoarvojen uskottavuuden (todennäköisyyden).
• Parametrin θsuurimman uskottavuuden estimaattorin otoskohtainen arvo maksimoi todennäköisyyden saada juuri se otos, joka on saatu.
θˆ
θˆ
TKK (c) Ilkka Mellin (2004) 51
Suurimman uskottavuuden menetelmä
SU-estimaattorin määrääminen 1/2
• Parametrin θsuurimman uskottavuuden estimaattori määrätään maksimoimalla uskottavuusfunktio parametrin θsuhteen.
• Kaikissa säännöllisissä tapauksissa maksimi löydetään merkitsemällä uskottavuusfunktion L(θ) derivaatta
L´(θ)
nollaksija ratkaisemalla θsaadusta normaaliyhtälöstä L´(θ) = 0
1 2
( ) ( ; , , , )n
Lθ =Lθ x x …x
TKK (c) Ilkka Mellin (2004) 52
Suurimman uskottavuuden menetelmä
SU-estimaattorin määrääminen 2/2
• Jos parametrin θarvo
tuottaa uskottavuusfunktion L(θ) maksimin, parametrin θ suurimman uskottavuuden estimaattorion
jossa X1, X2, … , Xnon yksinkertainen satunnaisotos siitä jakaumasta, johon uskottavuusfunktio L(θ) liittyy.
1 2
( , , , )n
t=g x x …x
1 2
ˆ g X X( , , ,Xn)
θ= …
Suurimman uskottavuuden menetelmä
Logaritminen uskottavuusfunktio 1/3
• Uskottavuusfunktion maksimin löytämistä
helpottaa tavallisesti siirtyminen tutkimaan logaritmista uskottavuusfunktiota(uskottavuusfunktion logaritmia):
• Huomautus:
Logaritminen uskottavuusfunktio saavuttaa ääriarvonsa samassa pisteessäkuin uskottavuusfunktio, koska logaritmi on aidosti monotoninen funktio.
( ) log ( ) lθ = Lθ
Suurimman uskottavuuden menetelmä
Logaritminen uskottavuusfunktio 2/3
• Koska havainnot X1, X2, … , Xnoletettiin tässä
riippumattomiksi, logaritminen uskottavuusfunktiovoidaan kirjoittaa seuraavaan muotoon:
jossa
l(θ; xi) = logf(xi; θ) , i= 1, 2, … , n
on havaintoarvoon xiliittyvä logaritminen uskottavuus- funktio.
(
1 2)
1 2
1 2
( ) log ( )
log ( ; ) ( ; ) ( ; )
log ( ; ) log ( ; ) log ( ; )
( ; ) ( ; ) ( ; )
n n n
l L
f x f x f x
f x f x f x
l x l x l x
θ θ
θ θ θ
θ θ θ
θ θ θ
=
= × × ×
= + + +
= + + +
TKK (c) Ilkka Mellin (2004) 55
Suurimman uskottavuuden menetelmä
Logaritminen uskottavuusfunktio 3/3
• Logaritmisen uskottavuusfunktion summaesityksen maksimointi on usein ratkaisevasti helpompaakuin uskottavuusfunktion maksimointi.
1 2
( ) ( ; ) ( ; ) ( ; )n lθ =lθ x +lθ x + +lθ x
TKK (c) Ilkka Mellin (2004) 56
Suurimman uskottavuuden menetelmä
SU-estimaattorin ominaisuudet
• Olkoon X1, X2, … , Xnyksinkertainen satunnaisotos jakaumasta f(x; θ), jonka parametrinaon θ.
• Olkoon parametrin θsuurimman uskottavuudeneli SU-estimaattori.
• Hyvä estimaattori on harhaton, tyhjentävä, tehokasja tarkentuva(ks. lukua Estimointi).
• SU-estimaattori ei välttämättä täytä
hyvän estimaattorin kriteereitä, joten suurimman uskottavuuden menetelmää käytettäessä on aina erikseen varmistettava tuloksena saadun estimaattorin hyvyys.
θˆ
θˆ
TKK (c) Ilkka Mellin (2004) 57
Suurimman uskottavuuden menetelmä
SU-estimaattorin asymptoottiset ominaisuudet 1/3
• Jos parametrin θSU-estimaattori ei täytä hyvän estimaattorin kriteereitä äärellisillä havaintojen luku- määrillä, SU-estimaattorin käyttöä parametrin θ estimaattorina voidaan perustella SU-estimaattorin yleisillä asymptoottisilla ominaisuuksilla:
(i) SU-estimaattori on tarkentuvaeli
(ii) SU-estimaattori on asymptoottisesti normaalinen.
θˆ
θˆ
Pr(θˆ→θ) 1, kun n= → + ∞ θˆ
θˆ
TKK (c) Ilkka Mellin (2004) 58
Suurimman uskottavuuden menetelmä
SU-estimaattorin asymptoottiset ominaisuudet 2/3
• SU-estimaattorintarkentuvuusmerkitsee sitä, että SU- estimaattori toteuttaa suurten lukujen lain(ks. lukua
Konvergenssikäsitteet ja raja-arvolauseet).
• Suurten lukujen lain mukaan SU-estimaattorin arvo lähestyy stokastisesti parametrin oikeata arvoa, kun otoskoko kasvaa.
TKK (c) Ilkka Mellin (2004) 59
Suurimman uskottavuuden menetelmä
SU-estimaattorin asymptoottiset ominaisuudet 3/3
• SU-estimaattorinasymptoottinen normaalisuusmerkitsee sitä, että SU-estimaattori toteuttaa keskeisen raja-arvo- lauseen(ks. lukua Konvergenssikäsitteet ja raja-arvolauseet).
• SU-estimaattorin asymptoottinen normaalisuus merkitsee sitä, ettäSU-estimaattorin jakaumaa voidaan suurissa otoksissa approksimoida normaalijakaumalla.
• Se, että SU-estimaattori on erittäin yleisten ehtojen pätiessä asymptoottisesti normaalinen, on tärkeä lisä- peruste normaalijakauman keskeiselle asemalle tilastotieteessä.
TKK (c) Ilkka Mellin (2004) 60
Suurimman uskottavuuden menetelmä
Suurimman uskottavuuden menetelmä vs momenttimenetelmä
• Suurimman uskottavuuden menetelmä ja momentti- menetelmä eivät välttämättä tuota samoja estimaattoreita todennäköisyysjakauman parametreille.
• Monissa alkeellisissa tilanteissa menetelmät tuottavat kuitenkin samat estimaattorit.
• Suurimman uskottavuuden menetelmällä on tukenaan vahva tilastollinen teoria.
• Suurimman uskottavuuden menetelmä on hyvin pitkälti syrjäyttänytvanhemman momenttimenetelmän estimaattoreiden johtamisessa.
TKK (c) Ilkka Mellin (2004) 61
Suurimman uskottavuuden menetelmä
Esimerkkejä 1/2
• Olkoon
X1, X2, … , Xn
yksinkertainen satunnaisotosjakaumasta f(x; θ).
• Tarkastellaan seuraavien jakaumien parametrien SU-estimointia eli estimointia suurimman uskottavuuden menetelmällä (ks. lukuja Diskreettejä jakaumiaja Jatkuvia jakaumia):
– Normaalijakauma – Eksponenttijakauma – Bernoulli-jakauma
TKK (c) Ilkka Mellin (2004) 62
Suurimman uskottavuuden menetelmä
Esimerkkejä 2/2
• Huomautuksia:
– Normaalijakauman, eksponenttijakauman ja Bernoulli-jakauman parametrien estimointia momenttimenetelmälläon tarkasteltu aikaisemmin tässä esityksessä.
– Normaalijakauman, eksponenttijakauman ja Bernoulli-jakauman tapauksessa suurimman uskottavuuden menetelmä ja momentti- menetelmä ja tuottavat jakaumien parametreille samat estimaattorit.
TKK (c) Ilkka Mellin (2004) 63
Normaalijakauman parametrien estimointi SU-menetelmällä
Normaalijakauma ja sen parametrointi
• Satunnaismuuttuja Xnoudattaa normaalijakaumaa N(µ, σ2), jos sen tiheysfunktioon
• Normaalijakauman parametreinaovat jakauman odotusarvo
ja varianssi E( )X =µ Var( )X =σ2
2
2 1 1
( ; , ) exp
2 2
, 0
f xµ σ σ π xσµ
µ σ
−
= −
−∞ < < +∞ >
TKK (c) Ilkka Mellin (2004) 64
Normaalijakauman parametrien estimointi SU-menetelmällä
Otos normaalijakaumasta
• Olkoon
X1, X2, … , Xn
yksinkertainen satunnaisotosnormaalijakaumasta N(µ, σ2)
• Tällöin havainnot X1, X2, … , Xnovat riippumattomia, samaa normaalijakaumaa
N(µ, σ2)
noudattavia satunnaismuuttujia.
Normaalijakauman parametrien estimointi SU-menetelmällä
Normaalijakautuneen otoksen
uskottavuusfunktio ja log-uskottavuusfunktio
• Otoksen X1, X2, … , Xnuskottavuusfunktioon
• Otoksen X1, X2, … , Xnlogaritminen uskottavuusfunktio on
2
1 2
2 2 2
1 2
1 2 2
2 1
( , ; , , , )
( ; , ) ( ; , ) ( ; , )
(2 ) exp 1 ( )
2
n
n n n
n
i i
L x x x
f x f x f x
x µ σ
µ σ µ σ µ σ
σ π µ
σ
− −
=
= × × ×
= − −
∑
…
2
1 2
2
1 2
2 2
( , ; , , , ) log ( , ; , , , )
1 1
log log(2 ) ( )
n n
n i
l x x x
L x x x
n n x
µ σ µ σ
σ π µ
σ
=
= − − −
∑
−…
…
Normaalijakauman parametrien estimointi SU-menetelmällä
Normaalijakauman parametrien SU-estimaattorit
• Normaalijakauman N(µ, σ2) odotusarvon µja varianssin σ2SU-estimaattoriteli suurimman uskottavuuden estimaattoritovat havaintojen X1, X2, … , Xn aritmeettinen keskiarvo
ja otosvarianssi
• Huomautus:
Parametrien µja σ2SU-estimaattorit yhtyvät niiden momentti-
1
ˆ 1 n i i
X X
µ n
=
=
∑
=2 2
1
ˆ 1 n ( i )
i
X X
σ n
=
=
∑
−TKK (c) Ilkka Mellin (2004) 67
Normaalijakauman parametrien estimointi SU-menetelmällä
SU-estimaattoreiden johto 1/2
• Derivoidaanlogaritminen uskottavuusfunktio
ensinparametrin µsuhteen ja merkitään derivaatta nollaksi:
• Derivaatan ainoa nollakohta
antaa log-uskottavuusfunktionmaksiminparametrin µsuhteen.
2 2 2
2 1
1 1
( , ) log log(2 ) ( )
2 2 2
n i i
lµ σ n σ n π x µ
σ =
= − − −
∑
−2 2
1
( , ) 1 n(i ) 0
i
lµ σ x µ
µ σ =
∂ = − =
∂
∑
1
ˆ 1
n i i
x x
µ n
=
=
∑
=TKK (c) Ilkka Mellin (2004) 68
Normaalijakauman parametrien estimointi SU-menetelmällä
SU-estimaattoreiden johto 2/2
• Sijoitetaanratkaisu logaritmiseen uskottavuusfunktioon:
• Derivoidaanfunktio parametrin σ2suhteen ja merkitään derivaatta nollaksi:
• Derivaatan ainoa nollakohta
antaa log-uskottavuusfunktionmaksiminparametrin σ2suhteen.
2 2 2
2 1
1 1
( , ) log log(2 ) ( )
2 2 2
n i i
l xσ n σ n π x x
σ =
= − − −
∑
−µ=x
( , 2) l xσ
2
2 2 4
1
( , ) 1 ( ) 0
2 2
n i i
lµ σ n x x
σ σ σ =
∂ = − + − =
∂
∑
2 2
1
ˆ 1n(i )
i
n x x σ
=
=
∑
−TKK (c) Ilkka Mellin (2004) 69
Normaalijakauman parametrien estimointi SU-menetelmällä
SU-estimaattoreiden ominaisuudet 1/2
• Normaalijakauman N(µ, σ2) odotusarvon µ SU-estimaattorilla on seuraavat ominaisuudet:
(i) on harhaton.
(ii) ja ovat yhdessä tyhjentäviäparametreille µ, σ2 . (iii) on tehokaseli minimivarianssinen estimaattori.
(iv) on tarkentuva.
(v) noudattaa normaalijakaumaa:
µˆ µˆ
µˆ µˆ µˆ µˆ
2
ˆ ~ N , n µ µ σ
ˆ2
σ
TKK (c) Ilkka Mellin (2004) 70
Normaalijakauman parametrien estimointi SU-menetelmällä
SU-estimaattoreiden ominaisuudet 2/2
• Normaalijakauman N(µ, σ2) varianssin σ2 SU-estimaattorilla on seuraavat ominaisuudet:
(i) on harhainen, mutta estimaattori
on harhaton.
(ii) ja ovat yhdessä tyhjentäviäparametreille µ, σ2 . (iii) on tehokaseli minimivarianssinen estimaattori.
(iv) on tarkentuva.
(v) (n– 1) s2/σ2noudattaa χ2-jakaumaa:
ˆ2
σ
2 2 2
1
ˆ 1 ( )
1 1
n i i
s n X X
n σ n
=
= = −
− −
∑
ˆ2
σ
ˆ2
σ ˆ2
σ
2 2 2
(n 1)s χ (n 1) σ
− ∼ −
ˆ2
σ µˆ
TKK (c) Ilkka Mellin (2004) 71
Eksponenttijakauman parametrien estimointi SU-menetelmällä
Eksponenttijakauma ja sen parametrointi
• Satunnaismuuttuja Xnoudattaa eksponenttijakaumaa Exp(λ), jos sen tiheysfunktioon
• Eksponenttijakauman ainoa parametri
voidaan tulkita sopivat ehdot toteuttavassa jono- tapahtumassa 1. tapahtuman odotusajaksitai tapahtuma- intensiteetiksi.
1 E( )X λ=
( ; ) exp( ) , 0 , 0
f xλ =λ −λx x≥ λ>
TKK (c) Ilkka Mellin (2004) 72
Eksponenttijakauman parametrien estimointi SU-menetelmällä
Otos eksponenttijakaumasta
• Olkoon
X1, X2, … , Xn
yksinkertainen satunnaisotoseksponenttijakaumasta Exp(λ)
• Tällöin havainnot X1, X2, … , Xnovat riippumattomia, samaa eksponenttijakaumaa
Exp(λ)
noudattavia satunnaismuuttujia.
TKK (c) Ilkka Mellin (2004) 73
Eksponenttijakauman parametrien estimointi SU-menetelmällä
Eksponenttijakautuneen otoksen
uskottavuusfunktio ja log-uskottavuusfunktio
• Otoksen X1, X2, … , Xnuskottavuusfunktioon
• Otoksen X1, X2, … , Xnlogaritminen uskottavuusfunktio on
1 2
1 2
1
( ; , , , )
( ; ) ( ; ) ( ; )
exp
n
n n
n
i i
L x x x
f x f x f x
x λ
λ λ λ
λ λ
=
= × × ×
= −
∑
…
1 2
1 2
1
( ; , , , ) log ( ; , , , )
log( )
n n n
i i
l x x x
L x x x
n x
λ λ λ λ
=
=
= −
∑
…
…
TKK (c) Ilkka Mellin (2004) 74
Eksponenttijakauman parametrien estimointi SU-menetelmällä
Eksponenttijakauman parametrin SU-estimaattori
• Eksponenttijakauman Exp(λ) parametrin λ SU-estimaattorieli suurimman uskottavuuden estimaattorion
jossa
on havaintojen X1, X2, … , Xnaritmeettien keskiarvo.
• Huomautuksia:
– Parametrin λSU-estimaattori yhtyy sen momenttiestimaattoriin.
– Estimaattorin ominaisuudet sivuutetaan.
ˆ 1 λ=X
1
1 n
i i
X X
n =
=
∑
λˆ
TKK (c) Ilkka Mellin (2004) 75
Eksponenttijakauman parametrien estimointi SU-menetelmällä
SU-estimaattorin johto
• Derivoidaanlogaritminen uskottavuusfunktio
parametrin λsuhteen ja merkitään derivaatta nollaksi:
• Derivaatan ainoa nollakohta
antaa log-uskottavuusfunktionmaksiminparametrin λsuhteen.
1
( ) log( ) n i i
lλ n λ λ x
=
= −
∑
1
( ) n i 0
i
lλ n x
λ λ =
∂ = − =
∂
∑
1
1 1
ˆ 1n
i i
x x n λ
=
= =
∑
TKK (c) Ilkka Mellin (2004) 76
Bernoulli-jakauman parametrien estimointi SU-menetelmällä
Bernoulli-jakauma ja sen parametrointi
• Olkoon A tapahtuma, jonka todennäköisyys on p:
Pr(A) = p
• Määritellään satunnaismuuttuja Xseuraavasti:
• Satunnaismuuttuja Xnoudattaa Bernoulli-jakaumaa Ber(p) ja sen pistetodennäköisyysfunktioon
• Bernoulli-jakauman ainoa parametri pyhtyy jakauman odotusarvoon:
p= E(X)
1, jos tapahtuu 0, jos ei tapahdu X A
A
=
( ; ) x(1 )1x, 0,1; 0 1 f x p =p −p − x= < <p
Bernoulli-jakauman parametrien estimointi SU-menetelmällä
Otos Bernoulli-jakaumasta
• Olkoon
X1, X2, … , Xn
yksinkertainen satunnaisotosBernoulli-jakaumasta Ber(p)
• Tällöin havainnot X1, X2, … , Xnovat riippumattomia, samaa Bernoulli-jakaumaa
Ber(p)
noudattavia satunnaismuuttujia.
Bernoulli-jakauman parametrien estimointi SU-menetelmällä
Bernoulli-jakautuneen otoksen
uskottavuusfunktio ja log-uskottavuusfunktio
• Otoksen X1, X2, …, Xnuskottavuusfunktioon
• Otoksen X1, X2, …, Xnlogaritminen uskottavuusfunktio on
1 2
1 2
( ; , , , )
( ; ) ( ; ) ( ; )
(1 )
i i
n
n
x n x
L p x x x
f x p f x p f x p
pΣ p −Σ
= × × ×
= −
…
1 2
1 2
( ; , , , ) log ( ; , , , )
log( ) ( )log(1 )
n n
n n
i i
l p x x x
L p x x x
x p n x p
=
=
∑
+ −∑
−…
…
TKK (c) Ilkka Mellin (2004) 79
Bernoulli-jakauman parametrien estimointi SU-menetelmällä
Bernoulli-jakauman odotusarvoparametrin SU-estimaattori 1/2
• Bernoulli-jakauman Ber(p) odotusarvoparametrin p SU-estimaattorieli suurimman uskottavuuden estimaattorion havaintojen X1, X2, … , Xn
aritmeettien keskiarvo
• Huomautus:
Parametrin pSU-estimaattori yhtyy sen momenttiestimaattoriin.
1
ˆ 1
n i i
p X X
n =
=
∑
=TKK (c) Ilkka Mellin (2004) 80
Bernoulli-jakauman parametrien estimointi SU-menetelmällä
Bernoulli-jakauman odotusarvoparametrin SU-estimaattori 2/2
• Koska
niin
jossa fon tapahtuman A frekvenssiotoksessa.
• Siten Bernoulli-jakauman odotusarvoparametrin p suurimman uskottavuuden estimaattori
on tapahtuman A suhteellinen frekvenssi1 otoksessa.
ˆ 1 n i i
p X f
n = n
=
∑
=1, jos tapahtuu 0, jos ei tapahdu
i
X A
A
=
1 n
i i
X f
=
∑
=TKK (c) Ilkka Mellin (2004) 81
Bernoulli-jakauman parametrien estimointi SU-menetelmällä
SU-estimaattorin johto
• Derivoidaanlogaritminen uskottavuusfunktio
parametrin psuhteen ja merkitään derivaatta nollaksi:
• Derivaatan ainoa nollakohta
antaa uskottavuusfunktion maksimin.
( ) 0
1
i i
x n x
l p
p p p
Σ − Σ
∂ = − =
∂ −
1 1
( ) n ilog( ) ( n i)log(1 )
i i
l p x p n x p
= =
=
∑
+ −∑
−1
ˆ 1n i i
p x x
n=
=
∑
=TKK (c) Ilkka Mellin (2004) 82
Bernoulli-jakauman parametrien estimointi SU-menetelmällä
SU-estimaattorin ominaisuudet
• Bernoulli-jakauman Ber(p) odotusarvoparametrin p SU-estimaattorilla on seuraavat ominaisuudet:
(i) on harhaton.
(ii) on tyhjentävä.
(iii) on tehokaseli minimivarianssinen estimaattori.
(iv) on tarkentuva.
(v) noudattaa asymptoottisesti normaalijakaumaa:
(1 ) ˆ ~ Na ,
p p
p p
n
−
ˆ p pˆ
pˆ pˆ pˆ pˆ