TKK (c) Ilkka Mellin (2004) 1
Johdatus tilastotieteeseen
Väliestimointi
TKK (c) Ilkka Mellin (2004) 2
Todennäköisyysjakaumien parametrien estimointi Luottamusväli
Normaalijakauman odotusarvon luottamusväli Normaalijakauman varianssin luottamusväli Bernoulli-jakauman odotusarvon luottamusväli
Väliestimointi
TKK (c) Ilkka Mellin (2004) 3
Väliestimointi:
Mitä opimme? – 1/3
• Tilastollisen tutkimuksentavoitteena on tehdä johtopäätöksiä prosesseistatai mekanismeista, jotka generoivatreaalimaailman ilmiöitä koskevia havaintoja.
• Tavoitteeseen pyritään rakentamalla havainnot generoineille prosesseille tai mekanismeille tilastollisia malleja.
• Koska tilastollisten tutkimusasetelmien havaintoihin liittyy aina satunnaisuuttatai epävarmuutta, tilastollisina malleina käytetään todennäköisyysmalleja.
• Tilastollinen malli havainnot generoineelle prosessille tai mekanismille on täysin määrätty, jos havaintojen todennäköisyys- jakaumatunnetaan.
TKK (c) Ilkka Mellin (2004) 4
Väliestimointi:
Mitä opimme? – 2/3
• Tilastollisena mallina käytettävän todennäköisyysjakauman parametrejaeisovellustilanteessa yleensä tunneta.
• Jakauman parametreille on löydettävä estimaatiteli arviot, jotta jakaumaa voisi hyödyntää mallina.
• Tilastollisen tutkimuksentärkeimpiä osatehtäviä on estimoidaeli arvioidamallina käytettävän todennäköisyysjakauman tuntemattomat parametrit ilmiötä koskevista havainnoista.
• Havaintojen funktiota, joka tuottaa ilmiötä koskeviin havaintoihin sovellettuna estimaattejaeli arvioitatodennäköisyysjakauman tuntemattomalle parametrille, kutsutaan parametrin estimaattoriksi.
TKK (c) Ilkka Mellin (2004) 5
Väliestimointi:
Mitä opimme? – 3/3
• Tilastotieteentärkeimpiä osatehtäviä on johtaaestimaattoreita todennäköisyysjakauman parametreille.
• Estimaattoreiden johtamiseen käytetään tavallisesti joko suurimman uskottavuuden menetelmäätai momenttimenetelmää.
Ks. lukua Estimointimenetelmät.
• Todennäköisyysjakauman tuntemattomien parametrien arvojen määräämistä kutsutaan usein piste-estimoinniksierotukseksi väli- estimoinnista, jossa parametreihin liitetään luottamusväleiksi kutsutut välit, joka sisältävät parametrien todelliset arvot soveltajan valittavissa olevilla todennäköisyyksillä.
TKK (c) Ilkka Mellin (2004) 6
Väliestimointi:
Esitiedot
• Esitiedot: ks. seuraavia lukuja:
Tilastollisten aineistojen kerääminen ja mittaaminen Tilastollisten aineistojen kuvaaminen
Otos ja otosjakaumat Estimointi Estimointimenetelmät
Satunnaismuuttujat ja todennäköisyysjakaumat Jakaumien tunnusluvut
Diskreettejä jakaumia Jatkuvia jakaumia
TKK (c) Ilkka Mellin (2004) 7
Väliestimointi:
Lisätiedot
• Todennäköisyysjakaumien parametreja koskevien tilastollisten hypoteesien testaamistakäsitellään luvussa
Tilastolliset testit
• Jakaumaoletuksien testaamistakäsitellään luvussa
Yhteensopivuuden, homogeenisuuden ja riippumattomuuden testaaminen
TKK (c) Ilkka Mellin (2004) 8
>> Todennäköisyysjakaumien parametrien estimointi Luottamusväli
Normaalijakauman odotusarvon luottamusväli Normaalijakauman varianssin luottamusväli Bernoulli-jakauman odotusarvon luottamusväli
Väliestimointi
TKK (c) Ilkka Mellin (2004) 9
Avainsanat Estimaatti Estimaattori Estimointi Havainto Havaintoarvo Parametri Otos Otosjakauma Parametri Piste-estimointi Tilastollinen aineisto Tilastollinen malli Todennäköisyysjakauma Väliestimointi
Parametrien estimointi
TKK (c) Ilkka Mellin (2004) 10
Todennäköisyysjakaumien parametrien estimointi
Todennäköisyysjakaumat tilastollisten aineistojen kuvaajina
• Tilastollinen aineistokoostuu tutkimuksen kohteita kuvaavien muuttujien havaituista arvoista.
• Tilastollisissa tutkimusasetelmissa havaintoihin liittyy aina epävarmuuttaja satunnaisuutta.
• Tilastollisissa tutkimusasetelmissa tutkimuksen kohteita kuvaavat muuttujat tulkitaan satunnaismuuttujiksi, jotka generoivatmuuttujien havaitut arvot.
• Tilastollisella mallillatarkoitetaan havaintoarvot generoineiden satunnaismuuttujien todennäköisyys- jakaumaa.
TKK (c) Ilkka Mellin (2004) 11
Todennäköisyysjakaumien parametrien estimointi
Todennäköisyysjakaumien parametrit 1/2
• Tarkastellaan jotakin tutkimuksen kaikkien mahdollisten kohteiden muodostaman perusjoukon Salkioiden ominaisuutta kuvaavaa satunnaismuuttujaa X.
• Oletetaan, että satunnaismuuttuja Xnoudattaa toden- näköisyysjakaumaa, jonka pistetodennäköisyys- tai tiheysfunktio
f(x; θ)
riippuu parametristaθ.
• Merkintä:
~ ( ; ) X f x θ
TKK (c) Ilkka Mellin (2004) 12
Todennäköisyysjakaumien parametrien estimointi
Todennäköisyysjakaumien parametrit 2/2
• Satunnaismuuttujan Xpistetodennäköisyys- tai tiheysfunktio
f(x; θ)
kuvaa satunnaismuuttujanX todennäköisyysjakaumaa ja parametri θkuvaa jotakin jakauman karakteristista ominaisuutta.
• Koska parametrin θarvoa eisovellustilanteessayleensä tunneta, tilastollisen tutkimuksen tärkeimpiä osatehtäviä on estimoidaeli arvioidatuntemattomalle parametrille θ sopiva arvo jakaumasta f(x; θ) poimitun otoksen perusteella.
TKK (c) Ilkka Mellin (2004) 13
Todennäköisyysjakaumien parametrien estimointi
Yksinkertainen satunnaisotos
• Olkoon
X1, X2, … , Xn
yksinkertainen satunnaisotosjakaumasta, jonka pistetodennäköisyys- tai tiheysfunktio f(x; θ) riippuu parametrista θ.
• Tällöin havainnot X1, X2, … , Xnovat riippumattomia, identtisesti jakautuneita satunnaismuuttujia, joilla on sama pistetodennäköisyys-tai tiheysfunktio f(x; θ):
1, 2, ,
~ ( ; ) , 1, 2, ,
n i
X X X
X f x θ i n
⊥
=
…
…
TKK (c) Ilkka Mellin (2004) 14
Todennäköisyysjakaumien parametrien estimointi
Havainnot ja havaintoarvot
• Oletetaan, että satunnaismuuttujat (havainnot) X1, X2, … , Xn
saavat poimitussa otoksessahavaituiksi arvoikseenluvut x1, x2, … , xn
• Havaintoarvot x1, x2, … , xn
vaihtelevat satunnaisesti otoksesta toiseenjakaumasta f(x; θ)
saatavin todennäköisyyksin.
TKK (c) Ilkka Mellin (2004) 15
Todennäköisyysjakaumien parametrien estimointi
Estimaattorit ja estimaatit 1/2
• Oletetaan, että todennäköisyysjakauman f(x; θ)
parametrinθestimoimiseenkäytetään satunnaismuuttujien X1, X2, … , Xnfunktiota eli tunnuslukua
T= g(X1, X2, … , Xn)
• Tällöin funktiota T= g(X1, X2, … , Xn) kutsutaan parametrin θestimaattoriksija havaintoarvoista
x1, x2, … , xn
laskettua funktion garvoa t= g(x1, x2, … , xn)
kutsutaan parametrin θestimaatiksi.
TKK (c) Ilkka Mellin (2004) 16
Todennäköisyysjakaumien parametrien estimointi
Estimaattorit ja estimaatit 2/2
• Olkoon
T= g(X1, X2, … , Xn)
jakauman f(x; θ) parametrin θestimaattori.
• Tällöin estimaattorinThavaintoarvoista x1, x2, … , xn
laskettu arvo eli estimaatti t= g(x1, x2, … , xn)
on satunnaismuuttujan T arvon realisaatio otoksessa.
TKK (c) Ilkka Mellin (2004) 17
Todennäköisyysjakaumien parametrien estimointi
Estimaattoreiden johtaminen
• Hyvien estimaattoreiden johtaminentodennäköisyys- jakaumien tuntemattomille parametreille on teoreettisen tilastotieteen keskeisiä ongelmia.
• Tärkeimmät estimaattoreiden johtamiseen käytettävät menetelmät:
– Momenttimenetelmä
– Suurimman uskottavuuden menetelmä Ks. lukua Estimointimenetelmät.
TKK (c) Ilkka Mellin (2004) 18
Todennäköisyysjakaumien parametrien estimointi
Piste-estimointi ja väliestimointi
• Todennäköisyysjakauman parametrin arvon estimointia kutsutaan usein piste-estimoinniksi.
• Parametrin estimaattiin on aina syytä liittää luottamus- väliksikutsuttu väli, joka sisältää estimoidun parametrin todellisen, mutta tuntemattoman arvon tietyllä, soveltajan valittavissa olevalla todennäköisyydellä.
• Luottamusvälin määräämistä kutsutaan väliestimoinniksi.
TKK (c) Ilkka Mellin (2004) 19
Todennäköisyysjakaumien parametrien estimointi
>> Luottamusväli
Normaalijakauman odotusarvon luottamusväli Normaalijakauman varianssin luottamusväli Bernoulli-jakauman odotusarvon luottamusväli
Väliestimointi
TKK (c) Ilkka Mellin (2004) 20
Avainsanat Frekvenssitulkinta Luottamuskerroin Luottamustaso Luottamusväli
Luottamusväli
TKK (c) Ilkka Mellin (2004) 21
Luottamusväli
Luottamusväli ja luottamustaso
• Väliestimoinnissatodennäköisyysjakauman f(x; θ) tuntemattomalle parametrille θpyritään määräämään havainnoista riippuva väli, joka tietyllä, tutkijan valittavissa olevalla todennäköisyydellä, peittää parametrin todellisen arvon.
• Konstruoitua väliä kutsutaan luottamusväliksija valittua todennäköisyyttä kutsutaan luottamustasoksi.
• Huomautus:
Luottamustasollevoidaan antaa tulkinta todennäköisyyden frekvenssitulkinnanavulla.
TKK (c) Ilkka Mellin (2004) 22
Luottamusväli
Luottamusvälin määrääminen 1/3
• Oletukset:
(i) Olkoon f(x; θ) satunnaismuuttujan Xtodennäköi- syysjakauma, jonka määrää tuntematon parametri θ. (ii) Olkoon X1, X2, … , Xnyksinkertainen satunnaisotos
jakaumasta f(x; θ).
(iii) Olkoon
parametrin θestimaattori.
1 2
ˆ ˆ( , , , )X X Xn
θ θ= …
TKK (c) Ilkka Mellin (2004) 23
Luottamusväli
Luottamusvälin määrääminen 2/3
• Valitaan luottamustaso 1 −α
ja määrätään sen jälkeen satunnaismuuttujat
siten, että
• Huomautus:
Satunnaismuuttujat Lja Uriippuvat sekä havainnoista X1, X2, … , Xnettä luottamustasosta (1 −α).
Pr(ˆ ) / 2
Pr(ˆ ) / 2
L U
θ θ α
θ θ α
− ≤ =
+ ≥ =
1 2
1 2
( , , , )
( , , , )
n n
L L X X X
U U X X X
=
=
…
…
TKK (c) Ilkka Mellin (2004) 24
Luottamusväli
Luottamusvälin määrääminen 3/3
• Tällöin väli
on parametrin θluottamusväli luottamustasolla (1 −α).
• Luottamusvälin konstruktiosta seuraa, että väli peittää tuntemattoman parametrinθtodellisen arvon todennäköisyydellä(1 −α):
ˆ ˆ
(θ−L,θ+U)
ˆ ˆ
Pr(θ− ≤ ≤ +L θ θ U) 1= −α
ˆ ˆ
(θ−L,θ+U)
TKK (c) Ilkka Mellin (2004) 25
Luottamusväli
Luottamusvälin määrääminen:
Erikoistapaus
• Jos estimaattorin jakauma on symmetrinen, parametrin θ luottamusväli luottamustasolla (1 −α)on muotoa jossa satunnaismuuttuja
valitaan siten, että
• Huomautus:
Satunnaismuuttuja Ariippuu sekä havainnoista X1, X2, … , Xn että luottamustasosta (1 −α).
θˆ ˆ A θ±
ˆ ˆ
Pr(θ− ≤ ≤ +A θ θ A) 1= −α
1 2
( , , , n) A A X X= …X
TKK (c) Ilkka Mellin (2004) 26
Luottamusväli
Luottamustason ja -välin frekvenssitulkinta
• Oletetaan, että luottamustasoksi on valittu (1 −α).
• Luottamustasolle ja siihen liittyvälle luottamusvälille voidaan antaa seuraava frekvenssitulkinta:
(i) Jos otantaa jakaumasta f(x; θ) toistetaan, keskimäärin 100×(1 −α) %
otoksista konstruoiduista luottamusväleistä peittää parametrin θtodellisen arvon.
(ii) Jos otantaa jakaumasta f(x; θ) toistetaan, keskimäärin 100×α%
otoksista konstruoiduista luottamusväleistä ei peitä parametrin θtodellista arvoa.
TKK (c) Ilkka Mellin (2004) 27
Luottamusväli
Johtopäätökset luottamisväleistä
• Oletetaan, että teemmejohtopäätöksen, että konstruoitu luottamusväli peittää parametrin θtuntemattoman todellisen arvon:
(i) Luottamusvälin konstruktiosta seuraa, että tehty johtopäätös on oikea100×(1 −α) %:ssa tapauksia.
(ii) Luottamusvälin konstruktiosta seuraa, että tehty johtopäätös on väärä100×α%:ssa tapauksia.
• Huomautus:
Virheellisen johtopäätöksen mahdollisuuttaei saada häviämään, ellei luottamusväliä tehdääärettömän leveäksi, jolloin väliei enää sisällä informaatiotaparametrinθoikeasta arvosta.
TKK (c) Ilkka Mellin (2004) 28
Luottamusväli
Luottamusvälit:
Esimerkkejä
• Olkoon
X1, X2, … , Xn
yksinkertainen satunnaisotosjakaumasta f(x; θ).
• Tarkastellaan seuraavien jakaumien parametrien luottamusvälejä:
– Normaalijakauman odotusarvon luottamusväli – Normaalijakauman varianssin luottamusväli – Bernoulli-jakauman odotusarvoparametrin
luottamusväli
TKK (c) Ilkka Mellin (2004) 29
Todennäköisyysjakaumien parametrien estimointi Luottamusväli
>> Normaalijakauman odotusarvon luottamusväli Normaalijakauman varianssin luottamusväli Bernoulli-jakauman odotusarvon luottamusväli
Väliestimointi
TKK (c) Ilkka Mellin (2004) 30
Avainsanat Frekvenssitulkinta Luottamuskerroin Luottamustaso Luottamusväli Normaalijakauma
Normaalijakauman odotusarvon luottamusväli
TKK (c) Ilkka Mellin (2004) 31
Normaalijakauman odotusarvon luottamusväli
Esimerkki – 1/4
• Kone tekee ruuveja, joiden pituudet vaihtelevat satunnaisesti noudattaen normaalijakaumaa;
ks. esimerkkiä luvussa Tilastollisten aineistojen kuvaaminen.
• Ruuvien joukosta poimitaan yksinkertainen satunnaisotos, jonka koko n= 30 ja otokseen poimittujen ruuvien pituudet mitataan.
• Taulukko oikealla esittää pituuksien luokiteltua frekvenssi- jakaumaa.
Luokkavälit Luokkafrekvenssit
(9.85,9.90] 1
(9.90,9.95] 2
(9.95,10.00] 6
(10.00,10.05] 3
(10.05,10.10] 5
(10.10,10.15] 4
(10.15,10.20] 5
(10.20,10.25] 3
(10.25,10.30] 1
TKK (c) Ilkka Mellin (2004) 32
Normaalijakauman odotusarvon luottamusväli
Esimerkki – 2/4
• Kuva oikealla esittää otokseen poimittujen ruuvien pituuksien luokiteltua frekvenssijakaumaa vastaavaa histogrammia.
• Luokkavälitmääräävät histogrammin suorakaiteiden kannat.
• Suorakaiteiden korkeudeton valittu niin, että suorakaiteiden pinta-alatsuhtautuvat toisiinsa kuten vastaavat luokka- frekvenssit.
Ruuvien pituuksien luokiteltu frekvenssijakauma
0 1 2 3 4 5 6 7
9.8 9.9 10.0 10.1 10.2 10.3 10.4
Pituus (cm)
Frekvenssi
TKK (c) Ilkka Mellin (2004) 33
Normaalijakauman odotusarvon luottamusväli
Esimerkki – 3/4
• Yhteenveto otostiedoista:
Pituuksien aritmeettinen keskiarvo:
Pituuksien keskihajonta:
s= 0.1038 cm
• Huomautus:
Jos otantaa toistetaan, kaikki otosta koskevat tiedot (sekä havainnot että niistä lasketut otossuureet) vaihtelevat satunnaisestiotoksesta toiseen.
10.09 cm X=
Ruuvien pituuksien luokiteltu frekvenssijakauma
0 1 2 3 4 5 6 7
9.8 9.9 10.0 10.1 10.2 10.3 10.4
Pituus (cm)
Frekvenssi
TKK (c) Ilkka Mellin (2004) 34
Normaalijakauman odotusarvon luottamusväli
Esimerkki – 4/4
• Ongelma:
Mitä koneen tekemien ruuvien todellisesta keskipituudesta voidaan tietääyhdestä otoksestasaatujen tietojen perusteella?
• Ratkaisu:
Konstruoidaan väli, joka valitulla todennäköisyydellä sisältää ruuvien todellisen keskipituuden.
Ruuvien pituuksien luokiteltu frekvenssijakauma
0 1 2 3 4 5 6 7
9.8 9.9 10.0 10.1 10.2 10.3 10.4
Pituus (cm)
Frekvenssi
TKK (c) Ilkka Mellin (2004) 35
Normaalijakauman odotusarvon luottamusväli
Normaalijakauma ja sen parametrointi
• Satunnaismuuttuja Xnoudattaa normaalijakaumaa N(µ, σ2), jos sen tiheysfunktioon
• Normaalijakauman parametreinaovat jakauman odotusarvo
ja varianssi
2
2 1 1
( ; , ) exp
2 2
, 0
f xµ σ x µ
σ π σ
µ σ
−
= −
−∞ < < +∞ >
E( )X =µ Var( )X =σ2
TKK (c) Ilkka Mellin (2004) 36
Normaalijakauman odotusarvon luottamusväli
Otos normaalijakaumasta
• Olkoon
X1, X2, … , Xn
yksinkertainen satunnaisotosnormaalijakaumasta N(µ, σ2)
• Tällöin satunnaismuuttujat X1, X2, … , Xnovat riippumattomiaja noudattavat samaa normaalijakaumaa
N(µ, σ2)
TKK (c) Ilkka Mellin (2004) 37
Normaalijakauman odotusarvon luottamusväli
Normaalijakauman parametrien estimointi
• Estimoidaannormaalijakauman N(µ, σ2) parametrit µja σ2niiden harhattomilla estimaattoreilla:
(i) Odotusarvoparametrinµharhaton estimaattori:
(ii) Varianssiparametrinσ2harhaton estimaattori:
1
1 n
i i
X X
n =
=
∑
2 2
1
1 ( )
1
n i i
s X X
n =
= −
−
∑
TKK (c) Ilkka Mellin (2004) 38
Normaalijakauman odotusarvon luottamusväli
Luottamustaso
• Määrätään luottamusväli normaalijakauman odotus- arvoparametrille µ.
• Valitaan luottamustasoksi 1 −α
• Luottamustaso kiinnittää todennäköisyyden, jolla konstruoitava luottamusväli peittää normaalijakauman odotusarvon µtodellisen arvon.
TKK (c) Ilkka Mellin (2004) 39
Normaalijakauman odotusarvon luottamusväli
Luottamuskertoimet
• Olkoon valittu luottamustaso (1 −α).
• Määrätään luottamuskertoimet–tα/2ja +tα/2siten, että
jossa satunnaismuuttuja tnoudattaa Studentin t-jakaumaa vapausastein (n– 1):
• Luottamuskertoimet –tα/2ja +tα/2toteuttavat ehdon
/ 2
/ 2
Pr( )
2
Pr( )
2 t t t t
α
α
α α
≤ − =
≥ + =
( 1) t t n∼ −
/ 2 / 2
Pr(−tα ≤ ≤ +t tα ) 1= −α
TKK (c) Ilkka Mellin (2004) 40
Normaalijakauman odotusarvon luottamusväli
Luottamuskertoimien määrääminen:
Havainnollistus
• Luottamuskertoimet –tα/2ja +tα/2jakavat t-jakauman tiheys- funktion kuvaajan alle jäävän todennäköisyysmassan (= 1) kolmeenosaan:
(1) Pisteen –tα/2vasemmalle puolelle jääα/2 % massasta.
(2) Pisteen +tα/2oikealle puolelle jääα/2 % massasta.
(3) Pisteiden –tα/2ja +tα/2 väliinjää (1 −α) % massasta.
• Huomaa, että
α/2 + α/2 + (1 −α) = 1
–tα/2 1−α
+tα/2
α/2 α/2
0 t-jakauman tiheysfunktio
TKK (c) Ilkka Mellin (2004) 41
Normaalijakauman odotusarvon luottamusväli
Luottamusväli normaalijakauman odotusarvolle
• Normaalijakauman odotusarvoparametrin µluottamus- väli luottamustasolla (1 −α)on muotoa
jossa
= havaintojen aritmeettinen keskiarvo s2 = havaintojen harhaton otosvarianssi n = havaintojen lukumäärä
−tα/2, +tα/2
= luottamustasoon (1 −α) liittyvät luottamus- kertoimet t-jakaumasta vapausastein(n– 1)
/ 2 s , / 2 s
X t X t
n n
α α
− +
X
TKK (c) Ilkka Mellin (2004) 42
Normaalijakauman odotusarvon luottamusväli
Luottamusväli ja sen pituus 1/2
• Normaalijakauman odotusarvon µluottamusväli luottamustasolla (1 −α) esitetään usein muodossa
koska väli on symmetrinen keskipisteensä suhteen.
• Normaalijakauman odotusarvon µluottamusvälin pituus on
/ 2
X t s
α n
±
X
2 t/ 2 s
α n
×
TKK (c) Ilkka Mellin (2004) 43
Normaalijakauman odotusarvon luottamusväli
Luottamusväli ja sen pituus 2/2
• Normaalijakauman odotusarvon µluottamusväli luottamustasolla (1 −α):
/ 2
t s
α n
X
/ 2
t s
α n
TKK (c) Ilkka Mellin (2004) 44
Normaalijakauman odotusarvon luottamusväli
Luottamusvälin johto 1/7
• Olkoon X1, X2, … , Xn
yksinkertainen satunnaisotosnormaalijakaumasta N(µ, σ2)
• Olkoon
havaintojen X1, X2, … , Xnaritmeettinen keskiarvoja
havaintojen X1, X2, … , Xn(harhaton) otosvarianssi.
1
1 n
i i
X X
n=
=
∑
2 2
1
1 ( )
1
n i i
s X X
n =
= −
−
∑
TKK (c) Ilkka Mellin (2004) 45
Normaalijakauman odotusarvon luottamusväli
Luottamusvälin johto 2/7
• Määritellään satunnaismuuttuja
• Satunnaismuuttuja tvoidaan kirjoittaa muotoon
• Määrätään satunnaismuuttujan tjakauma tarkastelemalla erikseen satunnaismuuttujan tosoittajaa ja nimittäjää.
t X s n
µ
= −
2 ( 1)2 2
1 X
X X n
t s n n s n s
n µ
µ µ σ σ
σ σ
−
− −
= = ⋅ =
−
−
TKK (c) Ilkka Mellin (2004) 46
Normaalijakauman odotusarvon luottamusväli
Luottamusvälin johto 3/7
• Satunnaismuuttujan tosoittaja määrittelee satunnaismuuttujan
• Satunnaismuuttuja Znoudattaa normaalijakautuneen otoksen aritmeettisen keskiarvon otosjakaumaa koskevan tuloksen perusteella standardoitua normaalijakaumaaN(0,1):
• Satunnaismuuttuja tnimittäjä määrittelee satunnaismuuttujan
• Satunnaismuuttuja Vnoudattaa normaalijakautuneen otoksen varianssin otosjakaumaa koskevan tuloksen perusteellaχ2-jakaumaa vapausastein(n– 1):
Z X n µ σ
= −
N(0,1) Z∼
2
( 1)s2
V n
= − σ
2( 1)
V∼χ n−
TKK (c) Ilkka Mellin (2004) 47
Normaalijakauman odotusarvon luottamusväli
Luottamusvälin johto 4/7
• Edellä on todettu, että
• Lisäksi voidaan osoittaa, että satunnaismuuttujat Zja Vovat riippumattomia(todistus sivuutetaan).
• Siten satunnaismuuttuja
noudattaa Studentin t-jakaumaavapausastein (n– 1) suoraan jakauman määritelmän mukaan:
1
X Z
t s n V
n
−µ
= =
−
( 1) t t n∼ −
2
N(0,1) ( 1) Z V χ n−
∼
∼
TKK (c) Ilkka Mellin (2004) 48
Normaalijakauman odotusarvon luottamusväli
Luottamusvälin johto 5/7
• Määrätään t-jakaumasta vapausastein (n– 1) piste +tα/2siten, että jolloin (t-jakauman symmetrian perusteella)
ja edelleen Pr( / 2)
t≥ +tα =α2
Pr( / 2) t tα 2
≤ − =α
/ 2 / 2
Pr(−tα ≤ ≤ +t tα ) 1= −α
TKK (c) Ilkka Mellin (2004) 49
Normaalijakauman odotusarvon luottamusväli
Luottamusvälin johto 6/7
• Tarkastellaan epäyhtälöketjua
• Sijoittamalla tähän epäyhtälöketjuun satunnaismuuttujan tlauseke, saadaan epäyhtälöketju
• Tästä epäyhtälöketjusta saadaan sen kanssa yhtäpitäväepäyhtälöketju
/ 2 / 2
t X t
s n
α −µ α
− ≤ ≤ +
/ 2 / 2
s s
X t X t
n n
α µ α
− ≤ ≤ +
/ 2 / 2
tα t tα
− ≤ ≤ +
TKK (c) Ilkka Mellin (2004) 50
Normaalijakauman odotusarvon luottamusväli
Luottamusvälin johto 7/7
• Yhdistämällä saatu epäyhtälö siihen, että saadaan vihdoin
/ 2 / 2
Pr s s 1
X t X t
n n
α µ α α
− ≤ ≤ + = −
/ 2 / 2
Pr(−tα ≤ ≤ +t tα ) 1= −α
TKK (c) Ilkka Mellin (2004) 51
Normaalijakauman odotusarvon luottamusväli
Luottamusvälin frekvenssitulkinta 1/2
• Normaalijakauman odotusarvon µluottamusvälin
konstruktiosta seuraa, että
• Siten konstruoitu luottamusväli peittääparametrin µ todellisen arvon todennäköisyydellä (1 −α) ja se ei peitä parametrin µtodellista arvoa todennäköisyydelläα.
/ 2 s , / 2 s
X t X t
n n
α α
− +
/ 2 / 2
Pr X t s X t s 1
n n
α µ α α
− ≤ ≤ + = −
TKK (c) Ilkka Mellin (2004) 52
Normaalijakauman odotusarvon luottamusväli
Luottamusvälin frekvenssitulkinta 2/2
• Normaalijakauman odotusarvon µluottamusvälille voidaan antaa seuraava frekvenssitulkinta:
(i) Jos otantaa jakaumasta N(µ, σ2) toistetaan, keskimäärin
100×(1 −α) %
otoksista konstruoiduista luottamusväleistä peittää parametrin µtodellisen arvon.
(ii) Jos otantaa jakaumasta N(µ, σ2) toistetaan, keskimäärin
100×α%
otoksista konstruoiduista luottamusväleistä ei peitä parametrin µtodellista arvoa.
TKK (c) Ilkka Mellin (2004) 53
Normaalijakauman odotusarvon luottamusväli
Luottamusvälin ominaisuudet 1/3
• Normaalijakauman odotusarvon µluottamusvälin keskipiste vaihtelee otoksesta toiseen.
• Luottamusvälin pituus
vaihtelee otoksesta toiseen.
• Luottamusvälin pituusriippuu valitusta luottamustasosta (1 −α), havaintojen lukumäärästänja otosvarianssista s2.
X
2 t / 2 s
α n
×
TKK (c) Ilkka Mellin (2004) 54
Normaalijakauman odotusarvon luottamusväli
Luottamusvälin ominaisuudet 2/3
• Luottamusväli lyhenee(pitenee), jos luottamustasoa (1 −α) pienennetään(kasvatetaan).
• Luottamusväli lyhenee(pitenee), jos havaintojen lukumäärää n kasvatetaan(pienennetään).
• Luottamusväli lyhenee(pitenee), jos otosvarianssi s2 pienenee(kasvaa).
TKK (c) Ilkka Mellin (2004) 55
Normaalijakauman odotusarvon luottamusväli
Luottamusvälin ominaisuudet 3/3
• Olisi toivottavaa pystyä konstruoimaan odotusarvolle µmahdollisimman lyhytluottamusväli, johon liittyvä luottamustaso olisi mahdollisimman korkea.
• Vaatimusten samanaikainen täyttäminen ei olekuitenkaan mahdollista, jos otoskoko pidetään kiinteänä:
(i) Luottamustason kasvattaminen pidentää luottamus- väliä, jolloin tieto parametrin µtodellisen arvon sijainnista tulee epätarkemmaksi.
(ii) Luottamusvälin lyhentäminen pienentää luottamus- tasoa, jolloin tieto parametrin µtodellisen arvon sijainnista tulee epävarmemmaksi.
TKK (c) Ilkka Mellin (2004) 56
Normaalijakauman odotusarvon luottamusväli
Johtopäätökset luottamusvälistä
• Oletetaan, että teemmejohtopäätöksen, että konstruoitu luottamusväli peittää odotusarvoparametrin µtodellisen arvon:
(i) Luottamusvälin konstruktiosta seuraa, että tehty johtopäätös on oikea100×(1 −α) %:ssa tapauksia.
(ii) Luottamusvälin konstruktiosta seuraa, että tehty johtopäätös on väärä100×α%:ssa tapauksia.
• Huomautus:
Virheellisen johtopäätöksen mahdollisuuttaei saada häviämään, ellei luottamusväliä tehdääärettömän leveäksi, jolloin väliei enää sisällä informaatiotaodotusarvoparametrinµtodellisesta arvosta.
TKK (c) Ilkka Mellin (2004) 57
Normaalijakauman odotusarvon luottamusväli
Esimerkki (jatkuu) – 1/4
• Erään koneen tekemien ruuvien joukosta poimittiin yksinkertainen satunnaisotosja ruuvien pituudet mitattiin.
Otoskoko: n= 30
Pituuksien aritmeettinen keskiarvo:
Pituuksien otoskeskihajonta: s= 0.1038 cm
• Konstruoidaan ruuvien todelliselle keskipituudelleµluottamusväli luottamustasolla0.95.
• Valitaan luottamuskertoimet–t0.025ja +t0.025siten, että jossa satunnaismuuttuja tnoudattaa Studentin t-jakaumaa vapausastein n– 1 = 29.
• Luottamuskertoimet –t0.025ja +t0.025toteuttavat ehdon 10.09 cm X=
0.025 0.025
Pr(t≤ −t ) Pr(= t≥ +t ) 0.025=
0.025 0.025
Pr(−t ≤ ≤ +t t ) 0.95=
TKK (c) Ilkka Mellin (2004) 58
0 0.1 0.2 0.3 0.4 0.5 Normaalijakauman odotusarvon luottamusväli
Esimerkki (jatkuu) – 2/4
• t-jakauman taulukoistanähdään, että
Pr(t≥+2.045) = 0.025 Pr(t≤–2.045) = 0.025 kun vapausasteiden lukumäärä
n– 1 = 29
• Siten luottamuskertoimet ovat:
+t0.025= +2.045 –t0.025= –2.045
• Kuvio oikealla havainnollistaa luottamuskertoimien valintaa.
−2.045 0.95
+2.045
0.025 0.025
t(29)-jakauman tiheysfunktio
0
TKK (c) Ilkka Mellin (2004) 59
Normaalijakauman odotusarvon luottamusväli
Esimerkki (jatkuu) – 3/4
• Luottamusväliksisaadaan:
• Siten tiedämme, ettäruuvien todellinen keskipituus on todennäköisyydellä0.95 välillä
(10.05, 10.13)
/ 2
0.1038 10.09 2.045
30 10.09 0.04 (10.05,10.13) X t s
α n
± = ± ×
= ±
=
TKK (c) Ilkka Mellin (2004) 60
Normaalijakauman odotusarvon luottamusväli
Esimerkki (jatkuu) – 4/4
• Luottamustason0.95 tulkinta:
Oletetaan, että poimimme koneen tekemien ruuvien joukosta toistuvastiyksinkertaisia satunnaisotoksia, joiden koko on 30 ja konstruoimme jokaisestaotoksesta 95 %:n luottamusvälin edellä esitetyllä menetelmällä.
Tällöin:
(i) Konstruoidusta väleistä keskimäärin95 % peittää ruuvien todellisen, mutta tuntemattoman keskipituuden.
(ii) Konstruoidusta väleistä keskimäärin5 % ei peitä ruuvien todellista, mutta tuntematonta keskipituutta.
TKK (c) Ilkka Mellin (2004) 61
Normaalijakauman odotusarvon luottamusväli
Otoskoon määrääminen 1/4
• Monissa tutkimustilanteissa toivotaan, että parametrille voitaisiin muodostaa mahdollisimman lyhytluottamusväli.
• Normaalijakauman odotusarvon µluottamusvälin pituus riippuu otoskoosta siten, ettäväli lyhenee, jos havaintojen lukumäärää n kasvatetaan.
• Tämä normaalijakauman odotusarvon µluottamus- välin ominaisuus mahdollistaa tietyin ehdoin otoskoon valitsemisen sellaisella tavalla, ettäluottamusväliksi saadaan(suunnilleen) halutun mittainen väli.
• Oletetaan siis, että normaalijakauman odotusarvo- parametrille µhalutaan konstruoida luottamusväli, jonka toivottu pituuson 2A.
TKK (c) Ilkka Mellin (2004) 62
Normaalijakauman odotusarvon luottamusväli
Otoskoon määrääminen 2/4
• Jos normaalijakauman varianssiσ2tunnetaan, normaali- jakauman odotusarvoparametrin µluottamusväliksi luottamustasolla (1 −α)saadaan
jossa
= havaintojen aritmeettinen keskiarvo σ2= havaintojen oletettu varianssi n =otoskoko
−zα/2, +zα/2
= luottamustasoon (1 −α) liittyvät luottamus- kertoimet normaalijakaumasta N(0,1) X z/ 2
α σn
±
X
TKK (c) Ilkka Mellin (2004) 63
Normaalijakauman odotusarvon luottamusväli
Otoskoon määrääminen 3/4
• Jos siis käytettävissä on ennakkotietoa perusjoukon varianssistaσ2, voidaan otoskoko nratkaista yhtälöstä:
jossa
zα/2= luottamustasoon (1 −α) liittyvä luottamus- kerroinnormaalijakaumasta N(0,1) σ2= havaintojen oletettu varianssi n =otoskoko
2A=toivottu pituusluottamusvälille z/ 2 A
α σn=
TKK (c) Ilkka Mellin (2004) 64
Normaalijakauman odotusarvon luottamusväli
Otoskoon määrääminen 4/4
• Siten tarvittava otoskokoon
• Huomautus:
Tarvittavan otoskoon kaavasta nähdään, että mitä lyhyempää luottamusväliä toivotaan, sitä suurempi otos on poimittava:
Esimerkiksi, jos luottamusvälin pituus halutaan puolittaa, pitää havaintoja kerätä 4 kertaa enemmän.
2
z / 2
n A
α σ
=
TKK (c) Ilkka Mellin (2004) 65
Todennäköisyysjakaumien parametrien estimointi Luottamusväli
Normaalijakauman odotusarvon luottamusväli
>> Normaalijakauman varianssin luottamusväli Bernoulli-jakauman odotusarvon luottamusväli
Väliestimointi
TKK (c) Ilkka Mellin (2004) 66
Avainsanat Frekvenssitulkinta Luottamuskerroin Luottamustaso Luottamusväli Normaalijakauma
Normaalijakauman varianssin luottamusväli
TKK (c) Ilkka Mellin (2004) 67
Normaalijakauman varianssin luottamusväli
Normaalijakauma ja sen parametrointi
• Satunnaismuuttuja Xnoudattaa normaalijakaumaa N(µ, σ2), jos sen tiheysfunktioon
• Normaalijakauman parametreinaovat jakauman odotusarvo
ja varianssi E( )X =µ Var( )X =σ2
2
2 1 1
( ; , ) exp
2 2
, 0
f xµ σ x µ
σ π σ
µ σ
−
= −
−∞ < < +∞ >
TKK (c) Ilkka Mellin (2004) 68
Normaalijakauman varianssin luottamusväli
Otos normaalijakaumasta
• Olkoon
X1, X2, … , Xn
yksinkertainen satunnaisotosnormaalijakaumasta N(µ, σ2)
• Tällöin satunnaismuuttujat X1, X2, … , Xnovat riippumattomiaja noudattavat samaa normaalijakaumaa
N(µ, σ2)
TKK (c) Ilkka Mellin (2004) 69
Normaalijakauman varianssin luottamusväli
Normaalijakauman parametrien estimointi
• Estimoidaannormaalijakauman N(µ, σ2) parametrit µja σ2niiden harhattomilla estimaattoreilla:
(i) Odotusarvoparametrinµharhaton estimaattori:
(ii) Varianssiparametrinσ2harhaton estimaattori:
1
1 n
i i
X X
n =
=
∑
2 2
1
1 ( )
1
n i i
s X X
n =
= −
−
∑
TKK (c) Ilkka Mellin (2004) 70
Normaalijakauman varianssin luottamusväli
Luottamustaso
• Määrätään luottamusväli normaalijakauman varianssiparametrille σ2.
• Valitaan luottamustasoksi 1 −α
• Luottamustaso kiinnittää todennäköisyyden, jolla konstruoitava luottamusväli peittää normaalijakauman varianssin σ2todellisen arvon.
TKK (c) Ilkka Mellin (2004) 71
Normaalijakauman varianssin luottamusväli
Luottamuskertoimet
• Olkoon valittu luottamustaso (1 −α).
• Määrätään luottamuskertoimet ja siten, että
jossa satunnaismuuttuja χ2noudattaa χ2-jakaumaa vapausastein (n– 1):
• Luottamuskertoimet ja toteuttavat ehdon
2 2
1 / 2
2 2
/ 2
Pr( )
2
Pr( )
2
α α
χ χ α χ χ α
≤ − =
≥ =
2 1α/ 2
χ− 2 α/ 2
χ
2 2(n 1)
χ ∼χ −
2 α/ 2
χ
2 1α/ 2
χ−
2 2 2
1 / 2 / 2
Pr(χ−α ≤χ ≤χα ) 1= −α
TKK (c) Ilkka Mellin (2004) 72
Normaalijakauman varianssin luottamusväli
Luottamuskertoimien määrääminen:
Havainnollistus
• Luottamuskertoimet ja jakavat χ2-jakauman tiheysfunktion kuvaajan alle jäävän todennäköisyysmassan (= 1) kolmeenosaan:
(1) Pisteen vasemmalle puolelle jääα/2 % massasta.
(2) Pisteen oikealle puolelle jääα/2 % massasta.
(3) Pisteiden ja väliinjää (1 −α) % massasta.
• Huomaa, että
α/2 + α/2 + (1 −α) = 1
2 1α/ 2
χ−
2 α/ 2
χ
2 1α/ 2
χ−
2 α/ 2
χ
2 1α/ 2
χ− χα2/ 2
χ2-jakauman tiheysfunktio
2 α/ 2
χ
2 1α/ 2
χ−
1 −α α/2
α/2
TKK (c) Ilkka Mellin (2004) 73
Normaalijakauman varianssin luottamusväli
Luottamusväli normaalijakauman varianssille
• Normaalijakauman varianssiparametrin σ2luottamus- väli luottamustasolla (1 −α)on muotoa
jossa
s2 = havaintojen harhaton otosvarianssi n = havaintojen lukumäärä
= luottamustasoon (1 −α) liittyvät luottamus- kertoimet χ2-jakaumasta vapausastein (n– 1)
2 2
2 2
/ 2 1 / 2
(n 1)s ,(n 1)s
α α
χ χ−
− −
2 2
1α/ 2, α/ 2
χ− χ
TKK (c) Ilkka Mellin (2004) 74
Normaalijakauman varianssin luottamusväli
Luottamusväli ja sen pituus
• Normaalijakauman varianssin σ2luottamusvälin pituus on
2
2 2
1 / 2 / 2
1 1
(n 1)s
α α
χ− χ
− −
TKK (c) Ilkka Mellin (2004) 75
Normaalijakauman varianssin luottamusväli
Luottamusvälin johto 1/5
• Olkoon
X1, X2, … , Xn
yksinkertainen satunnaisotosnormaalijakaumasta N(µ, σ2)
• Olkoon
havaintojen X1, X2, … , Xnaritmeettinen keskiarvoja
havaintojen X1, X2, … , Xn(harhaton) otosvarianssi.
1
1n
i i
X X
n=
=
∑
2 2
1
1 ( )
1
n i i
s X X
n =
= −
−
∑
TKK (c) Ilkka Mellin (2004) 76
Normaalijakauman varianssin luottamusväli
Luottamusvälin johto 2/5
• Määritellään satunnaismuuttuja
• Satunnaismuuttuja χ2noudattaa normaalijakautuneen otoksen varianssin otosjakaumaa koskevan tuloksen perusteellaχ2-jakaumaa vapausastein (n– 1):
2 2
2
(n 1)s
χ σ
= −
2 2(n 1)
χ ∼χ −
TKK (c) Ilkka Mellin (2004) 77
Normaalijakauman varianssin luottamusväli
Luottamusvälin johto 3/5
• Määrätään χ2-jakaumasta vapausastein (n– 1) piste siten, että ja piste siten, että
jolloin
2 2
1 / 2
Pr( )
α α2
χ ≤χ− =
2 1α/ 2
χ−
2 2 2
1 / 2 / 2
Pr(χ−α ≤χ ≤χα ) 1= −α
2 2
Pr( / 2)
α 2 χ ≥χ =α
2 α/ 2
χ
TKK (c) Ilkka Mellin (2004) 78
Normaalijakauman varianssin luottamusväli
Luottamusvälin johto 4/5
• Tarkastellaan epäyhtälöketjua
• Sijoittamalla tähän epäyhtälöketjuun satunnaismuuttujan χ2lauseke, saadaan epäyhtälöketju
• Tästä epäyhtälöketjusta saadaan sen kanssa yhtäpitäväepäyhtälöketju
2 2
2
2 2
/ 2 1 / 2
(n 1)s (n 1)s
α α
χ σ χ−
− ≤ ≤ −
2
2 2
1 / 2 2 / 2
(n 1)s
α α
χ χ
σ
−
≤ − ≤
2 2 2
1α/ 2 α/ 2
χ− ≤χ ≤χ