TKK (c) Ilkka Mellin (2004) 1
Johdatus tilastotieteeseen
Otos ja otosjakaumat
TKK (c) Ilkka Mellin (2004) 2
Yksinkertainen satunnaisotos Otostunnusluvut ja otosjakaumat
Aritmeettisen keskiarvon otosjakauma Otosvarianssin otosjakauma Suhteellisen frekvenssin otosjakauma
Otos ja otosjakaumat
TKK (c) Ilkka Mellin (2004) 3
Otos ja otosjakaumat:
Mitä opimme? – 1/2
• Tilastollinen aineistokoostuu tutkimuksen kohteita kuvaavien muuttujien havaituista arvoista.
• Tilastollisissa tutkimusasetelmissa ajatellaan, että jokin satunnais- ilmiöon generoinut havaintoarvot.
• Siten tilastollisissa tutkimusasetelmissa havaintoarvoihin liittyy aina epävarmuuttaja satunnaisuutta.
• Havaintoaineiston tilastollisella mallillatarkoitetaan aineiston generoiden satunnaismuuttujien todennäköisyysjakaumaa.
• Yksinkertaisissa tilastollisissa tutkimusasetelmissa havaintoaineiston keräämisessä käytetään yksinkertaista satunnaisotantaa.
TKK (c) Ilkka Mellin (2004) 4
Otos ja otosjakaumat:
Mitä opimme? – 2/2
• Koska tilastollisen aineiston havaintoarvot ovat jonkin satunnais- ilmiön generoimia, myös kaikkihavainnoista laskettavat suureet ovat satunnaisia.
• Tämä merkitsee sitä, että esimerkiksi havaintoaineistoa kuvaavat tunnusluvut vaihtelevat satunnaisesti otoksesta toiseen.
• Tunnusluvun otosvaihteluaeli satunnaista vaihtelua otoksesta toiseen voidaan kuvata tunnusluvun otosjakaumalla.
• Otosjakaumien teoriamuodostaa teoreettisen perustan sekä toden- näköisyysjakaumien parametrien estimaattoreidenominaisuuksia että parametreja koskevien hypoteesien testauksessa käytettävien testi- suureidenominaisuuksia koskevalle tilastolliselle tutkimukselle.
Otos ja otosjakaumat:
Esitiedot
• Esitiedot: ks. seuraavia lukuja:
Tilastollisten aineistojen kerääminen ja mittaaminen Tilastollisten aineistojen kuvaaminen
Satunnaismuuttujat ja todennäköisyysjakaumat Jakaumien tunnusluvut
Diskreettejä jakaumia Jatkuvia jakaumia
Normaalijakaumasta johdettuja jakaumia
Moniulotteiset satunnaismuuttujat ja todennäköisyysjakaumat
Otos ja otosjakaumat:
Lisätiedot
• Todennäköisyysjakaumien parametrien estimointiakäsitellään luvuissa
Estimointi Estimointimenetelmät Väliestimointi
• Todennäköisyysjakaumien parametreja koskevien tilastollisten hypoteesien testaamistakäsitellään luvussa
Tilastolliset testit
TKK (c) Ilkka Mellin (2004) 7
>> Yksinkertainen satunnaisotos Otostunnusluvut ja otosjakaumat
Aritmeettisen keskiarvon otosjakauma Otosvarianssin otosjakauma Suhteellisen frekvenssin otosjakauma
Otos ja otosjakaumat
TKK (c) Ilkka Mellin (2004) 8
Avainsanat Havainto Havaintoarvo Tilastollinen aineisto Tilastollinen malli Todennäköisyysjakauma Yksinkertainen satunnaisotos
Yksinkertainen satunnaisotos
TKK (c) Ilkka Mellin (2004) 9
Yksinkertainen satunnaisotos
Tilastollinen aineisto
• Tilastollinen aineistokoostuu tutkimuksen kohteita kuvaavien muuttujien havaituista arvoista.
• Tilastollisissa tutkimusasetelmissa havaintoarvoihin liittyy aina epävarmuuttaja satunnaisuutta.
• Seurauksia:
(i) Tilastollisissa tutkimusasetelmissa ajatellaan, että havaintoarvot on generoinut ilmiö, joka on luonteeltaan satunnainen.
(ii) Tilastollisen tutkimuksen kohteita kuvaavat muuttujat tulkitaan tilastollisissa tutkimusasetelmissa satunnaismuuttujiksija havaintoarvot tulkitaan näiden satunnaismuuttujien realisoituneiksi arvoiksi.
TKK (c) Ilkka Mellin (2004) 10
Yksinkertainen satunnaisotos
Tilastollinen malli
• Tilastollisella mallillatarkoitetaan tutkimuksen kohteita kuvaavien satunnaismuuttujien todennäköisyysjakaumaa, jonka ajatellaan generoineen ko. satunnaismuuttujien havaitut arvot.
• Havaintoarvojen ajatellaan syntyneen arpomalla tilastollisena mallina käytetystä todennäköisyysjakaumasta saatavin todennäköisyyksin.
• Huomautus:
Todennäköisyysjakaumat riippuvat tavallisesti parametreistaeli vakioista, joiden arvoja ei yleensä tunneta.
Yksinkertainen satunnaisotos
Tilastolliset mallit ja tilastollinen päättely
• Kun tilastollista mallia sovelletaan jotakin reaalimaailman ilmiötä kuvaavan havaintoaineiston analysointiin, kohdataan tavallisesti seuraavat mallin parametrejakoskevat ongelmat:
(i) Parametrien arvoja ei tunnetaja ne on estimoitavaeli arvioitavahavaintoaineistosta.
(ii) Parametrien arvoista on esitetty oletuksiatai väitteitä, joita halutaan testataeli asettaa koetteelle havainto- aineistosta saatua informaatiota vastaan.
• Tilastollisten mallien parametrien estimointi ja testaus muodostavat keskeisen osan tilastollista päättelyä.
Yksinkertainen satunnaisotos
Satunnaisotos ja satunnaisotanta
• Satunnaisotospoimitaan arpomallahavaintoyksiköt perusjoukosta otokseen.
• Arpomisessa käytettävää menetelmää kutsutaan satunnaisotannaksi.
• Satunnaisotannassa sattumamäärää mitkä perusjoukon alkioista tulevat otokseen.
TKK (c) Ilkka Mellin (2004) 13
Yksinkertainen satunnaisotos
Satunnaisotanta:
Kommentteja
• Jos havaintoyksiköt poimitaan perusjoukosta satunnaisotannalla, pätee seuraava:
(i) Havaintoyksiköitä kuvaavien muuttujien havaitut arvot ovat satunnaisiasiinä mielessä, että ne vaihtelevat satunnaisesti otoksesta toiseen.
(ii) Kaikkihavaintoyksiköitä kuvaavien muuttujien havaituista arvoista lasketut tunnusluvut ovat satunnaisiasiinä mielessä, että ne vaihtelevat satunnaisesti otoksesta toiseen.
TKK (c) Ilkka Mellin (2004) 14
Yksinkertainen satunnaisotos
Yksinkertainen satunnaisotos
• Olkoot
X1, X2, … , Xn
riippumattomia, identtisesti jakautuneitasatunnais- muuttujia, joilla on samapistetodennäköisyys- tai tiheysfunktio
f(x)
• Tällöin satunnaismuuttujat X1, X2, … , Xn
muodostavat yksinkertaisen satunnaisotoksen jakaumasta f(x).
TKK (c) Ilkka Mellin (2004) 15
Yksinkertainen satunnaisotos
Havainnot ja havaintoarvot
• Olkoon
X1, X2, … , Xn
yksinkertainen satunnaisotosjakaumasta f(x).
• Kutsumme satunnaismuuttujia X1, X2, … , Xntavallisesti havainnoiksi.
• Otoksen poimimisen jälkeensatunnaismuuttujat X1, X2, … , Xnsaavat havaituiksi arvoikseen havainto- arvot
x1, x2, … , xn
• Merkitään:
X1= x1, X2= x2, … , Xn= xn
TKK (c) Ilkka Mellin (2004) 16
Yksinkertainen satunnaisotos
Yksinkertainen satunnaisotos:
Kommentteja 1/2
• Olkoon
X1, X2, … , Xn
yksinkertainen satunnaisotosjakaumasta f(x).
• Tällöin havaintoarvot x1, x2, … , xn
on saatu toistamalla arvontaa toisistaan riippumattomin toistoin n kertaa samoin,jakaumasta f(x) saatavin toden- näköisyyksin.
• Havaintoarvot x1, x2, … , xnovat kiinteitäeli ei- satunnaisia, mutta ne vaihtelevat toisistaan riippumatta ja satunnaisesti otoksesta toiseen.
Yksinkertainen satunnaisotos
Yksinkertainen satunnaisotos:
Kommentteja 2/2
• Satunnaisuus liittyy yksinkertaisessa satunnais- otannassa siihen, ettähavaintoarvot vaihtelevat toisistaan riippumatta ja satunnaisesti otoksesta toiseen.
• Satunnaisuus ei siis liityotannan tuloksena saatuihin havaintoarvoihin, vaan tapaan, jolla otos poimitaan.
Yksinkertainen satunnaisotos
Tilastollinen malli yksinkertaiselle satunnaisotokselle 1/2
• Olkoon
X1, X2, … , Xn
yksinkertainen satunnaisotosjakaumasta f(x).
• Satunnaismuuttujien X1, X2, … , Xnyhteisjakauma muodostaa tilastollisen mallinhavaintoarvojen satunnaiselle vaihtelulle otoksesta toiseen.
TKK (c) Ilkka Mellin (2004) 19
Yksinkertainen satunnaisotos
Tilastollinen malli yksinkertaiselle satunnaisotokselle 2/2
• Koska satunnaismuuttujat X1, X2, … , Xn
on oletettu riippumattomiksi, niin satunnaismuuttujien X1, X2, … , Xnyhteisjakaumaon muotoa
jossa
1 2 1 2
( , , , )n ( ) ( ) ( )n
f x x …x =f x ×f x × ×f x ( ) , 1, 2, ,
i i
X ∼f x i= …n
TKK (c) Ilkka Mellin (2004) 20
Yksinkertainen satunnaisotos
>> Otostunnusluvut ja otosjakaumat Aritmeettisen keskiarvon otosjakauma Otosvarianssin otosjakauma Suhteellisen frekvenssin otosjakauma
Otos ja otosjakaumat
TKK (c) Ilkka Mellin (2004) 21
Avainsanat
Aritmeettisen keskiarvon otosjakauma Otosjakauma Otostunnusluvut Otosvarianssin otosjakauma Suhteellisen frekvenssin
otosjakauma Tilastollinen malli Yksinkertainen satunnaisotos
Otostunnusluvut ja otosjakaumat
TKK (c) Ilkka Mellin (2004) 22
Otostunnusluvut ja otosjakaumat
Otostunnusluvut 1/3
• Olkoon
X1, X2, … , Xn
yksinkertainen satunnaisotosjakaumasta, jonka pistetodennäköisyys- tai tiheysfunktio on f(x).
• Tällöin havainnot X1, X2, … , Xnovat riippumattomia, identtisesti jakautuneita satunnaismuuttujia, joilla on sama pistetodennäköisyys-tai tiheysfunktio f(x):
1, 2, ,
( ) , 1, 2, ,
n i
X X X
X f x i n
⊥
=
…
∼ …
Otostunnusluvut ja otosjakaumat
Otostunnusluvut 2/3
• Olkoon
T= g(X1, X2, … , Xn)
jokin satunnaismuuttujien X1, X2, … , Xn(mitallinen) funktio.
• Satunnaismuuttujaa Tkutsutaan (otos-) tunnusluvuksi.
Otostunnusluvut ja otosjakaumat
Otostunnusluvut 3/3
• Oletetaan, että otoksen poimimisen jälkeen satunnais- muuttujat X1, X2, … , Xnsaavat havaituiksi arvoikseen havaintoarvot x1, x2, … , xn:
X1= x1, X2= x2, … , Xn= xn
• Tällöin tunnusluku T= g(X1, X2, … , Xn)
saa havaituksi arvokseen tfunktion garvon pisteessä (x1, x2, … , xn):
t= g(x1, x2, … , xn)
TKK (c) Ilkka Mellin (2004) 25
Otostunnusluvut ja otosjakaumat
Otosjakauma
• Oletetaan, että satunnaismuuttujat X1, X2, … , Xn
muodostavat yksinkertaisen satunnaisotoksenjakaumasta f(x) ja olkoon funktio
T= g(X1, X2, … , Xn) jokin otostunnusluku.
• Tunnusluvun Tjakaumaa kutsutaan tunnusluvun T otosjakaumaksi.
• Tunnusluvun Totosjakauma muodostaa tilastollisen mallintunnusluvun T arvojen satunnaiselle vaihtelulle otoksesta toiseen.
TKK (c) Ilkka Mellin (2004) 26
Otostunnusluvut ja otosjakaumat
Eräiden tavallisten tunnuslukujen otosjakaumat
• Olkoon
X1, X2, … , Xn
yksinkertainen satunnaisotosjakaumasta f(x).
• Tarkastellaan seuraavien tunnuslukujen (ks. lukua
Tilastollisten aineistojen kuvaaminen) otosjakaumia:
– Aritmeettinen keskiarvo – Otosvarianssi
– Suhteellinen frekvenssi
TKK (c) Ilkka Mellin (2004) 27
Aritmeettisen keskiarvon otosjakauma
Aritmeettinen keskiarvo 1/2
• Oletetaan, että havainnot X1, X2, … , Xn
muodostavat yksinkertaisen satunnaisotoksensatunnais- muuttujan Xjakaumasta, jonka odotusarvoja varianssi ovat
• Tällöin kaikilla satunnaismuuttujilla Xi, i= 1, 2, … , non sama odotusarvo µja samavarianssi σ2.
2
E( ) Var( )
X X
µ σ
=
=
TKK (c) Ilkka Mellin (2004) 28
Aritmeettisen keskiarvon otosjakauma
Aritmeettinen keskiarvo 2/2
• Olkoon
havaintojen X1, X2, … , Xnaritmeettinen keskiarvo.
• Aritmeettinen keskiarvo kuvaa havaintojen keski- määräistä arvoa.
• Aritmeettinen keskiarvo on satunnaismuuttuja, jonka saamat arvot vaihtelevat satunnaisesti otoksesta toiseen.
1 2
1
1 n n
i i
X X X
X X
n = n
+ + +
=
∑
=X X
Aritmeettisen keskiarvon otosjakauma
Aritmeettisen keskiarvon odotusarvo ja varianssi
• Aritmeettisen keskiarvon odotusarvoja varianssi:
• Aritmeettisen keskiarvon standardipoikkeamaa
kutsutaan tavallisesti keskiarvon keskivirheeksija se kuvaa aritmeettisen keskiarvon otosvaihtelua oman odotusarvonsa µympärillä.
2 2
E( )
Var( ) D ( ) X
X X
n µ
σ
=
= =
X
X D( )X =σ n
Aritmeettisen keskiarvon otosjakauma
Aritmeettisen keskiarvon odotusarvon johto
• OlkootX1, X2, … , Xnriippumattomiasatunnaismuuttujia, joille
• Odotusarvon yleisten ominaisuuksien perusteella pätee (myös ilman riippumattomuusoletusta):
2
E( ) , 1,2, ,
Var( ) , 1,2, ,
i
i
X i n
X i n
µ σ
= =
= =
…
…
1
1
1
E( ) E 1
1 E( )
1 1
n i i n
i i
n
i
X X
n n X
n n
µ µ µ
=
=
=
=
=
=
= =
∑
∑
∑
TKK (c) Ilkka Mellin (2004) 31
Aritmeettisen keskiarvon otosjakauma
Aritmeettisen keskiarvon varianssin johto
• OlkootX1, X2, … , Xnriippumattomiasatunnaismuuttujia, joille
• Varianssin yleisten ominaisuuksien perusteella pätee (koska satunnaismuuttujat X1, X2, … , Xnon oletettu riippumattomiksi):
2
E( ) , 1,2, ,
Var( ) , 1,2, ,
i
i
X i n
X i n
µ σ
= =
= =
…
…
1
2 1
2 2
1 2 2 2
Var( ) Var 1
1 Var( )
1
1
n i i n
i i n
i
X X
n n X
n
n n n
σ σ σ
=
⊥
=
=
=
=
=
= =
∑
∑
∑
TKK (c) Ilkka Mellin (2004) 32
Aritmeettisen keskiarvon otosjakauma
Standardoidun aritmeettisen keskiarvon odotusarvo ja varianssi
• Koska
niin standardoidunsatunnaismuuttujan
odotusarvoja varianssiovat E(Z) = 0
Var(Z) = 1 Z X
n µ σ
= −
2
E( ) Var( )
X
X n
µ σ
=
=
TKK (c) Ilkka Mellin (2004) 33
Aritmeettisen keskiarvon otosjakauma
Otosjakauman käyttäytyminen otoskoon kasvaessa
• Koska aritmeettisen keskiarvon odotusarvo
ja varianssi
niin aritmeettisen keskiarvon otosjakauma keskittyy yhä voimakkaammin havaintojen yhteisen odotusarvonµ ympärille, kun otoskoko n kasvaa.
E( )X =µ
X
Var( )X =σ2n
TKK (c) Ilkka Mellin (2004) 34
Aritmeettisen keskiarvon otosjakauma
Aritmeettisen keskiarvon otosjakauma, kun otos on normaalijakautunut
• Oletetaan, että havainnot X1, X2, … , Xn
muodostavat yksinkertaisen satunnaisotoksen normaali- jakaumasta(ks. lukua Jatkuvia jakaumia)
• Tällöin havaintojen aritmeettinen keskiarvo noudattaa eksaktisti(myös pienissä otoksissa)normaalijakaumaa:
X
2
~ N ,
X n
µσ
N( ,µ σ2)
Aritmeettisen keskiarvon otosjakauma
Standardoidun aritmeettisen keskiarvon otosjakauma, kun otos on normaalijakautunut
• Oletetaan, että havainnot X1, X2, … , Xn
muodostavat yksinkertaisen satunnaisotoksen normaali- jakaumasta(ks. lukua Jatkuvia jakaumia)
• Tällöin standardoitu satunnaismuuttuja
noudattaa eksaktisti(myös pienissä otoksissa) standardoitua normaalijakaumaa:
( )
~ N 0,1 Z N( ,µ σ2)
Z X n µ σ
= −
Aritmeettisen keskiarvon otosjakauma
Aritmeettisen keskiarvon asymptoottinen jakauma
• Oletetaan, että havainnot X1, X2, … , Xn
muodostavat yksinkertaisen satunnaisotoksensatunnais- muuttujan Xjakaumasta, jonka odotusarvoon µja varianssion σ2.
• Tällöin havaintojen aritmeettinen keskiarvo noudattaa suurissa otoksissa approksimatiivisesti normaalijakaumaa(ks. lukua Jatkuvia jakaumia) jonka odotusarvo on µja varianssi on :
X
2
~ Na ,
X n
µσ
2/n σ
TKK (c) Ilkka Mellin (2004) 37
Aritmeettisen keskiarvon otosjakauma
Standardoidun aritmeettisen keskiarvon asymptoottinen jakauma
• Oletetaan, että havainnot X1, X2, … , Xn
muodostavat yksinkertaisen satunnaisotoksensatunnais- muuttujan Xjakaumasta, jonka odotusarvoon µja varianssion σ2.
• Tällöin standardoitu satunnaismuuttuja
noudattaa suurissa otoksissa approksimatiivisesti standardoitua normaalijakaumaa:
Z~aN(0,1) Z X
n µ σ
= −
TKK (c) Ilkka Mellin (2004) 38
Aritmeettisen keskiarvon otosjakauma
Kommentteja
• Oletukset havaintojen riippumattomuudesta,samasta jakaumasta ja normaalisuudesta ovat välttämättömiä aritmeettisen keskiarvon eksaktiaeli tarkkaaotos- jakaumaa koskevalle tulokselle.
• Aritmeettisen keskiarvon otosjakaumaa koskeva asymptoottinen(approksimatiivinen tulos) seuraa keskeisestä raja-arvolauseesta; ks. lukua
Konvergenssikäsitteet ja raja-arvolauseet.
• Aritmeettisen keskiarvon asymptoottista otosjakaumaa koskeva tulos pätee tietyin lisäehdoinmyös tilanteissa, joissa oletukset havaintojen riippumattomuudesta ja samasta jakaumasta eivät päde.
TKK (c) Ilkka Mellin (2004) 39
Otosvarianssin otosjakauma
Otosvarianssi 1/2
• Oletetaan, että havainnot X1, X2, … , Xn
muodostavat yksinkertaisen satunnaisotoksensatunnais- muuttujan Xjakaumasta, jonka odotusarvoja varianssi ovat
• Tällöin kaikilla satunnaismuuttujilla Xi, i= 1, 2, … , non sama odotusarvo µja samavarianssi σ2.
2
E( ) Var( )
X X
µ σ
=
=
TKK (c) Ilkka Mellin (2004) 40
Otosvarianssin otosjakauma
Otosvarianssi 2/2
• Olkoon
havaintojen X1, X2, … , Xnotosvarianssi, jossa
on havaintojen X1, X2, … , Xnaritmeettinen keskiarvo.
• Otosvarianssi s2kuvaa havaintoarvojen vaihtelua niiden aritmeettisen keskiarvon ympärillä.
• Otosvarianssi s2on satunnaismuuttuja, jonka saamat arvot vaihtelevat satunnaisesti otoksesta toiseen.
2 2
1
1 ( )
1
n i i
s X X
n =
= −
−
∑
1
1 n
i i
X X
n =
=
∑
Otosvarianssin otosjakauma
Otosvarianssin odotusarvo ja varianssi
• Otosvarianssins2odotusarvoja varianssi:
• Otosvarianssin s2standardipoikkeama:
2 2
4
2 2 2
E( )
Var( ) D ( ) 2 1 s
s s
n σ
σ
=
= =
−
2 2 2
D( )s 1
σ n
= −
Otosvarianssin otosjakauma
Otos normaalijakaumasta 1/2
• Oletetaan, että havainnot X1, X2, … , Xn
muodostavat yksinkertaisen satunnaisotoksen normaali- jakaumasta(ks. lukua Jatkuvia jakaumia)
• Tällöin satunnaismuuttuja
noudattaa eksaktisti χ2-jakaumaavapausastein n (χ2-jakauma: ks. lukua Normaalijakaumasta johdettuja jakaumia):
2
1 n
i i
Y X µ
σ
=
−
=
∑
N( ,µ σ2)
2( ) Y∼χ n
TKK (c) Ilkka Mellin (2004) 43
Otosvarianssin otosjakauma
Otos normaalijakaumasta 2/2
• Oletetaan, että havainnot X1, X2, … , Xn
muodostavat yksinkertaisen satunnaisotoksen normaali- jakaumasta
• Tällöin satunnaismuuttuja
noudattaa eksaktisti χ2-jakaumaavapausastein(n– 1) (χ2-jakauma: ks. lukua Normaalijakaumasta johdettuja jakaumia):
2 2 2
1
( 1) n i
i
X X
n s
V σ = σ
− −
= =
∑
N( ,µ σ2)
2( 1)
V∼χ n−
TKK (c) Ilkka Mellin (2004) 44
Otosvarianssin otosjakauma
Otosvarianssin otosjakauman johto 1/6
• Olkoon X1, X2, … , Xn
yksinkertainen satunnaisotos normaalijakaumasta
• Olkoon
havaintojen X1, X2, … , Xnaritmeettinen keskiarvoja
havaintojen X1, X2, … , Xn(harhaton) otosvarianssi.
N( ,µ σ2)
1
1n
i i
X X
n=
=
∑
2 2
1
1 ( )
1
n i i
s X X
n =
= −
−
∑
TKK (c) Ilkka Mellin (2004) 45
Otosvarianssin otosjakauma
Otosvarianssin otosjakauman johto 2/6
• Määritellään satunnaismuuttuja Ykaavalla
• Koska havainnot X1, X2, … , Xnovat riippumattomiaja noudattavat normaalijakaumaa :
niin standardoidutsatunnaismuuttujat
ovat riippumattomiaja noudattavat standardoitua normaalijakaumaa N(0, 1):
2
1 n
i i
Y X µ
= σ
−
=
∑
N( , 2) , 1,2, , Xi∼ µ σ i= …n
, 1,2, ,
i i
Y X µ i n
σ
= − = …
N(0,1) , 1,2, ,
Yi∼ i= …n
N( ,µ σ2)
TKK (c) Ilkka Mellin (2004) 46
Otosvarianssin otosjakauma
Otosvarianssin otosjakauman johto 3/6
• Edellä esitetystä seuraa, että satunnaismuuttuja Yon riippumattomien, standardoitua normaalijakaumaaN(0, 1) noudattavien satunnais- muuttujien Yi, i= 1, 2, … , n neliösumma:
• Suoraan -jakauman määritelmästäseuraa, että satunnaismuuttuja Y noudattaa -jakaumaa vapausastein n:
2 1 n i i
Y Y
=
=
∑
2( ) Y∼χ n
χ2
χ2
Otosvarianssin otosjakauma
Otosvarianssin otosjakauman johto 4/6
• Määritellään nyt satunnaismuuttuja Vkaavalla
• Satunnaismuuttuja Vsaadaan satunnaismuuttujasta
korvaamalla odotusarvo µharhattomalla estimaattorillaan .
• Satunnaismuuttujan Vmääritelmässä esiintyvän summan termit
eivät ole riippumattomia.
2
1 n
i i
X X
V = σ
−
=
∑
X
, 1,2, ,
Xi X i n
σ
− = …
2
1 n
i i
Y X µ
= σ
−
=
∑
Otosvarianssin otosjakauma
Otosvarianssin otosjakauman johto 5/6
• Voidaan kuitenkin osoittaa (todistus sivuutetaan), ettäVvoidaan esittääriippumattomien, standardoitua normaalijakaumaaN(0, 1) noudattavien satunnaismuuttujien Vi, i= 1, 2, … , n– 1 neliösummana:
• Suoraan -jakauman määritelmästäseuraa, että satunnaismuuttuja Y noudattaa -jakaumaa vapausastein(n– 1):
1 2 1 n
i i
V −V
=
=
∑
χ2 2( 1) V∼χ n−
χ2
TKK (c) Ilkka Mellin (2004) 49
Otosvarianssin otosjakauma
Otosvarianssin otosjakauman johto 6/6
• Huomautuksia:
(i) Satunnaismuuttuja Ynoudattaa -jakaumaa, jonka vapaus- asteiden lukumäärä on sama kuin havaintojen lukumäärä n.
(ii) Kun satunnaismuuttujasta Ysiirrytään satunnaismuuttujaan V menetetään yksi vapausaste.
(iii) Yhden vapausasteen menetys on seurausta siitä, ettäparametrin µkorvaaminen estimaattorillaan riippumattomissa satunnais- muuttujissa
luo yhden(lineaarisen)side-ehdonsatunnaismuuttujien
välille.
χ2
, 1,2, ,
i i
X X
V i n
σ
= − = …
X
, 1, 2, ,
i i
Y X µ i n
σ
= − = …
TKK (c) Ilkka Mellin (2004) 50
Otosvarianssin otosjakauma
Kommentteja
• Oletukset havaintojen riippumattomuudesta ja samasta jakaumasta ovat välttämättömiäotosvarianssin eksaktia eli tarkkaa otosjakaumaa koskevalle tulokselle.
TKK (c) Ilkka Mellin (2004) 51
Suhteellisen frekvenssin otosjakauma
Frekvenssi ja suhteellinen frekvenssi 1/3
• Olkoon Pjokin otosavaruuden Salkioiden ominaisuus.
• Jos otosavaruuden Salkiolla xon ominaisuus P, merkitään P(x)
• Olkoon
niiden otosavaruuden Salkioiden osajoukko, joilla on ominaisuus P.
• Oletetaan, että tapahtuman Atodennäköisyyson Pr(A) = p
{
( )}
A= x S P x∈
TKK (c) Ilkka Mellin (2004) 52
Suhteellisen frekvenssin otosjakauma
Frekvenssi ja suhteellinen frekvenssi 2/3
• Poimitaan otosavaruudesta S yksinkertainen satunnaisotos, jonka kokoon n.
• Olkoon f
niiden havaintoyksiköiden frekvenssi, joilla on ominaisuus Pja olkoon
vastaava suhteellinen frekvenssi.
pˆ=f n
Suhteellisen frekvenssin otosjakauma
Frekvenssi ja suhteellinen frekvenssi 3/3
• Frekvenssi f
kuvaa A-tyyppisten alkioiden lukumäärääotoksessa ja vastaava suhteellinen frekvenssi
kuvaa A-tyyppisten alkioiden suhteellista osuutta otoksessa.
• Frekvenssi fja vastaava suhteellinen frekvenssi ovat satunnaismuuttujia, joiden saamat arvot vaihtelevat satunnaisesti otoksesta toiseen.
ˆ p=f n
ˆ p
Suhteellisen frekvenssin otosjakauma
Frekvenssin
odotusarvo, varianssi ja jakauma 1/2
• Olkoon Ajokin otosavaruuden S tapahtuma:
A⊂S
• Poimitaan otosavaruudesta S yksinkertainen satunnaisotos, jonka kokoon n.
• Olkoon f
A-tyyppisten alkioiden lukumääräeli frekvenssiotoksessa.
TKK (c) Ilkka Mellin (2004) 55
Suhteellisen frekvenssin otosjakauma
Frekvenssin
odotusarvo, varianssi ja jakauma 2/2
• Frekvenssinfodotusarvoja varianssi:
jossa q= 1 –p.
• Frekvenssi f noudattaa eksaktistibinomijakaumaa parametrein nja Pr(A) = p(ks. lukua Diskreettejä jakaumia):
~ Bin( , )
f n p
E( ) Var( )
f np f npq
=
=
TKK (c) Ilkka Mellin (2004) 56
Suhteellisen frekvenssin otosjakauma
Suhteellisen frekvenssin odotusarvo ja varianssi 1/2
• Olkoon Ajokin otosavaruuden S tapahtuma:
A⊂S
• Poimitaan otosavaruudesta S yksinkertainen satunnaisotos, jonka kokoon n.
• Olkoon
A-tyyppisten alkioiden suhteellinen osuuseli frekvenssi otoksessa.
ˆ p=f n
TKK (c) Ilkka Mellin (2004) 57
Suhteellisen frekvenssin otosjakauma
Suhteellisen frekvenssin odotusarvo ja varianssi 2/2
• Suhteellisen frekvenssin odotusarvoja varianssi:
jossa q= 1 –p.
• Suhteellisen frekvenssin standardipoikkeamaa
kutsutaan tavallisesti suhteellisen frekvenssin keski- virheeksija se kuvaa suhteellisen frekvenssin otos- vaihtelua oman odotusarvonsa pympärillä.
ˆ p
2
E( )ˆ
ˆ ˆ
Var( ) D ( )
p p
p p pq n
=
= =
ˆ p ˆ
D( )p pq
= n
f n
TKK (c) Ilkka Mellin (2004) 58
Suhteellisen frekvenssin otosjakauma
Otosjakauman käyttäytyminen otoskoon kasvaessa
• Koska suhteellisen frekvenssin odotusarvo
ja varianssi on
niin suhteellisen frekvenssin otosjakauma keskittyy yhä voimakkaammin tapahtuman A todennäköisyyden p ympärille, kun otoskoko n kasvaa.
ˆ p E( )pˆ =p
Var( )pˆ =pq n q, = −1 p
Suhteellisen frekvenssin otosjakauma
Suhteellisen frekvenssin asymptoottinen jakauma
• Suhteellinen frekvenssi noudattaa suurissa otoksissa approksimatiivisestinormaalijakaumaa(ks. lukua Jatkuvia jakaumia):
• Siten standardoitu satunnaismuuttuja
noudattaa suurissa otoksissa approksimatiivisesti standardoitua normaalijakaumaa:
Z~ N(0,1) ˆ Z p p
pq n
= −
ˆ p
ˆ ~ Na , p p pq
n
Suhteellisen frekvenssin otosjakauma
Suhteellisen frekvenssin otosjakauma:
Kommentteja
• Suhteellisen frekvenssin otosjakaumaa koskeva asymptoottinen tulos seuraa keskeisestä raja-arvo- lauseesta; ks. lukua Konvergenssikäsitteet ja raja-arvolauseet.