TKK (c) Ilkka Mellin (2004) 1
Johdatus tilastotieteeseen
Testit laatueroasteikollisille muuttujille
TKK (c) Ilkka Mellin (2004) 2
Laatueroasteikollisten muuttujien testit Testi suhteelliselle osuudelle Suhteellisten osuuksien vertailutesti
Testit laatueroasteikollisille muuttujille
TKK (c) Ilkka Mellin (2004) 3
Testit laatueroasteikollisille muuttujille:
Mitä opimme?
• Tarkastelemme tässä luvussa seuraavia laatueroasteikollisten muuttujien testejä:
Testi suhteelliselle osuudelle Suhteellisten osuuksien vertailutesti
• Testauksen kohteena testeissä on Bernoulli-jakauman odotusarvo- parametri.
TKK (c) Ilkka Mellin (2004) 4
Testit laatueroasteikollisille muuttujille:
Esitiedot
• Esitiedot: ks. seuraavia lukuja:
Tilastollisten aineistojen kerääminen ja mittaaminen Tilastollisten aineistojen kuvaaminen
Otos ja otosjakaumat Estimointi Estimointimenetelmät Väliestimointi Tilastolliset testit
Satunnaismuuttujat ja todennäköisyysjakaumat Jakaumien tunnusluvut
Diskreettejä jakaumia Jatkuvia jakaumia
TKK (c) Ilkka Mellin (2004) 5
Testit laatueroasteikollisille muuttujille:
Lisätiedot
• Testejäsuhdeasteikollisille muuttujillekäsitellään luvussa Testit suhdeasteikollisille muuttujille
• Testejäjärjestysasteikollisille muuttujillekäsitellään luvussa Testit järjestysasteikollisille muuttujille
• Jakaumaoletuksien testaamistakäsitellään luvussa
Yhteensopivuuden, homogeenisuuden ja riippumattomuuden testaaminen
TKK (c) Ilkka Mellin (2004) 6
>> Laatueroasteikollisten muuttujien testit Testi suhteelliselle osuudelle Suhteellisten osuuksien vertailutesti
Testit laatueroasteikollisille muuttujille
TKK (c) Ilkka Mellin (2004) 7
Avainsanat Bernoullijakauma Kahden otoksen testit Laatueroasteikko Odotusarvo Parametri Suhteellinen osuus Yhden otoksen testit
Laatueroasteikollisten muuttujien testit
TKK (c) Ilkka Mellin (2004) 8
Laatueroasteikollisten muuttujien testit
Testit laatueroasteikollisille muuttujille 1/2
• Tarkastelemme seuraavia testejä laatueroasteikollisille muuttujille:
– Testi suhteelliselle osuudelle – Suhteellisten osuuksien vertailutesti
• Testejä saa käyttää myös järjestys-, välimatka- ja suhdeasteikollisille muuttujille.
• Mitta-asteikot: ks. lukua Tilastollisten aineistojen kerääminen ja mittaaminen.
TKK (c) Ilkka Mellin (2004) 9
Laatueroasteikollisten muuttujien testit
Testit laatueroasteikollisille muuttujille 2/2
• Testit ovat parametrisia testejä, joissa testauksen kohteena on Bernoulli-jakauman odotusarvoparametri.
• Testi suhteelliselle osuudelleon yhden otoksen testi.
• Suhteellisten osuuksien vertailutestion kahden otoksen testi.
TKK (c) Ilkka Mellin (2004) 10
Laatueroasteikollisten muuttujien testit
>> Testi suhteelliselle osuudelle Suhteellisten osuuksien vertailutesti
Testit laatueroasteikollisille muuttujille
TKK (c) Ilkka Mellin (2004) 11
Avainsanat Asymptoottinen testi Bernoulli-jakauma Binomijakauma Laatueroasteikko Normaalijakauma Odotusarvo Parametri Suhteellinen osuus Testisuure Testisuureen jakauma Yhden otoksen testit
Testi suhteelliselle osuudelle
TKK (c) Ilkka Mellin (2004) 12
Testi suhteelliselle osuudelle
Testausasetelma 1/3
• Olkoon Aperusjoukon S tapahtumaja olkoot Pr(A) = p
Pr(Ac) = 1 −p= q
• Määritellään satunnaismuuttuja X:
• Tällöin X~ Bernoulli(p) ja 1, jos sattuu 0, jos ei satu X A
A
=
Pr( 1)
Pr( 0) 1
X p
X p q
= =
= = − =
TKK (c) Ilkka Mellin (2004) 13
Testi suhteelliselle osuudelle
Testausasetelma 2/3
• Oletetaan, että tapahtuma Aon muotoa A= ”Perusjoukon alkiolla on ominaisuus P”
• Tällöin p= Pr(A)
on todennäköisyys poimia perusjoukosta Ssatunnaisesti alkio, jolla on ominaisuus P.
• Jos perusjoukko Son äärellinen, niin todennäköisyys p kuvaa niiden perusjoukon Salkioiden suhteellista osuutta, joilla on ominaisuus P.
TKK (c) Ilkka Mellin (2004) 14
Testi suhteelliselle osuudelle
Testausasetelma 3/3
• Olkoon X1, X2, … , Xnyksinkertainen satunnaisotos perusjoukosta S, joka noudattaa Bernoulli-jakaumaa
Bernoulli(p)
• Asetetaan Bernoulli-jakaumanparametrille p nollahypoteesi
• Testausongelma:
Ovatko havainnot sopusoinnussanollahypoteesin H0
kanssa?
• Ongelman ratkaisuna on testi suhteelliselle osuudelle.
0 0
H :p=p
TKK (c) Ilkka Mellin (2004) 15
Testi suhteelliselle osuudelle
Hypoteesit
• Yleinen hypoteesiH :
(1) Havainnot , jossa p= Pr(A), A⊂S
(2) Havainnot X1, X2, … , Xnovat riippumattomia
• NollahypoteesiH0:
• Vaihtoehtoinen hypoteesi H1:
~ Bernoulli( ) , 1, 2, ,
Xi p i= …n
0 0
H :p=p
1 0
1 0
1 0
H : 1-suuntaiset vaihtoehtoiset hypoteesit H :
H : 2-suuntainen vaihtoehtoinen hypoteesi
p p
p p
p p
>
<
≠
TKK (c) Ilkka Mellin (2004) 16
Testi suhteelliselle osuudelle
Parametrien estimointi
• Olkoon f tapahtuman A frekvenssisiinän-kertaisessa toistokokeessa, jota riippumattomien havaintojen poimiminen Bernoulli-jakaumasta merkitsee.
• Tällöin tapahtuman A suhteellinen frekvenssieli osuus on harhaton estimaattoriBernoulli-jakauman parametrille
E(Xi) = p, i= 1, 2, … , n
• Huomaa, että frekvenssi fnoudattaa binomijakaumaapara- metreinnjap:
ˆ /
p=f n
1
~ Bin( , )
n i i
f X n p
=
=
∑
TKK (c) Ilkka Mellin (2004) 17
Testi suhteelliselle osuudelle
Testisuure ja sen jakauma
• Määritellään testisuure
• Jos nollahypoteesi
pätee, niin testisuure znoudattaa suurissa otoksissa approksimatiivisesti standardoitua normaalijakaumaa:
• Approksimaatio on tavallisesti riittävän hyvä, jos
0
0 0
ˆ (1 ) / z p p
p p n
= −
−
N(0,1) z∼a
0 0
H :p=p
ˆ 10 ja (1 ˆ) 10 np≥ n −p ≥
TKK (c) Ilkka Mellin (2004) 18
Testi suhteelliselle osuudelle
Testisuureen jakauma nollahypoteesin H0pätiessä:
Perustelu
• Oletetaan, että testin yleinen hypoteesi H ja nollahypoteesi H0pätevät:
X1, X2, … , Xn⊥
• Tällöin (ks. lukuja Konvergenssikäsitteet ja raja-arvolauseet, Otos ja otosjakaumatja Väliestimointi):
jolloin
Bernoulli( ) ,0 1,2, ,
Xi∼ p i= …n
0 0
0 1
(1 )
ˆ 1n i aN ,
i
p p
p X f p
n= n n
−
=
∑
= ∼ 0
0 0
ˆ N(0,1)
(1 ) / a
z p p
p p n
= −
− ∼
TKK (c) Ilkka Mellin (2004) 19
Testi suhteelliselle osuudelle
Testi suhteelliselle osuudelle:
Testisuure zmittaa tilastollista etäisyyttä
• Testisuure
mittaa parametrin pestimaatin ja nollahypoteesin kiinnittämän parametrin parvon p0tilastollista etäisyyttä.
• Mittayksikkönäon erotuksen standardipoikkeaman
estimaattori, joka on määrätty olettaen, että nollahypoteesi H0pätee.
0
0 0
ˆ (1 ) / z p p
p p n
= −
−
ˆ 0
p p− (1 )
p p
n
−
0 0
H :p=p pˆ
TKK (c) Ilkka Mellin (2004) 20
Testi suhteelliselle osuudelle
Testi
• Testisuureen
normaaliarvo= 0, koska nollahypoteesinH0pätiessä E(z) = 0
• Siten itseisarvoltaan suurettestisuureen zarvot viittaavat siihen, ettänollahypoteesiH0ei päde.
• NollahypoteesiH0hylätään, jos testin p-arvo on kyllin pieni.
• Hylkäysalueen valinta ja p-arvon määrääminen: ks. lukua
Testit suhdeasteikollisille muuttujille.
0
0 0
ˆ (1 ) / z p p
p p n
= −
−
TKK (c) Ilkka Mellin (2004) 21
Laatueroasteikollisten muuttujien testit Testi suhteelliselle osuudelle
>> Suhteellisten osuuksien vertailutesti
Testit laatueroasteikollisille muuttujille
TKK (c) Ilkka Mellin (2004) 22
Avainsanat Asymptoottinen testi Bernoulli-jakauma Binomijakauma Kahden otoksen testit Laatueroasteikko Normaalijakauma Odotusarvo Parametri Suhteellinen osuus Testisuure Testisuureen jakauma Vertailutesti
Suhteellisten osuuksien vertailutesti
TKK (c) Ilkka Mellin (2004) 23
Suhteellisten osuuksien vertailutesti
Testausasetelma 1/4
• Olkoon
yksinkertainen satunnaisotosperusjoukosta S1, joka noudattaa Bernoulli-jakaumaa
Bernoulli(p1)
• Olkoon
yksinkertainen satunnaisotosperusjoukosta S2, joka noudattaa Bernoulli-jakaumaa
Bernoulli(p2)
• Olkoot otokset lisäksi toisistaan riippumattomia.
11, 21, , n11
X X … X
12, 22, , n22
X X … X
TKK (c) Ilkka Mellin (2004) 24
Suhteellisten osuuksien vertailutesti
Testausasetelma 2/4
• Olkoon Aperusjoukon Sk, k= 1, 2 tapahtumaja olkoot Pr(A) = pk
Pr(Ac) = 1 −pk= qk
• Määritellään satunnaismuuttujat Xk, k= 1, 2 :
• Tällöin Xk~ Bernoulli(pk) , k= 1, 2 ja 1, jos tapahtuu perusjoukossa 0, jos ei tapahdu perusjoukossa
k k
k
A S
X A S
=
Pr( 1)
Pr( 0) 1
k k
k k k
X p
X p q
= =
= = − =
TKK (c) Ilkka Mellin (2004) 25
Suhteellisten osuuksien vertailutesti
Testausasetelma 3/4
• Oletetaan, että tapahtuma Aon muotoa A= ”Perusjoukon alkiolla on ominaisuus P”
• Tällöin pk= Pr(A)
on todennäköisyys poimia perusjoukosta Sk, k= 1, 2 satunnaisesti alkio, jolla on ominaisuus P.
• Jos perusjoukko Sk, k= 1, 2 on äärellinen, niin todennäköisyys pkkuvaa niiden perusjoukon Skalkioiden suhteellista osuutta, joilla on ominaisuus P.
TKK (c) Ilkka Mellin (2004) 26
Suhteellisten osuuksien vertailutesti
Testausasetelma 4/4
• Asetetaan Bernoulli-jakaumienparametreille p1ja p2
nollahypoteesi
• Testausongelma:
Ovatko havainnot sopusoinnussahypoteesin H0kanssa?
• Ongelman ratkaisuna on suhteellisten osuuksien vertailutesti.
0 1 2
H :p =p =p
TKK (c) Ilkka Mellin (2004) 27
Suhteellisten osuuksien vertailutesti
Yleinen hypoteesi
• Yleinen hypoteesiH :
(1) Havainnot , jossa p1= Pr(A), A⊂S1
(2) Havainnot , jossa p2= Pr(A), A⊂S2
(3) Havainnot Xi1ja Xj2ovat riippumattomiakaikille ija j
• Huomautus:
Oletus (3) sisältää kolme riippumattomuusoletusta:
• Havainnot ovat riippumattomia otoksien 1 ja 2 sisällä.
• Havainnot ovat riippumattomia otoksien 1 ja 2 välillä.
1 Bernoulli( ) ,1 1,2, , 1
Xi ∼ p i= …n
2 Bernoulli( ) ,2 1,2, , 2
Xj ∼ p j= …n
TKK (c) Ilkka Mellin (2004) 28
Suhteellisten osuuksien vertailutesti
Nollahypoteesi ja vaihtoehtoiset hypoteesit
• NollahypoteesiH0:
• Vaihtoehtoinen hypoteesi H1:
1 1 2
1 1 2
1 1 2
H : 1-suuntaiset vaihtoehtoiset hypoteesit H :
H : 2-suuntainen vaihtoehtoinen hypoteesi
p p
p p
p p
>
<
≠
0 1 2
H :p =p =p
TKK (c) Ilkka Mellin (2004) 29
Suhteellisten osuuksien vertailutesti
Parametrien estimointi
• Olkoon fktapahtuman A frekvenssisiinänk-kertaisessa toistokokeessa, jota riippumattomien havaintojen poimiminen Bernoulli-jakaumastakmerkitsee, k= 1, 2.
• Tällöin tapahtuman A suhteellinen frekvenssieli osuus on harhaton estimaattoriBernoulli-jakauman parametrille
pk= E(Xik) , i= 1, 2, … , nk, k= 1, 2
• Huomaa, että frekvenssi fknoudattaa binomijakaumaa parametrein nkjapk:
ˆk k/ k, 1, 2 p =f n k=
1
~ Bin( , ) , 1, 2
nk
k ik k k
i
f X n p k
=
=
∑
=TKK (c) Ilkka Mellin (2004) 30
Suhteellisten osuuksien vertailutesti
Yhdistetty otos
• Jos nollahypoteesi pätee, voidaan otokset yhdistääja parametrin p harhaton estimaattorion tapahtuman Asuhteellinen frekvenssi yhdistetyssä otoksessa:
• Jos nollahypoteesiH0pätee, niin
1 1 2 2 1 2
1 2 1 2
ˆ ˆ
ˆ n p n p f f
p n n n n
+ +
= =
+ +
1 2
1 2
1 2
(1 ) (1 )
ˆ ˆ
Var( )
1 1
(1 )
p p p p
p p
n n
p p
n n
− −
− = +
= − +
0 1 2
H :p =p =p
TKK (c) Ilkka Mellin (2004) 31
Suhteellisten osuuksien vertailutesti
Testisuure ja sen jakauma
• Määritellään testisuure
• Jos nollahypoteesi
pätee, niin testisuure znoudattaa suurissa otoksissa approksimatiivisesti standardoitua normaalijakaumaa:
• Approksimaatio on tavallisesti riittävän hyvä, jos
1 2
1 2
ˆ ˆ
1 1
ˆ(1 ˆ)
p p
z
p p
n n
= −
− +
N(0,1) z∼a
1 1ˆ 5 , (11 ˆ1) 5 , 2ˆ2 5 , 2(1 ˆ2) 5 n p ≥ n −p ≥ n p ≥ n −p ≥
0 1 2
H :p=p =p
TKK (c) Ilkka Mellin (2004) 32
Suhteellisten osuuksien vertailutesti
Testisuureen jakauma nollahypoteesin H0pätiessä:
Perustelu 1/3
• Oletetaan, että testin yleinen hypoteesi H ja nollahypoteesi H0pätevät:
• Tällöin (ks. lukuja Konvergenssikäsitteet ja raja-arvolauseet, Otos ja otosjakaumatja Väliestimointi):
1 2
11 21 1 12 22 2
1 1
2 2
, , , , , , ,
Bernoulli( ) , 1,2, , Bernoulli( ) , 1,2, ,
n n
i j
X X X X X X
X p i n
X p j n
⊥
=
=
… …
∼ …
∼ …
1
2 1
1 1
1 1 1 1
2
2 2
2 1 2 2
1 (1 )
ˆ N ,
1 (1 )
ˆ N ,
n
i a
i n
j a
j
f p p
p X p
n n n
f p p
p X p
n n n
=
=
−
= =
−
= =
∑
∑
∼
∼
TKK (c) Ilkka Mellin (2004) 33
Suhteellisten osuuksien vertailutesti
Testisuureen jakauma nollahypoteesin H0pätiessä:
Perustelu 2/3
• Koska , niin
• Koska todennäköisyys pon tuntematon, satunnaismuuttujan Ylauseke on epäoperationaalinen.
1 2
1 2
ˆ ˆ N(0,1)
1 1
(1 )
a
p p
Y
p p
n n
= −
− +
∼
1 2
ˆ ˆ
p⊥p
TKK (c) Ilkka Mellin (2004) 34
Suhteellisten osuuksien vertailutesti
Testisuureen jakauma nollahypoteesin H0pätiessä:
Perustelu 3/3
• Jos satunnaismuuttujan Ylausekkeessa todennäköisyys pkorvataan otossuureella
saadaan testisuure
joka nollahypoteesinH0pätiessä noudattaa suurissa otoksissa standardoitua normaalijakaumaaN(0, 1):
z∼aN(0, 1)
• Todistus sivuutetaan.
1 1 2 2 1 2
1 2 1 2
ˆ ˆ
ˆ n p n p f f
p n n n n
+ +
= =
+ +
1 2
1 2
ˆ ˆ
1 1
ˆ(1 ˆ)
p p
z
p p
n n
= −
− +
TKK (c) Ilkka Mellin (2004) 35
Suhteellisten osuuksien vertailutesti
Testisuure zmittaa tilastollista etäisyyttä
• Testisuure
mittaa mittaa tapahtuman Aotoksista 1 ja 2 määrättyjen suhteellisten frekvenssien tilastollista etäisyyttä.
• Mittayksikkönäon erotuksen standardipoikkeaman
estimaattori, joka on määrätty olettaen, että nollahypoteesi H0pätee.
1 2
ˆ ˆ
p−p
1 2
1 2
ˆ ˆ
1 1
ˆ(1 ˆ)
p p
z
p p
n n
= −
− +
1 2
1 1
(1 )
p p
n n
− +
TKK (c) Ilkka Mellin (2004) 36
Suhteellisten osuuksien vertailutesti
Testi 1/2
• Testisuureen
normaaliarvo= 0, koska nollahypoteesinH0pätiessä E(z) = 0
• Siten itseisarvoltaan suurettestisuureen zarvot viittaavat siihen, ettänollahypoteesiH0ei päde.
• NollahypoteesiH0hylätään, jos testin p-arvo on kyllin pieni.
1 2
1 2
ˆ ˆ
1 1
ˆ(1 ˆ)
p p
z
p p
n n
= −
− +
TKK (c) Ilkka Mellin (2004) 37
Suhteellisten osuuksien vertailutesti
Testi 2/2
• Hylkäysalueen valinta ja p-arvon määrääminen: ks. lukua
Testit suhdeasteikollisille muuttujille.