TKK (c) Ilkka Mellin (2004) 1
Johdatus tilastotieteeseen
Testit suhdeasteikollisille muuttujille
TKK (c) Ilkka Mellin (2004) 2
Testit normaalijakauman parametreille Yhden otoksen t-testi
Kahden otoksen t-testi A Kahden otoksen t-testi B t-testi parivertailuille Testi varianssille Varianssien vertailutesti
Testit suhdeasteikollisille muuttujille
TKK (c) Ilkka Mellin (2004) 3
Testit suhdeasteikollisille muuttujille:
Mitä opimme?
• Tarkastelemme tässä luvussa normaalijakauman parametreja koskevia tilastollisia testejä.
• Yhden otoksen testit:
t-testi normaalijakauman odotusarvolle χ2-testi normaalijakauman varianssille
• Kahden otoksen testit:
t-testi A normaalijakaumien odotusarvojen vertailuun erisuurten varianssien tapauksessa
t-testi B normaalijakaumien odotusarvojen vertailuun yhtä suurten varianssien tapauksessa
t-testi normaalijakaumien odotusarvojen vertailuun parivertailutilanteessa
F-testi normaalijakauman varianssien vertailuun
TKK (c) Ilkka Mellin (2004) 4
Testit suhdeasteikollisille muuttujille:
Esitiedot
• Esitiedot: ks. seuraavia lukuja:
Tilastollisten aineistojen kerääminen ja mittaaminen Tilastollisten aineistojen kuvaaminen
Otos ja otosjakaumat Estimointi Estimointimenetelmät Väliestimointi Tilastolliset testit
Satunnaismuuttujat ja todennäköisyysjakaumat Jakaumien tunnusluvut
Jatkuvia jakaumia
Normaalijakaumasta johdettuja jakaumia
TKK (c) Ilkka Mellin (2004) 5
Testit suhdeasteikollisille muuttujille:
Lisätiedot
• Testejäjärjestysasteikollisille muuttujillekäsitellään luvussa Testit järjestysasteikollisille muuttujille
• Testejälaatueroasteikollisille muuttujillekäsitellään luvussa Testit laatueroasteikollisille muuttujille
• Jakaumaoletuksien testaamistakäsitellään luvussa
Yhteensopivuuden, homogeenisuuden ja riippumattomuuden testaaminen
TKK (c) Ilkka Mellin (2004) 6
>> Testit normaalijakauman parametreille Yhden otoksen t-testi
Kahden otoksen t-testi A Kahden otoksen t-testi B t-testi parivertailuille Testi varianssille Varianssien vertailutesti
Testit suhdeasteikollisille muuttujille
TKK (c) Ilkka Mellin (2004) 7
Avainsanat
Kahden otoksen testit Normaalijakauma Odotusarvo Otos Parametri
Riippumattomat otokset Varianssi
Vertailutesti Yhden otoksen testit
Testit normaalijakauman parametreille
TKK (c) Ilkka Mellin (2004) 8
Testit normaalijakauman parametreille
Normaalijakauman parametrien tilastolliset testit 1/2
• Normaalijakaumaon tilastotieteen tärkein jakauma.
• Oletetaan, että satunnaismuuttuja Xnoudattaa normaali- jakaumaa parametreinµja σ2:
• Tällöin E(X) = µ
on normaalijakauman odotusarvoja Var(X) = σ2
on normaalijakauman varianssi.
• Parametrit µja σ2määräävät täysin normaalijakauman.
N( , 2) X∼ µ σ
TKK (c) Ilkka Mellin (2004) 9
Testit normaalijakauman parametreille
Normaalijakauman parametrien tilastolliset testit 2/2
• Normaalijakauman parametreja koskevat testitvoidaan jakaa kahteen ryhmään:
– Yhden otoksen testit
– Kahden otoksen testiteli vertailutestit
• Yhden otoksen testeissätestataan yksinkertaisia nollahypoteeseja, jotka koskevat normaalijakauman odotusarvo- tai varianssiparametria.
• Kahden otoksen testitovat vertailutestejä, joilla verrataan kahden normaalijakauman odotusarvo- tai varianssi- parametreja toisiinsa.
TKK (c) Ilkka Mellin (2004) 10
Testit normaalijakauman parametreille
Normaalijakauman parametreille tarkoitettujen testien yleinen soveltuvuus 1/2
• Testejä normaalijakauman odotusarvolle sovelletaan usein myös sellaisissa tilanteissa, joissa havainnot eivät noudata normaalijakaumaa.
• Tämä perustuu seuraaviin seikkoihin:
(i) Esitettävät testit odotusarvolle perustuvat havaintojen aritmeettisiin keskiarvoihin.
(ii) Keskeisen raja-arvolauseenmukaan myös ei- normaalisten havaintojen aritmeettiset keskiarvot ovat – tietyin ehdoin –suurissa otoksissa approksimatiivisesti normaalijakautuneita.
TKK (c) Ilkka Mellin (2004) 11
Testit normaalijakauman parametreille
Normaalijakauman parametreille tarkoitettujen testien yleinen soveltuvuus 2/2
• Sen sijaantestit normaalijakauman varianssille eivät yleensä ole käyttökelpoisia ei-normaalisille havainnoilleja tilanne ei välttämättä parane suurillakaan havaintojen lukumäärillä.
TKK (c) Ilkka Mellin (2004) 12
Testit normaalijakauman parametreille
Tavanomaiset testit normaalijakauman parametreille
• Tarkastelemme seuraavia testejä normaalijakauman parametreille:
– Yhden otoksen t-testi odotusarvolle
– Kahden riippumattoman otoksen t-testi A odotus- arvoille erisuurten varianssien tapauksessa – Kahden riippumattoman otoksen t-testi B odotus-
arvoille yhtä suurten varianssien tapauksessa – t-testi parivertailuille
– Yhden otoksen χ2-testi varianssille – Kahden riippumattoman otoksen F-testi
variansseille
TKK (c) Ilkka Mellin (2004) 13
Testit normaalijakauman parametreille
>> Yhden otoksen t-testi Kahden otoksen t-testi A Kahden otoksen t-testi B t-testi parivertailuille Testi varianssille Varianssien vertailutesti
Testit suhdeasteikollisille muuttujille
TKK (c) Ilkka Mellin (2004) 14
Avainsanat
Aritmeettinen keskiarvo Nollahypoteesi Normaalijakauma Odotusarvo Otos Otosvarianssi Parametri Testisuure Testisuureen jakauma Testisuureen normaaliarvo t-jakauma
Varianssi Voimakkuus Yhden otoksen testit Yleinen hypoteesi
Yhden otoksen t-testi
TKK (c) Ilkka Mellin (2004) 15
Yhden otoksen t-testi
Testausasetelma 1/2
• Olkoon
X1, X2, … , Xn
yksinkertainen satunnaisotos perusjoukosta S, joka noudattaa normaalijakaumaa
• Jakauma riippuu seuraavista parametreista:
µ = jakauman odotusarvo σ2= jakauman varianssi N( ,µ σ2)
TKK (c) Ilkka Mellin (2004) 16
Yhden otoksen t-testi
Testausasetelma 2/2
• Asetetaan normaalijakauman odotusarvo-eli paikkaparametrilleµnollahypoteesi
• Testausongelma:
Ovatko havainnot sopusoinnussanollahypoteesin H0 kanssa?
• Ongelman ratkaisuna on yhden otoksen t-testi.
0 0
H :µ µ=
N( ,µ σ2)
TKK (c) Ilkka Mellin (2004) 17
Yhden otoksen t-testi
Hypoteesit
• Yleinen hypoteesiH : (i) Havainnot
(ii) Havainnot X1, X2, … , Xnovat riippumattomia
• NollahypoteesiH0:
• Vaihtoehtoinen hypoteesiH1:
N( , 2) , 1,2, , Xi∼ µ σ i= …n
0 0
H :µ µ=
1 0
1 0
1 0
H : 1-suuntaiset vaihtoehtoiset hypoteesit H :
H : 2-suuntainen vaihtoehtoinen hypoteesi µ µ
µ µ µ µ
>
<
≠
TKK (c) Ilkka Mellin (2004) 18
Yhden otoksen t-testi
Parametrien estimointi
• Olkoot
ja
tavanomaiset harhattomat estimaattoritparametreille E(Xi) = µ, i= 1, 2, … , n
ja
Var(Xi) = σ2, i= 1, 2, … , n
1
1 n
i i
X X
n =
=
∑
2 2
1
1 ( )
1
n i i
s X X
n =
= −
−
∑
TKK (c) Ilkka Mellin (2004) 19
Yhden otoksen t-testi
Testisuure ja sen jakauma
• Määritellään t-testisuure
• Jos nollahypoteesi
pätee, niin testisuure tnoudattaa Studentin t-jakaumaa vapausastein (n−1):
0
/ t X
s n
µ
= −
( 1) t t n∼ −
0 0
H :µ µ=
TKK (c) Ilkka Mellin (2004) 20
Yhden otoksen t-testi
Testisuureen jakauma nollahypoteesin H0pätiessä:
Perustelu 1/2
• Oletetaan, että testin yleinen hypoteesi H ja nollahypoteesi H0pätevät:
X1, X2, … , Xn⊥
• Koska tällöin (ks. lukua Otos ja otosjakaumat)
niin
• Koska standardipoikkeama σon tuntematon, satunnaismuuttujan z lauseke on epäoperationaalinen.
0 N(0,1) / z X
n µ σ
= − ∼
2
N( ,0 ) , 1,2, , Xi∼ µ σ i= …n
2 0 1
1n i N ,
i
X X
n n
µ σ
=
=
∑
∼TKK (c) Ilkka Mellin (2004) 21
Yhden otoksen t-testi
Testisuureen jakauma nollahypoteesin H0pätiessä:
Perustelu 2/2
• Jos satunnaismuuttujan zlausekkeessa standardipoikkeama σ korvataan vastaavalla otossuureella
saadaan t-testisuure
joka nollahypoteesinH0pätiessä noudattaa Studentin t-jakaumaa vapausastein (n−1):
t∼t(n−1)
• Todistus sivuutetaan; ks. kuitenkin lukua Väliestimointi.
0
/ t X
s n
−µ
=
2 1
1 ( )
1
n i i
s X X
n =
= −
−
∑
TKK (c) Ilkka Mellin (2004) 22
Yhden otoksen t-testi
t-testisuure mittaa tilastollista etäisyyttä
• Testisuure
mittaa havaintoarvojen aritmeettisen keskiarvon ja nolla- hypoteesin kiinnittämän odotusarvoparametrin µarvon µ0tilastollista etäisyyttä.
• Mittayksikkönäon erotuksen standardipoikkeaman
estimaattori, jota määrättäessä on oletettu, että nolla- hypoteesi H0pätee.
0 0
H :µ µ=
0
/ t X
s n
µ
= −
X−µ0
/ n σ
TKK (c) Ilkka Mellin (2004) 23
Yhden otoksen t-testi
Testi
• Testisuureen
normaaliarvo= 0, koska nollahypoteesin pätiessä
E(t) = 0
• Siten itseisarvoltaan suurettestisuureen tarvot viittaavat siihen, ettänollahypoteesiH0ei päde.
• NollahypoteesiH0hylätään, jos testin p-arvo on kyllin pieni.
0 0
H :µ µ=
0
/ t X
s n
µ
= −
TKK (c) Ilkka Mellin (2004) 24
Yhden otoksen t-testi
Testin hylkäysalueen valinta 1/4
• Valitaan testin merkitsevyystasoksiα.
• Jos vaihtoehtoinen hypoteesion muotoa H1: µ> µ0
niin kriittinen raja+tαsaadaan ehdosta Pr(t≥+tα) = α
jossa t∼t(n−1)
• Testin hylkäysalueon tällöin muotoa (+tα, +∞)
TKK (c) Ilkka Mellin (2004) 25
Yhden otoksen t-testi
Testin hylkäysalueen valinta 2/4
• Valitaan testin merkitsevyystasoksiα.
• Jos vaihtoehtoinen hypoteesion muotoa H1: µ< µ0
niin kriittinen raja−tαsaadaan ehdosta Pr(t≤ −tα) = α
jossa t∼t(n−1)
• Testin hylkäysalueon tällöin muotoa (−∞, −tα)
TKK (c) Ilkka Mellin (2004) 26
Yhden otoksen t-testi
Testin hylkäysalueen valinta 3/4
• Valitaan testin merkitsevyystasoksiα.
• Jos vaihtoehtoinen hypoteesion muotoa H1: µ≠µ0
niin kriittiset rajat−tα/2ja +tα/2saadaan ehdoista Pr(t≤ −tα/2) = α/2
Pr(t≥+tα/2) = α/2 jossa
t∼t(n−1)
• Testin hylkäysalueon tällöin muotoa (−∞, −tα)∪(+tα, +∞)
TKK (c) Ilkka Mellin (2004) 27
Yhden otoksen t-testi
Testin hylkäysalueen valinta 4/4
• Oletetaan, että testin merkitsevyystasoksion valittu α.
• Testin hylkäysalueenmääräämistä voidaan havainnollistaa alla olevilla kuvioilla.
1 0
H :µ µ> H :1 µ µ< 0 H :1 µ µ≠ 0 ( 1)
t n− t n( −1) t n( −1)
1−α 1−α 1−α
α α 12α 12α
Hylkäys- alue
Hylkäys- alue
Hylkäys- alue
Hylkäys- alue tα
+ −tα −tα/ 2 +tα/ 2
TKK (c) Ilkka Mellin (2004) 28
Yhden otoksen t-testi
Testin p-arvo
• Olkoon t-testisuureenhavaittu arvo t0.
• Testin p-arvonmääräämistä voidaan havainnollistaa alla olevilla kuvioilla.
1 0
H :µ µ> H :1 µ µ< 0 H :1 µ µ≠ 0 ( 1)
t n− t n( −1) t n( −1)
1−p 1−p 1 2− p
p p p p
t0 t0 −| |t0 +| |t0
TKK (c) Ilkka Mellin (2004) 29
Yhden otoksen t-testi
Normaalisuusoletuksen merkitys 1/2
• Yhden otoksen t-testin yleisessä hypoteesissa oletetaan, että havainnot ovat normaalijakautuneita.
• t-testi eikuitenkaan ole herkkä poikkeamille normaalisuudesta, jos havaintojen lukumääränon
”kyllin suuri”.
TKK (c) Ilkka Mellin (2004) 30
Yhden otoksen t-testi
Normaalisuusoletuksen merkitys 2/2
• Testiä on melko turvallista käyttää, kun havaintojen lukumäärä
n> 15
elleihavaintojen jakauma ole kovin vinoja havaintojen joukossa ole poikkeavia havaintoja.
• Jos havaintojen lukumäärä n> 40
testiä voidaan melko turvallisesti käyttää jopa selvästi vinoille havaintojen jakaumille.
TKK (c) Ilkka Mellin (2004) 31
Yhden otoksen t-testi
Testin hyväksymisvirheen todennäköisyys ja voimakkuus 1/6
• Tarkastellaan t-testin hyväksymisvirheen todennäköisyyttä ja voimakkuuttatilanteessa, jossa normaalijakauman
varianssi σ2oletetaan tunnetuksi.
• Olkoon nollahypoteesimuotoa
ja vaihtoehtoinen hypoteesimuotoa N( ,µ σ2)
0 0
H :µ µ=
1 0
H :µ µ<
TKK (c) Ilkka Mellin (2004) 32
Yhden otoksen t-testi
Testin hyväksymisvirheen todennäköisyys ja voimakkuus 2/6
• t-testisuure
noudattaa nollahypoteesin
pätiessä standardoitua normaalijakaumaa (ks. lukua Otos ja otosjakaumat):
t∼N(0, 1)
0
/ t X
n µ σ
= −
0 0
H :µ µ=
TKK (c) Ilkka Mellin (2004) 33
Yhden otoksen t-testi
Testin hyväksymisvirheen todennäköisyys ja voimakkuus 3/6
• Vaihtoehtoisen hypoteesin
tapauksessa t-testin päätössääntöon muotoa:
Hylkäänollahypoteesi
jos
• Kriittinen raja−zαsaadaan ehdosta Pr(z≤ −zα) = α
jossa z∼N(0, 1).
0
/
t X z
n α
µ σ
= − < −
0 0
H :µ µ=
1 0
H :µ µ<
TKK (c) Ilkka Mellin (2004) 34
Yhden otoksen t-testi
Testin hyväksymisvirheen todennäköisyys ja voimakkuus 4/6
• Vaihtoehtoisen hypoteesin
tapauksessa t-testin päätössääntövoidaan kirjoittaa myös seuraavaan muotoon:
Hylkäänollahypoteesi
jos
• Kriittinen raja−zαsaadaan ehdosta Pr(z≤ −zα) = α
jossa z∼N(0, 1).
0 / c
X<µ −zασ n=X
0 0
H :µ µ=
1 0
H :µ µ<
TKK (c) Ilkka Mellin (2004) 35
Yhden otoksen t-testi
Testin hyväksymisvirheen todennäköisyys ja voimakkuus 5/6
• Vaihtoehtoisen hypoteesin
tapauksessa t-testinhyväksymisvirheen todennäköisyys βon ehdollinen todennäköisyys
jossa µ∗≠µ0
0 0
Pr(H jätetään voimaan | H ei ole tosi)
Pr( | )
Pr /
c
c
X X
z X n β
µ µ µ σ
∗
∗
=
= ≥ =
−
= ≥
1 0
H :µ µ<
TKK (c) Ilkka Mellin (2004) 36
Yhden otoksen t-testi
Testin hyväksymisvirheen todennäköisyys ja voimakkuus 6/6
• Vaihtoehtoisen hypoteesin
tapauksessa t-testinvoimakkuus1 −βon ehdollinen todennäköisyys
jossa µ∗≠µ0
0 0
1 Pr(H hylätään | H ei ole tosi)
Pr( | )
Pr /
c
c
X X
z X n β
µ µ µ σ
∗
∗
− =
= < =
−
= <
1 0
H :µ µ<
TKK (c) Ilkka Mellin (2004) 37
Yhden otoksen t-testi
Testin hyväksymisvirheen todennäköisyys ja voimakkuus: Havainnollistus 1/3
• Kuvio oikealla havainnollistaa t- testin hyväksymisvirheen toden- näköisyyttäβja voimakkuutta 1 −β.
• Yleinen hypoteesiH : X1, X2, … , Xn⊥ Xi~ N(µ, σ2) , i= 1, 2, … , n
• NollahypoteesiH0:
• Vaihtoehtoinen hypoteesiH1:
µ∗ µ0 N(µ0,σ2/n) N(µ∗,σ2/n)
α β
µ µ= 0
µ µ< 0
Xc
TKK (c) Ilkka Mellin (2004) 38
Yhden otoksen t-testi
Testin hyväksymisvirheen todennäköisyys ja voimakkuus: Havainnollistus 2/3
• Valitaanmerkitsevyystasoksiα.
• Kriittinen raja zα: Pr(z≤ −zα) = α z∼N(0, 1)
• Kriittinen raja :
• Päätössääntö:
Hylkää nollahypoteesi H0, jos
µ∗ µ0
α β
Xc
Xc
0 /
Xc=µ−zασ n
N(µ∗,σ2/n) N(µ0,σ2/n)
TKK (c) Ilkka Mellin (2004) 39
Yhden otoksen t-testi
Testin hyväksymisvirheen todennäköisyys ja voimakkuus: Havainnollistus 3/3
• Hyväksymisvirheen todennäköisyys β:
• Voimakkuus1 −β:
µ∗ µ0
α β
Xc
Pr(X Xc| ) β= ≥ µ µ= ∗ 1− =β Pr(X<Xc|µ µ= ∗)
N(µ∗,σ2/n N(µ0,σ2/n)
TKK (c) Ilkka Mellin (2004) 40
Testit normaalijakauman parametreille Yhden otoksen t-testi
>> Kahden otoksen t-testi A Kahden otoksen t-testi B t-testi parivertailuille Testi varianssille Varianssien vertailutesti
Testit suhdeasteikollisille muuttujille
TKK (c) Ilkka Mellin (2004) 41
Avainsanat
Aritmeettinen keskiarvo Kahden otoksen testit Nollahypoteesi Normaalijakauma Odotusarvo Otosvarianssi Parametri
Riippumattomat otokset Testisuure Testisuureen jakauma Testisuureen normaaliarvo t-jakauma
Varianssi Vertailutesti Yleinen hypoteesi
Kahden otoksen t-testi A
TKK (c) Ilkka Mellin (2004) 42
Kahden otoksen t-testi A
Testausasetelma 1/4
• Olkoon
yksinkertainen satunnaisotosperusjoukosta S1, joka noudattaa normaalijakaumaa
• Jakauma riippuu seuraavista parametreista:
µ1 = jakauman odotusarvo σ12= jakauman varianssi
2
1 1
N( ,µ σ )
11, 21, , n11
X X … X
TKK (c) Ilkka Mellin (2004) 43
Kahden otoksen t-testi A
Testausasetelma 2/4
• Olkoon
yksinkertainen satunnaisotosperusjoukosta S2, joka noudattaa normaalijakaumaa
• Jakauma riippuu seuraavista parametreista:
µ2 = jakauman odotusarvo σ22= jakauman varianssi
2
2 2
N( ,µ σ )
12, 22, , n22
X X … X
TKK (c) Ilkka Mellin (2004) 44
Kahden otoksen t-testi A
Testausasetelma 3/4
• Oletetaan lisäksi, että perusjoukosta S1poimittu otos
ja perusjoukosta S2poimittu otos
ovat toisistaan riippumattomia.
• Otosten riippumattomuus merkitsee sitä, että se mikä alkio poimitaan perusjoukosta S1ei vaikutasiihen mikä alkioista poimitaan perusjoukosta S2ja kääntäen.
12, 22, , n22
X X … X
11, 21, , n11
X X … X
TKK (c) Ilkka Mellin (2004) 45
Kahden otoksen t-testi A
Testausasetelma 4/4
• Asetetaan normaalijakaumien ja odotusarvo- eli paikkaparametreilleµ1ja µ2 nollahypoteesi
• Testausongelma:
Ovatko havainnot sopusoinnussanollahypoteesin H0
kanssa?
• Ongelman ratkaisuna on kahden riippumattoman otoksen t-testierisuurten varianssien tapauksessa.
• Huomautus:
Jos voidaan olettaa, että , testauksessa kannattaa käyttää kahden riippumattoman otoksen t-testiä B.
2
1 1
N( ,µ σ ) N( ,µ σ2 22)
0 1 2
H :µ=µ =µ
2 2
1 2
σ =σ
TKK (c) Ilkka Mellin (2004) 46
Kahden otoksen t-testi A
Yleinen hypoteesi
• Yleinen hypoteesiH : (1) Havainnot (2) Havainnot
(3) Havainnot Xi1ja Xj2ovat riippumattomiakaikille ija j.
• Huomautuksia:
– Oletus (3) sisältää kolme riippumattomuusoletusta:
• Havainnot ovat riippumattomia otoksien 1 ja 2 sisällä.
• Havainnot ovat riippumattomia otoksien 1 ja 2 välillä.
– Jakaumien variansseja ja ei ole oletettu yhtä suuriksi;
vrt. kahden otoksen t-testi B.
2
1 N( ,1 1) , 1,2, , 1
Xi ∼ µ σ i= …n
2
2 N( ,2 2) , 1,2, , 2
Xj ∼ µ σ j= …n
TKK (c) Ilkka Mellin (2004) 47
Kahden otoksen t-testi A
Nollahypoteesi ja vaihtoehtoiset hypoteesit
• NollahypoteesiH0:
• Vaihtoehtoinen hypoteesi H1:
0 1 2
H :µ=µ =µ
1 1 2
1 1 2
1 1 2
H : 1-suuntaiset vaihtoehtoiset hypoteesit H :
H : 2-suuntainen vaihtoehtoinen hypoteesi µ µ
µ µ µ µ
>
<
≠
TKK (c) Ilkka Mellin (2004) 48
Kahden otoksen t-testi A
Parametrien estimointi
• Olkoot
ja
tavanomaiset harhattomat estimaattoritparametreille E(Xik) = µk, i= 1, 2, … , nk, k= 1, 2
ja
Var(Xik) = σk2, i= 1, 2, … , nk, k= 1, 2
1
1 k , 1,2
n
k ik
ki
X X k
n =
=
∑
=2 2
1
1 ( ) , 1, 2
1
nk
k ik k
k i
s X X k
n =
= − =
−
∑
TKK (c) Ilkka Mellin (2004) 49
Kahden otoksen t-testi A
Testisuure ja sen asymptoottinen jakauma
• Määritellään t-testisuure
• Jos nollahypoteesi
pätee, niin testisuure t noudattaa suurissa otoksissa approksimatiivisesti standardoitua normaalijakaumaa N(0,1):
1 2
2 2
1 2
1 2
X X
t s s
n n
= − +
N(0,1) t∼a
0 1 2
H :µ=µ =µ
TKK (c) Ilkka Mellin (2004) 50
Kahden otoksen t-testi A
Testisuureen jakauma nollahypoteesin H0pätiessä:
Perustelu 1/3
• Oletetaan, että testin yleinen hypoteesi H ja nollahypoteesi H0pätevät:
• Tällöin (ks. lukua Otos ja otosjakaumat)
• Koska , niin
2 2
1 2
1 2
1 2
N 0,
X X
n n
σ σ
− +
∼
1 2
11 21 1 12 22 2
2
1 1 1
2
2 2 2
, , , , , , ,
N( , ) , 1,2, , N( , ) , 1,2, ,
n n
i
j
X X X X X X
X i n
X j n
µ σ µ σ
⊥
=
=
… …
∼ …
∼ …
1
2
2 1
1 1
1
1 1
2 2
2 2
1
2 2
1 N ,
1 N ,
n i i
n j j
X X
n n
X X
n n
µσ
µσ
=
=
=
=
∑
∑
∼
∼
1 2
X⊥X
TKK (c) Ilkka Mellin (2004) 51
Kahden otoksen t-testi A
Testisuureen jakauma nollahypoteesin H0pätiessä:
Perustelu 2/3
• Edellä esitetystä seuraa, että
• Koska varianssit ovat tuntemattomia, satunnaismuuttujan z lauseke on epäoperationaalinen.
1 2
2 2
1 2
1 2
N(0,1)
X X
z
n n
σ σ
= − +
∼
2 2
1 ja 2
σ σ
TKK (c) Ilkka Mellin (2004) 52
Kahden otoksen t-testi A
Testisuureen jakauma nollahypoteesin H0pätiessä:
Perustelu 3/3
• Jos satunnaismuuttujan zlausekkeessa varianssit korvataan vastaavilla otossuureilla
saadaan t-testisuure
joka nollahypoteesinH0pätiessä noudattaa suurissa otoksissa approksimatiivisesti standardoitua normaalijakaumaaN(0, 1):
t∼aN(0, 1)
• Todistus sivuutetaan.
2 2
1
1 ( ) , 1,2
1
nk
k ik k
i k
s X X k
n =
= − =
−
∑
2 2
1 ja 2
σ σ
1 2
2 2
1 2
1 2
X X
t s s
n n
= − +
TKK (c) Ilkka Mellin (2004) 53
Kahden otoksen t-testi A
Testisuureen jakauman approksimointi
• Pienissä otoksissasaadaan testisuureen tjakaumalle parempi approksimaatiokäyttämällä approksimaationa Studentin t-jakaumaavapausastein (ns. Satterthwaiten approksimaatio)
2 2 2
1 2
1 2
2 2
2 2
1 2
1 1 2 2
1 1
1 1
s s
n n
s s
n n n n
ν
+
=
+
− −
TKK (c) Ilkka Mellin (2004) 54
Kahden otoksen t-testi A
t-testisuure mittaa tilastollista etäisyyttä
• Testisuure
mittaa otoksien 1 ja 2 aritmeettisten keskiarvojen tilastollista etäisyyttä.
• Mittayksikkönäon erotuksen standardipoikkeaman
estimaattori, jota määrättäessä on oletettu, että nolla- hypoteesi H0pätee.
1 2
X −X
2 2
1 2
1 2
n n
σ +σ
1 2
2 2
1 2
1 2
X X
t s s
n n
= − +
TKK (c) Ilkka Mellin (2004) 55
Kahden otoksen t-testi A
Testi
• Testisuureen
normaaliarvo= 0, koskanollahypoteesin pätiessä
E(t) = 0
• Siten itseisarvoltaan suurettestisuureen tarvot viittaavat siihen, ettänollahypoteesiH0ei päde.
• NollahypoteesiH0hylätään, jos testin p-arvo on kyllin pieni.
1 2
2 2
1 2
1 2
X X
t s s
n n
= − +
0 1 2
H :µ=µ =µ
TKK (c) Ilkka Mellin (2004) 56
Kahden otoksen t-testi A
Testin hylkäysalueen valinta 1/4
• Valitaan testin merkitsevyystasoksiα.
• Jos vaihtoehtoinen hypoteesion muotoa H1: µ> µ0
niin kriittinen raja+tαsaadaan ehdosta Pr(t≥+tα) = α
jossa t∼aN(0, 1)
• Testin hylkäysalueon tällöin muotoa (+tα, +∞)
TKK (c) Ilkka Mellin (2004) 57
Kahden otoksen t-testi A
Testin hylkäysalueen valinta 2/4
• Valitaan testin merkitsevyystasoksiα.
• Jos vaihtoehtoinen hypoteesion muotoa H1: µ< µ0
niin kriittinen raja−tαsaadaan ehdosta Pr(t≤ −tα) = α
jossa
t∼aN(0, 1)
• Testin hylkäysalueon tällöin muotoa (−∞, −tα)
TKK (c) Ilkka Mellin (2004) 58
Kahden otoksen t-testi A
Testin hylkäysalueen valinta 3/4
• Valitaan testin merkitsevyystasoksiα.
• Jos vaihtoehtoinen hypoteesion muotoa H1: µ≠µ0
niin kriittiset rajat−tα/2ja +tα/2saadaan ehdoista Pr(t≤ −tα/2) = α/2
Pr(t≥+tα/2) = α/2 jossa
t∼aN(0,1)
• Testin hylkäysalueon tällöin muotoa (−∞, −tα)∪(+tα, +∞)
TKK (c) Ilkka Mellin (2004) 59
Kahden otoksen t-testi A
Testin hylkäysalueen valinta 4/4
• Oletetaan, että testin merkitsevyystasoksion valittu α.
• Testin hylkäysalueenmääräämistä voidaan havainnollistaa alla olevilla kuvioilla.
1 0
H :µ µ> H :1 µ µ< 0 H :1 µ µ≠ 0
N(0,1) N(0,1) N(0,1)
1−α 1−α 1−α
α α 12α 12α
Hylkäys- alue
Hylkäys- alue
Hylkäys- alue
Hylkäys- alue tα
+ −tα −tα/ 2 +tα/ 2
TKK (c) Ilkka Mellin (2004) 60
Kahden otoksen t-testi A
Testin p-arvo
• Olkoon t-testisuureenhavaittu arvo t0.
• Testin p-arvonmääräämistä voidaan havainnollistaa alla olevilla kuvioilla.
1 0
H :µ µ> H :1 µ µ< 0 H :1 µ µ≠ 0
N(0,1) N(0,1) N(0,1)
1−p 1−p 1 2p−
p p p p
t0 t0 −| |t0 +| |t0
TKK (c) Ilkka Mellin (2004) 61
Kahden otoksen t-testi A
Normaalisuusoletuksen merkitys 1/2
• Kahden otoksen t-testin A yleisen hypoteesin mukaan havainnot ovat molemmissa otoksissa normaali- jakautuneita.
• Testi eikuitenkaan ole herkkä poikkeamille
normaalisuudesta, jos molempien otosten otoskoot ovat
”kyllin suuria”.
TKK (c) Ilkka Mellin (2004) 62
Kahden otoksen t-testi A
Normaalisuusoletuksen merkitys 2/2
• Testiä on melko turvallista käyttää, kun n1> 15 ja n2> 15
ja n1ja n2eivät eroa toisistaan kovin paljon, elleivät havaintojen jakaumat ole kovin vinojaja elleihavaintojen joukossa ole poikkeavia havaintoja.
• Jos
n1> 40 ja n2> 40
testiä voidaan melko turvallisesti käyttää jopa selvästi vinoille havaintojen jakaumille.
TKK (c) Ilkka Mellin (2004) 63
Testit normaalijakauman parametreille Yhden otoksen t-testi
Kahden otoksen t-testi A
>> Kahden otoksen t-testi B t-testi parivertailuille Testi varianssille Varianssien vertailutesti
Testit suhdeasteikollisille muuttujille
TKK (c) Ilkka Mellin (2004) 64
Avainsanat
Aritmeettinen keskiarvo Kahden otoksen testit Nollahypoteesi Normaalijakauma Odotusarvo Otosvarianssi Parametri
Riippumattomat otokset Testisuure Testisuureen jakauma Testisuureen normaaliarvo t-jakauma
Varianssi Vertailutesti Yleinen hypoteesi
Kahden otoksen t-testi B
TKK (c) Ilkka Mellin (2004) 65
Kahden otoksen t-testi B
Testausasetelma 1/4
• Olkoon
yksinkertainen satunnaisotosperusjoukosta S1, joka noudattaa normaalijakaumaa
• Jakauma riippuu seuraavista parametreista:
µ1 = jakauman odotusarvo σ2= jakauman varianssi
2
N( ,µ σ1 )
11, 21, , n11
X X … X
TKK (c) Ilkka Mellin (2004) 66
Kahden otoksen t-testi B
Testausasetelma 2/4
• Olkoon
yksinkertainen satunnaisotosperusjoukosta S2, joka noudattaa normaalijakaumaa
• Jakauma riippuu seuraavista parametreista:
µ2 = jakauman odotusarvo σ2= jakauman varianssi
2
N( ,µ σ2 )
12, 22, , n22
X X … X
TKK (c) Ilkka Mellin (2004) 67
Kahden otoksen t-testi B
Testausasetelma 3/4
• Oletetaan lisäksi, että perusjoukosta S1poimittu otos
ja perusjoukosta S2poimittu otos
ovat toisistaan riippumattomia.
• Otosten riippumattomuus merkitsee sitä, että se mikä alkio poimitaan perusjoukosta S1ei vaikutasiihen mikä alkioista poimitaan perusjoukosta S2ja kääntäen.
12, 22, , n22
X X … X
11, 21, , n11
X X … X
TKK (c) Ilkka Mellin (2004) 68
Kahden otoksen t-testi B
Testausasetelma 4/4
• Asetetaan normaalijakaumien ja odotusarvo- eli paikkaparametreilleµ1ja µ2
nollahypoteesi
• Testausongelma:
Ovatko havainnot sopusoinnussanollahypoteesin H0
kanssa?
• Ongelman ratkaisuna on kahden riippumattoman otoksen t-testiyhtä suurten varianssien tapauksessa.
• Huomautus:
Jos jakaumien varianssit eivät ole yhtä suuret, testauksessa on käytettäväkahden riippumattoman otoksen t-testiä A.
2
N( ,µ σ1 ) N( ,µ σ2 2)
0 1 2
H :µ =µ =µ
TKK (c) Ilkka Mellin (2004) 69
Kahden otoksen t-testi B
Yleinen hypoteesi
• Yleinen hypoteesiH : (1)
(2)
(3) Havainnot Xi1ja Xj2ovat riippumattomiakaikille ija j
• Huomautuksia:
– Oletus (3) sisältää kolme riippumattomuusoletusta:
• Havainnot ovat riippumattomia otoksien 1 ja 2 sisällä.
• Havainnot ovat riippumattomia otoksien 1 ja 2 välillä.
– Jakaumien varianssit ontässä oletettu yhtä suuriksi;
vrt. kahden otoksen t-testi A.
2
1 N( ,1 ) , 1,2, , 1
Xi ∼ µ σ i= …n
2
2 N( ,2 ) , 1, 2, , 2
Xj ∼ µ σ j= …n
TKK (c) Ilkka Mellin (2004) 70
Kahden otoksen t-testi B
Nollahypoteesi ja vaihtoehtoiset hypoteesit
• NollahypoteesiH0:
• Vaihtoehtoinen hypoteesi H1:
1 1 2
1 1 2
1 1 2
H : 1-suuntaiset vaihtoehtoiset hypoteesit H :
H : 2-suuntainen vaihtoehtoinen hypoteesi µ µ
µ µ µ µ
>
<
≠
0 1 2
H :µ =µ =µ
TKK (c) Ilkka Mellin (2004) 71
Kahden otoksen t-testi B
Parametrien estimointi
• Olkoot
ja
tavanomaiset harhattomat estimaattoritparametreille E(Xik) = µk, i= 1, 2, … , nk, k= 1, 2
ja
Var(Xik) = σ2, i= 1, 2, … , nk, k= 1, 2
1
1 k , 1,2
n
k ik
k i
X X k
n =
=
∑
=2 2
1
1 ( ) , 1, 2
1
nk
k ik k
k i
s X X k
n =
= − =
−
∑
TKK (c) Ilkka Mellin (2004) 72
Kahden otoksen t-testi B
Yhdistetty varianssiestimaattori
• Määritellään ns. yhdistetty varianssiestimaattori
• Yhdistetty varianssiestimaattori on harhaton estimaattorivarianssiparametrille σ2, jos nollahypoteesi
pätee.
• Huomautus:
Yhdistetty varianssiestimaattori ei ole sama kuin yhdistetyn otoksen varianssi, koska otoskeskiarvot ja eivät (yleensä) ole yhtä suuria.
2 2
2 1 1 2 2
1 2
( 1) ( 1)
P 2
n s n s
s n n
− + −
= + −
2
sP
2
sP
X1 X2
0 1 2
H :µ=µ =µ
TKK (c) Ilkka Mellin (2004) 73
Kahden otoksen t-testi B
Testisuure ja sen jakauma
• Määritellään t-testisuure
• Jos nollahypoteesi
pätee, niin testisuure tnoudattaa Studentin t-jakaumaa vapausastein (n1+ n2−2):
1 2
1 2
1 1
P
X X
t
s n n
= − +
1 2
( 2)
t t n∼ +n −
0 1 2
H :µ =µ =µ
TKK (c) Ilkka Mellin (2004) 74
Kahden otoksen t-testi B
Testisuureen jakauma nollahypoteesin H0pätiessä:
Perustelu 1/3
• Oletetaan, että testin yleinen hypoteesi H ja nollahypoteesi H0pätevät:
• Tällöin (ks. lukua Otos ja otosjakaumat)
• Koska , niin
2
1 2
1 2
1 1
N 0,
X X
n n
σ
− +
∼
1 2
11 21 1 12 22 2
2
1 1
2
2 2
, , , , , , ,
N( , ) , 1,2, , N( , ) , 1,2, ,
n n
i
j
X X X X X X
X i n
X j n
µ σ µ σ
⊥
=
=
… …
∼ …
∼ …
1
2
2
1 1
1
1 1
2
2 2
1
2 2
1 N ,
1 N ,
n i i
n j j
X X
n n
X X
n n
µσ
µσ
=
=
=
=
∑
∑
∼
∼
1 2
X⊥X
TKK (c) Ilkka Mellin (2004) 75
Kahden otoksen t-testi B
Testisuureen jakauma nollahypoteesin H0pätiessä:
Perustelu 2/3
• Edellä esitetystä seuraa, että
• Koska standardipoikkeama σon tuntematon, satunnaismuuttujan z lauseke on epäoperationaalinen.
• Määritellään otosvarianssit
1 2
1 2
N(0,1)
1 1
X X
z
n n
σ
= − +
∼
2 2
1
1 ( ) , 1,2
1
nk
k ik k
k i
s X X k
n =
= − =
−
∑
TKK (c) Ilkka Mellin (2004) 76
Kahden otoksen t-testi B
Testisuureen jakauma nollahypoteesin H0pätiessä:
Perustelu 3/3
• Jos satunnaismuuttujan zlausekkeessa standardipoikkeama σ korvataan otossuureella
saadaan t-testisuure
joka nollahypoteesinH0pätiessä noudattaa Studentin t-jakaumaa vapausastein (n1+ n2−2):
t∼t(n1+ n2−2)
• Todistus sivuutetaan.
1 2
1 2
1 1
P
X X
t
s n n
= − +
2 2
1 1 2 2
1 2
( 1) ( 1)
P 2
n s n s
s n n
− + −
= + −
TKK (c) Ilkka Mellin (2004) 77
Kahden otoksen t-testi B
t-testisuure mittaa tilastollista etäisyyttä
• Testisuure
mittaa otoksien 1 ja 2 aritmeettisten keskiarvojen tilastollista etäisyyttä.
• Mittayksikkönäon erotuksen standardipoikkeaman
estimaattori, jota määrättäessä on oletettu, että nolla- hypoteesi H0pätee.
1 2
1 1
n n
σ +
1 2
1 2
1 1
P
X X
t
s n n
= − +
1 2
X −X
TKK (c) Ilkka Mellin (2004) 78
Kahden otoksen t-testi B
Testi
• Testisuureen
normaaliarvo= 0, koskanollahypoteesin pätiessä
E(t) = 0
• Siten itseisarvoltaan suurettestisuureen tarvot viittaavat siihen, ettänollahypoteesiH0ei päde.
• NollahypoteesiH0hylätään, jos testin p-arvo on kyllin pieni.
1 2
1 2
1 1
P
X X
t
s n n
= − +
0 1 2
H :µ =µ =µ