• Ei tuloksia

1 Testit suhdeasteikollisille muuttujille:Lisätiedot Testit suhdeasteikollisille muuttujille Testit suhdeasteikollisille muuttujille:Mitä opimme? Testit suhdeasteikollisille muuttujille:Esitiedot Testit suhdeasteikollisille muuttujille Testit suhdeasteiko

N/A
N/A
Info
Lataa
Protected

Academic year: 2022

Jaa "1 Testit suhdeasteikollisille muuttujille:Lisätiedot Testit suhdeasteikollisille muuttujille Testit suhdeasteikollisille muuttujille:Mitä opimme? Testit suhdeasteikollisille muuttujille:Esitiedot Testit suhdeasteikollisille muuttujille Testit suhdeasteiko"

Copied!
23
0
0

Kokoteksti

(1)

TKK (c) Ilkka Mellin (2004) 1

Johdatus tilastotieteeseen

Testit suhdeasteikollisille muuttujille

TKK (c) Ilkka Mellin (2004) 2

Testit normaalijakauman parametreille Yhden otoksen t-testi

Kahden otoksen t-testi A Kahden otoksen t-testi B t-testi parivertailuille Testi varianssille Varianssien vertailutesti

Testit suhdeasteikollisille muuttujille

TKK (c) Ilkka Mellin (2004) 3

Testit suhdeasteikollisille muuttujille:

Mitä opimme?

Tarkastelemme tässä luvussa normaalijakauman parametreja koskevia tilastollisia testejä.

Yhden otoksen testit:

t-testi normaalijakauman odotusarvolle χ2-testi normaalijakauman varianssille

Kahden otoksen testit:

t-testi A normaalijakaumien odotusarvojen vertailuun erisuurten varianssien tapauksessa

t-testi B normaalijakaumien odotusarvojen vertailuun yhtä suurten varianssien tapauksessa

t-testi normaalijakaumien odotusarvojen vertailuun parivertailutilanteessa

F-testi normaalijakauman varianssien vertailuun

TKK (c) Ilkka Mellin (2004) 4

Testit suhdeasteikollisille muuttujille:

Esitiedot

Esitiedot: ks. seuraavia lukuja:

Tilastollisten aineistojen kerääminen ja mittaaminen Tilastollisten aineistojen kuvaaminen

Otos ja otosjakaumat Estimointi Estimointimenetelmät Väliestimointi Tilastolliset testit

Satunnaismuuttujat ja todennäköisyysjakaumat Jakaumien tunnusluvut

Jatkuvia jakaumia

Normaalijakaumasta johdettuja jakaumia

TKK (c) Ilkka Mellin (2004) 5

Testit suhdeasteikollisille muuttujille:

Lisätiedot

Testejäjärjestysasteikollisille muuttujillekäsitellään luvussa Testit järjestysasteikollisille muuttujille

Testejälaatueroasteikollisille muuttujillekäsitellään luvussa Testit laatueroasteikollisille muuttujille

Jakaumaoletuksien testaamistakäsitellään luvussa

Yhteensopivuuden, homogeenisuuden ja riippumattomuuden testaaminen

TKK (c) Ilkka Mellin (2004) 6

>> Testit normaalijakauman parametreille Yhden otoksen t-testi

Kahden otoksen t-testi A Kahden otoksen t-testi B t-testi parivertailuille Testi varianssille Varianssien vertailutesti

Testit suhdeasteikollisille muuttujille

(2)

TKK (c) Ilkka Mellin (2004) 7

Avainsanat

Kahden otoksen testit Normaalijakauma Odotusarvo Otos Parametri

Riippumattomat otokset Varianssi

Vertailutesti Yhden otoksen testit

Testit normaalijakauman parametreille

TKK (c) Ilkka Mellin (2004) 8

Testit normaalijakauman parametreille

Normaalijakauman parametrien tilastolliset testit 1/2

Normaalijakaumaon tilastotieteen tärkein jakauma.

• Oletetaan, että satunnaismuuttuja Xnoudattaa normaali- jakaumaa parametreinµja σ2:

• Tällöin E(X) = µ

on normaalijakauman odotusarvoja Var(X) = σ2

on normaalijakauman varianssi.

• Parametrit µja σ2määräävät täysin normaalijakauman.

N( , 2) X∼ µ σ

TKK (c) Ilkka Mellin (2004) 9

Testit normaalijakauman parametreille

Normaalijakauman parametrien tilastolliset testit 2/2

Normaalijakauman parametreja koskevat testitvoidaan jakaa kahteen ryhmään:

Yhden otoksen testit

Kahden otoksen testiteli vertailutestit

Yhden otoksen testeissätestataan yksinkertaisia nollahypoteeseja, jotka koskevat normaalijakauman odotusarvo- tai varianssiparametria.

Kahden otoksen testitovat vertailutestejä, joilla verrataan kahden normaalijakauman odotusarvo- tai varianssi- parametreja toisiinsa.

TKK (c) Ilkka Mellin (2004) 10

Testit normaalijakauman parametreille

Normaalijakauman parametreille tarkoitettujen testien yleinen soveltuvuus 1/2

Testejä normaalijakauman odotusarvolle sovelletaan usein myös sellaisissa tilanteissa, joissa havainnot eivät noudata normaalijakaumaa.

• Tämä perustuu seuraaviin seikkoihin:

(i) Esitettävät testit odotusarvolle perustuvat havaintojen aritmeettisiin keskiarvoihin.

(ii) Keskeisen raja-arvolauseenmukaan myös ei- normaalisten havaintojen aritmeettiset keskiarvot ovat – tietyin ehdoin –suurissa otoksissa approksimatiivisesti normaalijakautuneita.

TKK (c) Ilkka Mellin (2004) 11

Testit normaalijakauman parametreille

Normaalijakauman parametreille tarkoitettujen testien yleinen soveltuvuus 2/2

• Sen sijaantestit normaalijakauman varianssille eivät yleensä ole käyttökelpoisia ei-normaalisille havainnoilleja tilanne ei välttämättä parane suurillakaan havaintojen lukumäärillä.

TKK (c) Ilkka Mellin (2004) 12

Testit normaalijakauman parametreille

Tavanomaiset testit normaalijakauman parametreille

• Tarkastelemme seuraavia testejä normaalijakauman parametreille:

Yhden otoksen t-testi odotusarvolle

Kahden riippumattoman otoksen t-testi A odotus- arvoille erisuurten varianssien tapauksessa Kahden riippumattoman otoksen t-testi B odotus-

arvoille yhtä suurten varianssien tapauksessa t-testi parivertailuille

Yhden otoksen χ2-testi varianssille Kahden riippumattoman otoksen F-testi

variansseille

(3)

TKK (c) Ilkka Mellin (2004) 13

Testit normaalijakauman parametreille

>> Yhden otoksen t-testi Kahden otoksen t-testi A Kahden otoksen t-testi B t-testi parivertailuille Testi varianssille Varianssien vertailutesti

Testit suhdeasteikollisille muuttujille

TKK (c) Ilkka Mellin (2004) 14

Avainsanat

Aritmeettinen keskiarvo Nollahypoteesi Normaalijakauma Odotusarvo Otos Otosvarianssi Parametri Testisuure Testisuureen jakauma Testisuureen normaaliarvo t-jakauma

Varianssi Voimakkuus Yhden otoksen testit Yleinen hypoteesi

Yhden otoksen t-testi

TKK (c) Ilkka Mellin (2004) 15

Yhden otoksen t-testi

Testausasetelma 1/2

• Olkoon

X1, X2, … , Xn

yksinkertainen satunnaisotos perusjoukosta S, joka noudattaa normaalijakaumaa

• Jakauma riippuu seuraavista parametreista:

µ = jakauman odotusarvo σ2= jakauman varianssi N( ,µ σ2)

TKK (c) Ilkka Mellin (2004) 16

Yhden otoksen t-testi

Testausasetelma 2/2

• Asetetaan normaalijakauman odotusarvo-eli paikkaparametrilleµnollahypoteesi

• Testausongelma:

Ovatko havainnot sopusoinnussanollahypoteesin H0 kanssa?

• Ongelman ratkaisuna on yhden otoksen t-testi.

0 0

H :µ µ=

N( ,µ σ2)

TKK (c) Ilkka Mellin (2004) 17

Yhden otoksen t-testi

Hypoteesit

Yleinen hypoteesiH : (i) Havainnot

(ii) Havainnot X1, X2, … , Xnovat riippumattomia

NollahypoteesiH0:

Vaihtoehtoinen hypoteesiH1:

N( , 2) , 1,2, , Xi∼ µ σ i= …n

0 0

H :µ µ=

1 0

1 0

1 0

H : 1-suuntaiset vaihtoehtoiset hypoteesit H :

H : 2-suuntainen vaihtoehtoinen hypoteesi µ µ

µ µ µ µ

> 

< 

TKK (c) Ilkka Mellin (2004) 18

Yhden otoksen t-testi

Parametrien estimointi

• Olkoot

ja

tavanomaiset harhattomat estimaattoritparametreille E(Xi) = µ, i= 1, 2, … , n

ja

Var(Xi) = σ2, i= 1, 2, … , n

1

1 n

i i

X X

n =

=

2 2

1

1 ( )

1

n i i

s X X

n =

= −

(4)

TKK (c) Ilkka Mellin (2004) 19

Yhden otoksen t-testi

Testisuure ja sen jakauma

• Määritellään t-testisuure

Jos nollahypoteesi

pätee, niin testisuure tnoudattaa Studentin t-jakaumaa vapausastein (n−1):

0

/ t X

s n

µ

= −

( 1) t t n∼ −

0 0

H :µ µ=

TKK (c) Ilkka Mellin (2004) 20

Yhden otoksen t-testi

Testisuureen jakauma nollahypoteesin H0pätiessä:

Perustelu 1/2

Oletetaan, että testin yleinen hypoteesi H ja nollahypoteesi H0pätevät:

X1, X2, … , Xn

Koska tällöin (ks. lukua Otos ja otosjakaumat)

niin

Koska standardipoikkeama σon tuntematon, satunnaismuuttujan z lauseke on epäoperationaalinen.

0 N(0,1) / z X

n µ σ

=

2

N( ,0 ) , 1,2, , Xi µ σ i= n

2 0 1

1n i N ,

i

X X

n n

µ σ

=

=

TKK (c) Ilkka Mellin (2004) 21

Yhden otoksen t-testi

Testisuureen jakauma nollahypoteesin H0pätiessä:

Perustelu 2/2

Jos satunnaismuuttujan zlausekkeessa standardipoikkeama σ korvataan vastaavalla otossuureella

saadaan t-testisuure

joka nollahypoteesinH0pätiessä noudattaa Studentin t-jakaumaa vapausastein (n1):

tt(n1)

Todistus sivuutetaan; ks. kuitenkin lukua Väliestimointi.

0

/ t X

s n

µ

=

2 1

1 ( )

1

n i i

s X X

n =

=

TKK (c) Ilkka Mellin (2004) 22

Yhden otoksen t-testi

t-testisuure mittaa tilastollista etäisyyttä

• Testisuure

mittaa havaintoarvojen aritmeettisen keskiarvon ja nolla- hypoteesin kiinnittämän odotusarvoparametrin µarvon µ0tilastollista etäisyyttä.

Mittayksikkönäon erotuksen standardipoikkeaman

estimaattori, jota määrättäessä on oletettu, että nolla- hypoteesi H0pätee.

0 0

H :µ µ=

0

/ t X

s n

µ

= −

X−µ0

/ n σ

TKK (c) Ilkka Mellin (2004) 23

Yhden otoksen t-testi

Testi

• Testisuureen

normaaliarvo= 0, koska nollahypoteesin pätiessä

E(t) = 0

• Siten itseisarvoltaan suurettestisuureen tarvot viittaavat siihen, ettänollahypoteesiH0ei päde.

NollahypoteesiH0hylätään, jos testin p-arvo on kyllin pieni.

0 0

H :µ µ=

0

/ t X

s n

µ

= −

TKK (c) Ilkka Mellin (2004) 24

Yhden otoksen t-testi

Testin hylkäysalueen valinta 1/4

• Valitaan testin merkitsevyystasoksiα.

• Jos vaihtoehtoinen hypoteesion muotoa H1: µ> µ0

niin kriittinen raja+tαsaadaan ehdosta Pr(t≥+tα) = α

jossa tt(n−1)

• Testin hylkäysalueon tällöin muotoa (+tα, +∞)

(5)

TKK (c) Ilkka Mellin (2004) 25

Yhden otoksen t-testi

Testin hylkäysalueen valinta 2/4

• Valitaan testin merkitsevyystasoksiα.

• Jos vaihtoehtoinen hypoteesion muotoa H1: µ< µ0

niin kriittinen raja−tαsaadaan ehdosta Pr(t≤ −tα) = α

jossa tt(n−1)

• Testin hylkäysalueon tällöin muotoa (−∞, −tα)

TKK (c) Ilkka Mellin (2004) 26

Yhden otoksen t-testi

Testin hylkäysalueen valinta 3/4

• Valitaan testin merkitsevyystasoksiα.

• Jos vaihtoehtoinen hypoteesion muotoa H1: µ≠µ0

niin kriittiset rajat−tα/2ja +tα/2saadaan ehdoista Pr(t≤ −tα/2) = α/2

Pr(t≥+tα/2) = α/2 jossa

tt(n−1)

• Testin hylkäysalueon tällöin muotoa (−∞, −tα)∪(+tα, +∞)

TKK (c) Ilkka Mellin (2004) 27

Yhden otoksen t-testi

Testin hylkäysalueen valinta 4/4

• Oletetaan, että testin merkitsevyystasoksion valittu α.

• Testin hylkäysalueenmääräämistä voidaan havainnollistaa alla olevilla kuvioilla.

1 0

H :µ µ> H :1 µ µ< 0 H :1 µ µ 0 ( 1)

t n t n( 1) t n( 1)

1α 1α 1α

α α 12α 12α

Hylkäys- alue

Hylkäys- alue

Hylkäys- alue

Hylkäys- alue tα

+ tα tα/ 2 +tα/ 2

TKK (c) Ilkka Mellin (2004) 28

Yhden otoksen t-testi

Testin p-arvo

• Olkoon t-testisuureenhavaittu arvo t0.

• Testin p-arvonmääräämistä voidaan havainnollistaa alla olevilla kuvioilla.

1 0

H :µ µ> H :1 µ µ< 0 H :1 µ µ 0 ( 1)

t n t n( 1) t n( 1)

1p 1p 1 2 p

p p p p

t0 t0 | |t0 +| |t0

TKK (c) Ilkka Mellin (2004) 29

Yhden otoksen t-testi

Normaalisuusoletuksen merkitys 1/2

• Yhden otoksen t-testin yleisessä hypoteesissa oletetaan, että havainnot ovat normaalijakautuneita.

t-testi eikuitenkaan ole herkkä poikkeamille normaalisuudesta, jos havaintojen lukumääränon

”kyllin suuri”.

TKK (c) Ilkka Mellin (2004) 30

Yhden otoksen t-testi

Normaalisuusoletuksen merkitys 2/2

Testiä on melko turvallista käyttää, kun havaintojen lukumäärä

n> 15

elleihavaintojen jakauma ole kovin vinoja havaintojen joukossa ole poikkeavia havaintoja.

• Jos havaintojen lukumäärä n> 40

testiä voidaan melko turvallisesti käyttää jopa selvästi vinoille havaintojen jakaumille.

(6)

TKK (c) Ilkka Mellin (2004) 31

Yhden otoksen t-testi

Testin hyväksymisvirheen todennäköisyys ja voimakkuus 1/6

• Tarkastellaan t-testin hyväksymisvirheen todennäköisyyttä ja voimakkuuttatilanteessa, jossa normaalijakauman

varianssi σ2oletetaan tunnetuksi.

• Olkoon nollahypoteesimuotoa

ja vaihtoehtoinen hypoteesimuotoa N( ,µ σ2)

0 0

H :µ µ=

1 0

H :µ µ<

TKK (c) Ilkka Mellin (2004) 32

Yhden otoksen t-testi

Testin hyväksymisvirheen todennäköisyys ja voimakkuus 2/6

t-testisuure

noudattaa nollahypoteesin

pätiessä standardoitua normaalijakaumaa (ks. lukua Otos ja otosjakaumat):

t∼N(0, 1)

0

/ t X

n µ σ

= −

0 0

H :µ µ=

TKK (c) Ilkka Mellin (2004) 33

Yhden otoksen t-testi

Testin hyväksymisvirheen todennäköisyys ja voimakkuus 3/6

Vaihtoehtoisen hypoteesin

tapauksessa t-testin päätössääntöon muotoa:

Hylkäänollahypoteesi

jos

Kriittinen raja−zαsaadaan ehdosta Pr(z≤ −zα) = α

jossa z∼N(0, 1).

0

/

t X z

n α

µ σ

= − < −

0 0

H :µ µ=

1 0

H :µ µ<

TKK (c) Ilkka Mellin (2004) 34

Yhden otoksen t-testi

Testin hyväksymisvirheen todennäköisyys ja voimakkuus 4/6

Vaihtoehtoisen hypoteesin

tapauksessa t-testin päätössääntövoidaan kirjoittaa myös seuraavaan muotoon:

Hylkäänollahypoteesi

jos

Kriittinen raja−zαsaadaan ehdosta Pr(z≤ −zα) = α

jossa z∼N(0, 1).

0 / c

X<µ −zασ n=X

0 0

H :µ µ=

1 0

H :µ µ<

TKK (c) Ilkka Mellin (2004) 35

Yhden otoksen t-testi

Testin hyväksymisvirheen todennäköisyys ja voimakkuus 5/6

Vaihtoehtoisen hypoteesin

tapauksessa t-testinhyväksymisvirheen todennäköisyys βon ehdollinen todennäköisyys

jossa µ≠µ0

0 0

Pr(H jätetään voimaan | H ei ole tosi)

Pr( | )

Pr /

c

c

X X

z X n β

µ µ µ σ

=

= ≥ =

 − 

=  ≥ 

1 0

H :µ µ<

TKK (c) Ilkka Mellin (2004) 36

Yhden otoksen t-testi

Testin hyväksymisvirheen todennäköisyys ja voimakkuus 6/6

Vaihtoehtoisen hypoteesin

tapauksessa t-testinvoimakkuus1 −βon ehdollinen todennäköisyys

jossa µ≠µ0

0 0

1 Pr(H hylätään | H ei ole tosi)

Pr( | )

Pr /

c

c

X X

z X n β

µ µ µ σ

− =

= < =

 − 

=  < 

1 0

H :µ µ<

(7)

TKK (c) Ilkka Mellin (2004) 37

Yhden otoksen t-testi

Testin hyväksymisvirheen todennäköisyys ja voimakkuus: Havainnollistus 1/3

• Kuvio oikealla havainnollistaa t- testin hyväksymisvirheen toden- näköisyyttäβja voimakkuutta 1 −β.

Yleinen hypoteesiH : X1, X2, … , Xn Xi~ N(µ, σ2) , i= 1, 2, … , n

NollahypoteesiH0:

Vaihtoehtoinen hypoteesiH1:

µ µ0 N(µ0,σ2/n) N(µ,σ2/n)

α β

µ µ= 0

µ µ< 0

Xc

TKK (c) Ilkka Mellin (2004) 38

Yhden otoksen t-testi

Testin hyväksymisvirheen todennäköisyys ja voimakkuus: Havainnollistus 2/3

• Valitaanmerkitsevyystasoksiα.

Kriittinen raja zα: Pr(z≤ −zα) = α zN(0, 1)

Kriittinen raja :

Päätössääntö:

Hylkää nollahypoteesi H0, jos

µ µ0

α β

Xc

Xc

0 /

Xc=µzασ n

N(µ,σ2/n) N(µ0,σ2/n)

TKK (c) Ilkka Mellin (2004) 39

Yhden otoksen t-testi

Testin hyväksymisvirheen todennäköisyys ja voimakkuus: Havainnollistus 3/3

Hyväksymisvirheen todennäköisyys β:

Voimakkuus1 −β:

µ µ0

α β

Xc

Pr(X Xc| ) β= µ µ= 1− =β Pr(X<Xc|µ µ= )

N(µ,σ2/n N(µ0,σ2/n)

TKK (c) Ilkka Mellin (2004) 40

Testit normaalijakauman parametreille Yhden otoksen t-testi

>> Kahden otoksen t-testi A Kahden otoksen t-testi B t-testi parivertailuille Testi varianssille Varianssien vertailutesti

Testit suhdeasteikollisille muuttujille

TKK (c) Ilkka Mellin (2004) 41

Avainsanat

Aritmeettinen keskiarvo Kahden otoksen testit Nollahypoteesi Normaalijakauma Odotusarvo Otosvarianssi Parametri

Riippumattomat otokset Testisuure Testisuureen jakauma Testisuureen normaaliarvo t-jakauma

Varianssi Vertailutesti Yleinen hypoteesi

Kahden otoksen t-testi A

TKK (c) Ilkka Mellin (2004) 42

Kahden otoksen t-testi A

Testausasetelma 1/4

• Olkoon

yksinkertainen satunnaisotosperusjoukosta S1, joka noudattaa normaalijakaumaa

• Jakauma riippuu seuraavista parametreista:

µ1 = jakauman odotusarvo σ12= jakauman varianssi

2

1 1

N( ,µ σ )

11, 21, , n11

X XX

(8)

TKK (c) Ilkka Mellin (2004) 43

Kahden otoksen t-testi A

Testausasetelma 2/4

• Olkoon

yksinkertainen satunnaisotosperusjoukosta S2, joka noudattaa normaalijakaumaa

• Jakauma riippuu seuraavista parametreista:

µ2 = jakauman odotusarvo σ22= jakauman varianssi

2

2 2

N( ,µ σ )

12, 22, , n22

X XX

TKK (c) Ilkka Mellin (2004) 44

Kahden otoksen t-testi A

Testausasetelma 3/4

• Oletetaan lisäksi, että perusjoukosta S1poimittu otos

ja perusjoukosta S2poimittu otos

ovat toisistaan riippumattomia.

• Otosten riippumattomuus merkitsee sitä, että se mikä alkio poimitaan perusjoukosta S1ei vaikutasiihen mikä alkioista poimitaan perusjoukosta S2ja kääntäen.

12, 22, , n22

X XX

11, 21, , n11

X XX

TKK (c) Ilkka Mellin (2004) 45

Kahden otoksen t-testi A

Testausasetelma 4/4

• Asetetaan normaalijakaumien ja odotusarvo- eli paikkaparametreilleµ1ja µ2 nollahypoteesi

• Testausongelma:

Ovatko havainnot sopusoinnussanollahypoteesin H0

kanssa?

• Ongelman ratkaisuna on kahden riippumattoman otoksen t-testierisuurten varianssien tapauksessa.

• Huomautus:

Jos voidaan olettaa, että , testauksessa kannattaa käyttää kahden riippumattoman otoksen t-testiä B.

2

1 1

N( ,µ σ ) N( ,µ σ2 22)

0 1 2

H :µ=µ =µ

2 2

1 2

σ =σ

TKK (c) Ilkka Mellin (2004) 46

Kahden otoksen t-testi A

Yleinen hypoteesi

Yleinen hypoteesiH : (1) Havainnot (2) Havainnot

(3) Havainnot Xi1ja Xj2ovat riippumattomiakaikille ija j.

• Huomautuksia:

Oletus (3) sisältää kolme riippumattomuusoletusta:

Havainnot ovat riippumattomia otoksien 1 ja 2 sisällä.

Havainnot ovat riippumattomia otoksien 1 ja 2 välillä.

Jakaumien variansseja ja ei ole oletettu yhtä suuriksi;

vrt. kahden otoksen t-testi B.

2

1 N( ,1 1) , 1,2, , 1

Xi ∼ µ σ i= …n

2

2 N( ,2 2) , 1,2, , 2

Xj ∼ µ σ j= …n

TKK (c) Ilkka Mellin (2004) 47

Kahden otoksen t-testi A

Nollahypoteesi ja vaihtoehtoiset hypoteesit

NollahypoteesiH0:

Vaihtoehtoinen hypoteesi H1:

0 1 2

H :µ=µ =µ

1 1 2

1 1 2

1 1 2

H : 1-suuntaiset vaihtoehtoiset hypoteesit H :

H : 2-suuntainen vaihtoehtoinen hypoteesi µ µ

µ µ µ µ

> 

< 

TKK (c) Ilkka Mellin (2004) 48

Kahden otoksen t-testi A

Parametrien estimointi

• Olkoot

ja

tavanomaiset harhattomat estimaattoritparametreille E(Xik) = µk, i= 1, 2, … , nk, k= 1, 2

ja

Var(Xik) = σk2, i= 1, 2, … , nk, k= 1, 2

1

1 k , 1,2

n

k ik

ki

X X k

n =

=

=

2 2

1

1 ( ) , 1, 2

1

nk

k ik k

k i

s X X k

n =

= − =

(9)

TKK (c) Ilkka Mellin (2004) 49

Kahden otoksen t-testi A

Testisuure ja sen asymptoottinen jakauma

• Määritellään t-testisuure

Jos nollahypoteesi

pätee, niin testisuure t noudattaa suurissa otoksissa approksimatiivisesti standardoitua normaalijakaumaa N(0,1):

1 2

2 2

1 2

1 2

X X

t s s

n n

= − +

N(0,1) ta

0 1 2

H :µ=µ =µ

TKK (c) Ilkka Mellin (2004) 50

Kahden otoksen t-testi A

Testisuureen jakauma nollahypoteesin H0pätiessä:

Perustelu 1/3

Oletetaan, että testin yleinen hypoteesi H ja nollahypoteesi H0pätevät:

Tällöin (ks. lukua Otos ja otosjakaumat)

Koska , niin

2 2

1 2

1 2

1 2

N 0,

X X

n n

σ σ

+

1 2

11 21 1 12 22 2

2

1 1 1

2

2 2 2

, , , , , , ,

N( , ) , 1,2, , N( , ) , 1,2, ,

n n

i

j

X X X X X X

X i n

X j n

µ σ µ σ

=

=

1

2

2 1

1 1

1

1 1

2 2

2 2

1

2 2

1 N ,

1 N ,

n i i

n j j

X X

n n

X X

n n

µσ

µσ

=

=

=

=

1 2

XX

TKK (c) Ilkka Mellin (2004) 51

Kahden otoksen t-testi A

Testisuureen jakauma nollahypoteesin H0pätiessä:

Perustelu 2/3

Edellä esitetystä seuraa, että

Koska varianssit ovat tuntemattomia, satunnaismuuttujan z lauseke on epäoperationaalinen.

1 2

2 2

1 2

1 2

N(0,1)

X X

z

n n

σ σ

= +

2 2

1 ja 2

σ σ

TKK (c) Ilkka Mellin (2004) 52

Kahden otoksen t-testi A

Testisuureen jakauma nollahypoteesin H0pätiessä:

Perustelu 3/3

Jos satunnaismuuttujan zlausekkeessa varianssit korvataan vastaavilla otossuureilla

saadaan t-testisuure

joka nollahypoteesinH0pätiessä noudattaa suurissa otoksissa approksimatiivisesti standardoitua normaalijakaumaaN(0, 1):

taN(0, 1)

Todistus sivuutetaan.

2 2

1

1 ( ) , 1,2

1

nk

k ik k

i k

s X X k

n =

= =

2 2

1 ja 2

σ σ

1 2

2 2

1 2

1 2

X X

t s s

n n

= +

TKK (c) Ilkka Mellin (2004) 53

Kahden otoksen t-testi A

Testisuureen jakauman approksimointi

Pienissä otoksissasaadaan testisuureen tjakaumalle parempi approksimaatiokäyttämällä approksimaationa Studentin t-jakaumaavapausastein (ns. Satterthwaiten approksimaatio)

2 2 2

1 2

1 2

2 2

2 2

1 2

1 1 2 2

1 1

1 1

s s

n n

s s

n n n n

ν

 + 

 

 

=    

  +  

−   −  

TKK (c) Ilkka Mellin (2004) 54

Kahden otoksen t-testi A

t-testisuure mittaa tilastollista etäisyyttä

• Testisuure

mittaa otoksien 1 ja 2 aritmeettisten keskiarvojen tilastollista etäisyyttä.

Mittayksikkönäon erotuksen standardipoikkeaman

estimaattori, jota määrättäessä on oletettu, että nolla- hypoteesi H0pätee.

1 2

XX

2 2

1 2

1 2

n n

σ +σ

1 2

2 2

1 2

1 2

X X

t s s

n n

= − +

(10)

TKK (c) Ilkka Mellin (2004) 55

Kahden otoksen t-testi A

Testi

• Testisuureen

normaaliarvo= 0, koskanollahypoteesin pätiessä

E(t) = 0

• Siten itseisarvoltaan suurettestisuureen tarvot viittaavat siihen, ettänollahypoteesiH0ei päde.

NollahypoteesiH0hylätään, jos testin p-arvo on kyllin pieni.

1 2

2 2

1 2

1 2

X X

t s s

n n

= − +

0 1 2

H :µ=µ =µ

TKK (c) Ilkka Mellin (2004) 56

Kahden otoksen t-testi A

Testin hylkäysalueen valinta 1/4

• Valitaan testin merkitsevyystasoksiα.

• Jos vaihtoehtoinen hypoteesion muotoa H1: µ> µ0

niin kriittinen raja+tαsaadaan ehdosta Pr(t≥+tα) = α

jossa taN(0, 1)

• Testin hylkäysalueon tällöin muotoa (+tα, +∞)

TKK (c) Ilkka Mellin (2004) 57

Kahden otoksen t-testi A

Testin hylkäysalueen valinta 2/4

• Valitaan testin merkitsevyystasoksiα.

• Jos vaihtoehtoinen hypoteesion muotoa H1: µ< µ0

niin kriittinen raja−tαsaadaan ehdosta Pr(t≤ −tα) = α

jossa

taN(0, 1)

• Testin hylkäysalueon tällöin muotoa (−∞, −tα)

TKK (c) Ilkka Mellin (2004) 58

Kahden otoksen t-testi A

Testin hylkäysalueen valinta 3/4

• Valitaan testin merkitsevyystasoksiα.

• Jos vaihtoehtoinen hypoteesion muotoa H1: µ≠µ0

niin kriittiset rajat−tα/2ja +tα/2saadaan ehdoista Pr(t≤ −tα/2) = α/2

Pr(t≥+tα/2) = α/2 jossa

taN(0,1)

• Testin hylkäysalueon tällöin muotoa (−∞, −tα)∪(+tα, +∞)

TKK (c) Ilkka Mellin (2004) 59

Kahden otoksen t-testi A

Testin hylkäysalueen valinta 4/4

• Oletetaan, että testin merkitsevyystasoksion valittu α.

• Testin hylkäysalueenmääräämistä voidaan havainnollistaa alla olevilla kuvioilla.

1 0

H :µ µ> H :1 µ µ< 0 H :1 µ µ 0

N(0,1) N(0,1) N(0,1)

1α 1α 1α

α α 12α 12α

Hylkäys- alue

Hylkäys- alue

Hylkäys- alue

Hylkäys- alue tα

+ tα tα/ 2 +tα/ 2

TKK (c) Ilkka Mellin (2004) 60

Kahden otoksen t-testi A

Testin p-arvo

• Olkoon t-testisuureenhavaittu arvo t0.

• Testin p-arvonmääräämistä voidaan havainnollistaa alla olevilla kuvioilla.

1 0

H :µ µ> H :1 µ µ< 0 H :1 µ µ 0

N(0,1) N(0,1) N(0,1)

1p 1p 1 2p

p p p p

t0 t0 | |t0 +| |t0

(11)

TKK (c) Ilkka Mellin (2004) 61

Kahden otoksen t-testi A

Normaalisuusoletuksen merkitys 1/2

• Kahden otoksen t-testin A yleisen hypoteesin mukaan havainnot ovat molemmissa otoksissa normaali- jakautuneita.

• Testi eikuitenkaan ole herkkä poikkeamille

normaalisuudesta, jos molempien otosten otoskoot ovat

”kyllin suuria”.

TKK (c) Ilkka Mellin (2004) 62

Kahden otoksen t-testi A

Normaalisuusoletuksen merkitys 2/2

Testiä on melko turvallista käyttää, kun n1> 15 ja n2> 15

ja n1ja n2eivät eroa toisistaan kovin paljon, elleivät havaintojen jakaumat ole kovin vinojaja elleihavaintojen joukossa ole poikkeavia havaintoja.

• Jos

n1> 40 ja n2> 40

testiä voidaan melko turvallisesti käyttää jopa selvästi vinoille havaintojen jakaumille.

TKK (c) Ilkka Mellin (2004) 63

Testit normaalijakauman parametreille Yhden otoksen t-testi

Kahden otoksen t-testi A

>> Kahden otoksen t-testi B t-testi parivertailuille Testi varianssille Varianssien vertailutesti

Testit suhdeasteikollisille muuttujille

TKK (c) Ilkka Mellin (2004) 64

Avainsanat

Aritmeettinen keskiarvo Kahden otoksen testit Nollahypoteesi Normaalijakauma Odotusarvo Otosvarianssi Parametri

Riippumattomat otokset Testisuure Testisuureen jakauma Testisuureen normaaliarvo t-jakauma

Varianssi Vertailutesti Yleinen hypoteesi

Kahden otoksen t-testi B

TKK (c) Ilkka Mellin (2004) 65

Kahden otoksen t-testi B

Testausasetelma 1/4

• Olkoon

yksinkertainen satunnaisotosperusjoukosta S1, joka noudattaa normaalijakaumaa

• Jakauma riippuu seuraavista parametreista:

µ1 = jakauman odotusarvo σ2= jakauman varianssi

2

N( ,µ σ1 )

11, 21, , n11

X XX

TKK (c) Ilkka Mellin (2004) 66

Kahden otoksen t-testi B

Testausasetelma 2/4

• Olkoon

yksinkertainen satunnaisotosperusjoukosta S2, joka noudattaa normaalijakaumaa

• Jakauma riippuu seuraavista parametreista:

µ2 = jakauman odotusarvo σ2= jakauman varianssi

2

N( ,µ σ2 )

12, 22, , n22

X XX

(12)

TKK (c) Ilkka Mellin (2004) 67

Kahden otoksen t-testi B

Testausasetelma 3/4

• Oletetaan lisäksi, että perusjoukosta S1poimittu otos

ja perusjoukosta S2poimittu otos

ovat toisistaan riippumattomia.

• Otosten riippumattomuus merkitsee sitä, että se mikä alkio poimitaan perusjoukosta S1ei vaikutasiihen mikä alkioista poimitaan perusjoukosta S2ja kääntäen.

12, 22, , n22

X XX

11, 21, , n11

X XX

TKK (c) Ilkka Mellin (2004) 68

Kahden otoksen t-testi B

Testausasetelma 4/4

• Asetetaan normaalijakaumien ja odotusarvo- eli paikkaparametreilleµ1ja µ2

nollahypoteesi

• Testausongelma:

Ovatko havainnot sopusoinnussanollahypoteesin H0

kanssa?

• Ongelman ratkaisuna on kahden riippumattoman otoksen t-testiyhtä suurten varianssien tapauksessa.

• Huomautus:

Jos jakaumien varianssit eivät ole yhtä suuret, testauksessa on käytettäväkahden riippumattoman otoksen t-testiä A.

2

N( ,µ σ1 ) N( ,µ σ2 2)

0 1 2

H :µ =µ =µ

TKK (c) Ilkka Mellin (2004) 69

Kahden otoksen t-testi B

Yleinen hypoteesi

Yleinen hypoteesiH : (1)

(2)

(3) Havainnot Xi1ja Xj2ovat riippumattomiakaikille ija j

• Huomautuksia:

Oletus (3) sisältää kolme riippumattomuusoletusta:

Havainnot ovat riippumattomia otoksien 1 ja 2 sisällä.

Havainnot ovat riippumattomia otoksien 1 ja 2 välillä.

Jakaumien varianssit ontässä oletettu yhtä suuriksi;

vrt. kahden otoksen t-testi A.

2

1 N( ,1 ) , 1,2, , 1

Xi ∼ µ σ i= …n

2

2 N( ,2 ) , 1, 2, , 2

Xj ∼ µ σ j= …n

TKK (c) Ilkka Mellin (2004) 70

Kahden otoksen t-testi B

Nollahypoteesi ja vaihtoehtoiset hypoteesit

NollahypoteesiH0:

Vaihtoehtoinen hypoteesi H1:

1 1 2

1 1 2

1 1 2

H : 1-suuntaiset vaihtoehtoiset hypoteesit H :

H : 2-suuntainen vaihtoehtoinen hypoteesi µ µ

µ µ µ µ

> 

< 

0 1 2

H :µ =µ =µ

TKK (c) Ilkka Mellin (2004) 71

Kahden otoksen t-testi B

Parametrien estimointi

• Olkoot

ja

tavanomaiset harhattomat estimaattoritparametreille E(Xik) = µk, i= 1, 2, … , nk, k= 1, 2

ja

Var(Xik) = σ2, i= 1, 2, … , nk, k= 1, 2

1

1 k , 1,2

n

k ik

k i

X X k

n =

=

=

2 2

1

1 ( ) , 1, 2

1

nk

k ik k

k i

s X X k

n =

= − =

TKK (c) Ilkka Mellin (2004) 72

Kahden otoksen t-testi B

Yhdistetty varianssiestimaattori

• Määritellään ns. yhdistetty varianssiestimaattori

• Yhdistetty varianssiestimaattori on harhaton estimaattorivarianssiparametrille σ2, jos nollahypoteesi

pätee.

• Huomautus:

Yhdistetty varianssiestimaattori ei ole sama kuin yhdistetyn otoksen varianssi, koska otoskeskiarvot ja eivät (yleensä) ole yhtä suuria.

2 2

2 1 1 2 2

1 2

( 1) ( 1)

P 2

n s n s

s n n

− + −

= + −

2

sP

2

sP

X1 X2

0 1 2

H :µ=µ =µ

(13)

TKK (c) Ilkka Mellin (2004) 73

Kahden otoksen t-testi B

Testisuure ja sen jakauma

• Määritellään t-testisuure

Jos nollahypoteesi

pätee, niin testisuure tnoudattaa Studentin t-jakaumaa vapausastein (n1+ n2−2):

1 2

1 2

1 1

P

X X

t

s n n

= − +

1 2

( 2)

t t n∼ +n

0 1 2

H :µ =µ =µ

TKK (c) Ilkka Mellin (2004) 74

Kahden otoksen t-testi B

Testisuureen jakauma nollahypoteesin H0pätiessä:

Perustelu 1/3

Oletetaan, että testin yleinen hypoteesi H ja nollahypoteesi H0pätevät:

Tällöin (ks. lukua Otos ja otosjakaumat)

Koska , niin

2

1 2

1 2

1 1

N 0,

X X

n n

σ

+

1 2

11 21 1 12 22 2

2

1 1

2

2 2

, , , , , , ,

N( , ) , 1,2, , N( , ) , 1,2, ,

n n

i

j

X X X X X X

X i n

X j n

µ σ µ σ

=

=

1

2

2

1 1

1

1 1

2

2 2

1

2 2

1 N ,

1 N ,

n i i

n j j

X X

n n

X X

n n

µσ

µσ

=

=

=

=

1 2

XX

TKK (c) Ilkka Mellin (2004) 75

Kahden otoksen t-testi B

Testisuureen jakauma nollahypoteesin H0pätiessä:

Perustelu 2/3

Edellä esitetystä seuraa, että

Koska standardipoikkeama σon tuntematon, satunnaismuuttujan z lauseke on epäoperationaalinen.

Määritellään otosvarianssit

1 2

1 2

N(0,1)

1 1

X X

z

n n

σ

= +

2 2

1

1 ( ) , 1,2

1

nk

k ik k

k i

s X X k

n =

= =

TKK (c) Ilkka Mellin (2004) 76

Kahden otoksen t-testi B

Testisuureen jakauma nollahypoteesin H0pätiessä:

Perustelu 3/3

Jos satunnaismuuttujan zlausekkeessa standardipoikkeama σ korvataan otossuureella

saadaan t-testisuure

joka nollahypoteesinH0pätiessä noudattaa Studentin t-jakaumaa vapausastein (n1+ n22):

tt(n1+ n22)

Todistus sivuutetaan.

1 2

1 2

1 1

P

X X

t

s n n

= +

2 2

1 1 2 2

1 2

( 1) ( 1)

P 2

n s n s

s n n

+

= +

TKK (c) Ilkka Mellin (2004) 77

Kahden otoksen t-testi B

t-testisuure mittaa tilastollista etäisyyttä

• Testisuure

mittaa otoksien 1 ja 2 aritmeettisten keskiarvojen tilastollista etäisyyttä.

Mittayksikkönäon erotuksen standardipoikkeaman

estimaattori, jota määrättäessä on oletettu, että nolla- hypoteesi H0pätee.

1 2

1 1

n n

σ +

1 2

1 2

1 1

P

X X

t

s n n

= − +

1 2

XX

TKK (c) Ilkka Mellin (2004) 78

Kahden otoksen t-testi B

Testi

• Testisuureen

normaaliarvo= 0, koskanollahypoteesin pätiessä

E(t) = 0

• Siten itseisarvoltaan suurettestisuureen tarvot viittaavat siihen, ettänollahypoteesiH0ei päde.

NollahypoteesiH0hylätään, jos testin p-arvo on kyllin pieni.

1 2

1 2

1 1

P

X X

t

s n n

= − +

0 1 2

H :µ =µ =µ

Viittaukset

LIITTYVÄT TIEDOSTOT

Ensimmäisen lajin virhe Havainnot Hylkäysalue Hylkäysvirhe Hypoteesi Hyväksymisalue Hyväksymisvirhe Maailman tila Nollahypoteesi Parametri Testi Testin tulos Testisuure Toisen

• Jos havainnot ovat normaalijakautuneita, Mannin ja Whitneyn testi ei ole yhtä voimakas kuin kahden riippumattoman otoksen t-testi. • Jos havainnot eivät ole

Testit olivat aktiivinen niskan kierto, eteen- ja taaksetaivutus ja niihin yhdistet- ty passiivinen loppuvenytys, foraminakompressiotesti, yläraajan tensiotesti ja kaularangan

Käytössä olevat testit testaavat jotakin yleisesti hyväksyttyä päätepistettä ja tämän tiedon sivutuotteena voidaan tehdä johtopäätöksiä aineen hormonitoimintaa

Myös siksi tavoitetarkastelu on merkittävää. Testit, staattiset analyysit ja katselmukset voivat tietyissä tapauksissa olla täysin riittäviä. Keskeisimpänä tavoitteena

Mitkä standardit ja testit ovat mahdollisia tuotteen laatua arvioitaessa, esimerkiksi visuaalinen, valin läpäisy, halkeilu ja niin

Mitkä standardit ja testit ovat mahdollisia tuotteen laatua arvioitaessa, esimerkiksi visuaalinen, valin läpäisy, halkeilu ja niin

Mutta jos suomen sanojen pituus ei olisikaan jakautunut normaalisti, emme voisi käyttää lineaarista korrelaatiota vaan meidän olisi käytettävä