TKK (c) Ilkka Mellin (2004) 1
Johdatus tilastotieteeseen
Tilastolliset testit
TKK (c) Ilkka Mellin (2004) 2
Tilastollinen testaus Tilastolliset hypoteesit Tilastolliset testit ja testisuureet Virheet testauksessa
Merkitsevyystaso ja testin hylkäysalue Testin p-arvo
Testin suorittaminen
Esimerkki: Normaalijakauman parametrien testaaminen Tilastolliset testit ja mitta-asteikot
Tilastolliset testit
TKK (c) Ilkka Mellin (2004) 3
Tilastolliset testit:
Mitä opimme? – 1/5
• Tilastollisessa tutkimuksessa tutkimuksen kohteena olevasta perusjoukosta esitetään tavallisesti väitteitätai oletuksia, joiden pätevyyttä halutaan testata.
• Tilastollinen testaustarkoittaa perusjoukosta esitettyjen väitteiden tai oletuksien asettamista koetteelle havainnoista saatavaa informaatiota vastaan.
• Tilastollisessa testauksessa testattavat väitteet tai oletukset on puettava tutkimuksen kohteena olevan perusjoukon ominaisuuden vaihtelua perusjoukossa kuvaavaa todennäköisyysjakaumaatai sen parametrejakoskeviksi hypoteeseiksi.
TKK (c) Ilkka Mellin (2004) 4
Tilastolliset testit:
Mitä opimme? – 2/5
• Testausasetelma kiinnitetääntekemällä seuraavat kolme oletusta:
(i) Testausasetelmaa koskevia yleisiä oletuksiakutsutaan testin yleiseksi hypoteesiksi.
(ii) Testattavaa väitettätai oletustakutsutaan testin nollahypoteesiksi.
(iii) Jos nollahypoteesi hylätään testissä, astuu voimaan vaihtoehtoinen hypoteesi.
• Tilastollinen testion päätössääntö, joka kertoo jokaisessa yksittäisessä testaustilanteessa (jokaiselle otokselle), onko nollahypoteesi hylättävä vai ei.
TKK (c) Ilkka Mellin (2004) 5
Tilastolliset testit:
Mitä opimme? – 3/5
• Tilastollisen testin suoritus perustuu testisuureeseen, joka mittaa nollahypoteesin ja havaintojen yhteensopivuutta.
• Testisuureen normaaliarvoon sen odotusarvo nollahypoteesin pätiessä.
• Jos testisuureen arvo on lähellänormaaliarvoaan, katsotaan, että nollahypoteesi ja havainnot ovat sopusoinnussaja nollahypoteesi jätetään voimaan.
• Jos testisuureen arvo on kaukananormaaliarvostaan, katsotaan, että nollahypoteesi ja havainnot eivät ole sopusoinnussaja nollahypoteesi hylätään.
• Testi jakaa testisuureen mahdollisten arvojen alueen hylkäys- alueeseenja hyväksymisalueeseen.
TKK (c) Ilkka Mellin (2004) 6
Tilastolliset testit:
Mitä opimme? – 4/5
• Jos nollahypoteesi hylätään virheellisesti, tehdään 1. lajin virheeli hylkäysvirhe.
• Jos nollahypoteesi jätetään voimaan virheellisesti, tehdään 2. lajin virheeli hyväksymisvirhe.
• Koska hylkäysvirheen todennäköisyys halutaan tehdä mahdollisimman pieneksi, havainnoilta vaaditaan vahvoja todisteitanollahypoteesia vastaan ennen sen hylkäämistä.
• Testin merkitsevyystasoon todennäköisyys, että testisuure saa nollahypoteesin pätiessäarvoja testin hylkäysalueelta.
• Testin hylkäysalue voidaan määrätä kiinnittämällä testin merkitsevyystaso etukäteen, ennen testin tekemistä.
TKK (c) Ilkka Mellin (2004) 7
Tilastolliset testit:
Mitä opimme? – 5/5
• Testin p-arvoon pienin merkitsevyystaso, jolla nollahypoteesi voidaan hylätä, kun testisuure on saanut sen arvon, jonka se on havainnoista laskettuna saanut.
• Testin p-arvo on todennäköisyys sille, että testisuure saa sen arvon, jonka se on havainnoista on saanut tai testisuureen normaaliarvoon verrattuna vielä poikkeuksellisempia arvoja, kun nollahypoteesi pätee.
• Testit voidaan jakaa ryhmiin tarkasteltavan muuttujan mitta- asteikollisten ominaisuuksienmukaan:
– Testit suhde- (tai välimatka-) asteikollisille muuttujille – Testit järjestysasteikollisille muuttujille
– Testit laatueroasteikollisille muuttujille
TKK (c) Ilkka Mellin (2004) 8
Tilastolliset testit:
Esitiedot
• Esitiedot: ks. seuraavia lukuja:
Tilastollisten aineistojen kerääminen ja mittaaminen Tilastollisten aineistojen kuvaaminen
Otos ja otosjakaumat Estimointi Estimointimenetelmät Väliestimointi
Satunnaismuuttujat ja todennäköisyysjakaumat Jakaumien tunnusluvut
Jatkuvia jakaumia
Normaalijakaumasta johdettuja jakaumia
TKK (c) Ilkka Mellin (2004) 9
Tilastolliset testit:
Lisätiedot
• Suhdeasteikollisten muuttujientestejä käsitellään luvussa Testit suhdeasteikollisille muuttujille
• Järjestysasteikollisten muuttujientestejä käsitellään luvussa Testit järjestysasteikollisille muuttujille
• Laatueroasteikollisten muuttujientestejä käsitellään luvussa Testit laatueroasteikollisille muuttujille
• Jakaumaoletuksien testaamistakäsitellään luvussa
Yhteensopivuuden, homogeenisuuden ja riippumattomuuden testaaminen
TKK (c) Ilkka Mellin (2004) 10
>> Tilastollinen testaus Tilastolliset hypoteesit Tilastolliset testit ja testisuureet Virheet testauksessa
Merkitsevyystaso ja testin hylkäysalue Testin p-arvo
Testin suorittaminen
Esimerkki: Normaalijakauman parametrien testaaminen Tilastolliset testit ja mitta-asteikot
Tilastolliset testit
TKK (c) Ilkka Mellin (2004) 11
Avainsanat Havainnot Hypoteesi Otos Parametri Perusjoukko Testi Testisuure
Tilastollisten hypoteesien testaus Todennäköisyysjakauma Yksinkertainen satunnaisotos
Tilastollinen testaus
TKK (c) Ilkka Mellin (2004) 12
Tilastollinen testaus
Tilastollisten hypoteesien testaaminen 1/5
• Lähtökohta:
Tutkimuksen kohteena olevasta perusjoukosta on esitetty jokin väite tai oletus.
• Kysymys:
Miten esitettyä väitettä tai oletusta voidaan testata?
• Vastaus:
Väitettä tai oletusta voidaan testata tilastollisesti,
jos väite tai oletus voidaan pukea tutkimuksen
kohteena olevan perusjoukon ominaisuuden
vaihtelua perusjoukossa kuvaavaa toden-
näköisyysjakaumaa tai sen parametreja
koskevaksi oletukseksi eli hypoteesiksi.
TKK (c) Ilkka Mellin (2004) 13
Tilastollinen testaus
Tilastollisten hypoteesien testaaminen 2/5
• Olkoon X tutkimuksen kohteena olevan perusjoukon jonkin ominaisuuden vaihtelua perusjoukossa kuvaava satunnaismuuttuja.
• Olkoon satunnaismuuttujan X todennäköisyysjakauman pistetodennäköisyys- tai tiheysfunktio
f(x ; θ )
jossa θ on funktion f muodon määräävä tuntematon parametri.
• Yksinkertaisissa testausasetelmissa kiinnostuksen kohteena on hypoteesi, jonka mukaan parametrilla θ on arvo θ
0.
TKK (c) Ilkka Mellin (2004) 14
Tilastollinen testaus
Tilastollisten hypoteesien testaaminen 3/5
• Miten todennäköisyysjakauman f(x ; θ ) parametria θ koskevaa hypoteesia
θ = θ
0voidaan testata tilastollisesti?
• Tilastollisessa testauksessa hypoteesi θ = θ
0asetetaan koetteelle havaintojen todennäköisyys- jakaumasta f(x ; θ ) sisältämää informaatiota vastaan.
TKK (c) Ilkka Mellin (2004) 15
Tilastollinen testaus
Tilastollisten hypoteesien testaaminen 4/5
• Oletamme jatkossa, että havainnot X
1, X
2, … , X
nmuodostavat yksinkertaisen satunnaisotoksen jakaumasta, jonka pistetodennäköisyys- tai tiheysfunktio on
f(x ; θ )
• Tällöin X
1, X
2, … , X
novat riippumattomia, identtisesti jakautuneita satunnaismuuttujia, joilla on sama piste- todennäköisyys- tai tiheysfunktio f(x ; θ ):
1
,
2, ,
( ; ) , 1,2, ,
n i
X X X
X f x θ i n
⊥
=
…
∼ …
TKK (c) Ilkka Mellin (2004) 16
Tilastollinen testaus
Tilastollisten hypoteesien testaaminen 5/5
• Testin suorittamista varten valitaan testisuure, joka mittaa satunnaismuuttujien
X
1, X
2, … , X
nhavaittujen arvojen x
1, x
2, … , x
nja hypoteesin θ = θ
0yhteensopivuutta.
• Hyvä yhteensopivuus merkitsee sitä, että havainnot ovat sopusoinnussa oletuksen θ = θ
0kanssa.
• Huono yhteensopivuus merkitsee sitä, että havainnot ja oletus θ = θ
0ovat ristiriidassa keskenään.
TKK (c) Ilkka Mellin (2004) 17
Tilastollinen testaus
>> Tilastolliset hypoteesit Tilastolliset testit ja testisuureet Virheet testauksessa
Merkitsevyystaso ja testin hylkäysalue Testin p-arvo
Testin suorittaminen
Esimerkki: Normaalijakauman parametrien testaaminen Tilastolliset testit ja mitta-asteikot
Tilastolliset testit
TKK (c) Ilkka Mellin (2004) 18
Avainsanat Havainnot Hypoteesi Otantamenetelmä Parametri Perusjoukko Testausasetelma Testi
Tilastolliset hypoteesit – Nollahypoteesi – Vaihtoehtoinen hypoteesi – Yleinen hypoteesi Todennäköisyysjakauma
Tilastolliset hypoteesit
TKK (c) Ilkka Mellin (2004) 19
Tilastolliset hypoteesit
Testausasetelmaa koskevat hypoteesit
• Kun todennäköisyysjakauman parametreja koskevia väitteitä tai oletuksia testataan tilastollisesti, testaus- asetelmasta on tehtävä asetelman kiinnittämiseksi seuraavat kolme oletusta:
(i) Testausasetelmaa koskevat perusoletukset, joista pidetään kiinni testauksen aikana muodostavat testin yleisen hypoteesin.
(ii) Testattavaa oletusta kutsutaan nollahypoteesiksi.
(iii) Vaihtoehtoinen hypoteesi on oletus, joka astuu voimaan, jos nollahypoteesi hylätään testissä.
TKK (c) Ilkka Mellin (2004) 20
Tilastolliset hypoteesit
Yleinen hypoteesi 1/2
• Yleiset testausasetelmaa koskevat oletukset muodostavat testin yleisen hypoteesin H.
• Yleinen hypoteesi H sisältää oletukset – perusjoukosta
– käytetystä otantamenetelmästä – perusjoukon jakaumasta
• Yleisen hypoteesin H oletuksista pidetään kiinni koko
testauksen ajan, mikä merkitsee sitä, että testi tehdäänaina ehdollisesti yleisen hypoteesin H oletusten suhteen.
TKK (c) Ilkka Mellin (2004) 21
Tilastolliset hypoteesit
Yleinen hypoteesi 2/2
• Huomaa, että yleisen hypoteesin sisältämiä
jakaumaoletuksia voidaan ja on tavallisesti myös syytä testata erikseen; ks. esimerkiksi lukua
Yhteensopivuuden, homogeenisuuden ja riippumattomuuden testaaminen.
TKK (c) Ilkka Mellin (2004) 22
Tilastolliset hypoteesit
Nollahypoteesi
• Sitä perusjoukon jakauman parametreja koskevaa väitettä tai oletusta, jota halutaan testata kutsutaan
nollahypoteesiksi.
• Nollahypoteesille käytetään tavallisesti merkintää H
0.
• Testissä nollahypoteesi H
0asetetaan koetteelle havaintojen perusjoukon jakaumasta sisältämää informaatiota vastaan.
• Nollahypoteesista H
0pidetään kiinni, elleivät havaintojen sisältämät todisteet nollahypoteesia vastaan ole kyllin voimakkaita.
TKK (c) Ilkka Mellin (2004) 23
Tilastolliset hypoteesit
Nollahypoteesin muoto yksinkertaisissa testausasetelmissa
• Olkoon f(x ; θ )
tutkimuksen kohteena olevaa perusjoukon ominaisuutta kuvaavan todennäköisyysjakauman pistetodennäköisyys- tai tiheysfunktio.
• Yksinkertaisissa testausasetelmissa nollahypoteesi on muotoa
H
0: θ = θ
0• Huomautus:
Nollahypoteesit ovat yksinkertaisissa testausasetelmissa muotoa
”on sama” tai muotoa ”ei ole eroa”.
TKK (c) Ilkka Mellin (2004) 24
Tilastolliset hypoteesit
Vaihtoehtoinen hypoteesi
• Vaihtoehtoinen hypoteesi H
1on oletus, joka astuu voimaan, jos nollahypoteesi H
0hylätään.
• Vaihtoehtoinen hypoteesi voidaan tavallisesti muotoilla usealla eri tavalla.
• Huomautuksia:
– Jos nollahypoteesi on muotoa ”on sama” tai ”ei ole eroa”, vaihtoehtoinen hypoteesi on tavallisesti muotoa ”ei ole sama” tai ”on eroa”.
– Tilastollista testiä tehtäessä toivotaan usein, että nollahypoteesi voidaan hylätäja vaihtoehtoinen hypoteesi hyväksyä.
– Vaihtoehtoisen hypoteesin hyväksyminenmerkitsee yleensä informaation lisääntymistä.
TKK (c) Ilkka Mellin (2004) 25
Tilastolliset hypoteesit
Vaihtoehtoisen hypoteesin muoto yksinkertaisissa testausasetelmissa 1/2
• Jos nollahypoteesi on yksinkertaista muotoa H
0: θ = θ
0vaihtoehtoinen hypoteesi voidaan muotoilla kolmella eri tavalla.
• Huomautus:
Vaihtoehtoisen hypoteesin muoto vaikuttaa tavallisesti siihen tapaan, jolla testi suoritetaan.
TKK (c) Ilkka Mellin (2004) 26
Tilastolliset hypoteesit
Vaihtoehtoisen hypoteesin muoto yksinkertaisissa testausasetelmissa 2/2
• Jos vaihtoehtoinen hypoteesi on muotoa H
1: θ > θ
0tai muotoa H
1: θ < θ
0vaihtoehtoista hypoteesia kutsutaan yksisuuntaiseksi.
• Jos vaihtoehtoinen hypoteesi on muotoa H
1: θ
≠θ
0vaihtoehtoista hypoteesia kutsutaan kaksisuuntaiseksi.
TKK (c) Ilkka Mellin (2004) 27
Tilastollinen testaus Tilastolliset hypoteesit
>> Tilastolliset testit ja testisuureet Virheet testauksessa
Merkitsevyystaso ja testin hylkäysalue Testin p-arvo
Testin suorittaminen
Esimerkki: Normaalijakauman parametrien testaaminen Tilastolliset testit ja mitta-asteikot
Tilastolliset testit
TKK (c) Ilkka Mellin (2004) 28
Avainsanat Havainnot Hypoteesi Nollahypoteesi Otos Päätössääntö Testi Testisuure
Testisuureen normaaliarvo
Tilastolliset testit ja testisuureet
TKK (c) Ilkka Mellin (2004) 29
Tilastolliset testit ja testisuureet
Tilastollinen testi päätössääntönä
• Tilastollinen testi on päätössääntö, joka kertoo jokaisessa yksittäisessä testaustilanteessa eli jokaiselle otokselle, onko nollahypoteesi H
0hylättävä vai ei.
TKK (c) Ilkka Mellin (2004) 30
Tilastolliset testit ja testisuureet
Testisuure
• Tilastollinen testi perustetaan testisuureeseen, joka mittaa havaintojen ja nollahypoteesin H
0yhteensopivuutta.
• Testisuure on satunnaismuuttuja, jonka arvo riippuu havainnoista ja nollahypoteesista H
0.
• Havaintojen ja nollahypoteesin H
0yhteensopivuuden mittaaminen tarkoittaa sitä, että tutkitaan kuinka toden- näköistä on saada sellaisia testisuureen arvoja kuin on saatu.
• Siten yhteensopivuuden mittaaminen vaatii testisuureen
jakauman tuntemista.
TKK (c) Ilkka Mellin (2004) 31
Tilastolliset testit ja testisuureet
Testisuure ja testi päätössääntönä
• Jos havaintojen ja nollahypoteesin H
0yhteensopivuus on testisuureella mitattuna hyvä, nollahypoteesi H
0jätetään voimaan.
• Jos havaintojen ja nollahypoteesin H
0yhteensopivuus on testisuureella mitattuna huono, nollahypoteesi H
0hylätään ja vaihtoehtoinen hypoteesi H
1hyväksytään.
TKK (c) Ilkka Mellin (2004) 32
Tilastolliset testit ja testisuureet
Testisuureen normaaliarvo
• Testisuureen odotusarvoa nollahypoteesin H
0pätiessä kutsutaan testisuureen normaaliarvoksi.
• Jos testisuureen havaittu arvo on lähellä testisuureen normaaliarvoa, havainnot ovat sopusoinnussa nolla- hypoteesin H
0kanssa.
• Jos testisuureen otoksesta määrätty arvo poikkeaa merkitsevästi testisuureen normaaliarvosta, havainnot sisältävät todisteita nollahypoteesia H
0vastaan.
TKK (c) Ilkka Mellin (2004) 33
Tilastollinen testaus Tilastolliset hypoteesit Tilastolliset testit ja testisuureet
>> Virheet testauksessa
Merkitsevyystaso ja testin hylkäysalue Testin p-arvo
Testin suorittaminen
Esimerkki: Normaalijakauman parametrien testaaminen Tilastolliset testit ja mitta-asteikot
Tilastolliset testit
TKK (c) Ilkka Mellin (2004) 34
Avainsanat
Ensimmäisen lajin virhe Havainnot Hylkäysalue Hylkäysvirhe Hypoteesi Hyväksymisalue Hyväksymisvirhe Maailman tila Nollahypoteesi Parametri Testi Testin tulos Testisuure Toisen lajin virhe Voimakkuus
Virheet testauksessa
TKK (c) Ilkka Mellin (2004) 35
Virheet testauksessa
Hylkäysvirhe ja sen todennäköisyys 1/2
• Jos nollahypoteesi H
0hylätään silloin, kun se on tosi, tehdään hylkäysvirhe.
• Hylkäysvirheen todennäköisyys α on ehdollinen toden- näköisyys
Pr(H
0hylätäänH
0on tosi) = α
• Hylkäysvirheen todennäköisyyden α komplementti- todennäköisyys
Pr(H
0hyväksytäänH
0on tosi) = 1 – α
on todennäköisyys hyväksyä nollahypoteesi silloin, kun se on tosi.
TKK (c) Ilkka Mellin (2004) 36
Virheet testauksessa
Hylkäysvirhe ja sen todennäköisyys 2/2
• Tilastollisessa tutkimuksessa noudatetaan tieteen yleistä varovaisuusperiaatetta:
Hypoteeseja ei pidä hylätä ilman riittäviä syitä.
• Siksi nollahypoteesin H
0virheellisen hylkäyksen todennäköisyys halutaan tehdä tilastollisessa testauksessa mahdollisimman pieneksi.
• Jotta hylkäysvirheen todennäköisyys saataisiin
mahdollisimman pieneksi, havainnoilta vaaditaan vahvoja
todisteita nollahypoteesia H
0vastaan ennen kuin se
suostutaan hylkäämään.
TKK (c) Ilkka Mellin (2004) 37
Virheet testauksessa
Hyväksymisvirhe ja sen todennäköisyys
• Jos nollahypoteesi H
0jätetään voimaan silloin, kun se ei ole tosi, tehdään hyväksymisvirhe.
• Hyväksymisvirheen todennäköisyys β on ehdollinen toden- näköisyys
Pr(H
0jätetään voimaanH
0ei ole tosi) = β
• Huomautus:
Hylkäysvirheen todennäköisyys αja hyväksymisvirheen todennäköisyys βeivät oletoistensa komplementti- todennäköisyyksiä.
TKK (c) Ilkka Mellin (2004) 38
Virheet testauksessa
Testin voimakkuus
• Hyväksymisvirheen todennäköisyyden β komplementti- todennäköisyyttä
Pr(H
0hylätäänH
0ei ole tosi) = 1 − β kutsutaan testin voimakkuudeksi.
• Hyvä testi on voimakas, koska voimakkaalla testillä on pieni hyväksymisvirheen todennäköisyys β .
• Testin voimakkuus (1 − β ) riippuu tavallisesti mm.
testattavan parametrin todellisesta arvosta.
• Testin voimakkuutta testattavan parametrin arvojen funktiona kutsutaan voimakkuusfunktioksi; esimerkki:
ks. kappaletta
Yhden otoksen t-testiluvussa
Testit suhde- asteikollisille muuttujille.
TKK (c) Ilkka Mellin (2004) 39
Virheet testauksessa
Ensimmäisen ja toisen lajin virheet
• Koska testiä tehtäessä pyritään ensisijaisesti varomaan sitä, että nollahypoteesi H
0hylätään silloin, kun se on tosi, hylkäysvirhettä kutsutaan usein ensimmäisen lajin virheeksi.
• Tällöin hyväksymisvirhettä eli sitä, että nollahypoteesi H
0hyväksytään silloin, kun se ei ole tosi, kutsutaan toisen lajin virheeksi.
TKK (c) Ilkka Mellin (2004) 40
Virheet testauksessa
Maailman tila ja testin tulos
• Maailman tilat ja testin tulokset voidaan luokitella seuraavaksi nelikentäksi:
Maailman tila Nollahypoteesi
pätee Nollahypoteesi ei päde Nollahypoteesi
jää voimaan Oikea
johtopäätös Hyväksymis- virhe Testin
tulos Nollahypoteesi
hylätään Hylkäysvirhe Oikea johtopäätös
TKK (c) Ilkka Mellin (2004) 41
Virheet testauksessa
Testin hylkäys- ja hyväksymisalueet ja testi päätössääntönä
• Kun testi formuloidaan päätössääntönä, testiä varten konstruoidun testisuureen mahdollisten arvojen joukko jaetaan kahteen osaan, hylkäysalueeseen ja hyväksymis- alueeseen:
(i) Jos testisuureen havainnoista määrätty arvo joutuu hylkäysalueelle, nollahypoteesi H
0hylätään.
(ii) Jos testisuureen havainnoista määrätty arvo joutuu hyväksymisalueelle, nollahypoteesi H
0jätetään voimaan.
• Huomautus:
Jako hylkäys- ja hyväksymisalueisiin ei saa riippua havainnoista.
TKK (c) Ilkka Mellin (2004) 42
Tilastollinen testaus Tilastolliset hypoteesit Tilastolliset testit ja testisuureet Virheet testauksessa
>> Merkitsevyystaso ja testin hylkäysalue Testin p-arvo
Testin suorittaminen
Esimerkki: Normaalijakauman parametrien testaaminen Tilastolliset testit ja mitta-asteikot
Tilastolliset testit
TKK (c) Ilkka Mellin (2004) 43
Avainsanat Frekvenssitulkinta Hylkäysalue Hylkäysvirhe Hypoteesi
Kaksisuuntainen vaihtoehto Merkitsevyys
Merkitsevyystaso Nollahypoteesi Otos Perusjoukko Testi Testisuure
Vaihtoehtoinen hypoteesi Yksisuuntainen vaihtoehto
Merkitsevyystaso ja testin hylkäysalue
TKK (c) Ilkka Mellin (2004) 44
Merkitsevyystaso ja testin hylkäysalue
Merkitsevyystaso
• Testin merkitsevyystaso α on todennäköisyys sille, että testisuureen havainnoista määrätty arvo joutuu hylkäys- alueelle, jos nollahypoteesi H
0pätee.
• Jos testisuureen havainnoista määrätty arvo joutuu nolla- hypoteesin H
0pätiessä hylkäysalueelle, nollahypoteesi H
0hylätään virheellisesti ja seurauksena on hylkäysvirhe, jonka todennäköisyys on α .
• Testin hylkäysalue voidaan määrätä kiinnittämällä testissä käytettävä merkitsevyystaso α etukäteen (ennen havaintojen keräämistä).
TKK (c) Ilkka Mellin (2004) 45
Merkitsevyystaso ja testin hylkäysalue
Merkitsevyystason frekvenssitulkinta
• Oletetaan, että nollahypoteesi H
0pätee testausasetelmassa.
• Valitaan testin merkitsevyystasoksi α .
• Toistetaan otantaa ja sovelletaan jokaiseen otokseen samaa testiä.
• Tällöin joudumme virheellisesti hylkäämään nollahypoteesin H
0keskimäärin
α %:ssa
otoksia, vaikka nollahypoteesi H
0pätee.
TKK (c) Ilkka Mellin (2004) 46
Merkitsevyystaso ja testin hylkäysalue
Merkitsevyystason valinta:
Tavanomaiset merkitsevyystasot 1/2
• Koska testeissä halutaan ensisijaisesti suojautua hylkäysvirhettä vastaan, testin merkitsevyystasoksi α on tapana valita pieniä lukuja.
• Ns. tavanomaiset merkitsevyystasot ovat α = 0.05
α = 0.01 α = 0.001
• Testin merkitsevyystasoa α valittaessa on aina syytä ottaa huomioon väärän päätöksen seuraukset.
TKK (c) Ilkka Mellin (2004) 47
Merkitsevyystaso ja testin hylkäysalue
Merkitsevyystason valinta:
Tavanomaiset merkitsevyystasot 2/2
• Jos nollahypoteesi H
0voidaan hylätä merkitsevyystasolla α = 0.05, sanotaan:
Testin tulos on melkein merkitsevä.
• Jos nollahypoteesi H
0voidaan hylätä merkitsevyystasolla α = 0.01, sanotaan:
Testin tulos on merkitsevä.
• Jos nollahypoteesi H
0voidaan hylätä merkitsevyystasolla α = 0.001, sanotaan:
Testin tulos on erittäin merkitsevä.
TKK (c) Ilkka Mellin (2004) 48
Merkitsevyystaso ja testin hylkäysalue
Testin hylkäysalueen määrääminen yksinkertaisissa testausasetelmissa 1/5
• Testin hylkäysalue riippuu yksinkertaisissa testausasetelmissa
– paitsi valitusta merkitsevyystasosta α – myös vaihtoehtoisen hypoteesin muodosta.
• Olkoon parametria θ koskeva nollahypoteesi yksinkertaista muotoa
H
0: θ = θ
0• Olkoon testisuureena (jatkuva) satunnaismuuttuja Z ja oletetaan, että sen mahdolliset arvot kuuluvat väliin (a, b), jossa voi olla a = −∞ tai b = +∞.
• Valitaan testin merkitsevyystasoksi α .
TKK (c) Ilkka Mellin (2004) 49
Merkitsevyystaso ja testin hylkäysalue
Testin hylkäysalueen määrääminen yksinkertaisissa testausasetelmissa 2/5
• Jos vaihtoehtoisena hypoteesina on yksi- suuntainen vaihtoehto
H
1: θ > θ
0hylkäysalueeksi voidaan tavallisesti valita väli
(u, b)
jossa kriittinen raja u määrätään siten, että
Pr(Z
≥u | H
0) = α
u α 1−α
Hylkäysalue Hyväksymisalue Testisuureen tiheysfunktio
TKK (c) Ilkka Mellin (2004) 50
Merkitsevyystaso ja testin hylkäysalue
Testin hylkäysalueen määrääminen yksinkertaisissa testausasetelmissa 3/5
• Jos vaihtoehtoisena hypoteesina on yksi- suuntainen vaihtoehto
H
1: θ < θ
0hylkäysalueeksi voidaan tavallisesti valita väli
(a, l)
jossa kriittinen raja l määrätään siten, että
Pr(Z
≤l | H
0) = α
1−α l α
Hylkäysalue Hyväksymisalue Testisuureen tiheysfunktio
TKK (c) Ilkka Mellin (2004) 51
Merkitsevyystaso ja testin hylkäysalue
Testin hylkäysalueen määrääminen yksinkertaisissa testausasetelmissa 4/5
• Jos vaihtoehtoisena hypoteesina on kaksi- suuntainen vaihtoehto
H
1: θ
≠θ
0hylkäysalueeksi voidaan tavallisesti valita joukko
(a, l)∪(u, b)
jossa kriittiset rajat l ja u määrätään siten, että
Pr(Z
≥u | H
0)
= Pr(Z
≤l | H
0)
= α /2
1−α
α/2 α/2
Hylkäysalue Hylkäysalue Hyväksymisalue
Testisuureen tiheysfunktio
l u
TKK (c) Ilkka Mellin (2004) 52
Merkitsevyystaso ja testin hylkäysalue
Testin hylkäysalueen määrääminen yksinkertaisissa testausasetelmissa 5/5
• Oletetaan, että testisuureen Z jakauma on symmetrinen origon suhteen.
• Tällöin kalvoilla 2/5-4/5 esitetyille kriittisille rajoille pätee tavallisesti:
l = −u
• Huomautus:
Kalvojen 2/5-4/5 todennäköisyydet ovat ehdollisia toden- näköisyyksiä, joissa ehtotapahtumana on se, että nollahypoteesi H0pätee.
Siten todennäköisyydet määrätään testisuureen Zjakaumasta, kun jakaumaa määrättäessä on oletettu, että nollahypoteesiH0 pätee.
TKK (c) Ilkka Mellin (2004) 53
Tilastollinen testaus Tilastolliset hypoteesit Tilastolliset testit ja testisuureet Virheet testauksessa
Merkitsevyystaso ja testin hylkäysalue
>> Testin p-arvo Testin suorittaminen
Esimerkki: Normaalijakauman parametrien testaaminen Tilastolliset testit ja mitta-asteikot
Tilastolliset testit
TKK (c) Ilkka Mellin (2004) 54
Avainsanat Frekvenssitulkinta Hypoteesi
Kaksisuuntainen vaihtoehto Merkitsevyystaso Nollahypoteesi Otos p-arvo Perusjoukko Testi Testisuure
Testisuureen normaaliarvo Vaihtoehtoinen hypoteesi Yksisuuntainen vaihtoehto
Testin p-arvo
TKK (c) Ilkka Mellin (2004) 55
Testin p-arvo
p-arvo ja merkitsevyystasot
• Nollahypoteesin hylkääminen voidaan perustaa etukäteen valitun merkitsevyystason ja sitä vastaavan hylkäysalueen määräämisen sijasta testin p-arvoon.
• Testin
p-arvo on pienin merkitsevyystaso, jolla nolla-hypoteesi H
0voidaan hylätä.
• Tilastolliset ohjelmistot tulostavat nykyään lähes aina sovellettavien testien p-arvot ja siksi p-arvojen käyttö on lähes kokonaan syrjäyttänyt etukäteen valittujen kiinteiden merkitsevyystasojen käytön.
TKK (c) Ilkka Mellin (2004) 56
Testin p-arvo
p-arvo 1/2
• Testin p-arvo määrätään seuraavalla tavalla:
(i) Lasketaan valitun testisuureen arvo havainnoista.
(ii) Määrätään
– olettaen, että nollahypoteesi H
0pätee – todennäköisyys sille, että testisuure saa
(normaaliarvoonsa verrattuna) niin poikkeuksellisen arvon kuin se on saanut tai vielä poikkeuksellisempia arvoja.
TKK (c) Ilkka Mellin (2004) 57
Testin p-arvo
p-arvo 2/2
• Jos testin p-arvoksi saadaan pieni luku, testisuure on saanut arvon, joka kuuluu – jos nollahypoteesi H
0pätee – epätodennäköisten testisuureen arvojen joukkoon.
• Siten nollahypoteesi voidaan hylätä, jos testin p-arvo on kyllin pieni.
• Mitä pienempi on testin p-arvo, sitä vahvempia todisteita havainnot sisältävät nollahypoteesia H
0vastaan.
• Huomautus:
Testin p-arvo määrätään testisuureen Z jakaumasta, kun jakauma on määrättyolettaen, että nollahypoteesiH0pätee.
TKK (c) Ilkka Mellin (2004) 58
Testin p-arvo
p-arvon frekvenssitulkinta
• Oletetaan, että testausasetelma on sellainen, että yleisen hypoteesin H lisäksi myös nollahypoteesi H
0pätee.
• Toistetaan otantaa ja sovelletaan jokaiseen otokseen samaa testiä.
• Tällöin havaitsemme keskimäärin
p%:ssa
poimittuja otoksia havaittua testisuureen arvoa poikkeavamman testisuureen arvon.
TKK (c) Ilkka Mellin (2004) 59
Testin p-arvo
p-arvo ja testi päätössääntönä
• Tilastollinen testi eli päätössääntö, joka kertoo jokaisessa yksittäisessä tilanteessa eli jokaiselle otokselle, onko nollahypoteesi H
0hylättävä vai ei, voidaan perustaa seuraavalla tavalla testin p-arvoon:
(i) Valitaan pieni todennäköisyys p
0. (ii) Määrätään testin p-arvo.
Jos p < p
0, hylätään nollahypoteesi H
0ja hyväksytään vaihtoehtoinen hypoteesi H
1.
Jos p
≥p
0, jätetään nollahypoteesi H
0voimaan.
• Todennäköisyyttä p
0valittaessa on syytä ottaa huomioon väärän päätöksen seuraukset.
TKK (c) Ilkka Mellin (2004) 60
Testin p-arvo
p-arvon määrääminen yksinkertaisissa
testausasetelmissa 1/5
• Testin p-arvo riippuu yksinkertaisissa testausasetelmissa vaihtoehtoisen hypoteesin muodosta.
• Olkoon parametria θ koskeva nollahypoteesi yksinkertaista muotoa
H
0: θ = θ
0• Oletetaan yksinkertaisuuden vuoksi, että testisuureen jakauma on symmetrinen origon suhteen.
• Olkoon testisuureen Z havainnoista määrätty arvo z.
TKK (c) Ilkka Mellin (2004) 61
Testin p-arvo
p-arvon määrääminen yksinkertaisissa
testausasetelmissa 2/5
• Olkoon testisuureen Z havainnoista määrätty arvo z.
• Jos vaihtoehtoisena hypoteesina on yksi- suuntainen vaihtoehto
H
1: θ > θ
0niin testin p-arvo on p = Pr(Z
≥z | H
0)
Testisuureen tiheysfunktio
p 1−p
0 z
TKK (c) Ilkka Mellin (2004) 62
Testin p-arvo
p-arvon määrääminen yksinkertaisissa
testausasetelmissa 3/5
• Olkoon testisuureen Z havainnoista määrätty arvo z.
• Jos vaihtoehtoisena hypoteesina on yksi- suuntainen vaihtoehto
H
1: θ < θ
0niin testin p-arvo on p = Pr(Z
≤z | H
0)
Testisuureen tiheysfunktio
z 1−p p
0
TKK (c) Ilkka Mellin (2004) 63
Testin p-arvo
p-arvon määrääminen yksinkertaisissa
testausasetelmissa 4/5
• Olkoon testisuureen Z havainnoista määrätty arvo z.
• Jos vaihtoehtoisena hypoteesina on kaksi- suuntainen vaihtoehto
H
1: θ
≠θ
0niin testin p-arvo on
p = 2×Pr(Z
≥|z| | H
0)
Testisuureen tiheysfunktio
1−2×p p p
−|z| 0 +|z|
TKK (c) Ilkka Mellin (2004) 64
Testin p-arvo
p-arvon määrääminen yksinkertaisissa
testausasetelmissa 5/5
• Huomautus:
Kalvojen 2/5-4/5 todennäköisyydet ovat ehdollisia toden- näköisyyksiä, joissa ehtotapahtumana on se, että nollahypoteesi H0pätee.
Siten todennäköisyydet määrätään testisuureen Zjakaumasta, kun jakaumaa määrättäessä on oletettu, että nollahypoteesiH0 pätee.
TKK (c) Ilkka Mellin (2004) 65
Tilastollinen testaus Tilastolliset hypoteesit Tilastolliset testit ja testisuureet Virheet testauksessa
Merkitsevyystaso ja testin hylkäysalue Testin p-arvo
>> Testin suorittaminen
Esimerkki: Normaalijakauman parametrien testaaminen Tilastolliset testit ja mitta-asteikot
Tilastolliset testit
TKK (c) Ilkka Mellin (2004) 66
Avainsanat Hylkäysalue Hypoteesi Hyväksymisalue Merkitsevyystaso Nollahypoteesi Otos p-arvo Testi Testisuure
Vaihtoehtoinen hypoteesi Yleinen hypoteesi
Testin suorittaminen
TKK (c) Ilkka Mellin (2004) 67
Testin suorittaminen
Testin suorittaminen merkitsevyystason valintaan perustuvassa testausmenettelyssä 1/3
• Jos testi perustetaan merkitsevyystason valintaan, testin suorittamisessa on seuraavat vaiheet:
(1) Asetetaan testin hypoteesit:
– Yleinen hypoteesi H
– Testauksen kohteena oleva nollahypoteesi H
0– Vaihtoehtoinen hypoteesi H
1(2) Valitaan testiä varten testisuure.
– Testisuureen tehtävänä on mitata havaintojen ja nollahypoteesin H
0yhteensopivuutta.
TKK (c) Ilkka Mellin (2004) 68
Testin suorittaminen
Testin suorittaminen merkitsevyystason valintaan perustuvassa testausmenettelyssä 2/3
(3) Valitaan merkitsevyystaso α ja konstruoidaan sitä vastaava hylkäysalue testille.
(4) Poimitaan otos niin, että yleisen hypoteesin H oletukset pätevät.
– Jos havaintojen sisältämät todisteet nolla- hypoteesia H
0vastaan ovat testisuureella mitattuna kyllin vahvoja, nollahypoteesi H
0hylätään ja vaihtoehtoinen hypoteesi H
1hyväksytään.
(5) Määrätään valitun testisuureen arvo havainnoista.
TKK (c) Ilkka Mellin (2004) 69
Testin suorittaminen
Testin suorittaminen merkitsevyystason valintaan perustuvassa testausmenettelyssä 3/3
(6) Tehdään päätös nollahypoteesin hylkäämisestä.
– Jos testisuureen arvo joutuu hylkäysalueelle, hylätään nollahypoteesi H
0ja hyväksytään vaihtoehtoinen hypoteesi H
1.
– Jos testisuureen arvo ei joudu hylkäysalueelle, jätetään nollahypoteesi H
0voimaan.
TKK (c) Ilkka Mellin (2004) 70
Testin suorittaminen
Testin suorittaminen p-arvon määräämiseen perustuvassa testausmenettelyssä 1/3
• Jos testi perustetaan testisuureen arvoa vastaaviin p- arvoihin, testin suorittamisessa on seuraavat vaiheet:
(1) Asetetaan testin hypoteesit:
– Yleinen hypoteesi H
– Testauksen kohteena oleva nollahypoteesi H
0– Vaihtoehtoinen hypoteesi H
1(2) Valitaan testiä varten testisuure.
– Testisuureen tehtävänä on mitata havaintojen ja nollahypoteesin H
0yhteensopivuutta.
TKK (c) Ilkka Mellin (2004) 71
Testin suorittaminen
Testin suorittaminen p-arvon määräämiseen perustuvassa testausmenettelyssä 2/3
(3) Poimitaan otos niin, että yleisen hypoteesin H oletukset pätevät.
– Jos havaintojen sisältämät todisteet nolla- hypoteesia H
0vastaan ovat testisuureella mitattuna kyllin vahvoja, nollahypoteesi H
0hylätään ja vaihtoehtoinen hypoteesi H
1hyväksytään.
(4) Määrätään valitun testisuureen arvo havainnoista.
(5) Määrätään testisuureen havaittua arvoa vastaava
p-arvo.TKK (c) Ilkka Mellin (2004) 72
Testin suorittaminen
Testin suorittaminen p-arvon määräämiseen perustuvassa testausmenettelyssä 3/3
(6) Tehdään päätös nollahypoteesin hylkäämisestä.
– Jos testin p-arvo on kyllin pieni, hylätään nollahypoteesi H
0ja hyväksytään vaihtoehtoinen hypoteesi H
1.
– Jos testin p-arvo ei ole kyllin pieni, jätetään
nollahypoteesi H
0voimaan.
TKK (c) Ilkka Mellin (2004) 73
Tilastollinen testaus Tilastolliset hypoteesit Tilastolliset testit ja testisuureet Virheet testauksessa
Merkitsevyystaso ja testin hylkäysalue Testin p-arvo
Testin suorittaminen
>> Esimerkki: Normaalijakauman parametrien testaaminen Tilastolliset testit ja mitta-asteikot
Tilastolliset testit
TKK (c) Ilkka Mellin (2004) 74
Avainsanat Hylkäysalue Hypoteesi Hyväksymisalue χ2-jakauma Kriittiset rajat Merkitsevyystaso Nollahypoteesi Normaalijakauma Odotusarvo
Esimerkki:
Normaalijakauman parametrien testaaminen
Otos p-arvo Testi Testisuure
Testisuureen normaaliarvo t-jakauma
Vaihtoehtoinen hypoteesi Varianssi
Yleinen hypoteesi
TKK (c) Ilkka Mellin (2004) 75
Esimerkki: Normaalijakauman parametrien testaaminen
Testausasetelma 1/6
• Kone tekee ruuveja, joiden tavoitepituuson 10 cm.
• Oletetaan, että ruuvien pituus vaihtelee satunnaisestinoudattaen normaalijakaumaa.
• Valmistuserää pidetään myyntikelpoisena, jos erän ruuvien pituudet eivät vaihtele liian paljonja ruuvit ovat keskimäärinoikean mittaisia:
Ruuvien pituuksien varianssi ei saa ylittäätilastollisesti merkitsevästiarvoa 0.01 cm2ja ruuvien keskipituus ei saa poiketa tilastollisesti merkitsevästipituuden tavoitearvosta 10 cm.
TKK (c) Ilkka Mellin (2004) 76
Esimerkki: Normaalijakauman parametrien testaaminen
Testausasetelma 2/6
• Ruuvien pituutta valvotaanseuraavalla tavalla:
(i) Jokaisesta valmistuserästä ruuveja poimitaan yksinkertainen satunnaisotos.
(ii) Otokseen poimittujen ruuvien pituudet mitataan.
(iii) Otokseen poimittujen ruuvien pituuksien otosvarianssia verrataan arvoon 0.01 cm2ja pituuksien aritmeettista keskiarvoa verrataan ruuvien tavoitepituuteen 10 cm.
(v) Jos otokseen poimittujen ruuvien pituuksien varianssi on liian suuritai pituuksien aritmeettinen keskiarvo poikkeaa pituuden tavoitearvosta liian paljon, niin valmistuserä hylätään.
• Seuraavassa näytetään, miten ruuvien pituuden valvonnassa käytetään hyväksi tilastollista testausta.
TKK (c) Ilkka Mellin (2004) 77
Esimerkki: Normaalijakauman parametrien testaaminen
Testausasetelma 3/6
• Oletetaan, että valmistuserän ruuvien joukosta on poimittu yksinkertainen satunnaisotos, jonka koko n= 30 ja otokseen poimittujen ruuvien pituudet on mitattu.
• Taulukko oikealla esittää otokseen poimittujen ruuvien pituuksien luokiteltua frekvenssi- jakaumaa.
• Huomautus:
Aineistoa on käsitelty myös luvuissa Tilastollisten aineistojen kuvaaminenja Väliestimointi.
Luokkavälit Luokkafrekvenssit
(9.85,9.90] 1
(9.90,9.95] 2
(9.95,10.00] 6
(10.00,10.05] 3
(10.05,10.10] 5
(10.10,10.15] 4
(10.15,10.20] 5
(10.20,10.25] 3
(10.25,10.30] 1
TKK (c) Ilkka Mellin (2004) 78
Esimerkki: Normaalijakauman parametrien testaaminen
Testausasetelma 4/6
• Kuva oikealla esittää otokseen poimittujen ruuvien pituuksien luokiteltua frekvenssijakaumaa vastaavaa histogrammia.
• Luokkavälitmääräävät histogrammin suorakaiteiden kannat.
• Suorakaiteiden korkeudeton valittu niin, että suorakaiteiden pinta-alatsuhtautuvat toisiinsa kuten vastaavat luokka- frekvenssit.
Ruuvien pituuksien luokiteltu frekvenssijakauma
0 1 2 3 4 5 6 7
9.8 9.9 10.0 10.1 10.2 10.3 10.4
Pituus (cm)
Frekvenssi
TKK (c) Ilkka Mellin (2004) 79
Esimerkki: Normaalijakauman parametrien testaaminen
Testausasetelma 5/6
• Yhteenveto otostiedoista:
Pituuksien aritmeettinen keskiarvo:
Pituuksien otoskeskihajonta:
s= 0.1038 cm
• Huomautus:
Jos otantaa toistetaan, kaikki otoksia koskevat tiedot (sekä havaintoarvot että havainto- arvoista lasketut otostunnus- luvut) vaihtelevat satunnaisesti otoksesta toiseen.
10.09 cm X=
Ruuvien pituuksien luokiteltu frekvenssijakauma
0 1 2 3 4 5 6 7
9.8 9.9 10.0 10.1 10.2 10.3 10.4
Pituus (cm)
Frekvenssi
TKK (c) Ilkka Mellin (2004) 80
Esimerkki: Normaalijakauman parametrien testaaminen
Testausasetelma 6/6
• Kysymys:
Onko otosinformaatio sopusoinnussa ruuvien pituuden varianssille ja odotusarvolle asetettujen tavoitearvojen kanssa?
• Vastataan kysymykseen konstruoimalla tarkoitukseen sopivat tilastolliset testit.
Ruuvien pituuksien luokiteltu frekvenssijakauma
0 1 2 3 4 5 6 7
9.8 9.9 10.0 10.1 10.2 10.3 10.4
Pituus (cm)
Frekvenssi
TKK (c) Ilkka Mellin (2004) 81
Esimerkki: Normaalijakauman parametrien testaaminen
Testausasetelmaa koskevat hypoteesit 1/2
• Määritellään satunnaismuuttuja X:
X= ruuvin pituus
• Yleinen hypoteesi H:
Otokseen poimittujen ruuvien pituudet eivät riipu toisistaanja ruuvien pituudet vaihtelevat satunnaisesti noudattaen normaalijakaumaa:
H : X1, X2, … , Xn⊥ Xi~ N(µ, σ2) , i= 1, 2, … , n
Pidämme koko testauksen ajan kiinni yleisestä hypoteesista H.
TKK (c) Ilkka Mellin (2004) 82
Esimerkki: Normaalijakauman parametrien testaaminen
Testausasetelmaa koskevat hypoteesit 2/2
• Nollahypoteesi H10:
Ruuvien pituuksien varianssi on korkeintaan0.01 cm2: H10: σ2= σ02≤0.01 cm2
• Vaihtoehtoinen hypoteesi H11:
Ruuvien pituuksien varianssi on suurempi kuin0.01 cm2: H11: σ2= σ02> 0.01 cm2
• Nollahypoteesi H20:
Ruuvien pituuksien odotusarvo yhtyy pituuden tavoitearvoon10 cm:
H20: µ= µ0= 10 cm
• Vaihtoehtoinen hypoteesi H21:
Ruuvien pituuksien odotusarvo poikkeaa pituuden tavoitearvosta10 cm:
H21: µ≠µ0= 10 cm
TKK (c) Ilkka Mellin (2004) 83
Esimerkki: Normaalijakauman parametrien testaaminen
Testit
• Ruuvien pituuksien varianssiakoskevaa nollahypoteesia H10: σ2= σ02≤0.01 cm2
voidaan testata ns. χ2-testillä.
• Ruuvien pituuksien odotusarvoakoskevaa nollahypoteesia H20: µ= µ0= 10 cm
voidaan testata ns. t-testillä.
TKK (c) Ilkka Mellin (2004) 84
Esimerkki: Normaalijakauman parametrien testaaminen
χ
2-testi varianssille
• Yleinen hypoteesi H:
Otokseen poimittujen ruuvien pituudet eivät riipu toisistaanja ruuvien pituudet vaihtelevat satunnaisesti noudattaen normaalijakaumaa:
H :X1, X2, … , Xn⊥ Xi~ N(µ, σ2) , i= 1, 2, … , n
• Nollahypoteesi H10:
Ruuvien pituuksien varianssi on korkeintaan0.01 cm2: H10: σ2= σ02≤0.01 cm2
• Vaihtoehtoinen hypoteesi H11:
Ruuvien pituuksien varianssi on suurempi kuin0.01 cm2: H11: σ2= σ02> 0.01 cm2
TKK (c) Ilkka Mellin (2004) 85
Esimerkki: χ2-testi varianssille
Testisuure ja sen jakauma 1/3
• Käytetään testisuureenaχ2-testisuuretta
jossa
havaintojen (harhaton) otosvarianssija σ02
nollahypoteesinH10kiinnittämä parametrinσ2arvo.
2 2
1
1 ( )
1
n i i
s X X
n =
= −
−
∑
2 2
2 0
(n 1)s χ = σ−
TKK (c) Ilkka Mellin (2004) 86
Esimerkki: χ2-testi varianssille
Testisuure ja sen jakauma 2/3
• Voidaan osoittaa, ettäχ2-testisuure
noudattaa χ2-jakaumaavapaustein (n−1), jos yleinen hypoteesiH ja oletus
σ2= σ02= 0.01 cm2
pätevät(ks. lukuja Otos ja otosjakaumatja Väliestimointi):
2 2(n 1)
χ ∼χ −
2 2
2 0
(n 1)s χ = σ−
TKK (c) Ilkka Mellin (2004) 87
Esimerkki: χ2-testi varianssille
Testisuure ja sen jakauma 3/3
• Esimerkin tapauksessa otokseen poimittujen ruuvien pituuksien aritmeettinen keskiarvoon
otokseen poimittujen ruuvien pituuksien otoskeskihajontaon s= 0.1038 cm
ja nollahypoteesinH10kiinnittämä parametrinσ2arvoon σ02= 0.01 cm2
• Siten χ2-testisuureen arvoksisaadaan 10.09 cm
X=
2 2
2 2 0
( 1) (30 1) 0.1038 31.246 0.01
n s
χ σ
− − ×
= = =
TKK (c) Ilkka Mellin (2004) 88
Esimerkki: χ2-testi varianssille
Testisuureen normaaliarvo
• Voidaan osoittaa, ettäχ2-testisuureen
normaaliarvoeli χ2-testisuureen odotusarvo oletuksen σ2= σ02= 0.01 cm2
pätiessäon
E(χ2| σ2= σ02) = n−1
• Siten χ2-testisuureen normaaliarvoonsa (n−1) verrattuna suuretja pienetarvot viittaavat siihen, ettänollahypoteesiH10ei päde.
2 2 2 0
(n 1)s
χ σ
= −
TKK (c) Ilkka Mellin (2004) 89
Esimerkki: χ2-testi varianssille
Testin hylkäysalueen määrääminen 1/5
• Valitaan merkitsevyystasoksi α= 0.05
• Koska vaihtoehtoinen hypoteesi H11: σ2= σ02> 0.01 cm2
on yksisuuntainen, hylkäysalueen määräämistä varten valitaan kriittinen raja siten, että
jossa satunnaismuuttuja χ2noudattaa χ2-jakaumaavapausastein n– 1 = 29.
• Kriittinen raja toteuttaa ehdon
2 2
Pr(χ ≥χα) 0.05=
2
χα
2
χα
2 2
Pr(χ ≤χα) 1= − =α 0.95
TKK (c) Ilkka Mellin (2004) 90
0 0.01 0.02 0.03 0.04 0.05 0.06 0.07 Esimerkki: χ2-testi varianssille
Testin hylkäysalueen määrääminen 2/5
• χ2-jakauman taulukoista nähdään, että
Pr(χ2≥42.557) = 0.05 kun vapausasteiden lukumäärä
n– 1 = 29
• Siten kriittinen rajaon:
= 42.557
• Kuvio oikealla havainnollistaa kriittisen rajan määräämistä.
0.95
42.557 0.05 χ2(29)-jakauman tiheysfunktio
0 2
χ0.05