• Ei tuloksia

Tilastolliset menetelmät:Tilastolliset testit

N/A
N/A
Info
Lataa
Protected

Academic year: 2022

Jaa "Tilastolliset menetelmät:Tilastolliset testit"

Copied!
108
0
0

Kokoteksti

(1)

Tilastolliset menetelmät Tilastolliset testit

Tilastolliset menetelmät:

Tilastolliset testit

8. Tilastollinen testaus

9. Testejä suhdeasteikollisille muuttujille 10. Testejä järjestysasteikollisille muuttujille 11. Testejä laatueroasteikollisille muuttujille

12. Yhteensopivuuden, homogeenisuuden ja riippumattomuuden testaaminen

(2)

Tilastolliset menetelmät Tilastolliset testit

(3)

Tilastolliset menetelmät Tilastolliset testit

Sisällys

8. TILASTOLLINEN TESTAUS________________________________________________ 129 8.1. TILASTOLLISEN TESTAUKSEN IDEA ___________________________________________ 130 TILASTOLLISEN TESTAUKSEN LÄHTÖKOHTA__________________________________________ 130 SATUNNAISOTOS_____________________________________________________________ 130 8.2. TILASTOLLISET HYPOTEESIT________________________________________________ 131 YLEINEN HYPOTEESI __________________________________________________________ 131 NOLLAHYPOTEESI ____________________________________________________________ 131 VAIHTOEHTOINEN HYPOTEESI____________________________________________________ 132 8.3. TILASTOLLISET TESTIT JA TESTISUUREET ______________________________________ 132 TESTI _____________________________________________________________________ 132 TESTISUURE________________________________________________________________ 132 8.4. VIRHEET TESTAUKSESSA __________________________________________________ 133 HYLKÄYSVIRHE ______________________________________________________________ 133 HYVÄKSYMISVIRHE ___________________________________________________________ 133 TESTIN VOIMAKKUUS__________________________________________________________ 133 1. JA2. LAJIN VIRHEET_________________________________________________________ 133 TESTIN TULOS JA MAAILMAN TILAT ________________________________________________ 134 TESTIN HYLKÄYS- JA HYVÄKSYMISALUEET___________________________________________ 134 8.5. MERKITSEVYYSTASO JA TESTIN HYLKÄYSALUE __________________________________ 134 MERKITSEVYYSTASO__________________________________________________________ 134 MERKITSEVYYSTASON FREKVENSSITULKINTA ________________________________________ 134 TAVANOMAISET MERKITSEVYYSTASOT _____________________________________________ 135 HYLKÄYSALUEEN MÄÄRÄÄMINEN YKSIKERTAISISSA TESTAUSASETELMISSA ___________________ 135 8.6. TESTINP-ARVO _________________________________________________________ 137

P-ARVO____________________________________________________________________ 137

P-ARVON FREKVENSSITULKINTA __________________________________________________ 137

P-ARVO JA TESTI PÄÄTÖSSÄÄNTÖNÄ_______________________________________________ 137

P-ARVON MÄÄRÄÄMINEN YKSINKERTAISISSA TESTAUSASETELMISSA ________________________ 138 8.7. TESTIN SUORITTAMINEN___________________________________________________ 139 TESTIN SUORITTAMINEN MERKITSEVYYSTASON VALINTAAN PERUSTUVISSA TESTAUSASETELMISSA__ 139 TESTIN SUORITTAMINENP-ARVON VALINTAAN PERUSTUVISSA TESTAUSASETELMISSA ___________ 140 8.8. NORMAALIJAKAUMAN PARAMETREJA KOSKEVAT TESTIT: ESIMERKKI__________________ 140 TESTAUSASETELMA___________________________________________________________ 140 HAVAINNOT_________________________________________________________________ 141 TESTAUSASETELMAA KOSKEVAT HYPOTEESIT________________________________________ 142 χ2-TESTI VARIANSSILLE ________________________________________________________ 143

T-TESTI ODOTUSARVOLLE_______________________________________________________ 146 8.9. TILASTOLLISET TESTIT JA HAVAINTOJEN MITTA-ASTEIKOILLISET OMINAISUUDET__________ 150 9. TESTEJÄ SUHDEASTEIKOLLISILLE MUUTTUJILLE ___________________________ 152 9.1. SUHDEASTEIKOLLISTEN MUUTTUJIEN TESTIT____________________________________ 153 9.2. YHDEN OTOKSENT-TESTI ODOTUSARVOLLE ____________________________________ 154 TESTAUSASETELMA YHDEN OTOKSENT-TESTISSÄ_____________________________________ 154 HYPOTEESIT YHDEN OTOKSENT-TESTISSÄ __________________________________________ 154 PARAMETRIEN ESTIMOINTI YHDEN OTOKSENT-TESTISSÄ________________________________ 154 TESTISUURE JA SEN JAKAUMA YHDEN OTOKSENT-TESTISSÄ _____________________________ 155

(4)

Tilastolliset menetelmät Tilastolliset testit

HYLKÄYSALUEEN MÄÄRÄÄMINEN YHDEN OTOKSENT-TESTISSÄ____________________________ 156

P-ARVON MÄÄRÄÄMINEN YHDEN OTOKSENT-TESTISSÄ__________________________________ 157 NORMAALISUUSOLETUKSEN MERKITYS YHDEN OTOKSENT-TESTISSÄ _______________________ 157 YHDEN OTOKSENT-TESTIN HYVÄKSYMISVIRHEEN TODENNÄKÖISYYS JA VOIMAKKUUS ___________ 158 9.3. KAHDEN RIIPPUMATTOMAN OTOKSENT-TESTIA ODOTUSARVOILLE: YLEINEN TAPAUS _____ 160 TESTAUSASETELMA KAHDEN RIIPPUMATTOMAN OTOKSENT-TESTISSÄA_____________________ 160 HYPOTEESIT KAHDEN RIIPPUMATTOMAN OTOKSENT-TESTISSÄA__________________________ 161 PARAMETRIEN ESTIMOINTI KAHDEN RIIPPUMATTOMAN OTOKSENT-TESTISSÄA________________ 161 TESTISUURE JA SEN JAKAUMA KAHDEN RIIPPUMATTOMAN OTOKSENT-TESTISSÄA _____________ 162 HYLKÄYSALUEEN MÄÄRÄÄMINEN KAHDEN RIIPPUMATTOMAN OTOKSENT-TESTISSÄA____________ 163

P-ARVON MÄÄRÄÄMINEN KAHDEN RIIPPUMATTOMAN OTOKSENT-TESTISSÄA__________________ 164 NORMAALISUUSOLETUKSEN MERKITYS KAHDEN RIIPPUMATTOMAN OTOKSENT-TESTISSÄA_______ 165 9.4. KAHDEN RIIPPUMATTOMAN OTOKSENT-TESTIB ODOTUSARVOILLE: YHTÄ SUURTEN

VARIANSSIEN TAPAUS _________________________________________________________ 165 TESTAUSASETELMA KAHDEN RIIPPUMATTOMAN OTOKSENT-TESTISSÄB_____________________ 165 HYPOTEESIT KAHDEN RIIPPUMATTOMAN OTOKSENT-TESTISSÄB__________________________ 166 PARAMETRIEN ESTIMOINTI KAHDEN RIIPPUMATTOMAN OTOKSENT-TESTISSÄB________________ 167 TESTISUURE JA SEN JAKAUMA KAHDEN RIIPPUMATTOMAN OTOKSENT-TESTISSÄB _____________ 167 HYLKÄYSALUEEN MÄÄRÄÄMINEN KAHDEN RIIPPUMATTOMAN OTOKSENT-TESTISSÄB____________ 169

P-ARVON MÄÄRÄÄMINEN KAHDEN RIIPPUMATTOMAN OTOKSENT-TESTISSÄB__________________ 169 NORMAALISUUSOLETUKSEN MERKITYS KAHDEN RIIPPUMATTOMAN OTOKSENT-TESTISSÄB_______ 169 9.5. T-TESTI PARIVERTAILUILLE_________________________________________________ 169 PARIVERTAILUASETELMA_______________________________________________________ 169 TESTAUSASETELMAT-TESTISSÄ PARIVERTAILUILLE ____________________________________ 170 HYPOTEESITT-TESTISSÄ PARIVERTAILUILLE _________________________________________ 170 PARAMETRIEN ESTIMOINTIT-TESTISSÄ PARIVERTAILUILLE _______________________________ 170 TESTISUURE JA SEN JAKAUMAT-TESTISSÄ PARIVERTAILUILLE_____________________________ 170 HYLKÄYSALUEEN MÄÄRÄÄMINENT-TESTISSÄ PARIVERTAILUILLE___________________________ 172

P-ARVON MÄÄRÄÄMINENT-TESTISSÄ PARIVERTAILUILLE_________________________________ 172 NORMAALISUUSOLETUKSEN MERKITYST-TESTISSÄ PARIVERTAILUILLE ______________________ 172 9.6. YHDEN OTOKSENχ2-TESTI VARIANSSILLE ______________________________________ 172 TESTAUSASETELMA YHDEN OTOKSEN TESTISSÄ VARIANSSILLE____________________________ 172 HYPOTEESIT YHDEN OTOKSENχ2-TESTISSÄ VARIANSSILLE_______________________________ 172 PARAMETRIEN ESTIMOINTI YHDENχ2-TESTISSÄ VARIANSSILLE ____________________________ 173 TESTISUURE JA SEN JAKAUMA YHDEN OTOKSENχ2-TESTISSÄ VARIANSSILLE__________________ 173 HYLKÄYSALUEEN MÄÄRÄÄMINEN YHDEN OTOKSENχ2-TESTISSÄ VARIANSSILLE ________________ 174

P-ARVON MÄÄRÄÄMINEN YHDEN OTOKSENχ2-TESTISSÄ VARIANSSILLE ______________________ 175 NORMAALISUUSOLETUKSEN MERKITYS YHDEN OTOKSENχ2-TESTISSÄ VARIANSSILLE____________ 176 9.7. KAHDEN RIIPPUMATTOMAN OTOKSENF- TESTI VARIANSSEILLE ______________________ 176 TESTAUSASETELMA KAHDEN RIIPPUMATTOMAN OTOKSENF-TESTISSÄ VARIANSSEILLE___________ 176 HYPOTEESIT KAHDEN RIIPPUMATTOMAN OTOKSENF-TESTISSÄ VARIANSSEILLE________________ 177 PARAMETRIEN ESTIMOINTI KAHDEN RIIPPUMATTOMAN OTOKSENF-TESTISSÄ VARIANSSEILLE______ 177 TESTISUURE JA SEN JAKAUMA KAHDEN RIIPPUMATTOMAN OTOKSENF-TESTISSÄ VARIANSSEILLE ___ 177 HYLKÄYSALUEEN MÄÄRÄÄMINEN KAHDEN RIIPPUMATTOMAN OTOKSENF-TESTISSÄ VARIANSSEILLE _ 179

P-ARVON MÄÄRÄÄMINEN KAHDEN RIIPPUMATTOMAN OTOKSENF-TESTISSÄ VARIANSSEILLE _______ 180 NORMAALISUUSOLETUKSEN MERKITYS KAHDEN RIIPPUMATTOMAN OTOKSENF-TESTISSÄ VARIANSSEILLE

_________________________________________________________________________ 181 10. TESTEJÄ JÄRJESTYSASTEIKOLLISILLE MUUTTUJILLE ______________________ 182

(5)

Tilastolliset menetelmät Tilastolliset testit

10.2. MERKKITESTI__________________________________________________________ 183 TESTISUUREETS JAS+________________________________________________________ 183 TESTISUUREIDENS JAS+ OMINAISUUDET __________________________________________ 184 EKSAKTI MERKKITESTI_________________________________________________________ 184 STANDARDOITU MERKKITESTISUURE JA SEN ASYMPTOOTTINEN JAKAUMA ____________________ 184 KOMMENTTEJA ______________________________________________________________ 185 MERKKITESTI JA PARIVERTAILUASETELMAT__________________________________________ 185 10.3. WILCOXONIN RANKITESTI_________________________________________________ 185 TESTISUUREETW JAW+_______________________________________________________ 186 TESTISUUREIDENW JAW+ OMINAISUUDET _________________________________________ 186 EKSAKTIWILCOXONIN RANKITESTI________________________________________________ 187 STANDARDOITUW-TESTISUURE JA SEN ASYMPTOOTTINEN JAKAUMA _______________________ 187 KOMMENTTEJA ______________________________________________________________ 188 WILCOXONIN RANKITESTI JA PARVERTAILUASETELMAT__________________________________ 188 10.4. MANNIN JAWHITNEYN TESTI_______________________________________________ 188 HYPOTEESIT________________________________________________________________ 189 MANNIN JAWHITNEYN TESTIN IDEA _______________________________________________ 189 TESTISUUREU1 MUOTO1 _____________________________________________________ 189 TESTISUUREU1 MUOTO2 _____________________________________________________ 189 TESTISUUREENU1 OMINAISUUDET ________________________________________________ 190 TESTISUUREU2 MUOTO1 _____________________________________________________ 190 TESTISUUREU2 MUOTO2 _____________________________________________________ 190 TESTISUUREENU2 OMINAISUUDET ________________________________________________ 190 TESTISUUREIDENU1 JAU2 OMINAISUUDET __________________________________________ 191 STANDARDOITUU1-TESTISUURE JA SEN ASYMPTOOTTINEN JAKAUMA _______________________ 191 STANDARDOITUU2-TESTISUURE JA SEN ASYMPTOOTTINEN JAKAUMA _______________________ 191 KOMMENTTEJA ______________________________________________________________ 192 10.5. WILCOXONIN RANKISUMMATESTI____________________________________________ 192 MANNIN JAWHITNEYN TESTI JAWILCOXONIN RANKISUMMATESTI__________________________ 192 TESTISUURET1______________________________________________________________ 192 TESTISUURET2______________________________________________________________ 192 TESTISUUREIDENT1 JAT2 OMINAISUUDET___________________________________________ 192 STANDARDOITUT1-TESTISUURE JA SEN ASYMPTOOTTINEN JAKAUMA _______________________ 193 STANDARDOITUT2-TESTISUURE JA SEN ASYMPTOOTTINEN JAKAUMA _______________________ 193

11. TESTEJÄ LAATUEROASTEIKOLLISILLE MUUTTUJILLE _______________________ 194 11.1. LAATUEROASTEIKOLLISTEN MUUTTUJIEN TESTIT________________________________ 195 11.2. TESTI SUHTEELLISELLE OSUUDELLE_________________________________________ 195 TESTAUSASETELMA TESTISSÄ SUHTEELLISELLE OSUUDELLE _____________________________ 195 HYPOTEESIT TESTISSÄ SUHTEELLISELLE OSUUDELLE___________________________________ 196 PARAMETRIEN ESTIMOINTI TESTISSÄ SUHTEELLISELLE OSUUDELLE_________________________ 196 TESTISUURE JA SEN JAKAUMA TESTISSÄ SUHTEELLISELLE OSUUDELLE______________________ 197 HYLKÄYSALUEEN MÄÄRÄÄMINEN TESTISSÄ SUHTEELLISELLE OSUUDELLE ____________________ 198

P-ARVON MÄÄRÄÄMINEN TESTISSÄ SUHTEELLISELLE OSUUDELLE __________________________ 199 11.3. SUHTEELLISTEN OSUUKSIEN VERTAILUTESTI___________________________________ 199 TESTAUSASETELMA SUHTEELLISTEN OSUUKSIEN VERTAILUTESTISSÄ _______________________ 199 HYPOTEESIT SUHTEELLISTEN OSUUKSIEN VERTAILUTESTISSÄ ____________________________ 200 PARAMETRIEN ESTIMOINTI SUHTEELLISTEN OSUUKSIEN VERTAILUTESTISSÄ __________________ 200 TESTISUURE SUHTEELLISTEN OSUUKSIEN VERTAILUTESTISSÄ ____________________________ 201 HYLKÄYSALUEEN MÄÄRÄÄMINEN SUHTEELLISTEN OSUUKSIEN VERTAILUTESTISSÄ______________ 203

(6)

Tilastolliset menetelmät Tilastolliset testit

P-ARVON MÄÄRÄÄMINEN SUHTEELLISTEN OSUUKSIEN VERTAILUTESTISSÄ____________________ 204

12. YHTEENSOPIVUUDEN, HOMOGEENISUUDEN JA RIIPPUMATTOMUUDEN

TESTAAMINEN _____________________________________________________________ 205 12.1. JAKAUMAOLETUKSIEN TESTAUS____________________________________________ 206 12.2. YHTEENSOPIVUUDEN TESTAAMINEN _________________________________________ 206 TESTAUSASETELMAχ2-YHTEENSOPIVUUSTESTISSÄ____________________________________ 206 HYPOTEESITχ2-YHTEENSOPIVUUSTESTISSÄ _________________________________________ 207 HAVAITUT LUOKKAFREKVENSSIT__________________________________________________ 207 ODOTETUT LUOKKAFREKVENSSIT_________________________________________________ 208 TESTISUURE JA SEN JAKAUMAχ2-YHTEENSOPIVUUSTESTISSÄ ____________________________ 209 χ2-YHTEENSOPIVUUSTESTI: SOVELLUS_____________________________________________ 211 12.3. HOMOGEENISUUDEN TESTAAMINEN__________________________________________ 215 TESTAUSASETELMAχ2-HOMOGEENISUUSTESTISSÄ ____________________________________ 215 χ2-HOMOGEENISUUSTESTIN SUORITTAMINEN_________________________________________ 215 HYPOTEESITχ2-HOMOGEENISUUSTESTISSÄ _________________________________________ 216 HAVAITUT FREKVENSSIT________________________________________________________ 216 NOLLAHYPOTEESIN TULKINTAχ2-HOMOGEENISUUSTESTISSÄ_____________________________ 217 ODOTETTUJEN FREKVENSSIEN MÄÄRÄÄMINEN________________________________________ 217 TESTISUURE JA SEN JAKAUMAχ2-HOMOGEENISUUSTESTISSÄ_____________________________ 219 12.4. RIIPPUMATTOMUUDEN TESTAAMINEN ________________________________________ 220 TESTAUSASETELMAχ2-RIIPPUMATTOMUUSTESTISSÄ ___________________________________ 220 χ2-RIIPPUMATTOMUUSTESTIN SUORITTAMINEN________________________________________ 220 HYPOTEESITχ2-RIIPPUMATTOMUUSTESTISSÄ ________________________________________ 221 HAVAITUT FREKVENSSIT________________________________________________________ 221 NOLLAHYPOTEESIN TULKINTAχ2-RIIPPUMATTOMUUSTESTISSÄ____________________________ 222 ODOTETTUJEN FREKVENSSIEN MÄÄRÄÄMINEN________________________________________ 222 TESTISUURE JA SEN JAKAUMAχ2-RIIPPUMATTOMUUSTESTISSÄ____________________________ 224 12.5. χ2-HOMOGEENISUUSTESTI JAχ2-RIIPPUMATTOMUUSTESTI _________________________ 225 12.6. NORMAALISUUDEN TESTAAMINEN___________________________________________ 226 BOWMANIN JASHENTONIN TESTI NORMAALISUUDELLE__________________________________ 226 TODENNÄKÖISYYSJAKAUMAN VINOUS JA HUIPUKKUUS__________________________________ 226 HAVAINTOJEN JAKAUMAN VINOUS JA HUIPUKKUUS_____________________________________ 227 HYPOTEESIT________________________________________________________________ 228 BOWMANIN JASHENTONIN TESTI _________________________________________________ 228 RANKITPLOT-KUVIO SEKÄWILKIN JASHAPIRON TESTI NORMAALISUUDELLE _________________ 228 RANKITPLOT-KUVIO JAWILKIN JASHAPIRON TESTI: SOVELLUS __________________________ 229

(7)

Tilastolliset menetelmät 8. Tilastollinen testaus

8. Tilastollinen testaus

8.1. Tilastollisen testauksen idea 8.2. Tilastolliset hypoteesit

8.3. Tilastolliset testit ja testisuureet 8.4. Virheet testauksessa

8.5. Merkitsevyystaso ja testin hylkäysalue 8.6. Testinp-arvo

8.7. Testin suorittaminen

8.8. Normaalijakauman parametreja koskevat testit 8.9. Tilastolliset testit ja mitta-asteikot

Tilastollisella testauksella tarkoitetaan tutkimuksen kohteena olevastaperusjoukosta esitettyjen väitteiden tai oletuksien asettamista koetteelle havainnoista saatua informaatiota vastaan.

Perusjoukosta esitetyt väitteet tai oletukset on tilastollisessa testauksessa puettava tutkimuksen kohteena olevan perusjoukon alkioiden ominaisuuksien vaihtelua perusjoukossa kuvaavientoden- näköisyysjakaumia tainiiden parametreja koskeviksihypoteeseiksi.Tilastollinen testi onpäätös- sääntö, joka sanooonko hypoteesi hylättävä vai ei havainnoista saadun informaation valossa.

Testi mittaa hypoteesin ja havaintojenyhteensopivuutta.

Tarkastelemme tässä luvussa tilastollisen testiteorianperuskäsitteitä sekä tarkastelemme esitetytyn teorian havainnollistuksenanormaalijakauman parametreja koskevien hypoteesien testaamista.

Avainsanat:

Ensimmäisen lajin virhe, Frekvenssitulkinta, Havainto, Hylkäysalue, Hylkäysvirhe, Hypoteesi, Hyväksymis-alue, Hyväksymisvirhe, Järjestysasteikko,χ2-jakauma,χ2-testi, Kaksisuuntainen vaihto- ehtoinen hypoteesi, Kriittinen arvo, Kriittinen raja, Laatueroasteikko, Maailman tila, Merkitsevyys, Merkitsevyystaso, Mitta-asteikko, Nollahypoteesi, Normaaliarvo, Normaalijakauma, Odotusarvo, Otantamenetelmä, Otos, Parametri, p-arvo, Perusjoukko, Satunnaisotos, Suhdeasteikko, t-jakauma, t-testi, Testausasetelma, Testi, Testin tulos, Testisuure, Tilastollinen hypoteesi, Tilastollisten

hypoteesien testaus, Todennäköisyysjakauma, Toisen lajin virhe, Vaihtoehtoinen hypoteesi, Varianssi, Voimakkuus, Välimatka-asteikko, Yksisuuntainen vaihtoehtoine hypoteesi, Yleinen hypoteesi

(8)

Tilastolliset menetelmät 8. Tilastollinen testaus

8.1. Tilastollisen testauksen idea Tilastollisen testauksen lähtökohta Lähtökohta:

Tutkimuksen kohteena olevasta perusjoukosta on esitetty jokinväite taioletus.

Kysymys:

Miten esitettyä väitettä tai oletusta voidaantestata?

Vastaus:

Väitettä tai oletusta voidaan testata tilastollisesti,jos väite tai oletus voidaan pukea tutkimuksen kohteena olevan perusjoukon ominaisuuden vaihtelua perusjoukossa kuvaavaatodennäköisyysjakaumaa tai sen parametreja koskevaksi oletukseksi eli hypoteesiksi.

OlkoonX tutkimuksen kohteena olevan perusjoukon jonkin ominaisuuden vaihtelua perusjoukossa kuvaavasatunnaismuuttuja ja olkoon satunnaismuuttujanX todennäköisyysjakauman piste- todennäköisyys- taitiheysfunktio

f(x;θ)

jossaθ on funktionf muodon määräävätuntematonparametri. Yksinkertaisissa testausasetelmissa kiinnostuksen kohteena onhypoteesi, jonka mukaanparametrillaθon arvoθ0.

Miten todennäköisyysjakaumanf(x;θ) parametriaθ koskevaa hypoteesia θ =θ0

voidaantestata tilastollisesti? Tilastollisessa testauksessahypoteesiθ =θ0asetetaan koetteelle havaintojen todennäköisyysjakaumasta f(x;θ)sisältämää informaatiota vastaan.

Satunnaisotos

Oletamme jatkossa, ettähavainnot X1,X2, … ,Xn

muodostavatsatunnaisotoksen jakaumasta, jonka pistetodennäköisyys- tai tiheysfunktio on f(x;θ)

TällöinX1 ,X2 , … ,Xn ovatriippumattomia,identtisesti jakautuneita satunnaismuuttujia, joilla on sama pistetodennäköisyys- tai tiheysfunktio f(x;θ):

1, 2, ,

( ; ) , 1, 2, ,

n i

X X X

X f x θ i n

= K

K Tavoitteenamme on testata tilastollisesti muotoa

θ =θ0

olevaaparametrista hypoteesia. Testin suorittamista varten valitaan testisuure, jokamittaa satunnaismuuttujien

(9)

Tilastolliset menetelmät 8. Tilastollinen testaus

havaittujen arvojen

x1 ,x2 , … ,xn

ja hypoteesinθ =θ0yhteensopivuutta.Hyvä yhteensopivuus merkitsee sitä, että havainnot ovat sopusoinnussa oletuksenθ =θ0 kanssa jahuono yhteensopivuus merkitsee sitä, että havainnot ja oletusθ =θ0 ovatristiriidassa keskenään.

8.2. Tilastolliset hypoteesit

Kun todennäköisyysjakauman parametreja koskevia väitteitä tai oletuksia testataan tilastollisesti, testausasetelman kiinnittämiseksi on tehtävä seuraavat kolme oletusta:

(i) Testausasetelmaa koskevat perusoletukset, joista pidetään kiinni testauksen aikana, muodostavat testinyleisen hypoteesin.

(ii) Testattavaa oletusta kutsutaannollahypoteesiksi.

(iii) Vaihtoehtoinen hypoteesi onoletus,joka astuu voimaan,jos nollahypoteesi hylätään testissä.

Yleinen hypoteesi

Yleiset testausasetelmaa koskevat oletukset muodostavat testinyleisen hypoteesin H.Yleinen hypoteesi H sisältää oletukset

perusjoukosta

otantamenetelmästä

perusjoukon jakaumasta

Yleisen hypoteesin H oletuksistapidetään kiinni koko testauksen ajan,mikä merkitsee sitä,että tilastollinen testaus tehdään aina ehdollisesti yleisen hypoteesin H oletusten suhteen.

Huomautus:

• Yleisen hypoteesin sisältämiä jakaumaoletuksia voidaan ja on tavallisesti myös syytä testata erikseen; ks. esimerkiksi lukuaYhteensopivuuden, homogeenisuuden ja riippumattomuuden testaaminen.

Nollahypoteesi

Sitäperusjoukon jakauman parametreja koskevaa väitettä taioletusta,jota halutaan testata kutsutaan nollahypoteesiksi. Nollahypoteesille käytetään tavallisesti merkintää H0 .

Testissä nollahypoteesi H0asetetaan koetteelle havaintojen perusjoukon jakaumasta sisältämää informaatiota vastaan. Nollahypoteesista H0pidetään kiinni, elleivät havaintojen sisältämättodisteet nollahypoteesia vastaan olekyllin voimakkaita.

Olkoon

f(x;θ)

tutkimuksen kohteena olevaa perusjoukon ominaisuutta kuvaavantodennäköisyysjakauman piste- todennäköisyys- taitiheysfunktio.Yksinkertaisissa testausasetelmissa nollahypoteesi on muotoa

H0 :θ =θ0

(10)

Tilastolliset menetelmät 8. Tilastollinen testaus

Huomautus:

• Nollahypoteesit ovat yksinkertaisissa testausasetelmissa muotoa ”on sama” tai muotoa

ei ole eroa”.

Vaihtoehtoinen hypoteesi

Vaihtoehtoinen hypoteesi H1 onoletus,joka astuu voimaan,jos nollahypoteesi H0hylätään.

Vaihtoehtoinen hypoteesi voidaan tavallisesti muotoilla usealla eri tavalla. Jos nollahypoteesi on muotoa ”on sama” tai ”ei ole eroa”, vaihtoehtoinen hypoteesi on tavallisesti muotoa ”ei ole sama”

tai ”on eroa”.

Kun tilastollista testiä tehdään, toivotaan usein, ettänollahypoteesi voidaan hylätä javaihtoehtoinen hypoteesi hyväksyä. Vaihtoehtoisen hypoteesinhyväksyminen merkitsee yleensäinformaation lisääntymistä.

Jos nollahypoteesi onyksinkertaista muotoa H0 :θ =θ0

vaihtoehtoinen hypoteesi voidaan muotoilla seuraavilla kolmella tavalla:

(i) H1 :θ >θ0

(ii) H1 :θ <θ0

(iii) H1 :θ ≠ θ0

Tapauksissa (i) ja (ii) sanomme, että vaihtoehtoinen hypoteesi onyksisuuntainen. Tapauksessa (iii) sanomme, että vaihtoehtoinen hypoteesi onkaksisuuntainen.

Huomautus:

• Vaihtoehtoisen hypoteesin muoto vaikuttaa tavallisesti siihen tapaan, jolla testi suoritetaan.

8.3. Tilastolliset testit ja testisuureet Testi

Tilastollinen testi onpäätössääntö, joka kertoo jokaisessa yksittäisessä testaustilanteessa eli jokaiselle otokselle, onko nollahypoteesi H0 hylättävä vai ei.

Testisuure

Tilastollinen testi perustuu ainatestisuureeseen, jokamittaa havaintojen ja nollahypoteesin H0yhteensopivuutta. Testisuure onsatunnaismuuttuja, jonka arvo riippuu havainnoista ja nolla- hypoteesista H0. Havaintojen ja nollahypoteesin H0yhteensopivuuden mittaaminen tarkoittaa sitä, ettätutkitaan kuinka todennäköistä on saada sellaisia testisuureen arvoja kuin on saatu. Tämä vaatii testisuureen jakauman tuntemista.

Jos havaintojen ja nollahypoteesin H0yhteensopivuus on testisuureella mitattuna hyvä,nolla- hypoteesi H0jätetään voimaan. Jos havaintojen ja nollahypoteesin H0yhteensopivuus on testi- suureella mitattuna huono,nollahypoteesi H0hylätään ja vaihtoehtoinen hypoteesi H1hyväksytään.

(11)

Tilastolliset menetelmät 8. Tilastollinen testaus

nollahypoteesin H0kanssa. Jos testisuureen otoksesta määrätty arvo poikkeaa merkitsevästi testisuureen normaaliarvosta,havainnot sisältävät todisteita nollahypoteesia H0vastaan.

8.4. Virheet testauksessa Hylkäysvirhe

Jos nollahypoteesi H0hylätään silloin,kun se on tosi, tehdäänhylkäysvirhe.Hylkäysvirheen todennäköisyysαon ehdollinen todennäköisyys

Pr(H0 hylätään | H0 on tosi) =α

Hylkäysvirheen todennäköisyydenα komplementtitodennäköisyys Pr(H0 hyväksytään | H0 on tosi) = 1 –α

on todennäköisyyshyväksyä nollahypoteesisilloin,kun se on tosi.

Tilastollisessa tutkimuksessa noudatetaan tieteen yleistävarovaisuusperiaatetta:

Hypoteeseja ei saa hylätä ilman riittäviä syitä.

Siksi nollahypoteesin H0virheellisen hylkäyksen todennäköisyys halutaan tehdä tilastollisessa testauksessamahdollisimman pieneksi. Siksihavainnoilta vaaditaan vahvoja todisteita nolla- hypoteesia H0vastaan ennen kuin se suostutaan hylkäämään.

Hyväksymisvirhe

Jos nollahypoteesi H0jätetään voimaan silloin,kun se ei ole tosi, tehdäänhyväksymisvirhe.

Hyväksymisvirheen todennäköisyysβ on ehdollinen todennäköisyys Pr(H0 jätetään voimaan | H0 ei ole tosi) =β Huomautus:

• Hylkäysvirheen todennäköisyysα ja hyväksymisvirheen todennäköisyysβ eivät ole toistensa komplementtitodennäköisyyksiä.

Testin voimakkuus

Hyväksymisvirheen todennäköisyydenβkomplementtitodennäköisyyttä Pr(H0 hylätään | H0 ei ole tosi) = 1−β

kutsutaan testinvoimakkuudeksi. Hyvä testi onvoimakas, koska voimakkaalla testillä on pieni hyväksymisvirheen todennäköisyysβ . Testin voimakkuus (1−β) riippuu tavallisesti testattavan parametrintodellisesta arvosta.

Testin voimakkuutta testattavan parametrin arvojen funktiona kutsutaanvoimakkuusfunktioksi;

esimerkki: ks. kappalettaYhden otoksent-testi luvussaTestejä suhdeasteikollisille muuttujille.

1. ja 2. lajin virheet

Koska testiä tehtäessä pyritäänensisijaisesti varomaan sitä, että nollahypoteesi H0hylätään silloin, kun seon tosi,hylkäysvirhettä kutsutaan useinensimmäisen lajin virheeksi. Tällöinhyväksymis- virhettä eli sitä, että nollahypoteesi H0hyväksytään silloin, kun seei ole tosi, kutsutaantoisen lajin virheeksi.

(12)

Tilastolliset menetelmät 8. Tilastollinen testaus

Testin tulos ja maailman tilat

Maailman tilat jatestin tulokset voidaan ryhmitellä seuraavaksi nelikentäksi:

Testin hylkäys- ja hyväksymisalueet

Kun testi formuloidaanpäätössääntönä, testiä varten konstruoidun testisuureenmahdollisten arvojen joukko jaetaan kahteen osaan,hylkäysalueeseen jahyväksymis-alueeseen:

(i) Jos testisuureen havainnoista määrätty arvo joutuu hylkäysalueelle,nollahypoteesi H0

hylätään.

(ii) Jos testisuureen havainnoista määrätty arvo joutuu hyväksymisalueelle,nollahypoteesi H0

jätetään voimaan.

Huomautus:

• Testisuureen mahdollisten arvojen joukon jako hylkäys- ja hyväksymisalueisiinei saa riippua havainnoista.

8.5. Merkitsevyystaso ja testin hylkäysalue Merkitsevyystaso

Testin merkitsevyystasoα ontodennäköisyys,että testisuureen havainnoista määrätty arvo joutuu hylkäysalueelle,jos nollahypoteesi H0pätee.

Jos testisuureen havainnoista määrätty arvo joutuu nollahypoteesin H0 pätiessä hylkäysalueelle, nollahypoteesi H0 hylätään virheellisesti ja seurauksena on hylkäysvirhe, jonka todennäköisyys onα.

Tavallisesti testin hylkäysalue määrätään kiinnittämällä testissä käytettävä merkitsevyystasoα etukäteen so. jo ennen havaintojen keräämistä; ks. kappalettaEsimerkki: Normaalijakauman parametrien testaaminen.

Merkitsevyystason frekvenssitulkinta

Oletetaan, että yleisen hypoteesin H lisäksi myös nollahypoteesi H pätee testausasetelmassa ja että

Maailman tila

Nollahypoteesi pätee

Nollahypoteesi ei päde

Nollahypoteesi jää voimaan

Oikea johtopäätös

Hyväksymis- virhe Testin

tulos

Nollahypoteesi hylätään

Hylkäysvirhe Oikea

johtopäätös

(13)

Tilastolliset menetelmät 8. Tilastollinen testaus

otokseen samaa testiä.Tällöin joudumme virheellisesti hylkäämään nollahypoteesin H0

keskimäärin

α %:ssa

otoksia,vaikka nollahypoteesi H0koko ajan pätee.

Tavanomaiset merkitsevyystasot

Koska testeissä halutaan ensisijaisesti suojautua hylkäysvirhettä vastaan, testin merkitsevyystasoksiα on tapana valita pieniä lukuja.

Ns.tavanomaiset merkitsevyystasot ovat α = 0.05

α = 0.01 α = 0.001

(i) Jos nollahypoteesi H0 voidaan hylätä merkitsevyystasollaα = 0.05, sanotaan:

Testisuureen arvo (tai testin tulos) onmelkein merkitsevä.

(ii) Jos nollahypoteesi H0 voidaan hylätä merkitsevyystasollaα = 0.01, sanotaan: Testisuureen arvo (tai testin tulos) onmerkitsevä.

(iii) Jos nollahypoteesi H0 voidaan hylätä merkitsevyystasollaα = 0.001, sanotaan:

Testisuureen arvo (tai testin tulos) onerittäin merkitsevä.

Merkitsevyystasoaα valittaessa on aina syytä ottaa huomioon väärän päätöksen seuraukset.

Hylkäysalueen määrääminen yksikertaisissa testausasetelmissa

Testin hylkäysalue riippuu yksinkertaisissa testausasetelmissa – paitsi valitusta merkitsevyystasostaα – myös vaihtoehtoisen hypoteesin muodosta.

Olkoon parametriaθ koskeva nollahypoteesi yksinkertaista muotoa H0 :θ =θ0

Valitaan testin merkitsevyystasoksiα ja oletetaan, että testisuureena on (jatkuva) satunnaismuuttuja Z. Tehdään testisuureestaZ seuraavat oletukset:

(1) TestisuureenZ mahdolliset arvot kuuluvat väliin (a,b), jossa voi ollaa =−∞ ja/taib = +∞.

(2a) TestisuureellaZ on taipumus saadasuuria arvoja, jos θ >θ0

(2b) TestisuureellaZ on taipumus saadapieniä arvoja, jos θ <θ0

Huomautus:

• Oletukset 2a-b pätevät kaikille testisuureille tässä esityksessä.

Tarkastellaan testin hylkäysalueen määräämistä erilaisten vaihtoehtoisten hypoteesien tapauksissa.

(i) Jos vaihtoehtoisena hypoteesina onyksisuuntainen

vaihtoehto Testisuureen tiheysfunktioTestisuureen tiheysfunktio

(14)

Tilastolliset menetelmät 8. Tilastollinen testaus

H1 :θ >θ0

niin testinhylkäysalue on muotoa (u,b)

jossakriittinen arvo tairajau määrätään siten, että Pr(Z≥u | H0) =α

Ks. kuvaa oikealla.

(ii) Jos vaihtoehtoisena hypoteesina onyksisuuntainen vaihtoehto

H1 :θ <θ0

niin testihylkäysalue on muotoa (a,l)

jossakriittinen arvo tairajal määrätään siten, että Pr(Z≤l | H0) =α

Ks. kuvaa oikealla.

(iii) Jos vaihtoehtoisena hypoteesina onkaksisuuntainen vaihtoehto

H1 :θ ≠ θ0

niin testinhylkäysalue on muotoa (a,l)∪(u,b)

jossakriittiset arvot tairajatl jau määrätään siten, että

Pr(Z≥u | H0) = Pr(Z≤l | H0) =α/2 Ks. kuvaa oikealla.

Jos testisuureenZ jakauma onsymmetrinen origon suhteen, niin edellä esitetyille kriittisille arvoille

1−α l α

Hylkäysalue Hyväksymisalue Testisuureen tiheysfunktio

1−α l α

Hylkäysalue Hyväksymisalue Testisuureen tiheysfunktio

1−α

α/2 α/2

Hylkäysalue Hylkäysalue Hyväksymisalue

Testisuureen tiheysfunktio

l u

1−α

α/2 α/2

Hylkäysalue Hylkäysalue Hyväksymisalue

Testisuureen tiheysfunktio

l u

(15)

Tilastolliset menetelmät 8. Tilastollinen testaus

l =−u Huomautus:

• Todennäköisyydet kohdissa (i)-(iii) ovat ehdollisia todennäköisyyksiä, joissa ehto- tapahtumana on se, että nollahypoteesi H0 pätee. Siten todennäköisyydet määrätään testisuureenZ jakaumasta, kun jakaumaa määrättäessä oletetaan, että nollahypoteesi H0

pätee.

8.6. Testinp-arvo p-arvo

Nollahypoteesin hylkääminen voidaan perustaa etukäteen valitun merkitsevyystason ja sitä vastaavan hylkäysalueen määräämisen sijasta testinp-arvoon.

Testin p-arvo onpienin merkitsevyystaso,jolla nollahypoteesi H0 voidaanhylätä.

Tilastolliset ohjelmistot tulostavat nykyään lähes aina sovellettavien testienp-arvot ja siksip-arvojen käyttöon lähes kokonaan syrjäyttänyt etukäteen valittujen kiinteiden merkitsevyystasojen käytön.

Testinp-arvo määrätään seuraavalla tavalla:

(i) Lasketaan valituntestisuureen arvo havainnoista.

(ii) Määrätään –olettaen,että nollahypoteesi H0pätee – todennäköisyys sille, että testisuure saa

(normaaliarvoonsa verrattuna) niin poikkeuksellisen arvon kuin se on saanut tai vielä poikkeuksellisempia arvoja.

Jos testinp-arvoksi saadaanpieni luku,testisuure on saanut arvon,joka kuuluu –nollahypoteesin H0pätiessä–epätodennäköisten testisuureen arvojen joukkoon. Siten nollahypoteesi voidaan hylätä, jos testinp-arvo onkyllin pieni. Mitäpienempi on testinp-arvo, sitävahvempia todisteita havainnot sisältävät nollahypoteesia H0vastaan.

Huomautus:

• Testinp-arvo määrätään testisuureenZ jakaumasta, kun jakauma on määrätty olettaen, että nollahypoteesi H0 pätee.

p-arvon frekvenssitulkinta

Oletetaan, että yleisen hypoteesin H lisäksi myös nollahypoteesi H0 pätee testausasetelmassa.

Toistetaan otantaa jasovelletaan jokaiseen otokseen samaa testiä.Tällöin havaitsemme keskimäärin

p %:ssa

poimittuja otoksia havaittua testisuureen arvoa poikkeavamman testisuureen arvon.

p-arvo ja testi päätössääntönä

Tilastollinen testi eli päätössääntö, joka kertoo jokaisessa yksittäisessä tilanteessa eli jokaiselle otokselle, onko nollahypoteesi H0 hylättävä vai ei, voidaan perustaa seuraavalla tavalla testinp- arvoon:

(i) Valitaanpieni todennäköisyys p0 .

(16)

Tilastolliset menetelmät 8. Tilastollinen testaus

(ii) Määrätään testinp-arvo.

Josp <p0,hylätään nollahypoteesi H0 jahyväksytään vaihtoehtoinen hypoteesi H1. Jospp0,jätetään nollahypoteesi H0voimaan.

Todennäköisyyttäp0 valittaessa on aina syytä ottaa huomioon väärän päätöksen seuraukset.

p-arvon määrääminen yksinkertaisissa testausasetelmissa

Testinp-arvo riippuu yksinkertaisissa testausasetelmissa vaihtoehtoisen hypoteesin muodosta.

Olkoon parametriaθ koskeva nollahypoteesi yksinkertaista muotoa H0 :θ =θ0

Oletetaan, että testisuureena on (jatkuva) satunnaismuuttujaZ. Oletetaan yksinkertaisuuden vuoksi, että testisuureen jakauma onsymmetrinen origon suhteen. Tehdään testisuureestaZ lisäksi seuraavat oletukset:

(1) TestisuureenZ mahdolliset arvot kuuluvat väliin (a,b), jossa voi ollaa =−∞ ja/taib = +∞.

(2a) TestisuureellaZ on taipumus saadasuuria arvoja, jos θ >θ0

(2b) TestisuureellaZ on taipumus saadapieniä arvoja, jos θ <θ0

Huomautus:

• Oletukset 2a-b pätevät kaikille testisuureille tässä esityksessä.

Oletetaan, että testisuureenZ havainnoista määrätty arvo onz.

Tarkastellaan testinp-arvon määräämistä erilaisten vaihtoehtoisten hypoteesien tapauksissa.

(i) Jos vaihtoehtoisena hypoteesina onyksisuuntainen vaihtoehto

H1 :θ >θ0

niin testinp-arvo on

p = Pr(Zz | H0) Ks. kuvaa oikealla.

Testisuureen tiheysfunktio

p 1−p

0 z

Testisuureen tiheysfunktio

p 1−p

0 z

Testisuureen tiheysfunktio

p 1−p

0 z

(17)

Tilastolliset menetelmät 8. Tilastollinen testaus

(ii) Jos vaihtoehtoisena hypoteesina onyksisuuntainen vaihtoehto

H1 :θ <θ0

niin testinp-arvo on

p = Pr(Zz | H0) Ks. kuvaa oikealla.

(iii) Jos vaihtoehtoisena hypoteesina onkaksisuuntainen vaihtoehto

H1 :θ ≠ θ0

niin testinp-arvo on

2p = 2×Pr(Z≥ |z| | H0)

Huomautus:

• Todennäköisyydet kohdissa (i)-(iii) ovat ehdollisia todennäköisyyksiä, joissa ehto- tapahtumana on se, että nollahypoteesi H0 pätee. Siten todennäköisyydet määrätään testisuureenZ jakaumasta, kun jakaumaa määrättäessä on oletettu, että nollahypoteesi H0

pätee.

8.7. Testin suorittaminen

Testin suorittaminen merkitsevyystason valintaan perustuvissa testausasetelmissa Jos testi perustetaanmerkitsevyystason valintaan, testin suorittamisessa on seuraavat vaiheet:

(1) Asetetaan testinhypoteesit:

Yleinen hypoteesi H

• Testauksen kohteena olevanollahypoteesi H0

Vaihtoehtoinen hypoteesi H1

(2) Valitaan testiä vartentestisuure.

• Testisuureen tehtävänä on mitata havaintojen ja nollahypoteesin H0yhteensopivuutta.

(3) Valitaanmerkitsevyystasoα ja konstruoidaan testille sitä vastaavahylkäysalue.

(4) Poimitaanotos niin, että yleisen hypoteesin Holetukset pätevät.

Testisuureen tiheysfunktio

z 1−p p

0

Testisuureen tiheysfunktio

z 1−p p

0

Testisuureen tiheysfunktio

1−2p

p p

|z| 0 +|z|

Testisuureen tiheysfunktio

1−2p

p p

|z| 0 +|z|

(18)

Tilastolliset menetelmät 8. Tilastollinen testaus

• Jos havaintojen sisältämät todisteet nollahypoteesia H0 vastaan ovat testisuureella mitattunakyllin vahvoja, nollahypoteesi H0hylätään ja vaihtoehtoinen hypoteesi H1

hyväksytään.

(5) Määrätään valituntestisuureen arvo havainnoista.

(6) Tehdäänpäätös nollahypoteesin hylkäämisestä.

• Jos testisuureen arvojoutuu hylkäysalueelle,hylätään nollahypoteesi H0 jahyväksytään vaihtoehtoinen hypoteesi H1 .

• Jos testisuureen arvoei joudu hylkäysalueelle,jätetään nollahypoteesi H0voimaan.

Testin suorittaminenp-arvon valintaan perustuvissa testausasetelmissa

Jos testi perustetaan testisuureen arvoa vastaaviinp-arvoihin, testin suorittamisessa on seuraavat vaiheet:

(1) Asetetaan testinhypoteesit:

Yleinen hypoteesi H

• Testauksen kohteena olevanollahypoteesi H0

Vaihtoehtoinen hypoteesi H1

(2) Valitaan testiä vartentestisuure.

• Testisuureen tehtävänä on mitata havaintojen ja nollahypoteesin H0yhteensopivuutta.

(3) Poimitaanotos niin, että yleisen hypoteesin H oletuksetpätevät.

• Jos havaintojen sisältämät todisteet nollahypoteesia H0 vastaan ovat testisuureella mitattunakyllin vahvoja, nollahypoteesi H0hylätään ja vaihtoehtoinen hypoteesi H1

hyväksytään.

(4) Määrätään valituntestisuureen arvo havainnoista.

(5) Määrätään testisuureen havaittua arvoa vastaavap-arvo.

(6) Tehdäänpäätös nollahypoteesin hylkäämisestä.

• Jos testinp-arvoon kyllin pieni,hylätään nollahypoteesi H0 jahyväksytään vaihtoehtoinen hypoteesi H1 .

• Jos testinp-arvoei ole kyllin pieni,jätetään nollahypoteesi H0voimaan.

8.8. Normaalijakauman parametreja koskevat testit: Esimerkki

Esitämme tässä kappaleessa testiteorian havainnollistuksenatestit normaalijakaumanodotusarvolle javarianssille yksinkertaisenlaadunvalvontaa koskevan esimerkin tapauksessa. Normaalijakauman parametreja koskevia testejä käsitellään perusteellisesti kappaleessaTestejä suhdeasteikollisille muuttujille.

Testausasetelma

Kone tekee ruuveja, joidentavoitepituutena on 10 cm. Ruuvienpituus vaihtelee kuitenkin satunnaisesti, mutta voidaan olettaa, että pituuden vaihtelua voidaan kuvatanormaalijakaumalla.

(19)

Tilastolliset menetelmät 8. Tilastollinen testaus

Ruuveja tehdään koneella erinä. Valmistuserää pidetään myyntikelpoisena, jos erän ruuvien pituudet eivät vaihtele liian paljon ja ruuvit ovatkeskimäärin oikean mittaisia:

Ruuvien pituuksien varianssi ei saa ylittäätilastollisesti merkitsevästi arvoa 0.01 cm2 ja ruuvien keskipituus ei saa poiketatilastollisesti merkitsevästi pituuden tavoitearvostaan 10 cm.

Ruuvien pituuttavalvotaan seuraavalla tavalla:

(i) Jokaisesta valmistuserästä poimitaan joukko ruuveja tutkittavaksi käyttäensatunnaisotantaa.

(ii) Otokseen poimittujen ruuvienpituudet mitataan.

(iii) Otokseen poimittujen ruuvienpituuksien otosvarianssia verrataan arvoon 0.01 cm2 ja pituuksien aritmeettista keskiarvoa verrataan ruuvien tavoitepituuteen 10 cm.

(v) Jos otokseen poimittujen ruuvien pituuksien varianssi onliian suuri tai pituuksien

aritmeettinen keskiarvo poikkeaa pituuden tavoitearvostaliian paljon, niin kokovalmistuserä hylätään.

Seuraavassa katsotaan, miten ruuvien pituuden valvonnassa käytetään hyväksitilastollista testausta.

Havainnot

Oletetaan, että erään valmistuserän ruuvien joukosta on poimittusatunnaisotos, jonka koko on n = 30

ja otokseen poimittujen ruuvien pituudet on mitattu.

Otosta kuvaavat seuraavattunnusluvut: Pituuksien aritmeettinen keskiarvo on

10.09 cm X =

ja pituuksienotoskeskihajonta on 0.1038 cm s=

Huomautus:

• Samaa aineistoa on tarkasteltu myös luvuissaTilastollisten aineistojen kuvaaminen jaVäliestimointi.

Taulukko oikealla esittää otokseen poimittujen ruuvien pituuksienluokiteltua frekvenssijakaumaa.

Kuva oikealla esittää otokseen poimittujen ruuvien pituuksien luokiteltua frekvenssijakaumaa vastaavaa histogrammia.

Luokkavälit määräävät kuvion suorakaiteiden kannat ja suorakaiteiden korkeudet on valittu niin, että suorakaiteiden pinta-alat suhtautuvat toisiinsa kuten vastaavat luokkafrekvenssit.

Luokkavälit Luokkafrekvenssit

(9.85,9.90] 1

(9.90,9.95] 2

(9.95,10.00] 6

(10.00,10.05] 3

(10.05,10.10] 5

(10.10,10.15] 4

(10.15,10.20] 5

(10.20,10.25] 3

(10.25,10.30] 1

Ruuvien pituuksien luokiteltu frekvenssijakauma

0 1 2 3 4 5 6 7

9.8 9.9 10.0 10.1 10.2 10.3 10.4

Pituus (cm)

Frekvenssi

(20)

Tilastolliset menetelmät 8. Tilastollinen testaus

Huomautus:

• Jos otantaa toistetaan, kaikki otosta koskevat tiedot (sekä havaintoarvot että niistä määrätyt otossuureet kuten aritmeettiset keskiarvot ja otoskeskihajonnat sekä havainto- arvojen jakaumaa kuvaavat graafiset esitykset kuten hisrogrammit) vaihtelevat

satunnaisesti otoksesta toiseen.

Ongelma: Onko otosinformaatio sopusoinnussa ruuvien pituuden varianssille ja odotusarvolle asetettujen tavoitearvojen kanssa?

Ratkaisu: Konstruoidaan otosinformaation ja ruuvien pituuden varianssin ja odotusarvon tavoitearvoille yhteensopivuuden tutkimista varten tarkoitukseen sopivattilastolliset testit.

Testausasetelmaa koskevat hypoteesit Määritellään satunnaismuuttujaX:

X = ruuvin pituus Yleinen hypoteesi H :

Otokseen poimittujen ruuvien pituudeteivät riipu toisistaan ja ruuvien pituudetvaihtelevat satunnaisesti noudattaen normaalijakaumaa:

X1,X2, … ,Xn

Xi ~ N(µ,σ2) ,i = 1, 2, … ,n

Pidämme testauksen aikana kiinni yleisestä hypoteesista H.

Nollahypoteesi H10 :

Ruuvien pituuksien varianssion korkeintaan 0.01 cm2 : H10 : σ2 ≤σ02 = 0.01 cm2

Vaihtoehtoinen hypoteesi H11 :

Ruuvien pituuksien varianssion suurempi kuin 0.01 cm2 : H11 : σ202 = 0.01 cm2

Ruuvien pituuksienvarianssia koskevaa nollahypoteesia H10 voidaan testata ns.χ2-testillä; ks. alla.

Nollahypoteesi H20 :

Ruuvien pituuksien odotusarvoyhtyy tavoitearvoonsa 10 cm:

H20 : µ µ= 0 = 10 cm Vaihtoehtoinen hypoteesi H21 :

Ruuvien pituuksien odotusarvopoikkeaa pituuden tavoitearvosta 10 cm:

H21 : µ µ≠ 0 = 10 cm

Ruuvien pituuksienodotusarvoa koskevaa nollahypoteesia H20 voidaan testata ns.t-testillä: ks. alla.

(21)

Tilastolliset menetelmät 8. Tilastollinen testaus

χ2-testi varianssille Yleinen hypoteesi H :

Otokseen poimittujen ruuvien pituudeteivät riipu toisistaan ja ruuvien pituudetvaihtelevat satunnaisesti noudattaen normaalijakaumaa:

X1,X2, … ,Xn

Xi ~ N(µ,σ2) ,i = 1, 2, … ,n Nollahypoteesi H10 :

Ruuvien pituuksien varianssion korkeintaan 0.01 cm2 : H10 : σ2 ≤σ02 = 0.01 cm2

Vaihtoehtoinen hypoteesi H11 :

Ruuvien pituuksien varianssion suurempi kuin 0.01 cm2 : H11 : σ202 = 0.01 cm2

Käytetääntestisuureenaχ2-testisuuretta

2 2

2 0

(n 1)s

χ σ

= −

jossa

2 2

1

1 ( )

1

n i i

s X X

n =

= −

on havaintojen (harhaton)otosvarianssi ja σ02 onnollahypoteesin H10 kiinnittämä parametrinσ2 arvo.

Voidaan osoittaa, ettätestisuureχ2 noudattaaχ2-jakaumaa vapaustein (n− 1),jos yleinen hypoteesi H ja ehto

2 2

σ =σ0

pätevät (ks. lukuaOtokset ja otosjakaumat):

2 2

(n 1)

χ χ −

Esimerkin tapauksessa otokseen poimittujen ruuvien pituuksienaritmeettinen keskiarvo oli 10.09 cm

X =

otokseen poimittujen ruuvien pituuksienotoskeskihajonta oli s = 0.1038 cm

janollahypoteesin H10kiinnittämä parametrin σ2arvo oli

2

σ0 = 0.01 cm2 Sitenχ2-testisuureen arvoksi saadaan

(22)

Tilastolliset menetelmät 8. Tilastollinen testaus

2 2

2

2 0

( 1) (30 1) 0.1038

31.246 0.01

n s

χ σ

− − ×

= = =

Voidaan osoittaa, että yllä määritellynχ2-testisuureennormaaliarvo elitestisuureen odotusarvo ehdon

2 2

σ =σ0

pätiessä on

2 2 2

E(χ σ| =σ0)= −n 1

χ2-testisuureen normaaliarvoonsa (n− 1) verrattunasuuret japienet arvot viittaavat siihen, että nollahypoteesi H10 ei päde.

Valitaanmerkitsevyystasoksi α = 0.05 Koskavaihtoehtoinen hypoteesi

H11 : σ202 = 0.01 cm2

onyksisuuntainen,hylkäysalueen määräämistä varten valitaankriittinen arvo tairaja χα2 siten, että

2 2

Pr(χ ≥χα)= =α 0.05

jossa satunnaismuuttujaχ2 noudattaaχ2-jakaumaa vapausastein (n – 1) = 29. Kriittinen arvo χα2 toteuttaa ehdon

2 2

Pr(χ ≤χα)= − =1 α 0.95 χ2-jakaumantaulukoista nähdään, että

Pr(χ2≥ 42.557) = 0.05 kun vapausasteiden lukumäärä (n – 1) = 29.

Siten haluttukriittinen arvo on:

2

χα = 42.557

Kuvio oikealla havainnollistaa kriittisen arvon määräämistä.

Valitaanχ2-testinhylkäysalueeksiα2,+∞)

Josχ2-testisuureen arvo joutuu hylkäysalueelle,nollahypoteesi H10 : σ2 ≤σ02

hylätään merkitsevyystasollaα = 0.05. Todennäköisyys, ettäχ2-testisuureen arvo joutuu ehdon

2 2

σ =σ

0 0.01 0.02 0.03 0.04 0.05 0.06 0.07

0.95

42.557 0.05 χ2(29)-jakauman tiheysfunktio

0 0.01 0.02 0.03 0.04 0.05 0.06 0.07

0.95

42.557 0.05 χ2(29)-jakauman tiheysfunktio

Viittaukset

LIITTYVÄT TIEDOSTOT

Ensimmäisen lajin virhe Havainnot Hylkäysalue Hylkäysvirhe Hypoteesi Hyväksymisalue Hyväksymisvirhe Maailman tila Nollahypoteesi Parametri Testi Testin tulos Testisuure Toisen

Kahden otoksen t-testi A Kahden otoksen t-testi B t-testi parivertailuille Testi varianssille Varianssien vertailutesti.. Testit

• Jos havainnot ovat normaalijakautuneita, Mannin ja Whitneyn testi ei ole yhtä voimakas kuin kahden riippumattoman otoksen t-testi. • Jos havainnot eivät ole

&gt;&gt; Laatueroasteikollisten muuttujien testit Testi suhteelliselle osuudelle Suhteellisten osuuksien vertailutesti. Testit

Aritmeettinen keskiarvo, Bernoulli-jakauma, Bernoulli-koe, χ 2 -jakauma, Frekvenssi, Harhaton estimaattori, Normaalijakauma, Odotusarvo, Otantajakauma, Otos, Otoskoko,

Hintikka (1969, 282) tuo tä- män esiin puhuessaan geometristen konstruktioiden löytämi- sen strategian mahdottomuudesta: ”Koska edellisten löytämi- nen on yleisessä muodossaan

Lopullinen keskiarvo laskettiin tulosaineistosta sen jälkeen, kun tuloksista poistettiin poikkeavat tulokset (Grubbs- testi) ja niiden laboratorioiden tulokset, jotka

Kerro miltä autoregressiivinen malli näyttäisi aineistolle Puuttuvan Muuttujan harha:.. Mikä on