• Ei tuloksia

3.2 Vapausasteet, merkitsevyys ja khiin neliön oletukset

N/A
N/A
Info
Lataa
Protected

Academic year: 2022

Jaa "3.2 Vapausasteet, merkitsevyys ja khiin neliön oletukset"

Copied!
3
0
0

Kokoteksti

(1)

3.2 Vapausasteet, merkitsevyys ja khiin neliön oletukset

Khiin neliö -testin tilastollinen merkitsevyys saadaan vertaamalla havaintoaineistosta saatua χ2:n kertymäarvoa teoreettiseen χ2-jakaumaan. Teoreettinen χ2-jakauma on jatkuvakestoinen ja sen arvo riippuu taulukon vapausasteista. Mutta mitä vapausasteet tarkoittaa? Asiaa voisi lähestyä seuraavasti: jos tunnemme taulukon rivisummat ja sarakesummat, miten monen solun arvo ristiintaulukoidussa taulukossa voi vaihdella vapaasti. Jos taulukossa on kaksi riviä ja kaksi saraketta, kuten tupakointia koskevassa aineistossamme, tällöin ainoastaan yhden solun arvo voi vaihdella vapaasti, muiden solujen arvo määräytyy täysin tuon yhden solun sekä rivisummien ja sarakesummien perusteella. Jos taulukon vapausasteet ovat 2, se tarkoittaa sitä, että kahden solun arvo voi vaihdella vapaasti, mutta muut arvot voi laskea niiden kahden vapaasti vaihtelevan solun sekä rivi- ja sarakesummien perusteella. Vapausasteet khiin neliön tapauksessa viittaavat siis siihen, miten monen solun arvo voi vaihdella vapaasti. Vapausasteiden määrä khiin neliölle saadaan laskettua kaavalla:

(rivienmäärä−1)∗(sarakkeidenmäärä−1)

Rivien määrä ja sarakkeiden määrä tässä tarkoittavat ristiintaulukoidun taulukon rivien ja sarakkeiden määrää. Kuvitteelliselle aineistollemme rivien määrä on 2 ja sarakkeiden määrä on 2, ja tämän vuoksi sen vapausasteet = 1.

Tutkimuksessa on osoitettu, että kun havaintoaineiston otos on tarpeeksi suuri, sen

jakauma approksimoi teoreettista khiin neliö -jakaumaa. Näin ollen, vaikka khiin neliö -testi on epäparametrinen testi, sillä on siis oletuksia. Yksi näistä oletuksista on se, että

otoskoon täytyy olla tarpeeksi suuri, muuten p-arvon approksimointi teoreettisesta khiin neliö -jakaumasta ei ole luotettava. Riittävä otoskoko määritellään seuraavasti (ks.

Cochran 1952):

(2)

· 2x2 taulukossa jokaisen solun odotusarvo (huom! ei havaintoarvo) on oltava vähintään viisi

· suuremmissa taulukoissa 80 prosentissa soluista odotusarvon on oltava vähintään viisi ja kaikissa soluissa odotusarvon on oltava suurempi kuin nolla.

Huomaa vielä, että khiin neliö -testin rajoitus koskee odotusarvoja, ei havaintoarvoja.

Tässä kannattaa olla erittäin tarkkana, koska usein tulee huolestuttua, jos havaintoarvot ovat pieniä, vaikka pitäisi pikemminkin tarkastella havaintoarvojen suuruutta. Khiin neliö - testiä voi siis käyttää, vaikka havaintoarvoissa jokin frekvenssi olisi pienempi kuin viisi, kunhan vain odotusarvot ovat tarpeeksi suuret.

Toinen oletus/rajoitus khiin neliö -testille on sen suuntaisuus. Khiin neliö -testin avulla ei voi suoraan päätellä, onko muuttujien välillä suora suhde vai esiintyykö niiden välillä käänteinen suhde. Tämän arvioimiseksi on käytettävä muita keinoja, kuten Pearsonin residuaaleja tai vetokertoimien suhdetta. Näihin voit tutustua lisälukemistosta (mm. Gries 2013: 186–187).

Khiin neliö -testissä oman havaintotaulukon p-arvo lasketaan siis teoreettisen jakauman perusteella, kun on ensin varmistuttu odotusarvojen riittävästä suuruudesta. Testissä otoksen pohjalta laskettua khiin neliön kertymäarvoa verrataan vapausasteiltaan vastaavaan teoreettiseen jakaumaan ja arvioidaan, miten poikkeava kertymäarvo on suhteessa jakauman muihin arvoihin. Jos taulukon vapausasteet = 1, tällöin khiin neliön kertymäarvo 3,8415 on ns. kriittinen arvo, eli sitä vastaava p-arvo on 0,05. Eli jos kyseessä on 2x2-taulukko ja khiin neliön kertymäarvo on suurempi kuin 3,8415, tällöin muuttujien välillä esiintyy tilastollisesti merkitsevä riippuvuus ja p-arvo on pienempi kuin 0,05.

Tupakointiaineistolle χ2:n kertymäarvo on pyöristettynä 5,77. Tämä on selvästi suurempi kuin kriittinen arvo 3,84. Näin ollen voidaan todeta, että kuvitteellisessa aineistossa

tupakoinnin ja sukupuolen välillä esiintyy tilastollisesti merkitsevä riippuvuus. Saamaamme kertymäarvoa vastaava tarkka p-arvo on 0,016, joka saadaan englanninkielisessä

EXCEL:issä funktion CHISQ.DIST.RT avulla (suomenkielisessä versiossa funktio on CHINELIÖ.JAKAUMA.OH). Funktiolle annetaan kaksi arvoa, jotka erotetaan toisistaan puolipisteellä: khiinneliön kertymäarvo; vapausasteet).

(3)

Tilastollisia tuloksia raportoidessa on tärkeä ilmoittaa testisuure, vapausasteet sekä p- arvo. Saamamme tulos voidaan siis raportoida seuraavasti: aineiston perusteella henkilön tupakoiminen riippuu hänen sukupuolestaan tilastollisesti merkitsevällä tavalla (χ2 = 5,77;

df = 1; p = 0,016).

Viittaukset

LIITTYVÄT TIEDOSTOT

Kun p-arvo on pienempi kuin 0,05, mutta suurempi kuin 0,01 sanotaan, että tulos on tilastollisesti melkein merkitsevä.. Jos tuolla p-arvolla tulos hyväksytään, eli uskotaan, että

Laske kohta, missä taivutusmomentin maksimiarvo esiintyy ja laske myös kyseinen taivutusmo- mentin maksimiarvo.. Omaa painoa ei

Kuinka monta prosenttia kuvassa olevan pienemmän neliön sivun pituus on suuremman neliön sivun pituudesta?. Kuinka monta prosenttia pienemmän neliön pinta-ala on suu- remman

Kielentutkimuksessa muuttujat ovat usein luokitteluasteikollisia, joten khiin neliö -testi sopii monenlaisten kielellisten muuttujien tutkimiseen.. Sitä pidetään

Yllä taulukossa on molemmilla muuttujilla kaksi luokkaa (esim. muuttujalla tupakointi on luokat ”tupakoi” ja ”ei tupakoi”) ja siten myös kaksi saraketta, joten i voi saada

EXCEL-taulukossa ”Khiin neliö” on valmiina kaikki tarvittavat funktiot khiin neliö -testin suorittamiseksi ristiintaulukoidulle aineistolle eri vapausasteille.. Videossa

Tässä seuraavalla rivillä on khiin neliön kriittinen arvo tapaukselle 0,05, eli tuossa on 3,84 ja risat, joka tarkoittaa sitä, että tuossa kun khiin neliön kertymäarvo on

Yritysten muodostumista ja rakennetta selvittä- vät teoriat eivät vielä ole kehittyneet niin pitkälle, että niiden avulla voitaisiin ymmärtää, miten yri- tykset