• Ei tuloksia

3.1 Havaintoarvot, odotusarvot ja khiin neliön kertymäarvot

N/A
N/A
Info
Lataa
Protected

Academic year: 2022

Jaa "3.1 Havaintoarvot, odotusarvot ja khiin neliön kertymäarvot"

Copied!
3
0
0

Kokoteksti

(1)

3.1 Havaintoarvot, odotusarvot ja khiin neliön kertymäarvot

Khiin neliön riippumattomuustestillä verrataan toisiinsa kahta muuttujaa tai kahta otosta.

Tyypillinen nollahypoteesi tälle testille on, että tutkittavat muuttujat ovat toisistaan riippumattomia (tai että otokset ovat peräisin samasta jakaumasta). Jotta muuttujien jakaumia voitaisiin testata, niiden havaintoaineisto tulee ristiintaulukoida ensin. Katso videosta ”Ristiintaulukointi”, miten ristiintaulukointi tapahtuu EXCEL:issä.

Oletetaan, että meillä on satunnaisotos, jossa on tietoa miesten ja naisten tupakoinnista (keksitty esimerkki). Ristiintaulukoidaan aineisto kuten yllä videossa ja tarkastellaan näin saadun taulukon jakaumia.

mies Nainen summa

ei tupakoi 20 32 52

tupakoi 30 18 48

summa 50 50 100

Tutkimuskysymys voisi olla, riippuuko tupakoiminen sukupuolesta. Nollahypoteesi on, että sukupuoli ja tupakointi ovat toisistaan riippumattomia. Khiin neliö -testillä ei suoraan pysty vastaamaan esimerkiksi kysymykseen, tupakoivatko miehet todennäköisemmin kuin naiset. Sen voimme saada kuitenkin selville arvioimalla asiaa pylväskaavion avulla.

Huomaa myös, että tutkimuskysymys ”tupakoivatko miehet useammin kuin naiset” vaatisi toisenlaista aineistoa, esimerkiksi tietoa siitä, miten monta savuketta kukin otokseen osallistuvista henkilöistä polttaa keskimäärin päivässä. Käyttämämme kuvitteellinen aineisto kertoo ainoastaan, tupakoivatko henkilöt ylipäätään vai eivät.

Khiin neliö -testissä lasketaan, millä todennäköisyydellä havaintoarvot pystyttäisiin arvaamaan ristiintaulukoidun taulukon sarakesummien ja rivisummien perusteella eli ns.

marginaalien perusteella. Ennen testin tekemistä täytyy siis laskea havaintoarvojen sarakesummat ja rivisummat. Niiden avulla lasketaan odotusarvot jokaiselle

ristiintaulukoidun havaintoaineiston solulle. Itse testissä lasketaan, miten paljon havaitut

(2)

arvot poikkeavat odotusarvoista. Kullekin ristiintaulukoidun havaintoaineiston solulle lasketaan odotusarvo seuraavalla kaavalla.

sarakesumma

i

∗rivisumma

j

otoskoko

Kaavassa alaindeksi i tarkoittaa sarakkeen numeroa ja se saa arvoksi positiivisia kokonaislukuja yhdestä ylöspäin, niin monta saraketta kuin kyseisellä muuttujalla on eri luokkia. Yllä taulukossa on molemmilla muuttujilla kaksi luokkaa (esim. muuttujalla tupakointi on luokat ”tupakoi” ja ”ei tupakoi”) ja siten myös kaksi saraketta, joten i voi saada arvoksi 1 tai 2. Alaindeksi j tarkoittaa rivin numeroa ja se saa arvoksi positiivisia kokonaislukuja yhdestä ylöspäin, niin monta riviä kuin kyseisellä muuttujalla on eri luokkia.

Yllä taulukossa on kaksi riviä, joten j voi saada arvoksi 1 tai 2.

Tietylle solulle khiin neliön odotusarvo lasketaan sen sarakkeen sarakesumman ja sen rivin rivisumman perusteella, missä kyseinen solu sijaitsee ristiintaulukoidussa taulukossa.

Esimerkiksi odotusarvo sille, että miehet tupakoivat lasketaan kaavalla 50∗48/100=24 (50 on 1. sarakkeen sarakesumma ja 48 on 2. rivin rivisumma). Eli tämän aineiston perusteella odotusarvo on, että 24 miestä tupakoi. Näin tehdään kaikille soluille ja saadaan

seuraavanlaiset odotusarvot neljälle eri solulle.

mies nainen summa

ei tupakoi 26 26 52

tupakoi 24 25 48

summa 50 50 100

Khiin neliö -testissä idea on laskea, miten paljon havaitut arvot (20, 32, 30, 18) poikkeavat näistä odotusarvoista (26, 26, 24, 24). Mitä lähempänä havaitut arvot ovat odotusarvoja, sitä pienempi tämä poikkeama on ja sitä todennäköisemmin nollahypoteesi jää voimaan.

(3)

Poikkeama lasketaan laskemalla kullekin solulle khiin neliön (χ2:n) kertymäarvo. Khiin neliön kertymäarvo lasketaan yksittäiselle solulle havaintoarvojen ja odotusarvojen avulla seuraavasti:

(havaintoarvot-odotusarvot)

2

odotusarvot

Esimerkiksi χ2:n kertymäarvo sille, että miehet tupakoivat saadaan laskemalla (30−24)2/24

= 36/24 = 1,5. Sama tehdään kaikille soluille ja näin saadaan seuraavat solukohtaiset kertymäarvot:

mies nainen

ei tupakoi 1,385 1,385

tupakoi 1,5 1,5

Koko taulukolle χ2:n kertymäarvo saadaan laskemalla yhteen kunkin solun kertymäarvo, joka yllä taulukossa olevien lukujen perusteella on pyöristettynä χ2 = 5,77. Koko taulukon kertymäarvo saadaan siis matemaattisella kaavalla:

∑(ℎ𝑎𝑣𝑎𝑖𝑛𝑡𝑜𝑎𝑟𝑣𝑜 − 𝑜𝑑𝑜𝑡𝑢𝑠𝑎𝑟𝑣𝑜)2 𝑜𝑑𝑜𝑡𝑢𝑠𝑎𝑟𝑣𝑜

Katso videosta ”Odotusarvojen laskeminen”, miten odotusarvojen, khiin neliön kertymäarvojen ja merkitsevyyden laskeminen tapahtuu EXCEL:issä.

Viittaukset

LIITTYVÄT TIEDOSTOT

Eli jos otetaan tämä, että miehet eivät tupakoi, niin kerrotaan sitä saraketta vastaava sarakesumma sitä riviä vastaavalla rivisummalla ja jaetaan otoskoolla..

Tässä seuraavalla rivillä on khiin neliön kriittinen arvo tapaukselle 0,05, eli tuossa on 3,84 ja risat, joka tarkoittaa sitä, että tuossa kun khiin neliön kertymäarvo on

Puhdistuksen myötä Sofi Oksaselle on annettu paikka suomalaisen kirjallisuuden eturivissä, ja ainakin itse haluan nähdä Oksasen menestyksen merkkinä siitä, että moni-

Kuten yllä viittasin, kysymykseen on ainakin kaksi pe- riaatteellista vastausta. Russellin tapauksessa objektiivi- suus-käsite ja sen ala voidaan erottaa toisistaan, joten

Ilman tällaista kehitystä ei olisi pohjaa ko- ville uutisille eikä siten kovien ja pehmeiden uutisten erolle Luc Van Poecken tarkoitta- massa mielessä.. Tämän historiallisen

Mutta mahdollinen on myos tammoi- nen painotus: »Pakkasella poltettiin myos halkoja .» Talia kertaa my os on painol- linen eika sen vaikutusalaa olekaan nyt

kunkin absoluuttinen arvo on illatiivissa (4. aste?) yli kaksi kertaa suurempi kuin partitiivissa (3. Siten on analysoitu aantamyksia, joissa suurimmat erot ovat

Ja vastaus kysymykseen mik- si l¨oytyy t¨at¨a kautta – siksi, ett¨a hyv¨aksytyist¨a m¨a¨aritelmist¨a niin (p¨a¨attelys¨a¨ant¨ojen avulla) seuraa?. Vastauksen takana