• Ei tuloksia

6 TUTKIELMAN TOTEUTUS

6.5 Tutkielmassa käytetyt analyysimenetelmät

Taulukossa 13 on esitetty analyysimenetelmät tutkimusongelmittain. Taulukon jälkeen seuraa lyhyt kuvaus tutkielmassa käytetyistä analyysimenetelmistä.

TAULUKKO 13. Analyysimenetelmät tutkimusongelmittain

Tutkimusongelma Analyysimenetelmä

1. Millainen on koulutukseen hakeneiden persoonalli-suus, itsetunto ja uranvalintamotiivit?

kuvailevat tunnusluvut; frek-venssit, prosentit, keskiarvot ja keskihajonnat

1.1 Eroavatko miehet ja naiset näiden tekijöiden

suhteen? riippumattomien otosten

t-testi 1.2 Eroavatko eri yliopistoihin hakeneet näiden

teki-jöiden suhteen?

yksisuuntainen varianssiana-lyysi (ANOVA), post hoc – vertailu (Tukey HSD) 1.3 Onko koulutukseen hakeneiden taustoilla

yhteyt-tä persoonallisuuteen, itsetuntoon ja

uranvalintamo-tiiveihin? Pearsonin korrelaatio

2. Mitkä hakijan tekijät ovat yhteydessä valintakokeissa

saataviin pisteisiin? keskiarvot ja keskihajonnat

2.1 Onko hakijoiden taustoilla, persoonallisuudella, itsetunnolla ja uranvalintamotiiveilla yhteyttä valin-takokeiden eri osioista saataviin pisteisiin?

Pearsonin korrelaatio 2.2 Onko hakijoiden taustoilla, persoonallisuudella,

itsetunnolla ja uranvalintamotiiveilla yhteyttä valin-takokeissa saataviin kokonaispisteisiin?

Pearsonin korrelaatio 3. Miten sukupuoli sekä haastattelun ja ryhmätilanteen

järjestelyt vaikuttavat niissä menestymiseen? keskiarvot ja keskihajonnat 3.1 Onko hakijan sukupuolella yhteyttä

valintako-keen kirjallisiin osuuksiin

riippumattomien otosten t-testi

3.1 Onko hakijan sukupuolella ja arvioitsijoiden su-kupuolella yhteyttä haastattelusta ja

3.2 Vaikuttaako haastattelusta saataviin pisteisiin

se, monentenako hakija näihin menee? Pearsonin korrelaatio 3.3 Vaikuttaako ryhmätilanteesta saataviin pisteisiin

se, monentenako hakija näihin menee ja missä ryh-mässä hän on?

Pearsonin korrelaatio sisäkorrelaatio 4. Mitkä tekijät selittävät hakijoiden opiskelemaan

pää-semistä

4.1 Mitkä tekijät selittävät hakijan valituksi tule-mista?

logistinen askeltava regres-sioanalyysi

4.2 Ovatko selitysmallit erilaisia eri yliopistoissa? logistinen askeltava regres-sioanalyysi

T-testi

Sukupuolten vertailussa (tutkimusongelmat 1-3) hyödynnettiin riippumattomien otos-ten t-testiä (independent samples t-test). Sen taustaoletuksena on vertailtavien ryh-mien toisistaan riippumattomuus, kuten tässä miesten ja naisten osalta oli ja tavoit-teena on verrata ryhmien keskiarvoja toisiinsa (Heikkilä 2004, 224). T-testissä testa-taan ovatko kahden ryhmän keskiarvot yhtä suuret ja yleistettävissä perusjoukkoon (Valli 2001, 80-81).

T-testi huomioi varianssien yhtä- ja erisuuruuden. (Heikkilä 2005, 230.) Vaikkakin Nummenmaa (2004, 166) ilmoittaa, ettei t-testiä tulisi käyttää, jos varianssit ovat erisuuret, on t-testin käyttö hyvin yleistä sellaisissakin tapauksissa. Esimerkiksi Heik-kilä (2005, 232), Metsämuuronen (2006, 533) ja Valli (2001, 81) kehottavat sitä käyt-tämään.

Varianssianalyysi

Varianssianalyysiä voidaan käyttää, kun riippumattomat muuttujat ovat laatueroas-teikollisia ja riippuva taas vähintään välimatka-asteikollinen. Analyysissä tarkastellaan, kuinka paljon tutkittavien yksiköiden kuuluminen eri riippumattomien muuttujien (efektimuuttujien) ryhmiin selittää tulosten vaihtelua eli varianssia verrattuna vaihte-luun eri ryhmien sisällä. (Toivonen 1999, 250.) Varianssianalyysissä huomioidaan kes-kiarvojen lisäksi kuhunkin keskiarvoon liittyvä virhe eli keskiarvon keskivirhe (stan-dard error of mean) (Metsämuuronen 2006, 708).

Varianssianalyysi voi olla yksisuuntainen (Oneway ANOVA), jolloin ryhmitteleviä muut-tujia on yksi. (Metsämuuronen 2006, 708.) Yksisuuntainen varianssianalyysi (ANOVA) on t-testin tavoin parametrinen testi, joka vertailee useamman kuin kahden ryhmän keskiarvoja toisiinsa samanaikaisesti (Valli 2001, 82). Analyysin taustaoletuksena on, että havainnot ovat toisistaan riippumattomia, ryhmien populaatiot normaalisti jakau-tuneita ja varianssit yhtä suuria. Varianssien yhtäsuuruutta voidaan testata varianssi-en yhtäsuuruustestillä (Homogvarianssi-eneity-of Variance). (Metsämuuronvarianssi-en 2006, 710 - 711)

Varianssianalyysi sopi ensimmäiseen tutkimusongelmaan, jossa vertailin eri yliopistoi-hin hakeneiden eroja persoonallisuudessa, itsetunnossa ja uranvalintamotiiveissa. Täl-löin oletuksena oli, että näiden ryhmien keskiarvot tutkittavissa ilmiöissä ovat yhtä suuret. Havaintoja voidaan pitää toisistaan riippumattomina. Normaalisuutta

tarkas-teltiin silmämääräisesti, jota tuki myös otoskoon suuruus. Varianssien yhtäsuuruustes-ti osoityhtäsuuruustes-ti, että analyysiä voidaan käyttää ryhmien vertailuun (p=,033-,928). Vaikkakin ajautuminen muiden tukemana –uranvalintamotiivi (p=,033) jäi tilastollisesti merkit-seväksi, voidaan F-testiä pitää melko vakaana varianssien yhtäsuuruus-oletuksen rik-kouduttua (Metsämuuronen 2008, 723).

ANOVA-testi kertoo tilastollisesti merkitsevistä eroista, mutta ei sitä, mitkä ryhmät poikkeavat toisistaan. Post hoc – vertailujen avulla voidaan verrata kaikkia ryhmiä kaikkiin muihin ryhmiin. Tukeyn HSD (Honestly Significant Differences) –testi on kah-den otoksen t-testi laskettuna siten, että virheterminä on varianssianalyysissä laskettu virhe. Sitä pidetään kohtalaisen turvallisena käyttää. (Nummenmaa 2004, 196.) Ver-tailussa ryhmät ryhmitellään luokiksi sen mukaan, kuinka voimakkaasti niiden keskiar-vot eroavat toisistaan (Metsämuuronen 2008, 724).

Kaksisuuntainen varianssianalyysi

Kaksisuuntaisen varianssianalyysin avulla voidaan tutkia samanaikaisesti kahden kate-gorisen muuttujan vaikutusta riippuvaan muuttujaan Nummenmaa 2004, 201). Tällai-nen tapaus oli kyseessä tutkimusongelmassa kolme, jossa arvioitiin hakijan sukupuo-len sekä arvioitsijoiden sukupuosukupuo-len vaikutusta hakijan haastattelusta saamiin piste-määriin. Analyysin avulla tutkitaan, onko kategorisilla muuttujilla päävaikutusta tai niillä yhdessä yhdysvaikutusta tutkittavaan ilmiöön. Mikäli keskiarvot ovat erilaisia yh-den muuttujan eri tasoilla, on kyseessä päävaikutus. Jos taas riippuvan muuttujan keskiarvot ovat erilaisia eri tasojen yhdistelminä, on kyse yhdysvaikutuksesta. (Num-menmaa 2004, 202 - 203.)

Pearsonin korrelaatio ja sisäkorrelaatio

Pearsonin korrelaatiokerrointa hyödynnettiin tutkittaessa ensimmäisessä ja toisessa tutkimusongelmassa hakijoiden taustatekijöiden yhteyttä persoonallisuuteen, itsetun-toon ja uranvalintamotiiveihin sekä näiden yhteyksiä valintakokeiden eri osioissa saa-taviin pistemääriin. Pearsonin korrelaatiota esiteltiin tarkemmin sivulla 57.

Sisäkorrelaation tulkinta sopi puolestaan siihen, onko tiettyyn ryhmään kuulumisella merkitystä hakijan saamien pistemäärien vaihtelussa (tutkimusongelma 3). Sisäkorre-laation tutkiminen soveltuu tilanteisiin, joissa tutkittavalla aineistolla hierarkkinen

luonne. Tämä tarkoittaa sitä, että henkilöiden jakautumisessa tiettyihin ryhmiin, osa-joukkoihin, seuraa siitä jonkinlaista homogenisoitumista ryhmän sisällä ja ryhmän jä-senten välille syntyy riippuvuussuhde. Käytännössä sisäkorrelaatio ilmaisee hakijan pistemäärien riippuvuutta ryhmänsä sisällä suhteessa kaikkiin muihin ryhmiin. (God-steiniä 2003 lainaten Ellonen 2006, 129 - 130.)

Sisäkorrelaation arvo saadaan jakamalla ryhmien välinen varianssi tarkasteltavan muuttujan kokonaisvarianssilla. Sisäkorrelaation arvo vaihtelee välillä 0-1. Jos ryhmi-en väliset keskiarvojryhmi-en erot kasvavat, niin myös ryhmiryhmi-en välinryhmi-en varianssi kasvaa. Jos taas ryhmien sisäinen varianssi suhteessa koko varianssiin pienenee, niin sitä suurem-pi on ryhmien välisen varianssin osuus kokonaisvarianssista. Tällöin sisäkorrelaation arvo kasvaa ja lähenee ykköstä. Mitä lähempänä ykköstä sisäkorrelaation arvo on, sitä todennäköisemmin kyse on ryhmätason ilmiöstä. Lähellä nollaa arvo viittaa yksilöta-son ilmiöön. SPSS:n avulla saatujen varianssien estimaattien tulostusten avulla sisä-korrelaatio voidaan laskea kaavalla: var1/(var1+var(Error). (Jokivuori 2009.)

Logistinen regressioanalyysi

Neljännessä tutkimusongelmassa pyrin selittämään hakijoiden valintaa koulutukseen useiden hakijaan liittyvien tekijöiden avulla. Kyse oli binäärisestä mallista, sillä selitet-tävä muuttuja oli kaksi-luokkainen (ei-valittu/valittu). Tavoitteena oli löytää malleja perustuen todennäköisyyksiin kuulua valittujen ryhmään. (Nummenmaa 2004, 319).

Logistisessa regressioanalyysissä pyritään luomaan matemaattinen malli, joka ennus-taa selitettävän muuttujan vaihtelua selittävien muuttujien avulla (Nummenmaa 2004, 320). Logistisen mallin etuna on, että selittävät muuttujat voivat olla millä tahansa as-teikolla mitattuja, eikä se tee yhteyksien laadusta tai muuttujien jakaumista niin vah-voja oletuksia kuin lineaariset regressiot. (Nummenmaa 2004, 319 - 320.)

Logistinen askeltava regressioanalyysi asettaa muuttujat paremmuusjärjestykseen nii-den tilastollisen merkitsevyytensä suhteen. Se siis etsii muuttujajoukosta sellaisia te-kijöitä, jotka pystyvät selittämään hakijan valintaa koulutukseen. (Metsämuuronen 2008, 670.)

Nagelkerke pseudo R2 on ns. pseudo R2 –kerroin, joka estimoi mallin sopivuutta. Tut-kimukseeni liitettynä se siis arvioi, kuinka paljon hakijan koulutukseen valinnan

vaih-telusta voidaan kuvata mallin avulla. (Nummenmaa 2004, 326.) Negelkerkenin R-neliö siis kertoo mallin selitysasteen (Metsämuuronen 2008, 652).

Selittäjien merkitys ilmenee riskisuhteiden muutoksien (Exs(B)) tarkasteluissa. Se il-mentää, kuinka paljon selittävän muuttujan kuuluminen tiettyyn luokkaan kasvattaa todennäköisyyttä sille, että tutkittava kuuluu selittävän muuttujan referessikategori-aan. (Nummenmaa 2004, 326 - 327.) Tässä yhteydessä riskisuhteiden muutokset il-maisevat hakijan todennäköisyyttä tulla valituksi koulutukseen, mikäli hän kuuluu mallissa oleviin muuttujiin. Tämä soveltuu erityisen hyvin luokitteluasteikollisille muut-tujille, kuten esimerkiksi sukupuolelle.

Välimatka-asteikollisissa ja jatkuvissa muuttujissa mallin tulkinta hieman hankaloituu.

Tällöin mallin tulkinnassa käytetään suhteellista selitysvoimaa, jota kuvataan tunnus-luku R:llä. Tunnustunnus-luku R vastaa jossain määrin lineaarisen regression Beta-saraketta.

Se lasketaan kaavalla SQSORT((Wald-2)/-2LL0). (Nevalinna 2002.)