• Ei tuloksia

Sosiologian väitöskirjoissa käytetyt monimuuttujamenetelmät

5. Tilastollisten menetelmien vaihteleva suosio

5.2. Sosiologian väitöskirjoissa käytetyt monimuuttujamenetelmät

väitöskirjo-jen määrät eroteltuna tilastollisia menetelmiä sisältäviin ja niitä sisältämättömiin.

Kuvassa kiinnittää huomiota 1990-luvulla alkanut väitöskirjojen määrän kasvu ja laadullisia menetelmiä sisältävien väitöskirjojen lisääntyminen. Tämän luvun kannalta keskeinen asia liittyy tilastollisia menetelmiä sisältävien väitöskirjojen määrän vertailuun siltä osin, ovatko väitöskirjoissa käytetyt tilastolliset menetel-mät kuvailevia menetelmiä ja testejä ilman monimuuttujamenetelmiä. Kuvaan on merkitty vihreällä viivalla ne väitöskirjat, joissa ei ole käytetty mitään tilastollisia menetelmiä ja harmaa viiva esittää tilastollisia menetelmiä sisältävien väitöskirjojen määrät. Harmaan viivan sisällä oleva harmaa alue osoittaa monimuuttujamenetel-mien osuuden tilastollisia menetelmiä sisältävistä väitöskirjoista. Harmaa alue pyrkii siis kuvaamaan, minkälainen osuus monimuuttujamenetelmillä on ollut kaikkien tilastollisten menetelmien käytössä. 180:n tilastollisia menetelmiä sisältävän väitös-kirjan joukossa on 123 väitöskirjaa, joihin sisältyy monimuuttujamenetelmiä ja 57 sellaista, joissa on käytetty pelkästään kuvailevia menetelmiä ja tilastollisia testejä.

Kuva 16 Sosiologiassa vuosina 1960–2007 tarkastetut väitöskirjamäärät eroteltuna tilastollisia menetelmiä ja monimuuttujamenetelmiä sisältäviin

Sosiologien väitöskirjoissaan käyttämien monimuuttujamenetelmien kirjaami-nen tutkimusaineistooni osoittautui haasteelliseksi. Sosiologit ovat maininneet menetelmät hyvin vaihtelevin käytännöin ja erilaisilla tarkkuuksilla. Joistakin väitöskirjoista en esimerkiksi löytänyt mainintaa menetelmän nimestä, mutta me-netelmän yhteydessä käytetyistä sanavalinnoista olen päätellyt tutkijan käyttäneen tiettyä menetelmää. Esimerkiksi sanoista odds ratio, OR tai ristitulosuhde olen päätellyt tutkijan käyttäneen logistista regressioanalyysia tai log-lineaarista ana-lyysia. Joissakin väitöskirjoissa esiintyi ristiriitaisuuksia menetelmän nimeämis-ten, menetelmäesittelyiden ja tulosten välillä. Tutkija on esimerkiksi kirjoittanut käyttäneensä varianssianalyysia, mutta hänen kuvaksensa menetelmästä ja hänen esittämänsä tulokset vaikuttavat logistiselta regressioanalyysilta (esim. Kainulainen 1998). Tällaisissa tilanteissa olen kirjannut menetelmän tutkijan käyttämää nimi-tystä kunnioittaen. Lisähaastetta menetelmien kirjaamisessa tutkimustani varten aiheutti myös se, että joidenkin menetelmien nimet ovat aikojen saatossa muuttu-neet. Erityisesti logistisen regressioanalyysin ja log-lineaarisen analyysin kirjaamiset aiheuttivat päänvaivaa. Nämä menetelmät olivat 1990-luvulla vielä melko uusia ja vähän tunnettuja eivätkä niiden nimet olleet vielä vakiintuneet. Tuolloin väitös-kirjoissa käytettiin vaihtelevasti nimityksiä log-lineaarinen analyysi, logit-analyysi ja logistinen regressioanalyysi menetelmästä, joka nykyisestä näkövinkkelistä katsottu-na olisi logistinen regressioakatsottu-nalyysi. 2000-luvulla nimitystapa näyttää vakiintuneen logistiseksi regressioanalyysiksi.

Väitöskirjoissa mainittuja tilastollisia analyysimenetelmiä ovat aakkosjärjestyk-sessä mainittuna AID-analyysi, Cox-regressioanalyysi, demografiset menetelmät, eksploratiivinen faktorianalyysi, elinaika-analyysi, erotteluanalyysi, faktorianalyysi, hierarkinen analyysi, kanoninen analyysi, klusterianalyysi, kohorttianalyysi, konfir-matorinen faktorianalyysi, korrespondenssianalyysi, lineaarinen regressioanalyysi, LISREL-analyysi, logistinen regressioanalyysi, logit-mallit, log-lineaarinen analyysi, MCA-analyysi, monisuuntainen varianssianalyysi, Poisson-regressioanalyysi, pol-kuanalyysi, pääkomponenttianalyysi, Q-metodologia, regressioanalyysi, ryhmittely-analyysi, transformaatioanalyysi ja varianssianalyysi yksisuuntaisena ja kaksisuuntai-sena. Olen ryhmitellyt menetelmät seuraaviin kokonaisuuksiin: Faktorianalyysin alle olen sijoittanut maininnat faktorianalyysista, eksploratiivisesta faktorianalyysis-ta sekä pääkomponenttianalyysisfaktorianalyysis-ta. Regressioanalyysin alle ole lukenut kuuluvaksi maininnat yhden selittäjän ja monen selittäjän regressioanalyysista sekä lineaarisesta regressioanalyysista. Logistisen regressioanalyysin, log-lineaarisen analyysin ja logit-mallien ryhmittely oli haastavaa, koska niiden osalta erityisesti on tapahtunut muutoksia menetelmien nimeämiskäytännöissä. Päädyin jakamaan menetelmät logistiseen regressioanalyysiin ja log-lineaariseen analyysiin. Varianssianalyysi pitää sisällään yksisuuntaisen, kaksisuuntaisen ja monisuuntaisen varianssianalyysin. Ryh-mittelyanalyysi on toiselta nimeltään klusterianalyysi, joten olen sijoittanut näihin liittyvät maininnat samaan ryhmään.

Taulukossa 3 näkyy sosiologian väitöskirjoissa eri aikoina käytetyt monimuuttu-jamenetelmät. Taulukossa esitetään erikseen sellaiset väitöskirjat, joissa tutkimus-aineistona on ollut rekisteriaineisto. Taulukosta käy ilmi, että rekisteriaineistoon sovelletut monimuuttujamenetelmät ovat erilaisia kuin ei-rekisteripohjaisiin aineis-toihin - joita kutsun taulukossa kvantitatiivisiksi aineistoiksi - sovelletut monimuut-tujamenetelmät. 123:sta monimuuttujamenetelmiä sisältävästä väitöskirjasta 100 on sellaisia, joissa analyysin kohteena on ollut kvantitatiivinen aineisto. 23 väitöskirjaa perustuu puolestaan rekisteriaineistojen analyysiin. Ensimmäinen rekisteriaineistoja hyödyntävä väitöskirja on tarkastettu vuonna 1989.

Taulukko 3 Sosiologian väitöskirjoissa käytetyt monimuuttujamenetelmät ja niiden käytön ajankohdat

Käytetyin monimuuttujamenetelmä sosiologian väitöskirjoissa on faktorianalyy-si. Faktorianalyysia sisältävien väitöskirjojen määrä on 56 ja niiden osuus on 10,5 % kaikista sosiologian väitöskirjoista. Erityisen suosittua faktorianalyysi oli vuosina

1968 ja 1969. Tuolloin tarkastettiin seitsemän väitöskirjaa, joista jokaisessa on käy-tetty faktorianalyysia. 1970-luvulla faktorianalyysin käyttö väheni, mutta edelleen enemmistö sosiologian väitöskirjoista (60 %) sisälsi faktorianalyysia. 1980-luvulla faktorianalyysin suosio laski, tuolloin vain kahdessa väitöskirjassa on käytetty fak-torianalyysia. Vuosien 2000–2009 aikana 12 väitöstutkijaa on käyttänyt faktoriana-lyysia tutkimuksessaan. Vuosina 2010–2018 faktorianafaktoriana-lyysia esiintyy kahdeksassa väitöskirjassa.

Toiseksi käytetyin menetelmä on lineaarinen regressioanalyysi. Menetelmää on käytetty 43 väitöstutkimuksessa, joista kahdeksan liittyy rekisteriaineistojen analy-sointiin. Kolmanneksi käytetyin on varianssianalyysi, jota esiintyy 33 väitöskirjassa.

Varianssianalyysin suosio sosiologien keskuudessa on ollut maltillista verrattuna kasvatustieteisiin, jossa se on nauttinut huomattavasti suurempaa suosiota. Lauri Nummenmaa (2004, 173) arvelee, että varianssianalyysi lienee yksi eniten käytetyistä tilastomenetelmistä kasvatustieteissä. Näiden kolmen menetelmän suosio perustuu osaltaan siihen, että ne olivat 1960-luvulla ainoat menetelmät, joita tietokoneilla pys-tyi suorittamaan, koska vain niille oli saatavissa tietokoneohjelmat (Alastalo 2014).

Logistinen regressioanalyysi on uudempi menetelmä kuin edellä mainitut. Ensim-mäinen logistista regressioanalyysia sisältävä väitöskirja on tarkastettu vuonna 1989.

Kuva 17 Neljän suosituimman monimuuttujamenetelmän esiintyminen sosiologian väitöskirjois-sa 1960-2018, ylärivi esittää lukumäärät ja alarivi osuudet

Kuva 17 havainnollistaa faktorianalyysin, regressioanalyysin, varianssianalyy-sin ja logistisen regressioanalyyvarianssianalyy-sin suosion sosiologian väitöskirjoissa vuovarianssianalyy-sina 1960–2018. Lukumäärätarkastelu paljastaa, että menetelmiä on käytetty

määrälli-sesti melko saman verran eri aikoina. Osuuksien tarkastelu tuo hyvin esiin fakto-rianalyysin 1960-luvulla vallinneen suosion. Myös regressioanalyysin suhteellinen suosio 1960-luvun jälkipuoliskolla tulee näkyviin. Menetelmien suhteellinen suosio 1980-luvulta alkaen on ollut jokseenkin vaatimatonta ja laskusuhdanteista, ainoas-taan logistisen regressioanalyysin suosiossa on havaittavissa hienoista kasvua.

Monimuuttujamenetelmien esiintyminen on jaoteltu taulukossa 4 menetelmien sisältämään ongelmanasetteluun perustuen. Taulukossa on jälleen erotettu omaan sarakkeeseen rekisteripohjaisia aineistoja sisältävät väitöskirjat. On huomattava, että väitöskirjoissa on voitu käyttää useita eri asetelmiin pohjautuvia menetelmiä, minkä vuoksi taulukon 4 yhteensä-lukumäärien summa on suurempi kuin monimuuttuja-menetelmiä sisältävien väitöskirjojen määrä.

Taulukko 4 Väitöskirjoissa esitetyt menetelmät ongelmanasettelunsa mukaan

Ongelmanasettelultaan tietoa tiivistäviä menetelmiä on käytetty 68 väitöskir-jassa. Rekisteriaineistojen analysoinnissa ei tähän ryhmään kuuluvia menetelmiä ole käytetty lainkaan. Suosituin tiivistäviin menetelmiin lukeutuva monimuuttu-jamenetelmä on ollut faktorianalyysi. Ryhmittelyanalyysia on käytetty yllättävän vähän siihen nähden, että erilaisten vastaajaryhmien etsiminen voisi hyvin sopia sosiologiseksi tutkimustavoitteeksi. Vähäisen käytön syinä ovat luultavasti menetel-män nuoruus ja se, että menetelmä on huonosti tunnettu. Vähäisen käytön syynä

on luultavasti myös se, että väitöskirjoissa on valittu menetelmäksi faktorianalyysi tilanteissa, joissa tutkimuskysymyksen, perustelujen ja tulkinnan perusteella mene-telmäksi olisi sopinut ryhmittelyanalyysi. Vaikka ryhmittelyanalyysi ja faktoriana-lyysi eroavat toisistaan tilastomatemaattisesti, tuottavat ne kvantitatiivisen aineiston analyysissa lopulta hyvin samankaltaisia tuloksia. Vähiten käytetty menetelmä on ollut korrespondenssianalyysi.

Jos katsotaan kvantitatiivisiin, ei-rekisteripohjaisiin, aineistoihin käytettyjä monimuuttujamenetelmiä, ovat toisella sijalla ovat asetelmaltaan selittämiseen pohjautuvat menetelmät. Jos taas katsotaan kaikkia monimuuttujamenetelmiä sisältäviä väitöskirjoja, ovat selittämiseen perustuvat menetelmät suosituimpia.

Kvantitatiivisia aineistoja käyttäneissä väitöskirjoissa yleisimmät selittävät menetel-mät ovat lineaarinen ja logistinen regressioanalyysi. Rekisteriaineistoja hyödyntävät väitöstutkimukset puolestaan ovat käyttäneet erityisesti Poisson-regressioanalyysia, Cox-regressioanalyysia mutta myös lineaarista regressioanalyysia.

Kolmannella sijalla taulukossa 4 ovat vastaajaryhmien analysointiin liittyvät menetelmät, joita on käytetty 47 väitöskirjassa. Monia ongelmanasetteluja sisältäviä menetelmiä on käytetty vähiten. Syynä vähäiseen käyttöön ei varmastikaan ole se, että menetelmät olisi koettu hyödyttömiksi vaan se, että tähän ryhmään kuuluvat menetelmät ovat kohtalaisen uusia ja vaativat erityisiä tilasto-ohjelmia.

6. Rajakohdemalli ja tieteiden välinen yhteistyö,