• Ei tuloksia

Rajakohdemallin laajentaminen monimuuttujamenetelmiin

9. Monimuuttujamenetelmien monet kasvot

9.1. Rajakohdemallin laajentaminen monimuuttujamenetelmiin

ja tilastotieteen moninaisuutta. Sosiologit ovat valinneet faktorianalyysin monin eri perustein, he ovat käyttäneet sitä monin eri tavoin. Menetelmä on kehittynyt monen eri tieteen panoksena ja se voidaan nähdä monin matemaattisin ja tutkimus-menetelmällisin tavoin. Kaiken moninaisuuden haltuunotto yhdessä tutkimuksessa on mahdotonta enkä ole sellaista tavoitellutkaan.

Tutkimusta voisi jatkaa laajentamalla tässä tutkimuksessa esitettyä rajakoh-demallia (kuva 43) koskemaan kaikkien monimuuttujamenetelmien valintaa ja käyttötapaa sosiologisessa tutkimuksessa. Kauttakulkupisteinä toimisivat kriteerit, joilla menetelmävalinta perustellaan ja joiden mukaan menetelmää käytetään. Yksi kauttakulkupiste tarjoaisi tilastomatematiikkaan ja muuttujiin matemaattisiin ominaisuuksiin pohjautuvia perusteluja. Toinen kauttakulkupiste perustuisi moni-muuttujamenetelmien sisältämiin asetelmiin. Kolmas kauttakulkupiste puolestaan korostaisi sosiologisen tutkimuskysymyksen keskeisyyttä menetelmävalinnassa ja tavassa, miten menetelmää käytetään. Rajakohdemallin verkostoina toimisivat monimuuttujamenetelmiä käyttävät tilastotieteilijä(t), tutkija(t) ja sosiologi(t).

Rajakohdemallin kääntämiset puolestaan olisivat kamppailuja tieteellisestä aukto-riteetista eli siitä, mikä kauttakulkupiste tarjoaa vakuuttavimmat perustelut moni-muuttujamenetelmän valintaan ja käyttöön.

Kauttakulkupisteet – monimuuttujamenetelmät tilastomatematiikkana, ongelmanasetteluina ja tutkimusmenetelminä

Kuvassa 42 havainnollistetaan faktorianalyysin lisäksi muiden monimuuttujamene-telmien eli regressioanalyysin, varianssianalyysin ja ryhmittelyanalyysin näyttäyty-minen kolmessa kauttakulkupisteessä.

Kuva 42 Monimuuttujamenetelmien näyttäytyminen rajakohdemallin kauttakulkupisteinä

Useimmissa monimuuttujamenetelmiä esittelevissä teoksissa menetelmien esit-tely ja niiden jaottelu pohjautuu muuttujiin ja niiden ominaisuuksiin (Tacq 1997, 1). Tilastomatematiikkaan perustuvassa kauttakulkupisteessä menetelmät näyttäy-tyvät muuttujina, matemaattisina yhtälöinä ja laskutoimituksina. Faktorianalyysi esitetään yhtälöryhmänä, jossa havaitut yi-muuttujat pyritään kuvaamaan faktorin η, faktorilatausten λi ja virhetermien εi avulla. Regressioanalyysiin sisältyy yhtälö, jossa xi-muuttujien vaikutusta y-muuttujan vaihteluun tarkastellaan regressioker-rointen βi avulla. Varianssianalyysissa vertaillaan yhden muuttujan keskiarvoja eri havaintoryhmissä. Vertailu perustuu yhtälöihin, joissa lasketaan erilaisia poikkeamia kokonaiskeskiarvosta ja ryhmäkeskiarvosta sekä määritellään erilaisia vaihteluja kuvaavia neliösummia. Ryhmittelyanalyysi perustuu myös keskiarvolaskelmiin, joiden perusteella määräytyvät niin sanotut ryhmäkeskukset. Ryhmittelyanalyysissa vertaillaan havaintojen etäisyyttä ryhmäkeskuksiin pyrkimyksenä sijoittaa kukin havainto lähimpään ryhmäkeskukseen kuuluvaksi.

Asetelmaan perustuvassa kauttakulkupisteessä monimuuttujamenetelmät voi-daan jakaa monin tavoin. Luvussa 4.3 menetelmät jaettiin tiivistäviin ja ryhmittä-viin menetelmiin, selittämiseen perusturyhmittä-viin menetelmiin, ryhmävertailuja tekeryhmittä-viin menetelmiin sekä monia menetelmiä sisältäviin menetelmiin.

Sosiologisen tutkimuskysymyksen kauttakulkupisteessä monimuuttujamene-telmän on palveltava tutkimusta tukevana analyysimenemonimuuttujamene-telmänä. Kvantitatiivisen aineiston analyysiin etsitään monimuuttujamenetelmiä, jotka asetelmaltaan vastaavat sosiologisen tutkimuskysymyksen käsitteellistä rakennetta ja sopivat

yh-teen tutkimuskysymysten valittujen elementtien kanssa. Faktorianalyysi voi sopia aineiston analyysimenetelmäksi, jos sosiologisessa tutkimuskysymyksessä viitataan teoreettisiin käsitteisiin tai käsitteiden ulottuvuuksiin. Regressioanalyysiin viittaa-via elementtejä puolestaan ovat maininnat tarkasteltavaan asiaan yhteydessä olevista tekijöistä. Jos sosiologisessa tutkimuskysymyksessä tuodaan esille tarve löytää erilai-sia vastaajaryhmiä, saattaisi ryhmittelyanalyysi olla hyödyllinen.

Kauttakulkupisteen valinta tapahtuu periaatteessa siten, että osapuolet pun-taroivat niiden tarjoamia näkemyksiä ja valitsevat niistä vakuuttavimman. To-dellisuudessa monimuuttujamenetelmien valinnat ja käyttötavat sisältävät usean kauttakulkupisteen tarjoamia perusteluja. Tilastotieteilijä katsoo menetelmiä muuttujien ja niiden tilastomatemaattisten ominaisuuksien näkökulmasta, mutta hän näkee menetelmät myös asetelmallisesta näkökulmasta. Sosiologille keskeisintä on asetelman vastaavuus tutkimusongelman käsitteellisen rakenteen kanssa, mutta hänen on jossakin määrin huomioitava myös menetelmään valittavien muuttujien tilastomatemaattiset kriteerit (Tacq 1997; Alkula ym. 1994, 284–285; Byrne 2001;

2004; Ronkainen ym. 2013, 125–126).

Tilastomatemaattisten kriteerien huomioiminen on sosiologisessa tutkimuksessa haasteellista. Ensimmäiseksi haasteeksi asettuu normaalijakaumavaatimus, jonka useat monimuuttujamenetelmät asettavat muuttujille (Tacq 1997, 31). Tähän vaati-mukseen sosiologiset aineistot harvoin pystyvät vastaamaan, koska kvantitatiivisissa sosiologisissa tutkimusaineistoissa muuttujien jakaumat ovat usein vinoja.

Toinen haaste liittyy muuttujien mitta-asteikoihin. Sosiologit joutuvat kamp-pailemaan mittaamisen problematiikan kanssa tasapainotellen sen suhteen, kuinka paljon huomioida aineistossa olevien muuttujien matemaattisia ominaisuuksia ja toisaalta, kuinka paljon tulisi kiinnittää huomioita sisältöön, jota ne kuvastavat tut-kittavasta ilmiöstä. Jos sosiologit noudattaisivat mitta-asteikkovaatimuksia tiukasti, olisi heidän käytettävissään melko suppea menetelmävalikoima. Analysoidakseen kvantitatiivisia aineistojaan mahdollisimman monipuolisesti sosiologit joutuvat rikkomaan menetelmien tilastotieteellisiä mitta-asteikkosääntöjä. Toisaalta ei voida puhua varsinaisesti sääntöjen rikkomisesta, koska mittaaminen ja mittaustulokset ovat sosiologiassa muutakin kuin numeroilla määriteltyä tietoa. Kuten Ronkainen ym. (2013, 122) toteavat, tutkijalle aineisto on tiedon tuottamisen väline eikä se koskaan edusta puhtaasti todellisuutta. Sosiologi saa numeroiden avulla suuntaa antavan käsityksen ilmiöstä. Sosiologi ei voi kuitenkaan rajautua mittaustulosten käsittelyssä vain tilastomatematiikan sääntöihin vaan hänen on koko ajan pohdit-tava, millä tavalla ilmiötä heijastavia numeroita voisi analysoida, jotta ilmiön saisi kuvattua parhaalla mahdollisella tavalla.

Vaikka sosiologille mitta-asteikkoajattelu ei ole niin keskeistä, on kuitenkin ole-massa tilanteita, joissa muuttujien ominaisuuksien – mitta-asteikkojen ja jakaumien – tunnistaminen auttaa sosiologia valitsemaan parhaan mahdollisen menetelmän aineistonsa analyysiin. Esimerkkinä mainittakoon Köpän (1979, 37–40)

sosiolo-gian väitöskirja, jossa hän esittää tarkan kuvauksen käyttämästään AID-analyysista eli puuanalyysista. Kuvaus muistuttaa paljolti ryhmittelyanalyysia. Köppä arvioi, että AID-analyysin vaihtoehtona olisi ollut moniulotteinen ristiintaulukointi ja regressioanalyysi. Hän kertoo kuitenkin päätyneensä AID-analyysiin, koska piti sitä taulukointia tehokkaampana ja taloudellisempana ja alhaisille mittaustasoille sopi-vampana menetelmänä kuin lineaarinen regressioanalyysi. Toinen esimerkki liittyy tilanteeseen, jossa sosiologi haluaa etsiä aineistostaan selittäviä tekijöitä jollekin asialle. Tällöin asetelmaltaan sopivia menetelmiä ovat lineaarinen regressioanalyysi ja logistinen regressioanalyysi (kuva 43). Lineaarisen regressioanalyysin tilastomate-matiikka vaatii muuttujilta vähintään välimatka-asteikollisuutta ja muuttujien nor-maalijakautuneisuutta, kun taas logistisen regressioanalyysin tilastomatematiikka perustuu todennäköisyyslaskentaan ja sen kaltaisiin matemaattisiin muunnoksiin, että muuttujat voivat olla mitta-asteikoltaan mitä tahansa. Sosiologille menetelmä-valinnan matemaattiset kriteerit ja mitta-asteikkovaatimukset eivät ole ensisijaisia, mutta jonkinlainen ymmärrys menetelmiin liittyvästä matematiikasta ja niihin kyt-köksissä olevista muuttujien mitta-asteikko- ja jakaumavaatimuksista on kuitenkin hänelle hyödyksi (ks. esim. Saari ja Melin 2020, 50).

Kuva 43 Lineaarisen ja logistisen regressioanalyysin asetelmallinen yhtäläisyys ja matemaattinen eroavaisuus

Menetelmiin liittyvät lineaarisuus- ja kausaalisuusoletukset ovat myös sosio-logisen tutkimuksen kannalta haasteellisia. Selkälä (2013, 117–119) tuo esille Byrnen (2002; 2004) näkemyksen, jonka mukaan regressioanalyysia ja faktoriana-lyysia ei sopisi käyttää, koska ne kausaalisuuteensa ja lineaarisuuteensa takia eivät vastaa tutkittavan todellisuuden rakennetta. Byrnen mukaan sopivia ei-lineaarisia menetelmiä ovat ryhmittelyanalyysi, korrespondenssianalyysi ja neuroverkko-mallit. Selkälä (2013, 118) näkee, että menetelmät on kuitenkin nähtävä vain menetelminä, mutta toki niiden kohdalla on pohdittava kuinka suuressa määrin

ne muovaavat aineistoa sellaiseen suuntaan, että se ei enää vastaa todellisuuden teoreettista rakennetta.

Alkula ym. (1994, 17) toteavat, että erilaisten lähestymistapojen ja näkökulmien vaihdellessa ei mikään menetelmällinen ratkaisu ole ainoa oikea jonkin tutkimus-ongelman selvittämisessä. Käyttökelpoisia ratkaisuja voi olla heidän mukaansa olla useita ja valinta niiden välillä joskus vaikeakin. Pöntinen (2004, 90–91) toteaa, että olisi hyvä, jos tutkija valitsisi käyttämänsä menetelmät aina niiden käyttökelpoisuu-den perusteella. Kuten Alkula ym. (1994, 285) toteavat, ovat kuvailevat menetelmät yksinkertaisia ja havainnollisia. Kuvailevien menetelmien tuloksia on kohtalaisen helppo ymmärtää. Monimuuttujamenetelmät puolestaan pystyvät tiivistämään in-formaatiota tehokkaammin, mutta monimuuttujamenetelmien haasteena on tiedon abstraktius. Kunkin monimuuttujamenetelmän tulkinta on erikseen opeteltava.

(Alkula ym. 1994, 285.) Näen monimuuttujamenetelmien abstraktissa muodossa esitettyjen tulosten tulkinnassa ylitulkitsemisen ja virheellisten päätelmien teke-misen riskin. Tässä mielessä monimuuttujamenetelmät voivat olla jopa haitallisia kuvaileviin menetelmiin verrattuna. Pöntinen (2004, 90–91) jatkaa, että väistä-mättä tutkijan menetelmävalintaan vaikuttavat myös kunkin ajan metodologiset ihanteet. Erola ja Räsänen (2014a, 246–247) näkevät menetelmien merkityksen ja menetelmäosaamisen vaatimusten kasvaneen 2000-luvun sosiologiassa. He toteavat, että aikaisemmin väitöstutkimuksen analyysimenetelmiksi riittivät kuvailevat me-netelmät, mutta nykyisin ne eivät heidän mukaansa riitä edes maisteriopintojen lä-päisemiseen. Erolan ja Räsäsen näkemyksen vastineeksi esitän Ronkaisen ym. (2013, 123) näkemyksen, jonka mukaan tutkimuksessa tieto ei piile ’tuloksissa’ sinänsä vaan avainasemassa on tutkija, joka nostaa tiettyjä asioita tutkimustuloksiksi eli tulkitsee ja käsitteellistää aihettaan oman ymmärryksensä varassa.