Tilastotieteen moninaisuus - Tutkimuksen taustaksi: tieteiden eriytymisen historiaa

2. Tutkimuksen taustaksi: tieteiden eriytymisen historiaa

2.2. Tilastotieteen moninaisuus

Tiedettä tutkimuskohteenaan pitävää oppialaa kutsutaan tieteentutkimukseksi.

Monet tieteentutkijat, eräänä tunnetuimmista Thomas Kuhn, ovat taustaltaan luonnontieteilijöitä, jotka ovat alkaneet pohtia ja tutkia omaa toimintaansa ja tie-teenalaansa (Kiikeri ja Ylikoski 2004, 9–10; Mikkeli ja Pakkasvirta 2007, 132; Bird 2001). Oman tutkimukseni kipinänä on myös toiminut pitkäaikainen kokemukseni tilastotieteen parissa ja sen myötä syntyneet huomioit tilastotieteen moninaisuu-desta. Opiskeluaikana tilastotiede näyttäytyi minulle lähinnä matemaattisena op-piaineena. Tilastotieteilijäksi valmistumisen jälkeen olen opettanut tilastotiedettä yhteiskunta- ja kasvatustieteiden opiskelijoille sekä ollut menetelmäasiantuntijana erilaisissa kvantitatiivisissa tutkimusprojekteissa. Vuosien kokemukset näissä tehtä-vissä ovat osoittaneet, että tilastotieteen sisältö, käyttötapa ja rooli voivat vaihdella suuresti eri yhteyksissä. Joissakin tilanteissa tilastotiede palvelee matematiikkana, toisissa tilanteissa matemaattisena tutkimusmenetelmänä ja joissakin jopa melko laadullisena tutkimusmenetelmänä.

Seppo Raiski (1976) on todennut tilastollisten tutkimusmenetelmien opiske-lussa olevan kaksi puolta. Ensimmäinen on hänen mukaansa tilastollisen teorian hallinta, joka on tilastotieteen tehtävä. Toinen on harjaantuminen niiden käyttöön yhteiskuntailmiöiden erittelyssä, mikä puolestaan on yhteiskuntatieteen metodinen tehtävä. (Raiski 1976, 59.) Tilastotiedettä ei siten voida samaistaa puhtaaseen mate-matiikkaan (Bellhouse 2000). Tilastotieteen sijoittuminen tieteiden jaottelussa on ollut vaihtelevaa. Historiansa aikana tilastotiede on voitu lukea niin matemaattisek-si kuin yhteiskuntatieteellisekmatemaattisek-si ja joskus myös maantieteeseen kuuluvakmatemaattisek-si tieteekmatemaattisek-si (Porter 1986, 24–25). Tilastotieteen nimen on katsottu liittyvän valtioihin tai valti-olliseen, tilaan tai numeeriseen tietoon yhteiskunnasta (Porter 1986, 11–12; 23–25;

38; 152–153; Alastalo 2005, 30).

Hans Helenius (1992, 3) toteaa kirjassaan, miten tilastotieteen yhteistyö muiden tieteiden kanssa on hiljalleen häivyttänyt tieteiden rajat ja yhteistyön aluetta on alettu nimittää omalla nimellä. Esimerkiksi lääketieteen ja tilastotieteen yhteistyön aluetta kutsutaan biostatistiikaksi, psykologian ja tilastotieteen yhteistyön aluetta psykometriaksi ja taloustieteen ja tilastotieteen yhdistävää alaa ekonometriaksi.

Kuva 1 havainnollistaa tilastotieteen käytön kirjoa eri tieteissä.

Kuva 1 Tieteiden eriytyminen

Kirjallisuudessa ei ole pystytty esittämään tiukkarajaista, yleisesti hyväksyttyä määritelmää tilastotieteelle, koska eri tahojen esittämissä määritelmissä tiivistyvät erilaiset näkökulmat, lähestymistavat ja painotukset (Helenius 1992, 1). David Bartholomew (1995a) esittää tilastotieteelle useita määritelmä päätyen siihen, että tilastotiedettä on melko mahdotonta määritellä kattavasti. Mäkelän (1991, 11) mukaan käytännössä ei ole olemassa mitään yksikäsitteistä tilastollista metodia vaan useita erilaisia vaihtoehtoja, joiden taustalta on löydettävissä omat tieteenfilosofiset sitoumuksensa. Sosiologi ja tilastotieteilijä Clifford C. Clogg (1992) on halunnut erottaa aineiston analyysiin tarkoitetun tilastotieteen tilastomatematiikasta. Ai-neiston analyysiin soveltuvaa tilastotiedettä hän kutsuu vuonna 1992 julkaistussa artikkelissaan mieluummin tilastolliseksi metodologiaksi. David Hand (2009) on Cloggin kanssa samoilla linjoilla ilmaistessaan, että tilastotieteen voisi jakaa laajaan ja suppeaan tilastotieteeseen. Laaja tilastotiede liittyisi Handin mukaan kaikkeen aineistosta oppimiseen. Suppea tilastotiede taas viittaa tilastotieteilijöiden kehittä-mään metodologiseen ytimeen eli sellaiseen tilastotieteeseen, jota julkaistaan alan aikakauslehdissä ja josta tehdään esimerkiksi väitöskirjat. Handin näkemyksen mu-kaan moderni tilastotiede tulisi määritellä laajan tilastotieteen tapaan.

Eskola (1971) on todennut, että ”Ymmärtääksemme käyttämiämme menetelmiä meidän on tarkasteltava niitä historiallisesti ja rakenteellisesti. Menetelmä tulee tajuttavaksi, kun selvitetään sen rakenne; ja sen käyttö selittyy, kun tuo rakenne sijoitetaan laajempaan, tieteenfilosofiseen ja yhteiskunnalliseen rakenteeseen, joka on sitä ennen selvitettävä ja tajuttava.” Myös Alastalo (2005, 295) korostaa historian tuntemuksen tärkeyttä todetessaan, että historiaa tutkimalla voi tehdä näkyväksi ja ymmärrettäväksi tieteenalalla tapahtuneita muutoksia. Eskolan ja Alastalon linjaa

myötäillen teen lyhyen tieteiden, tilastollisen ajattelun ja tilastotieteen kehittymistä koskevan historiakatsauksen havainnollistaakseni tilastotieteen moninaisuutta.

Tilastotieteen historiaan ja tilastollisen ajattelun syntyyn voi tarkemmin tutustua esimerkiksi D. B. Owenin, Paul D. Mintonin ja John W. Prattin (1976), Alain Des-rosièresin (2002) tai Ian Hackingin (1990) teoksissa. Julian Champkin (2014) on esittänyt tilastotieteen kehittymisen aikajanan. Tässä yhteydessä esitän yksinkertais-tetun aikajanan tilastotieteen osa-alueiden kehittymisestä (kuva 2).

Kuva 2 Tilastotieteen osa-alueiden kehittyminen

Tilastotieteen matemaattinen perusta, todennäköisyyslaskenta, sai alkunsa 1600-luvulla. 1700-luvulla kehitettiin yliopistostatistiikan ja poliittisen aritmetiikan piirissä erilaisia tilastointeja ja taulukointeja, joiden avulla yhteiskuntia ja valtioita pyrittiin hallitsemaan. Eräs kytkös liittyy joukkoilmiöiden tutkimisen yhteydessä tehtyihin keksintöihin. Porter (1986) kuvaa kirjassaan, millä tavalla 1800-luvulla, joka oli merkittävä ajanjakso tilastollisen ajattelun kehittymisessä, oivallettiin muun muassa normaalijakauman hyödyntäminen joukkoilmiöiden tutkimisessa. Keskeise-nä kehittäjäKeskeise-nä tässä oli Adolphe Quételet, joka työskenteli observatoriossa tutkien taivaankappaleiden liikeratoja. Taivaankappaleilla ajateltiin tiettynä aikana olevan tietty sijainti. Mitattaessa liikeratoja ja sijainteja ajateltiin mittauksissa esiintyvän vaihtelun johtuvan puutteellisista mittausvälineistä. Mittausvirheiden arvioimiseksi kehiteltiin menetelmiä, joista hyödylliseksi osoittautui eksponentiaalista funktiota hyödyntävä virhelaki. Myöhemmin virhelaki opittiin tuntemaan Gaussin käyränä eli normaalijakaumafunktiona. Quételet oivalsi, että virhelaki ja erityisesti siihen liittyvä keskiarvo sopivat myös ihmisten fyysisten piirteiden jakaumien kuvailuihin ihmispopulaatiossa. Quételetiä kiinnostivat myös joukkoilmiöiden taustalla olevat syyt. Niitä tarkastellakseen hän taulukoi ilmiöiden esiintymismääriä erilaisten taus-tatekijöiden, esimerkiksi iän, sukupuolen, ammatin ja syntymäpaikan mukaan poh-tien huolellisesti havaitsemiensa lukujen merkityksiä ja vaikutuksia. Havaitsemiaan säännönmukaisuuksia Quételet kutsui tilastollisiksi laeiksi. Hän tulkitsi, että tilas-tolliset lait toteutuvat ryhmässä, vaikka ne eivät päde yksilötasolla. Porter kirjoittaa Quételetin päätyneen siihen, että tilastollinen säännöllisyys ja suurten lukujen laki olivat avaimia numeeriseen sosiaalitieteeseen. (Porter 1986.)

Toinen tilastotieteen ja sosiologian kytkös liittyy tilastotieteen nimeen. Sosiolo-gian perustajana pidetty Auguste Comte kehitti 1800-luvulla positivistisen tieteen nimittäen sitä sosiaalifysiikaksi. Comte ajatteli tieteiden kehittyvän teologisesta metafyysiseen ja siitä edelleen positiiviseen vaiheeseen. Matematiikkaan ja toden-näköisyyksiin ihastunut Quételet omi Comten ideat kehitellessään joukkoilmiöitä koskevaa tiedettään. Quételet otti käyttöönsä myös Comten omalle tieteelleen keksimän nimen physique sociale. Comte, joka Porterin mukaan suorastaan karttoi matematiikan, numeroiden ja todennäköisyyksien käyttöä, oli tästä todella vihai-nen. Kun nimi vielä virheellisesti käännettiin tilastotieteeksi, oli Comten keksittävä omalle tieteelleen uusi nimi. Hän päätti nimetä tieteensä sosiologiaksi. (Porter 1986, 152–156; Lazarsfeld 1993b, 263; Töttö 1997b.)

Tilastotiede muuttui tieteenä matemaattiseksi ja erityisesti biologiaan ja luon-nontieteisiin soveltuvaksi 1900-luvulla. (Porter 1986; Alastalo 2005; Kuusela 2010;

Champkin 2014.) Porterin (1986, 24) mukaan on vaikea arvioida, milloin ihmiset tarkalleen alkoivat nähdä tilastotieteen matemaattisena tieteenä. Mäkelä (1996) esittää matemaattisen tilastotieteen kehittymisen tapahtuneen kahtena ajanjaksona.

Ensimmäinen jakso (1890–1925) liittyi voimakkaasti biologiaan. Silloin kehitettiin korrelaatioajattelu, koesuunnittelu, estimointiteoria sekä merkitsevyystestit. Toisen vaiheen (1926–1934) aikana kehitettiin hypoteesien testaukseen ja luottamusvälien laskemiseen liittyvät teoriat. Matemaattisen tilastotieteen kehittyessä tilastotieteen omat tutkimusongelmat alkoivat muotoutua. Matemaattisen tilastotieteen kehitty-misen myötä luonnontieteellisyys kiinnittyi vahvasti tilastotieteeseen ja tilastollisten menetelmien käyttöön. Tieteenalojen ja tutkijoiden, jotka käyttivät tilastotieteen menetelmiä, oli siten myös omaksuttava matemaattisesti painottunut, luonnontie-teellinen ajattelutapa omissa tutkimuksissaan. Mäkelä (1996.)

In document Sosiologian ja tilastotieteen rajoilla. Faktorianalyysi rajakohteena (sivua 24-27)