• Ei tuloksia

Perusteet tutkittavien lekseemien valinnalle

3 AINEISTO JA METODIT

3.2 Perusteet tutkittavien lekseemien valinnalle

3.2 Perusteet tutkittavien lekseemien valinnalle

Valitsen tutkittavaksi lekseemeiksi eli tutkimuksen havaintoyksiköiksi sellaiset sanat, joilla ei ole kielenulkoista referenttiä. Kielenulkoisessa maailmassa usein yhdessä esiintyvät asiat esiintyvät todennäköisesti myös kielessä toistensa läheisyydessä (Sinclair 1991a: 110). Näin ollen voidaan olettaa, että tutkimukset saattavat paljastaa joidenkin sanojen tyypillisiksi kollokaateiksi erityisesti sellaisia sanoja, jotka jo kielenulkoisessa maailmassa esiintyvät usein kyseisen sanan yhteydessä.

Esimerkiksi KOIRA-lekseemiä tutkittaessa saatettaisiin havaita sen tyypilliseksi kollokaatiksi vaik-kapa verbi HAUKKUA. Tämä ei kuitenkaan nähdäkseni olisi erityisen kiinnostavaa, ja voidaan jopa ajatella, että tämäntyyppisissä tapauksissa tutkimustulokset kuvaisivat enemmän kielenulkoista maailmaa kuin kieltä. Oletettavasti erityisesti sisältösanoissa on tämäntyyppisiä sanoja. Sisältösanat ovat tyypillisesti substantiiveja, adjektiiveja ja verbejä, ja niille on luonteenomaista referentiaalinen merkitys eli juuri kyky viitata kielenulkoisessa maailmassa oleviin asioihin (VISK § 438).

Valitsenkin tutkimuskohteekseni mieluummin funktiosanoja, koska etenkin niitä tutkimalla voidaan olettaa saatavan tietoa nimenomaan kielestä sen sijaan, että ennen kaikkea kielenulkoisen maailman olosuhteet vaikuttaisivat tutkimustuloksiin. Funktiosanat ovat tavallisesti lyhyempiä kuin sisältösanat, niiden tehtävä on selkeämmin kieliopillinen tai keskustelun kulkuun liittyvä ja ne ovat sanaluokaltaan partikkeleita, apuverbejä, persoona-, demonstratiivi- ja relatiivipronomineja (VISK

§ 438). Sana EHKÄ modaalisena partikkelina ja sana MAHDOLLISESTI modaalisena adverbina voi-daankin luokitella funktiosanoihin. Joka tapauksessa niillä ei ole kielenulkoista referenttiä, joten sikäli ne täyttävät hyvin tutkimuskohteeni kriteerit. Sisältösanoja nimitetään toisinaan myös leksi-kaalisiksi sanoiksi ja niiden vastinparia, funktiosanoja, muoto- tai kieliopillisiksi sanoiksi (Kangas-niemi 1997: 39). Tässä tutkielmassa käytän nimityksiä sisältösanat ja kieliopilliset sanat.

Suomen kielen keskenään synonyymisten kieliopillisten sanojen fraseologiaa on tutkittu sano-jen HYVIN, KOVIN ja OIKEIN osalta (Jantunen 2004; sanojen kieliopillisiksi luokittelemisesta tar-kemmin mts. 69) sekä sanojen VUOKSI ja TAKIA osalta (Suoraniemi 2011). Lisäksi Päiviö (2007) on tutkinut sanojen ASTI ja SAAKKA synonymiaa, joskaan ei fraseologisen tutkimuksen käsitteitä hyö-dyntäen; monet Päiviön havainnoista olisivat kuitenkin esitettävissä myös fraseologian näkökulmas-ta käsin. Modaalisten adverbien näkökulmas-tai partikkelien synonymiaa ei ole tutkittu, mutnäkökulmas-ta modaalisuus on keskeinen piirre kielessä, joten niiden tutkimiselle on sijaa kielentutkimuksen kentässä. Ylipäätään adverbien ja partikkelien valintaa tutkimuksen kohteeksi puoltaa se, että ne ovat yleensä taipumat-tomia. Taipuvienkin sanojen synonymiaa voidaan toki hyvin tutkia fraseologian näkökulmasta, mut-ta tällöin tutkimuksessa on usein hyvä otmut-taa huomioon lekseemin eri mut-taivutusmuodot, mikä kasvat-taa tutkimuksen laajuutta ja vähentää siten mahdollisuutta keskittyä sanojen piirteisiin perusteelli-sesti.

Vaikka tutkimusasetelma onkin luonteeltaan kahden sanan piirteitä vertaileva, kahden sanan vastakkainasettelua ei tule liiaksi korostaa: asetelmaa ei tule ymmärtää niin, että sanat EHKÄ ja

MAHDOLLISESTI olisivat suomen kielen ainoat kyseistä merkitystä edustavat sanat. Sanat kuuluvat sitä vastoin laajempaan synonyymiryhmään. Tässä tutkielmassa ei ole kuitenkaan mahdollista tut-kielman rajallisen laajuuden vuoksi tutkia kaikkia synonyymiryhmän sanoja, vaan on keskityttävä kahteen havaintoyksikköön. Olen käyttänyt lekseemien valinnassa hyväkseni ensinnäkin Ison suo-men kieliopin modaalisten adverbien ja partikkelien luetteloa (VISK § 1601), sillä siitä voidaan poimia monta eri samaan merkityskenttään kuuluvaa, epävarmuutta ja epätodennäköisyyttä ilmaise-vaa sanaa: MAHDOLLISESTI, KAI, KAIKETI, EHKÄ, KENTIES, KUKATIES, VARMAAN, ARVATENKIN. Näis-tä partikkeli EHKÄ on valikoitunut toiseksi havaintoyksiköksi siksi, että se on sanomalehtikielessä merkityskentän sanoista kaikkein yleisin. Myös esimerkiksi Jantunen (2004: 68) pitää synonymiaa koskevan fraseologisen tutkimuksensa yhtenä kriteerinä havaintoyksiköiden valinnassa sitä, että

sanojen on oltava tarpeeksi frekventtejä, jotta niiden kontekstuaalisia piirteitä voidaan kuvata riittä-vän luotettavasti. Suomen sanomalehtikielen taajuussanaston (CSCb) mukaan sana EHKÄ on kaik-kien suomen sanomalehtikielessä esiintyvien sanojen yleisyysjärjestyksessä sijalla 335, ja sana on listassa korkeammalla kuin mikään sen edellä luetelluista synonyymeista. Muiden edellä lueteltujen

EHKÄ-sanan synonyymien yleisyysjärjestys on seuraava: MAHDOLLISESTI (sijalla 1525), VARMAAN

(sijalla 1670), KAI (sijalla 2069), KENTIES (sijalla 2340). Sanat KAIKETI, KUKATIES ja ARVATENKIN

eivät ylipäätään ole mukana kyseisessä taajuussanastossa, johon on otettu mukaan suomen sanoma-lehtikielen 9996 yleisintä lekseemiä.

Toisen havaintoyksikön valinnassa voidaan hyödyntää edellä lueteltuja frekvenssitietoja. Sa-nat KAIKETI, KUKATIES ja ARVATENKIN on syytä jättää tutkimuksen ulkopuolelle, sillä ne eivät ole frekventtejä sanoja. Sanat MAHDOLLISESTI, VARMAAN, KAI ja KENTIES eivät nekään ole aivan kärki-päässä taajuusjärjestyksessä, mutta niitä voidaan kuitenkin pitää suhteellisen frekventteinä ja frase-ologiseen tutkimukseen hyvin soveltuvina; esiintymiä suuressa aineistossa on joka tapauksessa pal-jon. Olennaista toisen havaintoyksikön valinnassa on tarkastella myös sanojen merkitystä, ja siinä voidaan hyödyntää sanakirjoja ja sanastoja. Ensinnäkin niistä voidaan löytää perusteita sille, että

EHKÄ-sanan synonyymeja ovat pikemmin MAHDOLLISESTI ja KENTIES kuin VARMAAN ja KAI: sekä Antti Leinon ja Pirkko Leinon Synonyymisanastossa (1996), Kivimiehen Synonyymisanastossa (1974) että Kielitoimiston sanakirjassa (KS) mainitaan hakusanan EHKÄ sana-artikkelissa kaksi en-sin mainittua sanaa, mutta ei lainkaan kahta viimeksi mainittua. Niinpä VARMAAN ja KAI voidaan jättää tutkittavien vaihtoehtojen joukosta pois – samoin harvinaiset ilmaisut KUKATIES, PIAN AIKAA,

MENE TIEDÄ ja MITÄMAKS, jotka esimerkiksi Kivimies (mp.) mainitsee EHKÄ-sanan synonyymeina.

Myös esimerkiksi adverbit LUULTAVASTI ja ILMEISESTI rajautuvat vaihtoehtojen joukosta pois, sillä niitä ei ylipäätään mainita synonyymisanastoissa EHKÄ-sanan synonyymeina. Näin ollen tutkittavik-si vaihtoehdoiktutkittavik-si EHKÄ-sanan ohella jäävät sanat MAHDOLLISESTI ja KENTIES. Olen valinnut niistä havaintoyksiköksi sanan MAHDOLLISESTI siksi, että se on edellä kuvattujen frekvenssitietojen mu-kaisesti yleisempi suomen sanomalehtikielessä kuin KENTIES. Ison suomen kieliopin, Kielitoimiston sanakirjan, synonyymisanastojen ja taajuussanaston tietojen perusteella tutkimukseni havaintoyksi-köiksi ovat siis valikoituneet modaalisista sanoista synonyymit EHKÄ ja MAHDOLLISESTI.

Äidinkielisen suomenpuhujan kielelliseen intuitioon nojautuen voidaan todeta, että tutkittavat synonyymit eivät ole kuitenkaan täydellisiä synonyymeja, vaan niillä tuntuu olevan jonkinlaisia keskinäisiä merkityseroja. Esimerkiksi VUOKSI- ja TAKIA-sanojen väliseen synonymiaan verrattuna sanojen EHKÄ ja MAHDOLLISESTI synonymia tuntuu kenties hieman löyhemmältä, sillä intuitiivisesti saattaa ehkä tuntua siltä, että nämä kaksi modaalisanaa eivät ole yhtä usein korvattavissa lauseessa toisillaan kuin ensin mainitut synonyymit. Absoluuttista synonymiaa ei kuitenkaan ylipäätään

lain-kaan pidetä kielessä mahdollisena, vaan synonyymeina pidetyt sanat ovat siis aina lähisynonyyme-ja. Lähtökohta lekseemien EHKÄ ja MAHDOLLISESTI synonymian tutkimiselle on hedelmällinen juuri sillä tavoin, että sanat yhtäältä tuntuvat olevan synonyymisia ja toisaalta eroavan toisistaan. Eroja ei voitane selittää kovin tarkasti ja luotettavasti yksinomaan intuition perusteella: esimerkiksi Sinclair (1991a: 4) toteaa, että kielenkäyttäjän intuitiivinen oletus kielenkäytöstään on usein ristiriidassa sen kanssa, miten hän todellisuudessa käyttää kieltä (ks. kuitenkin luku 3.3.5 intuition roolista tutki-muksessa). Näin ollen työni tarkoitus on korpusmenetelmin selvittää, mitä kyseiset erot mahdolli-sesti ovat.