Tutkimuksen arviointia - 5 SEMANTTINEN PREFERENSSI

5 SEMANTTINEN PREFERENSSI

6.2 Tutkimuksen arviointia

6.2 Tutkimuksen arviointia

Tässä tutkimuksessa erityisesti semanttisen preferenssin analyysi vaati vahvasti tutkijan oman kie-lellisen intuition käyttöä. Kielen sanojen luokitteleminen semanttisiin luokkiin ei ole yksitulkintais-ta. Ensinnäkin olisi mahdollista ottaa mukaan erilaiset 19 luokkaa kuin tässä tutkielmassa tehtiin tai vaihtoehtoisesti eri määrä merkitysluokkia. Toisekseen voidaan sanoa, että mitkä merkitysluokat jaottelun pohjaksi valitaankin, sanat on joka tapauksessa mahdollista luokitella sanat käytettyihin ryhmiin monella eri tavalla, sillä monet sanat eivät edusta ainoastaan yhtä merkitysryhmää, vaan useita. Tällaisissa tapauksissa luokittelussa oli usein valittava se merkitysryhmä, jota sana tuntuu kotekstissaan vahvemmin edustavan. Kyse on siis väistämättä siitä, että tutkija käyttää omaa intui-tiotaan luokittelua tehdessään. Voidaan kuitenkin ajatella, että intuitiiviset näkemykset kielestä ovat läsnä ylipäätään kaikessa kielentutkimuksessa. Monitulkintaisten sanojen luokittelussa käytettiin myös periaatetta, jonka mukaan luokat ’prosessi’ ja ’arvo, laatu’ ovat toissijaisia muihin luokkiin nähden. On mahdollista, että esimerkiksi luokka ’arvo, laatu’ olisi osoittautunut huomattavasti suu-remmaksi luokaksi etenkin EHKÄ-sanalla, jos kaikki arvoon tai laatuun viittaavat sanat olisi todella luokiteltu ’arvo, laatu’ -luokkaan eikä merkitykseltään kapea-alaisimpiin ryhmiin.

Kollokaatti-analyysi nimittäin osoitti, että EHKÄ-sanalla on paljon adjektiivikollokaatteja, mutta adjektiivien eli laatuun viittaavien sanojen suuri määrä ei kuitenkaan näkynyt voimakkaana semanttisena preferens-sinä ’arvo, laatu’.

Semanttisen preferenssin analyysissa tuli esiin toinenkin ongelma. Kun nimittäin tutkittavien sanojen kollokaatteja luokitellaan merkitysryhmiin, herää kysymys, onko sanoja oikeastaan mah-dollista luokitella merkitysryhmiin pelkkinä lekseemeinä ja olla ottamatta merkityksessä huomioon niiden kulloistakin kieliopillista muotoa. Esimerkiksi tämän tutkielman ’prosessi’-merkitysluokassa on monta partisiippimuotoista verbiä, kuten jäävänsä, käytetyistä, leivottuja ja liikuteltava. Parti-siippimuotoisuus nähdäkseni heikentää verbien ’prosessiin’ liittyvää merkitystä. Jos samat verbit olisivat esimerkiksi muodoissa jään, käyttävät, leipovat ja liikuttelemme, ’prosessin’ merkitys tulisi sanoista kenties paremmin esiin. Samoin esimerkiksi superlatiivimuotoisuus voi tuoda adjektiiviin

’määrän’ merkitystä (surullisinta), liitepartikkeli -ko verbiin ’epävarmuuden’ merkitystä (oliko) ja paikallissija adjektiiviin ’paikan’ merkitystä (korkeammallakin). Työssä pyrin tarkastelemaan sano-ja lekseemeinä sano-ja jättämään merkitystä pohtiessani huomiotta kunkin saneen kieliopillisen muodon, mutta voidaan kysyä, onko semanttisen preferenssin analyysi syytä todella perustaa ainoastaan sa-nojen merkityksen tutkimiseen. Esimerkiksi edellä luetelluista esimerkeistä huomataan, että lek-seemin merkityksen lisäksi kulloinenkin kieliopillinen muoto vaikuttaa sanan merkitykseen. Kyse on itse asiassa kontekstuaalisessa semantiikassa tähdennetystä leksikon ja kieliopin erottamatto-muudesta.

Voidaankin ajatella, että lekseemien merkitykset yksinään eivät ratkaise synonyymien valin-taa, vaan prosessi on huomattavasti monimutkaisempi. Siihen, mikä modaalisana valitaan lausee-seen syntagmaattilausee-seen suhteelausee-seen, vaikuttaa semanttisten piirteiden lisäksi myös muun muassa sa-nojen kieliopilliset muodot, kuten se, käytetäänkö lauseessa esimerkiksi partisiippimuotoista verbiä.

Semanttinen preferenssi kontekstuaalisena valintatekijänä ei olekaan erillään muista kontekstuaali-sista piirteistä. Kaiken kaikkiaan koska kielenkäyttöön ja synonyymien keskinäiseen valintaan vai-kuttavat useat eri muuttujat, synonyymien kontekstuaalisesta valinnasta saataisiin perusteellisempi kuva hyödyntämällä monimuuttujamenetelmiä, sillä niiden avulla voidaan tarkastella usean eri teki-jän samanaikaista vaikutusta synonyymien valintaan. Suomen kielen tutkimuksessa menetelmää on toistaiseksi käyttänyt Arppe (2008).

Semanttisen preferenssin analyysissa ongelmallisena voidaan pitää niin ikään aineiston pie-nehköä kokoa. Voidaan ajatella, että mitä laajempi aineisto on, sitä luotettavampia tutkimustulokset ovat. Tässä tutkielmassa ei ollut tutkielman rajallisen laajuuden vuoksi mahdollista tarkastella eri-tyisen laajaa aineistoa semanttisen preferenssin osalta. EHKÄ-sanan tarkastelualueella oli 343 sanetta ja MAHDOLLISESTI-sanan tarkastelualueella 366 sanetta. Ongelmallista on etenkin, että pienimmät

merkitysluokat koostuvat vain muutamasta sanasta; tällöin suhteellisten osuuksien testauksen tulok-sia voidaan pitää etenkin pienimpien merkitysluokkien osalta lähinnä suuntaa antavana. Etukäteen ei voitu toisaalta tietää, kuinka paljon sanoja mihinkin luokkaan tulisi, vaan luokittelu tehtiin sen mukaan, millaisia ryhmiä ja piirteitä aineistosta nousi esiin. Lisäksi esimerkiksi Jantusen (2004: 85, 133) vastaavan analyysin aineisto on kooltaan suunnilleen samansuuruinen ja kahden tutkittavan sanan osalta jopa pienempi kuin tässä tutkimuksessa: Jantusen semanttisen preferenssin analyysissa

HYVIN-astemääritteen aineisto on 352 sanetta, KOVIN-astemääritteen 176 sanetta ja OIKEIN -astemääritteen 121 sanetta. Ei ole siis tavatonta, että semanttista preferenssiä tarkastellaan suhteelli-sen pienistä aineistoista. Analyysin luonne selittääkin aineiston pienuutta: jokainen sanaesiintymä on käytävä yksitellen läpi ja luokiteltava merkityksen mukaiseen luokkaan, joten aineisto ei voi koostua esimerkiksi miljoonista saneista, toisin kuin kollokaatioanalyysissa.Toisaalta on huomatta-va, että analyysin luotettavuutta lisää se, että kollokaatioanalyysissa esiin nousseet hypoteesit mo-daalisanojen semanttisista preferensseistä ovat hyvin samansuuntaisia kuin itse semanttisen prefe-renssin analyysissa tehdyt huomiot. Kollokaatioanalyysi siis tukee semanttisen prefeprefe-renssin analyy-sia.

Tässä tutkielmassa viittaan kollokaatiolla sanojen esiintymiseen teksteissä toistensa läheisyy-dessä. Kyseessä on siis kollokaation tekstuaalinen määrittely, jota muiden kollokaation määritel-mien tavoin käsiteltiin luvussa 2.2.2. Kollokaatioanalyysissa kuitenkin lisäksi korostuu kollokaation tilastollinen määritelmä, sillä analysoitava aineisto on muodostettu siinä käyttämällä tilastollisia testejä. On ajateltavissa, että tilastollisuus antaa kollokaation määritelmään eräänlaisen lisäulottu-vuuden: kaikki kollokaatiot eivät välttämättä ole tilastollisesti merkitseviä, mutta osa on, ja tätä piir-rettä voidaan tarkastella tilastollisin testein.

Voidaan ajatella, että kenties erityisesti tilastollinen merkitsevyys liittyy myös kollokaation kolmanteen määrittelytapaan, assosiatiiviseen määrittelyyn, eli kertoo myös siitä, että sanat assosi-oituvat toisiinsa kielenkäyttäjän tajunnassa. Tilastolliset menetelmät ovat toki ensisijaisesti tilastol-lista tarkastelua varten, mutta voidaan kuitenkin ajatella, että esimerkiksi tilastollisesti merkitsevä kollokaatio EHKÄ <HIEMAN> ilmentää paitsi sitä, että kollokaatio on tilastollisesti merkitsevä, myös jollain tavalla sitä, että kielenkäyttäjän kognitiossa nämä sanat yhdistyvät voimakkaasti toisiinsa.

Sille, että jokin myötäesiintymä nousee tilastollisesti merkitseväksi, on nimittäin oltava jokin syy, ja yhtenä syynä voidaan pitää sitä, että sanat assosioituvat toisiinsa kognitiossa, muodostavat siellä valmiin rakenteen ja sen myötä realisoituvat kielenkäytössä taajaan – ja synnyttävät tilastollisesti merkitseviä myötäesiintymiä. Täten kieli ei ole sattumanvaraisesti rakentunutta, vaan perustuu sii-hen, miten kieltä on aina aiemmissa kielenkäyttötilanteissa tyypillisesti käytetty. Kun EHKÄ ja HIE-MAN assosioituvat toisiinsa kielenkäyttäjän kognitiossa, kielenkäyttäjän on helppo toistaa tämä

val-mis rakenne valitessaan leksikaalisia yksiköitä syntagmaattisiin suhteisiin. Kyse on siis Hoeyn (2007) esiin ottamasta primingista (ks. luku 2.2.2), siitä, että aikaisemmat kielenkäyttötilanteet virit-tävät kielenkäyttäjän niin, että tämä käyttää sanaa usein sellaisissa konteksteissa, joissa sitä aiem-minkin on käytetty. Myös synonyymien eroja voidaan tarkastella kollokaation tilastollisen ja as-sosiatiivisen määrittelyn sekä primingin käsitteen kautta: kollokaatio MAHDOLLISESTI <HIEMAN> ei ainakaan tilastollisin menetelmin nouse merkitseväksi kollokaatioksi, joten voidaan ajatella, että sanat eivät myöskään ole yhdistyneet toisiinsa kielenkäyttäjän kognitiossa yhtä vahvasti kuin EHKÄ

ja HIEMAN. Toisaalta tilastollisin menetelmin ei toki suoraan voida tutkia sanojen assosioitumista toisiinsa tai muita mentaalisia ilmiöitä, mutta voidaan silti ajatella, että kollokaation vahva tilastol-linen merkitsevyys kertoo vahvemmasta assosiaatiosta myös kognition tasolla verrattuna kollokaa-tioon, joka on esimerkiksi vain heikosti tai ei lainkaan merkitsevä.

In document Synonyymien ehkä ja mahdollisesti kollokaatit ja semanttiset preferenssit (sivua 100-103)