kirjAllisuuttA
Väitöstutkimus morfologisesta produktiivisuudesta
Alexandre Nikolaev: Suomen nominien taivutusjärjestelmän produktiivisuudesta.
Korpuslingvistisiä ja kokeellisia tutkimuk
sia. Väitöskirja, Itä-Suomen yliopiston filosofinen tiedekunta, Joensuu 2011.
260 s.
Alexandre Nikolaevin yleisen kielitieteen alaan kuuluva väitöskirja Suomen nomi- nien taivutusjärjestelmän produktiivisuu- desta: Korpuslingvistisiä ja kokeellisia tut- kimuksia tarkastettiin Itä-Suomen yli- opiston filosofisessa tiedekunnassa Joen- suussa 1.4.2011. Nikolaevin lektio aiheesta
”Substantiivien taivutusjärjestelmän pro- duktiivisuudesta” on julkaistu Virittäjän verkkoliitteessä 2/2011.
Kyseessä on artikkeliväitöskirja, jonka kuusi alkuperäisartikkelia ovat yhteispi- tuudeltaan 120 sivua. Artikkeleista Niko- laev on kirjoittanut yhden yksin (11 si- vua), ja muut viisi artikkelia ovat yhteis- artikkeleita, joiden kirjoittajien joukossa joka artikkelissa on Nikolaevin ohjaaja Jussi Niemi. Kolmessa artikkelissa kirjoit- tajat ovat Nikolaev ja Niemi kahdestaan, yhdessä lisäksi yksi kirjoittaja ja vielä yh- dessä lisäksi kuusi muuta kirjoittajaa. Ar- tikkeleista kolme on ilmestynyt Virittä- jässä, yksi julkaisussa Puhe ja kieli, yksi kansainvälisessä kokoomateoksessa ja yksi oli tarkastuksen yhteydessä arvioi- tavana julkaisemista varten. Julkaisufoo- rumit ovat hyviä, ja useimmissa tapauk- sissa artikkelit ovat käyneet läpi referee- arvioin nin.
Yhteisartikkelit eivät suomalaisissa kielitieteen artikkeliväitöskirjoissa ole ol- leet yleisiä. Ottaen huomioon artikkelei- den lyhyehkön yhteen lasketun sivumää- rän ja monet kirjoittajat, herää kysymys, onko väittelijän itsenäinen panos riittävä.
Nikolaev tekee kuitenkin riittävästi sel- koa omasta panoksestaan, joka kohdis- tuu erityisesti laajojen korpusanalyysien tekemiseen sekä relevanttien lingvistis- ten teorioiden (kuten optimaalisuusteo- rian) ja psykolingvististen kokeellisten menetelmien integratiiviseen soveltami- seen. Juuri tämä tekeekin väitöskirjasta riittävän yleislingvistisen. Toinen osoitus Nikolaevin omasta panoksesta on pitkä (melkein ylipitkä eli 101-sivuinen) joh- danto- ja yhteenvetoluku, joka kiinnosta- vasti nivoo yhteen vuosikymmenen ajan kestäneen väitöskirjatyön eri vaiheet, me- netelmät ja tulokset ja lisäksi luo katsauk- sen suomen taivutusjärjestelmän kuvauk- sen vaiheisiin Petraeuksesta alkaen.
Lektion substantiiveihin perustuva nimi kuvaa väitöskirjan sisältöä osu- vammin kuin yhteenvedon mainitsemat nominit. Käytännössä Nikolaev käsitte- lee substantiiveja; nominien alaluokista- han kaksi (pronominit ja osin lukusanat) ovat itse asiassa täysin epäproduktiivisia.
Artikkelit käsittelevät suomen taivu- tusmorfologian kuvausta ja prosessoin- tia sekä teorioiden että metodien näkö- kulmasta. Koeasetelmiin minulla ei ole oleellista huomauttamista. Nikolaevin lu- keneisuus ja teoreeettis-metodinen hal-
linta on kokonaisuutena ottaen kohdal- laan. Kvantitatiivisia menetelmiä hän so- veltaa asiantuntevasti, mikä osin kokeel- lisessa työssä tietenkin on välttämätöntä.
Lingvistisen teorian näkökulmasta kum- mastuttaa, ettei tekijä kertaakaan viittaa yhteen morfologisen produktiivisuus- teorian perusteokseen, Laurie Bauerin jo vuonna 2001 ilmestyneeseen kirjaan Morphological productivity, joka käsit- telee monipuolisesti produktiivisuuden yleistä ongelmaa ja sen pitkää tutkimus- historiaa.
Kokeellisia tutkimusasetelmia lu- kuun ottamatta suurin osa väitöskirjan empiirisestä aineistosta on peräisin Kie- lipankin (www.csc.fi) suomenkielisistä korpuksista (laajimmillaan yli 130 mil- joonaa sananmuotoesiintymää), jotka voittopuolisesti koostuvat 1990-luvun sanomalehtiaineistoista. Esitarkastus- vaiheessa huomautin, että tällaisten au- tomaattisen morfologisen analyysin lä- pikäyneiden mutta koodaukseltaan tar- kistamattomien korpusten luotettavuus tulisi perusteellisesti arvioida. Pistoko- keita tehdessäni olin huomannut muun muassa, että Nikolaev tuolloin ilmoitti veri-substantiivilla olevan aineistossa 10 monikon genetiivin esiintymää verten.
Tarkistaessani nämä osoittautuivat kui- tenkin kaikki varten-postposition vää- rin kirjoitetuiksi muodoiksi. Lopulliseen väitöskirjaan (johdanto s. 19) tämä yksi- tyiskohta on korjattu ja Nikolaev on li- sännyt alaviitteen, missä hän yleisesti huomauttaa painovirheiden ja koodaus- virheiden olemassaolosta. Silti lukija toi- voisi saavansa tarkempia tietoja käytetyn korpuksen luotettavuudesta juuri Niko- laevin tutkimusongelman kannalta. Li- säesimerkkinä voisi mainita sananmuo- don unten. Sitä löysin käytetyistä kor- puksista nyt tarkistettaessa 73 esiintymää
(Nikolaevilla 77 kpl). Kourallinen on sak- san joko oikein kirjoitettuja unten-adver- bin tai väärin kirjoitetun unter-preposi- tion esiintymiä, lopuista melkein kaikki leksikaalistuneen idiomin unten mai/lla, -lle esiintymiä. Pelkkä luku 73 (77?) ei si- ten anna realistista kuvaa unten-muodon morfologisesta asemasta, koska oikeiden ja ei-idiomaattisten esiintymien määrä on korkeintaan 6–7.
Useissa artikkeleissaan Nikolaev kä- sittelee kielenkäyttäjien mentaalisia mor- fologisia representaatioita. Aineistoon liittyen lukijaa jää vaivaamaan se, ettei Nikolaev kunnolla pohdi, kuinka suurella varmuudella Tekstipankin kirjoitettujen tekstien morfologisen analyysin pohjalta voidaan päätellä kielenkäyttäjien sisäi- siä representaatioita, jotka ensisijaisesti perustuvat varhaislapsuudessa omaksut- tuun puheeseen ja sen rutiineihin. Tämä on Per Linellin (2005) mainitseman kieli- tieteen ”written language biasin”, kirjoite- tun kielen suosimisen ilmentymä.
Vanhin ja Nikolaevin yksin kirjoit- tama on artikkeli ”Eräiden suomen kie- len taivutustyyppien produktiivisuu- desta” (Puhe ja kieli 22, 2002: 113–124).
Kirjoittaja tarkastelee produktiivisuuden omaksumista kahdessa produktiivisessa versus epäproduktiivisessa paradigma- parissa (varis – kirves; lasi – kivi) sekä kolmanneksi kvantitatiivisen astevaihte- lun osalta, missä siis vaihtelullisuus on produktiivista (hattu : hatun). Epäsano- jen taivutuskokeisiin osallistui kolmeen ikäryhmään kuuluvia (3–5-, 10–11- ja 13–14-vuotiaita) syntyperäisiä suomalai- sia ja venäläisiä lapsia. Syntyperäiset suo- menkieliset valitsivat odotuksenmukai- sesti produktiivisen taivutusstrategian, vaikka 3–5-vuotiaat jättivätkin melkein kolmanneksen epäsanoista taivuttamatta.
Venäläisillä tendenssi on vielä vahvempi.
Perustulokset ovat uskottavia ja mielen- kiintoisia. Yritys selittää kvantitatiivisen astevaihtelun produktiivisuutta tavumää- rän vakioimisella ei silti vakuuta, muun muassa siksi, että useimmissa taivutus- muodoissa tavumäärä onkin eri kuin yk- sikön nominatiivissa ja genetiivissä sekä monikon nominatiivissa (vrt. kaksitavui- set hattu : hatun : hatut, mutta kolmita- vuiset hatussa : hatuissa : hatuista : ha- tulla : hatuilla : hatulta : hatuilta : hatulle : hatuille jne.)
Artikkelissa ”Suomen nominien tai- vutuksesta: rytmi-, sivupaino ja agglu- tinaatiohypoteesien testausta” (Virit- täjä 109, 2005: 530–553) Nikolaev ja Jussi Niemi analysoivat uudelleen suomen tai- vutusopin klassista ongelmaa, kolmi- ja useampitavuisten nominien ns. vapaata vaihtelua monikon genetiivissä ja par- titiivissa. Arto Anttila sovelsi väitöskir- jassaan (1997) ensimmäisenä optimaa- lisuusteoriaa näiden ongelmien analyy- siin käyttäen 1,3 miljoonan kokoista sa- nanmuotoaineistoa. Uutta Nikolaevilla ja Niemellä on erityisesti 109 miljoo- nan sananmuodon tekstipankkiaineiston käyttö, mikä tarjoaa entistä luotettavam- mat tiedot vaihtelevien muotojen esiin- tymisyleisyydestä. Käytössä olevat rajoit- teet ovat ”vältä kahden tasavahvuisen ta- vun vierekkäisyyttä”, ”vältä heikkoja sivu- painollisia tavuja” ja ”vältä vartalonmuu- toksia suffiksaatiossa”. Optimaalisuusteo- rian mukainen rajoitteiden kilpailu osoit- tautuu hyvin toimivaksi menetelmäksi ennustaa pintavaihtelun preferenssejä.
Malli ontuu vain paperi-tyyppisissä sa- noissa.
Artikkelissa ”Nominien paradigmaat- tistuminen suomessa: Millä rakenteelli- silla ehdoilla kielenkäyttäjät sitovat po- tentiaaliset nominit taivutusluokkiin?”
(Virittäjä 110, 2006: 46–69) Nikolaev ja
Niemi vertaavat patsas- ja keskus-taivu- tustyyppien produktiivisuusominaisuuk- sia leksikaalisesti CD-Perussanakirjan ja tekstitaajuudeltaan eli lemmafrekvenssil- tään Kielipankin laajan aineiston avulla.
Leksikaalisesti patsas-sanoja on 440 ja keskus-sanoja 2 628, eli jälkimmäisiä on melkein kuusi kertaa enemmän, kun taas lemmataajuuksien eli tekstifrekvenssien suhteet ovat päinvastaiset mediaanilla mitattuna (patsas-sanojen mediaanisa- nan lemmafrekvenssi on 231, kun vas- taavan keskus-sanan frekvenssi on 40).
Tämä on yleinen lainalaisuus: epäpro- duktiiviset sanat ovat käytöltään ylei- sempiä ja juuri sen takia ne säilyvät käy- tössä. Kummankin taivutustyypin kol- mitavuiset sanat pyrkivät olemaan kes- kitavultaan vahvoja (morilla mitattuna), ja laitatavut ovat heikkoja. Erityisen vah- vaksi taivutustyypin merkiksi osoittautu- vat viimeiset kaksi segmenttiä eli -As ja -Us. Epäsanojen taivutustestissä koehen- kilöt suosivat odotuksenmukaisesti vah- vasti -Us-paradigmaa. Kriittisenä huo- mautuksena voi todeta, että -As-sanoja tietenkin syntyy produktiivisesti johta- malla (vaikkapa trendi+käs). Tekijät pi- tävät yhtenä tuloksena sitä, että koehen- kilöt eivät ole mieltäneet epäsanoja eris- nimiksi eivätkä siksi yleisesti taivutta- neet Carlos : Carlos+in. Mutta tämä on todennäköisesti seuraus koeasetelmasta, koska koehenkilöt saivat tehtäväksi si- joittaa epäsanat objektimuotoon lause- kehykseen Minä otan ___, eikä tällainen konteksti ole luonteva objektina olevan sanan erisnimitulkinnalle.
Artikkelissa ”Suomen nominien tai- vutusjärjestelmän produktiivisuuden in- dekseistä” (Virittäjä 112, 2008: 518–544) Nikolaev ja Niemi yleistävät edellisen ar- tikkelin keskeiset tulokset koko suomen nominien taivutusjärjestelmään. Tekijät
valaisevat mielenkiintoisin kvantitatii- visin testein, minkälaisia riippuvuuksia ja osittaisia poikkeamia on pienen lek- sikaalisen frekvenssin – suuren käyttö- taajuuden, ja toisaalta suuren leksikaa- lisen frekvenssin ja pienen käyttötaa- juuden välillä. Erityisen merkittäväksi osoittautuu hapaksien eli korpuksessa vain kerran (tai erittäin harvoin) esiinty- vien sanojen määrä. Produktiivisuustar- kasteluissa liian vähälle huomiolle jää- vät silti yhdyssanat. Vaikka kivettyneissä ja epäproduktiivisissa taivutustyypeissä onkin vain vähän perussanoja, nämä pe- russanat saattavat silti toistua sadoissa produktiivisesti muodostetuissa yhdys- sanoissa, jotka voivat olla erittäin ylei- siä. Vaikkapa sana lapsi on taivutukselli- nen uniikkitapaus, mutta se esiintyy kor- puksessa 620 eri yhdyssanan perusosana, siis sijoituslapsi, muslimilapsi, aviolapsi jne. – Ei tunnu oikealta väittää risti-pa- radigmasta, että se olisi ”lähes agglutina- tiivinen”. Monikon i/e-vaihtelun lisäksi tämän tyypin sanat ovat tietenkin aste- vaihtelunkin alaisia, ja astevaihtelu on mitä epäagglutinatiivisin.
Artikkelissa ”Impaired attention to phonological input, dysfunctional ’lexi- cal frequency counter/s’ and abnormal grammatical morphology: A possible causal chain?” (Zlatev ym. toim. 2009:
246–260) Niemi, Nikolaev ja Kenneth Hugdahl selvittävät tapaa, millä spesifistä kielihäiriötä potevat koehenkilöt proses- soivat eräitä keskeisiä taivutustyyppejä, kun he kohtaavat tuntemattomia epäsa- noja. Jossain määrin hypoteettiseksi se- litykseksi tarjoutuu kyvyttömyys tajuta syötteen frekvenssieroja.
Vertaisarviointiin jätetyssä artikke- lissa ”Paradigm complexity and percep- tion of isolated lexemes: Effects of num- ber of stem allomorphs on performance
in lexical decision and event-related po- tential experiments” Nikolaev, Ari Pääk- könen, Jussi Niemi, Mikko Nissi, Eini Niskanen, Mervi Könönen, Esa Mer- vaala ja Hilkka Soininen selvittävät ko- keellisesti, onko lasi- ja vesi-paradigmo- jen eräiden sananmuotojen todellisessa prosessoinnissa eroja. Aivovastemittauk- set osoittavat odotuksen mukaisesti, että vesi-muotojen prosessointiin kuluu enemmän resursseja (”left anterior ne- gativity”). Tekijöiden sinänsä uskottava tulkinta on, että epäproduktiiviset muo- dot ovat laajemman, monen polun ver- koston osia kuin produktiiviset muodot.
Yksikön nominatiivilla ei ole mitään eri- koisstatusta oletettuna ”perusmuotona”.
Toisaalta epäproduktiivisten muotojen nopeampi tunnistaminen tulkitaan suu- remman esiintymistaajuuden aiheutta- maksi. Pienenä huomautuksena voidaan todeta, että vesi-paradigma ei suinkaan ole teoreettisestikaan tarjolla sellaisten lainojen kuten ledi, brändi taivutusmal- liksi, koska ei ole olemassa näin taipu- via *-di-loppuisia nominatiiveja. Parempi ja omaperäinen esimerkki olisi kasi ’8’, joka taipuu kasi+n : kasi+a eikä *kade+n : *kat+ta kuten käsi (eikä toisaalta myös- kään *kase+n : *kas+ta kuten jousi).
Yhteenvetoluvussa Nikolaev käsitte- lee uutena asiana mm. suomen substan- tiivien taivutusjärjestelmän informaa- tiopitoisuutta käsitteiden ”entropia” ja
”informaatio” avulla. Molemmat käsit- teet ovat tunnetusti vaikeaselkoisia. Ne liittyvät toki toisiinsa, mutta niiden sa- mastaminen (esim. s. 37) yksinkertais- taa liikaa. Tässä Nikolaev laskee tietty- jen paradigmaattisesti keskeisten taivu- tusmuotojen entropian päätyen siihen, että ”eniten informaatiota sisältää” yksi- kön partitiivi, koska sen entropian arvo on suurempi kuin yksikön nominatii-
vin ja genetiivin sekä monikon partitii- vin ja inessiivin. Mutta suurta entropiaa ja korkeaa informaatiopitoisuutta voi- daan myös pitää toistensa vastakohtina.
Suuri entropia eli haje on yllätyksellisyy- den, rakenteen puutteen ja epäjärjestyk- sen mitta, kun taas korkea informaatiopi- toisuus viestii ennustettavuutta ja raken- teen eriytyneisyyttä. Sen takia informaa- tion yksi luonnehdinta onkin, että se on negatiivista entropiaa (negentropiaa, vrt.
Niiniluoto 1989: 18–22). Yksikön partitii- vin muodosta käsin on helpompi ennus- taa esimerkiksi yksikön nominatiivi kuin vaikkapa yksikön genetiivistä tai moni- kon inessiivistä käsin.
Kaikkiaan Alexandre Nikolaevin väi- töskirja tarjoaa mielenkiintoisia, empii- risesti perusteltuja näkökulmia taivutus- morfologian produktiivisuuteen ja mor- fologisen prosessoinnin klassisiin ongel- miin.
Fred Karlsson etunimi.sukunimi@helsinki.fi
Lähteet
Anttila, Arto 1997: Variation in Finnish phonology and morpohology. Väitöskirja, Stanford University, Department of Linguistics.
Bauer, Laurie 2001: Morphological produc- tivity. Cambridge: Cambridge University Press.
Linell, Per 2005: The written language bias in linguistics. Its nature, origins and transformations. London: Routledge.
Niiniluoto, Ilkka 1989. Informaatio, tieto ja yhteiskunta. Filosofinen käsiteanalyysi.
Helsinki: Valtion painatuskeskus.
Zlatev, J. – Johansson Falck, M.
– Lundmark, C. – Andrén, M.
(toim.) 2009: Studies in language and cognition. Newcastle: Cambridge Schol-Cambridge Schol- ars Publishing.