ja kehitys

(1)

KATEGORIAKIELIOPPI

KristiinaJokinen

Tietokonelin gvistiikan

tutkimusyksikkö Helsinginyliopisto

During the past ten years Categorial Grammar, CG, has achieved a lot of interest among linguists. Two main characteristics of CG are responsible for its popularity: a strictly bottom-up analysis ofsentences and a close relationship to formal semantics. The paper is a brief introduction to CG. An overview of basic concepts and principles common to different CG versions is presented. Problems are exemplifìed by a simple application to Finnish with a special emphasis on word-order.

T.JOHDANTO

Kategoriakielioppi (Categorial Granimar, CG) on

viimeisten

kymmenen vuoden aikana

kiinnittänyt

lingvistien huomiota syntaksin

ja

semantiikan l¿iheisen vuorovaikutuksen sekä leksikkolähtöisen

ja

lauseen pintaraken- üeeseen

keskittyvân

analyysinsa

vuoksi.

K¿isitteen¿i kategoriakielioppi tosin kattaa useita yksityiskohdiltaan erilaisia versioiüa,

ja

_senpuitteissa tehdään tutkimusta sekä puhtaasti semanttis-loogisista lah6kohdista ettå luonnollisen kielen kuvausüarpeista käsin.

Tässä artikkelissa tarkastelen kategoriakielioppia etupåässá syntak- tisena kuvausmallina. Näkökulmani on yleinen. Esittelen lyhyesti

kaikille

kategoriakieliopeille yhteiset pÉiåperiaatteet, ja peruskäsitteet, ja pyrin vålt- tämäån vain

jollekin

_CG:nversiolle

tyypillisiri

yksityiskohtia. Kä.ytän tosin Steedmanin notaatiota, koska se on selkeå

ja

havainnollinen,

ja

toisaalta melko laajasti ktiytässä. Myös monet esimerkkilauseeni pohjautuvat hänen esimerkkeihinsä.

Artikkelini

lopuksi tarkastelen kategoriakieliopin frag- menttia suomen kielelle. Sovellan CG:n periaatteita yksinkertaisten transi- tiivilauseiden sanajridestyksen kuvaamisessa

ja

kriyn läpi muutamia han- kalia koordinaatiotapauksia.

2. KATSAUS

HISTORIAAN

Kategoriakielioppi on alunperin puolalaisen loogikon Ajdukiewiczin (1935) kehittåmå menetelmä formaalien kielten jåsentämiseksi. Kategoriakieli- oppi

kehittyikin

aluksi matemaattisen logiikan piirisså,

ja

historiasta joh- tuu, ettå CG:n nykyisess¿ikin tutkimuksessa loogikkojen osuus on

erittäin

vahva.

Lingvistiikkaan

kategoriakielioppi

tuli

vasta 1970-luvulla,

jolloin

perinteisen TG-kieliopin valtakausi alkoi hajotaja kiinnostus uusiin

kieli- oppimalleihin

lisåÉintyi.

Myös

Montague-semantiikan

synty ja

kehitys

vauhditti

CG:n tutkimusta, koska Montague-semantiikka perustuu katego-

riakieliopin

periaatteille.

Lyonsin

⁽¹⁹⁶⁸⁾kategoriakielioppia käsittelev¿i

(2)

luku lienee ensimmäinen lingvisteille tarkoitettu CG:n yleisesitys ja on varsin hyväjohdanto sen perusteisiin. Geach (1972) esitti sovelluksen loogiseen syntaksiin, mutta vasta Bach (1980, 1983)ja Dowty (1982, 1985) sovelsivat kategoriakielioppia luonnollisen kielen kuvaukseen.Myös Ades & Steedman (1982)

käsittelivát

sanajädestystå

ja pitkän

matkan riippuvuuksia CG:n pohjalta psykolingvistisesti motivoituneessa artikkelissaan. Steedman on sittemmin kehittånyt kategoriakielioppia edelleen (Steedman 1985a, 1985b' 19S?)

ja keskittynyt erityisesti

luonnollisen

kielen

kombinat'oriikkaan Lambekin ⁽¹⁹⁶¹⁾esittämän kombinatorisen semantiikan pohjalta ^(Steed-

manin

versio

on nimeltåån

Combinatorial Categorial Grammar, CCG).

Semantiikan puolella taas

van

Benthem (1983, 1986, 1987)

on

useissa artikkeleissaan

kåsitellyt

kategoriakieliopin

ja

loogisen semantiikan, erityisesti tyyppiteorian, yhteyttä.

Kategoriakieliopin versioita on myös implementoitu tietokoneella.

Unifïkaatiopohjaisia kategoriakielioppeja ovat UCG (Unifïcation Categorial Grammar, Zeevat

& al.

^1986),CUG (Categorial

Unification

Grammar, Uszkoreit 1986)

ja

CATFINN (Karttunen 1986). Myös HPSG (Head-Driven Phrase Structure Grammar, Pollard 1985, Pollard & Sag 1987) voidaan

tul- kita

kategoriakieliopiksi, vaikkakaan ei sen perinteisimmäksi edustajaksi.

Toisaalta UCG

ja

HPSG muistuttavat toisiaan suuresti

ja

eroavat lähinnËi notaationsa sekä kåyttämienså semattisten teorioiden perusteella.

Kategoriakieliopin tutkimus on keskittynyt etupåässä Edinburghiin, Stuttgartiin, Amsterdamiin

ja

Stanfordiin. Kahdessa ensin mainitussa pai- kassa

on meneillään laaja

ACORD-projekti,

joka _tähtåä

tietokantojen haku-

ja

kyselyohjelman kehittämiseen,

ja

jossa lauseanalyysi ^perustuu UCG:hen. Haddock

& Klein

(1986) on suositeltava -

vaikkakin

formaalin esitystapansa vuoksi melko raskas - kokoelma artikkeleita,

jotka

käsitte- levät Edinburghissa tehüyå tutkimusta, CCG:tä ja UCG:tå.

3.

KATEGORIAKIELIOPIN

PERUSTEET

Kategoriakielioppi on generatiivinen

kielioppimalli, eli

se sisälttiå ekspli- siittisesti

mååritellyn

leksikon sekä säånnöstän,

jonka

tarkoiüus on gene- roida

kaikki

kielen lauseetja vain ne.

Bar-Hillel &

^al.⁽¹⁹⁶⁰⁾

todistivatjo varhain

kategoriakieliopin

ja

lausekerakennekieliopin

heikosti

ekviva-

lenteiksi. Formaaleilta ominaisuuksiltaan klassinen

kategoriakielioppi kuuluu siis kontekstittomien kielioppien (context-free grammars) joukkoon, ts. se pystyy generoimaan keskiupotuksia, mutta ei ristiinmeneviå riippu- vuussuhteita. Kategoriakieliopin laajennukset

kuitenkin

lis¿iävät sen gene-

ratiivista

kapasiteettia. Osa CG:n tutkimusta käsittelekin CG:n formaalien ominaisuuksien

muuttumista

sen mukaan,

millaisia

sääntöjti kielioppiin valitaan (Friedman & al. 1986, Friedman 1987).

(3)

cG:n päämäåränâ on kielen ilmausten yhdistymismahdollisuuksien

ja

-rajoitusten selvitt¿iminen lâhtien siitâ perusajatuksesta, ettå ilmaukset voivat kombinoitua muiden ilmausten ^kanssavain tietyllä tavalla. Isommat kokonaisuudet (lausekkeet, lauseet) ovat hyvÈimuotoisia vain jos niiden osa- ilmaukset

on voitu

^yhdiståä

kieliopin

måärËiåimàllä

tavalla. Kaikki

ei-

triviaali

informaatio koodataan leksikkoon

liittåmållä

jokaiseen kielen ilmaukseen kategoria, joka määräå miten ilmaus voi kombinoitua. Syntak- sin osuus

kutistuu

siis minimiin,

ja

syntaktiset säännöt redusoituvat muu- tamaksi

yleiseksi

kombinointisåäúnöksi. Alkuperäisesså kategoriakieli- opissa kombinointisääntöjå

oli

vain

yksi, mutta

luonnollisen kielen

kieli-

opeissa

niitä

tarvitaan enemmän.

Leksikkomuotoihin voidaan helposti koodata myös semanttista infor- maatiota. syntaksia

ja

semantiikkaa

ei

nÊiin ollen ole erotettu

erillisiksi

komponenteiksi, vaan

ne toimivat

samanaikaisesti samojen kombinato- risüen periaatteiden mukaan. Låhtökohtana on ^syntaksin

ja

semantiikan rakenteellinen isomorfisuus, ts. jokaista syntaktisesti hyvåimuotoista lauseketta vastaa semanttisesti hyvämuotoinen ilmaus. Kokonaisuuden merkitys saadaan Fregen kompositionaalisuusperiaatteen mukaisesti ^{osien mer-} kityksen funktiona, ts. kombínoimalla osien semanttiset arvot (tyypit, kategoriat) semanttisten hyvâmuotoisuussäänk)jen mukaisesti. Kategoriakieli- oppiin voidaan yhdistää erilaisia semanttisia teorioita (esim. CCG kåyttää Lambekin kehittåmäâ kombinatorista semantiikkaa, ^{UCG Hans}Kampin diskurssirepresentaatioteoriaa

ja HPSG

situaatiosemantiikþ¿¿), mutta oleellista on, että syntaksi sen paremmin kuin semantiikkakaan eivåt toimi toistensa syötteenâ, vaan

kumpikin vaikuttaa yhtå

aikaa analyysin kul-

kuunja

tulokseen. Lauseanalyysi ei siis tåhtää pelkåistään lauseen syntak- tisen rakenteen muodostamiseen, vaan paremminkin lauseen merkityksen esille saamiseen, lauseen ¡rmmärtämiseen.

3.1.

Kategoriat

jaetaan peruskategorioihin (basic cøtegories)

ja

johdettuihin lc,øtegorioihin (d.eriued categories). Peruskategoriat voidaan

valita

^mieli- valtaisesti, ja muut kategoríatjohdetaan ^näistÉirekursiivisesti. Kategorian määritelmåkuuluu:

(1)

Jos X on peruskategoria, niin X on kategoria.

Jos X ja _{Y ovat}kategorioita, niin XIY on kategoria'

Johdettu kategoria XIY

('X

leautta

Y')

tarkoittaa ilmausta, joka kombinoi-

tuu

kategoriaa

Y

olevan ilmauksen kanssa

ja

muodostaa kategoriaa X olevan ilmauksen. Kategoriat voidaan

tulkita

myös funktioina, jolloin kategoria

xlY

kåsiüett¿iisiin funktioksi Y-kategorialta x-kategorialle. Funktio-

tulkinnan

pohjalta kategoriaa

Y

kutsutaan argurnenttikøtegoriahsi, kategoriaa

X

tuloskategoriøksi

ia

kategoriaa XIY kokonaisuudessaan funktio-

(4)

køtegoriaksi. Funktiokategoria

on

aina

johdettu

kategoria,

mutta

argu- menttikategoriana voi olla joko perus- tai johdettu kategoria. Steedmanin ehdottaman merkintätavan mukaisesti kategorias¡rmbolissa on argumenttikategoria kauttaviivan oikealla, tuloskategoria vasemmalla puolen.

Ero peruskategorioiden jajohdettujen kategorioiden vålillä on se, ettâ peruskategoriat

tulkitaan triydellisiksi jo

itsessäån,

kun

taas johdetut kategoriat ovat epäüäydellisiå

siinä

mielessä,

että ne

tarvitsevat jotain, jonka _kanssakombinoitua,

jotta

ilmaus olisi hyvämuotoinen. Perinteisesti substantiiveja, nominaalilausekkeita

ja _lauseita _on pidetty

peruskate-

gorioina,

muüüa eråisså nykyisissä CG-versioissa peruskategoriaksi _{on va-}

littu

verbi. Valintaa on perusteltu sillä, ettri kielissä, joissa on vapaa sana- järjestys

ja rikas

morfologia,

kombinointi tulee

yksinkertaisemmaksi

ja

elegantimmaksi, jos sijataivutettu NP "etsii" sopivaa verbiå, jonka _subjek-

tina tai

objektina se voisi toimia,

kuin

^jos

verbi

"etsisi" argumenttejaan, joiden

tulisi

olla tietyssä sijassa (Karttunen 1986).

3.2

Kombinointisåånnöt

3.2.1

Funktioapplikaatio

Funktioøppliþaøtio (Functionøl

Applicationl on

kombinointisåäntö, ^jossa

funktiokategoria kombinoituu

argumenttikategoriansa

kanssa.

Koska argumenttikategoría voi löytyä joko funktion oikealta tai vasemmalta puo-

lelta,

puhutaan vastaavasti kombinoinnista eteenpåin

ja

kombinoinnista taaksepäin.

Argumentin sijainti ilmoitetaan vinoviivan

^(slash)avulla.

Eteenpäin kallistuva vinoviiva tarkoittaa, ettå argumentin on oltava funk- tionjåljesså (oikealla _puolen),kun taas taaksepäin kallistuva vinoviiva tarkoittaa, ettå argumentin on lõydyttËivä

funktion

edeltå (vasemmalta puolen). Jos argumentti

voi

olla kummalla puolen tahansa, käytetÉiàn pysty- suoraa viivaa. Kombinoinnin suunnalla on yleenså merkitystâ luonnollisen kielen sanajärjestyksen kannalta.

(2) Applikaatioeteenpäin

(ForwardApplication)

XN Y ->

Applikaatiotaaksepäin

(BackwardApplication)

Y X\Y ->

Funktioapplikaatiossa tuloskategorian semanttinen arvo saadaan sovelta- malla funktiokategorian semanttista arvoa argumenttikategorian semanttiseen arvoon. Såännön

nimi,

funhtioapplihaøtio,

viittaakin

semanttiseen operaatioon, kun taas puhtaasti syntaktista yhdiståmistå tarkoitüava säåin- tä

olisi

kon¿binointisätintöoikealle tai vasemmalle. Kuten edellåi on kuiten-

kin tullut

esille, voidaan kategorias¡rmboli

tulkita

myös semanttisen tyypin lyhenteeksi,

jolloin

syntaktiset säånnöt vastaavat semanttisia

tulkinta-

sååntöjá

(vrt.

Bachin L980 rule-to-rule -periaate

ja Kleinin &

Sagin 1984

(5)

esittånä tiukempi, semanttisten tyyppien ohjaama

tulkinta,

ns. type-d.riuen translation\. Ottamatta kantaa semanttisen edustuksen yksityiskohtiin voidaan syntaktis-semanttiset applikaatiosåânnöt esitt¿iå siten, että katego-

rioihin

on merkitty myös semanttinen tieto esim. seuraavasti:

(3)

X/Y:F

Y:y ->

Y:y X\Y:F ->

^X:F(y)

Funktioapplikaatio voi soveltua vain, jos argumentti on heti funktion vieresså.

Luonnollisen kielen kieliopissa vaatimus rajoittaa

kieliopin kuvausvoimaa,

sillå

tunnetusti piükån matkan riippuvuudeü, rinnastus

ja

sanajârjestysvariaatiot ovat ilmiöit¿i, joissa funktio

ja

argumentti eivåt ole

vierekkäin.

Klassista kategoriakielioppia

onkin

laajennettu Steedmanin

ym.

ehdotusten pohjalta funktiokompositiolla

ja

tyypinnostolla. Funktio- komposition

ja

tyypinnoston vapaa salliminen on kuiüenkin CG:n formaalien ominaisuuksien kannalta vaarallista, koska kategorioiden måiâirâ kas- vaa äårettömäksi,

ja

tyypinnoston rekursiivinen soveltaminen tekee ana- lyysista pririttymeittU'män. Näiden sääntöjen soveltumisehtojen määrittä-

minen on siten

tÊirkeå

osa kieliopin kirjoittamista

^(Steedman1987, Szabolcsi 1983,1987).

3.2.2

Funktiokompositio

F unktio ho rnpo sitio s

sa

^(Functional C ompo

sition) kaksi

funktiokategoriaa kombinoidaan keskenään. Sen mukaan,

mihin

suuntaan vinoviivat osoitta- vat funktiokategorioissa, saadaan neljä erityyppistä funktíokompositiota:

(4)

Kompositio

eteenpäin

^(ForwardComposition)

xtY Ytz

^_>

Kompositio

taaksepäin

^(BackwardComposition)

Y\Z X\Y ->

Sekakompositioeteenpäin

(MixedForwardComposition)

)vY Y\Z ->

Sekakompositiotaaksepåin

(MixedBackwardComposition)

Y/Z X\Y ->

Esim. funktiokompositiossa eteenpåin on kyse tilanteesta, ^jossafunktio- kategoria X.fY tuottaisi kategoriaa X olevan ilmauksen, jos sen oikealla puolella olisi kategoriaa Y oleva ilmaus. Oikealla puolen on kuitenkin funktiokategoria,

joka tuottaisi

vaaditun Y-kategorian, jos se vain ensin löytåisi oikealta puoleltaan kategoriaa Z olevan ilmauksen. Olettamalla Y-katego-

ria

löydetyksi

ja

supistamalla se pois, voidaan kyseiseü funktiokategoriat kombinoida. Tuloksena

on

kategoria,

joka tuottaa

kategoriaa

X

olevan ibnauksen,

jos se loytaå oikealta puoleltaan

alkuperäisen argumenttikategorian argumentin, Z :n.

(6)

Funktiokomposition

kohdalla on kiinnitettävâ

erityisüå huomiota vinoviivojen suuntaan sekå "supistettavan" kategorian

sijaintiin.

Funktio- kompositio

ei

ole mahdollinen esim. tapauksessa ^(5),jossa ensim¡näinen

funktio etsii

argumenttiaan

(Y)

vasemmalta

eikå

siten

voi

kombinoitua oikealla olevan funktiokategorian (Y\Z) kanssa; toisen

funktion

argumentti taas on kategorian Z ilmaus,joüa ei ole lainkaan tarjolla.

(5) X\Y Y\Z ->

^*

Funktiokomposition

nimi viittaa jålleen

semanttiseen operaatioon, jossa tuloksen merkitys saadaan funktiokomposition avulla:

(6) _XIY:F YIZ:G ->

3.2.3

Tyypinnosto

Tyypinnosto (Type-Røising) on semantiikasta

tuttu

käsite,

jolla

tarkoite-

taan

ilmauksen

tyypin

(semanttisen kategorian) muutüamista siten, että

siitä

tulee astetta korkeampi, abstraktimpi. Tyypinnoston avulla funkt'ion ja argumentin suhde voidaan kääntåä päinvastaiseksi: argumenttina toimi- nut kategoria nostetaan funktioksi,joka ottaa entisen funktionsa argumen- tikseen. Sen mukaan, kummalta puolen tyyppinostettu kategoria haluaa argumenttinsa löyüyvån, puhutaan joko eteenpäin tai taaksepåin suuntau- tuvasta tyypinnostosta.

(7)

Tyypinnostoeteenpäin(ForwardType-Raising)

X:x ->

Tyypinnosto taaksepåin ^(BackwardType-Raising)

X:x -) Y\(Y/X): ÂF[Fx]

Tyypinnoston suunta

riippuu tietenkin

alkuperåiisestä funktiokategoriasta ja _sensuunnasta: tyyppinostetun kategorian suuntâ on påinvastainen

kuin sen argumenttina toimivan funktiokategorian.

Semant'tiselta kannalta tyypinnosto on vain nåkökulman muutos eikÉi vaikuta tuloksen merkityk- seen. Tyypinnostoon

liittyvå

sementtinen operaatio on lambda-abstraktio.

4.

LEIKKIKIELIOPPI

Tarkastelen

lopuksi pientä

suomen

kielen

kielioppifragmenttia,

ja

sen rajoissa suomen

kielen

sanajärjestystä. Steedmanin ehdotuksen pohjalta teen ensin sulutusta koskevan notaüionaalisen sopimuksen: vinoviivat ovat vasemmalle assosiatiivisia. Sulut voi siis jättÉiä pois tuloskategorian ¡rmpä-

riltå, sillå

kategoriasymbolissa äärimmäisenêi oikealla oleva kategoria on aina argumenttikategoria, ^jamuut muodostavat yhdessä tuloskategorian:

(xlY)lz = ^xlYlz

(xlY)l(zlw) = ^xlYl(zllv)

(7)

Jos argumentti on johdettu kategoria, se on aina kokonaisuudessaan

kirjoi- tettava sulkuihin:

kategoria XlYlZlW

ei siis

ole jålkimmåisen esimerkin lyhennetty muoto, vaan tarkoittaisi kategoriaa ((XlY)lz)l\lV.

Valitsen peruskategorioiksi yleisen käytännän mukaisesti substan-

tiivin

(N), nominaalilausekkeen ^(NP)

ja

lauseen (S). Esimerkkini kannalt'a

valinnalla

ei ole suurtakaan vaikutusta,

vrt. kuitenkin

^Karttunen^(1986).

Johdettuja kategorioita ovat nyt mm.:

SINPs (=W) int¡ansitiiviverbi

SlNPdNPo ^(=VPlNPo)

transit'iiviverbi

SlNPsl(SlNPs) (= vPlvP)

adverbi

NP/N

determinantti

N/¡I

^adjektiivi

NU{(SINPs) relatiivipronomini

^(subjekti)

N\N(SINPg) relatiivipronomini

^(objekti)

Esimerkiksi

intransitiiviverbi

on ilmaus, joka tarvitsee subjekti-NP:n muodostaakseen lauseen,

transitiiviverbi

taas ilmaus,

joka

tarvitsee objekti- NP:n muodostaakseen kategoriaa SINPg olevan ilmauksen

(intransitiivi-

verbin) ja _edelleensubjekti-NP:n muodostaakseen lauseen.

Kategorioiden rekursiivisen mâäritelmån vuoksi kategoriasymbolit

tulevat

helposti

varsin

monimutkaisen nåköisiksi. Selvyyden stiilyttämi- seksi

on kategorioille annettu

lyhennemerkintä, esim. kategoria SINP5 lyhennetäán

VP.

Kategorioihin voidaan myös yhdistäå

piirteitä

erotta- maan kategoriasymboliltaan samanlaiset, mutta

joiltakin

olennaisilta ominaisuuksiltaan

erilaiset

kategoriat toisistaan. Esim.

NP:ihin liitetyt

ala- indeksit s

ja

o

viittaavat

subjektin

ja

objektin sijapiirteisiin. Verbikatego-

riat

taas saavaü mm. muotoa ja persoonaa osoittavan alaindeksin:

VPlfïn,sg3lÆ[infl] =

^haluaa,^tahtoo,^saajne'

W¡innlÆtittt¡l =

^ruveta'^pyytäÊi,^käskeäjne'

Piirteet jåtetäån pois, jos ne eívât ole välttämättömiËi esimerkin kannalta.

Vapaan sanajärjestyksen vuoksi suomen kielen kuvauksessa

verbillå

on suuntaamaton kategoria, ts. subjekti-NP:n

ja

objekti-NP:n paikka suhteessa

verbiin

on vapaa. Jos suuntaamaton kategoria

kuitenkin tulkitaan

vain

suuntaisten kauttaviivojen neutraalistumaksi, on kat'egoriakieliopin perusidea samasta syntaktisesta jakautumasta kadotettu, koska suuntaamaton kategoria pitäÈi nyt, sisållâän sekå oikealle että vasemmalle kombi- noivan kaüegorian. Suuntaamaüon kategoria onkin parhaiten qiaüeltavissa lyhenteeksi kahdelle suunnatulle kategorialle,

joita

käytetään tilanteen mukaan:

kauttaviiva

instantioidaan aina sen mukaan kummalla puolen

(8)

objekti on. Suuntaamattomat kategoriat

ja piirteet

eivät lisâå kategoriakieliopin generatiivisüa kapasiteettia.

Kategoriakieliopin mukainen analyysi yksinkertaiselle

suomen kielen transitiivilauselle ^onesitetty alla. Notaatio on Steedmanin käyttämåi

ja

vastaa

ylösalaisin

ktiånnettyå derivaatiopuuta. Lyhenteet viiüt'aavat funktioapplikaatioon eteenpäin ⁽

>)ja

taaksepåin

(<).

Anttí kääntää

^runoja

NPs SlNPslNPo

^NPo

slNPs S

Vertailun vuoksi ohessa on myös vastaavan englanninkielisen lauseen analyysi. Periaaüteessa se on samanlainen kuin suomenkielisen lauseen analyy-

si, mutta

verbÍkategoria

on nyt

suunnatüu: objekti-NP:n

on

löydyttåv¿i verbin oikealta, subjekti-NP:n taas vasemmalta puolen.

Andy translates

^poems

NP S\NP/NP

^NP

S\NP S

Kummallekin analyysille on yhteistä se, että verbin kanssa kombinoidaan ensin objekti-NP

ja

vasta t¿imän jâlkeen subjekti-NP. Mutta kun englannin kielen analyysissa subjekti

ja

objekti erotetaan toisistaan verbin semantiikan

avulla

(ensimm¿iiseksi kombinoitu NP

tulkitaan

aina objek- tiksi, viimeksi kombinoitu NP subjektiksi), tunnistetaan ne suomen kielen analyysissa sijapiirteiden avulla.

Analyysi

myötäå siten tunnettua typo- logista eroa: subjektin ja _objektinerottamisessa käytetään joko sijapiirteitå tai kiinteäå sanajärjestystä.

Suuntaamattomien kategorioiden

ja

funktioapplikaation avulla voidaan suomen kielen kuudesta transitiivilauseen mahdollisest'a sanajärjes- tyksestä kuvata neljä,

nimittåin

ne,joissa verbija objekti ovat rinnakkain:

Antti käånt¡iä runoja

^S^{V O}

Antti runoja käåntäËi

^{S O}

^V Runoja kåäntäå Antti

^O

^VS Käåntåä runoja Antti

^V^{O S}

Jos subjekti on

kiilautunuü

verbin

ja

objektin

vâliin

(lausetyypit OSV

ja

VSO), ei funktioapplikaatio voi soveltua,

ja

analyysi pysâhtyy. Transit'iivi-

verbin

kategoriahan määrââ, että

verbin

kanssa on kombinoitava ensin objekti-NP

ja

vasta ü¿imän jälkeen subjekti-NP, mutta nyt lineaarinen

jår-

(9)

jestys ei anna tähân mahdollisuutta. Ratkaisuja ^onkaksi. Voimme joko laa- jentaa s¿iännöstijå tai

liittää transitiiviverbiin

toisen kategorian,

nimittäin

kategorian SlNPolNPs, jolloin verbi kombinoituu ensin subjekti-NP:n ja sit- ten objekti-NP:n kanssa. Ensimmåinen vaihtoehto on hankala semant'iikan kannalta, koska se tuhoaisi semanttiset yleistykset lauseen merkityksen muodostamisesta. SitÉi

paitsi

sanan kuulumínen moneen

eri

kategoriaan kasvattaa leksikon kokoa

ja

tisååi lokaalista monimerkityksisyyttä: jokai- nen

transitiiviverbi

^saisi^kaksi^erilaistakategoriaa, ja _sitenjokainen transi-

tiiviverbin

^esiintymå^lauseessa^olisikaksimerkityksinen. Toisaalta on luon- nollista hyvåksyä säåinnöston laajennus, sillä muutamien muiden syntaksin ílmiöiden vuoksi meidän on

joka

tapauksessa laajennettava säånnöstöä sekä funktiokompositiolla

että

tyypinnostolla.

Jo muutenkin tarvittavia

keinoja voidaan näin ollen kåyttåä myös t'åimän

ilmiön

kuvaamiseen. Jos siis subjekti-NP nostetaan verbin yli'eteenpäin

(>C*) ja

funktiokompositiota sovelletaan eteenpäin ⁽>B), saadaan analyysi etenemään:

Runoja Antti

^{käänt¿i¿i}

NPo NPs

(SlNPs)lNPo

---- )C*

Sl(slNPs)

>B

slNPo S

Intoslause

KritintääAntti

runoja saadaan kuvattua samalla tavalla.

Funktiokomposition lisääminen luonnollisen

kielen kielioppiin

on üarpeen

erilaisten siirtojen ja

koordinaatiotapausten kuvaamiseksi. Jos esim. vapaa ^(ts.ei alakategorioitu) määrite on

"siirretty"

^verbin

ja

_{sen ala-} kategorioiman argumentin

väliin

(esim. adverbi on verbin

ja

sen objektin välissä), on kåytettåvå funktiokompositiota taaksepäin ⁽< B):

Antti söi eilen

^ostereita

NPs VPINPo VqVP

^NPo

<B

vPlNPo

VP=

SINPs S

Funktiokompositiota eteenpÉiin

(>B)

taas

tarvitaan mm.

^oikealle nousevan noodin

(Right

Node Raising) tapauksessa, jossa

kaksi

saman objekti-NP:n

ottavaa verbiá on rinnastettu konjunktiolla.

Konjunktion kategoria on sellainen, ettå se voi yhdistäå vain kaksi samanlaista kat'ego-

(10)

riaa (Gazdar 1981).

Alla

olevassa esimerkkilauseessa vålittömäisti konjunk-

tion

vieresså olevat kategoriat (S/NPg/NPp

ia

SlNfulVP) ovat

kuitenkin

yhteensopimattomia,

ja jos

peräkkäisten funktioapplikaatioiden avulla muodostetaan ilmauksen haluøø

julkaista

runoja kategoria, saadaan tulok- seksi S/NPs,

joka

myöskin on yhteensopimaüon. Ilmaukset høluaa ia

jul'

h,aista voidaan

kuitenkin

kombinoida funktiokomposition avulla,

jolloin

saadaan kirjoittøø-ilmauksen kategorian kanssa yhteensopiva kategoria

S lN ^{P slN}^{P o,}ia analyysi päåsee etenemåån.

Antti kirjoittaa ja haluaa ^julkaista

^runoja

NPs SlNPslNPo conj

SINP5/VP

VPINP6

^NPo

>B

slNPslNPo koord

slNPslNPo

slNPs S

Kaikkia

funktiokomposition lajeja (4)

ei tietyn

erityiskielen

kieli-

opissa välttämåittä tarvita. Steedman (1987) arvelee, ettei taaksepäin suun- tautuva sekakompositio ole välttämÉitön englannin kielen kieliopissa. Mui- ta kompositioita taas tulee rajoittaa siten, että ne soveltuvat vain

tiettyihin

kategorioihin, muuten esim. epäkieliopillinen topikaalistus ^*book,

I

^read.the tulisi hyväksytyksi. Suomen kielen kuvaus ntiyttåiä sanajärjestysvariaatioi- den vuoksi tarvitsevan

kaikki

funktiokomposition

lajit,

mutta niiden sovel- tamisrajoitusten måärittåminen on kuvauksen keskeinen ongelma.

Tyypinnosto

on tarpeellinen tietyisså

koordinaatioissa. Jos esim.

oikealle nousevan noodin tapauksessa rinnasteütavilla verbeillå ^on^erisub-

jektit,

on

kumpikin

verbi kombinoitava subjeküinsa kanssa ennen rinnas- tusta. TätÉi varten on subjekti ensin tyyppinostettava verbin

yli:

Hillevi valmisti ja Antti söi ^torilta

^ostetut^osterit

"""¡ ñä'

tqÑË.-¡lNpo ^NPo

---- )C*

sl(slNPs)

>B >B

slNPo

^slNPo

-.-____ koord slNPo

NPs

^(SINPJINPo

--- )C*

SI(SINPS)

S

(11)

Jos rinnastus koskee esim. verbin argumentin ja vapaan adverbiaalin koko- naisuutta, joka ei muodosta lauseketta perinteisesså mielesså (kyse on epä- konstituenttien koordinaal,iosta, non-constituentcoord,ination, Dowty 1985)' on argumentti ensin nostettava VP:n

yli, jotta

sen

ja

adverbiaalin ^kombinointi onnistuisi funktiokompositiolla taaksepäin:

Hillevi tapasi Antin tiistaina ja Aimon

^torstaina

NPs VPINP9 NPo VPIVP conj NPo

^VPIVP

""ri"r¡,1Tî ^<B ""i"-;t*Tî ^<B vPl(vPlNPo)

vPl(vPlNPo)

--- koord

vPl(vPlNPo) VP

=

^SINPs

S

Toisaalta tyypinnosto aiheuttaa usein ^sen,

että

lauseelle saadaan kaksi erilaista analyysia sen mukaan, onkojokin kategoria tyyppinostettu

vai

ei. Semanttiset kombinointisäännöt tosin takaavat sen, ettå lauseiden merkitys on sama riippumatta

siitä,

miten analyysi on tehty. Esim' lause Antti leuorsaø saa kaksi analyysia riippuen siitåi nostetaanko subjekti vai ei:

kuorsaa

Antti

^kuorsaa

Antti

NPs slNPs

NPs

^SINPS

--- )C*

sl(slNPs) S

S

Useat syntaktiset analyysit samalle pintarakenteelle eivät teorian kannal-

ta

kuitenkaan ole vältt¿imåttä

kuin

pelkkiä kauneusvirheitå. Koska lauseelle saadaan vain yksi merkitys,

ja

koska lauseen merkityksen esille saa- minen on lauseanalyysin pÉiämåärå, voidaan erilaisia analyysitapoja pitåéi vain menetelmän sivutuotteina,

joilla

ei ole sen suurempaa arvoa itse teo-

rian

kokonaisuudessa.

Lingvistien hellimä ajatus siitâ, että

^jokaiseen semanttisesti disambiguoiüuun lauseeseen

liitetään

vain yksi synüaktinen analyysi, voi

hyvinkin

olla ylellisyyttä, ^johonluonnollisella

kielellä

ei ole varaa

(Morrill

198?). Toisaalta tämä näennäinen monimielisyys ^(spurious ambiguity) tuottaa hankaluuksia automaattisessa jåsennyksessä.

Yrityksiä

kehittäå

tehokas, CCG:n mukaiseen jäsennykseen pystyvà jåsentâjä on kuitenkin olemassa (Pareschi & Steedman 1987).

(12)

Tyypinnoston vapaa salliminen johtaa myös äårettämään rekursioon, koska sitå voidaan soveltaa mielivaltaisen monta kertaa. Funktio, jonka argumentti on tyyppinostettu, voidaan tyyppinostaa kyseisen tyyppinoste-

tun

argumenttinsa

yli,

joka _taasvoidaan tyyppinostaa entisen funktionsa yli jne., jolloin _analyysi_{ei lopu}koskaan. CCG:ssa tyypinnosto onkin rajoitet- tu yhteen kertaan,

ja

UCG:ssa

ja

CATFINN:ssa tyypinnosto tapahtuu vain leksikossa ja _vainkerran kullekin NP:lle.

s.POHDINTAA

Kategoriakielioppi näyttáä soveltuvan hämm¿istyttåvän hyvin suhteellisen vapaan sanajârjestyksen omaavaan kieleen kuten suomeen. Toisaalta se ei ole

ratkaisu

kaikkeen.

Jotkin

sanajädestykset ovat hankalasti kuvatta- vissa, eikä ongelmiin ole olemassa

siistiâ

vastausta. Esim. aukko-lauseet (gapping)

Antti

söi ostereita

ja

Ai¡no hanhenmaþsaa tai. Eilen HiIIevi halusi m.ennã. Tampereelle

ja

ttinäön Turþuun ovat

vaikeita

myös CG:lle, eivät ainoastaan

muille

kielioppiteorioille. Steedman (1987) ehdotüaa CCG:ssa

ratkaisuksi ns.

dekompositiota (decomposition), jossa

valmis

kategoria

"puretaan" osatekijöihinsä, ja kombinointi suoritetaan uudestaan näin saa- tujen kategorioiden avulla. Dekompositio luonnollisesti lisäâ automaattisen jásennyksen ongelmia,

ja on arveluttava

myös prosessoinnin kannalta:

aukon sisâltävåt tapauksethan eivåt ole garden path -lauseita.

Suomen kielen kuvauksen kannalta ongelmallista on sanajärjestyk- sen periaatteellinen vapaus, johon

kuitenkin liittyy tiettyjä

rajoiüuksia.

Suomen kielen kieliopissa tarvitaan yleensä suuntaamattomia kategorioita, mutta näin joitakin epäkieliopillisia sanajärjestyksiä on vaikea sulkea pois.

Esim. verbiketjun sisältävissä lauseissa pääverbi on yleensâ ennen

infini- tiivejä,

^mutta^joissakinfokusointitapauksissa järjestys voi muuttua: mi¿ci haluan syöd.ö ornenan vs. oïænan minti syödd. haluan mutta *minä syöd,ä

haluan o ¡nenøn v s. ^*sy ö dä h al uan minä o rnenan Sallitut järjestykset rii ppu- vat siitå,

mitä

lauseessa on verbiketjun lisäksi

ja

missêi jÉirjestyksesså, ts.

lauseen informaatiorakenteesta. Kuvaus

vaatii

siten

joko

leksikaalisten

entryjen lisäämistä tai

kombinointisååntöjen sofistikoimista

niin,

et'tä tuloskategorian piirteet mäeirriytyisivät sekä kauttaviivan suunnan perusteella että sen mukaan,

millaisia

muita kategorioita lauseesta

on

lÕytynyt.

Kombinoíntisâäntäihin

olisi näin

ollen koodattava syntaktis-semanütisen tiedon

lisåksi

lauseen temaattiseen rakenteeseen

ja

informaatiorakentee- seen

liittyvia

seikkoja: joidenkin kategorioiden kombinointi voisi tapahtua vain, jos lauseen siihenastinen rakenne _çensallisi. Jälkimmåinen vaiht'oeh- to nostaisi kategoriakieliopin tyyppiå: kombinointi eí tapahtuisi pelkåstään kategorian m¿iärä¿imâll¿i

tavalla

vaan myös konteksti vaikut'taisi siihen.

Analyysi ohjaisi itse itseäån sen mukaan,

millaisia

rajoituksia

kukin

kom-

binointi

toisi

jatkon

kannalta. Se onko kombinointi puhtaasti kompositio-

(13)

naalinen (osiensa summa), vai voiko se jotenkin muuttaa osista saatavaa tu- losta, on täll¿i hetkellå yksi cG-tutkimuksen ongelmallisista kysymyksistå.

unifïkaatioformalismin ^käyttötarjonnee tähän ainakin jonkin ratkaisun.

Toisaalta

cG

^onainoa nykyisistå kielioppimalleista,

jolla

on itses- sään, puhtaasti teoreettisena konstruktiona, suora yhteys

formaaliin

^se-

mantiikkaan. Lisäksi

^senmukainen lauseanalyysi tuottaa elegantisti

ja

vaivattomasti ^(ik¿ian

kuin

kaupan pâälle) myös lauseen

tulkinnan

^syntak- tisen hyvâmuotoisuusanalyysin ohella. Koska semantiikan tärkeys ^luonnollisen

kielen analyysille

tiedetään, voidaan kategoriakielioppia pitää tässä suhteessa parempana kuin sellaisia malleja, ^joissasyntaksi ja seman-

tiikka

ovat erillisiÉi, täysin itsenäisesti toimivia komponentteja'

cG

on myös laajentanut perinteistä kåsitystä konstituenteista pitå-

mällâ

hyvämuotoisina

ilmauksina

⁽

=

kategorioina) sellaisia ilmauksia kuin høluaa

julkaista taí

Anttí kääntää. Nåin ^yleensÈivarsin sopimattomat ja

tiukat

konstituenttimäåritelmät ovat lähentyneet niitëi

intuitiivisia

käsi- tyksili, joita yhteenkuuluvista, konstituentin muodostavista kielen ilmauk- sista on olluü. cG:n peruajatusta, leksikkokeskeistä analyysia, jossa sanat itse måärÉiävrit yhdistymismahdollisuutensa, voidaan ^myöspitää luonnolli- sempana ajaüuksena

kuin

aikaisemmin

vallalla ollutta

såiäntökeskeistä ajattelutapaa.

LIIHTEET

Ades,

Anthony E. & Mark J.

^Steedman^1982.

^{On the}

^order

^of

^words'

Linguistics and P hilosop hy 4:5 17-558.

Ajdukiewicz, Kazimierz 1935. Die syntaktische Konnexität.

^Studia Philosophica

t:L-27' Englanninkielinen

käânnÖs teoksessa Storrs McCall ^(ed.)1967. Polish Logic 1920-1939. Oxford University ^{Press, s'} 207-23L.

Bach, Emmon ^1980.

In

defense

of

passive. Linguistics ønd ^Philosophy 3:297-34L.

--- 1983. On the relatinship

between word-grammar

and

phrase- granrmar. Teoksessa Natural lønguage and Linguistic ^Theory^1:65-89.

Reidel, Dordrecht.

Bar-Hillel,

^Yehoshua,

c.

Gaifman

& E. Shamir

^1960.

on

categorial and phrase structure ^grammars.

Bulletin

of the Research council of Israel Óf',f-f

e. Painettu

uudestaan teoksessa

Y. Bar-Hillel (ed')

¹⁹⁶⁴

Lønguage ønd. Informotion. Reading Massachusetts, Addison-Wesley, s.99-114.

(14)

Benthem, Johan F.

A. K. van

t983. The logic of semantics. Universit'y

of

Groningen,ms.

---

^1986.^Es^saysin Logical Semantics. Reidel, Dordrecht.

--- 1987. Categorial grammar and the theory oftypes. Paper presented at the Symposium on Aspects of Caüegorial Grammars

at the first joint

meeting of the Association for Symbolic Logic and the Linguistic Society of America, Stanford University, July 1987'

Dowty, David

1982. Grammatical

relations and

Montague Grammar.

Teoksessa Pauline Jakobson

ja

Geoffrey K. Pullum ^(eds.)1l¿¿ N¿ture

of

S yntactic R epresentøtion. Reidel, Dordrecht, ^s.79-130.

---

1985.

Type raising, functional

composition,

and

non-constituent coordination,

Paper

presented

at the

Conference

on

Categorial Grammar, Tucson, Arizona, June 1985. Teoksessa Richard T. Oehrle, E.

Bach

ja

D. Wheeler (eds.) Categoríal Gram¡nars and NaturøI Language

S tructures, Reidel, Dordrecht.

Friedman, Joyce 198?. The generative power of categorial grammars. Paper presented at the Symposium on Aspects of Categorial Grammars at the

first joint _meeting of the

Association

for

Symbolic

Logic and

the Linguistic Society of America, Stanford University,

July

1987.

Friedman, Joyce, Dawei Dai

&

Weiguo Wang 1986. The weak generative capacity of parenthesis-free categorial ^grammars.Proceedings of the 11th

International

Conference

on

Computational Linguistics, ^Bonn, August 1986, s. 199-210.

Gazd.ar, Gerald L981. Unbounded dependencies and coördinaüe structure.

L in g ui s tic I n q u ir y L2:15 5 - 184.

Geach, Paul

T.

1972.

^

program for syntax. Teoksessa Donald Davidson

ja Gilbert Harman

^(eds.)S¿rnøntics

of Nøtural

Languøge. Reidel, Dordrecht, s.483-497.

Haddock, Nick J. & Ewan

Klein

(eds.) 1986. Ed.inburgh Worbing Pøpers in

Cognitiue

Science,

Volurne 7: Categorial Grammar,

Unification Grommar,

ønd

Pørsing.

Available from the Centre for

Cognitive Science, Edinburgh University.

Karttunen, Lauri 1986. Radical Lexicalism. Paper

^presented

at

the Conference on

Alternative

Conceptions ofPhrase Structure,

July

1986' NewYork.

Klein,

Ewan & Ivan

A.

Sag 1984. Type-driven translation. Linguistics ^and' Philosophy 8:163-201.

Lambek, Joachim 1961. On the calculus ofsyntactic types' Teoksessa Roman Jakobson (ed.) Structure of Language and' its Mathematicøl Aspects.

(15)

Proceedings

of the

Symposia

in

Applied Mathematics, 12. American Mathematical Society, Providence, Rhode Island, s.166-1?8.

Lyons,

John

^1968.

Introduction to

Theoretical

Linguistics.

^Cambridge University Press.

Morrill, Glynn

^198?.Categorial Grammar

and

Non-canonicality. Ph.D Thesis. University of Edinburgh. Unfinished draft.

Pareschi, Remo

& Mark

Steedman 1987. A' lazy way

to

chart parse wit'h categorial grammars. Paper presented at the 25th Annual Conference of the ACL, Stanford, July 1987.

Pollard, Carl 1985. Lectures on HPSG. ms. Stanford University.

Pollard, Carl & Ivan A. Sag 1987. Head-Driven Phrase Structure Grammar.

Information-based Syntax and Semantics. Volume 1: Fundamentals. To appear in CSLI Lecture Notes 12.

Steedman, Mark

J.

1985a. Dependency and coordination

in

the grammar of Dutch and English. Language 61:523-568.

--- 1985b. Combinaüors and grammars. Paper presented at the Conference

on Categorial

Grammar, Tucson,

Arizona, June

^1985.^Teoksessa

Richard T. Oehrle, E. Bach

ja

D. Wheeler ^(eds.)Categorial Gra¡nmars and Natural Language Structures, Reidel, Dordrecht.

--- 198?. Gapping as Constituent

Coordination

in a

Combinatory Grammar, Paper presented at the Conference on Logic and Linguistics.

Stanford University, July 1987.

Szabolcsi,

Anna

1983. ECP

in

categorial grâmmar. ms. Nijmegen, Max Planck Institute.

--- 198?.

Combinatory

categorial grammar and the

lexicon. Paper presented at the Symposium on Lexical Semantics, Stanford University' August 198?.

Uszkoreit, Hans 1986. Categorial Unification Grammars. In Proceedings of the 11th International Conference on Computational Linguistics, Bonn, August 1986, s.187-194.

Zeevat,

Henk, Ewan Klein & Jo Calder

1986.

Unification

^Categorial Grammar. Teoksessa Haddock &

Klein

(eds.) 1986.

ja kehitys

KATEGORIAKIELIOPPI

KristiinaJokinen

T.JOHDANTO

viimeisten

kiinnittänyt

ja

ja

keskittyvân

vuoksi.

ja

kaikille

jollekin

tyypillisiri

ja

ja

Artikkelini

ja

HISTORIAAN

kehittyikin

ja

erittäin

Lingvistiikkaan

tuli

jolloin

kieli- oppimalleihin

Myös

synty ja

vauhditti

riakieliopin

Lyonsin

käsittelivát

ja pitkän

ja keskittynyt erityisesti

kielen

manin

on nimeltåån

van

on

kåsitellyt

ja

& al.

Unification

ja

tul- kita

ja

ja

ja

on meneillään laaja

joka tähtåä

ja

ja

& Klein

vaikkakin

jotka

KATEGORIAKIELIOPIN

kielioppimalli, eli

mååritellyn

jonka

kaikki

Bar-Hillel &

todistivatjo varhain

ja

heikosti

lenteiksi. Formaaleilta ominaisuuksiltaan klassinen

kuitenkin

ratiivista

muuttumista

millaisia

ja

on voitu

kieliopin

tavalla. Kaikki

triviaali

liittåmållä

kutistuu

ja

yleiseksi

oli

yksi, mutta

joka _tähtåä

ja _lauseita _on pidetty