• Ei tuloksia

Digitaaliset ihmistieteet huipulta huipulle? HELDIG Summitissa

N/A
N/A
Info
Lataa
Protected

Academic year: 2022

Jaa "Digitaaliset ihmistieteet huipulta huipulle? HELDIG Summitissa"

Copied!
3
0
0

Kokoteksti

(1)

1/2018 niin & näin 95

Y

hteen päivään oli mahdutettu yli kahdek- sankymmentä viiden minuutin esitystä pos- terit mukaan lukien. Tuntui siltä, että kaikki halusivat olla mukana digitaalisten ihmistie- teiden maailmanvalloituksessa. Tutkimus- ryhmien lisäksi esillä oli kirjastoja, arkistoja, museoita ja julkishallinnon edustajia. Tapahtuma järjestetään jatkossa vuosittain, ja ensimmäisellä kerralla tavoitteena oli var- masti myös tutustuminen ja verkostoituminen.

Vuonna 2016 perustettu HELDIG-keskus kuuluu Helsingin yliopiston strategisiin kärkihankkeisiin, joita on tuettu Suomen Akatemian profilointirahoituksella.

Vaikka keskuksella ei vielä ole erikseen suunniteltuja tiloja, vuoden 2017 aikana on valittu yhteensä seitsemän tenure track -professoria eri tiedekuntiin.1 Helsingin yli- opistoon on perustettu digitaalisten aineistojen profes- suuri jo vuonna 2014, ja virkaa on vuodesta 2015 hoi- tanut Mikko Tolonen. Hän on käynnistänyt digitaalisten ihmistieteiden sivuaineopetuksen ja koonnut Helsingin yliopistoon pienen mutta aktiivisen ja kansainvälisen yh- teisön digitaalisten ihmistieteiden ympärille.

HELDIG-keskuksen johtajaksi valittiin vuonna 2016 professori Eero Hyvönen Aalto-yliopistosta. Hyvönen on eri yhteyksissä korostanut verkostomaista toimintatapaa ja roolissaan SeCo-tutkimusryhmän vetäjänä profiloi- tunut monenlaisten aineistojen hyödyntäjänä yleisten kirjastojen luetteloista lakitekstiin2. Tapahtumapäivä ku- vasti tätä pyrkimystä hyvin.

Perinteet, aineistot ja avoimuus

Päivän ohjelmassa olivat vahvasti edustettuina Helsingin yliopiston Nykykielten laitoksen tutkimusryhmät kor-

puslingvistiikkaan ja kieliteknologiaan liittyvine hank- keineen sekä Aalto-yliopiston linkitetyn datan ja semant- tisen verkon tutkimukseen vuosia keskittynyt SeCo- ryhmä. Kieliteknologialla tarkoitetaan kirjoituksen tai puheen jäsentämistä koneella käsiteltävään muotoon ja kielikorpuksilla kieltä koskevien hypoteesien testaamista varten koottuja teksti- tai puheaineistoja. Semanttisilla verkoilla puolestaan kuvaillaan metatasolla verkkosi- sältöjä siten, että sisältöjä voi tulkita osin automaattisesti.

Tämä lähestymistapa mahdollistaa eri sisältöjen yhdis- telyn ja automaattisen rikastamisen isommiksi kokonai- suuksiksi, niin sanotuksi linkitetyksi dataksi. Digitaa- listen ihmistieteiden tutkimusmenetelmien kehittäminen Suomessa nojaakin vahvasti näihin kahteen suuntaan:

yhtäältä tekstiaineistoja tutkitaan kielentutkimuksen me- netelmillä, ja toisaalta aineistoja yhdistellään linkitetyn datan periaatteiden mukaisesti.

Digitaalisten aineistojen käyttäminen kielentutki- muksessa ei ole uutta. Esimerkiksi suomalainen FIN CLARIN -konsortio ja sen lähinnä suomenkieliset kie- likorpusaineistot Kielipankki-palvelussa ovat olleet tut- kijoiden käytössä jo kymmenisen vuotta. Samoin linki- tettyä dataa on Suomessa tutkittu jo yli viisitoista vuotta.

Kumpikin ryhmä tarjoaa vakiintuneena toimijana mene- telmiään aineistojen käsittelyyn ja uusiin hankkeisiin.

Erityisessä asemassa digitaalisten ihmistieteiden tutkimuksessa ovat muistiorganisaatiot eli kirjastot, arkistot ja museot. Nämä organisaatiot ovat aina tar- jonneet humanisteille tutkimusaineistoja, kuten pai- nettuja kirjakokoelmia, käsikirjoituksia ja esineitä. Ko- koelmien jatkuvasti etenevä digitointi muuttaa niiden käyttöä. Arkistoon tai kirjastoon ei tarvitse välttämättä fyysisesti mennä, vaan kokoelmia voi tarkastella omalta

Maija Paavolainen

Digitaaliset ihmistieteet huipulta huipulle?

HELDIG Summitissa

Digitaalisia ihmistieteitä luonnehtii kaksi lähestymistapaa. Toinen tarkastelee digitalisaatiota, kuten verkkoa ja viestintää, kulttuurintutkimuksen menetelmillä ja toinen tutkii perinteisiä humanististen tieteiden kysymyksiä ja aineistoja digitalisaation mahdollistamilla metodeilla. Kulttuurintutkimuksen menetelmät ovat viime vuosina korostaneet kontekstia, valtarakenteita ja marginaaleja, siinä missä digitaalista

lähestymistapaa on leimannut keskeisten, tunnettujen aineistojen saattaminen digimuotoon ja uuden tarkastelun alle. Helsingin yliopiston pienessä juhlasalissa lokakuun puolivälissä järjestetty HELDIG Summit -tapahtuma esitteli digitaalisten ihmistieteiden tutkimuksen tilaa Suomessa.

Emmi Kallio, Päältä kaunis (2016), akryyliväri kankaalle, 110 x 80 cm

(2)

96 niin & näin 1/2018

päätelaitteelta dokumentti kerrallaan. Seuraava askel otetaan, jos kokonaisia kokoelmia lähdetään analy- soimaan niiden rakenteisten piirteiden kuten metadatan tai tekstin osien avulla. Käytännössä tämä tarkoittaa esimerkiksi isojen tekstimäärien tutkimista tilastollisin menetelmin.

Samaan aikaan tutkimusrahoituksen haku muuttuu yhtenäisemmäksi eri tieteenaloilla, ja rahoittajat edellyt- tävät aineistonhallintasuunnitelmia myös humanisteilta.

Jos aiemmin humanistit ovat voineet kuitata aineistoa koskevan suunnitelmansa sanalla ”kirjallisuus”, digitaa- listen ihmistieteiden kaltainen tutkimus tuo tulevaisuu- dessa lisää humanisteja pohtimaan aineistojen käsittelyä, käyttöä ja jakamista. Opetusministeriön Avoin tiede ja tutkimus -hanke sekä Tieteen tietotekniikan keskus CSC toivat esiin, että humanistien kannattaa kuvailla, avata ja jakaa digitaalisia tutkimusaineistojaan.

Aineiston jakamisesta yleiseen käyttöön voi tulla uu- denlainen tutkimuskontribuutio. Digitaalisten aineis- tojen saatavuuden parantuminen tukee osaltaan avoimen datan ja avointen menetelmien eli tutkimusta tukevien avoimen lähdekoodin tietokoneohjelmistojen käyttöä myös humanistisessa tutkimuksessa.3

Saatavuus ja menetelmät

Kiinnostavinta digitaalisten ihmistieteiden tutkimus on, kun uusien aineistojen ja menetelmien avulla tar- kastellaan aiheita, jotka eivät muuten tulisi esiin. Valo- kuvaaja Tyyne Savia (1887–1959) kuvasi muotokuvia useille eri studioille vuosisadan vaihteesta kuolemaansa saakka, mutta hänen elämäntyötään ei ole tallennettu yhtenäisenä kokoelmana mihinkään museoon. Tunne- tumpien kollegoiden töitä sen sijaan on säilytetty syste- maattisesti negatiiveja myöten ja kuvailtu luetteloihin4. Helsingin kaupunginmuseon tutkija Satu Savia esitteli projektiaan, jonka tarkoituksena on koota Tyyne Savian kuvat yhteen eri puolilta maata ja tarkastella niiden va- lokuvallista ilmaisua. Tyyne Savia oli muotokuvavalaise- misen pioneeri ja ensimmäisiä sähkövalon käyttäjiä.

Savian kohdalla kuvien paikasta riippumaton käyttö mahdollistaa uuden tutkimusaineiston kokoamisen.

Vaikka digitaalinen versio toistaa alkuperäisen kuvan olennaiset piirteet, esimerkiksi jälkikäsittelyn tarkas- teluun kelpaavat vain alkuperäiset kuvat ja negatiivit.

Voidaan ajatella, että materiaalisesta ja digitaalisesta ku- vasta tutkitaan eri asioita, eikä digitointi siksi poista tar- vetta säilyttää alkuperäisiä dokumentteja vaan ainoastaan avaa niihin toisen näkökulman.

Suomalaisia sanomalehtiä on ollut saatavana avoi- mesti verkossa jo jonkin aikaa Kansalliskirjaston tar- joamana5. Viime kevään Digital Humanities Hacka- thonissa syntynyt, opiskelijoista ja tutkijoista koostuva ryhmä selvitti, voiko algoritmin opettaa tunnistamaan sanomalehdissä ilmestynyttä kaunokirjallisuutta, joka on pääosin tähän asti jäänyt dokumentoimatta6. Voiko runoja erottaa muusta tekstistä kielen piirteiden avulla

koneellisesti? Mitä sanomalehtirunot käsittelevät? Ryhmä keräsi ensin lehdistä runoja käsin ja vertasi sen jälkeen tätä testidataa koko sanomalehtikorpukseen. Algoritmi näytti oppivan erottamaan runoja suhteellisen hyvin.

Tätä suurten tekstimassojen tutkimista koneellisesti kutsutaan digitaalisissa ihmistieteissä kaukolukemiseksi, distant reading. Kaukolukemisen ja perinteisen lähiluke- misen vuorottelu antaa löytyneille runoille kontekstin ja auttaa niiden tulkinnassa.

Suomi24-keskustelupalstan tekstejä analysoinut Turun yliopiston tutkimusryhmä esitteli aihemallin- nusmenetelmää eli topic modelingia ja niitä yhteyksiä, joissa sana ”sosiaalipummi” palstalla esiintyy7. Aihe- mallinnusta käytetään ryhmittelemään sanoja tietyssä tekstikokonaisuudessa ja nostamaan esiin yleisimpiä, tekstin sisällön kannalta keskeisiä ilmaisuja. Kielteisten tunneilmaisujen lisäksi ”sosiaalipummiin” liittyvistä aiheista erottui kuluttamiseen ja säästämiseen liittyviä teemoja. Samoja keskustelupalsta- ja muita sosiaalisen median aineistoja tutkiva Helsingin yliopiston Citizen Mindscapes -projekti on laatinut erillisen datajulkaisun näiden aineistojen käytön helpottamiseksi. Julkaisu kuvaa tarkemmin aineistojen syntytapaa ja tallennus- muotoja sekä auttaa tutkijoita arvioimaan mahdollisia uusia tutkimussuuntia.8

Digitaaliset ihmistieteet muuttavat humanistisen tutkimuksen suuntaa, mikäli tutkimuskäytännöt alkavat osalla tutkijoista muistuttaa enemmän muiden tieteen- alojen käytäntöjä. Jos humanistinen tutkimus on perin- teisesti ollut yksittäisten tutkijoiden pitkäjänteistä tulkin- tatyötä kirjallisuuden tai arkistoaineiston parissa ja sen tuloksena on vuosien päästä syntynyt monografia, joka esittää jostain ilmiöstä kokonaistulkinnan, ryhmässä tut- kiminen, aineistojen käsittely yhdessä ja artikkelijulkaisut ovat uusia työtapoja. Monitieteiset tutkimusryhmät, digitaaliset kvantitatiiviset aineistot eli data ja ohjelmis- tojen käyttäminen aineistojen analyysiin ovat arkipäivää luonnontieteissä ja mahdollistavat tulevaisuudessa uusia työtapoja kielentutkijoiden lisäksi myös historian ja tai- teentutkijoille. Toisaalta digitaalisten ihmistieteiden on pidettävä kiinni humanistiselle tutkimukselle keskeisistä huolellisesta kontekstualisoinnista ja muutokselle avoi- mista tulkinnoista pysyäkseen osana ihmistieteiden tra- ditiota.

Lyhyistä esityksistä koostuva pitkä päivä ilman kes- kustelulle varattua aikaa ei ole tyypillisin tapa esitellä humanistista tutkimusta. Esitysten muoto muistuttikin enemmän yritysmaailmasta tuttuja pitchejä eli esitte- lypuheita. Toisaalta tapahtuman verkkosivuja ja sinne vietyjä abstrakteja voi todella katsoa hakemistona siitä, minkälaisia aloitteita digitaalisten ihmistieteiden piirissä Suomessa on käynnissä, ja etsiä yhteistyökumppaneita9. Lisää kansainvälisiä esimerkkejä digitaalisista ihmistie- teistä saadaan maaliskuussa 2018, kun vuosittainen poh- joismainen konferenssi Digital Humanities in the Nordic Countries rantautuu Helsinkiin yli sadan osallistujan voimin.10

(3)

1/2018 niin & näin 97

Viitteet & Kirjallisuus

1 Eero Hyvönen, Digitaalisten ihmis- tieteiden keskus HELDIG käynnisti toimintansa (Digital Humanities Centre HELDIG Started Operations). Tieteessä tapahtuu 2/2017. Verkossa: journal.fi/tt/

article/view/62348

2 Tutkimusryhmän kotisivu: seco.cs.aalto.fi/

3 Verkossa: portti.avointiede.fi/tutkimus- menetelmat/sosiaalinen-koodailu-ja- avoimen-tieteen-vallankumous 4 Suomalaisten museoiden digitoituihin

valokuviin voi tutustua kulttuuriportaali Finna.fi:ssa.

5 Verkossa: digi.kansalliskirjasto.fi/

6 Tutkimusryhmän jäsenet: Mikko Koho, Agata Dominowska, Elsi Hyttinen, Péter Ivanics, Elizabeth Oakes, Ilona Pikka- nen, Leena Tulkki & Risto J. Turunen;

ks. myös helsinki.fi/en/helsinki-centre- for-digital-humanities/helsinki-digital- humanities-hackathon-2017-dhh17 7 Veronika Laippala, Lotta Lehti ym.

Myös Krista Lagus kirjoittaa oivaltavasti sosiaalipummi-käsitteestä ja siitä, miten sitä on käytetty 2010-luvulla tietynlai- sen moraalipaniikin lietsomiseen, ks.

Sosiaaliturvariippuvuus. Sosiaalipummit oleskeluyhteiskunnassa? Toim. Juho Saari.

Tampere University Press, Tampere 2017.

8 Krista Lagus, Mika Pantzar, Minna Ruckenstein & Marjoriikka Ylisiurua, Suomi24. Muodonantoa aineistolle.

Kuluttajantutkimuskeskus 2016:10.

Helsingin yliopisto, Helsinki 2016. Ver- kossa: blogs.helsinki.fi/citizenmindsca- pes/files/2016/05/257383_HY_VALT_

suomi24_muodonantoa_aineistolle.pdf 9 Ohjelma ja abstraktit osoitteessa: hel-

sinki.fi/en/helsinki-centre-for-digital- humanities/heldig-digital-humanities- summit-2017

10 Verkossa: helsinki.fi/en/helsinki-cen- tre-for-digital-humanities/dhn-2018

O

malla kohdallani digitaalisen huma- nismin aurinko nousi Helsinki Digital Humanities Hackathonissa toukokuussa 2015. Hackathonin perusidea on yk- sinkertainen: humanistit ja tietojen- käsittelytieteilijät hikoilevat viikon yhteisen ongelman äärellä. Humanistien vastuulla on merkityksellisten tut- kimuskysymysten keksiminen, kun taas ohjelmoijat ra- kentavat algoritmeja, joiden avulla kysymyksiin saadaan vastauksia. Ensimmäisessä hackathonissa ujutin historian väitöskirjani tutkimuskysymyksen oman ryhmäni mietit- täväksi: mikä erottaa 1900-luvun alun sosialismin poliit- tisen kielen aikakauden muista kilpailevista käsitejärjes- telmistä? Kansalliskirjasto antoi käyttöömme todellisen aarteen: kaikki suomalaiset sanomalehdet koneluettavassa muodossa vuosilta 1771–1910, miljardien sanojen ”kult- tuurisen arkin”.

Mutta kuinka operationalisoida sosialismin kieli?

Päädyimme lopulta melko primitiiviseen ratkaisuun eli laskimme, mitkä sanat toistuvat sosialistilehdissä useam- min kuin koko lehdistössä. Parin päivän puurtamisen jälkeen koodarimme ilmoitti ensimmäisistä tuloksista.

Hieman kohmeloisilla silmillä – sosiaaliset iltamenot

kuuluvat tapahtumaan – tutkin läppärin näytöllä vilis- täviä sanoja ja numeroita. Valistunut arvaaja olisi voinut ennustaa suuren osan sosialisteille tärkeistä sanoista (”ka- pitalismi”, ”porwaristo”, ”sorto”), mutta tuloksissa oli myös virkistäviä yllätyksiä (”piru, ”ryssä”, ”naiset”). Tie- tokone kykeni näyttämään sanomalehdistä jotakin, mitä ihmissilmän on lähes mahdotonta huomata.1

Suomalaisista historioitsijoista Tampereen yliopiston Viljo Rasila hyödynsi tietokonetta jo 1960-luvulla tut- kiessaan sisällissodan syntyä monimuuttujamenetelmien avulla2. Rasila suositteli tietokoneen käyttöä silloin, ”kun on kysymys niin laajasta tavalla tai toisella mitattavasta aineistosta, että sen täydellinen hallitseminen on ihmisen omalle muistikyvylle mahdotonta, taikka jos vertailut ovat niin monimutkaisia, että ihminen ei kykene niitä suorittamaan”3. Rasilan neuvossa on edelleen järkeä: las- kennallisten menetelmien mahdollinen hyöty riippuu tutkimusasetelmasta. Jos kartoittaa 1500-luvulla eläneen myllärin maailmankuvaa fragmentaaristen lähteiden avulla, tietokoneen kyvyistä ei liene suurta apua4. Esi- merkiksi digitaalisten lehtien sisältöä kvantifioimalla tutkimani ilmiö koostuu puolestaan sadoistatuhansista sosialisteista ja heidän miljoonista sanoistaan, joten sitä

Risto Turunen

Humanisti, kurkista

makroskooppiin

Viittaukset

LIITTYVÄT TIEDOSTOT

Helsingin yliopistossa käynnisti toimintansa syksyllä 2016 uusi digitaalisten ihmistieteiden (Digital Humanities, DH) keskus HELDIG – Helsinki Centre for Digital Humanities

Toinen tärkeä huomio symposiumista oli, että merkittävä osa siitä humanistis-yhteiskun- tatieteellisestä big data -tutkimuksesta, mitä Suomessa ja maailmalla tehdään,

Tulevaisuu- dessa esineiden internet yleistyy niin, että arki- setkin esineet ovat verkossa.. Jos kaikilla esineillä on internet-osoite ja sensoreita, ne voivat lähet-

Toisaalta Bode edustaa tutkijoita, jotka lähtevät morettilaisten menetelmien kritiikistä, mutta tarjoavat moni- puolisia tapoja kehittää datarikasteista kirjallisuushistoriaa

Tämä sanan kaksoismerkitys – että sana ”kirjallisuus” voi viitata kielenkäytössämme niin tiettyyn kulttuuristen tekstien ja käytäntöjen alueeseen kuin tätä

Kun resurssit alan opetus- ja tutkimustyöhön sekä kehitysprojek- teihin ovat riittävät, voidaan myös tulevaisuu- dessa soveltaa uusimpia menetelmiä Suomen talouden seurantaan

Neljännes yksityismetsätalouden organisaatio -ryhmään kuu- luvista oli sitä mieltä, että nykyinen tukijärjestel- mä turvaa parhaiten puuhuollon myös tulevaisuu-

Kiire ja jul- kaisupaineet ovat saaneet monet humanistit ja yhteiskuntatieteilijät muuttamaan tutkimus- ja julkaisukäytänteitään, mutta siihen kirjoittajat eivät