• Ei tuloksia

Datatiede verkko-opetuksessa

N/A
N/A
Info
Lataa
Protected

Academic year: 2022

Jaa "Datatiede verkko-opetuksessa"

Copied!
80
0
0

Kokoteksti

(1)

Datatiede verkko-opetuksessa

Waltteri Turunen

Pro gradu -tutkielma

Tietojenkäsittelytieteen laitos Tietojenkäsittelytiede

Heinäkuu 2016

(2)

i

ITÄ-SUOMEN YLIOPISTO, Luonnontieteiden ja metsätieteiden tiedekunta, Kuopio Tietojenkäsittelytieteen laitos

Tietojenkäsittelytiede

Turunen, Jon Lauri Waltteri: Datatiede verkko-opetuksessa Pro gradu -tutkielma, 78 s.

Pro gradu -tutkielman ohjaaja: FT Maija Marttila-Kontio Heinäkuu 2016

Tiivistelmä: Internetin ja tieto- ja viestintätekniikan myötä lisääntyneet verkko-oppi- misympäristöt asettava uusia mahdollisuuksia ja haasteita opetukselle. Samalla lisään- tyneet datamäärät ja niiden analysointimahdollisuudet ovat johtaneet datatieteen syn- tyyn. Verkko-opetus tuottaa dataa, jota voidaan käsitellä datatieteen keinoin. Tämä tutkielma on kirjallisuuskatsaus, jossa kerrotaan näiden kahden alan kosketuspinnasta.

Tutkielma käsittelee ensimmäisessä kappaleessa verkko-opetusta alkaen sen histori- asta 1960-luvulta tähän päivään saakka, jonka jälkeen esitellään verkko-opetuksen teo- riaa. Lopuksi käydään läpi verkko-opetuksen hyötyjä ja haittoja. Toisessa kappaleessa keskitytään datatieteeseen. Datatieteestä pyritään muodostamaan kokonaiskuva esitte- lemällä sen eri määrittelyt ja sijainti suhteessa muihin tutkimusaloihin. Kerrotaan myös datatieteen historiasta ja nykytilasta, etenkin sen yleistymisen syistä. Tämän jäl- keen esitellään joitain sen käyttökohteista ja käydään läpi datatieteen prosessi ja kehi- tyssuunnat. Viimeisessä kappaleessa kerrotaan, kuinka datatiedettä hyödynnetään verkko-opetuksessa. Ensin tutkitaan miksi datatiedettä pitäisi soveltaa verkko-opetuk- seen, sitten esitellään, miten sitä sovelletaan ja mihin sitä verkko-opetuksessa voidaan soveltaa. Lopuksi käsitellään muutama merkittävä tapaustutkimus, katsaus markki- noilla oleviin tuotteisiin ja tulevaisuuden odotuksiin.

Avainsanat: datatiede verkko-opetuksessa, datatiede, verkko-opetus, oppimisen ana- lytiikka, koulutustiedonlouhinta

ACM-luokat (ACM Computing Classification System, 1998 version): J.1, K.3.1

(3)

ii

UNIVERSITY OF EASTERN FINLAND, Faculty of Science and Forestry, Kuopio School of Computing

Computer Science

Turunen, Jon Lauri Waltteri: Data science in e-learning Master’s Thesis, 78 p.

Supervisor of the Master’s Thesis: PhD Maija Marttila-Kontio July 2016

Abstract: The internet along with information and communication technologies have given rise to e-learning environments which present new opportunities and challenges for education. At the same time increased amounts of data and the capabilities to ana- lyze it have led to the emergence of data science. E-learning generates data that can be processed with the methods of data science. This study is a literature review, the pur- pose of which is to explore the contact surface between the two sectors. The thesis starts with tracing the origins of e-learning from its history in 1960s to the present day and, after that, we go through the theory behind e-learning and end up with the de- scription its advantages and disadvantages. The second section will focus on data sci- ence and it starts by defining data science and its relation to other scientific disciplines.

It continues on to describe the history and current state of data science, particularly the reasons of recent emergence, and the section ends with the presentation of some of its uses and going through the process of data science and its future trends. The final section explains how data science can be used with e-learning. First we go through the motivation of applying data science to e-learning, then discuss how and where specif- ically to apply it. Finally, we go through a few important case studies, followed by an overview of the products on the market and we end with some future expectations.

Keywords: data science in e-learning, data science, e-learning, learning analytics, ed- ucational data mining

CR Categories (ACM Computing Classification System, 1998 version): J.1, K.3.1

(4)

iii

Esipuhe

Tämä tutkielma on tehty Itä-Suomen yliopiston Tietojenkäsittelytieteen laitokselle ke- väällä 2016. Tahdon kiittää ohjaajaani Maija Marttila-Kontiota hyvästä ohjauksesta ja kirjoittajan takakireän deadlinen sietämisestä.

Suurin kiitos tästä työstä kuuluu kuitenkin vaimolleni Tuijalle, joka pyöritti kotita- loutta vailla valituksen sanaa aviomiehen istuessa iltaan asti napit korvilla tietoko- neella näppäimistöä nakuttamassa oltuaan ensin pitkän päivän lorvailemassa toimis- tolla syöden työpaikkalounaita, kun perheelle oli tarjolla vain haaleaa makaronivelliä.

Pahoitteluni myös kahdelle tyttärelleni, joilla ei viikkokausiin ollut isää ennen iltaseit- semää. Viimeiseksi haluaisin kiittää Spotify-suoratoistopalvelua, joka tuotti mainion Electronic Study Music -soittolistan, jonka avulla olen saanut työrauhan niin yliopis- tolla ja anoppilassa kuin kotonakin ja auton kyydissä.

Vuorela, Heinäkuu 2016 Waltteri Turunen

(5)

iv

Lyhenneluettelo

AR Augmented Reality; lisätty todellisuus.

CD-ROM Compact Disc - Read-Only Memory. Tietokoneissa käytettävä tiedon talletuslevy, jota voi ainoastaan lukea.

EDM Educational Data Mining; koulutustiedonlouhinta ITS Intelligent Tutoring System; älykäs opetusjärjestelmä

Jisc Brittiläinen ei-kaupallinen yhdistys. Entinen Joint Information Systems Committee.

KPI Key Performance Indicator; keskeinen suorituskykymittari LA Learning Analytics; oppimisen analytiikka

LAK Learning Analytics and Knowledge. Ks. LA

LMS Learning Management System; oppimisen hallintajärjestelmä MOOC Massive Open Online Course; kaikille avoin verkkokurssi ROI Return On Investment; sijoitetun pääoman tuotto

SIS Student Information System; opiskelijatietojärjestelmä SNA Social Network Analysis; sosiaalisten verkkojen analysointi VR Virtual Reality; virtuaalitodellisuus.

(6)

v

Sisällysluettelo

1 Johdanto ... 1

2 Verkko-opetus ... 3

2.1 Verkko-opetuksen historiaa ja nykytilanne ... 3

2.2 Verkko-opetuksen teoriaa ... 7

2.2.1 Oppimiskäsitykset ... 7

2.2.2 Pedagogisia malleja ... 10

2.2.3 Verkko-oppimisympäristöjen eri tasot ... 13

2.2.4 Oppimisaihiot ... 13

2.3 Verkko-opetuksen hyötyjä ja haittoja ... 14

2.3.1 Hyötyjä ... 14

2.3.2 Haittoja ... 15

3 Datatiede ... 17

3.1 Määritelmät ... 17

3.1.1 Tiedon eri tasot ... 17

3.1.2 Big data ... 19

3.1.3 Datatiede ... 20

3.2 Datatieteen historia ja nykytila ... 23

3.2.1 Datatieteen juuret ... 23

3.2.2 Syyt yleistymiselle ... 24

3.3 Datatieteen käyttökohteet ... 25

3.4 Datatiede prosessina ... 28

3.4.1 Kysymyksen asettelu ... 29

3.4.2 Tiedon hankinta ... 30

3.4.3 Tiedon puhdistaminen ... 30

3.4.4 Kuvaileva analytiikka ... 31

3.4.5 Ennustava analytiikka ... 32

3.4.6 Tulosten havainnollistaminen ja johtopäätösten tekeminen33 3.5 Datatieteen kehityssuuntia ... 35

4 Datatiede verkko-opetuksessa ... 37

4.1 EDM ja LAK ... 37

4.2 Sovellusalat ... 39

4.2.1 Opiskelijan tietämyksen mallintaminen ... 39

4.2.2 Käyttäytymisen mallintaminen ... 40

4.2.3 Kokemuksen mallintaminen ... 41

4.2.4 Opiskelijan profilointi ... 41

4.2.5 Aihealueen mallintaminen ... 41

4.2.6 Oppimisaihioiden ja pedagogisen mallin analysointi ... 42

4.2.7 Trendianalyysi ... 42

4.2.8 Mukautuminen ja yksilöllistäminen... 42

4.3 Hyödyt ... 43

4.3.1 Opiskelun laatu ... 43

4.3.2 Opetuksen laatu ... 43

(7)

vi

4.3.3 Opiskelijapysyvyyden parantaminen ... 44

4.3.4 Kustannustehokkuus ... 45

4.4 Käytäntö ... 45

4.4.1 Menetelmät ... 45

4.4.2 Infrastruktuuri ... 49

4.4.3 Työkalut ... 50

4.4.4 Rajoitteet ... 51

4.5 Esimerkkejä datatieteen hyödyntämisestä verkko-opetuksessa ... 52

4.5.1 Purduen yliopisto ... 52

4.5.2 Nottingham Trentin yliopisto ... 54

4.5.3 PeT-työkalu ... 56

4.6 Datatiedettä hyödyntäviä verkko-opetuksen tuotteita ... 57

4.7 Datatieteen ja verkko-opetuksen yhteinen tulevaisuus ... 58

5 Pohdinta ... 60

Viitteet ... 63

(8)

1

1 Johdanto

Nykyään lähes jokainen koulutuslaitos hyödyntää opetuksessaan tietoverkkoja, eten- kin internetiä. Verkko-opetus on suosittua, koska se mahdollistaa helpon tiedonjaka- misen sekä aika- ja paikkariippumattoman opiskelun. Joustavalla opiskelulla helpote- taan opiskelua, koska opiskelijoiden ja opettajien ei tarvitse olla enää samassa paikassa vaan kukin voi osallistua opiskeluun, miten ja mistä haluavat. Vaikka jokainen voikin osallistua opetukseen eri paikasta, verkko-opetus kuitenkin parantaa yhteisöllistä op- pimista sosiaalisten työkalujen kautta. (Tervo, 2012) Verkko-opiskelu tapahtuu verkko-oppimisympäristöissä, joissa tapahtuvista toiminnoista voidaan tallentaa dataa myöhempää jatkokäsittelyä varten.

Datan määrä maailmassa kasvaa räjähdysmäisesti. 90% maailman datasta on syntynyt viimeisen kahden vuoden aikana ja datan määrän on ennustettu kaksinkertaistuvan vii- den vuoden sisällä. (B. Walker, 2015) Datan määrän kasvu ja sen analysointimahdol- lisuuksien parantuminen ovat nostaneet datatieteen muodikkaaksi ilmiöksi. Datatiede on uusi tieteenala, joka sijaitsee tilastotieteen, ohjelmoinnin ja alakohtaisen osaamisen kohtaamispisteessä. Sen avulla voidaan saavuttaa merkittäviä hyötyjä lähes alasta riip- pumatta. Sen avulla voi muun muassa tehostaa liiketoimintaa, parantaa julkista liiken- nettä, vähentää potilaskuolleisuutta sekä ennustaa epidemioiden puhkeamista.

Datatiedettä sovelletaan verkko-opetuksessa opiskelijan tietämyksen, käyttäytymisen ja opiskelukokemuksen mallintamiseen, opiskelijan profilointiin ja opetuksen aihealu- een mallintamiseen. Lisäksi sitä voidaan käyttää oppimisaihioiden ja pedagogisten mallien analysointiin, trendianalyysiin sekä mallianalyysiin. (Bienkowski, Feng, &

Means, 2012) Datatieteen avulla on mahdollista nostaa opiskelun ja opetuksen laatua, parantaa opiskelijapysyvyyttä sekä opetuksen kustannustehokkuutta. (Sclater, Peasgood, & Mullan, 2016)

Tutkielman luvussa 2 esitellään verkko-opetuksen historiaa ja nykytilannetta, sen teo- reettista taustaa sekä sen hyötyjä että haittoja. Luvussa 3 pyritään määrittelemään da-

(9)

2

tatiede terminä, datatieteen historiaa ja miksi se on yleistynyt juuri nyt. Luvussa käy- dään myös läpi datatieteen eri käyttökohteita ja tutustutaan tarkemmin sen prosessiin, kunnes lopulta esitetään datatieteen mahdollisia kehityssuuntia. Datatieteen sovellusta itse verkko-opetukseen tutkitaan luvussa 4. Siinä esitellään ensin kaksi merkittävintä tutkimusalaa aiheesta, jonka jälkeen esitellään saavutettavat hyödyt. Seuraavaksi ker- rotaan käytännön soveltamisesta sekä sovellusaloista eli mihin kaikkeen datatiedettä voi verkko-opetuksessa käyttää. Lopuksi esitellään muutama tapaustutkimus ja kau- pallinen tuote sekä luodaan katsaus tulevaan. Tutkielma päättyy aiheen pohdintaan ja ajatuksiin sen tulevaisuudesta.

(10)

3

2 Verkko-opetus

Tässä luvussa määritellään verkko-opetuksessa käytettävät termit. Luku 2.1 kertoo verkko-opetuksen historiasta ja nykytilanteesta ja luku 2.2 käsittelee verkko-opetuksen teoriaa. Luvussa 2.3 punnitaan verkko-opetuksen hyötyjä ja haittoja.

Verkko-opetuksella tarkoitetaan suunnitelmallista tietoverkkojen, erityisesti internetin hyödyntämistä opetuksessa ja opiskelussa (Nevgi et al., 2005; Tella et al., 2001). Opis- kelija on verkon kautta vuorovaikutuksessa toisten opiskelijoiden, opettajan, oppima- teriaalien tai muiden aineistojen ja palveluiden kanssa. Pedagogiikka tarkoittaa tapaa, jolla opetus järjestetään, sekä sen kasvatuksellisia periaatteita (Hellström, 2008), joten verkkopedagogiikan voidaan käsittää tarkoittavan tapaa, jolla verkko-opetus järjeste- tään sekä sen järjestämisen teoreettista sisältöä.

Tässä yhteydessä tietoverkolla tarkoitetaan tietokoneiden ja tietoliikennelaitteiden muodostamaa fyysistä kokonaisuutta, jonka avulla on mahdollista siirtää informaa- tiota. Verkkokäsitteeseen liittyy myös käsitys virtuaalisista toiminnoista, jolloin asioi- den tekeminen ei edellytä fyysistä läsnäoloa tai ympäristöä (Lepistö, 2008).

Oppimisympäristöksi kutsutaan paikkaa tai yhteisöä, jossa ihmisillä on käytössään eri- laisia resursseja, joiden avulla he voivat oppia ymmärtämään erilaisia asioita ja kehit- tämään mielekkäitä ratkaisuja erilaisiin ongelmiin (Manninen, 2001). Esimerkiksi luokkahuone on perinteinen fyysinen oppimisympäristö. Verkko-opetus tapahtuu verkko-oppimisympäristössä, joka usein sisältyy oppimisen hallintajärjestelmään (eng. Learning Management System, LMS), jonka avulla voi hallinnoida ja seurata opetusta sekä tuottaa siitä raportteja. (Ryann K. Ellis, 2010)

2.1 Verkko-opetuksen historiaa ja nykytilanne

Verkko-opetus sai alkunsa 1960-luvulla, kun PLATO (Programmed Logic for Auto- matic Teaching Operations) kehitettiin Illinoisin yliopistossa Yhdysvalloissa (Bitzer,

(11)

4

Lyman, & Easley, 1966). Se oli yksi ensimmäisistä tietokoneita hyödyntävistä oppi- misympäristöistä ja se oli käytössä lähinnä akateemisissa laitoksissa. PLATO mahdol- listi tuhansien opiskelijoiden samanaikaisen ja yksilöllisen opetuksen paikallisesti. Se käytti aluksi näyttönä televisiota ja erityistä näppäimistöä komentojen antamiseksi.

PLATO:ssa esiintyi monia nykyisten oppimisympäristöjen ominaisuuksia, kuten säh- köinen oppikirja, tiedonhakumahdollisuus, tukijärjestelmä avun saamiseksi sekä hen- kilökohtaiset muistiinpanot. Siihen sisältyi myös suoritusten ja toimintojen tallentumi- nen myöhempää tilastollista analyysiä varten.

1980-luvun alussa julkaistiin ensimmäiset oppimisympäristöt, joihin sai etäyhteyden modeemin avulla. Niitä hyödynnettiin mm. Ison-Britannian The Open University -yli- opistossa. Nämä ensimmäiset varsinaiset verkko-oppimisympäristöt pohjautuivat vi- deotex-tekniikkaan, joka mahdollisti yhteyden ottamisen keskustietokoneeseen puhe- linlinjoja pitkin käyttäen televisiota näyttönä – aivan kuten kaksisuuntainen teksti-tv.

Myöhemmin näihin ympäristöihin voitiin ottaa yhteyttä Internetin kautta omalta koti- koneelta.

Yrityksissä sähköiset oppimisympäristöt alkoivat yleistyä 1980-luvun puolessavälissä CD-ROM (Compact Disc - Read-Only Memory) -teknologian myötä. CD-levyt olivat paljon halvempia kuin kouluttajat ja kursseja oli helppo levittää, mutta CD-levyihin perustuvilla kursseilla oli kuitenkin huikea keskeyttämisaste eikä tietokoneen edessä istuminen ollut työntekijälle kiinnostavaa – kouluttaja ei ollut läsnä auttamassa tai mo- tivoimassa opiskelijaa. (Cross & Jay, 2004)

1990-luvun lopussa opetuksen sisältöä alettiin jakaa Internetin välityksellä ja opetus voitiin järjestää opetuspaikasta tai -ajasta riippumatta. Välitystapa mahdollisti myös räätälöidyt koulutusportaalit, suoritusten seurannan, uutiskirjeet ja keskusteluryhmät (Cross, 2004). Internetin toiminnallisuuden parantuminen mahdollisti myös multime- dian ja verkkokameran käytön opetuksessa. Teknologian kehittyessä kustannukset ale- nivat ja se mahdollisti opetuksen entistä laajemmalle yleisölle. Käyttäjät saattoivat suorittaa tutkintoja eri yliopistoista ja sivistää itseään kursseilla joustavasti ja riippu- mattomasti kotoaan käsin heille sopivaan kellonaikaan.

(12)

5

Yritysmaailmassa työntekijöiden kouluttamiseksi alettiin myös käyttää verkko-ope- tusmallia. Niin uudet kuin kokeneetkin työntekijät saattoivat nyt helposti kerrata jo opittuja asioita ja oppia uutta näin lisäten yrityksen henkistä pääomaa. Tämä olikin tärkeää etenkin IT-sektorin kasvaessa, sillä sen työkalut vanhenivat suhteellisen nope- asti, jolloin kouluttamisesta tuli entistä tärkeämpää.

Suomessa Internetiä alettiin hyödyntää koulutukseen 1990-luvun puolivälissä (Taipalmaa, 2008). Alta Vista Forum oli yksi ensimmäisistä Internetiä hyödyntävistä oppimisympäristöistä. Se oli eräänlainen yhdistelmä uutisryhmää ja sähköpostilistaa, jonka avulla voitiin luoda keskusteluketjuja ja -arkistoja. Se mahdollisti samanaikai- sen, ajasta riippumattoman viestinnän monelle opiskelijalle ja sitä käytettiin yleisen viestinnän lisäksi henkilökohtaiseen opastukseen.

2010-luvulla verkko-opetukseen tuotiin myös sosiaalinen elementti. Yhteisöt tarjoavat opiskelijalle tukea ja paikan, jossa vaihtaa ajatuksia opetuksesta. Yhteisöt voivat sijaita joko itse verkko-oppimisympäristössä tai kaikille avoimessa sosiaalisessa verkossa.

Opetuksessa voitiin myös hyödyntää mm. blogeja ja wikejä keskustelun ja vuorovai- kutteisuuden lisäämiseksi.

2010-luvulla myös MOOC- (eng. Massive Open Online Course) -kurssien tarjonta li- sääntyi vahvasti. Ne tarjoavat Internetin välityksellä kaikille avoimia yliopistotason kursseja. Näin opiskelija itse voi määritellä mitä haluaa opiskella ja kuinka paljon käyttää siihen aikaa. Yleensä MOOC-kurssit eivät aluksi olleet hyväksiluettavissa pe- rinteisten oppilaitosten opintokokonaisuuksiin, mutta sittemmin monet opetuksen jär- jestäjät ovat tuoneet tarjolle maksullisia suoritustodistuksia ja jopa kokonaisia tutkin- toja.

Eräitä tämän hetken tunnetuimpia MOOC-tarjoajia ovat Coursera, Udacity ja edX.

Coursera on niistä suurin tarjoten 1764 yliopistotason kurssia 147 yhteistyötä tekevien yliopistojen ja instituuttien tarjonnasta. Opiskelijoita sillä on ollut yli 17 miljoonaa.

Suurin osa Courseran kursseista on ilmaisia, mutta se tarjoaa myös maksullisia kurs- sikokonaisuuksia sertifikaatteineen, joista voi saada myös opintopisteitä akateemisiin oppilaitoksiin. Udacity keskittyy enemmän ammattitaidon lisäämiseen ilmaisilla ja

(13)

6

maksullisilla kursseilla. Sen erityinen innovaatio on kurssimaksun vaativat ”nanotut- kinnot”, joille he lupaavat työllistämistakuun – jos opiskelija ei saa työpaikkaa tietyn ajan kuluessa, hän saa kurssimaksut takaisin. Sen kurssitarjonta käsittää 134 kurssia 19 eri yhteistyökumppanilta, esimerkiksi Googlelta, Amazonilta ja Facebookilta. edX on voittoa tavoittelematon järjestö, joka tarjoaa yli 800 avointa yliopistotason kurssia yli 88 kumppanilta. Opiskelijoita on ollut yli 6 miljoonaa ja kurssi-ilmoittautumisia yli 19 miljoonaa.

Tällä hetkellä Suomessa MOOC -kursseja järjestävät Aalto-yliopisto ja Helsingin yli- opiston tietojenkäsittelytieteen laitos. Kursseja on yhteensä 12 kappaletta tietojenkä- sittelyn ja matematiikan alalta. Ne ovat ilmaisia kaikille ja ne voidaan myös hyväksi- lukea laitosten opinnoissa. Osa Helsingin yliopiston MOOC-kursseista toimii myös osittaisena pääsykokeena laitokselle. (Helsingin yliopisto, 2016)

Suomen Virtuaaliammattikorkeakoulu tarjoaa AMK-tason verkko-opetusta. Se on ol- lut toiminnassa vuodesta 2000 lähtien ja se tarjoaa vuosittain n. 800 ammattikorkea- koulujen järjestämää opintojaksoa, jotka tarjotaan enimmäkseen verkko-opintoina.

Opinnot ovat avoinna vain AMK-tutkintoa suorittaville tai vaihto-opiskelijoille.

Suosituimmat verkko-oppimisympäristöt tällä hetkellä ovat Blackboard, De- sire2Learn, Moodle, Sakai ja Pearson. Nykyiset verkko-oppimisympäristöt tarjoavat työkaluja, joilla opiskelijoiden hallinta, seuranta ja rekisteröinti on erotettu yksittäi- sistä kursseista. Opiskelijakohtainen suoritusten yleinen ja yksityiskohtainen rapor- tointi mahdollistaa arvioinnin opiskelun vaikutuksesta tulevaan suoritustasoon. Tätä suoritustietoa voi hyödyntää esimerkiksi ROI-laskennassa (Return Of Investment) yri- tysmaailmassa. Erilaisen suoritusdatan keräämistä ja sen raportointia pidetään kilpai- luvalttina verkko-oppimisympäristöjen välisessä kilpailussa. (Stone & Zheng, 2016) Tällä hetkellä 93% korkeakouluista käyttävät verkko-oppimisympäristöjä ja 65% pi- tävät verkko-opetusta kriittisenä pitkän aikavälin suunnitelmilleen. Työmarkkinoiden kasvavat koulutusvaatimukset vaativat tulevaisuuden verkko-oppimisympäristöiltä avoimuutta, oppijakeskeisyyttä ja joustavuutta. Tämän lisäksi niiden pitää perustua

(14)

7

yhteistyöhön, mahdollistaa suoritustason mittaukset ja raportointi sekä olla saatavilla päätelaitteesta riippumatta. (Stone & Zheng, 2016)

2.2 Verkko-opetuksen teoriaa

Tässä luvussa käsitellään verkko-opetuksen teoreettista puolta. Ensin esitellään oppi- miskäsitykset ja kuinka ne liittyvät verkko-opetukseen. Sen jälkeen esitellään muu- tama verkko-opetukseen liittyvä pedagoginen malli, jonka jälkeen esitellään verkko- oppimisympäristöjen eri tasot. Lopuksi esitellään oppimisaihio-käsite.

2.2.1 Oppimiskäsitykset

Opetus perustuu opettajan käsitykseen oppimisesta ja opetuksesta. Opettajan pedago- ginen ajattelu ja opetuksen suunnittelu ja toteutus perustuvat erilaisiin oppimiskäsityk- siin eli teoreettisiin malleihin siitä, miten ihminen oppii. Tässä luvussa esitellään be- havioristinen, kognitiivinen, konstruktivistinen sekä realistinen oppimiskäsitys.

Behavioristinen oppimiskäsitys

Kuten perinteinen luokkahuoneopetus, myös varhainen verkko-opetus perustui beha- vioristiseen oppimiskäsitykseen, joka painottaa passiivista lähestymistapaa oppimi- seen (Greitzer, 2002). Se pohjautuu behaviorismiin, josta esimerkkinä käy kuuluisa psykologi Pavlov ja hänen koiransa, jotka oppivat kuolaamaan kuullessaan kellon soi- van. Behavioristinen oppimiskäsitys korostaa opettajan, sisällön ja materiaalin roolia oppimisessa ja opiskelijaa pidetään opetuksen kohteena ja suorittajana (Ihanainen et al, 2004). Tässä mallissa opetustavoitteet ovat tarkkaan määritelty, opettaja suodattaa materiaalin valmiiksi ja opiskelija vastaanottaa tiedon passiivisesti. Keskeisiä periaat- teita ovat lisäksi ärsyke – reaktio -kytkentä, oikeiden suoritusten vahvistaminen, vir- heellisten vastausten nopea ohittaminen ja opetettavan aineksen jakaminen mitattaviin osioihin.

Nykykäsityksen mukaan behavioristinen oppimiskäsitys on vanhentunut ja sille löytyy parempiakin vaihtoehtoja (Lepistö, 2008). Verkko-opetuksessa se näyttäytyy liian

(15)

8

suunnittelupainotteisena lähestymistapana opetuksen suunnitteluun. Odottamattomille käänteille ei jätetä kehitystilaa eikä opiskelijakohtaista mukautumista tapahdu ja ope- tuksessa keskitytään suoritettaviin tehtäviin eikä itse tehtävien tarkoitukseen. (Emin- Martínez et al., 2014)

Kognitiivinen oppimiskäsitys

Behaviorismin lisäksi perinteisiin oppimisteorioihin luetaan kognitiivinen oppimiskä- sitys (Raitala & Ylilehto, 2012). Se perustuu oppijan omiin kognitiivisiin prosesseihin – oppija itse ohjaa omaa oppimistaan. Sen mukaan oppiminen ei ole pelkkää tiedon varastointia ja ulkoisiin ärsykkeisiin reagoimista vaan ennemminkin se on tiedon han- kintaa ja prosessointia. Eri asioita opitaan eri tavalla ja oppiminen on sosiaalista. Ope- tuksen tarkoituksena tukea aktiivista oppimista ja opettajan ja opiskelijan välistä kom- munikaatiota, lisätä opiskelijoiden välistä yhteistyötä ja antaa täsmällistä ja kannusta- vaa palautetta. Opetuksessa otetaan myös huomioon erilaiset lahjakkuudet ja oppimi- sen tavat sekä asetetaan tavoitteet korkealle (Lepistö, 2008). Verrattuna behavioris- miin, oppijan rooli aktivoituu ja hän ottaa vastaan tietoa, tekee havaintoja, taltioi tietoa valikoivasti ja tekee tulkintoja (Pylkkä, 2010). Opettajan roolina on vuorovaikutusten ja kognitiivisten mallien kehittymisen ohjaaminen (Manninen, 2001).

Verkko-opetus mahdollistaa kustannustehokkaan tavan hyödyntää kognitiivisen oppi- miskäsityksen periaatteita mm. vuorovaikutteisten, opiskelijakeskeisten oppimateriaa- lien avulla. Oppimateriaaleihin voidaan lisätä esim. simulaatioita oikeista tilanteista, joita voi kokeilla ratkaista ja kerrata yhä uudestaan. (Greitzer, 2002)

Konstruktivistinen oppimiskäsitys

Konstruktivismi on muunnelma kognitivismista ja perustuu humanistiseen ihmiskäsi- tykseen, tiedon suhteellisuuden käsitykseen ja näkemykseen oppijasta aktiivisena tie- donrakentajana (Auvinen et al, 2007). Viimeisen kahden vuosikymmenen aikana huo- mio on opetuksessa siirtynyt juuri konstruktivismiin, koska tukee aktiivista oppimista tiedon rakentamisen avulla. (Koohang, Riley, Smith, & Schreurs, 2009)

(16)

9

Humanistisen ihmiskäsityksen mukaan ihmisen kyky ohjata omaa oppimistaan, käsi- tys omasta itsestään ja itsereflektiiviset valmiudet, kuten itseen suuntautuva mietiskely ja harkinta, ovat opittavia ominaisuuksia. Subjektiivisista kokemuksista syntyy objek- tiivista tietoa sosiaalisen vuorovaikutuksen ja oppijoiden keskinäisen yhteistoiminnan kautta (Pylkkä, 2010). Tieto on suhteellista, koska absoluuttista tai kiistatonta totuutta ei ole, joten jokainen todellisuuskuva on arvokas ja luotettava - sama asia voidaan tulkita tai käsittää monella eri tavalla. Näin ollen sitä ei voi behavioristisesti siirtää oppijalle. Konstruktivismin perusprosessi onkin oppijan tiedon konstruoiminen eli tie- don rakentaminen vanhan tietopohjan päälle. Tieto jäsennetään omien kokemuksien kautta ja ymmärtäminen liittyy aina johonkin tilanteeseen. Toimintaa ohjaa tavoite, joka taas määritellään oppimisen kriteereissä, mutta itse oppiminen on oppijan oman toiminnan tulosta (Lepistö, 2008; Manninen, 2001).

Konstruktivistinen oppimiskäsitys sopii erityisen hyvin verkko-opetukseen, sillä se varmistaa opiskelijoiden oppimisen (Koohang et al., 2009). Verkko-opetuksen keskus- telufoorumit ja muu yhteisöllinen oppiminen edustavat myös konstruktivistista oppi- miskäsitystä, jossa tietoa ei siirretä ihmiseltä toiselle vaan opiskelija on aktiivinen osa- puoli oppimisessa. (Harris & Sandor, 2007)

Realistinen oppimiskäsitys

Realistisessa oppimiskäsityksessä ei ole yhtä ainoata opetustapaa vaan sen mukaan erilaiset näkemykset tulisi nähdä toisiaan täydentävinä näkökulmina. Näin ollen esi- merkiksi behavioristista oppimiskäsitystä ei voida suoraan hylätä, vaan sitä voidaan hyödyntää esimerkiksi oppimisvaikeuksista kärsivien opiskelijoiden kohdalla. Toisin kuin konstruktivismissa, realismin mukaan kaikki tieto ei ole suhteellista, vaan on ole- massa pysyviä totuuksia ja opetuksen tarkoituksena on auttaa opiskelijoita muodosta- maan käsityksiä, taitoja, tottumuksia ja asenteita, jotka vastaavat tätä todellisuutta ja sen asettamia vaatimuksia. Tietoa rakennetaan aktiivisesti ja vanhaan pohjaten, mutta samalla edellytetään näiden rakenteiden pätevyyden arviointia. Realismi myös sallii oppijan epätäydellisyyden ja tunnustaa hänen tarpeensa toisten tukeen ja ohjaukseen.

(Auvinen et al., 2007)

(17)

10

Kirjallisuudesta ei löytynyt esimerkkejä tämän oppimiskäsityksen soveltamisesta verkko-opetukseen.

2.2.2 Pedagogisia malleja

Erilaisia pedagogisia oppimiskäsityksiä voidaan toteuttaa pedagogisilla malleilla. Ne jäsentävät oppimisprosessin etenemistä ja kuvaavat miten oppiminen pedagogisten pe- riaatteiden mukaan käytännössä tapahtuu. Ne eroavat lähinnä painotuseroissa ja käy- tännöissä. Niitä voidaan myös yhdistellä ja soveltaa tilanteiden mukaan. Tämän hetken verkko-opetuksessa yleisimmät pedagogiset mallit ovat tutkiva, keksivä ja ongelma- keskeinen oppiminen.

Tutkiva oppiminen

Tutkivan oppimisen tarkoitus on saada opiskelijat osallistumaan yhteisölliseen tiedon- luomisen prosessiin, jossa kysymykset käsiteltävästä asiasta perustuvat opiskelijoiden omiin ennakkokäsityksiin ja aiempiin tietoihin. Prosessi syvenee asteittain, kun kysy- myksiä ja selityksiä tarkennetaan tietolähteiden avulla. Yhteisöllisyys on olennaista – opiskelijat jakavat tietoa keskenään ja opettelevat jatko-kehittämään selityksiä jaetusta tiedosta sekä tukemaan toistensa ajattelua.

Tutkivan oppimisen prosessi alkaa kontekstin luomisesta, jonka tarkoitus on moti- voida opiskelijoita ja luoda perusta oppimiselle, jonka jälkeen opiskelijat itse asettavat tutkimuskysymykset. Opettaja ohjaa keskustelua mielekkääseen suuntaan, mutta opis- kelijat itse asettavat ne kysymykset, joita he haluavat tutkia. Sen jälkeen opiskelijoiden tulee paljastaa omat ennakkokäsityksensä ja aikaisemmat tietonsa valituista kysymyk- sistä muodostamalla niistä työskentelyteorioita eli hypoteeseja. Tämä rohkaisee heitä aktiivisesti ajattelemaan ongelmaa eikä vain passiivisesti ottamaan vastaan informaa- tiota. Verkko-oppimisympäristön yhteiset työskentelyfoorumit antavat hyvän ympä- ristön työskentelyteorioiden julkaisemiseen sekä erilaisten selitysten ja tulkintojen vertailemiseen.

Luotuja teorioita kehitetään nostamalla niistä esiin epäselvyyksiä tai puutteellisuuksia.

Työskentelyfoorumit ovat tässäkin erittäin hyviä työkaluja, koska ne mahdollistavat

(18)

11

kaikille avoimen teorioiden argumentoinnin ja kommenttien tallentamisen. Sitten opis- kelijat hankkivat lisää syventävää tietoa eri tietolähteistä, tarkentavat sen avulla tutki- muskysymyksiä ja niiden pohjalta teorioita. Tämä prosessi jatkuu asteittain kohti pro- sessin tulosten yhteenvetoa ja selitysten julkaisemista.

Verkko-oppimisympäristö tukee hyvin tutkivaa oppimista tarjoamalla eräänlaisen

”kollektiivisen työpöydän” opiskelijoiden tuottamalle tiedolle, sen jakamiselle ja ke- hittelylle. Verkon avustuksella myös asiantuntijoiden on helppo osallistua oppimisen prosessiin. Verkkofoorumeiden ja tiedostonjaon lisäksi yhteisöllistä tiedonluonnin prosessia helpottaa tehokas tiedostojen versionhallinta, dokumenttien yhteismuokkaus ja tietokohteiden uudelleenjärjestely. (Lakkala, 2002; Raitala & Ylilehto, 2012;

Veermans, 2004)

Keksivä oppiminen

Keksivän oppimisen seurauksena on tarkoitus, että oppija kokee keksineensä jotain uutta, henkilökohtaisesti mielekästä ja kiinnostavaa. Se erottuu omaksi malliksi juuri tämän henkilökohtaisen oppimisprosessin painottamisen ansiosta. Sitä yleensä käyte- tään jonkin tietyn periaatteen tai ilmiön oppimiseen ja keksivän oppimisen taitojen käyttämiseen uudelleen uusissa yhteyksissä ja tilanteissa.

Konstruktivistisen oppimiskäsityksen yleistyminen on tehnyt tätä mallia suosituksi, mutta siihen on vaikuttanut myös laajentunut ja monipuolistunut tietotekniikan käyttö.

Keksivää oppimista käytetään etenkin luonnontieteissä, joissa käytetään simulaatioita mallintamaan monimutkaisia luonnonlakeja ja -ilmiöitä.

Keksivän oppimisen prosessi koostuu viidestä vaiheesta tai aliprosessista: ongelman määrittäminen, hypoteesin kehittäminen, kokeen suunnitteleminen ja hypoteesin tes- taaminen, yhteenveto ja regulaatio. Nämä vaiheet tulisi tehdä opiskelijalle näkyväksi, jotta he pystyvät monitoroimaan omaa oppimistaan. Se voidaan tehdä graafisen työ- kalun avulla, joka tallentaa eri prosessit, niiden väliset suhteet ja suhteiden muutokset.

Keksivää oppimista voidaan tukea käyttämällä erilaisia simulaatioita, kuten esimer- kiksi SimQuest. Sen avulla voidaan rakentaa simulaatioiden ympärille rakentuvia

(19)

12

verkko-oppimisympäristöjä, jotka tarjoavat opiskelijalle yksilöllistä palautetta sekä oppimista tukevia toimintoja, kuten esim. tehtäviä, selityksiä ja monitorointityökaluja.

(Veermans, 2004)

Ongelmakeskeinen oppiminen

Ongelmakeskeinen oppiminen on käytännönläheistä ja se on kehitetty työelämän nä- kökulmasta. Siinä lähdetään liikkeelle huolellisesti suunnitelluista ongelmista, jotka ovat samankaltaisia kuin opiskeltavan aihepiirin todelliset ongelmat. Ne pohjautuvat usein ”tapauksiin” (eng. case) ja niissä kuvataan ilmiöitä tai tapahtumia, joille tarvitaan selitys. Erotuksena muiden opetusmenetelmien ongelmanratkaisuun, tapausten ongel- mat eivät ole valmiiksi strukturoituja eikä niille välttämättä ole ratkaisua tai niille voi olla monta ratkaisua.

Ongelmakeskeisen oppimisen mallissa oppiminen perustuu ryhmätyöskentelyyn on- gelman ymmärtämiseksi tai ratkaisemiseksi. Opiskelijat perehtyvät kukin joihinkin ongelman erityispiirteisiin ja oleellista on, että ryhmässä keskustellaan yhteisesti sekä opiskellaan yhteisesti ja yksilöllisesti ratkaisua ongelmaan. Tämä työtapa tuottaa on- gelmanratkaisun edellyttämää jaettua asiantuntijuutta. Opiskelijoilla on apunaan tutor, joka vie prosessia eteenpäin, korjaa syntyneitä vääriä käsityksiä tai ratkaisuja sekä tu- kee opiskelua mm. asiantuntijuudella, kontakteilla ja autenttisilla materiaaleilla.

Ongelmakeskeinen oppimisprosessi alkaa ongelmatilanteen kuvauksella, joka on usein moniulotteinen. Sitä seuraava prosessi kulkee seitsemän eri vaiheen kautta: kä- sitteiden ja termien selvittäminen, ongelman määrittely, aivoriihi, ongelman analy- sointi ja hypoteesin kehittäminen, oppimistavoitteiden määrittely (eli mistä tarvitaan tietoa), tiedon hankinta sekä ryhmäkeskustelu.

Verkko-opetuksessa ongelmanratkaisuprosessia voi mallintaa ja ohjata tuottamalla verkkoon pohja, joka kuvaa ongelmaratkaisun eri vaiheita ja johon opiskelijat voivat tuottaa eri vaiheiden aikana syntyvää tietoa, ajatuksia, kuvia yms. Tällainen pohja tu- kee työskentelyprosessia ja auttaa jäsentämään ratkaisun vaiheita. Voidaan käyttää myös virtuaalisia esimerkkejä, kuten esim. lääketieteen opetuksessa virtuaalipotilasta,

(20)

13

joka saattaa itsessään olla ratkaisua vaativa ongelma. Se voi olla toteutettuna videona ja potilaan lisätiedot voidaan antaa esim. todenmukaisina laboratoriotuloksina. Myös koko ongelmanratkaisuprosessi voidaan toteuttaa verkkokurssina, jolloin opiskelija- ryhmä toteuttaa koko prosessin verkossa erilaisten virtuaalisten työkalujen avulla.

(Veermans, 2004)

2.2.3 Verkko-oppimisympäristöjen eri tasot

Verkko-oppimisympäristöt voidaan jäsentää eri tasoihin verkko-opetuksen yhteisölli- syyden perusteella (Raitala & Ylilehto, 2012). Ensimmäisellä tasolla verkkoympäristö toimii vain materiaalipankkina, jonka avulla välitetään informaatiota. Toisella tasolla verkkoa hyödynnetään myös opettajan ja opiskelijan väliseen viestintään, kuten esi- merkiksi tehtävien palautukseen ja oppimisen palautteeseen. Kolmannella tasolla opis- kelijat ovat vuorovaikutuksessa myös keskenään. Yhteisöllisissä työskentelytilan- teissa jaetaan ideoita sekä tuotoksia ja kommentoidaan niitä. Neljännellä tasolla opis- kelijoiden vuorovaikutus painottuu oppisisällön sijaan suoraan keskinäiseen kommu- nikointiin. Opiskelijat vaihtavat ajatuksia ja ideoita sovitusta aihepiiristä ja voivat esi- merkiksi tuottaa yhdessä kehitellyn ratkaisun johonkin avoimeen ongelmaan. Kor- keimmalla viidennellä tasolla ratkaisuja ja tuotoksia kehitetään pitkäjänteisesti yh- dessä, jolloin tiettyjen oppisisältöjen hallinta tulee ikään kuin toiminnan sivutuotteena.

2.2.4 Oppimisaihiot

Verkko-opetus on mahdollista käyttää itsenäisiä digitaalisen oppimisen resursseja eli oppimisaihioita. (Ilomäki, 2008; Opetushallitus, 2011) Oppimisaihio on pienimuotoi- nen, tiettyihin oppimistilanteisiin soveltuva, opiskelijaa aktivoiva oppimateriaalikoko- naisuus. Ne on tarkoitettu helposti jaettaviksi, löydettäviksi ja uudelleenkäytettäviksi ja niiden avulla on pyritty kustannustehokkuuteen oppimateriaaleissa. Esimerkkejä niistä ovat muun muassa animaatiot, simulaatiot tai pienimuotoiset oppimispelit. Opis- kelija hyötyy oppimisaihioista opiskelun joustavuuden kautta, koska niillä voidaan li- sätä opiskelun aika- ja paikkariippumattomuutta. Oppimisaihiot myös tukevat yksilöl- lisiä opiskelutarpeita sekä yhteisöllistä työskentelyä.

(21)

14

2.3 Verkko-opetuksen hyötyjä ja haittoja

Tässä luvussa käsitellään verkko-opetuksen erilaisia hyötyjä ja haittoja perinteiseen luokkaopetukseen verrattuna. Hyödyt kerrotaan ensin ja niitä tasapainotetaan sen jäl- keen haittapuolien esittelemisellä.

2.3.1 Hyötyjä

Verkko-opetus on perinteistä opetusta joustavampaa, niin ajallisesti kuin maantieteel- lisestikin. Kun opiskelija suorittaa kurssia itsenäisesti, hän voi suorittaa opintoja silloin kun hänelle itselleen parhaiten sopii, kunhan noudatetaan kurssille asettuja aikataulu- rajoitteita. Tämä joustavuus on myös kustannustehokasta, kun opiskelijoiden ja opet- tajien ei tarvitse matkustaa eikä opetus vaadi fyysisiä opiskelutiloja. Myös henkilö- kuntaa vaaditaan opiskelijaa kohden vähemmän kuin perinteisessä opetuksessa.

Verkko-opetuksessa myös asiantuntijoiden hyödyntäminen on helpompaa. Tämä joh- tuu siitä, että verkkoluennot voi tallentaa ja niihin voi myöhemmin palata itsenäisesti.

Vierailevia asiantuntijoita voidaan myös integroida opetukseen interaktiivisten simu- laatioiden tai vuorovaikutusympäristöjen avulla.

Tiedon jakaminen on verkko-opetuksessa helppoa, koska verkossa tieto voidaan koota yhteen paikkaan, johon kaikilla opiskelijoilla on pääsy. Tämä jättää lisää aikaa opis- kelulle, sillä verkossa kurssimateriaali on aina saatavilla toisin kuin lähiopetuksessa, jolloin opiskelijan täytyy olla läsnä materiaalia jaettaessa. Myös opiskelijoiden tuot- tama tieto on luonnollisempaa jakaa verkon välityksellä kuin esimerkiksi kopioida ja jakaa muistiinpanoja koko kurssiryhmälle.

Verkko-opetuksessa voidaan hyödyntää verkon aika- ja paikkariippumattomuutta myös opiskelijoiden ja opettajien vuorovaikutuksessa. Verkko toimii sosiaalisena toi- mintaympäristönä, jossa opiskelijat keskustelevat, tuottavat ja vertailevat materiaalia sekä ottavat kantaa muiden tekemään materiaaliin. Verkossa opiskelijalle jää myös enemmän aikaa ajatella, kun vastausta ei tarvitse tuottaa heti kysyttäessä. Verkkoym- päristössä keskustelu ohjautuu enemmän käsiteltävään asiaan kuin ryhmäsuhteisiin ja

(22)

15

vuorovaikutuksen rakenne muuttuu opettaja-opiskelija-suhteesta enemmän opiskeli- joiden väliseen ja opettajan väliseen vuorovaikutukseen. Keskustelut tallentuvat verk- koon, jossa niihin voi myöhemmin palata ja ottaa osaksi oppimateriaalia.

Yhteisön sosiaalisen tuen merkitys korostuu verkko-opiskelussa, sillä verkko-opetuk- seen osallistuvilla opiskelijoilla herää tarve yhteistyöhön ja sosiaaliseen vuorovaiku- tukseen. Yhteisöllisyys ja yhdessä tekeminen aktivoi ja motivoi opiskelijoita. Ver- kossa yhteisön tasa-arvo korostuu, sillä verkkokeskusteluissa kaikkien ääni on saman arvoinen ja esimerkiksi luokkahuoneen hiljaisimmat voivat osallistua tasa-arvoisesti keskusteluun. (Tervo, 2012)

Datatieteen avulla verkko-oppimisympäristö soveltuu reflektiiviseen oppimiseen, jossa opiskelija voi itse nähdä suoritushistoriansa ja oppimisensa edistymisen. Tämä on yksi tärkeimpiä asioita tämän tutkielman kannalta. Lähtötasotestit ja oppimisen seu- ranta antavat suoraa palautetta opiskelija ja opettajalle. Myös verkko-oppimisympäris- töjen raportointimahdollisuudet tuottavat arvokasta tietoa ja mittareita opiskelijan mo- tivaatiosta, opettajan suorituksessa ja verkko-opetuksen toiminnasta. Raporteilla on myös todettu positiivinen vaikutus kurssin lopputulokseen. (Arkorful & Abaidoo, 2015; Tervo, 2012)

2.3.2 Haittoja

Verkko-opetukseen liittyy myös haittoja verrattuna perinteiseen opetukseen. Verkko- opetus asettaa uudenlaisia vaatimuksia, jotka täytyy ottaa huomioon oppimateriaalin suunnittelussa, etenkin muokattaessa olemassa olevaa materiaalia verkkoon sopivaksi.

Verkossa materiaalia luetaan silmäillen, joten tekstisisältö täytyy jäsentää eri tavalla verrattuna perinteiseen oppimateriaaliin. Verkko mahdollistaa myös eri medioiden käytön oppimateriaalissa, mutta niiden käyttö täytyy suunnitella hyvin, jotta koko- naisuus pysyy johdonmukaisena. (Pirilä, 2013)

Verkko-opetuksessa on kiinnitettävä erityistä huomiota sosiaaliseen vuorovaikutuk- seen, koska sen tuottama dialogi on paras tapa kehittää argumentointitaitoja ja kriittistä ajattelua. Sosiaalinen vuorovaikutus syntyy luonnostaan lähiopetustilanteissa, mutta verkkoympäristöissä se usein unohtuu ja vuorovaikutus keskittyy enemmän muihin

(23)

16

asioihin, kuten kognitiivisiin prosesseihin ja yhteiseen tiedonrakentamiseen. (Nevgi et al., 2005)

Koska verkko-oppiminen vaatii itsenäistä työtä eikä aina edellytä sosiaalista vuorovai- kutusta, se vaatii opiskelijalta hyvää motivaatiota ja ajanhallintakykyä. (Arkorful &

Abaidoo, 2015) Kommunikaatio saattaa olla joillekin hankalampaa verkossa, jolloin opiskelijan taitotaso ei välity muille. Verkko-oppimisympäristöissä myös erilainen huono toiminta, kuten huijaaminen, on mahdollista ja siitä kiinnijäämisen riski pie- nempi.

Alati läsnä oleva teknologia on myös johtanut huomion jatkuvaan hajaantumiseen ja keskittymiskyvyn heikentymiseen (Small & Vorgan, 2008). Jatkuva huomion jakau- tuminen voi johtaa aivojen stressitilan kohoamiseen, joka pitkään jatkuessa heikentää kognitiivisia prosesseja ja aiheuttaa masennusta.

(24)

17

3 Datatiede

Tässä luvussa keskitytään datatieteeseen. Luvussa 3.1 määritellään datatiede ja siihen liittyvät termit, jonka jälkeen luvussa 3.2 keskitytään datatieteen syntyhistoriaan ja syihin miksi se on noussut merkittäväksi juuri nyt. Luvussa 3.3 esitellään datatieteen nykyisiä käyttökohteita ja luvussa 3.4 tutustutaan tarkemmin datatieteen prosessiin.

Viimeisessä luvussa 3.5 tarkastellaan datatieteen kehityssuuntia.

3.1 Määritelmät

Tässä luvussa pyritään saamaan selville datatieteen konteksti ja mitä datatiede tarkoit- taa. Ensin käydään läpi mitä tiedolla, ja sen eri tasoilla, tarkoitetaan, jonka jälkeen määritellään Big Data -termi. Lopuksi yritetään saada datatieteelle selkeä määrittely.

3.1.1 Tiedon eri tasot

Tieto on hyvin laaja-alainen käsite. Se koostuu eri tasoista, joita ovat data, informaa- tio, tietämys ja ymmärrys, jotka ovat kuvattu kuvassa 1. Tieto kumuloituu ja jalostuu liikuttaessa datasta informaation kautta tietämykseen ja edelleen ymmärrykseen.

(Ilvonen, Jussila, & Kukko, 2013; Jokela, 2011)

(25)

18

Kuva 1: Tiedon eri tasot ovat data, informaatio, tietämys sekä ymmärrys. (Jokela, 2011)

Data tarkoittaa jonkin ”asian säännönmukaista esitystä käsittelykelpoisessa muo- dossa” (Kotimaisten kielten keskus, 2016). Se on rakenteetonta, objektiivista tietoa, jota kerättäessä tallennetaan säilytystä varten tietokantoihin tai hieman organisoidum- min tietovarastoihin (Ilvonen et al., 2013). Data-sana on lähtöisin latinan kielen sanasta datum, ’annettu’. Data-sanaa on käytetty nykyisessä kontekstissaan 1940-luvulta läh- tien, kun tietokoneilla on alettu käsitellä tietoa. (Stanton, 2013)

Datalla ei sinänsä ole merkitystä, vaan se tarvitsee aina tulkintaa. Eri järjestelmät ja sovellukset luovat datasta informaatiota (eng. information) luomalla sille rakenteen, sisällön ja merkityksen, joka mahdollistaa sen analysoinnin. (Ilvonen et al., 2013;

Jokela, 2011)

Data ja informaatio ovat objektiivista, helposti välitettävissä olevaa tietoa. Tietämys (eng. knowledge) taas on inhimillistä tietoa, joka syntyy tulkittaessa oppimisen ja omaksumisen avulla merkitykselliseksi koettua informaatiota. (Ilvonen et al., 2013)

(26)

19

Ymmärrys (eng. wisdom) on tiedon ylin muoto ja se saavutetaan, kun tietämyksen käsittelyä jatketaan aiempien kokemusten, arvojen ja tavoitteiden pohjalta. Ymmär- ryksellä tarkoitetaan kykyä soveltaa tietämystä sekä saatavilla olevaa informaatiota ongelmanratkaisussa tai tehtävän suorittamisessa. Ymmärrystä syntyy, kun vertail- laan, tehdään johtopäätöksiä ja keskustellaan. (Ilvonen et al., 2013)

3.1.2 Big data

Big Data on sana, jolla ei myöskään ole tarkkaa määritelmää. Yleisesti voidaan sanoa, että Big Data on suhteellinen, ei absoluuttinen, termi. Sillä tarkoitetaan suurta määrää dataa, mutta suurta ei tässä yhteydessä määritellä. Sille ei anneta lukua, esim. 1 peta- tavu < Big Data. Data on suurta silloin, kun sen käsittelystä tulee haasteellista. (Schutt

& O’Neil, 2013)

Big Dataa voidaan luonnehtia nk. neljällä V:llä: Volume (määrä), Velocity (nopeus), Variety (muoto) ja Veracity (todenmukaisuus), jotka löytyvät kuvan 2 kohdasta ”Big Data”.1 Big Datan määrä on nimensä mukaisesti suurta. Dataa syntyy joka päivä 2,5 exabittiä eli 2500 petabittiä ja 90% maailman datasta on syntynyt viimeisen kahden vuoden aikana. Dataa syntyy yhä nopeammin, sillä vuonna 2013 dataa syntyi 28,9 te- ratavua sekunnissa ja vuonna 2018 sitä on ennustettu syntyvän jo 50 teratavua sekun- nissa eli tuotetun datan määrä lähes kaksinkertaistuu viidessä vuodessa. 90% Big Da- tasta on jäsentämätöntä dataa, kuten esim. valokuvia, videoita tai keskustelupalstan kommentteja. (B. Walker, 2015) Jäsentämätön data on nimensä mukaisesti merkittä- viltä osin epävarmaa ja epätarkkaa. Kerättävän datan nopeus osaltaan kasvattaa tätä ongelmaa, sillä aikaa ei enää riitä datan jäsentämiseen esikäsittelyssä. (M. Walker, 2012a)

1 Eri lähteet määrittelevät eri lukumäärän V-alkuisia termejä ja ne voivat olla toisistaan hieman poik- keavia. Määrät vaihtelevat lähteestä riippuen kolmen ja kymmenen välillä. Luetellut neljä termiä ovat kuitenkin yleisimmät.

(27)

20

Kuva 2: Big Datan "viisi V:tä": Volume, Velocity, Variety, Veracity, Visibility sekä Value.

(Quitzau, 2014)

IBM on lisännyt edellä lueteltuihin Big Datan ominaisuuksiin kaksi V-alkuista termiä lisää: Visibility (näkyvyys) ja Value (arvo), jotka löytyvät kuvan 2 kohdasta ”Open Data”. Näkyvä data on avointa kaikille, joka aiheuttaa huolta yksityisyyden, turvalli- suuden ja alkuperän kannalta. Datan arvo riippuu sen analysoinnista eli sama data eri tavalla käytettynä voi olla arvokkaampaa kuin toisella tavalla käytettynä. (Marr, 2014;

Quitzau, 2014) 3.1.3 Datatiede

Datatiede on uusi termi, jolla ei vielä ole vakiintunutta määritelmää. Sillä kuvataan jo yleisesti työpaikkoja tai tutkintoja, jotka sisältävät datan keräämistä, tulkitsemista ja havainnollistamista. (Harvard, 2016; Schutt & O’Neil, 2013)

Datatieteen yhteydessä on käytetty myös termiä datan louhinta (eng. Data Mining) sekä tietämyksen louhinta (eng. Knowledge Discovery) ja joskus myös tietämyksen

(28)

21

louhinta tietokannoista (eng. Knowledge Discovery in Databases, KDD). Tietämyk- sen louhinta on prosessi, jonka avulla etsitään käyttökelpoista tietoa datasta. Datan louhinta on sen prosessin osa, jossa datasta louhitaan hahmoja soveltamalla siihen tiet- tyjä algoritmeja. (Fayyad, Piatetsky-Shapiro, & Smyth, 1996) KDD-prosessi on hyvin samankaltainen datatieteen prosessin kanssa (Schutt & O’Neil, 2013) ja datatieteilijä Gregory Piatetsky-Shapiro onkin sitä mieltä, että se on vain yksi uusi termi kuvaamaan samaa kuin KDD eli datan analysointia. (Piatetsky-Shapiro, 2012)

Informaatiojärjestelmien professori Vasant Dharin mukaan datatiede on poikkitieteel- linen ala koskien järjestelmiä ja prosesseja, joiden avulla louhitaan datasta tietämystä tai oivalluksia joko rakenteellisessa tai ei-rakenteellisessa muodossa ja, joka on jatkoa sellaisille data-analytiikan aloille kuin tilastotiede, datanlouhinta ja ennustava analy- tiikka, samoin kuin KDD. (NYU, 2013)

Eräs toinen laajalti viitattu määritelmä datatieteelle määrittelee sen alaksi, joka sijait- see tilastotieteen, ohjelmoinnin ja alakohtaisen asiantuntijuuden risteyskohdassa. Ku- vassa 3 datatieteen sijainti kuvataan Venn-kaavion avulla. (Conway, 2015; Schutt &

O’Neil, 2013)

(29)

22

Kuva 3: Datatieteen sijainti Venn-kaavion avulla kuvattuna. Datatiede sijaitsee tilastotieteen, ohjelmoinnin ja alakohtaisen asiantuntijuuden risteyskohdassa. (Conway, 2015)

Kaikkia kaaviossa kuvattuja kolmea alaa tarvitaan datatieteessä. Perinteinen tutkimus on tässä kaaviossa kuvattu yhdistelmäksi matematiikan ja tilastotieteen teoriaa ja ala- kohtaista tuntemusta. Conway väittää, että tämä voi johtua akateemisesta kulttuurista, joka ei perinteisesti ole palkinnut teknologian ymmärrystä. Ilman alakohtaisen tunte- muksen antamaa kontekstia ja tutkimuskysymyksiä, datatieteestä jää jäljelle vain ko- neoppiminen. Ohjelmointi ja alakohtainen tuntemus ilman tuloksia selittävää mate- maattista teoriaa johtaa vaaralliseen tilanteeseen, jossa päällisin puolin päteviltä vai- kuttavia analyysejä ei osata tulkita oikein ja se voi johtaa vääriin toimenpiteisiin.

(Conway, 2015)

(30)

23

Datatiede eroaa perinteisestä datan analysoinnista esimerkiksi tilastollisin keinoin siinä, että tilastotieteessä pyritään selittämään ilmiö tarkastelemalla yksittäisissä data- joukoissa esiintyviä hahmoja, kun taas datatiede pyrkii tekemään datasta ennusteita ja tuottamaan tietoa päätöksenteon tueksi. (Wladawsky-Berger, 2014)

Datatiede on myös tilastotiedettä vapaampaa siinä suhteessa, että se ei pyri olemaan niin eksaktia vaan sallii suuremman virhemarginaalin tai mallin poikkeaman saavut- taakseen nopeammin toimeenpantavia tuloksia. Tehokkuus ja ROI ovat tärkeimpiä ominaisuuksia, kuten myös ratkaisujen vakaus, skaalautuvuus sekä tulosten tulkitta- vuus. (Granville, 2014)

3.2 Datatieteen historia ja nykytila

Tässä luvussa pyritään vastaamaan kysymykseen: mistä datatiede kumpuaa? Ensin tut- kitaan datatieteen syntyhistoriaa ja sen jälkeen datatieteen kasvuun vaikuttaneita teki- jöitä.

3.2.1 Datatieteen juuret

Datatiede on lähtöisin kypsän tilastotieteen alan ja nuoren tietojenkäsittelytieteen yh- distämisestä. Vuonna 1977 kansainvälisen tilastoinstituutin (International Statistical Institute ISI) jaostoksi perustettiin laskennan alajaosto (International Association for Statistical Computing IASC), jonka tehtävänä on muuttaa data informaatioksi ja tietä- mykseksi yhdistämällä perinteiset tilastomenetelmät ja moderni tietokoneteknologia alakohtaisten asiantuntijoiden tietämykseen. (Press, 2013)

Vuonna 1989 Gregory Piatetsky-Shapiro järjesti ensimmäisen Knowledge Discovery in Databases (KDD) -työpajan, josta vuonna 1995 tuli vuosittainen ACM SIGKDD tiedonlouhinnan konferenssi. SIGKDD on datalouhinnan, -tieteen ja -analysoinnin yh- teisö. (Press, 2013)

Vuonna 1994 yhdysvaltalainen talouslehti Businessweek kertoi kansitarinassaan tie- tokantamarkkinoinnista (Database marketing), jossa yritykset keräsivät paljon tietoa asiakkaistaan. Tiedon avulla ennustettiin, kuinka todennäköistä oli, että kuluttaja ostaa

(31)

24

jonkin tuotteen ja tuleva markkinointi suunniteltiin sen ympärille. Ongelmana kuiten- kin siihen aikaan oli niin suuren tietomäärän käsittely vaikeus. (Berry, 1994)

Ensimmäistä kertaa datatiede-termi esiintyi konferenssin nimessä vuonna 1996, kun IFCS (International Federation of Classification Societies) järjesti konferenssinsa ni- mellä ”Data science, classification and related methods”. (Press, 2013)

Vuosina 2002 ja 2003 julkaistiin ensimmäistä kertaa kaksi datatiedettä käsittelevää tieteellistä julkaisua, Data Science Journal ja Journal of Data Science. Datatiede sai oman tutkimuskeskuksensa Fudanin yliopiston yhteyteen vuonna 2007 nimellä ”The Research Center for Dataology and Data Science”.

Brittiläinen ei-kaupallinen yhdistys Jisc (ent. Joint Information Systems Committee) määritteli datatieteilijät vuonna 2008 henkilöiksi, jotka ”työskentelevät siellä missä tutkimusta suoritetaan, tai, tietokeskushenkilökunnan tapauksessa, lähellä paikkaa, jossa data tuotetaan” ja jotka ”tuottavat luovia kyselyjä tai analyysejä, mahdollistaen muiden työskentelyn digitaalisen datan kanssa ja edistyksen tietokantateknologiassa”.

(Swan & Brown, 2008)

2010-luvulla saavuttiin nykyisenlaiseen määritelmään datatieteilijästä eli hän on hen- kilö, joka ”käyttää niin dataa kuin tiedettäkin luodakseen jotain uutta”. (Patil, 2011) 3.2.2 Syyt yleistymiselle

Datatiede on yleistynyt juuri nyt, koska tiedon, teknologian ja liiketoiminnan odotuk- set suuntautuvat analysoimaan ja käyttämään kasvanutta datamäärää. (Upadhyaya, 2014) Aiemmin mainitusta kerätyn datan määrän räjähdysmäisestä kasvusta johtuen, dataa on paremmin saatavilla. Uudet teknologiat mahdollistavat entistä kustannuste- hokkaamman datanhallinnan, -säilömisen kuin -käsittelynopeudenkin. Uusien työka- lujen avulla voidaan myös paremmin käsitellä yhä kasvavaa joukkoa muodoltaan mo- ninaista dataa sekä kehittäminen ja ottaa käyttöön tietomalleja entistä tehokkaammin.

Liiketoiminnan odotukset ovat myös suuntautuneet hyödyntämään teknologian avaa- mia uusia mahdollisuuksia, kuten vasteaikojen pienentämistä tai asiakkaan yksilöllistä

(32)

25

tunnistamista ja käyttäytymisen ennustamista sekä sen pohjalta viestimistä. (Schutt &

O’Neil, 2013)

Kuva 4: Datatieteen nousuun vaikuttavat tekijät ovat data, teknologia sekä liiketoiminnalliset tarpeet. (Upadhyaya, 2014)

Datatieteen yleistymiseen johtavia tekijöitä on avattu kuvassa 4. Datan saatavuuden kasvu sekä teknologian uudet mahdollisuudet selviytyä suurten datamäärien analy- soinnista järkevin kustannuksin ovat osaltaan edistäneet datatieteen esiinmarssia.

Myös yritysten kilpailutilanne, joka vaatii digitaalisen kokemuksen huomioon otta- mista ja uusia palvelumalleja, on siihen vaikuttanut. (Upadhyaya, 2014)

3.3 Datatieteen käyttökohteet

Datatiedettä voidaan käyttää hyvin laaja-alaisesti. Kerättyä dataa käytetään mm. edis- tämään terveyttä ja terveydenhuoltoa, tehostamaan resurssien käyttöä ja kierrätystä, vähentämään rikollisuutta ja parantamaan turvallisuutta. Kerätystä datasta muodoste- taan myös mm. datatuotteita, kuten verkkokauppojen suosittelijajärjestelmiä, verkko-

(33)

26

opiskelun yksilöllisesti mukautuvaa materiaalia tai dataan pohjautuvaa politiikkaa.

(Loukides, 2010; Schutt & O’Neil, 2013; B. Walker, 2015)

Ennakoivan analytiikan suurimmat datalähteet liittyvät tulovirtoihin. Vuonna 2012 en- nustavaa analyysia käyttävien yritysten käyttökohteet olivat markkinointi (65%) ja myynti (59%) ja suurimmat tietolähteet asiakkaisiin (69%), markkinointiin (67%), tuotteisiin (55%), myyntiin (54%) ja rahoitukseen (51%) liittyvä data. (Vorhies, 2014) Lääketiede voi hyötyä valtavasti datatieteen soveltamisesta. Suuria hyötyjä voidaan saavuttaa etenkin, jos dataa saadaan yhdistettyä ja avattua eri tahojen, kuten sairaaloi- den ja klinikoiden, tietovarastoista. Dataa voidaan myös kerätä ihmisten käyttämistä laitteista mm. aktiviteetinseurantaan, jolloin data on oikeellisempaa kuin ihmisten it- sensä ilmoittama tieto. Terveysalan yritykset, kuten Pittsburgh Health Data Alliance, ovat jo alkaneet tarjota palveluita kuluttajille, jotka ovat räätälöity yksilöllisesti heidän vakuutustietojensa, laiteseurantadatan, genetiikan ja jopa sosiaalisen median käyttö- datan mukaan. Lisääntyneen datan ja koneoppimisen myötä diagnosointi helpottuu ja jopa diagnoosin mukainen hoito voi olla räätälöity yksilökohtaisesti. Datatieteen avulla voidaan myös tehostaa jälkihoitoa mm. ennustamalla ketkä potilaat todennäköi- sesti noudattavat terveydenhuollon ammattilaisen ohjeita ja ketkä eivät. (Marr, 2016a;

Rojas, 2015)

Yksi datatieteen käyttökohteista on markkinointi, jossa sitä hyödynnetään ennusta- maan asiakkaiden käyttäytymistä ja heidän kulutuskäyttäytymistään. Tämän tiedon avulla voidaan tehokkaasti markkinoida oikeita tuotteita oikeille henkilöille oikeaan aikaan, joka johtaa korkeampaan asiakastyytyväisyyteen sekä korkeampaan asiakas- kohtaiseen tuottoon. (M. Walker, 2013)

Datatiedettä käytetään myös rakennusalalla, jossa on alettu hyödyntämään tietojärjes- telmiä, jotka mahdollistavat ennustavan, reaaliaikaisen rakennussuunnitelman päivit- tämisen kustannusarvion raameissa. Tämänkaltaiset tietojärjestelmät nopeuttavat suunnitteluprosessia vähentämällä tarvetta edestakaiseen kommunikaatioon arkkiteh- tien, insinöörien ja omistajien välillä. Ne myös vähentävät materiaalihukkaa, joka on merkittävä menoerä rakennusalalla. Kuten muillakin aloilla, datan vapauttaminen ja

(34)

27

kokoaminen eri lähteistä on mahdollistanut sen hyödyntämisen datatieteen keinoin.

(Marr, 2016c)

Datatieteen käyttö vakuutusalalla mahdollistaa uusien tuottomahdollisuuksien tunnis- tamisen. Asiakaskäyttäytymisen analysointi ja ennustaminen on johtanut kasvaneisiin tuloihin mm. nopeutuneen laskunmaksun kautta. Datatiedettä voidaan hyödyntää ris- kiprofiilien muodostamisessa ja mahdollisten vakuutuspetosten tunnistamisessa.

(Pandey, 2014) Liikennevakuutuksien yhteydessä voidaan käyttää reaaliaikaisesti päi- vittyvää dataa asiakkaiden autoista ja muodostaa datasta yksilöllisiä hinnoittelumalleja liikennevakuutuksille. Myös kotivakuutusten yhteydessä voidaan muodostaa yksilöl- lisiä riskiprofiileja asuinpaikan, siitä saatavan julkisen datan ja kodin sisäisten senso- rien (kosteussensorit, liiketunnistimet, turvakamerat) tuottamaa dataa yhdistämällä.

Niistä voidaan myös tuottaa ennusteita ja sen pohjalta auttaa asukasta varautumaan mahdollisiin vaaratilanteisiin. Samaa dataa, jota kerätään terveydenhuollon käyttöön, voidaan myös käyttää terveys- ja henkivakuutusten riskiprofiilien muodostamiseen.

(MastersInDataScience.org, 2016)

Datatieteen sovelluksilla voidaan helpottaa henkilöstöresurssien hallintaa. Näitä sovel- luksia tarjoavat mm. Oracle, IBM ja SAP. Henkilöstöstä kerättyä dataa voidaan ana- lysoida ja sen avulla parantaa erilaisia henkilöstöön liittyviä prosesseja, kuten esim.

henkilöstön säilyttämistä, rekrytointia ja koulutusta. Datatieteen avulla voidaan mm.

ennustaa työvoiman muutostarpeita sekä tunnistaa henkilöstön tyytyväisyyttä ja työ- paikanvaihtohalukkuutta. MITn ja IBMn suorittaman tutkimuksen mukaan HR:ssä da- tatiedettä soveltavat yritykset kasvattivat myyntiään 8% nopeammin, niillä oli 24%

suurempi nettotuotto ja 58% suurempi työntekijäkohtainen myynti. (Sen, 2016) Datatiedettä voidaan käyttää jokaisella koulutusasteella ennustamaan oppilaiden suo- ritustasoa ja tunnistamaan varhain opiskelijat, jotka todennäköisimmin jäisivät jälkeen opetuksessa. Opetuksen sisältö voi mukautua yksilöllisesti opiskelijan tasoon ja oppi- mistyyliin ja opiskelijoiden motivaatiota voidaan parantaa oikea-aikaisella palaut- teella. Opettajille ja opetuslaitoksen hallinnolle voidaan tarjota tietoa opetuksen ja opintosuunnitelman vaikuttavuudesta. Datatieteen avulla voidaan myös parantaa pää- töksentekoa ja vähentää kuluja. (Siemens et al., 2007)

(35)

28

Pelimaailmassa datatiedettä on sovellettu markkinointiin ja pelisuunnitteluun. Mark- kinoinnissa sitä käytetään kuten muillakin aloilla, eli tunnistetaan asiakassegmenttejä ja kohdennetaan markkinointia niiden perustella. Pelisuunnittelussa pystytään taas mittaamaan, miten pelaajat reagoivat eri ärsykkeisiin ja saadun palautteen perusteella voidaan muokata peliä toivottuun suuntaan. Tässä tärkein tavoite on maksimoida pe- liaika ja kokemus siitä, että rahalle on saatu vastinetta maksullisten pelien suhteen ja toisaalta ilmaisissa, mainosrahoitteisissa peleissä on tarkoitus maksimoida nähtyjen mainosten määrä. (Marr, 2015) Lisäksi ”freemium”-mallin mukaan hinnoitelluissa pe- leissä maksua ei suoriteta peliä ostettaessa vaan sitä käytettäessä ja datatieteen avulla optimoidaan pelin sisällä käytetty raha. Kilpailullisissa peleissä datatieteellä varmiste- taan pelihahmojen välinen tasapaino. Myös kasinojen pelikoneissa voittojen ajankohta on rytmitetty pelaajan mentaliteetin mukaan, oli sitten kyseessä harkitsevainen varmo- jen voittojen pelaaja tai riskialtis vedonlyöjä. (Parkin, 2015)

3.4 Datatiede prosessina

Tässä luvussa käydään läpi datatieteen prosessi. Datatieteen soveltaminen ei ole trivi- aali seikka vaan vaatii verkko-opetuksessakin erityistä suunnittelua. Jokainen vaihe nojaa edelliseen ja perustan on oltava kunnossa, jos prosessin kautta halutaan saavuttaa hyötyjä. Datatieteen prosessi koostuu kysymyksen asettelusta, tiedon hankinnasta ja sen puhdistamisesta, kuvailevasta ja ennustavasta analytiikasta sekä tulosten havain- nollistamisesta ja päätöksenteosta ja se on avattu kuvassa 5.

(36)

29

Kuva 5: Datatieteen prosessi koostuu kysymyksen asettelusta, tiedon hankinnasta, tiedon puh- distamisesta, kuvailevasta ja ennustavasta analytiikasta sekä tulosten havainnollistamisesta.

(Schutt & O'Neil, 2013)

3.4.1 Kysymyksen asettelu

Datatieteen prosessi alkaa kysymyksen asettelulla – mihin kysymykseen halutaan vas- tata tai mikä ongelma halutaan ratkaista. Kysymys voi esimerkiksi olla: Minkälaiset ominaisuudet kuvaavat hyvin suoriutuvia opiskelijoita? (Bucky, 2016). Tässä ensim- mäisessä vaiheessa syntyy datatieteen varsinainen arvo, joten on tärkeää, että haetaan vastausta oikeaan kysymykseen. Oikea kysymys on se, johon vastattaessa saavutetaan olosuhteisiin nähden suurin mahdollinen hyöty. Hyödyn ei tarvitse välttämättä olla korkein rahallinen hyöty, vaan se voi olla myös esimerkiksi kilpailuetu. (Shung, 2014) Kysymykset kumpuavat omasta toimialastaan, joka on tunnettava, jotta kysymys osa- taan kysyä oikein. Näin ollen tämä on tärkeä työvaihe datan analysoimisessa. (Stanton, 2013)

(37)

30 3.4.2 Tiedon hankinta

Ennen kuin tietoa voi analysoida, se täytyy kerätä ja tallentaa. Tiedonlähteitä on monia erilaisia, kuten esim. julkiset tilastot, verkkorajapintojen kautta saatava tieto, sensori- data, tietokoneohjelmiston generoima tieto. Esimerkiksi terveydenhuollon tietokanto- jen potilaskohtaista dataa voidaan täydentää potilaan omien aktiviteetin- ja terveyden- seurantalaitteiden datalla. Eri lähteistä kerätty data täytyy koostaa yhdeksi käsiteltä- väksi datajoukoksi. (Guo, 2013; Stanton, 2013)

Alakohtainen asiantuntijuus auttaa valitsemaan mitä tietoa kerätään. Yleensä kannat- taa kerätä kaikki mahdollinen tutkimuskysymykseen liittyvä data, jotta saadaan mah- dollisimman tarkkoja tuloksia, mutta joskus kannattaa välttää keräämästä joitain tie- toja esim. yksityisyydensuojan nojalla. (Ali, 2016; Altintas & Gupta, 2016; Gutierrez, 2014) Keräämisessä voidaan käyttää hyödyksi keskeisiä suorituskykymittareita (eng.

Key Performance Indicator, KPI), jotka kertovat olennaisen tiedon esimerkiksi yrityk- sen suorituskyvystä. (Marr, 2016e)

3.4.3 Tiedon puhdistaminen

Kerätty tieto täytyy puhdistaa, jotta sitä voidaan analysoida ja se vaatii tiedon eri as- teista muokkausta riippuen sen lähteestä. Esimerkiksi verkkosivuilta kopioitu tieto voidaan joutua jäsentämään lähdekielen sääntöjen mukaan ennen kuin sitä voidaan käyttää. Tyhjät ja puuttuvat arvot sekä duplikaatit tulee käsitellä tilanteen vaatimalla tavalla, tiedon muoto tulee yhtenäistää ja semanttiset virheet korjata. Tiedon puhdista- minen voi tapahtua koneellisesti tai manuaalisen työn avulla. (Bandyopadhyay, 2016;

Guo, 2013; Loukides, 2010)

Kun tieto on jäsennetty, sen laatu täytyy ottaa tarkasteluun. Yleensä tieto on puutteel- lista tai sisäisesti ristiriitaista. Ristiriitojen syy täytyy selvittää. Onko tieto virheellistä ja jos on, mistä se johtuu? Kertooko ristiriita jotain muuta kuin mitä tutkimuskysymys kysyy ja seurataanko sen sijaan tätä ristiriitaisuuksien kysymyslinjaa? Esimerkiksi ot- sonikato olisi todettu aikaisemmin, mutta aukon todentaminen viivästyi, koska auto- maattinen tiedonkeräys hylkäsi liian matalat lukemat. (Loukides, 2010)

(38)

31

Tiedon puhdistaminen on yleensä aikaa vievin ja pitkästyttävin työvaihe datatieteessä - datatietelijän työajasta jopa 50% - 80% voi mennä tietoa puhdistettaessa. Etenkin eri tietolähteistä kerättyä tietoa yhdistettäessä sen puhdistaminen käy entistä vaikeam- maksi. Sitä puhdistettaessa voidaan kuitenkin päätellä jotain tietojoukon ominaispiir- teistä, mitä oletuksia siitä voidaan tehdä ja millä tavalla sitä kannattaa lähteä analysoi- maan. (Guo, 2013; Lohr, 2014)

3.4.4 Kuvaileva analytiikka

Kuva 6: Gartnerin analyyttinen jatkumo kuvailevasta analytiikasta ohjailevaan analytiikkaan.

(Laney, 2015)

Kuvassa 6 Gartner asettaa kuvailevan analytiikan (eng. descriptive analytics) analyyt- tisen jatkumon alimmalle tasolle. Se katsoo taaksepäin ja on helpoin analytiikan ala suorittaa. Se vastaa kysymykseen: Mitä on tapahtunut? (Laney, 2015)

Kuvailevan analytiikan keinoin yritetään ymmärtää datasta mitä tapahtui menneisyy- dessä. Tässä yhteydessä menneisyys tarkoittaa aikaa minuuteista vuosiin. Tämä on yleisin ja yksinkertaisin tapa analysoida dataa ja se auttaa ymmärtämään mitä on tehty,

(39)

32

mitä siitä voi oppia ja miten se saattaa vaikuttaa tulevaisuuteen. Tärkeimpänä kuvai- levan analytiikan välineenä ovat yksinkertaiset tilastotieteelliset menetelmät, kuten summa, keskiarvo ja prosenttimääräiset muutokset. (Bertolucci, 2013)

Kuvailevaa analytiikkaa hyödynnetään näyttämään tietoa, kuten varastosaldo, asiak- kaiden keskimääräinen ostosmäärä ja myynnin vuotuinen muutos. Yleisin kuvailevan analytiikan tulos onkin raportti, jossa kerrotaan miten esimerkiksi yrityksen tuotto, ra- hoitus, myynti yms. ovat kehittyneet. Kuvailevaa analytiikkaa käytetään myös esimer- kiksi luokittelemaan analysoinnin kohteita (esim. asiakkaita) eri ominaisuuksien (ku- ten suositun tuotteen) mukaan. (Bertolucci, 2013)

3.4.5 Ennustava analytiikka

Kuvassa 6 Gartner asettaa ennustavan analytiikan (eng. predictive analytics) analyyt- tisen jatkumon toiseksi korkeimmalle tasolle. Se katsoo eteenpäin ajassa ja on toiseksi vaikein analytiikan ala suorittaa. Se vastaa kysymykseen: Mitä tulee tapahtumaan?

(Laney, 2015)

Ennustavan analytiikan keinoin pyritään ennustamaan tulevia tapahtumia menneisyy- den pohjalta. Sen tarkoitus on tuottaa dataa tulevaisuudesta, jonka pohjalta voidaan tehdä toimenpiteitä muun muassa antamalla mahdollisille tapahtumille todennäköi- syyksiä. Pitää kuitenkin muistaa, että mikään algoritmi ei voi ennustaa tulevaisuutta 100% todennäköisyydellä. (Halo Business Intelligence, 2016)

Ennustavassa analytiikassa käytetään monenlaisia menetelmiä mallintamisen, koneop- pimisen, datalouhinnan ja peliteorian alalta, joilla pyritään havaitsemaan datasta eri- laisia toistuvia malleja ja datajoukkojen välisiä suhteita, joita käytetään ennustamaan esimerkiksi asiakaskäyttäytymistä, ostostrendejä ja tuotantoketjun vaatimuksia. Eräs yleinen sovelluskohde on luottoluokituksen laskeminen, joiden avulla luoton antaja voi arvioida luoton saajan tulevaisuuden maksukykyä. (Halo Business Intelligence, 2016; M. Walker, 2012b)

Ennustavan analytiikka ei ole rajoittunut vain ajalliseen ennustamiseen – olemassa ole- vaa tietoa voidaan myös käyttää sellaisen tiedon ennustamiseen, jota ei vielä tiedä.

(40)

33

Esimerkiksi sosiaalisessa mediassa ennustavaa analytiikkaa voidaan käyttää henkilön vaikutuksen ennustamiseen hänen sosiaalisen aktiivisuustiedon perusteella. Sitä käy- tetään myös tunneanalyysiin, jossa analysoidaan henkilön tuottamaa tekstitietoa ja en- nustetaan siitä henkilön tunnetilaa. (Wu, 2013a)

3.4.6 Tulosten havainnollistaminen ja johtopäätösten tekeminen

Kuva 7: BADIR™-päätöksentekoprosessi (Jain, 2013)

Kerättyä tietoa voidaan analysoida ja ymmärtää, mutta siitä ei ole hyötyä, jos sitä ei käytetä päätöksenteon tukena! Päätöksentekoa helpotetaan pitämällä se mukana pro- sessin jokaisessa vaiheessa esimerkiksi pysymällä liiketoiminnallisten rajoitteiden si- sällä, osallistamalla avainsidosryhmiä ja ajoittamalla päätöksenteon niin, että sidos- ryhmät ovat valmiita ryhtymään toimeen analyysin tulosten pohjalta. Kuvassa 7 on havainnollistettu päätöksentekoprosessia, jossa data ja siitä tehdyt johtopäätökset ovat kiinteä ja jatkuva osa koko prosessia. (Jain, 2013)

Päätöksiä tehtäessä pitää myös muistaa datan konteksti ja arvioida tulosten oikeelli- suus. Jos jotain datajoukkoa analysoidaan liian pitkälle, siitä vedettyjä johtopäätöksiä ei voi yleistää datajoukon ulkopuoliseen maailmaan. Tätä ilmiötä kutsutaan ylisovit- tamiseksi. (Provost & Fawcett, 2013)

(41)

34

Tuloksista ei ole hyötyä, jos niitä ei ymmärretä, joten ne täytyy esittää ymmärrettä- vässä muodossa kohdeyleisölle, jotka eivät yleensä ole asiantuntijoita. Näin ollen on erittäin tärkeää, että datatieteilijät ja päätöksentekijät puhuvat asioista kaikkien osa- puolien ymmärtämillä termeillä. Esimerkiksi teknisien mittareiden (algoritmien tark- kuus tai herkkyys) sijaan tulisi puhua kontekstin mukaisin termein, eli yritysmaail- massa liiketoimintamittarien mukaan. Mittaustulosten sijaan kannattaa puhua analy- soinnin pohjalta tehtyjen toimenpide-ehdotuksien hyvistä ja huonoista puolista. Tari- nankerronta on tehokas tapa kommunikoida tulokset. (Davenport, 2013; Matsudaira, 2015)

Tiedon havainnollistaminen eli visualisointi on tehokas tapa havainnollistaa analyysin tuloksia. Taulukossa 1 on esimerkki pylväskaaviosta. Eri kaaviotyylejä, kuten pylväs- , viiva- ja ympyräkaavioita, voi soveltaa tapauskohtaisesti ja jotkut ohjelmistot, kuten SAS Visual Analytics, osaavat valita kaaviotyylin automaattisesti käytetyn datan mu- kaan. Kaaviot voivat myös olla dynaamisia ja vuorovaikutteisia, joiden avulla voidaan helpommin tuoda esille ajan mittaan tapahtuvia muutoksia ja porautua tarkemmin eri mittaustuloksiin. Tietoa voidaan myös havainnollistaa muilla keinoin, kuten esim. 3D- tulostetuilla, kosketeltavilla tulosten esityksillä. (Davenport, 2013)

Viittaukset

LIITTYVÄT TIEDOSTOT

Pohdimme usein, mitä verkko-opettaminen oikein on ja miten sitä voisi kehittää. Verkko-opiskelu tuntuu usein olevan vain tehtävien antoa ja palauttamista verkossa. Verkko

Jos verkko on separoitumaton, voidaan siitä poistaa mikä tahansa solmu siten, että verkko pysyy yhtenäisenä. Tämä on hyödyllistä esimerkiksi silloin kun havaitaan, että joku

Jatkossa päätoteuttaja voi antaa hankkeessa käytettäviä rakennetyyppejä suunnittelijoiden käyttöön ArchiCAD – muodossa niin, että suunnittelija käyttää niitä

Edellä esitetyn tuottavuuden tasoa kuvaavan mittarin lisäksi seurantaan käytetään suh- teellisia mittareita, jotka kuvaavat tuottavuuden muutosta edelliseen ajanjaksoon verrat-

Miten eri tavoin voidaan tukea verkko- opiskelijan opinnoissa etenemistä ja mielekästä opiskelukokemusta.. Lisäksi nostetaan esiin konkreettisia vinkkejä eri

Niiden mukaan arvioinnin tarkoituksena on opiskelijan arvi- oinnin ja ohjaamisen lisäksi myös kehittää opetusta.. Opetussuunnitelmassa olevat opintojaksojen

Tutkimustehtävänä oli selvittää, mitkä tekijät edistävät ja estävät verkko-oppimista sekä analysoida hyvän verkko- opettajan, verkko-opiskelijan ja verkkokurssin

Kokemuksellisen oppimisen lisäksi olemme verkko-opetuksessa rakentaneet seikkailupohjai- suutta myös vapaaehtoisuuden, ennakoimatto- muuden sekä yksilöllisyyden kautta..