• Ei tuloksia

Asenteet analytiikkaa kohtaan

N/A
N/A
Info
Lataa
Protected

Academic year: 2022

Jaa "Asenteet analytiikkaa kohtaan"

Copied!
37
0
0

Kokoteksti

(1)

Asenteet analytiikkaa kohtaan

Heikki Parkkonen

Pro gradu -tutkielma

Tietojenkäsittelytieteen laitos Tietojenkäsittelytiede

Joulukuu 2015

(2)

i

ITÄ-SUOMEN YLIOPISTO, Luonnontieteiden ja metsätieteiden tiedekunta, Kuopio Tietojenkäsittelytieteen laitos

Tietojenkäsittelytiede

Opiskelija, Parkkonen Heikki: Asenteet analytiikkaa kohtaan Pro gradu -tutkielma, 37 s.

Pro gradu -tutkielman ohjaaja(t): FT Virpi Hotti Joulukuu 2015

Tutkielmassa tehtiin kirjallisuuskatsaus asenteista analytiikkaa kohtaan. Kirjallisuus- katsauksen taustalla oli Andrew McAfeen esittelemä HIPPO (the highest-paid per- son´s opinion), joka tekee päätöksiä intuition tai tunteiden perusteella. Kirjallisuus- katsauksen pääkysymys oli seuraava: onko asenteella vaikutusta päätöksentekotilan- teessa, kun informaatio päätöksenteon tueksi on tullut rakenteisena tai rakenteetto- mana datana ja sitä on pitänyt analytiikan avulla jalostaa? Kysymykseen ei löydetty vastausta. Tutkielman tekoaikana syntyi jatkotutkimusajatuksia siitä, miten tutkimus- kysymykseen voi lähteä hakemaan vastauksia esimerkiksi sentimentti- eli asenneana- lyysillä, jonka tuloksia voidaan ymmärtää paremmin, jos asenneanalyysin tuloksien tulkinnassa hyödynnetään niiden henkilöiden profiilia, joiden asenteita tutkitaan.

Avainsanat: HIPPO, analytiikka, asenne, data

(3)

ii

UNIVERSITY OF EASTERN FINLAND, Faculty of Science and Forestry, Kuopio School of Computing

Computer Science

Student, Parkkonen Heikki: Attitude towards analytics Master’s Thesis, 37 p.

Supervisors of the Master’s Thesis: PhD Virpi Hotti December 2015

In this Master´s thesis literature review was conducted and researched on the subject of attitude towards analytics. The main proposition was set in motion when Andrew McAfee introduced the term HIPPO (the highest-paid person´s opinion), whom deci- sion is based on intuition and emotions. Literature reviews main statement was: does attitude have weight on the matter when the moment of decision is on hand and the information for the decision have been collected from structured of unstructured data and it needed to be refine with analytic tools. This question was left unanswered. Dur- ing the research ideas for further research was generated. Could answers be found from attitude analytics? If the research would take into consideration the profile of that sub- ject which is under survey.

Keywords: HIPPO, analytics, attitude, data

(4)

iii

Esipuhe

Tämä tutkielma on tehty Itä-Suomen yliopiston Tietojenkäsittelytieteen laitokselle syksyllä 2015.

Kirjallisuuskatsauksen idea lähti käytännön kokemuksista, joita olin itse kohdannut ja joita halusin tutkia. Tänä päivänä organisaatiot eivät voi tehdä päätöksiä ”musta tun- tuu” -tunnetilojen perusteella vaan tarvitsevat päätöksen tueksi kerätystä datasta jalos- tettua informaatiota. Tämän idean pohjalta Virpi Hotin erinomaisessa ohjauksessa on- nistuimme kehittämään työlleni suunnan, jota lähdin itsenäisesti työstämään. Haluai- sinkin kiittää Virpi Hottia onnistuneesta yhteistyöstä: ”jos oma lamppu ei pala, niin lainataan kaverin valoja.”

Tämän esipuheen kirjoittaminen on erityinen hetki itselleni. Kovin kaukainen tavoite valmiista tutkielmasta, joka konkretisoituu esipuheen muodossa. Kiitokset myös kuu- luvat opiskeluyhteisölleni, tuki sieltä suunnalta on ollut merkittävä opintojeni aikana.

Erityismaininta avopuolisolleni Jennille, joka on omalla panoksellaan tukenut minua, ei pelkästään pro-gradu -tutkielman aikana, mutta myös näiden 4 vuoden opintojeni aikana.

(5)

iv

Sisällysluettelo

1 Johdanto ... 1

2 Analytiikka ... 5

2.1 Suorituskykymittarit ... 6

2.2 Monimuotoinen data ... 8

2.2.1 Rakenteeton ja rakenteinen data ... 9

2.2.2 Big Data ... 9

2.3 Ennakoiva analytiikka ... 11

2.4 Tilastotiede ... 13

3 Asenteen määrittely ... 15

4 Kirjallisuuskatsauksen sisältö ... 16

4.1 Hakutermien määrittely ... 16

4.2 Tietokantojen valinta ... 17

4.3 Hakukriteerien luonti ... 17

4.4 Julkaisujen etsintä ... 20

4.5 Hakutulosten arviointi ja valinta ... 21

5 Kirjallisuuskatsauksen tulokset ... 22

5.1 Lausumat ... 22

5.2 Tarkistushaku kirjallisuuskatsauksen tulosten varmentamiseksi ... 24

6 Yhteenveto ... 27

Viitteet ... 29 Liitteet

(6)

1

1 Johdanto

Johdannon ideana on auttaa lukijaa ymmärtämään tutkielman perustaa, avata käsitteitä ja auttaa ymmärtämään, mitä tutkielman pääkysymyksellä halutaan saavuttaa ja miten se auttaa tietoyhteiskuntaa kehittymään.

Intuitio ihmisessä on mykistävän voimakas väline ja oikein käytettynä ihmiset kyke- nevät ennakoimaan intuition avulla tapahtumia, jotka tulevat tapahtumaan tai ovat par- haillaan käynnissä ilman, että kukaan sitä huomaa. Joku saattaa kutsua aistihavainto- aan intuitioksi, arvaukseksi, spekulaatioksi, päättelyksi, arveluksi, yliaistilliseksi ko- kemukseksi tai joksikin muuksi. Vaikka intuitiolle löytyy tieteellisiä määrittelyjä, tu- lee huomioida, että määritelmä on aina mielivaltainen, riippuen intuition kokijan omasta tulkinnasta. (Nikkari, 2015) Juurikin noiden termien takia intuitioon luottami- nen on vähennyttävä ja keskityttävä päätöksentekoon faktapohjalta.

”Mikäli yritys kykenee luomaan uutta tietoa muita yrityksiä tehokkaam- min tai pystyy paremmin hallitsemaan yrityksessä olevaa tietämystä, pys- tyy se toimimaan tehokkaammin ja tuottavammin kuin sen kilpailijat. Tie- tämyksen parempi hallinta voi tarkoittaa tiedon tehokkaampaa tallenta- mista, tiedon tehokkaampaa siirtämistä yksilöiden ja ryhmien välillä tai tiedon tehokkaampaa hyödyntämistä uusissa yhteyksissä.”(Pajunen, 2010) Intuition ongelma on yleensä sen subjektiivisuus, henkilö kokee tilanteet samankaltai- sina vaikka tilanteiden muuttujat voivat olla täysin erilaiset. Tästä johtuu epäjohdon- mukaisuudet esimerkiksi päätöksentekotilanteissa, joissa pitäisi katsoa faktoja objek- tiivisesti ilman tulkintaa omien tuntemusten tai intuition pohjalta. Tutkimukset osoit- tavat, että henkilöt jotka ovat olleet suunnittelemassa lääketieteeseen potilaiden hoi- toon tarkoitettuja malleja päätöksenteon tueksi, tekevät heikompia päätöksiä itsenäi- sesti kuin hyödyntämällä suunnittelemiaan malleja. (McAfee, 2015)

Teknologinen kehitys on nopeaa datan ja sen käsittelyn osalta. Puhutaan esimerkiksi big datasta ja fast datasta sekä niihin liittyvistä teknologioista, jotka mahdollistavat

(7)

2

uusien syy-seuraus-suhteiden löytämisen monimuotoisesta datasta. Lisäksi teknologi- oita hyödyntämällä pyritään ennustamaan ja ennakoimaan tulevaa.

Maailma muuttuu tällä hetkellä nopeammin kuin koskaan ja tekniikan kehittyminen vaatii alan osaajiltakin jatkuvaa koulutusta. Onkin siis erikoista, että organisaatio- ja yritysmaailmassa olevat päätöksentekijät ovat jatkuvasti samaa mieltä asiasta, että tuotteet ja palvelut pitää olla aallon harjalla, jotta pysytään samoissa markkinaosuuk- sissa ja kasvuprosentteja kyetään ilmoittamaan osakkeenomistajille, mutta johtamis- kulttuuri on pysynyt vuosikymmeniä identtisenä. Ylin johto yrityksessä käyttää valtaa ja odottaa työntekijöiltä vain panostusta annettuun työtehtävään.

Oli kyseessä mikä tahansa työtehtävä, niin kyseinen henkilö tulee vuosien saatossa sen työtehtävän asiantuntijaksi. Ja jos työntekijälle annetaan kapeat vapaudet toteuttaa työ- tehtävänsä, niin lopputulos tulee olemaankin odotetun kaltainen. Jos kuitenkin työnte- kijälle annetaan vapaudet ja pyydetään toteuttamaan tietyn kaltainen lopputulos, on sen toteuttamistapoja lähes yhtä monta kuin tekijöitäkin. Miksei siis hyödynnetä re- sursseja sen maksimaalisella potentiaalilla?

Marrin (2007) mukaan kertaiskulla toteutuvat toimintaympäristön muutokset, katoavat kilpailuedut, tekniset harharetket, onnistuneesti uutta luovat kilpailijat, rapautuvat markkinat, yhä enemmän valtaa itselleen hankkineet asiakkaat ja kapinahenkiset osak- keenomistajat rasittavat 2000-luvun johtamiskoneistoja. On aihetta pelätä, että johta- mismallimme eivät sittenkään ole pysyneet ajan tasalla. Tämä aikakausi tuo modernin liikkeenjohdon suorituskyvyn rajat selvästi näkyviin.

Tämän päivän yritysten tulisi olla ketteriä ja nopeasti uusia omaksuvia kameleontteja.

Osittain Mooren lain1 takia tuotamme informaatioita jatkuvalla syötöllä eikä sitä kaik-

1 ”Mooren laki liittyy informaatioteknologian kehitykseen. Yksinkertaistettuna 1970 -luvulta lähtien prosessorien nopeus tai tarkemmin sanottuna transistorien määrä kaksinkertaistuu kahden vuoden vä- lein. http://www.mooreslaw.org/

(8)

3

kea välttämättä kyetä keräämään, joten tekniikan on kehityttävä, joka taas johtaa kier- teeseen tuotetun ja helposti hallinnoitavan datan välillä. Kun tekniikka kehittyy näin nopeasti ja tekniset innovaatiot ovat lähes arkipäivää, kuitenkin johtamiskulttuuri on pysynyt samankaltaisena vuosikymmenet. Minkä takia johtamisessa ei ole tapahtunut samankaltaisia kehityshyppäyksiä?

”Nykyisille toimintaympäristölle ovat tyypillisiä sekä jatkuva muutos että kehitystren- dien katkeileminen. Siksi yritysten on kyettävä olemaan yhtäaikaisesti sekä sopeutu- miskykyisiä että operatiivisesti tehokkaita. Ne pystyvät turvaamaan riittävän suuret käyttökatteensa vain, jos ne pystyvät soveltamaan innovaatioita ennakkoluulottomasti ja nopeasti. Ja silloin kun uudet nousukasyritykset uhkaavat perinteisten toimijoiden markkinaosuuksia, jälkimmäisten on huolehdittava älyllisestä ja henkisestä kapasitee- tistaan eli saatava työntekijänsä antamaan parastaan joka työpäivänä.”(Hamel, 2007”) Kun metodit kirjallisuuskatsauksen suorittamisesta suunnitellaan perusteellisesti, on tutkimuksen perimmäisen kysymyksen muodostaminen merkittävästi helpompaa:

Onko asenteella vaikutusta positiivisesti tai negatiivisesti päätöksentekotilanteessa, kun informaatio päätöksenteon tueksi on tullut rakenteisena tai rakenteettomana da- tana ja sitä on pitänyt analytiikan avulla jalostaa? Tämän kaltaiseen kysymykseen ei voi vastata yksiselitteisesti ja yksinkertaisella kyllä- tai ei-vastauksella, joten se on ositettava paremman hakutuloksen aikaansaamiseksi ja jälkikäteen yhdistellä osat, jotta niiden perusteella voidaan vastata päätutkimuskysymykseen.

Tutkielman tavoitteena on löytää apuja analytiikan parissa työskenteleville ja johdon tukitoimissa toimiville henkilöille, jolloin olisi mahdollista hyödyntää keinoja ja työ- välineitä tarjotessa tukea päätöksentekotilanteeseen. Jokainen päätöksentekotilanne on yksittäinen tapaus ja niitä on myös arvioitava yksittäisesti, joten yleisluontoisia lin- jauksia ei välttämättä kyetä tekemään.

Tutkielman tarkoituksena on kartoittaa tutkimustietoa asenteista analytiikkaa kohtaan kirjallisuuskatsauksen muodossa. Kirjallisuuskatsaus alkaa määrittelemällä analy- tiikka ja asenne, jotta osataan muokata vaadittavat hakulauseet ja tietokannat sopiviksi

(9)

4

kirjallisuuskatsauksen suorittamiseen. Saarelainen & Hotti (2014) toteutti kirjallisuus- katsauksen prosessilla, josta pysyi arvioimaan yksiselitteisesti jokaisen prosessin vai- heen, jolloin lopputuloksen arviointi ja toistettavuus oli esimerkillinen.

Tutkimuksen loppuosassa, jossa koostetaan tuloksista tutkimustulos, on tarkoitus yh- distellä vastauksia osista suuremmaksi kokonaisuudeksi ja esitellä näiden pohjalta johto-päätöksiä ja muiden tutkijoiden ajatuksia, jolloin mahdollinen vastaus saadaan kirjallisuuskatsauksen päätutkimuskysymykselle. Asenteita analytiikkaa kohtaan ei tutkita käytännössä. Kirjallisuuskatsauksen avulla saadaan selville, onko asennetta analytiikkaa kohtaan tutkittu ja jos on, niin mitä tutkimustuloksia on esitetty.

Ensimmäisessä luvussa esitellään pro gradu -tutkielman idea ja johdatellaan lukija pääkysymyksen äärelle, mistä kirjallisuuskatsauksessa kyse. Toinen luku avaa analy- tiikan osa-alueita ja nivotaan niistä kokonaisuus, jotta analytiikkaan kohtaan olemassa olevia asenteita voitaisiin kohdistaa oikein. Kolmannessa luvussa esitellään asennetta ja sen määritelmä, jotta voidaan yhdistää kaksi tärkeää asiaa kirjallisuuskatsauksen osalta, asenne ja analytiikka. Neljännessä luvussa käydään läpi kirjallisuuskatsauksen sisältö ja miten se on toteutettu toistettavalla tavalla. Jokainen vaihe avataan, jotta kir- jallisuuskatsauksen toistettavuus on mahdollista. Viidennessä luvussa esitellään kirjal- lisuuskatsauksen tulokset ja käydään niitä läpi sekä varmennetaan tulokset. Kuudes luku pitää sisällään yhteenveto -osuuden, jossa peilataan kirjallisuuskatsausta sekä ar- tikkeleita, jotka ovat jääneet kirjallisuuskatsauksen ulkopuolelle, jotta voidaan muo- dostaan kattava kuva tilanteesta asenteiden vaikutuksesta analytiikkaan.

(10)

5

2 ANALYTIIKKA

Kun halutaan vahvistaa organisaatioiden toiminnallista älykkyyttä (actionable intelli- gence), niin organisaation johdolla tulee olla ymmärrys datan eri muodoista ja sen tar- joamista mahdollisuuksista. Toiminnalliseen älykkyyteen kuuluu monimuotoisen da- tan (Luku 2.2) kerääminen ja tutkiminen sekä konkreettisten toimenpiteiden ehdotta- minen organisaation kilpailu- ja suorituskyvyn (Luku 2.1) parantamiseksi. Liiketoi- minta-analytiikan /raportoinnin (Luku 2.4) lisäksi tulevaisuutta ennustetaan (forecas- ting) olemassa olevan datan perusteella tai ennakoidaan (predict) datasta valikoitujen ominaispiirteiden perusteella (Luku 2.3)

Analytiikka on terminä hyvinkin käytetty, mutta tulkintoja sen tarkoituksesta on mo- nia, joten sen selventäminen on ensiarvoisen tärkeää heti kirjallisuuskatsauksen alku- vaiheessa. Van Barneveld et al. (2012) määrittelivät analytiikan seuraavalla tavalla:

”Prosessi, jonka avulla dataa tulkitaan, jalostetaan ja arvioidaan, joka auttaa meitä mit- taamaan, kehittämään ja vertaamaan suorituskykyä yksittäisten ohjelmien, osastojen, instituutioiden, organisaatioiden tai kokonaisten teollisuusalojen välillä”. Tämän kal- tainen työkalu on yritysmaailmassa mittaamattoman arvokas, jos sitä osataan hyödyn- tää oikein.

Analytiikasta itsestään on hyvinkin laaja kirjo erilaisia termejä, joilla pyritään kohden- tamaan sitä tiettyyn segmenttiin, jolloin termiä käyttävät tietävät mitä analytiikan osa- aluetta halutaan analysoida. Esimerkiksi liiketoiminta-analytiikka (Business Analy- tics) pyörii yrityksen suorituskykymittareiden ja yrityksen keräämän datan analysoin- nin ja sen ymmärtämisen ympärillä, jotta voidaan tehostaa yrityksen toimintaa. Useim- miten teknologia yritykset pitävät keräämäänsä dataa resurssinaan, joka tulee analy- soida yritystä vahvistavaksi voimavaraksi kilpailijoihinsa nähden, oli sitten kyseessä työn tehokkuuden mittaaminen tai kiinteisiin kuluihin ohjatut resurs-sit. (Van Barne- veld et al. 2012)

(11)

6

Kun yritysmaailmassa halutaan tehdä päätöksiä, tulee sen pohjautua faktoihin. Viite- kehys (Van Barneveld et al. 2012) tarjoaa prosessin, kun faktat eivät välttämättä esit- täydy organisaation johdolle yksiselitteisenä tietona, vaan monimuotoinen data tulee analysoida, jotta sitä voidaan hyödyntää informaationa. Kun jalostettu data on infor- maatiota, sitä voidaan hyödyntää päätöksen teossa (Kuva 1).

2.1 Suorituskykymittarit

Key Performance Indicators eli suorituskykymittarit ovat jokaiselle päätöksenteosta vastuussa olevalle henkilölle elintärkeitä työkaluja. Suorituskykymittareilla pyritään selvittämään yrityksen mennyttä historiaa, nykyistä tilannetta ja mahdollisesti ennus- tamaan tulevaa. Miten tämä kaikki on mahdollista? Yksinkertaisesti keräämällä dataa tai informaatiota, jota yritys kerää ja tuottaa. Tämän jälkeen sitä tulee jalostaa tiedoksi ja ohjata yritystä tai organisaatiota sen avulla haluttuun suuntaan. Jos kuitenkin mitat-

Kuva 1. Analytiikan viitekehys, jonka kantavana voimana on liiketoiminnan analysointi. (Mu-kailtu Van Barne- veld et al, 2012)

(12)

7

tavia tilastoja ei ole saatavilla on yritys sen osa-alueen osalta ”sokea” eikä pystytä te- kemään faktapohjaisia päätöksiä, vaan päädytään tilanteeseen, jossa annetaan tunteille valta. Kun erehdytään sekoittamaan tieto ja tunne oikeasta päätöksestä, voi lopullisen lopputuloksen hallitusta saavuttamisesta unohtaa ja luottaa vain arpaonneen. (Marr, 2010)

Suorituskykymittareiden avulla pystytään seuraamaan hyvinkin tarkasti yrityksen re- surssien käyttöä ja niiden haluttua ohjautumista oikeaan sektoriin. Return on invest- ment (ROI) on erinomainen työkalu arvioidessa kerrytettyä tuloa tai menetystä sijoi- tusta kohti. Esimerkiksi tehokkaampi tuotantolaitteisto voi olla merkittävän suuri ta- loudellinen sijoitus ja sitoo yrityksen pääomaa huomattavan pitkäksi aikaa, mutta toi- saalta nopeampi, tehokkaampi ja taloudellisempi tuotantolaitteisto voi maksaa itsensä takaisin hyvinkin nopeasti. Tämän kaltaisiin tilanteisiin tulisi käyttää tilastollisia tosi- asioita eikä perustaa päätöksentekotilannetta tunnetasolla. Jos yritys ei kykene hoita- maan maksusitoumuksia hankitulle laitteistolle, voi se pahimmassa tilanteessa ajaa yrityksen konkurssiin. Tämän kaltaisiin tilanteisiin mittaaminen on ensiarvoisen tär- keää ja jokaisen tulisi niistä olla tietoisia ja hyödyntää niitä parhaalla mahdollisella tavalla. ”Suorittamalla ROI:n organisaatio kykenee selvittämään todennäköisyyksiä tulolle tai menoille. Jos tulokset antavat viitteitä korkeammasta ROI:n tuloista, niin alhaisemmaksi jäänyt analyysi saa pienemmän painoarvon eikä näin ollen ole organi- saatiolle korkeimmalla prioriteetilla.” (Marr, 2010)

Täytyy kuitenkin huomioida se seikka, että yksittäinen suorituskykymittari on vain kerätystä tiedosta muodostettu laskutoimitus eikä näin ollen voi määrittää suurempaa kokonaisuutta. Päätöksentekoa tehdessä tulee ottaa monia muita muuttujia huomioon, joilla voi olla päätöksentekoa tukeva tai kumoava vaikutus lopputulemaan ja näin ollen suorituskykymittareita tulee käyttää tukemaan päätöksentekoa, eikä olla itse päätös.

Tietenkin yksinkertainen menojen ja tulojen yhteen laskeminen auttaa yritystä näke- mään tappiollisen liiketoiminnan ja parhaimmillaan pelastaa yrityksen konkurssilta, mutta suorituskykymittareilla kyetään muodostamaan hyvinkin monimutkaisia yhtä-

(13)

8

löitä, jolloin niiden painoarvo on vain suuntaa antava. Kuten sanottua, suorituskyky- mittarit ovat mukana eliminoimassa tunne päätöksentekoa ja ohjaamassa rationaali- seen päättelyyn.

2.2 Monimuotoinen data

Datalla tarkoitetaan isoa tai pientä formaatista riippumatonta rakenteellista tai raken- teetonta bittien summaa, joka voi yksittäiselle havainnoijalle olla staattista kohinaa.

Useimmiten tulkinta kulkee ylhäältä alas datan jalostuksessa:

1. Data: raaka informaation muoto, joka vaatii jalostusta

2. Informaatio: tiedon fyysinen olomuoto, kirjallisena tai sähköisenä

3. Tieto: Subjektiivinen tulkinta informaatiosta, jota jaetaan useimmiten suulli- sesti tai välillisesti informaation kautta.

Datastream(Kuva 2.) on kuvailu ”tiedon” etenemisestä askeleittain tarkemmaksi ja konkreettisemmaksi tulokseksi. Portaan pohjalla on pala dataa, josta ei voi suoraan

Kuva 2. Mukailtu 2004 - 2008 Scott A. Carpenter:n pohjalta

(14)

9

päätellä mitään, mutta porras kerrallaan se muuttaa muotoaan käyttäjälleen hyödylli- semmäksi, kun se portaiden lopussa on visio tulevasta.

2.2.1 Rakenteeton ja rakenteinen data

Yrityksen tai organisaation kerätessä jalostamatonta dataa se yleensä jaotellaan kah- teen osaan: rakenteiseen ja rakenteettomaan dataan. Mitä näillä kahdella termillä sitten tarkoitetaan? Rakenteinen data on helpommin havainnoitavaa ja sillä on joku tietty muoto, esimerkiksi CSV-tiedosto ja sen tiedot on jäsennelty. Toki se voi olla paljon muutakin, mutta pääsääntöisesti se on tietyn muotoista ja sitä kyetään hallinnoimaan tietyin välinein. Tähänkin kohtaan on poikkeus, jos rakenteinen data saa ominaisuu- dekseen minkä tahansa big datan ominaisuuden, niin sen hallittavuus muuttuu helposta monimutkaiseksi.

Rakenteeton data on ominaisuuksiltaan heterogeenistä ja voi teoriassa sisältää mitä tahansa missä muodossa tahansa ja missä koko luokassa tahansa. Rakenteettomalla datalla tarkoitetaan yleensä tekstiä, puhetta, ääntä, kuvia ja videota. Jotta näitä kyettäi- siin hallinnoimaan samalla tavalla kuin rakenteista dataa, niin siihen vaaditaan kehit- tyneempiä työkaluja ja monimutkaisempia käsittelytapoja, jotta rakenteeton data saa- daan jalostettavaksi. (Wu et al, 2012)

Analytiikan kannalta ei ole niinkään olennaista kumpaan kategoriaan data kuuluu, ra- kenteettomaan vai rakenteiseen. Ydinideana on kyky erotella ne toisistaan, jalostaa rakenteinen data ja muodostaa rakenteettomasta datasta rakenteisia datakokonaisuuk- sia, jotta niistä voidaan tehdä analysoitavia ja näin ollen hyödyntää päätöksenteossa.

Kun tiedetään haluttu lopputulos, on työvaihe alusta kohti loppua johdonmukaisempi ja selkeämmin hahmoteltavissa.

2.2.2 Big Data

Big datalla viitataan aineistoon, jonka fyysinen koko on yksinkertaisesti liian iso va- rastoitavaksi, hallinnoitavaksi tai analysoitavaksi tavallisin työkaluin. Useimmiten määriteltävä big data saa seuraavan kaltaisia adjektiiveja: volume, velocity, variety, value, veracity, volatility. (bigdata.fi)

(15)

10 1. Volume: Datan määrä on massiivinen.

2. Velocity: Dataa muodostuu niin nopeasti, että sen taltioiminen on hankalaa.

3. Variety: Data on heterogeenistä ja noin 85 % siitä on strukturoimatonta.

4. Value: Datalla on arvoa, mutta sen hyödyntäminen vaatii jalostusta.

5. Veracity: Onko data hyödynnettävissä olevaa ja hyödytäänkö siitä?

6. Volatility: Onko data relevanttia ja säilyykö se pitkäänkin hyödyllisenä?

Yllä olevien kuvausten perusteella kyetään hahmottamaan big datan ominaisuuksia.

Mikä tästä tekee sitten erikoista? Nykyinen yhteiskunta tuottaa joka hetkellä enemmän dataa kuin koskaan aikaisemmin ja teknologian rajat tulevat jossain määrin vastaan.

Esimerkiksi Microsoftin ohjelmisto Excel ei kykene kuin noin miljoonaan riviin työ- muistinsa avulla, mutta työstettävänä voikin olla viisinkertainen määrä rivejä eikä näin ollen työskentely onnistu perinteisin metodein. Tästä on kysymys big datan kohdalla, dataa on niin paljon sovelluksissa, että tavanomaiset rajat tulevat vastaan ja pitää kek- siä uusia ratkaisuja massiivisten tietokantojen hallinnointiin. Tilastojen mukaan ihmis- kunta on tuottanut 90% maailman datavarannoista viimeisen kahden vuoden aikana.

(ScienceDaily, 2013)

Hilbert (2013) sanoo, että vuonna 2012 Google vastaanottaa noin 2 000 000 haku - pyyntöä minuutissa ja Facebook käsittelee noin 700 000 kappaletta määrittämätöntä sisältöä käyttäjiltään. Tämän kaltainen heterogeeninen massa dataa jatkuvalla syötöllä on hyvinkin haastavaa eikä meidän dataan liittyvä sormenjälki jää tähän. Kaikki puhe- limien, autojen GPS -data, valvontakameroiden ja muiden samankaltaisten sensorien tuottama data on prosessoitava jollakin tapaa ja hyödynnettävä liiketoiminnan kannalta parhaalla mahdollisella tavalla.

Jos yllä kuvatun kaltainen määrä jalostamaton tietoa on tarjolla, niin miksei sitä hyö- dynnetä? Toistaiseksi big data -analytiikka laahaa kehityksen perässä, siihen ei välttä- mättä haluta panostaa niin paljon kuin pitäisi vaan ennemminkin halutaan vain ne tu- lokset.

(16)

11

2.3 Ennakoiva analytiikka

Ennustava analytiikka muodostaa eräänlaisen symbioosin data analytiikan ja varsinkin big datan kanssa. Big datan myötä kerättävä data voidaan jalostaa malleja varten, joita sitten hyödynnetään ennustettavuudessa.

“Predictive analytics include statistical models and other empirical meth- ods that are aimed at creating empirical predictions, as well as methods for assessing the quality of those predictions in practice.” (Shmueli et al. 2010) Ennustavan analytiikan ideana on tuottaa käytännön tietoa datan hallinnoijalle, jonka perustella voidaan arvioida tai visioida tulevaa. Tämän kaltainen työkalu on ensiarvoi- sen tärkeä markkinoilla, joissa kilpaillaan tiukasta markkinaosuuksista. Jos kyetään tekemään päätöksiä, joidenka perusteella tiedetään tai ennustetaan esimerkiksi käyt- täytymismalleja ostotilanteessa, tuo se merkittävää etua tiedon hyödyntäjälle. Tietyt tapahtumat, vakiot ja olosuhdemuutokset tekevät ennustamisesta helpompaa, esimer- kiksi palkanmaksu päivänä pankit tietävät olevansa resurssiensa osalta kriittisimmil- lään, jolloin resurssien kohdistaminen ja oikeanlainen hyödyntäminen voi auttaa sekä itse yritystä, mutta myös sen palveluita käyttäviä tahoja.

(17)

12

Gartnerin (2013) kuvan pohjalta (Kuva 3.) kyetään havainnoimaan selkeämmin infor- maation hyödyntämisestä, mallin muodostuksesta sekä sen vaiheista, jotta malli saa- daan toimivaksi sekä hyödyksi yrityksen liiketoiminnalla. Tarkoitus on mitata tämän hetken tapahtumat ja syyt näille tapahtumille, kun nämä kaksi ymmärretään, voidaan aloittaa muodostamaan malleja päätöksenteolle. Kun malli tapahtuneista on olemassa, voidaan sen pohjalta ennustaa tulevia tapahtumia.

Ennustusmallien eri variaatioilla ei teoriassa ole rajoja. Aikajanaennustukset ovat yleensä yhtä tarkkoja kuin annetut tiedot mallia varten. Jos ennustetaan kuukauden tarkkuudella, niin mallin tulokset ovat kuukauden tarkkuudella ja taas vastaavasti tun- nin tarkkuudella kerätyt tiedot tarjoavat tunnin tarkkuudella ennustustietoja. Toki suunnitellessa ja toteuttaessa ennustusmalleja pitää huomioida riskianalyysi ja virhe- marginaali. Kun on kyseessä tulevaisuus, muuttujia on niin paljon, ettei välttämättä kaikkea kyetä huomioimaan. Tästä syystä ennustusmallit onkin päätöksenteon tueksi.

(Maciejewki et al, 2011)

Kuva 3. Mukailtu: The Retail Intelligence Blog, Gartner.

(18)

13

2.4 Tilastotiede

Kun halutaan varmistaa faktat, joidenka pohjalta päätöksiä tehdään tai ennustetaan tu- levia tapahtumia perustuen aikaisempiin tilastointeihin, tarvitaan tilastotieteen osaa- mista. Tilastotiede itsessään ei ole avain onneen, mutta kun ymmärtää tilastojen sano- man, voi sieltä etsiä suurempia merkityksiä tai ilmentymiä, jolloin voi saada sen kai- vatun markkinaeron kilpailijoihinsa nähden.

Jotta ymmärretään numeraalisten tilastojen päälle, tarvitaan siihen yleensä esivalmis- teluja. Esimerkiksi data-analytiikan avulla kyetään järjestelemään datasetit niin, että niitä kyetään työstää tilastotieteen menetelmin. Näin ollen yhdistelemällä useampaa tekniikkaa, kuten data-analytiikka, tilastotiedettä ja suorituskykymittareita, saadaan paras mahdollinen lopputulos ja sitä myöten suurempi määrä informaatiota päätöksen- tekoon.

Yleisesti ottaen päätöksenteko vaatii pohjatietoa, kokemusta ja visiota tulevasta, mutta olisiko mahdollista ohittaa nämä kolme edellä mainittua ja ohjata toimintaa todennä- köisyyksien ja ennustettavuuden avulla. Noether (1990) sanoo, että tilastollinen päät- tely on lähes mahdottomuus yksilötapauksissa. Verrattaessa kahta tapausta toisiinsa, on mahdotonta sanoa lopputuloksesta. Sattumalla jää tässä tilanteessa liian suuri mer- kitys, näin ollen on parempi luottaa vaistoon tai visioon kuin tilastotieteeseen. Mutta tilanteessa, jonka pohjalta on tuhat tapausta ja kyetään vertaamaa lähes samankaltai- sella tapauksella näihin tuhanteen aikaisempaan, voidaan sen perusteella muodostaa johtopäätöksiä ja ennustusmalleja. Tämä pohjaakin tilastoinnin ja informaation ke- räyksen merkityksellisyyteen, ilman sitä emme kykene muodostamaan pohjaa päätök- sellä emmekä näin ollen kykene siirtymään pois tunnepäätöksistä tietopäätöksiin.

Tilastotieteen vahvuus pohjautuu historiaan ja sen taltiointia mahdollisimman suurella tarkkuudella. Virheellinen tilastointi johtaa suurenevaan virhemarginaaliin, joka ai- heuttaa epäluotettavuutta tilastoinnin luotettavuuteen sekä käyttökelpoisuuteen.

Myöskin poikkeukselliset poikkeavuudet aiheuttavat tilastoinnissa haasteita ja voi- daankin käyttää asteikkoa, joka poistaa poikkeavuudet, jolloin tilastoinnista tulee käyt- tökelpoinen. (Noether, 1990)

(19)

14

Tilastointi oikein tehtynä on erittäin voimakas työväline, jota ei tule ottaa kevyesti.

Oikein käytettynä pystytään arvioimaan nykyistä tilannetta sekä ennustamana tulevaa, kunhan tilastointi on tehty riittävällä tarkkuudella. Numerot tilastojen takana kertovat mitä on tapahtunut, mutta on tulkitsijasta kiinni, miten niitä hyödyntää.

(20)

15

3 ASENTEEN MÄÄRITTELY

Asenne2 vaikuttaa meidän jokapäiväiseen tekemiseen ja sen pohjalta muodostetaan mielipiteitä. Helkama et al, (2001) sanoo, että asenne on: ”Johonkin sosiaalisesti mer- kitykselliseen kohteeseen liittyvä myönteinen tai kielteinen suhtautumistapa”. Kun jo- kin aiheuttaa positiivisen tai negatiivisen kokemuksen, on se aina subjektiivinen ko- kemus eikä sitä voi yleistää kaikkiin sopivaksi. Miten tämä liittyy analytiikkaan? Tässä päästään tutkimuksen pääkysymyksenkin juurelle ja syitä kuin myös selityksiä on useita.

”Ihmisten tulkitessa toistensa tekoja ollaan oltu kiinnostuneista siitä, aja- tellaanko teon tai toiminnan taustalla olevan kyseisen henkilön sisäinen motivaatio, tarkoitus tai tunnetila, vai ajatellaanko sen johtuneen jostain ulkoisesta tekijästä kuten sattumasta tai tilanteesta.” (uta.fi)

”Erheen esiintymiseen vaikuttavat myös tilannetekijät, kuten paljonko tie- toa on käytettävissä. Jos sitä on hyvin niukasta, sisäinen attribuutio3 teh- dään todennäköisemmin. Jos taas tunnemme henkilön ja esimerkkitilan- teen hyvin, osaamme ottaa huomioon useampia tekijöitä tapahtuman taus- talla.” (uta.fi)

2 ” a favorable or unfavorable evaluative reaction toward something or someone, exhibited in ones be- liefs, feelings, or intended behavior”. (Myers, 2012)

3 Attribuution peruserhe (Fundamental attrubution error): Olemme taipuvaisia tulkitsemaan tekoja en- nemmin sisäisillä kuin ulkoisilla syillä.

(http://www.uta.fi/avoinyliopisto/arkisto/sosiaalipsykologia/kognitiivisuus.html#Asenne)

(21)

16

4 Kirjallisuuskatsauksen sisältö

Kirjallisuuskatsauksen toteutus on kohtalaisen virtaviivainen suoritus kohti päämäärä- keskeistä lopputulosta. Saarelainen & Hotti (2014) tutkielmassa on käytetty esimerkil- listä lähestymistapaa tutkielman suorittamiseen: 1) Miten (asenteet analytiikkaa koh- taan) on määritelty tieteellisissä julkaisuissa, 2) miten datan keräys kyseisessä tutki- muksessa on toteutettu (kirjallisuuskatsaus) ja 3) kuinka laadullisten metodien hyö- dyntäminen on toteutettu analysoimalla kerätyt tulokset?

Tarkoituksena on tuottaa systemaattinen kirjallisuuskatsaus, joka kattaa seuraavat kri- teerit: 1) menetelmät toteutetaan systemaattisesti, 2) esittää yksiselitteisesti miten kir- jallisuuskatsaus on toteutettu, 3) sisältää kaiken relevantin materiaalin kattavasti ja 4) on toistettavissa muiden toimesta. (Saarelainen & Hotti, 2014)

Tutkimuksen (Saarelainen & Hotti, 2014) osa-alueet on jaoteltu seuraavalla tavalla:

1. Hakutermien määrittely 2. Tietokantojen valinta 3. Hakukriteerien luonti 4. Julkaisujen etsintä

5. Hakutulosten arviointi ja valinta 6. Määritelmien lainaus papereista

Luvussa 4.1. on hakutermien määrittely, luvussa 4.2. on tietokantojen valinta, 4.3. on hakukriteerien luonti, luvussa 4.4. on julkaisujen etsintä ja luvussa 4.5. on hakutulos- ten arviointi ja valinta.

4.1 Hakutermien määrittely

Ensimmäisessä vaiheessa hakutermien määrittely tapahtui kokeilemalla eri hakuter- mejä ja tutkimalla niiden hakutulosten sopivuutta kirjallisuuskatsaukseen peilaten. Ha- kutermeiksi valikoituivat seuraavat: attitude (asenne), analytics (analytiikka) ja de- sicion (päätöksenteko). Näiden sanojen kombinaatiolla pyrittiin samaan hakutuloksia,

(22)

17

jotka laajentaisivat tut-kittavan aihealueen tietoutta (breadth), tarjoaisivat teoreettista taustatietoa (theoretical background) tai vastata käytännön kysymyksiin (practical questions). Lopulliset hakutermit kirjallisuuskatsausta varten olivat: attitude AND (ja -operaattori) analytics. (Saarelainen & Hotti 2014)

4.2 Tietokantojen valinta

Toisessa vaiheessa valittiin tutkittavaan alaan sopivat tietokannat. Tietojenkäsittely- tieteelle sopiviksi tietokannoiksi rajautuivat luonnon- ja matemaattiset tieteet, mutta attitude -hakutermi vaati myös laajennusta psykologian puolelle. Tietokannat kirjalli- suuskatsausta varten oli seuraavat:

1. ACM Digital Library 2. IEEE Xplore

3. Springer Link 4. ScienceDirect 5. EBSCOhost

6. Wiley Online Library 7. Emerald | Insight

4.3 Hakukriteerien luonti

Hakukriteerien valinta tapahtui alkuunsa kokeilun ja erehdyksen myötä, jotta saatiin halutun kaltainen tilanne, jotta hakukriteerien täyttyessä, kyettiin valitsemaan aihee- seen liittyvät alan tutkimukset. Näiden hakukriteerien myötä rakentui päätöspuu, jota jäljiteltiin Saarelaisen & Hotin, (2014) mukaisesti. Ensimmäinen kriteeri liittyi saata- vuuteen, tietokantaa tuli päästä ilmaiseksi Itä-Suomen yliopiston kirjastopalveluita

(23)

18

hyödyntäen. Toiseksi valitun artikkelin tuli olla tieteellinen tutkimusartikkeli. Tieteel- listen artikkeleiden ulkopuolelle joutuneet artikkelit ovat päässeet mukaan tutkielmaan pohdinnan ja toisenlaisen näkökulman hakemisen myötä, esimerkiksi kyetään argu- mentoimaan tarvittaessa puolesta taikka vastaan, toki ilman tieteellisen näytön tukea.

Kolmanneksi artikkelin tuli olla tietojenkäsittelytieteen alalta. Hakutermeinä käytetyt hakutermit toivat laajan skaalan muita aiheen ulkopuolelta olevia tutkimuksia, jotka tuli eriyttää kirjallisuuskatsauksesta. Neljänneksi hakutermit tuli olla abstract -osuu- dessa, jotta kyseistä julkaisua voitiin hyödyntää. Viidentenä kriteerinä hakutulokset tuli olla järjestettävissä julkaisijan mukaan, jotta voitiin tarkastaa esimerkiksi ACM:n tai IEEE:n julkaisuissa vittauksia muihin julkaisuihin. Tämän pois sulkemisen myötä työmäärä ei käynyt työläästä lähes mahdottomaksi. Näiden kriteerien perusteella kyet- tiin tekemään kattavat ja ennen kaikkea järjestelmällinen haku valittuihin tietokantoi- hin, jolloin haut ja hakutulosten seuranta olisi toistettavissa kenen tahansa toimesta.

Julkaisuja etsittiin järjestelmällisesti (Kuva 4.) tietokanta kerrallaan päätöspuun perus- teella. Hakutuloksia käytiin läpi järjestelmällisesti ja jos artikkeli oli pdf -tiedostomuo- dossa sekä Adoben tarjoama hakutoiminto oli käytettävissä, etsittiin artikkeleista ”at- titude” - ja ”analytics” -määritelmiä. Jos vastaavuus löytyi artikkelista, niin poimittiin se talteen taulukointia ja tilastointia varten. Hakutuloksia tuli hyvin vaihteleva määrä, riippuen täysin hakukoneen ominaisuuksista. Hakutulokset löytyvät taulukosta (Tau- lukko 1).

(24)

19

Kuva 4. Hakukriteereistä muodostettu prosessi. Mu- kailtu Saarelainen & Hotti (2014)

(25)

20

4.4 Julkaisujen etsintä

IEEE:n tietokannan artikkelit eivät olleet hyödynnettävissä. Hakutulosten perusteella haetut artikkelit olivat tietokannassa upotettuina kuvina, jolloin Adoben tarjoama ha- kutoiminto ei kykene poimimaan sanoja kuvista. Hakutuloksia ei näin ollen ole huo- mioitu tuloksissa.

EBSCOhost:n tietokanta ei antanut oikeuksia kirjautua Itä-Suomen yliopiston verkosta suorittamaan kirjallisuuskatsausta. Näin ollen tietokannan sisällä pitämiä tutkimusar- tikkeleita ei ole huomioutu tässä kirjallisuuskatsauksessa.

Taulukko 1:

Tietokanta

Osumien luku- määrä

Valittuja artik- keleita

Lausumia va- littu

ACM Digital Lib- rary

5 5 2

IEEE Xplore 8 0 0

Springer Link 0 0 0

ScienceDirect 6 6 1

EBSCOhost Ei oikeuksia

Wiley Online Lib- rary

2522 0 0

Emerald | Insight 0 0 Ei tuloksia.

Yhteensä: 2541 11 3

(26)

21

Springer Link:n tietokanta ei tarjonnut hakutuloksia hakutermeille. Haku suoritettiin kohdistamalla haku otsikkoon, koska sitä ei voinut kohdistaa abstract -osuuteen niin kuin muissa tietokannoissa.

Wiley Online Library:n tietokanta tarjosi 2522 hakutulosta. Hakutulokset kohdista- malla artikkelin otsikkoon ei antanut yhtään tulosta, eikä sitä voinut kohdistaa tieto- jenkäsittelytieteen artikkeleihin.

4.5 Hakutulosten arviointi ja valinta

Hakutulokset käytiin läpi artikkeli kerrallaan ja etsittiin niistä hakutermi kerrallaan lausumia. Jos lausuma löytyi hakutermin ympäriltä, pääsi tämä tarkempaan tarkaste- luun ja tarvittaessa poimittiin talteen. Jos hakutulos oli aiheeseen liittyvä ja siinä mai- nittiin hakutermi, siirrettiin se lausumaksi. Lausumia kerättiin kaikista tietokannoista ja kaikista aiheeseen liittyvistä artikkeleista. Näin ollen mahdollisimman laaja otanta tarjoaisi laajemman perspektiivin tarkasteltavan aihealueen ympärille.

Kaikkiaan hakutuloksia, eli lausumia kerättiin kolme (3) kappaletta. Näiden avulla py- rittiin muodostamaan kuva, joskin ohut sellainen vähäisen tarjonnan takia, tutkitta- vasta aihealueesta.

(27)

22

5 Kirjallisuuskatsauksen tulokset

Luvussa 5.1 on esitelty löydetyistä julkaisusta kerätyt lausumat, jonka perään luvussa 5.2 on tarkistushaku kirjallisuuskatsaukselle. Tässä luvussa on suoritettu kirjallisuus- katsauksen kannalta tärkeä vaihe, jotta katsaus olisi kattava sekä varmistetaan tulos- ten samankaltaisuus. Toki poikkeuksetkin tulosten kanssa olisivat mieluisa vaihtoehto, joiden perusteella olisi ollut hyvä suorittaa analyyseja.

Prosessin onnistuessa, kun tehdään kirjallisuuskatsausta, odotusarvona on saada tuke- via tai poissulkevia johtopäätöksiä lausumien perusteella. Otanta on kuitenkin tämän kirjallisuuskatsauksen osalta kovinkin kapea, johtuen osittain tutkimuksen poikkitie- teellisestä asettelusta, mutta myös varsin tuoreesta tekniikasta. Tekniikalla tässä ta- pauksessa viitataan data-analytiikan tarjoamiin haasteisiin sekä ratkaisuihin, joita ei vielä muutama vuosikymmen sitten tunnettu. Tietojenkäsittelytiede käsitteli menneillä vuosikymmenillä pääsääntöisesti muutamista tavuista mega4 -tavuihin, tänä päivänä teratavut5 ovat arkipäivää kotitietokoneissakin, kun kyseessä on tiedoston koot ja tal- lennuskapasiteetit.

5.1 Lausumat

Tietokannat tarjosivat lausumia hakutermin ”attitude” -sanan ympärille eikä ”analy- tics” -hakutermi saanut osumia saati, että molemmista oltaisiin kirjoitettu samassa virkkeessä.

4 Mega on SI-järjestelmän kerrainnaisyksikön etuliite, jonka yksikkökerroin on 106.

5 Tera on SI-järjestelmän kerrannaisyksinkön etuliite, jonka yksikkökerroin on 1012 http://web.archive.org/web/20120831234747/http://www.sfs.fi/files/70/si-opas.pdf

(28)

23

“We understand competence as a combination of knowledge, skills, un- derstanding, values, attitudes and desires, which lead to effective, embod- ied human action in the world, in a particular domain.”

Ensimmäinen ACM -tietokannan tuloksista seuloitui edellä mainittu lausuma, jossa

“attitude” oli mainittu. Lausumassa otettiin kantaa pätevyyteen seuraavalla tavalla:

Ymmärrämme pätevyyden olevan kombinaatio tiedostoa, taidosta, ymmärryksestä, ar- voista, asenteista ja toiveista, jotka johtavat tehokkaaseen ihmisen toimintaan.

Toinen ACM -tietokannan tulos oli saman suuntainen ensimmäisen lausuman kanssa.

Kantaa otettiin vain toiseen hakutermiin ”attitude”:

”The qualitative assessment shows that domain experts have a positive at- titude toward the provision of automatic support and the visualization of normal behavioral models, as these aids may reduce reaction time and in- crease trust in and comprehensibility of the system.”

Edellinen lausuma ei viittaa suoranaisesti analytiikkaan, mutta mallit ja visualisointi ovat analytiikan osa-alueita: Laadullinen arviointi osoittaa, että verkkoasiantuntijoilla on positiivinen asenne automaattista tukea ja normaalin käytösmallin visualisointia kohtaan, koska nämä apuvälineet voivat alentaa reaktioaikoja ja kasvattaa luottamusta ja järjestelmän ymmärrettävyyttä.

Kolmas lausuma oli ScienceDirect -tietokannasta poimittu, jossa määritellään suoraan

”attitude” -hakutermi.

“Attitude is defined as ‘‘a mental position with regard to a fact or state”.

Though attitudes may not be directly observable, they can be inferred from a person’s objective, evaluative responses and comments.”

Asenne on määritelty henkisenä tilana, joka ottaa huomioon faktan ja lausuman. Tosin asenteet eivät ole suoraan havainnoitavissa, mutta se voidaan päätellä henkilön objek- tiivisuudesta, arvioitavissa olevista reaktioista sekä kommenteista.

(29)

24

5.2 Tarkistushaku kirjallisuuskatsauksen tulosten varmentamiseksi

Tutkielman tuloksia läpikäydessä heräsi epäilys tulosten oikeellisuudesta, joten sa- maan kirjallisuuskatsaukseen on tehty varmistava selvitys aiheeseen liittyen. Tieto- kannat, joita käytiin tutkielman lopuksi läpi, olivat seuraavat:

1. Web of Science 2. Pubmed

3. Scopus

Web of Science vaati Itä-Suomen yliopiston verkkoon kirjautumisen, jotta tietokanta hakuja voitiin suorittaa. Haut toteutettiin samaa kaavaa käyttäen kuin luvussa 4.1 on esitelty. Web of Science ei antanut ”attitude AND analytics” - hakutermillä kuin 30 tulosta, joista tietojenkäsittelytieteen tutkimuksiin liittyi neljä kappaletta. Yksikään ar- tikkeleista ei täyttänyt aikaisemmin kuvatun (kuva4) prosessin vaiheita, mutta otsik- kotasolla silmäiltäessä yksi herätti kiinnostuksen. Tätä tutkittiin tarkemmin, lähinnä laajemman perspektiivin saavuttamiseksi tutkittavasta aihealueesta.

“Companies can then measure customers’ responses on those social media as users post comments or recommendations. Automatic measurement of customers’ opinions of or attitudes toward specific products and services may be possible using these comments, which often reveal customer pref- erences and values”.(Jang, H.-J, et al. 2013)

Asenteen mittaamiseen on siis tulossa edistystä, jos (Jang, H.-J, et al. 2013) tutkimuk- sessa käytetty personality -value-attitude -malli on käytettävissä laajemminkin.

Pubmed.gov -tietokanta on avoin tietokanta kenen tahansa käytettäväksi. Pupmed on US National Library of Medicine National Institutes of Health, joka otettiin yhdeksi tietokannoiksi “attitude” -termin sosiopsykologisen taustan takia. Tämän avulla saa- taisiin ehkä laajempi ja tarkempi kuvaus asenteesta. Toki analytiikkaa hyödynnetään myös lääketieteen saralla hyvinkin laajasta, joten tietokannan pääpainoa ei missään nimessä pidä väheksyä.

(30)

25

Hakutermit kohdistettuna otsikkoon ei antanut yhtään hakutulosta. Jotta jonkinlainen otanta saataisiin tästäkin tietokannasta, niin hakutermit kohdistettiin abstract -osuu- teen, joka antoi kaksi hakutulosta. Nämä tutkimukset eivät vastanneet sisällöltään kir- jallisuuskatsauksen aihealuetta, joten Pubmed ei tarjonnut eriäviä tuloksia varsinaisen kirjallisuuskatsaukseen peilaten.

Kolmantena listalla oli Scopus vaati Itä-Suomen yliopiston verkon käyttöoikeudet, jotta vastaava selvitys kyettiin suorittamaan kuin edellisille tietokannoille. Scopuksen kohdalla tarkennuksia tehtiin tietojenkäsittelytieteen alaan liittyviin artikkeleihin, jol- loin tuloksia listattiin kaksitoista kappaletta.

Scopus mahdollistaa tulosten analysoinnin, joka oli poikkeus kaikkien käytettyjen tie- tokantojen joukossa, mutta ehdottomasti käyttöliittymältään paras. Alla oleva kuva (Kuva 5.) on poimittu Scopuksen verkkosivuilta esittämään dokumenttien aiheiden tieteenaloja.

Valinta tutkittavaksi artikkeliksi kävi läpikäymällä otsikot hakutuloksista. Otsikoista nousi pinnalle Kotsiantis, et al.(2013) tekemä tutkimus analytiikka työkalujen hyödyn- tämisestä menestyvien opiskelijoiden seulonnassa. Abstract -kohdassa oli maininta

Kuva 5.Scopus analytiikkatyökalu

(31)

26

molemmista hakutermeistä, joten lausuman poiminta oli enemmän kuin sopiva tästä artikkelista.

“Eighteen variables depicting the students' perceptions of Moodle, as well as their interaction with it, were examined using four complementary data mining and statistical analysis approaches: visualisation, decision trees, class association rules and clustering. The analysis of the collected data shows that failure in the course was associated with negative attitudes and perceptions of the students towards Moodle.” (Kotsiantis, et al. 2013)

Artikkelissa mainitaan korrelaatio analytiikan avulla: “.. kurssin läpipääsyn epäonnis- tuminen oli yhteydessä negatiiviseen asenteeseen Moodlea kohtaan.” Tämä lausuma on karkeasti tulkittuna linjassa McAfeen (2013) artikkelin kanssa, jossa HIPPO tekee päätöksen intuition ja tunteiden perusteella. Jos asenteeseen voitaisiin vaikuttaa, niin tämän kaltaisia ongelmia voitaisiin vähentää tai jopa poistaa kokonaan.

(32)

27

6 YHTEENVETO

Nykytutkimus ei kykene tarjoamaan yksiselitteistä vastausta tutkimuksen pääkysy- mykseen, ainoastaan ohjata, neuvoa, opastaa ja suositella kuulemaan asiantuntijoiden näkemystä analytiikasta ja antaa painoarvoa analytiikalla. Kirjallisuuskatsauksen pää- kysymys oli: Onko asenteella vaikutusta päätöksentekotilanteessa, kun informaatio päätöksenteon tueksi on tullut rakenteisena tai rakenteettomana datana ja sitä on pi- tänyt analytiikan avulla jalostaa? Tällä hetkellä asenne on vielä liian epämääräinen eikä sen mittaaminen ole hyödyllistä. McAfee (2013) sanookin, ettei HIPPO:a kannata vielä metsästää loppuun kuvainnollisesti vaan ottaa huomioon asiantuntijoiden mieli- pide. Henkilöt, jotka työskentelevät säännöllisesti tietyn aiheen parissa, kykenevät sa- nomaan tarkemman analyysin kuin asiasta tietämätön. Näin ollen HIPPO:n ei pidä yrittäkään omaksua ja hallita kaikkea informaatiota tai tietoa, vaan valjastaa parhaat prosessit, asiantuntijat sekä työvälineet parhaan lopputuloksen aikaansaamiseksi.

Kirjallisuuskatsauksen tarkoituksena oli kartoittaa tilannetta analytiikan tilannetta ja asenteiden kohdistumista sitä kohtaan. Oletusasetelma oli kerätä tietoja ja niiden poh- jalta tuottaa loppulauselmiin analyysi, mutta tämän kaltainen tutkimus on vielä hake- massa omia suuntaviivojaan. Näin ollen suuria suuntaviivoja ei kyetä pienestä otan- nasta johtuen vetämään, mutta voidaan mainita myös tieteellisten artikkeleiden ulko- puolelta olevia lausumia.

Tutkimukselle pohjan antoi Andrew McAfee:n esittelemä HIPPO6, jonka päätöksen- tekoon asiantuntijoina toimivien henkilöiden mielipiteeseen kyetä vetoamaan analyyt- tisilla välineillä, jolloin päätöksenteosta vastaava saisi dataan pohjautuvaa tietoa itse päätöksentekoon. ”Hallitus kokoontuu, keskustelee aiheesta ja HIPPO tekee päätöksen intuition tai tunteiden perusteella. (Andrew McAfee, 2013)

6 A HiPPO is the highest-paid person´s opinion. Andrew McAfee

(33)

28

McAfee (2013) ehdottaakin, että vaikka korkealla hierarkiassa oleva henkilö kykenee tekemään päättelyketjun päätteeksi validin arvioin, niin hänen kuitenkin tulisi luottaa enemmän datan johdattaa oikealle jäljille. Tunneasiat voivatkin johdattaa väärään suuntaan, koska niillä ei ole välttämättä faktapohjaa, joten asiantuntijoiden tuoma li- säinformaatio voi koitua kannattavaksi.

Kuten aikaisemmin mainittua, mallien luominen ennustamista varten on varsin tärkeää sekä nykytilanteen että tulevaisuuden arvioimisen kannalta. Mallit tulevat saamaan tu- levaisuudessa uuden osa-alueen, kun asennetta kyetään mittamaan algoritmien avus- tuksella, koneoppiminen kehittyy ja kyetään tarttumaan ongelmakohtiin entistä suu- remmilla tarkkuuksilla. Jang, H.-J, et al. (2013) sanoo tutkimuksessaan kyvyn yhdis- tellä mallin avulla persoonallisuus-arvo-asenteen. Uusi malli kykenee algoritmin avulla erottelemaan avainsanoja tykkäysten ja inhokkien avulla, joidenka perusteella kyetään muodostamaan sosio-tekninen malli, joka tunnistaa asiakkaan ydinarvot.

(34)

29

Viitteet

Ayhan, S., Pesce, J., Comitz, P., Gerberick, G., Bliesner, S. (2012): Pridictive analyt- ics with surveillance big data. BigSpatial ’12: Proceedings of the 1st ACM SIGSPA- TIAL Internationa Workshop on Analytics for Big Geospatial Data

Big data, for better or worse; 90% of world´s data generated over last two years.

http://www.sciencedaily.com/releases/2013/05/130522085217.htm ScienceDaily.

(Luettu 09.10.2015)

Big data. http://www.bigdata.fi/big-data-maaritelma (Luettu 09.10.2015)

Coopeer A. (2012): What is analytics? Definition and essential characteristics. JISC CETIS Analytics Series: Vol. 1 No. 5. What is analytics?

Cuzzocrea, A., Song, I., Davis, C. (2011): Analytics over large-scale multidimensional data: the big data revolution. Dolap ’11: Proceedings of the ACM 14th international workshop on Data Warehousing and OLAP.

Hamel, G., Breen, B. (2007): Johtamisen tulevaisuus. Talentum Media Oy

Harvard Business Review (2010) The Future of Decision Making: Less Intuition, More Evidence. https://hbr.org/2010/01/the-future-of-decision-making/ (13.05.2015)

Hilbert, M. (2013): Big data for development: From information- to knowledge socie- ties. University of California, Davis.

Hippo versus geeks. Who will win? http://blogs.sas.com/content/sas- com/2013/04/30/hippos-versus-geeks-who-will-win/ SaS.com (Luettu 22.10.2015)

Helkama, K. & Myllyniemi, R. & Liebkind, K. (2001) Johdatus sosiaalipsykologiaan.

Helsinki: Edita

http://upstreamcommerce.com/blog/2013/02/27/global-bi-software-revenue-reach- 13-8b-2013-gartner-retail-pi-analytics (25.10.2015)

(35)

30

IoT in 2015: Pioneers are born and analytics go mainstream. http://insights.wi- red.com/profiles/blogs/iot-in-2015-pioneers-are-born-and-analytics-go-mainstream

http://www.techrepublic.com/article/ask-the-crunchy-big-data-questions-that-lead-to- breakthrough-analytics/ (25.10.2015)

Jang, H.-J., Sim, J., Lee, Y., & Kwon, O. (2013): Deep sentiment analysis: Mining the causality between personality-value-attitude for analyzing business ads in social me- dia. Expert Systems with Applications, Volume 40, Issue 18, 15 December 2013, Pages 7492-7503

Kognitiivista sosiaalipsykologiaa. http://www.uta.fi/avoinyliopisto/arkisto/sosiaali- psykologia/kognitiivisuus.html#Asenne (Luettu 08.10.2015) Tampereen yliopisto

Kotsiantis, S., Tselios, N., Filippidi, A., Komis, V.(2013): Using learning analytics to identify successful learners in a blended learning course. Department of Mathematics, University of Patras, 26500 Rio, Patras, Greece. Department of Educational Sciences and Early Childhood Education, ICT in Education Group, University of Patras, 26500 Rio, Patras, Greece

Li, Q.(2015): Examining the accuracy of sentiment analysis by brand monitoring com- panies. 5th IBA Bachelor Thesis Conference, July 2 nd, 2015, Enschede, The Nether- lands.

Maciejewski, R., Hafen, R., Rudolph, S., Larew, S., Mitchell., M, Cleveland, W., Ebert, D. (2011): Forecasting hotspots - A predictive analytics approach. IEEE Trans- actions on Visualization and Computer Graphics. Volume 17, Issue 4, pages: 440-453, Manyika, J. Chui, M., Brown, B., Bughin, J., Dobbs. R., Roxburgh, C., Hung Byers, A., (2011): Big data: The next frontier for innovation, competition, and productuctiv- ity. Mckinsey Global Institute

Marr, B. (2010): Key Performance Indicators: The 75 measures every manager needs to know. Financial Times

(36)

31

Nikkari, K. (2015): Intuition merkitys rekrytointipäätöksissä. Pro gradu -tutkielma, Johtamiskorkeakoulu, Tampereen yliopisto

Noether, E. (1990): Introduction to statistics. The Nonparametric way. Springer Sci- ence + Business Media, LLC

Okoli, C., Schabram, K. (2010): A guide to conducting a systematic literature review of information systems research. Sprouts: Working paper on information systems, vol.10

Pajunen, M. (2010): Projektien välisen oppimisen kehittäminen ohjelmistoyrityksessä.

Diplomityö. Tietojohtamisen koulutusohjelma, Tampereen Teknillinen yliopisto Saarelainen, MM., Hotti, V.(2014): Different Notions Lead Difficulties of Making In- formation System Modernization Decisions. The Fourth International Conference on Digital Information Processing and Communications (ICDIPC2014) - Malaysia Shmueli, G., Koppius, O. (2010): Predictive analytics in information systems re- search. Robert H. Smith School Research Paper No. RHS 06-138

Towards wise decision-making. http://www.cognitivecybernetics.com/Primer- FoU.html (Luettu 09.10.2015) Cognitivecybernetics.com

Van Barneveld, A., Arnold, K., Campbell, J. (2012): Analytics in Higher Education:

Establishing a Common Language. ELI Paper 1: 2012

Wu, J., Coggeshall, S. (2012): Foundatations of predictive analytics. CRC Press, Tay- lor & Francis Group

Myers, D. G. (2012): Social psychology (11th edition.) Boston, MA: McGraw-Hill.

Vartiainen, M. (2014): Liiketoimintatiedon hallinta ja analytiikka - esimerkkinä ener- giayhtiö. Pro gradu -tutkielma. Tietojenkäsittelytieteen laitos, Itä-Suomen yliopisto

Waller, M., Fawcett, S. (2013): Data science, predictive analytics, and big data: A revolution that will transform supply chain design and management. Journal of Busi- ness Logistics. Volume 34, Issue 2, pages 77-84, June 2013

(37)

32

Zins, C. (2007): Conceptual approaches for defining data, information and knowledge Journal of the American society for information science.

Viittaukset

LIITTYVÄT TIEDOSTOT

Kaupunginhallitus asettaa alkuvuodesta 2013 Kilpailukyky ja elinkeinopoliittisen työryhmän (Kelpo-ryhmä), jonka tehtävänä on.. − tehdä esityksiä kaupungin

Vammaisuus pitäisi pyrkiä tuomaan enemmän esille, jotta sitä kohtaan olevia ennakkoluuloja ja pelkoja saataisiin rikottua. Eteva on hyvin tuomassa vammai- sia

Big data tarkoittaa kaikkea maailmassa saatavilla olevaa tietoa, jota voidaan jalostaa eteenpäin analysoimalla sitä. Sen avulla voidaan saada tietoa asiakkaiden asenteista,

Olisi todennäköistä, että ihmiset, joilla on myönteiset asenteet, esittäisivät myös korkeita mak- suhalukkuuksia.. Tässä tutkimuksessa näiden välillä ei kuitenkaan

Tutkittaessa sitä, mitä opettajaksi opiskelevat olettivat autismikirjon oppi- laan ajatelleen opettajasta, kun oppitunti oli mennyt todella hyvin ja todella huonosti,

Tyytyväisyyttä paransivat tämän tutkimuksen tulosten mukaan digitaalisen oppimisen joustavuus, helppous, rajoittamaton opiskelu sekä oppimisen tehokkuus, jotka

polttoaineista vapautuu energiaa, joka voidaan käyttää sitä kuluttaviin reaktioihin ja muihin työtä vaativiin tapahtumiin.. • Tässä merkityksessä energia on kyky

Vaikka hoitajien asenteet homoseksuaalisia ihmisiä kohtaan tässä tutkimuksessa olivat hyvät, tulee hoitajien asenteita tulevaisuudessakin tut- kia, koska asenteet homoseksuaalisia