• Ei tuloksia

TIETOVARASTOINTI JA BUSINESS INTELLIGENCE

N/A
N/A
Info
Lataa
Protected

Academic year: 2022

Jaa "TIETOVARASTOINTI JA BUSINESS INTELLIGENCE"

Copied!
62
0
0

Kokoteksti

(1)

VAASAN YLIOPISTO TEKNILLINEN TIEDEKUNTA

TIETOTEKNIIKKA

Jarkko Lehto

TIETOVARASTOINTI JA BUSINESS INTELLIGENCE

Tietotekniikan pro gradu –tutkielma

VAASA 2016

(2)

SISÄLLYSLUETTELO

LYHENTEET ... 4

KUVAT ... 5

TAULUKOT ... 6

1 JOHDANTO ... 9

2 TIETOVARASTOT ... 12

2.1 Tietovarastotyypit ... 13

2.2 Tietovarastoarkkitehtuurit ... 15

2.3 Tietokannat ... 17

2.4 Tietokannan rakenne ... 18

2.5 Tietovarastoprojekti ... 19

2.6 Tietovaraston palvelun tarjoajat ... 24

3 TIEDON MUOKKAAMINEN ... 26

3.1 ETL-prosessi ... 26

3.2 ETL-työkalut ... 27

3.3 Tiedon louhinta ... 28

3.4 Big Data ... 30

3.5 Metadata ... 31

3.6 Tietovarastoinnin apuvälineet ... 32

4 BUSINESS INTELLIGENCE ... 34

4.1 Business Intelligence pilvessä ... 36

4.2 Business Intelligence sovellukset ... 37

4.3 Päätöksenteon apuvälineet ... 38

4.4 Raportointi ... 41

4.5 Mittaristot ... 43

4.6 BI-projektin toteutus ... 44

(3)

5 LIIKETOIMINNAN SUORITUSKYVYN JOHTAMINEN ... 47

5.1 Liiketoiminnan suorituskyvyn johtamisen eroaminen BI:stä ... 47

5.2 Strategia ... 48

5.3 Strategisen johtamisen edut ... 50

5.4 Strategia tasot ... 54

5.5 Suorituskykymittarit ... 55

5.6 Balanced scorecard ... 56

5.7 Six Sigma ... 57

6 YHTEENVETO ... 59

LÄHDELUETTELO ... 61

(4)

LYHENTEET

BAM Business Activity Monitoring

BI BIaaS

Business Intelligence

Business Intelligence as a Service BSC

CRISP

Balanced Scorecard

Cross Industry Standard Process for Data Mining

DSS Decision Support System

DW Data Warehouse

EDW Enterprice Data Warehouse

EII Enterprice Information Integration

EIS Executive Information System

ETL Extract, Transform, Load

KPI LDP LOD

Key Performance Indicator Linked Data Platform Linked Open Data

MDM Master Data Management

OLAP Online Analytical Process

OLTP RTDW

Online Transaction Process Real Time Data Warehouse SQL

VDW

Structured Query Language Virtual Data Warehouse

(5)

KUVAT

Kuva 1. Tietovarastoon yhdenmukaistetaan eri tietolähteiden tietoja (Hovi, Hervonen &

Koistinen 2009: 23).

Kuva 2. Itsenäiset datamartit (Hovi ym. 2009:26).

Kuva 3. EDW-arkkitehtuuri (Hovi ym 2009: 27).

Kuva 4. Kolmitasoarkkitehtuuri (Turban ym.2011: 58).

Kuva 5. Web-pohjainen tietovarasto (Turban ym. 2011: 59).

Kuva 6. Tähtimalli (Hovi, Huotari & Lahdenmäki 2005: 136).

Kuva 7. Spiraalimalli (Hovi ym. 2009: 133).

Kuva 8. ETL-prosessi (Turban ym. 2011: 68).

Kuva 9. Tiedon louhinnan kuusi vaihetta (Turban ym. 2014: 207).

Kuva 10. Business Intelligence silmukka (Giovinazzo 2000: 2).

Kuva 11. Päätöksenteon järjestelmä (Turban ym. 2014: 85).

Kuva 12. OLAP-kuutio. Nolla ulottuvuutta (Hovi ym. 2009: 91).

Kuva 13. Ylempänä yksiulotteinen ja alempana kaksiulotteinen OLAP-taulu (Hovi ym.

2009: 91).

Kuva 14. Kolmiulotteinen OLAP-kuutio (Hovi 2009:92).

Kuva 15. Tietovarastonkehitys suunnitelma (Hovi ym. 2009: 180) Kuva 16. Strategisen suunnittelun tuomat edut (David ym:49).

Kuva 17. Strategiatasoista vastuussa olevat henkilöt (David ym. 2015: 137).

(6)

TAULUKOT

Taulukko 1. EDW ja Data Martti lähestymistapojen erot (Turban ym 2014:311).

Taulukko 2. Tietovarastotuotteiden palveluntarjoajat (Turban ym. 2014:310).

Taulukko 3. ETL-työkalut (Hovi ym. 2009: 60).

Taulukko 4. Metadata tyyppejä (Giovinazzo 2000: 44).

Taulukko 5. Business Intelligence-työkalut (Turban ym. 2011: 41).

Taulukko 6. Seitsemäntoista ohjetta tehokkaaseen strategiaan (David ym. 2015:52).

Taulukko 7. Strategiakartta ja tasapainotettu tuloskortti (Turban ym. 2014: 361).

(7)

TIIVISTELMÄ VAASAN YLIOPISTO Teknillinen tiedekunta

Tekijä: Jarkko Lehto

Tutkielman nimi: Tietovarastointi ja Business Intelligence

Ohjaajan nimi: Tero Vartiainen

Tutkinto: Kauppatieteiden maisteri

Oppiaine: Tietotekniikka

Opintojen aloitusvuosi: 2007

Tutkielman valmistumisvuosi: 2016 Sivumäärä: 62 TIIVISTELMÄ:

Tutkielmassa tutkitaan tietovarastoinnin ja Business Intelligencen tekniikoita ja käytän- töjä. Tutkimus suoritettiin kirjallisuustutkimuksena ja siinä perehdyttiin tietovarasto- tyyppeihin ja arkkitehtuureihin, tietokantoihin, ETL-työkaluihin sekä meta-dataan.

Tutkimuksessa tutkittiin myös Business Intelligenceä ja muita päätöksenteon apuväli- neitä sekä raportointia ja mittaristoja. Strategista johtamista esitellään myös lyhyesti, koska Business Intelligence ja siitä saadun tiedon perustella tehdään strategisia päätök- siä ja ohjataan yritystä menestykseen.

Tutkimukset osoittivat, että tietovarastointi ja Business Intelligence voidaan toteuttaa monella eri tavalla ja monessa eri mittakaavassa. Pienimmillään ratkaisut voidaan to- teuttaa pelkän excelin avulla ja laajimmillaan koko organisaation kattavalla tietovarasto ja Business Intelligence -ratkaisulla. Business Intelligence -ratkaisut toteutetaan yleen- sä yhdessä tietovaraston kanssa ja kustannussyistä molemmat ratkaisut ostetaan samal- ta valmistajalta tai toimittajalta. Business Intelligencen puuttumisesta on tänä päivänä yritykselle pelkästään haittaa ja hyvin toteutettuna se on yritykselle merkittävä kilpai- luetu. Parhaimmillaan Business Intelligence antaa yrityksen johdolle reaaliaikaista tie- toa päätöksenteon tueksi.

ASIASANAT: Data Warehousing, Business Intelligence, Tietovarastointi

(8)

ABSTRACT

UNIVERSITY OF VAASA Faculty of technology

Author: Jarkko Lehto

Topic of the Master’s Thesis: Data warehousing and Business Intelli- gence systems

Instructor: Tero Vartiainen

Degree: Master of Science in Economics and Bu- siness Administration

Major: Computer Science

Year of entering the University: 2007

Year of completing the Master’s Thesis: 2016 Pages: 62 ABSTRACT:

This study examines techniques and practices of data warehousing and business intel- ligence. Study was conducted as literature study and it familiarizes the types of data warehouses, architectures, databases, ETL-tools and meta-data. In the study was also included other decision support systems, reporting and reports. Strategic management was studied shortly in this study as well.

The studies showed that business intelligence can be implemented many different ways and many different scales. The smallest solution could be just Microsoft Excel report.

Largest scale of business intelligence is organization wide data warehouse and busi- ness intelligence system. Now a day’s business intelligence system is essential to all companies to succeed on the market. However, business intelligence does not guaran- tee success on the market. It gives the needed information to executives to make better strategic decisions.

KEYWORDS: Data Warehousing, Business Intelligence

(9)

1 JOHDANTO

Yritysten liiketoimintaympäristö muuttuu ja elää jatkuvasti. Ympäristön muuttuminen vaatii yritysten johdolta enemmän ja nopeampia päätöksiä pärjätäkseen markkinoilla.

Liiketoiminta ympäristön muuttuminen monimutkaisemmaksi antaa yritykselle mahdol- lisuuksia, mutta toisaalta aiheuttaa taas ongelmia (Turban, Sharda & Delen 2014: 5).

Päätöksen tekoa varten yrityksen johto tarvitsee tietoa menneestä, jotta voisi tehdä oi- keita ratkaisuja saadakseen yrityksen menestymään. Tietoa kerätään yritysten operatii- visista järjestelmistä ja tytäryhtiöiden järjestelmistä. Lisäksi kerätään ulkoista tietoa esimerkiksi kilpailijoista sekä kilpailuympäristöstä. Ilman tietovarastointia ja Business Intelligenceä sekä niiden tuomaa tiedon prosessointitehoa oikeita päätöksiä ei voitaisi tehdä riittävän nopeasti.

Tutkielmassa perehdytään tietovarastoinnin ja Business Intelligencen perusasioihin.

Tietovarastoista esitellään erilaiset tietovarastotyypit, -arkkitehtuurit sekä hieman tieto- kannan rakennetta. Koska operatiivisesta järjestelmästä ei voi suoraan tallentaa tietoa tietovarastoon, perehdytään myös tiedon muuntamiseen tietojärjestelmään sopivaksi.

Tiedon tallentamisen lisäksi tutkielmassa kerrotaan mitä metadata on ja miten sitä voi- daan hyödyntää tietovarastoissa.

Business Intelligence on varsin uusi käsite tiedon hyödyntämisessä. Tutkielmassa kerro- taan Business Intelligencen perusteet sekä hieman sen historiasta. Business Intelligen- cen ollessa kuitenkin laaja käsite sekä tulkittu hieman monikäsitteisesti, tutkielmassa perehdytään hieman muihinkin päätöksenteon apuvälineisiin. Raportointiin sekä mitta- ristoihin perehdytään myös hieman.

Tutkielmassa halutaan kuvata tietovarasto ja Business Intelligence tekniikoita ja käytän- töjä yleisellä tasolla, eli tässä tekstissä ei perehdytä tietovarasto tai Business Intelligen- cen käyttöönottoprojektin toteutukseen. Käyttöönottoprojekti vaatisi valitsemaan jonkin tietyn palveluntarjoajan järjestelmän ja kuvaamaan sitä. Pelkästään toisen prosessin ku- vaaminen yksityiskohtaisesti laajentaisi tutkimuksen laajuudeltaan huomattavan suurek- si. Tietovarasto- ja BI-projektien toteutuksesta kerrotaan kuitenkin yleisellä tasolla.

Tutkielma ei ole syvälle luotaava tutkimus mistään tietystä tietovarasto- tai Business Intelligence ratkaisusta, vaan on aihetta yleisesti esittelevä kirjallisuustutkimus. Tut- kielmassa mainitaan myös yleisimmät tietovarastointi ja Business Intelligence -

(10)

ratkaisuja tarjoavat yritykset. Tutkimuksessa ei ole perehdytty mihinkään yksittäiseen ratkaisuja tarjoavaan työkaluun eikä työkalujen tai eri valmistajien tarjoamiin ratkaisu- jen eroihin.

Business Intelligencen avulla tehdään myös strategisia päätöksiä. Tutkielmassa pereh- dytään liiketoiminnan suorituskyvyn johtamiseen ja sitä kautta yrityksen strategisiin päätöksiin. Strategiaa ei avata syvällisesti, tutkielmassa lähinnä kuvataan miten strategi- sia päätöksiä tehdään Business Intelligencen avulla.

Tutkimus tehdään kirjallisuuskatsauksena. Tutkimuksessa perehdytään tietovarastointiin ja Business Intelligenceen liittyvään kirjallisuuteen ja artikkeleihin. Aineistosta kooste- taan kattava kuvaus tietovarastoinnista ja siihen liittyvistä asioista. Näitä asioita ovat mm. tietokannat, järjestelmien arkkitehtuurit sekä käytettävät ohjelmistot. Tutkimukses- sa pyritään vastaamaan kysymyksiin: mitä on tietovarastointi ja liiketoiminta tiedon hallinta? Miten tietoa varastoidaan ja miten sitä voidaan käyttää hyödyksi? Tutkimuk- sessa selvitetään millaisia järjestelmiä toimiva tietovarasto ja BI-järjestelmä tarvitsee.

Teoksessa käsitellään myös muita päätöksenteon apuvälineitä ja niiden luokitteluita.

Kirjallisuuskatsaus on metodi ja tutkimustekniikka, joka tutkii tutkittua tutkimusta. Kir- jallisuuskatsauksella on useita tavoitteita, se voi vahvistaa olemassa olevaa teoriaa tai luoda uutta. Se voi arvioida teoriaa ja tarkistaa ovatko tiedot totuudenmukaisia ja luotet- tavia. Se voi myös rakentaa kokonaiskuvaa tutkimuksen kohteesta. Tämä tutkimus to- teutettiin kuvailevana kirjallisuuskatsauksena. Kuvailevalle kirjallisuuskatsaukselle tyy- pillistä on laajat aineistot eikä aineistoa rajata metodisten sääntöjen perusteella. Narra- tiivinen kirjallisuuskatsaus kuvailee tutkittavan aiheen historiaa ja kehitystä sekä antaa laajan kuvan käsiteltävästä aiheesta. Se yhdistelee tutkittua tietoa eri lähteistä ja esittää sen järkevässä ja helppolukuisessa muodossa. Tässä tutkimuksessa kerätään tietoa Tie- tovarastoinnista, Business Intelligencestä sekä johtamisesta ja esitellään se lukijalle sel- keästi johdonmukaisessa järjestyksessä. (Eskelinen & Karsikas 2014: 89, Salminen 2011: 3-7)

Tutkimuskysymyksiä on useita, ensimmäisenä kysymyksenä on ”Mitä on tietovarastoin- ti?”. Toisena kysymyksenä on ”Mitä on Business Intelligence?”. Nämä kaksi ovat var- sinaisia tutkimuskysymyksiä, mutta tutkimuksessa pyritään myös vastaamaan kysymyk- seen miten tietovarastointi ja Business Intelligence liittyvät johtamiseen.

Tutkielma alkaa johdannolla, jonka jälkeen esitellään tietovarasto ja siihen liittyvät ark- kitehtuurit. Tietokannat ja niiden rakenne kuvataan tässä samassa yhteydessä. Tiedon

(11)

prosessointia ja siihen käytettäviä työkaluja esitellään luvussa kolme. Neljännessä lu- vussa perehdytään Business Intelligenceen sekä muihin päätöksenteon apuvälineisiin.

Myös raportointiin ja mittaristoihin perehdytään tässä luvussa. Viidennessä luvussa ker- rotaan suorituskyvyn johtamisesta. Tässä kappaleessa avataan johtamisen viitekehyksiä sekä kerrotaan niistä perusasiat.

(12)

2 TIETOVARASTOT

Tietovarasto (Data Warehouse, DW) on operatiivisesta järjestelmästä erillään oleva ym- päristö, johon on tallennettu haluttu tieto halutussa muodossa yrityksen hyödynnettä- väksi. Tietovarastoon ei tallenneta kaikkea mahdollista dataa, vaan sinne kerätään sel- lainen data, josta on yritykselle hyötyä.

Tietovarasto on tietokanta, joka on tehty avustamaan päätöksen tekoa. Tietovarasto on myös nykyisen ja menneen datan varasto. Tallennettu data on muokattu valmiiksi tiedon louhintaa, analysointia, kyselyitä ja raportointia varten. (Turban, Sharda, Delen & King 2011: 52.)

Tietovarastoon on koottu dataa yrityksen kaikista operatiivisista järjestelmistä, prosessi on kuvattu kuvassa 1.

Tietovaraston datasta voidaan tehdä erilaisia raportteja ja analyyseja rasittamatta yrityk- sen operatiivista järjestelmää. Yrityksellä voi olla myös yhtäaikaisesti käytössä useita operatiivisia järjestelmiä, joiden data on tallennettuna eri tietokantoihin. Operatiivisia järjestelmiä ovat mm. laskutus-, tilaustenkäsittely- ja toiminnanohjausjärjestelmä. Tie- Kuva 1. Tietovarastoon yhdenmukaistetaan eri tietolähteiden tietoja (Hovi, Hervonen &

Koistinen 2009: 23)

Tiedostot, taulukko- laskenta tiedostot

ETL - prosessi Ulkoiset

tiedot

Tietovarasto Operatiivisten

järjestelmien tietokannat

(13)

tokannat voivat olla rakenteeltaan hyvin erilaisia, joten dataa ei voida suoraan siirtää sellaisenaan tietovarastoon. Tiedon oikeellisuus tulee tarkistaa ja data täytyy muokata yhtenäiseen muotoon ennen sen siirtoa varsinaiseen tietovarastoon.

Operatiivisen tietokannan data muuttuu jatkuvasti. Esimerkiksi varastosaldo vaihtuu, kun tavara myydään. Tietovaraston tietokantaan taas jää kaikki merkinnät, mitä tieto- kantaan tallennetaan. Kun varastosaldo on muuttunut seuraavaan ajoon mennessä, niin uusi saldo tallennetaan, mutta vanha saldo jää myös tietokantaan. Näin nähdään varas- tosaldot eri ajankohtina.

2.1 Tietovarastotyypit

Tietovarastoja voi olla erilaisia riippuen yrityksen käyttötarpeesta. Pienempi tietovaras- to on nimeltään datamartti (Hovi ym. 2009: 24). Datamartti on yksinkertainen muoto tietovarastosta, joka keskittyy yhteen aihealueeseen esim. myynti, talous tai markki- nointi (kuva 2).

Datamartteja on kahta tyyppiä, riippuvainen ja riippumaton datamartti. Riippuvainen datamartti on koostettu tietovaraston datasta. Tietovarastoon tallennettu data on jo ker- taalleen tarkistettu ja muokattu oikeaan muotoon, joten tietomalli on johdonmukainen ja data on laadukasta. Yhtenäisestä tietomallista johtuen koko organisaation raportit ovat yhtenäisiä. Riippuvainen datamartti on kallis toteuttaa, koska se vaatii tietovaraston toimiakseen. (Turban ym. 2011: 53.)

Kuva 2. Itsenäiset datamartit (Hovi ym. 2009:26).

A

B Operatiiviset järjestelmät

Erillisiä data- martteja

(14)

Riippumattomat datamartit ovat muuten samanlaisia kuin riippuvaiset datamartit, mutta niiden tiedon lähteenä ei ole tietovarasto. Riippumattomiin datamartteihin kerätään usein tietoa vain yhdestä lähteestä, esim. operatiivisesta järjestelmästä. (Oracle 2013).

Riippumattomat datamartit ovat suhteellisen helppoja ja nopeita toteuttaa, joten niitä tarvitseva osasto yleensä toteuttaa ja ylläpitää niitä itse. Tästä johtuen yrityksessä voi olla useita samankaltaisia datamartteja. Mikäli datamartteihin haetaan tieto operatiivi- sesta tietokannasta, tiedonhaku voi hidastaa yrityksen operatiivisen järjestelmän toimin- taa.

Keskitetty tietovarasto (Enterprise Data Warehouse, EDW, kuva 3) kokoaa organisaati- on tiedot yhteen tai muutamaan isoon tietokantaan. Tietokanta pitää sisällään usean lii- ketoiminta-alueen tiedot yhdenmukaistettuna. (Hovi ym. 2009: 27.) Tietovarastot on yleensä tehty yrityksen IT-osaston toimesta. Keskitetty tietovarasto palvelee koko yri- tystä.

IT-osasto ylläpitää tietovarastoa ja tekee niistä valmiita summatauluja, datamartteja ja kuutioita. Loppukäyttäjät tekevät kyselyitä sitten valmiista ja helppokäyttöisistä data- marteista. Tietovarastosta muodostetut datamartit voivat pitää sisällään osaston ja järjes- telmien rajojen ulkopuolista dataa. Tietovarastoista tehdyt datamartit eivät myöskään rasita yrityksen operatiivisia järjestelmiä. EDW-arkkitehtuurista on olemassa myös mal-

EDW

Summataulut Operatiiviset

järjestelmät

Tietovarasto

Kuva 3. EDW-arkkitehtuuri (Hovi ym 2009: 27).

(15)

li, jossa ei käytetä datamartteja ja summatauluja. Tässä mallissa käyttäjät tekevät haut suoraan tietovaraston tietokannasta. Arkkitehtuurin etuna on se, että kaikki tieto on kaikkien käytettävissä. Tieto ei rajoitu valmiiden datamarttien tarjoamaan dataan.

Kolmantena arkkitehtuurimallina on yhdenmukaistetut riippumattomat datamartit. Mal- lissa datamartit rakennetaan tähtimallimenetelmällä yhteismitallisiksi, jolloin osa di- mensioista on yhdenmukaisia. Esimerkiksi tuote tai asiakas dimensiot esiintyvät useissa eri tähtimalleissa. (Hovi ym. 2009: 28, Turban ym. 2011: 62.) Riippumattomat data- martit ovat yksinkertaisia ja helppoja toteuttaa, joten ne sopivat pienempiin yrityksiin, joilla ei ole mahdollisuuksia panostaa keskitettyyn ratkaisuun. Datamarttien laajennetta- vuus on kuitenkin rajallista, joten niiden käyttö on aina suunniteltu tietylle kohderyh- mälle.

2.2 Tietovarastoarkkitehtuurit

Tietovarastoarkkitehtuurina voidaan käyttää useita perinteisiä tietojärjestelmäarkkiteh- tuureja. Useimmiten käytetään asiakas/palvelin tai n-tason arkkitehtuuria. Kolmi- tasoarkkitehtuurissa tietovarasto sijaitsee erillisellä palvelimella ja ohjelmat, joilla tietoa haetaan tietovarastosta sijaitsevat toisella palvelimella. Kolmitaso arkkitehtuuri on ku- vattu kuvassa 4.

Kuva 4. Kolmitasoarkkitehtuuri (Turban ym.2011:58).

Taso 1:

Työasema

Taso 2:

Sovelluspalvelin

Taso 3:

Tietovarasto

(16)

Asiakas/palvelin arkkitehtuurissa (kaksitasoarkkitehtuuri) päätöksenteko- ja Business Intelligence –sovellukset sijaitsevat samalla palvelimella tietovaraston kanssa. Kaksi- tasoarkkitehtuuri on edullisempi toteuttaa, koska siinä tarvitsee vähemmän laitteistoa.

Haittapuolena siinä voi olla suorituskykyongelmia, mikäli kyseessä on suuri tietovaras- to. (Turban ym. 2011: 62.)

Web-pohjainen tietovarastointi (kuva 5) voidaan toteuttaa joko kaksi- tai kolmitasoark- kitehtuuria hyväksikäyttäen. Kolmitasoarkkitehtuurissa web-selain ottaa yhteyden web- palvelimeen, joka taas pyytää sovelluspalvelinta noutamaan tarvittavan tiedon tietova- rastosta. Noudon jälkeen sovelluspalvelin palauttaa tiedot web-palvelimelle, joka näyt- tää ne selaimelle. Web-pohjainen tietovarasto on helppo pääsyinen, alustariippumaton ja edullinen toteuttaa.

Yhtenä tyyppinä mainittakoon vielä reaaliaikainen tietovarasto (Real Time Data Ware- house, RTDW). Reaaliaikainen tietovarasto sopii tilanteisiin, joissa tarvitaan reaaliai- kaista dataa päätöksenteon tueksi. Normaalin tietovaraston data ei pelkästään riitä tähän tarkoitukseen, koska se voi olla jo vanhentunutta. Tätä varten on kehitetty virtuaalinen tietovarasto (Virtual Data Warehouse, VDW). Virtuaaliseen tietovarastoon kerätään tietovarastosta historiallinen data sekä operatiivisista järjestelmistä reaaliaikainen data.

Web-selain Web-palvelin

Sovellus palvelin

Tietovarasto Internet/

Intranet/

Extranet

Web-sivut

Kuva 5. Web-pohjainen tietovarasto (Turban ym. 2011:59).

(17)

Loppukäyttäjälle virtuaalinen tietovarasto, joka siis yhdistää tietovaraston ja operatiivis- ten järjestelmien tiedot, näkyy yhtenäisenä raporttina, jossa on sekä historiallinen että reaaliaikainen data. Tällöin päättäjillä on käytössään tietovaraston tarjoama jalostettu data, sekä sen lisäksi operatiivisista järjestelmistä saatu reaaliaikainen tieto. (Farrah 2013)

2.3 Tietokannat

Yrityksellä voi olla useita erilaisia tietokantoja käytössään. Esimerkiksi fuusion yhtey- dessä toisella yhtiöllä on ollut Microsoftin tarjoama tietokanta ja toisella yrityksellä on ollut Oraclen tietokanta. Fuusion yhteydessä on kuitenkin päätetty jatkaa käyttäen kahta eri operatiivista järjestelmää ja siirtää uuden yhteisen järjestelmän käyttöönotto myö- hemmälle. Tällaisessa tilanteessa datan Business Intelligence-käyttö vaatii runsaasti it- osaston toimenpiteitä, jotta data saadaan muokattua yhtenäiseen muotoon raportteja varten.

Operatiiviset järjestelmät tarvitsevat nopean pääsyn tietokantoihin ja vaativat useita samanaikaisia yhteyksiä tietokantoihin. Operatiiviset järjestelmät on toteutettu tapahtu- mankäsittelyjärjestelmiksi, OnLine Transaction Processing Systems (OLTP) (Hovi ym.

2009: 22). Operatiivisen järjestelmän tietokannan tulee olla nopea ja palvella useita käyttäjiä samanaikaisesti, kun taas tietovarastotietokantaa ei päivitetä päiväsaikaan ol- lenkaan.

Tietovaraston tietokanta pitää sisällään datat useilta vuosilta ja se toimii ikään kuin or- ganisaation muistina ja mahdollistaa trendianalyysien teot (Hovi ym. 2009: 22). Tieto- varastotietokannan tulee olla rakenteeltaan selkeä, helppokäyttöinen ja ymmärrettävä.

Taulut ja sarakkeet tulee olla nimetty selkeästi. Tietokannasta tulee voida tehdä kyselyjä ilman varsinaista ohjelmointia (Hovi, Huotari & Lahdenmäki 2005).

Tietovarastojen tietokantoina käytetään yleisimmin suurimpien valmistajien kaupallisia tietokantoja, kuten IBM:n DB2, Oracle ja Microsoftin SQL Server. Nämä tietokannat on alun perin suunniteltu operatiivisiin järjestelmiin ja ne sisältävät raskaita, ajantasaista tapahtumankäsittelyä tukevia ominaisuuksia. Myöhemmin tietokannan hallintajärjes- telmiin on lisätty ETL- ja raportointiominaisuuksia. (Hovi ym. 2009: 62.)

(18)

2.4 Tietokannan rakenne

Tietovaraston tietokanta on suunniteltava selkeäksi rakenteeltaan, jotta sitä on helppo käyttää. Taulujen ja tietojen nimeämisessä on pyrittävä selkeyteen, koska tietovaraston loppukäyttäjinä on myös IT-osaston ulkopuolisia henkilöitä. (Hovi ym. 2009:36.)

Tähtimallia (Star Schema) on usein käytetty moniulotteisen ja numeerisen tiedon tallen- tamiseen. Tähtimallissa on yksi faktataulu ja useita dimensiotauluja. Faktataulu on nor- malisoitu ja dimensiotaulut ovat denormalisoidussa muodossa. Kuvassa 6 on kuvattu tähtimalli, jossa faktataulu MYYNTI on normalisoitu. Mikäli dimensiotaulutkin norma- lisoitaisiin, malli muuttuisi lumihiutalemalliksi. (Hovi ym. 2005: 136.)

Tietovaraston suunnittelussa on kiinnitettävä erityistä huomiota indeksointiin. Operatii- visista järjestelmistä saatavat luonnolliset perusavaimet tulee korvata surrogaateilla, eli keinotekoisilla avaimilla. Tämä on tärkeää, koska operatiivisen järjestelmän perusavai- met voivat olla esimerkiksi tuotenumeroita, jotka voidaan ottaa uudelleenkäyttöön myöhemmin. Saman avaimen käyttö kahdessa eri tuotteessa sotkisi tietovarastosta tuo- tetut raportit. Surrogaattina tulisi käyttää juoksevaa numerointia. Globaalien yksilöllisi- en avaimien käyttöä tulisi välttää, koska ne vievät enemmän levytilaa ja ovat hitaampia käyttää. (Hovi ym. 2005:136.)

PVM pvm_id pvm viikonpaiva kuukausi vuosi loma-aika

MYYNTI

pvm_id tuote_id liike_id myynti maara kulut

TUOTE

tuote_id tuote_nro nimi tuoteryhma tuoteryhmanimi yksikko

LIIKE

liike_id liikenro liikenimi lahiosoite laani postinro

postitoimipaikka piiri

piirinimi

Kuva 6. Tähtimalli (Hovi ym. 2005: 136).

(19)

Kuvan 6 mukaisessa tähtimallin tietokannassa tulee eniten rivejä ”MYYNTI”-tauluun.

Dimensiotauluihin tulee harvemmin lisäyksiä. Esimerkiksi myyntitapahtumia lisätään useita kertoja päivässä, mutta asiakkaita lisätään silloin tällöin. Näitä dimensiotauluja kutsutaan hitaasti muuttuviksi dimensioiksi. Tietovarastoa suunniteltaessa on tehtävä päätös, halutaanko historia tiedot pitää sellaisenaan vai muutetaanko historiaa. Esimer- kiksi kun tuotenumero käytetään uudelleen ja tietovaraston dimensiotauluihin haetaan data Master data taulusta, niin silloin tuotteen historiatiedot muuttuvat. Tai itse asiassa uudella tuotteella on jo valmiiksi myyntiä. Dimensioiden muutoksen hallintaan on mo- nia tapoja, mutta yleisimmin käytetään kolmea Ralph Kimballin tapaa:

1. Kirjoitetaan muutokset vanhan tiedon päälle.

2. Tehdään uusi tietue muuttuneilla tiedoilla ja jätetään vanha.

3. Dimensiotauluun laitetaan uusi sarake, johon tulee uusi arvo.

Mikäli dimensiotauluihin tulee muutoksia, summataulut on luotava muuttuneilta osin uudestaan. (Hovi ym. 2005:140.)

Tietovarastoa suunniteltaessa on myös tärkeää ottaa huomioon tietokantojen fyysinen suunnittelu sekä levytilan tarpeen arviointi. Fyysisessä suunnittelussa on otettava huo- mioon tietokantasivun koon ja tyhjän tilan määrittäminen, taulujen ja indeksien ositus, taulujen tilavaraus, sijoittelurajoitukset sekä mahdolliset tietokantapuskuriallasrajoituk- set. Suunnittelijan on tunnettava hyvin tietokannanhallintajärjestelmä, jotta ominaisuu- det saadaan määriteltyä huolellisesti. (Hovi ym. 2005: 142.)

2.5 Tietovarastoprojekti

Tietovarastoprojektin toteuttamiseen pätevät samat mallit ja menetelmät kuin operatiivi- sen järjestelmän toteuttamiseen. Tietovarastoprojekteissa, kuten muissakin it- projekteissa , tulee muutoksia kesken prosessin. Tämän takia tietovarasto tulisi rakentaa iteraatiota hyväksikäyttäen. Tietovaraston suunnittelussa tulee huomioida käytettävissä olevat operatiiviset järjestelmät sekä tiedon laatu, joka niistä halutaan tuoda tietovaras- toon. (Hovi ym. 2009: 130.)

Tietovaraston kehittämisessä on syytä käyttää menetelmiä, joilla saadaan nopeasti tu- loksia. Hyväksi todettuja malleja ovat inkrementaalinen rakentaminen sekä spiraalimal- li. Ensin mainitussa mallissa tietovarastoa rakennetaan inkrementti kerrallaan, esim.

(20)

ensin taloustiedot, toiseksi myyntitiedot jne. Ensimmäisen inkrementin rakentamien on erityisen tärkeää, koska tässä vaiheessa testataan käytetyt menetelmät ja välineet.

Kun menetelmät ja välineet on todettu toimiviksi, voidaan seuraavat inkrementit toteut- taa nopeammin. Inkrementaalimalli on kuin palapeli: jokaisen inkrementin on sovittava toistensa kanssa yhteen. (Hovi ym. 2009: 132.)

Spiraalimallissa (kuva 7) ei aseteta lopullisia tavoitteita projektin alkuvaiheessa, vaan

rakennetaan tietovaraston ensimmäinen versio nopeasti. Ensimmäistä versiota kommen- toidaan ja siihen esitetään parannusehdotuksia, jotka toteutetaan spiraalimallin seuraa- valla kierroksella. Uusia kierroksia voidaan aloittaa myös ennen edellisen kierroksen valmistumista, jolloin saadaan nopeutettua tietovaraston valmistumista. (Hovi ym.

2009: 132.)

Inkrementaalista rakentamista kutsutaan myös Data Martti lähestymistavaksi ja tätä lähestytään alhaalta-ylös mallin mukaan. Tässä prosessissa tietovarasto rakennetaan Data Martti kerrallaan. Spiraalimallia kutsutaan EDW lähestymistavaksi, jota lähesty- tään ylhäältä-alas mallin mukaan. Tässä tapauksessa rakennetaan ensin organisaation

Määritys Vaatimukset

Käyttöönotto

Testaus

Toteutus

Kuva 7. Spiraalimalli (Hovi ym. 2009: 133).

(21)

kattava tietovarasto. Taulukossa 1 on kuvattu inkrementaali ja EDW lähestymistapojen erot. (Turban ym. 2014, s311-312)

Taulukko 1. EDW ja Data Martti lähestymistapojen erot (Turban ym. 2014: 311).

Panostus Data Martti lähestymistapa EDW lähestymistapa

Laajuus Yksi kohdealue Useita kohdealueita

Kesto Kuukausia Vuosia

Kustannukset $10 000 - $100 000+ $1 000 000+

Haastavuus Pieni tai keskisuuri Suuri Tiedon jaettavuus Liiketoiminta-alueen laajui-

nen

Organisaation laajuinen

Tietolähteet Joitain ulkoisia järjestelmiä Useita operatiivisia ja ulkoisia läh- teitä

Koko Megatavuista useihin giga tavuihin

Gigatavuista petatavuihin Tiedon muunnok-

set

Lähiaikainen ja historiallinen data

Historiallinen data Päivitys tiheys Tunneittain, päivittäin, vii-

koittain

Viikoittain tai kuukausittain Laitteisto Työasemat ja osaston palve-

limet

Organisaation palvelimet ja main- frame koneet

Käyttöjärjestelmät Windows ja Linux Unix, Z/OS, OS/390 Tietokannat Työryhmä tai tavalliset tieto-

kantapalvelimet

Organisaation tietokantapalvelimet Yhtäaikaisia käyt-

täjiä

Kymmeniä Sadoista tuhansiin

Käyttäjätyypit Liiketoiminta analyytikot ja päälliköt

Organisaation analyytikot ja johta- jat

Liiketoiminta tarkoitus

Aktiviteettien optimointi lii- ketoiminta-alueella

Toimintojen välinen optimointi ja päätöksen teko

(22)

Tietovarastoprojekti on suuri panostus, joka täytyy suunnitella ja toteuttaa huolellisesti.

Tietovarastoprojektin onnistuminen vaatii, että projektista on todellista hyötyä yrityksel- le. Projektilla tulee olla omistaja ja taho, joka haluaa projektin onnistuvan. Projektin laajuus tulee rajata tarkasti ja on mietittävä mitkä liiketoiminta-alueet otetaan mukaan projektiin sekä mistä operatiivisista järjestelmistä tietoa tuodaan. Projektista saatujen hyötyjen tulee olla myös mitattavissa, jolloin projektin jälkeen voidaan selvittää miten projekti on onnistunut. Tietovarastoprojektin toteuttamisessa kannattaa hyödyntää jo aiemmin todettuja parhaita käytäntöjä, joita ovat:

- Projektin tulee sopia strategiaan ja liiketoimintatavoitteisiin - Projektilla täytyy olla johtajien, päälliköiden ja käyttäjien tuki - Tietovarasto tulee rakentaa käyttäen inkrementaalimallia - Projektin / tekijöiden täytyy olla sopeutuvaisia

- Projektia tulee johtaa sekä IT:n että liiketoiminnan puolelta - Tilaaja – toimittajasuhde täytyy olla selvä

- Käytä vain puhdistettua ja laadukasta dataa - Älä unohda koulutusta

Tietovarastoprojektissa on paljon riskejä. Näitä samoja riskejä on myös muissa IT- projekteissa, mutta tietovarastointiprojektin riskeihin täytyy suhtautua vakavammin, koska tietovarastoprojektit ovat laajoja ja kalliita. (Turban ym. 2014: 314-316, Hovi ym.

2009: 133.)

Onnistuneen tietovarastoprojektin toteutuksessa kannattaa harkita seuraavia asioita:

- Älä aloita väärän rahoittajan kanssa. Tarvitset johtotason tuen ja rahoituksen, jolla on vaikutusvaltaa tarvittaviin resursseihin. Tarvitset myös johtotason pro- jektin vetäjän, joka on ansainnut muiden johtajien kunnioituksen ja jolla on terve epäilys tietotekniikka kohtaan. Tarvitse myös IT-päällikön tukemaan projektia.

- Asetat tavoitteita, joita et voi saavuttaa. Jokaisessa tietovarastoprojektissa on kaksi vaihetta: myyntivaihe, jossa markkinoit projektin tuomia etuja ja toisessa vaiheessa taistelet saavuttaaksesi tavoitteet, jotka asetit vaiheessa 1.

- Annat vääriä lupauksia projektista. Älä väitä, että tietovarastoprojekti auttaa johtajia tekemään parempia päätöksiä. Tietovarasto tarjoaa tarvittavan tiedon, jotta johtajat voivat tehdä parempia päätöksiä.

(23)

- Täytät tietovaraston tiedolla vain siksi kun sitä on saatavilla. Tietovarasto ei ole kaatopaikka, kerää vain sellaista dataa, jota tarvitaan.

- Uskot, että tietovaraston tietokanta on rakenteeltaan samanlainen kuin operatiivisen järjestelmän tietokanta. Yleensä se ei ole. Operatiivisen järjes- telmän tietokanta on yleensä normalisoitu relaatiotietokanta, kun taas tietovaras- ton tietokanta ei ole normalisoitu ja on moniulotteinen.

- Valitset tietovarastopäällikön, joka on enemmän teknologia orientoitunut kuin käyttäjä orientoitunut. Tietovaraston päätarkoitus on toimittaa liiketoi- minnalle heidän tarvitsemaa tietoa. Tietovarastoa ei tule rakentaa vain teknolo- gian vuoksi.

- Keskityt vain perinteiseen sisäiseen dataan ja unohdat ulkoisen datan mer- kityksen. Dataa saadaan monessa muodossa myös yrityksen ulkopuolelta. Datan tulee olla oikeiden ihmisten saatavilla oikeaan aikaan oikeassa muodossa.

- Toimitat päällekkäistä data sekavin määrittelyin. Datan putsaaminen on erit- täin tärkeä prosessi tietovarastoinnissa. Se sisältää tiedon muokkaamisen oike- aan muotoon sekä päällekkäisen datan poiston.

- Uskot lupauksiin suorituskyvystä. Tietovarastot vaativat yleensä enemmän kapasiteettia ja nopeutta kun on budjetoitu.

- Luulet, että ongelmat ovat ohi kun tietovarasto on valmis ja käynnissä. Tie- tovarasto- ja Business Intelligense projektit ovat jatkuvia prosesseja. Tietoa täy- tyy jatkuvasti lisätä tai muuttaa. Myös uusia analytiikka työkaluja täytyy mah- dollisesti ottaa käyttöön projektin jälkeen.

- Keskityt ad hoc tiedon louhintaan ja säännöllisiin raportteihin hälytysten sijaan. Tiedon luonnollinen kulku tietovarastossa on:

1. Tiedon poiminta operatiivisista järjestelmistä, tiedon puhdistaminen ja syöttäminen tietovarastoon

2. Tukea ad hoc raportteja kunnes opit mitä ihmiset haluavat 3. Muokkaat ad hoc raporteista säännöllisesti ajastettuja raportteja

(24)

Tämä ei kuitenkaan ole optimiratkaisu. Johtajat ja päälliköt ovat usein kiireisiä ja tarvitsevat aikaa lukeakseen raportteja. Hälytysjärjestelmät ovat parempi rat- kaisu kuin ajastetut raportit. Hälytysjärjestelmä tarkkailee dataa ja lähettää tar- vittaessa hälytyksen avainhenkilöille mikäli datassa tapahtuu ennalta määritelty kriittinen muutos.

Useissa yrityksissä tietovarastoprojekti onnistuu vain mikäli heillä on vahva keskijoh- don tuki projektin toteutukselle. Tämä sama sääntö pätee myös muihin IT-projekteihin, mutta on erityisen tärkeä tietovarastoprojekteissa. (Turban ym. 2014:317-319)

Tiedon mallinnus ja käyttöoikeuksien rajaaminen on myös kriittinen tekijä projektin onnistumiselle. Tiedon mallinnuksessa on tärkeää, että juuri kyseisen osaston asiantunti- jat ovat mukana määrittelemässä mitä tietoa kerätään ja missä muodossa se tallennetaan tietovarastoon. Tässä myös määritellään kenellä on oikeus päästä käsiksi dataan sen jälkeen kun se on tallennettu tietovarastoon.

2.6 Tietovaraston palvelun tarjoajat

Tietovarastoja on tarjolla useilta toimittajilta. Tietovarastoja vertailtaessa tulee ottaa huomioon palveluntarjoajan taloudellinen tilanne, linkitykset toiminnanohjausjärjestel- miin, konsulttien saatavuus, markkinaosuus, toimialakokemus ja kumppanuudet. Tieto- varastotuotteita on kolmea tyyppiä, ensimmäisen tyyppisissä on toiminnot tiedon pai- kannukseen, lataamiseen, muokkaamiseen, puhdistamiseen sekä siirtämiseen ja lataami- seen tietovarastoon. Toinen tyyppi on sovellukset, jotka tallentavat ja hallinnoivat tieto- varaston tietoa ja metatietoa. Kolmannen tyyppiset tuotteet tarjoavat loppukäyttäjälle työkalut tietovaraston tiedon analysointiin. Taulukossa 2 on listattu tietovarastotuottei- den palveluntarjoajat.

(25)

Taulukko 2. Tietovarastotuotteiden palveluntarjoajat. (Turban ym. 2014:310) Palvelun tarjoaja Tuotteen ominaisuudet

Computer Associates Kattava kokoelma tietovarastotyökaluja ja tuotteita

DataMirror Tietokannan hallinta ja suorituskyky työ-

kaluja

Data Advantage Group Metadata ohjelmisto

Dell Tietokanta palvelimia

Embarcadero Tietokannan hallinta ja suorituskyky työ-

kaluja

Business Objects Tiedon puhdistus (cleansing) työkalu

Harte-Hanks Asiakkuuden hallinta tuotteita ja palveluja

HP Tietokantapalvelimia

Hummingbird Ltd. (OpenText Connectivi- ty Solutions)

Tietokannan hakukone ja tietovaraston tutkimus sovellus

Hyperion Solutions Kattava kokoelma tietovarastotyökaluja ja tuotteita

IBM Tietokanta työkaluja, tuotteita ja sovelluk-

sia

Informatica Tietokannan hallinta ja suorituskyky työ-

kaluja

Microsoft Tietokantatyökaluja ja tuotteita

Oracle Tietokanta, ERP ja CRM työkaluja, tuot-

teita ja sovelluksia

SAS Institute Tietokantatyökaluja, tuotteita ja sovelluk- sia

Siemens Tietokanta palvelimia

SyBase Kattava kokoelma tietovarastotyökaluja ja

tuotteita

TeraData Tietokantatyökaluja, tuotteita ja sovelluk-

sia

(26)

3 TIEDON MUOKKAAMINEN

Operatiivisista järjestelmistä haetaan yleensä data ajastetusti yöaikaan, jolloin se ei rasi- ta yrityksen kriittisiä järjestelmiä. Datan hakua kutsutaan ETL-prosessiksi, Extract - Transform – Load eli poiminta, muokkaus ja lataus (Hovi ym. 2009: 23). Poiminta (Ext- ract) vaiheessa data luetaan yhdestä tai useammasta tietokannasta. Poiminnan jälkeen data muokataan (Transform) haluttuun muotoon ja ladataan (Load) tietovarastoon. Nä- mä kolme vaihetta on integroitu yhteen ohjelmaan, joka hakee datan yhdestä tai use- ammasta tietokannasta ja siirtää ne tietovaraston tietokantaan. ETL-prosessi vie aikaa, joten reaaliaikaisessa tietovarastossa ei ole mahdollista tarkistaa, integroida, jalostaa eikä summata tietoja (Hovi ym. 2009: 30).

3.1 ETL-prosessi

Datan prosessoinnissa tulee ottaa huomioon erityyppiset muuttujat. Eri tietokantoihin voidaan tallentaa tietoa eri tavalla, mutta tietovaraston tietokantaan vietäessä data pitää muuttaa samanmuotoiseksi. Esimerkiksi ”ei” voi olla ”0”, ”No” tai ”n” ja ”kyllä” voi olla ”1”, ”y” tai ”Yes”. Myös kategoriset muuttujat ovat ongelmallisia ja useimmiten niitä ei voi käyttää sellaisenaan tietovarasto ratkaisuissa. Kategoriset muuttujat tulee muuttaa sarjaksi ”dummy” -muuttujia. Esimerkiksi muuttuja, joka voi saada arvot

”opiskelija”, ”työtön”, ”työssäkäyvä” tai ”eläkkeellä” muutetaan neljäksi eri muuttujak- si:

Opiskelija – Kyllä / Ei Työtön – Kyllä / Ei Työssä käyvä – Kyllä / Ei Eläkkeellä – Kyllä / Ei

Näistäkin muuttujista voidaan jättää yksi muuttuja käyttämättä, koska mikäli muuttujis- ta tiedetään kolme, niin silloin tiedetään neljäskin muuttuja. Eli jos henkilö ei ole opis- kelija, työtön tai työssä käyvä niin silloin hänen on oltava eläkkeellä (Shmueli, Patel &

Bruce 2010: s. 19).

ETL-prosessi (kuva 8) voidaan tehdä joko työntö- tai vetoperiaatteella. Työntöperiaat- teella tiedot poimitaan operatiivisesta järjestelmästä, muokataan oikeaan muotoon ja kirjoitetaan tiedostoihin. Tämän jälkeen tietoja muokataan vielä ennen kuin ne siirretään varsinaiseen tietovarastoon. Vetoperiaatteella toimiva ETL-prosessi lukee tiedot suoraan

(27)

operatiivisen järjestelmän tietokannasta. Tämä toteutus on yksinkertaisempi toteuttaa ja voi olla jopa joustavampikin kuin työntömenetelmä. Vetoperiaatteeseen liittyy kuitenkin riskejä. Operatiivisen tietokannan päivitys voi olla kesken lukuhetkellä, jolloin tietova- rastoon siirtyy väärää dataa tai jos operatiivinen järjestelmä vaihtuu, joudutaan imple- mentoimaan koko ETL-prosessi uudelleen. (Hovi ym. 2009:61.)

3.2 ETL-työkalut

Datan prosessoimiseen operatiivisesta tietokannasta tietovarastoon voidaan tehdä erilli- sellä ETL-työkalulla tai tietokantatoimittajan toimittamalla työkalulla. Taulukossa 3 on listattu ETL-työkaluja ja niiden tarjoajia.

Yleensä tietovaraston tietokantatoimittaja toimittaa myös ETL-työkalun kustannus syis- tä. Erillisen työkalun ostaminen eri valmistajalta vaatisi ylimääräisten kustannusten li- säksi vielä IT-osaston konfiguroinnin. Kaupallisten ohjelmistojen lisäksi on tarjolla joi- tain Open Source –tuotteita, kuten Talend ja Pentaho. Useimmiten yritykset päätyvät vakiintuneisiin toimittajiin joilta voi ostaa koko tietovaraston ja jatkuvan tuen sen yllä- pitoon. (Hovi ym. 2009:61.)

Sovellus

Perinteiset järjestelmät

Muut sisäi- set sovel-

lukset

Poiminta Muokkaus Puhdistus Lataus

Väliaikainen tietolähde

Tietovarasto

Data martti

Kuva 8. ETL-prosessi (Turban ym. 2011: 68).

(28)

Taulukko 3. ETL-työkalut (Hovi ym. 2009: 60).

Tietovarasto ETL-työkalu

Microsoft SQL Server SQL Server Integration Services (SSIS)

Oracle Oracle Warehouse Builder (OWB)

Oracle Data Integrator

IBM DB2 Data Stage

IBM Cognos Data Manager

SAP Business Objects Data Integrator

ETL-työkalujen tarkoituksena on vähentää, tiedon siirtämiseen operatiivisesta järjestel- mästä tietovarastoon, tarvittavaa ohjelmoinnin määrää. Työkalut tarjoavat graafisen käyttöliittymän sekä osaavat hakea tiedon erilaisista tietokannoista. Työkaluissa on myös ominaisuudet tiedon tyyppimuunnoksille, yhdistelylle sekä tuplarivien poistoon.

ETL-prosessi voidaan käynnistää joko ajastetusti tai herätepohjaisesti. Nykyään käyte- tään myös jatkuvaa latausta. Joihinkin ETL-tuotteisiin on lisätty profilointi ja monito- rointi ominaisuuksia, jotka tarkkailevat tiedon laatuun liittyviä ominaisuuksia. ETL- työkaluissa on myös ominaisuus, jolla voidaan korjata virheitä tiedossa ja muokata raa- ka-dataa loppukäyttäjille valmiiseen muotoon. (Hovi ym. 2009:61, Xavier & Moreira 2013)

3.3 Tiedon louhinta

Tiedon louhinta (Data Mining) on prosessi, joka käyttää tilastollisia, matemaattisia ja tekoälyä tekniikoita kerätäkseen tarvittavan tiedon suurista datamassoista. Hakuehdot, joilla tietoa kerätään voivat olla liiketoimintasääntöjä, yhtäläisyyksiä, korrelaatioita, trendejä tai ennusteita. Tiedon louhinta on määritelty seuraavasti: epätriviaali prosessi, jolla tunnistetaan validia, uutta, mahdollisesti hyödyllistä ja täysin ymmärrettäviä raken- teita(toistuvia merkkijonoja) tietokannassa. Tässä määrittelyssä avainsanat tarkoittavat:

- Prosessi - tiedon louhinta on sisältää useita iteraatioita

- Epätriviaali – joitain koe-tyyppisiä tai pääteltyjä hakuja joudutaan käyttämään - Validi – löydetyt tiedot ovat totuudenmukaisia riittävällä varmuudella

(29)

- Uusi – löydetyt tiedot eivät ole entuudestaan tunnettuja

- Mahdollisesti hyödyllinen – löydetystä tiedosta tulee olla hyötyä käyttäjälle - Täysin ymmärrettävä – löydetyn tiedon tulee olla liiketoiminnalisesti järkevää (Turban ym. 2014 s.196)

Tiedon louhinta projekteissa käytetään yleensä standardoitua CRISP –prosessia (Cross- Industry Standard Process for Data Mining). Prosessissa on kuusi kohtaa, prosessi alkaa liiketoiminnan ymmärryksestä. Ennen kuin tiedon louhinta aloitetaan, tulee olla tiedossa mitä tietoa halutaan. Kohdassa kaksi tulee ymmärtää mitä tietoa ja mistä lähteistä tietoa halutaan kerätä.

Kolmantena tulee tiedon esivalmistelu, joka on CRISP -prosessin aikaa vievin vaihe.

Tietojen mukaan tämä vaihe vie koko prosessin kestosta noin 80%. Tiedon esivalmiste- lun ensimmäisessä vaiheessa kerätään relevantti data tunnistetuista tietolähteistä. Esi-

1. Liiketoimintaym- märrys

2. Tiedon ymmärrys

3. Tiedon valmistelu

4. Tietomallin raken- taminen

5. Testaus ja arviointi 6. Käyttöönotto Tietoläh-

teet

Kuva 9. Tiedon louhinnan kuusi vaihetta (Turban ym. 2014: 207).

(30)

valmistelun toisessa vaiheessa kerätty tieto puhdistetaan, tyhjät arvot täytetään sopivilla keskiarvoilla tai hylätään, ääriarvot poistetaan tai tasoitetaan muita arvoja vastaaviksi.

Kolmannessa vaiheessa data muutetaan paremmin prosessoitavaan muotoon. Tiedon esivalmistelun viimeisessä vaiheessa datasta hylätään ylimääräinen osa. Vaikkakin da- taa on hyvä olla paljon, myös liika data voi olla ongelma.

Prosessin neljännessä vaiheessa valitaan halutut mallinnus tekniikat liiketoiminnan tar- peita varten kolmesta pääkategorista: ennustaminen, yhdistäminen ja klusterointi. En- nustamisessa pyritään kertomaan tulevaisuudesta. Yhdistämisessä pyritään etsimään kiinnostavia yhteyksiä muuttujien välillä laajasta tietokannasta. Klusterointi taas jakaa asiakokonaisuudet segmentteihin niiden ominaisuuksien perustella. (Turban ym. 2014:

200)

Viidennessä vaiheessa edellisissä vaiheissa tehdyt mallit arvioidaan niiden tarkkuuden ja yleisluonteisuuden osalta. Kuudennessa eli viimeisessä vaiheessa on tiedon louhinnan käyttöönotto. Käyttöönotto voi yksinkertaisuudessaan olla pelkkä raportin luominen tai sitten monimutkainen toteutus koko organisaation laajuudessa toistettavasta tiedon lou- hinta prosessista. CRISPin lisäksi muita tiedon louhinta prosesseja ovat SAS:n kehittä- mä SEMMA. (Turban ym. 2014: 207-212)

3.4 Big Data

Big Datalla tarkoitetaan tietoa, joka on peräisin lukemattomista tietolähteistä tietover- kosta. Big Data pitää sisällään miljardeja ja jopa biljoonia tietueita tietoa. Koska tämä tieto on usein huonosti strukturoitua ja epätäydellistä sellaisenaan, sen muokkaamiseen, analysointiin ja tiedon esittämiseen tarvitaan teknologiaa ja työkaluja. Big Datan ainoa- na haasteena ei ole tiedon tallentaminen ja säilyttäminen, vaan sen käsittely on osoitta- nut suuremmaksi haasteeksi. Tätä varten ollaan kehittämässä yhteistä käsitteellistä tie- tomallia nimeltä Linked Data (LDP). (Bansal & Kageman 2015)

Linked Data kuvaa tavan julkaista tietoa verkkoon, jolloin tieto on koneellisesti luetta- vissa. Tämä tarkoittaa, että tieto on yksiselitteisesti määritelty ja se voi olla linkitetty ulkoisiin tietolähteisiin. Ja kun ulkoinen tietolähde on tuotettu samaa tapaa noudattaen, näistä yhdessä muodostuu massiivinen tietovarasto. Linked Open Data (LOD) yhteisö on tuottanut suuren tietovaraston tämän tekniikan avulla. (Bansal ym. 2015)

(31)

Myös W3C on standardoinut arkkitehtuurin ja tavan lukea ja kirjoittaa Linked Data tietoja:

- Käytä asioiden nimenä URIa

- Käytä http URIa, jotta ihmiset voivat etsiä asioita käyttäen nimeä

- Kun joku etsii URIa, tarjoa hyödyllistä tietoa, käytä standardeja (RDF*, SPARQL)

- Sisällytä tietoon linkkejä muihin osoitteita, jotta muut löytävät enemmän asioita ETL-prosessilla muokataan tieto yhtenäiseen muotoon, tämä on normaalistu tehyt oman yrityksen tarpeita varten. Big Datan tapauksessa tieto tulee muokata esimerkiksi Linked Data –muotoon ja laittaa muiden saataville (W3C 2015).

3.5 Metadata

Metadata on tietoa tiedosta. Metadata kuvailee tiedon rakennetta ja tarkoitusta. Harvat yritykset ymmärtävät metadatan merkityksen ja vielä harvemmat ymmärtävät kuinka luoda strategia metadatan suunnittelua ja toteutusta varten. Metadata määritellään käy- tön mukaan joko tekniseksi tai liiketoiminnalliseksi tiedoksi. Syntaktinen metadata si- sältää kuvauksen datan syntaksista, eli missä muodossa data on tallennettu. Rakenteelli- nen metadata kuvailee datan rakennetta ja semanttinen metadata kertoo datan tarkoituk- sen. Metadata pitää sisällään tiedon, joka auttaa meitä ymmärtämään perinteistä dataa.

(Turban ym. 2011: 56.)

Taulukossa 4 on esitetty erityyppisiä metadatoja ja mitä tietoa niihin tallennetaan. Staat- tinen metadata pysyy pidempään muuttumattomana, kun taas dynaaminen metadata kertoo järjestelmän tilasta. Tyypillisesti dynaaminen metadata kertoo esimerkiksi mil- loin järjestelmästä on otettu viimeksi varmuuskopio tai paljonko levyillä on tilaa jäljel- lä. Ilman metadataa loppukäyttäjien olisi vaikea löytää etsimäänsä dataa tietokannasta.

Kun tiedetään mitä etsitään, niin etsittävä data löydetään helposti metadatan avulla.

(Giovinazzo 2000: 44-45.)

Metadatalla on useita eri käyttäjiä. BI-ympäristössä loppukäyttäjä tarvitsee eniten meta- dataa löytääkseen haluamansa tiedon tietokannasta. Muita käyttäjiä ovat tietovarasto- arkkitehti, joka määrittelee tietovaraston rakenteen.

(32)

Taulukko 4. Metadata tyyppejä (Giovinazzo 2000: 44).

Staattinen (rakenteellinen)

Nimi Kertoo nimen millä dataelementti tunnetaan järjestel- mässä. Esim. asiakas_nimi, asiakas_id

Kuvaus Täydellinen kuvaus dataelementistä

Muoto Datan esitysmuoto

Data tyyppi Datan tyyppi, esim. kokonaisluku, boolean

Yhteydet Määrittelee yhteyden järjestelmään, eli missä dataa käytetään

Dynaaminen (operatiivi- nen)

Laatu Kuvailee tiedon laadun järjestelmässä, kuten tarkkuus, täydellisyys, johdonmukaisuus

Tilastollinen

Kertoo mitä dataa käytetään eniten ja mitä osioita olisi syytä tehostaa järjestelmän suorituskyvyn parantami- seksi

Tila Sisältää tiedon järjestelmän tilasta, sekä sen koska vii- meksi on tehty varmuuskopiot

Tässä vaiheessa syntyy suurin osa metadatasta. Insinöörit parantavat tietokannan suori- tuskykyä tekemällä valmiiksi usein kysyttyjä kyselyitä. Järjestelmä- ja tietokantavalvo- jat käyvät läpi tilastoja ja muokkaavat ympäristöä saavuttaakseen paremman suoritus- kyvyn. Kaikki tiedot näistä muutoksista tallennetaan metadata-tietoihin, joiden avulla loppukäyttäjät löytävät aina haluamansa tiedon. (Giovinazzo 2000: 46.)

3.6 Tietovarastoinnin apuvälineet

Perinteisellä arkkitehtuurilla toteutetun tietovaraston tieto pysyy muuttumattomana ETL-prosessin jälkeen. Master Data Managementin (MDM) avulla yritys voi hallita yrityksen ydintietoja. Ydintietoa on esimerkiksi asiakas-, tuote- ja organisaatiotiedot.

Master Data Managementin tavoite on koota useiden operatiivisten järjestelmien ydin- tieto yhteen paikkaan. Master Dataa hallitaan keskitetysti ja muut operatiiviset järjes-

(33)

telmät viittaavat Master Dataan, jolloin kaikissa järjestelmissä ydintieto on yhtenäistä.

Master Data palvelee operatiivisten järjestelmien lisäksi myös tietovarastoa.

Enterprise Information Integration-työkaluilla (EII) haetaan tietoa operatiivisten järjes- telmien tietokannoista ja yhdistellään sitä lennosta. EII-ratkaisut eivät yleensä korvaa tietovarastoa, koska niiden data on muokkaamatonta. EII-työkalujen avulla täydenne- tään tietovaraston tietoa reaaliaikaisella tiedolla. (Hovi ym. 2009:67)

(34)

4 BUSINESS INTELLIGENCE

Business Intelligence (BI) on termi, joka tarkoittaa eri asiaa eri ihmisille. Joillekin se tarkoittaa tiedon analysointia ja toisille arkkitehtuureja, työkaluja tai tietokantoja. Bu- siness Intelligencen päätavoite on mahdollistaa interaktiivinen yhteys tietovaraston tie- toon ja mahdollistaa sen käsittely niin, että yrityksen päättäjät voivat tehdä tarpeellisia analyysejä. Business Intelligence prosessin tarkoitus on muokata data informaatioksi, jonka avulla voidaan tehdä päätöksiä, jotka johtavat toimenpiteisiin. (Turban ym. 2011:

28-29.)

Business Intelligence keksittiin 1990-luvun puolivälissä, mutta konsepti on paljon van- hempi. Jo 1970-luvulla oli raportointijärjestelmiä, ne olivat staattisia ja kaksiulotteisia eikä niiden avulla ollut mahdollista analysoida tietoa. Myöhemmin järjestelmiin lisättiin ominaisuuksia, kuten dynaaminen moniulotteinen raportointi, ennustaminen, trendiana- lyysit ja porautuminen. Nämä ominaisuudet olivat vain ylimmän johdon käytettävissä.

Myöhemmin nämä samat ominaisuudet ja paljon muita ominaisuuksia tulivat muidenkin käyttöön. Konseptin nimi Executive Information System muutettiin Business Intelligen- ceksi. Vuodesta 2005 lähtien Business Intelligence sovelluksiin on lisätty tekoälyä ja tehokkaita analysointia sisältäviä ominaisuuksia. (Turban ym. 2011: 28-29.)

Business Intelligence kuvaa yrityksen toiminnasta kertyvää informaatiota, jonka avulla voidaan tehdä parempia päätöksiä ja ohjata toimintaa oikeaan suuntaan. Ilman BI- sovelluksia jokaisen tietoa tarvitsevan tulisi tuntea tietokantojen rakenne ja hakea tieto sieltä. BI-sovellukset esittävät tiedon visuaalisesti ja käyttäjät voivat hakea haluamansa tiedon ilman ohjelmointikokemusta. Kaikkien BI-sovellusten taustalla on tietovarasto, josta tieto haetaan. Reaaliaikainenkin BI-sovellus käyttää tietovarastoa, koska BI- sovelluksia varten data täytyy muokata oikeaan muotoon ennen esittämistä BI- sovelluksissa. (Hovi ym. 2009: 74.)

Business Intelligence tarjoaa yritykselle tarkkaa informaatiota, jota tarvitaan, kun tar- kastellaan menestystä. Tämä tieto on tärkeää, jotta voidaan suunnitella tulevaisuutta ja tehdä tärkeitä päätöksiä. Yritykset on pakotettu tallentamaan, ymmärtämään ja hyödyn- tämään tietoa, jotta yritys voisi kehittää omia prosessejaan. Nykyään prosessit ovat no- peutuneet ja päätöksentekoajat ovat lyhentyneet. Tämän vuoksi päätöksentekijät tarvit- sevat oikean tiedon, oikealla hetkellä, oikeassa paikassa. (Turban ym. 2011: 32.)

Tietovarasto Instituutin (Data Warehous institute), jossa on mukana 510 yritystä, mu- kaan Business Intelligencen käyttöönotto on säästänyt aikaa noin 61 %:lta yrityksistä.

(35)

Yrityksistä 57:a on pystynyt tekemään parempia strategisia päätöksiä ja 56%:a parem- pia taktisia päätöksiä. Lisäksi 39% yrityksistä on säästänyt rahaa Business Intelligencen käyttöönoton jälkeen. (Xavier ym. 2013)

Aikaisemmin Business Intelligencen hyödyntäminen toi yritykselle kilpailuedun. Nyky- ään BI-työkalujen puuttuminen on yritykselle haitaksi. BI sisältää liiketoiminnan kaikki osa-alueet, asiakashallinnan, kirjanpidon, rahoituksen, myynnin jne. Yrityksen toiminta aiheuttaa tapahtumia yrityksen operatiiviseen järjestelmään (kuva 10). Operatiivisesta järjestelmästä kerätään haluttu data, muokataan se oikeaan muotoon ja se tallennetaan tietovarastoon. Tietovaraston datasta voidaan tehdä erilaisia raportteja. Raporttien avulla yrityksen johto tekee strategisia päätöksiä, jotka vaikuttavat taas dataan, joka tallentuu operatiiviseen järjestelmään. BI prosessi on siis eräänlainen silmukka. (Giovinazzo 2000: 2.)

ätöksenteon avustaminen

Tietovarasto

Business Strategia

OLAP Tiedon louhinta Raportit

Tietovarasto

ETL-prosessi

CRM Kirjanpito Rahoitus HR

Kuva 10. Business Intelligence silmukka (Giovinazzo 2000: 2).

(36)

4.1 Business Intelligence pilvessä

Viime vuosina pilvipalvelut ovat yleistyneet, uusia liiketoiminta muotoja ovat SaaS (software as a service), PaaS (platform as a service) ja IaaS (infrastructure as a service).

Ensimmäinen tarkoittaa esimerkiksi verkossa toimivaa ohjelmistoa tai sovellusta, jonka käytöstä maksetaan. Tätä sovellusta ei siis ladata käyttäjän koneelle, vaan sovelluksen käyttö tapahtuu verkon kautta. PaaS on palvelu, jossa esimerkiksi yritykselle tarjotaan alusta tai ympäristö, jossa kehittää, suorittaa ja hallinnoida web-sovelluksia. IaaS taas tarjoaa käyttäjälle koko infrastruktuurin käytettäväksi. Tämä sisältää verkkoyhteydet, tallennustilan, palvelimet ja niiden ylläpidon. (Al-Aqrabi, Liu, Hill & Antonopolous 2014)

Vaikka BI järjestelmä olisi tällä hetkellä toimiva, liiketoiminnan omistajien täytyy etsiä vaihtoehtoja hallitsemattoman järjestelmä- ja tallennus resurssien kasvun vuoksi itse ylläpidettyihin järjestelmiin. Jossain vaiheessa järjestelmien ylläpito ja päivitys tulee kohtuuttoman kalliiksi. Tällöin pilvipalvelut ovat hyvä ratkaisu BI järjestelmälle, jolloin järjestelmien ja infrastruktuurin ylläpito on palveluntarjoajalla. Pilvipalvelut ovat myös hyvä ratkaisu pienemmille yrityksille, jolloin heidän ei tarvitse rakentaa ja ylläpitää itse BI järjestelmien vaativaa infrastruktuuria. (Al-Aqrabi ym. 2014)

Yksinkertainen BI-järjestelmä koostuu loppukäyttäjästä, raportointipalvelimesta, tieto- varastosta, ETL-palvelimesta ja operatiivisista järjestelmistä. Tällaisessa BI- järjestelmässä laitteisto ja ohjelmisto kulut voivat nousta jopa miljooniin euroihin. Pil- vessä olevassa BI-järjestelmässä vain loppukäyttäjä ja operatiivisten järjestelmien lait- teistot ja ohjelmistot ovat yrityksen vastuulla. (Gash, Ariyachandra & Frolick 2011, ) Pilvessä olevaa Business Intelligence kutsutaan BIaaS (Business Intelligence as a servi- ce). Pilveen rakennettu BI-järjestelmä tuo yritykselle kustannussäästöjä laitteistojen ja ohjelmistojen lisäksi myös järjestelmän suunnittelu- ja toteutusvaiheessa. Yleensä jär- jestelmän toimittavalla yrityksellä on jo valmis perussuunnitelma järjestelmästä ja ym- päristöstä, ja järjestelmä sitten räätälöidään yritykselle sopivaksi. (Gash ym. 2011, Chang 2014)

(37)

4.2 Business Intelligence sovellukset

Business Intelligence-sovelluksia on saatavilla useilta eri valmistajilta. Isoimmat val- mistajat ovat Teradata, MicroStrategy, Microsoft, IBM, Oracle, SAS ja SAP. Useimmat edellisistä ovat kasvaneet suuriksi toimijoiksi yritysostojen kautta. Koska BI-sovellus tarvitsee yleensä tietovaraston toimiakseen, usein ostetaan sekä tietovarasto että BI- sovellus samalta toimittajalta. Tämä on oikeastaan ainoa käytetty vaihtoehto kustannus- syistä. BI-sovellukseen kuuluu useita muitakin tuotteita tietovaraston ja itse BI- sovelluksen lisäksi. Usein sovelluksen mukana toimitetaan mm. raportointityökaluja, päätöksentekoapuvälineitä, portaaleja, analysointityökaluja, tuloskortteja ja mittaristoja.

(Turban ym. 2011:41.)

Taulukossa 5 on listattu tunnettuja BI-työkalujen valmistajia sekä mainittu työkalujen nimet. Suurten BI-työkalujen valmistajien lisäksi markkinoilla on myös pienempiä haastajia.

Taulukko 5. Business Intelligence-työkalut (Turban ym. 2011:41).

Valmistaja Työkalu

IBM IBM Cognos Business Intelligence

Microsoft Power BI

Microstrategy Microstrategy

Oracle Business Intelligence Enterprise Edition

Oracle Oracle Hyperion System

Pentaho BI Suite Pentaho

QlikTech QlikView

SAP SAP BusinessObjects

SAP SAP NetWeaver BI

SAS SAS Enterprise BI Server

Tableau Software Tableau

WebFOCUS Information Builders

BI-sovelluksen mukana toimitetaan yleensä myös tietovarasto, mutta useimmat työkalut on mahdollista integroida myös muiden valmistajien tietokantoihin. BI-sovellukset in-

(38)

tegroidaan usein myös toiminnanohjausjärjestelmään, jolloin saadaan reaaliaikaista tie- toa käyttöön. Yleisimmin ERP/BI integraatiota on käytetty taloudellisten päätöstenteon avuksi, mutta nykyään sitä käytetään myös markkinoinnin, henkilöstöhallinnon ja tuo- tannon päätöksenteonapuvälineinä. (Turban 2011: 261.)

4.3 Päätöksenteon apuvälineet

Päätöksenteon apuvälineet (Decision Support System, DSS) on yleensä tehty jotain tiet- tyä ongelmaa varten tai arvioimaan tiettyä mahdollisuutta. Raportointi näyttelee BI- järjestelmissä suurta roolia. BI-järjestelmät tarkkailevat tilanteita ja tunnistavat ongel- mia ja mahdollisuuksia käyttäen analyyttisia menetelmiä. BI-järjestelmiin on sisällytet- ty tietomallit ja tietokantayhteys. BI keskittyy siis raportointiin ja etsimään ongelmia.

Päätöksenteon apuvälineet käyttävät taas omaa tietokantaa ja ne on kehitetty ratkaise- maan BI:n löytämiä ongelmia. Päätöksenteon apuvälineet kehitetään varta vasten löy- dettyjä ongelmia varten. Näitä apuvälineitä voi käyttää yksi käyttäjä tietokoneella tai se voi olla internetin kautta käytettävä sovellus, jolla voi olla useita yhtäaikaisia käyttäjiä.

(Turban, Sharda & Delen 2011: 75.)

Web-pohjaisessa DSS-arkkitehtuurissa prosessointi on hajautettu usealle palvelimelle.

Sovelluspalvelimella sijaitseva sovellus käynnistetään web-selaimen kautta. Sovellus muodostaa yhden tai useamman mallin omasta tietokannasta ja tietomalleistaan. Sovel- lus voi myös hakea tietoa tietovarastosta tai operatiivisesta järjestelmästä. Mikäli käyttä- jä vaatii mallin optimointia, tietomalli tietoineen siirretään optimointipalvelimelle. Op- timointi palvelin hakee tietovarastosta tarvittaessa lisää tietoa. Tämän jälkeen optimoin- tipalvelin ratkaisee ongelman ja lähettää vastauksen suoraan web-selaimelle. Sovellus- palvelin muokkaa muodostetut ratkaisuraportit johtajille luettavaan muotoon ja lähettää ne automaattisesti sähköpostilla tai julkaisee ne portaalissa. (Turban ym. 2011: 75-76.) Päätöksenteonapuväline voi olla monimutkainen ja useasta eri komponentista koostuva järjestelmä. Määrittelyjen mukaan päätöksenteonapuväline tarvitsee vähintään kolme komponenttia: tietokannanhallintajärjestelmän, tietomallinhallintajärjestelmän sekä käyttöliittymän. Kuvassa 11 on kuvattu päätöksenteonapuväline kaikkine komponent- teineen. Useimmat näistä web-järjestelmistä on toteutettu Javalla ja ne pyörivät sovel- luspalvelimilla.

(39)

Järjestelmään voi kuulua:

Tiedonhallintajärjestelmä (The Data Management Subsystem) sisältää tietokannan, jota ylläpidetään tietokannanhallintaohjelmiston (DBMS) avulla ja on monesti kytketty yrityksen tietovarastoon.

Tietomallinhallintajärjestelmä (The Model Management SubSystem) on sovellus, joka pitää sisällään taloudelliset, tilastolliset, hallinnolliset tai muut kvantitatiiviset mal- lit, jotka mahdollistavat tietojen analysoinnin. Tämä komponentti on yleensä kytköksis- sä yrityksen sisäisiin tai ulkoisiin tietomalleihin. Tätä kutsutaan usein myös tietoperus- teinen hallintajärjestelmä (Model Base Management System, MBMS).

Käyttöliittymä (The User Interface Subsystem) on rajapinta, jonka avulla päätöksen- teonapuvälinettä käytetään. Usein käyttöliittymä on web-sivu, jolloin käyttäjälle tarjo- taan graafinen käyttöliittymä. Joskus käyttöliittymä voi olla myös excel-asiakirja.

Muut tieto- järjestelmät

Internet, intranet, extranet

Johtaja (käyttäjä) Yritystason tietämys

ERP / POS

Legacy

ERP / POS

Tiedonhallinta Tietomallin-

hallinta Ulkoiset mallit

Tietoperusteinen järjes- telmä

Käyttöliittymä

Kuva 11. Päätöksenteon järjestelmä (Turban ym. 2014: 85).

(40)

Tietoperusteinen hallintajärjestelmä (The Knowledge-Based Management Subsys- tem) voi tukea kaikkia muita järjestelmän komponentteja tai se voi toimia itsenäisenä järjstelmänä (Turban ym. 2014: 85-86).

Päätöksenteon apuvälineitä ei ole määritelty yksimielisesti, eikä sen ominaisuuksia ja kykyjä ole määritelty tarkasti. Seuraavassa listassa on kuitenkin joitain DSS:n ominai- suuksia:

1. Osittain jäsennellyt tai jäsentymättömät ongelmat 2. Palvelee johtajia kaikilla tasoilla

3. Palvelee yksilöitä ja ryhmiä

4. Toisistaan riippumattomat tai peräkkäiset päätökset 5. Tukee älykästä suunnittelua, valintoja ja toteutusta 6. Tukee erilaisia päätöksenteko prosesseja ja tyylejä 7. Mukautuva ja joustava

8. Interaktiivinen ja helppokäyttöinen 9. Tehokas

10. Ihmiset ohjaavat prosessia 11. Loppukäyttäjien helppo kehittää 12. Mallinnus ja analyysit

13. Tietokantayhteys

14. Erillisjärjestelmä, integroitu tai web-pohjainen (Turban ym. 2011: 77.)

Automaattisia päätöksentekojärjestelmiä käytetään usein tuotteiden tai palveluiden hin- noittelussa. Lentolippujen hinnat on hyvä esimerkki: lentoyhtiön myy lippuja ja mikäli vain 70 % lennon paikoista on myyty tiettynä ajankohtana ennen lentoa, annetaan x pro- sentin alennus muille kuin business-luokan matkustajille. Tällaiset päätökset on tehty aikaisemman datan analysoinnin perusteella ja syötetty operatiiviseen järjestelmään matemaattisten mallien avulla. (Turban ym. 2011: 28-29, 34.)

Tapahtumapohjaiset hälytykset varoittavat BI-käyttäjää epätavallisista tapahtumista.

Esimerkiksi luottokorttiyhtiö saa hälytyksen, mikäli luottokortilla yritetään maksaa epä- tavallisen suuri summa tai yritetään maksaa epätavallisessa sijainnissa. (Turban ym.

2011:35.)

(41)

4.4 Raportointi

Business Intelligence -järjestelmän tarkoituksena on tuottaa raportteja käyttäjilleen. Ra- porttien informaation tulee olla oikeaa ja nopeasti saatavilla. Raportit luodaan tietova- rastotietokannasta tai datamartista, lukuun ottamatta reaaliaikaista BI-ratkaisua, jossa data haetaan operatiivisesta järjestelmästä. Uusi raportti luodaan tekemällä kysely SQL- kielellä tietolähteestä. Usein kyselyn tekemistä varten on luotu käyttöliittymä, jossa käyttäjä valitsee halutut tiedot raporttiin ja sovellus muodostaa SQL-lausekkeen käyttä- jän puolesta. Vaikka uusien raporttien luominen on tehty helpoksi, usein tietohallinto tai ulkopuolinen konsultti muodostaa uudet raportit. Raportteihin voidaan sisällyttää muut- tuvia elementtejä, jolloin useat eri käyttäjät voivat hyödyntää samaa raporttia. Raporttiin syötetään hakuehdot ennen varsinaista tiedon hakua. Raporttien hakuehdot voidaan myös automatisoida, jolloin hakuehdot määräytyvät esimerkiksi sisään kirjautumisen yhteydessä.

Moniulotteinen analysointi (OLAP, On-line Analytical Processing) on menetelmä, jolla on helppoa ja tehokasta toteuttaa liiketaloudellisia analyyseja. Kuvassa 12 on OLAP- kuutio ilman ulottuvuuksia. Kuutio voi esittää esimerkiksi yrityksen kokovuoden myyn- tiä kaikkien tuotteiden osalta.

Kuvassa 13 kuutioon on lisätty ensimmäinen ulottuvuus, kvartaali. Nyt kuutiosta saa- daan selville koko vuoden myynti kvartaaleittain sekä aggregaattina koko vuoden myynti.

Kuva 12. OLAP-kuutio. Nolla ulottuvuutta (Hovi 2009:92).

Myynti €: 545.000

Viittaukset

LIITTYVÄT TIEDOSTOT

Keywords: Competitive intelligence, Gaming environment, Competitiveness, Business intelligence, Data exploitation, Information, Market intelligence, Strategic process,

The extant body of knowledge on Business Intelligence (BI), because of its fragmented state, has overlooked to map the BI literary landscape and subsequently identify the

Esitettävän datan tulee aina pohjautua informaation luonteeseen, tavoiteltuun viestiin, sekä yleisön tarpeeseen. Informaation voi esittää joko tekstinä, kuviona tai näiden

artificial intelligence, automation, business, digital marketing, future, machine learning,

Asiakaskannattavuuslaskennalla voidaan ohjata koko yrityksen toimintaa kannattavampaan suuntaan. Muutokset asiakassuhteen kannattavuudessa otetaan huomioon, jonka seurauksena

Kohdeyrityksessä Business Intelligence -ratkaisut tuotetaan QlikView-so- velluksella. Yrityksen tahtotilana on erottua henkilökohtaisella ja palkitse- valla asiakaskokemuksella

”alhaalta ylös” (Elbashir ym. Näistä erilaisista näkökulmista ja rooleista voidaan huomata, että BI:n roo- lia asiantuntijapalveluyritysten strategisessa päätöksenteossa on

For example, Evelson’s (2011) definition for agile business intelligence was: “Agile business intelligence is an approach that com- bines processes, methodologies,