• Ei tuloksia

The business effect of the quality of structured information

N/A
N/A
Info
Lataa
Protected

Academic year: 2022

Jaa "The business effect of the quality of structured information"

Copied!
150
0
0

Kokoteksti

(1)

TEKNILLINEN KORKEAKOULU

Sähkö- ja tietoliikennetekniikan osasto

Petteri Pelkonen

STRUKTUROIDUN INFORMAATION LAADUN VAIKUTUS YRITYKSEN LIIKETOIMINTAAN

Diplomityö, joka on jätetty opinnäytteenä tarkastettavaksi diplomi-insinöörin tutkintoa varten Espoossa 16.10.2006

Valvoja: Paul Lillrank, Professori

Ohjaaja: Kari Erämaa, Diplomi-insinööri

(2)

Työn tekijä: Petteri Pelkonen

Työn nimi: Strukturoidun informaation laadun vaikutus yrityksen liiketoimintaan

Päivämäärä: 16.10.2006

Sivumäärä: 142

Osasto: Sähkö-ja tietoliikennetekniikan osasto Professuuri: Tu-22 Teollisuustalous

Työn valvoja: Professori Paul Lillrank Työn ohjaaja: Diplomi-insinööri Kari Erämaa

Kehittyvä informaatioteknologia mahdollistaa yhä suurempien datamäärien keräämisen ja varastoinnin. Teknologian kehittyessä on datan ja informaation laatu jäänyt usein vähemmälle huomiolle. Kun data jalostetaan informaatioksi, korostetaan käytön roolia.

Heikon informaation laadun aiheuttamat kustannukset ovat merkittävä, joskin usein piilevä, osuus yritysten kustannuksista. Pelkän laadun varmistamisen kustannusten sijaan laaduttoman informaation pohjalta tehty päätös voi johtaa myös menetettyihin tuloihin ja jopa liiketoiminnan epäonnistumiseen. Informaation laatua tarkasteltaessa on tärkeää huomioida niin liiketoiminnan kuin lT:n näkökulmat. Informaatio kerätään ja muodostetaan tietojärjestelmien ja IT:n toimesta. Informaation laatu arvioidaan taas viime kädessä käyttäjien, eli liiketoiminnan tarpeiden perusteella.

Tässä työssä rakennetaan viitekehys strukturoidun informaation laadusta ja vaikutuksista.

Informaation laadun erittelyyn on valittu viitekehykset aikaisempaan tutkimukseen perustuen. Liiketoiminnan osuus havainnollistetaan erittelemällä tietotyöntekijöiden rooli informaatioprosessin eri vaiheissa, jakamalla käyttö operatiiviseen ja analyyttiseen tasoon ja lähestymällä ongelmia liiketoimintaprosessien näkökulmasta. Lisäksi informaatioprosessin tekninen osuus yhdistetään liiketoimintaan informaation arvoketjun, informaation elinkaaren ja kustannusvaikutusten avulla. Käytännön osassa teoriaosassa rakennettua viitekehystä sovelletaan viiden case-tutkimuksen avulla. Case-tutkimusten yritysten toimialat ovat valmistava teollisuus, tukkukauppa, tietoliikennepalvelut, matkapalvelut ja pankkipalvelut. Case-tutkimuksissa tarkastellaan miten yritykset käyttävät informaatiota tutkituilla alueella ja esitellään käyttöön liittyvät ongelmat, niiden syyt ja seuraukset.

Päätelmissä todetaan viitekehyksen soveltuvan hyvin case-tutkimusten käytännön työkaluksi. Case-tutkimuksissa havaituista ongelmista muodostetaan kokonaisuudet, joita tarkastellaan vallitsevien teemojen näkökulmasta. Tutkituissa yrityksissä informaation laadun vaikutusmekanismit olivat monimuotoisia, mutta liiketoiminnalliset vaikutukset kiistämättömiä.

Avainsanat: Strukturoitu informaatio, data, informaation laatu, datan laatu, informaation laadun viitekehys, tietojärjestelmät, informaation arvoketju, informaation laadun vaikutus

(3)

ii_______ ___________________________

HELSINKI UNIVERSITY OF TECHNOLOGY Abstract of Master's Thesis Author: Petteri Pelkonen

Title: The business effect of the quality of structured information

Date: 16.10.2006

Department: Department of Electrical and Communications Engineering Professorship: Tu-22 Industrial Management

Supervisor: Professor Paul Lillrank Instructor: M. Sc. Tech. Kari Erämaa

Constantly developing infonnation technology enables collection and storing of increasing amounts of data. However, as technology takes giant leaps focus must be directed towards the quality of data and information. As data is processed to information emphasis is on the user’s side. The cost of low quality information might be latent and hidden, but is nevertheless significant. Not only are costs rising from increased inspection costs, the decisions based on poor quality information can lead to decreased revenues and business failure. When evaluating information quality, it is important to take into account the role of both IT and business. IT may gather and store the information but business is eventually the one using it and witnessing the effect of poor quality.

This thesis develops a framework for the quality and effects of structured information. In order to brake down the concept of information quality frameworks from previous research are used. The role of business is presented by introducing the roles of knowledge workers across the different phases of information process and by dividing the use of information into operative and analytical levels. Also, the problems are investigated from the viewpoint of business processes. Additionally, the technical IT component of information process is connected to business with the concepts of information value chain, information lifecycle and cost of poor quality information. In the empirical part of the thesis the framework is applied to five case studies. Industries of these five case study companies are manufacturing, wholesale, telecommunication services, travel services and banking services. Case studies present how companies use structured information in the study area. Also, the problems, causes and consequences related to use of structured information are presented.

In conclusion, the framework is found to be a suitable and practical tool when conducting case studies concerning information quality. Problems found during case studies are scrutinized further and investigated as wholes. Additionally, problems are linked to current concepts concerning the quality of information. Problems and mechanics behind the effect of information quality varied between companies; however, the business effects were obvious.

Keywords: Structured information, data, information quality, data quality, information quality framework, information systems, information value chain, cost of information quality

(4)

Diplomityön tekoprosessi oli pitkä, mutta erittäin opettavainen. Työ oli haastava ja tulokset palkitsevia. Varsinkin käytännön osan yhteydessä tehty tutkimus oli erittäin antoisaa.

Työstä tuli alkuperäisiä suunnitelmia laajempi, mutta näin urakan jälkeen voin kuitenkin sanoa olevani tuloksiin ja tehtyyn työhön erittäin tyytyväinen. Toivon, että kaikki tutkimukseen osallistuneet tahot hyötyvät tutkimuksesta tavalla tai toisella.

Kiitokset työn valvojalle Paul Lillrankille asiantuntevista neuvoista ja tuesta erityisesti tutkimuksen alkuvaiheissa. Haluan kiittää myös työn ohjaajaa Kari Erämaata ja Innometa Oy:tä, jotka olivat huomattava apu työn käytännön ongelmien ratkaisemisessa.

Mielenkiintoiset keskustelut ja huomiot toivat erinomaisen lisän tutkimuksen eri vaiheisiin.

Suuri kiitos kaikille tutkimukseen osallistuneille case-yrityksille ja haastatteluihin osallistuneille henkilöille. Diplomityötä kohtaan osoitettu mielenkiinto oli uskomattoman motivoivaa.

Kiitos kaikille opiskelukavereille, joiden kanssa olen saanut työskennellä opintojeni aikana.

Haluan muistaa myös rakkaita ystäviä, perhettä ja erityisesti Ninaa kannustuksesta ja ymmärryksestä työn aikana.

Espoossa 16. lokakuuta 2006

Petteri Pelkonen

(5)

IV

Sisällysluettelo

l johdanto________________

1.1 diplomityönmotivaatio

1.2 Tavoitejarajaus

1.3 tutkimusmenetelmät

1.4 Lukuohjejatyönrakenne

2 STRUKTUROIDUN INFORMAATION LAATU--- 2.1 Strukturoitujastrukturoimaton

2.2 INFORMAATION TUOTTAJA, YLLÄPITÄJÄ JA KÄYTTÄJÄ 2.3 Data, informaatiojatieto

2.4 informaationlaatu

2.5 Prosessit

3 INFORMAATION ARVOKETJU 3.1 Datanlähteet

3.2 Sovellukset

4 INFORMAATION LAADUN VAIKUTUS JA KUSTANNUKSET--- 4.1 informaationelinkaari

4.2 Heikostainformaationlaadustaaiheutuvatkustannukset

5 CASE A: VALMISTAVA TEOLLISUUS___________

5.1 tutkimusalueenjatutkimusympäristönkuvaus

5.2 Informaationarvoketju

5.3 ONGELM AT JA NIIDEN SEURAUKSET 5.4 Ongelmiensyyt

6 CASE B: TUKKUKAUPPA_______________________

6.1 Tutkimusalueenjatutkimusympäristönkuvaus

6.2 Informaationarvoketju

6.3 Ongelmatjaniidenseuraukset

6.4 Ongelmiensyyt

(6)

7 CASE C: TIETOLIIKENNEPALVELUT____________

7.1 Tutkimusalueenjatutkimusympäristönkuvaus

7.2 Informaationarvoketju

7.3 Ongelmatjaniidenseuraukset

7.4 Ongelmiensyyt

8 CASE D: MATKAPALVELUT_____________________

8.1 Tutkimusalueenjatutkimusympäristönkuvaus

8.2 Informaationarvoketju

8.3 Ongelmatjaniidenseuraukset

8.4 Ongelmiensyyt

9 CASE E: PANKKIPALVELUT

9.1 Tutkimusalueenjatutkimusympäristönkuvaus 9.2 Informaationarvoketju

9.3 ONGELMAT JA NIIDEN SEURAUKSET 9.4 Ongelmiensyyt

99 100 103 108

10 YHTEENVETO JA JOHTOPÄÄTÖKSET 110

10.1 Teoriaosanviitekehysstrukturoidun informaationlaadulle

10.2 Case-tutkimustentulostenyhteenveto

10.3 Johtopäätöksetjapohdinta

110 111 115

LÄHTEET 124

LIITTEET

Liite 1: Tietokantojenperuskäsitteistä

Liite 2: Tietomalleista

Liite 3: Informaationlaatukriteerienalkuperäinenluokittelu

Liite 4: Kimballinmallitietovarastolle

Liite 5: Haastattelurakenteenkysymykset

Liite 6: Caseahaastattelut

Liite 7: Case В haastattelut

Liite 8: Case С haastattelut

Liite 9: Case D haastattelut

Liite 10: Case E haastattelut

129 129 131 133 134 135 138 139 140 141 142

(7)

VI

Luettelo kuvista

Kuva 1 Datan määrän kasvu...

Kuva 2 Datan informaation ja tiedon hierarkia...

Kuva 3 Esimerkki informaation arvoketjusta...

Kuva 4 Kolmitasoarkkitehtuuri...

Kuva 5 Corporate Information Factory...

Kuva 6 Hallittuja hallitsematon informaation elinkaari... ... ...••••••...

Kuva 7 Informaation keräämisen kustannus informaation elinkaaren eri vaiheissa Kuva 8 Informaatio pyramidi...

Kuva 9 Prosessikaavio case A: valmistava teollisuus... ...

Kuva 10 Informaation arvoketju case A: valmistava teollisuus...

Kuva 11 Prosessikaavio case B: tukkukauppa...

Kuva 12 Informaation arvoketju case B: tukkukauppa...

Kuva 13 Prosessikaavio case C: tietoliikennepalvelut...

Kuva 14 Informaation arvoketju case C: tietoliikennepalvelut...

Kuva 15 Prosessikaavio case D: matkapalvelut...

Kuva 16 Informaation arvoketju case D: matkapalvelut...

Kuva 17 Prosessikaavio case E: pankkipalvelut...

Kuva 18 Informaation arvoketju case E: pankkipalvelut...

Kuva 19 Yhteenveto käytännön osan tapaustutkimuksissa havaituista ongelmista Kuva 20 PSP/IQ-mallin kriteerien ja informaation laadun kaavan yhteys...

Kuva 21 Kolmannen normaali muodon (3NF) mukainen relaatiomalli...

Kuva 22 Tähtimalli...

Kuva 23 Lumihiutalemalli...

Kuva 24 Kimballin mallin mukaisen tietovaraston peruselementit...

...1 ...8 .18 .19 .23 .30 .31 .32 .35

„37 .49 .50 ..65 ..67 ..83 ..85 ..99 100 112 117 131 131 132 134

Luettelo taulukoista

Taulukko 1 PSP/lQ-malli informaation laadulle - kvadrantit...

Taulukko 2 PSP/lQ-malli informaation laadulle - kriteerit...

Taulukko 3 PSP/IQ-mallin kriteerien selitykset...

Taulukko 4 Semioottinen informaation laadun viitekehys...

Taulukko 5 Tietovaraston ja datamartin ominaisuuksista...

Taulukko 6 EAI ja ETL ominaisuuksia...

Taulukko 7 Operatiivisen ja analyyttisen käytön ominaisuuksia...

Taulukko 8 Eräitä materiaali-informaation ominaisuuksia...

Taulukko 9 MHJ:n keskimääräinen käyttö...

Taulukko 10 Yhteenveto ongelmista PSP/IQ-mallin kriteerien mukaisesti Taulukko 11 Tuoteinformaation ominaisuuksia...

Taulukko 12 Yhteenveto ongelmista PSP/IQ-mallin kriteerien mukaisesti

12 12 13 15 25 27 29 38 40 40 ,51 .54

(8)

Taulukko 13 Yhteenveto ongelmista PSP/IQ-mallin kriteerien mukaisesti Taulukko 14 Asiakaspalauteinformaation ominaisuuksista...

Taulukko 15 Yhteenveto ongelmista PSP/IQ-mallin kriteerien mukaisesti Taulukko 16 Yhteenveto ongelmista PSP/IQ-mallin kriteerien mukaisesti Taulukko 17 Asiakkaat-taulu...

Taulukko 18 Tuotteet-taulu...

Taulukko 19 Tilaukset-taulu... ... ...

Taulukko 20 Alkuperäinen informaation laatukriteereiden luokittelu...

.71 ..86 ..88 103 129 129 130 133

(9)

Kappale 1 - Johdanto

1 JOHDANTO

1.1 Diplomityön motivaatio

Toimialoja mullistavia paradigman muutoksia tapahtuu kaiken aikaa. Viimeisin merkittävä muutos on siirtyminen teollisesta ajasta informaation aikaan. Data ja data jalostettuna informaatioksi ovat organisaation kriittinen resurssi informaation aikakautena. Data on faktatietoa yrityksen asiakkaista, tuotteista ja palveluista, resursseista, taloudellisesta suorituskyvystä ja kaikesta liiketoimintaan liittyvästä informaatiosta. Alati kehittyvä informaatioteknologia mahdollistaa yhä suurempien datamäärien keräämisen, ihmiset ja yritykset verkostoituvat ja tietoliikenneyhteyksien nopeudet kasvavat harppauksin. Yhä useampi tietotyöntekijä hyödyntää tietojärjestelmiä ja niiden tarjoamaa informaatiota tehtäviensä suorittamisessa. Yritysten varastoiman datan määrä kasvaa räjähdysmäisesti, kymmenen kertaa enemmän verkottuneita ihmisiä johtaa tuhatkertaiseen määrään laitteita, jotka yhdessä johtavat miljoonakertaiseen datan määrään (Redman 2004). Datan määrän

kasvaessa sen laatuun on kiinnitettävä yhä enemmän huomiota.

The volume of dati doubled between 1999 and 2002, Reaching 5 exabytes

of new information

пил*:

Kuva 1 Datan määrän kasvu (Lähde: DC Berkeley, How Much Information? 2003)

Tietokantojen ja datan laajempi konteksti ovat informaatio ja tietojärjestelmät, joiden kautta datasta generoidaan informaatiota organisaation toiminnan ja päätöksenteon tueksi. Heikko datan ja informaation laatu ovat todistettavasti olleet merkittävä, jos ei merkittävin, tekijä lukuisissa onnettomuuksissa avaruuslennoista epäonnistuneisiin sotilaallisiin hyökkäyksiin.

(10)

Toisaalta vaikutus on nähtävissä myös yritysten taloudellisina tappioina (Redman 2004).

Heikosta datasta aiheutuvien suorien ja epäsuorien sosiaalisten ja taloudellisten kustannusten suuruus on merkittävä (Eckerson 2002, Strong et ai. 1998). Erään arvion mukaan tyypillinen datan heikosta laadusta aiheutuva ylimääräisen työn välitön kustannus kattaa 15-25 % yrityksen operatiivisista kuluista (English 1999).

1.2 Tavoite ja rajaus

Diplomityön perimmäinen tutkimuskysymys on pääotsikon mukaisesti.

"Miten strukturoitu informaatio ja sen laatuun liittyvät ongelmat vaikuttavat yrityksen liiketoimintaan?

Teoriaosassa vastataan kysymyksiin:

• Mitä on strukturoitu informaatio ja miten sen laatu voidaan määritellä?

• Miten strukturoitua informaatiota ja sen vaikutusta tarkastellessa yhdistetään liiketoiminnan ja IT:n näkökulmat?

Käytännön osassa suoritetaan teoriaosassa muodostettua viitekehystä käyttäen tutkimus viidessä case-yrityksessä ja keskitytään seuraaviin kysymyksiin:

• Miten strukturoitua informaatiota hyödynnetään case-yrityksissä, mikä on sen arvoa tuottava funktio?

• Mitä laadullisia ongelmia hyödyntämiseen liittyy ja miten nämä ongelmat ilmenevät yritysten liiketoiminnassa?

Tutkimus koskee strukturoitua informaatiota (kappale 2) ja rajataan lisäksi sisäiseen, yrityksen itse tai sen läheisten yhteistyökumppanien tuottamaan ja ylläpitämään informaatioon. Varsinainen informaation käyttö ja asiakkaat voivat tietenkin olla ulkoisia.

Yrityskohtainen tutkimusalue on rajattu informaation arvoketjun, esille tulleiden ongelmien sekä yrityksen toiveiden mukaan. Tietämyksen laadun vaikutuksen osuus rajataan työstä pois. Tietämys, tai tieto, on merkittävä tekijä informaation laadullisten ongelmien takana, mutta varsinaisiin tietojohtamisen liiketoiminnallisiin vaikutuksiin ei syvällisesti puututa.

(11)

Kappale 1 - Johdanto 3 Informaation laadun johtaminen ja informaation parantaminen ovat analogia laatujohtamisesta (Total Quality Management) ja Shewhartin jatkuvan parannuksen PDCA- sykiistä (Plan Do Check Act). Diplomityön käytännön osan tutkimus keskittyy PDCA- syklin ensimmäiseen osaan, ongelmien paikallistamiseen - tavoitteena edellä mainittujen lisäksi kontekstin ymmärtämisen, ongelmien ja niiden seurausten ja syiden kautta löytää yrityksistä parannuskohteita.

1.3 Tutkimusmenetelmät

Työ on rajattu kahteen osaan: teoriaosaan ja käytännön osaan. Teoriaosassa rakennetaan kirjallisuuteen ja alan tutkimukseen perustuen viitekehys informaation laadusta, yhteydestä yritysten tietojärjestelmiin sekä liiketoiminnallisista vaikutuksista. Kirjallisuustutkimus on jatkuvaa työn edetessä. Käytännön osassa tutkitaan informaation laadun vaikutusta viidessä yrityksessä. Käytännön osan tutkimuksen perustana käytetään teoriaosassa rakennettua viitekehystä, yrityksissä tehtyjä haastatteluita sekä muuta yritysten tarjoamaa materiaalia.

Ohjeellisesti yrityskohtainen keskittymisalue on yrityksen liiketoiminnalle tärkeä kokonaisuus, kuten asiakasinformaatio ja sen hyödyntäminen asiakaspalvelu- ja markkinointiprosesseissa. Haastatteluiden tavoitteena on määrittää, minkälainen liiketoiminnallinen vaikutus informaation laadulla on kohdeyrityksissä. Tämä saavutetaan selvittämällä miten ja minkälaisia ongelmia informaation laatu aiheuttaa liiketoiminnalle sekä arvioimalla minkälaisia ovat näiden ongelmien seuraukset ja kustannusvaikutukset.

Haastatteluiden pohjana käytetään laadullisen tutkimuksen periaatteita (Metsämuuronen 2001) sekä teoriaosan perusteella muodostettua haastattelurakennetta ja kysymyslomakkeita. Haastattelurakenne on kolmiosainen. Ensin määritellään työn alustava keskittymisalue ja kartoitetaan, missä informaation laatu mahdollisesti aiheuttaisi ongelmia.

Tässä vaiheessa valitaan siis liiketoiminta- ja informaatioalueet. Toisessa osassa haastatellaan informaation arkkitehtuurista vastaavia tietohallinnon henkilöitä ja määritetään informaation arvoketju (kappale 3). Kolmannessa, haastatte 1 urakenteen laajimmassa, osassa haastatellaan informaation käyttäjiä ja selvitetään informaation

(12)

laadullisia haasteita operatiiviselta ja analyyttiseltä tasolta. Haastattelurakenteen ja haastateltavien roolit ovat jaoteltavissa myös kappaleen 2.2 mukaisesti. Käytännössä haastateltavien roolit ovat usein päällekkäisiä, mikä vaatii joustavuutta haastattelurakenteelta ja kysymyslomakkeilta. Kysymyslomakkeet lähetettiin etukäteen haastatelluille haastatteluun valmistautumista varten. Usein yksittäisen haastattelun tarkempi keskittymisalue setvisi vasta tutkimuksen edetessä. Haastattelurakenne ja kysymyslomakkeet ovat liitteenä (Liite 5 Haastattelurakenteen kysymykset)

1.4 Lukuohje ja työn rakenne

Diplomityö sisältää 10 kappaletta, joista kappaleet 1-4 muodostavat teoriaosan ja kappaleet 5-9 käytännön osan. Kappale 10 sisältää yhteenvedon ja johtopäätökset. Ensimmäinen kappale on johdanto diplomityöhön. Kappaleessa esitellään tutkimuksen tausta ja motivaatio, tutkimusongelma ja sen rajaus sekä rakenne lukuohjeen avulla. Toisessa kappaleessa käydään läpi tutkimuksen peruskäsitteet kirjallisuuteen ja alan tutkimukseen perustuen. Kolmannessa kappaleessa esitellään informaation arvoketju ja sen yhteys strukturoituun informaatioon. Tämä kappale on työn teknisin osuus ja sisältää runsaasti viittauksia tietotekniikkaan; yrityksen tietojärjestelmät muodostavat strukturoidun informaation muodostamisprosessin teknisen osan. Neljännessä kappaleessa esitellään lyhyesti datan ja informaation laatuun liittyvä liiketoiminnallinen vaikutus ja vaikutuksen luonne informaation elinkaaren eri vaiheissa.

Diplomityön käytännön osa muodostuu viidestä case-tutkimuksesta. Case-tutkimusten rakenne perustuu teoriaosaan. Ensin esitellään case-yrityksen toimiala ja tutkimusympäristö sekä informaation arvoketju. Tämän jälkeen kuvaillaan tutkimuksessa esiin tulleet informaation laadulliset haasteet ja arviot liiketoiminnallisesta vaikutuksesta. Lopuksi tarkastellaan ongelmien syitä niin teoriaan kuin yritysten omiin lausuntoihin perustuen.

Kappale 10 on yhteenveto case-tutkimuksista ja tutkimuksen tuloksista. Lisäksi kappale sisältää tulosten pohdinnan ja johtopäätökset sekä hahmotelman jatkotutkimuksen vaiheista.

(13)

Kappale 2 - Strukturoidun informaation laatu 5

2 STRUKTUROIDUN INFORMAATION LAATU _____

Tähän osaan on koottu strukturoidun informaation laatuun liittyvät peruskäsitteet, jotka ovat keskeisiä työn myöhemmissä vaiheissa.

2.1 Strukturoitu ja strukturoimaton

Strukturoidulla informaatiolla viitataan tietojärjestelmien kautta esitettävään dataan ja edelleen informaatioon, jonka esitysmuoto ja arvojoukko ovat ennalta määriteltyjen sääntöjen mukaisia. Esimerkki strukturoidusta informaatiosta on käyttösovelluksen yhteydessä tietyn esitysmuodon saava tietokantarivi, joka on määritelty tietokantaan tietyn ennalta määritetyn tietomallin mukaisesti. Informaatiolla on tässä yhteydessä kaksi muotoa, tietokannassa ylläpidettävä tallennusmuoto ja käytön yhteydessä muodostuva sovelluskohtainen esitysmuoto (Price ja Shanks 2004, Morris 1938). Strukturoidulla tarkoitetaan siis tietyn ennalta määritellyn säännön, tai käytännön, ja muodon noudattamista. Metadata on tärkeä strukturoidun informaation komponentti. Lyhyesti metadata on dataa datasta, tarkemmin metadatan avulla datan rakenne ja käyttäytyminen tallennetaan, hallinnoidaan ja julkaistaan organisaatiossa (Tozer 1999). Metadata määrittää datan, kuten rakennuspiirustukset rakennuksen (English 1999). Informaation struktuuri ja laatu, eivät ole kuitenkaan määriteltävissä pelkästään metadatan ja sen laadun avulla.

Merkittävässä roolissa ovat myös laajemmat tietojärjestelmien ja käytön luomat kontekstit.

Ellei erikseen mainita, informaatiolla tässä työssä tarkoitetaan strukturoitua informaatiota.

Strukturoimattomana informaationa käsitetään taas muut yleiset informaation tallennus- ja välitysformaatit kuten kuvat, videotallenteet, puhe tai dokumentit, joiden muokkaaminen ja analysointi on strukturoitua formaattia haasteellisempaa. Strukturoidun ja strukturoimattoman informaation erittely voi rajatapauksissa olla vaikeaa. Näin esimerkiksi lisäinformaatiolle tarkoitetun vapaan tekstikentän tapauksessa, jossa vapaalle tekstikentälle ei ole määritelty muita ominaisuuksia kuin maksimipituus. Usein strukturoitu informaatio yhdistetään strukturoimattomaan informaatioon, esimerkiksi tuotetietojärjestelmässä, jossa tuotteista säilytetään usein muun datan lisäksi erinäisiä ohjedokumentaatioita ja kuvia.

(14)

Lisäksi data ja informaatio ovat jaoteltavissa sisäiseen ja ulkoiseen, jolloin jaottelu tapahtuu käytännössä lähteen perusteella. Usein dataa ostetaan omaan käyttöön kolmannen osapuolen ylläpitämästä rekisteristä kustannus- ja luotettavuussyistä, esimerkiksi osoitetietojen tapauksessa. Eräs yhä useammin käytettävä ulkoinen strukturoimattoman informaation lähde on Internet ja hakukoneet ( Tozer 1999).

Strukturoidulle informaatiolle voidaan edelliseen määrittelyyn perustuen asettaa tiettyjä laadullisia ennakko-odotuksia (Lillrank 2002, 2003), jolloin informaation laatua kyetään perustellusti mittaamaan.

2.2 Informaation tuottaja, ylläpitäjä ja käyttäjä

Tarkasteltaessa ihmisten roolia informaation elinkaaren eri vaiheissa, voidaan ihmiset jaotella kolmeen ryhmään (esim. Strong et ai. 1997b, English 1999). Ensimmäiseen ryhmään kuuluvat dataa ja edelleen tietojärjestelmien kautta informaatiota tuottavat ihmiset. Dataa tuotettaessa voidaan henkilö edelleen eritellä varsinaiseksi tuottajaksi tai välikädeksi, joista jälkimmäisen tapauksessa informaatio kopioidaan tai käännetään mediasta toiseen, esimerkiksi paperidokumentista tai muistiinpanoista elektroniseen muotoon. Yleisesti ottaen välikäsiä tulisi välttää tehottomuuden ja virheiden minimoimiseksi — miksi esimerkiksi kahden elektronista dataa käyttävän toiminnon väliin tarvitaan manuaalinen työvaihe, jos sama kyetään toteuttamaan automaattisesti? Usein välikäsiä kuitenkin tarvitaan tietotekniikan tai liiketoiminnan asettamien rajoitteiden takia.

Välikädet toimivat esimerkiksi rajapintana muutettaessa informaatio strukturoimattomasta strukturoituun ja elektroniseen muotoon. Lisäksi voidaan puhua informaation täydentämisestä ja päivittämisestä, jolloin viitataan olemassa olevan informaation täydentämiseen ja tarkentamiseen. Tällöin uuden tietokantarivin luomisen sijaan täydennetään vanhaan riviin puuttuvat kentät.

Toinen ryhmä ovat informaation ylläpitäjät. Nämä ihmiset vastaavat informaation infrastruktuurin, eli datan, laitteiden ja ohjelmistojen ylläpitämisestä ja kehittämisestä.

Informaation infrastruktuuri voidaan mieltää informaation edellyttäjänä. tai alustana, kun

(15)

Kappale 2 - Strukturoidun informaation laatu 7

taas informaation arvoketjun tapauksessa alusta on jaoteltu perinteisen arvoketjuajattelun mukaisesti koko yrityksen kattavaksi ketjuksi. Eräs merkittävä ylläpidon rooliin kuuluva toiminto on datan yhdistäminen tietovarastoon useista en lähteistä ja datanvalityksen mahdollistaminen eri järjestelmien välillä. Vaikka konversio onkin automaattinen, on se ensin suunniteltava ja implementoitava. Esimerkiksi välikäsien minimoimisen tapauksessa automaattisen datakonversion tekninen suunnittelu ja toteuttaminen on hoidettava huolellisesti.

Kolmanteen ryhmään lukeutuvat informaation käyttäjät. Nämä ihmiset käyttävät aktiivisesti informaatiota työnsä suorittamisessa operatiivisissa tehtävissä, tai pidemmän aikavälin analyyttisessä ja strategisessa suunnittelussa suoritusta mitattaessa, tai etsittäessä trendejä ja uusia liiketoimintamahdollisuuksia. Usein eri roolit sekoittuvat ja yksi ihminen voi toimia niin tuottajana, kuin käyttäjänäkin. Edellä mainittuun luokkaan, tai luokkiin, kuuluvalle työntekijälle on jossakin määrin vakiintunut nimitys tietotyöntekijä (esim. English 1999).

2.3 Data, informaatio ja tieto

Data, informaatio ja tieto ovat käsitteitä, joiden käyttö ei ole saavuttanut vakiintunutta asemaa suomen kielessä. Tässä työssä data, informaatio ja tieto erotellaan kuitenkin eri käsitteiksi. Yhdessä data, informaatio ja tieto muodostavat hierarkian (Kuva 2), jonka alin taso on data ja vastaavasti ylin tieto. Alin taso, data, voidaan määritellä olevan bittejä ja tavuja, tiedon murusia ilman määrättyä kontekstia (Tozer 1999). Data on tietyn asiantilan tai tapahtuman symbolinen vastaavuus (Lillrank 2002), ulkoisen maailman ilmiön kuvaus (Price ja Shanks 2004, Morris 1938), joka säilytetään usein elektronisessa muodossa tietokannassa. Datalla yksinään on harvoin arvoa tuottava vaikutus. Se on kuitenkin koko hierarkian kulmakivi, jota ilman yksikään yritys ei kykene toimimaan. Esimerkkinä datasta numero 1 000 000.

(16)

Merkitys Informaatio

Esitys ja muoto Sisältö

Ymmärrys

Kuva 2 Datan informaation ja tiedon hierarkia (Lähde: Innometa, sovellettu Paul Lillrank 2002)

Informaatio on dataa, jolle on annettu konteksti (Lillrank 2003). Edellisen esimerkin numerolle voidaan antaa konteksti sanomalla esimerkiksi, että yrityksen A liikevaihto vuonna 2005 oli EUR 1 000 000. Data on siis informaation komponentti ja informaatio ymmärryksen takaamiseksi järjestettyä - strukturoitua - dataa (English 1999). Samoin kontekstin voi luoda toiminnanohjausjärjestelmän käyttöliittymän tietyn valikon tietty datan esitykseen varattu tila. Tässä työssä huomio on nimenomaan tietojärjestelmien kautta esitysmuodon saavassa informaatiossa. Toinen esimerkki informaation muodostamisesta datasta, perinteisesti tietokantojen mallinnuksessa käytetyn tauluesityksen yhteydessä, on liikevaihdon määrittävän sarakkeen ja yrityksen määrittävän rivin leikkauksena syntyvästä solusta katsojalle muodostuva merkitys.

Tieto (knowledge) on taas ihmisten sisäistämää oppimalla, järkeilemällä ja havainnoimalla muodostunutta tietoa ja taitoa (Lillrank 2002). Tiedon osuus on pyritty rajaamaan pois tästä työstä nimenomaan sen immateriaalisen luonteen takia. Toisaalta, esimerkiksi informaatiota tuotettaessa, tietotyöntekijän tieto nousee tärkeään rooliin koulutuksen kautta, jolloin tiedon osuus ongelmien syiden selittäjänä on ilmeinen — huomaa tietotyöntekijä-yhdyssanan ensimmäinen sana (Lee ja Strong 2004). Tietotyöntekijöillä on tietojärjestelmästä mentaalinen malli, jota he käyttävät tulkitessaan havaitsemaansa informaatiota (Benyon et ai. 2005). Edellistä esimerkkiä jatkaen, tiedon avulla henkilö ymmärtää mitä informaatio

”yrityksen A liikevaihto vuonna 2005 oli EUR 1 000 000" merkitsee; osaa yhdistellä sitä

(17)

Kappale 2 - Strukturoidun informaation laatu 9

edelleen muuhun informaation ja käyttää sitä arvoa tuottavaan toimintaan. Kokonaisuutta voidaan tarkastella kaavan M = f(D, C) avulla, minkä mukaan tietoa (f) käytetään prosessoidessa data (D) ja konteksti (C) merkitykselliseksi informaatioksi (M) (Lillrank 2002). Kaava toimii yhtälailla strukturoidun, strukturoimattoman, ulkoisen tai sisäisen

informaation kohdalla.

2.4 Informaation laatu

Eniten käytetyt määritykset laadulle perustuvat asiakastyytyväisyyteen, kuten "kohtaa jatkuvasti asiakkaan odotukset” ja "käyttöön sopiva" (Juran et ai. 1974) tai "vaatimuksia noudattava” (Crosby 1979). Data ja informaatio sekä niiden yhteys IT-ymparistoon esiteltiin lyhyesti edellisessä kappaleessa. Yhteys IT-ympäristöön käsitellään tarkemmin kappaleessa 3. Kirjallisuudesta löytyy useita viitekehyksiä datan ja informaation laadulle (esimerkiksi Price ja Shanks 2004, Wand ja Wang 1996. Yang W. Lee et al. 2001).

Viitekehysten välillä on havaittavissa huomattavia yhtäläisyyksiä, mutta varsinaista vallitsevaa viitekehystä ei vielä ole kuitenkaan muodostunut.

Usein kirjallisuudessa ei erotella dataa ja informaatiota. Kappaleen 2.3 jaottelun mukaisesti voidaan kuitenkin sanoa objektiivisen tuoteperspektiivin soveltuvan paremmin dataan ja subjektiivisen palveluperspektiivin vastaavasti kontekstista riippuvaan informaatioon.

Selvän rajan vetäminen datan ja informaation, kuten tuotteen ja palvelunkin, laadun välille on joissakin tapauksissa kyseenalaista. Usein puhutaankin tuotteen ja palvelun hybrideistä.

Toisaalta, koska data on informaation komponentti, voidaan informaation laadun katsoa sisältävän myös datan laadun. Palveluperspektiivillä viitataan prosessiin, jossa informaatio muodostetaan datasta. Muodostamisprosessin yhteydessä käyttäjät ovat mahdollisesti interaktiossa informaation ylläpitäjien kanssa. Palveluperspektiivillä viitataan myös vasta käytön yhteydessä ilmeneviin informaation ominaisuuksiin (Kahn et ai. 2002). Wand ja Wang perustavat teoreettisen viitekehyksensä objektiiviseen, datan käytöstä riippumattomaan tuoteperspektiiviin ontologisin lähtökohdin (Wand ja Wang 1996). Pian samaan viitekehykseen lisättiin myös subjektiivinen ulottuvuus (Wang ja Strong 1996, Wand ja Strong et al. 1997, Pipino et al. 2002). Price ja Shanks perustavat viitekehyksensä

(18)

semiotiikkaan (Morris 1938) ja ottavat huomioon niin teoreettisen, kuin käytännöllisen lähestymistavan ja tuote- sekä palveluperspektiivit (Price ja Shanks 2004, Price ja Shanks 2005). Objektiivinen näkökulma on käytännöllinen informaation laadun helpomman mittaamisen mahdollistajana kontekstista riippumattomien kriteerien kohdalla.

Subjektiivinen näkökulma kattaa taas käyttäjän tiedon, käyttäjän tarpeet ja käyttöympäristön.

jaottelu voidaan tehdä myös jakamalla informaation laatu tekniseen ja neuvoteltuun komponenttiin (Lillrank 2002). Teknisen laadun tapauksessa vaatimukset ovat suhteellisen hyvin etukäteen määriteltävissä, jolloin prosessin ulostulo pyrkii noudattamaan kyseisiä vaatimuksia. Informaatio voidaan siis mieltää mitattavana artetaktina. Neuvotellun laadun tapauksessa vaatimukset eivät ole täydellisesti tiedossa. Tilannetta voi verrata informaatioparadoksiin, eli tilanteeseen jossa informaation asiakas ei tiedä, tai kykene ilmaisemaan vaatimuksiaan (Wigand et ai. 1997). Neuvotellun laadun tapauksessa informaatio mielletään toimitettavana (deliverable). Sopivuus määrittyy toimittajan tarjoaman ja asiakkaan tarpeiden kohtaamisessa muodostuvasta yhteisymmärryksestä.

Edellisessä kappaleessa esiteltyä kaavaa M = f(D, C) voidaan käyttää myös informaation laadun määrittämiseen. Informaation laatu määräytyy sen kyvyn mukaan käynnistää tai mahdollistaa arvoa tuottavaa toimintaa (Lillrank 2002). Tällöin yhtälön oikean puolen komponenttien on kyettävä muodostamaan käyttäjälle arvoa tuottavaa, merkityksellistä informaatiota (ks. seuraavan kappaleen kriteerit).

2.4.1 Informaation laadun dimensiot

Alla olevissa taulukoissa on esitetty kaksi pitkäjänteisen tutkimuksen ja käytännön testauksen perusteella muodostettua informaation laadun kriteerien luokittelua. Molemmat viitekehykset yhdistävät edellisessä kappaleessa mainitut eri näkökulmat.

PSP/IQ-viitekehyksessä (Product Service Performance Information Quality) (Taulukko 2) kriteerit on määritelty neljään kvadrantti in erityisesti informaation parannuskohteiden tunnistamisen näkökulmasta (Lee et ai. 2001, Kahn et ai. 2002). Tuote-rivi viittaa informaation aineellisiin tai luontaisiin ominaisuuksiin. Palvelu-rivi viittaa informaation

(19)

Kappale 2 - Strukturoidun informaation laatu 11 syntyprosessiin ja aineettomiin ominaisuuksiin. Sarakkeet vastaavasti kuvaavat laadun täyttymistä kahden laatumääritelmän: objektiivisen ja subjektiivisen perusteella. Ehjä informaatio tarkoittaa objektiivisesti mitattavissa olevaa ominaisuutta ennalta määriteltyä spesifikaatiota vastaan. Esimerkkejä ovat puuttuva tai virheellinen solu tietokannassa ja päivämäärän esitysmuoto eurooppalaisen tai vastaavasti yhdysvaltojen käytännön mukaan.

Riippuva informaatio tarkoittaa informaation toimitusvaiheen mahdollisia ongelmia.

Esimerkiksi pääsy informaatioon on liian hidasta, tai käyttöoikeudet epäävät pääsyn kokonaan. Hyödyllisellä informaatiolla tarkoitetaan ominaisuuksia, jotka tekevät informaatiosta käyttäjän tarpeisiin sopivaa ja riittävää mahdollistaen näin tehtävän suorittamisen. Informaation hyödyllisyys heikkenee, jos esimerkiksi varastosaldot ovat jaoteltu varastoittain pelkän kokonaismäärän sijaan käyttäjän tarvitessa nimenomaan varastokohtaista informaatiota. Vaikka informaation sisältö olisi kunnossa ja sen luomisessa käytetty prosessi toimii moitteetta, voi informaatio silti olla käyttäjän subjektiivisen kokemuksen mukaan hyödytöntä. Käytettävällä informaatiolla tarkoitetaan ominaisuuksia, jotka mahdollistavat informaation käyttäjälle informaation hankinnan ja manipuloinnin. Käyttäjän on esimerkiksi kyettävä käyttämään kyselykieltä, jolla varastosaldoihin liittyvä informaatio saadaan muutettua tehtävää tukevaan muotoon.

Taulukossa 1 on esitelty PSP/lQ-mallin kriteerien luokitteluun käytetyt kvadrantit.

Taulukossa 2 on varsinainen kriteerien luokittelu, ja taulukko 3 sisältää kriteerien selitykset. Mallin pohjana toiminut alkuperäinen MlT:n TDQM-ohjelmassa (Total Data Quality Management) kehitetty viitekehys ja informaation laatukriteerien luokittelu ovat liitteenä (Liite 3: Informaation laatukriteerien alkuperäinen luokittelu).

(20)

Taulukko 1 PSP/IQ-malli informaation laadulle - kvadrantit

Noudattaa määrittelyä Objektiivisesti arvioitava

Kohtaa tai ylittää käyttäjän odotukset Subjektiivisesti arvioitava Tuote laatu

Informaation luontaiset ominaisuudet

Ehiä informaatio Hvödvllinen informaatio Informaation

ominaisuudet noudattavat annettuja standardeja, esim. metadataa

Tarjottu informaatio kohtaa informaation käyttäjän tarpeet

Palvelu laatu Informaation da­

tasta muodostamis- prosessin ominaisuudet

RiiDDUva informaatio Käytettävä informaatio Informaation datasta

muodostamisprosessi noudattaa annettuja standardeja

Informaation datasta muodostamisprosessi ylittää käyttäjän odotukset

Taulukko 2 PSP/IQ-malli informaation laadulle - kriteerit Noudattaa määrittelyä Kohtaa tai ylittää

käyttäjän odotukset Tuote laatu Ehiä informaatio Hvödvllinen informaatio

Virheetön Tarkka esitys Täydellinen Yhtenevä

Sopiva määrä Relevanttisuus Ymmärrettävä Tulkittava Objektiivinen Palvelu laatu Riioouva informaatio Käytettävä informaatio

Ajantasaisuus Turvallisuus

Uskottavuus Saatavuus Joustavuus Maine Arvoa lisäävä

(21)

Kappale 2 - Strukturoidun informaation laatu 13

Taulukko 3 PSP/IQ-mallin kriteerien selitykset

■-■■JC. ---

Virheetön Data on oikein ¡a luotettavaa Tarkka esitys Data on kompaktisti esitetty

Täydellinen Dataa ei puutu, käytön kannalta tarpeelliset ominaisuudet on taltioitu dataa luotaessa

Yhtenevä Data on esitetty samassa formaatissa Riippuva informaatio

Turvallisuus Data on suojattu vahingoilta ja väärinkäytöltä, esim. käyttöoikeudet Hyödyllinen informaatio

Sopiva määrä Dataa on kävtön kannalta sopiva määrä

Relevanttisuus Data on käytettävää ja hyödyllistä tehtävän kannalta Ymmärrettävyys Data on helposti ymmärrettävissä

Tulkittavuus Dataa kuvaavat symbolit, kieli, yksiköt, ¡a määritelmät ovat selkeitä Objektiivisuus Data ei ole vääristeltyä, tarkoituksella epätodenmukaiseksi muokattua Käytettävä informaatio

Uskottavavuus Data nähdään totena ¡a dataa pidetään uskottavana Saatavuus Data on saatavissa tai helposti ja nopeasti noudettavissa Joustavuus Data on helposti muokattavissa eri tehtäviin sopivaksi Maine Data on arvostettua sisällön ja lähteen kannalta Arvoa lisäävä Data tuottaa käyttäjälleen lisäarvoa

Semioottinen viitekehys (Taulukko 4) on kehitetty semioottisen mallin pohjalta, jonka mukaan merkillä, eli datalla, on aina tallennettu muoto, referenssi ulkoisessa maailmassa ja tallennetusta muodosta johdettu tulkinta tai vastaavasti muoto, merkitys ja käyttö (Price ja Shanks 2004). Viitekehys on jaettu kolmeen semioottiseen tasoon mukaillen edellä mainittuja semioottisia näkökulmia infonnaation laatuun. Syntaksinen taso määrittää kuinka hyvin tallennettu data noudattaa määritettyjä sääntöjä, eli metadataa. Metadatan ja edelleen tietokannan eheyssääntöjen noudattamisen merkitys informaation laatuun ovat ilmeisiä (Lee et ai. 2002), koska liiketoimintasäännöt tallennetaan metadataan. Semanttinen taso määrittää kuinka hyvin data vastaa ulkoisen maailman ilmiötä ja pragmaattinen taso määrittää kuinka hyvin data täyttää käyttäjän tarpeet tietyssä toiminnassa ja kontekstissa.

Semioottisen mallin viitekehyksessä on pyritty välttämään kriteerien välisiä korrelaatioita ja päällekkäisyyksiä. Esimerkiksi usein datalle annettu laatuvaatimus virheettömyys (accuracy) on tässä mallissa määritettävissä kahden kriteerin avulla: tunnisteen viittaus

(22)

oikeaan ulkoisen maailman ilmiöön ja ilmiölle kartoitettujen ominaisuuksien oikeellisuus vastaavaan ulkoisen maailman referenssi ilmiöön. Tavanomaisemmin käytetty kriteeri

”täydellinen” vastaa mallin toista kriteeriä "kartoitettu täydellisesti”. Tyyppi-täydellinen sisältää taas käyttöön liittyvät täydellisyyden ominaisuudet, kuten ovatko kaikki tehtävän suorittamiseksi tarvittava informaatio kerättävissä informaation lähteellä. Näkökulma informaation laatuun on hieman eri semioottisessa ja PSP/IQ-mallissa. Jos malleja kuitenkin verrataan, voidaan todeta syntaksisten ja semanttisten kriteerien lähestyvän objektiivisesti mitattavia informaation tuotemaisia ominaisuuksia, ja vastaavasti pragmaattisten kriteerien informaation muodostamisprosessiin ja käyttöön liittyviä palvelumaisia ominaisuuksia.

(23)

Kappale 2 - Strukturoidun informaation laatu 15

Taulukko 4 Semioottinen informaation laadun viitekehys

Syntaksiset kriteerit

Noudattaa metadataa Data noudattaa määritettyjä tietokannan eheyssääntöjä.

Esimerkiksi kotitalouden tapauksessa aviopuolisot, tai vanhempi ja lapsi. Relaatioiden kokonaisuus.

Semanttiset kriteerit

Kartoitettu täydellisesti Jokainen ulkoisen maailman ilmiö on esitetty

Kartoitettu yksiselitteisesti Jokainen datayksikkö esittää korkeintaa yhtä ulkoisen maailman ilmiötä

Ilmiö kartoitettu oikein Jokainen datayksikkö vastaa oikeaa ulkoisen maailman ilmiötä. Esim ilmiön 1 ominaisuudet osoittavat ilmiön 1 ominaisuuksiin, eivät ilmiön 2

Ominaisuudet kartoitettu oiken Kaikki attribuutit, jotka eivät ole avaimia, vastaavat oikein ulkoisen maailman ilmiön ominaisuuksia

Kartoitettu yhtenevästi Mikäli ilmiöstä on useita esityksiä, ovat kaikki yhteneviä.

Vastaavasti epäjohdonmukaisuudet kyetään selvittämään hyväksyttävän aikarajan sisällä. Ts. ei duplikaatteja

Kartoitettu merkitsevästi Jokainen data yksikkö esittää vähintään yhtä tiettyä ulkoisen maailman ilmiötä

Pragmaattiset kriteerit

Saatavuus Data on helposti ja nopeasti saatavissa

Sopivasti esitetty Datan muoto, tarkkuus, ja esitys yksikkö ovat käytön kannalta sopivat

Joustavuus Data on helposti muokattavissa. Esim aggregoitavissa, tai esitysmuodon muuttaminen on helppoa

Ajantasaisuus Data ei ole liian vanhaa käytön kannalta Ymmärrettävyys Data on esitetty ymmärrettävästi

Turvalisuus Data on suojattu vahingoilta ja väärinkäytöltä, esim.

käyttöoikeudet

Tyyppi-täydellinen Sisältää kaiken informaation käytön kannalta. Data on käytön kannalta relevanttia ja sitä on riittävä määrä, ts yhdistää dimensiot riittävä määrä ja relevanttisuus Pääsy metadataan Datan määritys, rajoitukset, ja dokumentointointi ovat

saatavilla Näkemykset syntaksiksisesta ja

semanttisista kriteereistä

Esimerkiksi syntaksinen tapauksessa noudattaa liiketoimintasääntöjä

Informaation laadun kriteerit, kuin myös laadun määrittäminen kriteerien avulla on jatkuvan keskustelun alaista. Usein eri viitekehykset ja saman viitekehyksen kriteerit sisältävät päällekkäisyyksiä ja korrelaatioita. Esimerkiksi PSP/lQ-mallin informaation

(24)

kriteerien luokittelussa käytetyt kaksi akselia (tuote-palvelu ja laatu määrittelyt) eivät ole täysin ortogonaalisia. Tämä johtaa siihen, että hyödyllisyys ja riippuva -kvadrantit menevät osittain päällekkäin eheä ja käytettävä -kvadranttien kanssa. Lisäksi kriteerien nimeämiset eivät ole vakiintuneita - usein eri yhteyksissä perimmäisesti samaa tarkoittava ominaisuus ilmaistaan eri kriteereillä. Kuitenkin erityisesti strukturoidun informaation tapauksessa, missä IT-ympäristön luoma konteksti on erityisen huomion kohteena, on ongelmien lähestyminen yllä olevien viitekehysten avulla järkevää ja hyödyllistä.

2.5 Prosessit

Oaklandin mukaan prosessilla on aina syöte, joka käy läpi erinäisiä vaiheita sisältävän muutoksen, jossa syötteestä muodostuu ulostulo, joka enemmän tai vähemmän tyydyttää prosessin asiakkaiden odotukset (Oakland 1993). Syötteenä voivat toimia esimerkiksi ihmiset, laitteisto, tai data. Vastaavasti ulostulona voisivat toimivat tuote, palvelu tai informaatio. On hyvä huomata, että ensimmäisen prosessin kannalta tarkasteltu ulostulo on informaatiota, kun taas seuraavan prosessin syötteen näkökulmasta se on dataa - toisen miehen informaatio on toisen miehen dataa (Lillrank 2002 s. 700). Yritysten toimintaa analysoidaan usein prosessinäkökulmasta. Perinteisen funktionaalisen, osastoihin rajoittuvan tarkastelun sijaan prosessinäkökulma painottaa kokonaisuuden ja kaikkien prosessiin osallistuvien funktionaalisten osastojen toiminnan korrelaatioiden huomioimista yhteistuloksen näkökulmasta. Tyypillinen yrityksen toimintaa kuvaava prosessi on tilaus- toimitusprosessi. Prosessit voidaan luonnollisesti jakaa edelleen aliprosesseihin.

Diplomityön käytännön osan tutkimuksessa informaation laatuun liittyvät ongelmat ja niiden vaikutus linkitetään case-yritysten liiketoimintaan prosessinäkökulman avulla.

Lisäksi näkökulma on erinomainen lähestymistapa myös keskittymisalueen rajaamisessa.

2.5.1 Prosessien luokittelu ja prosessin laatu

Prosessit voidaan eritellä kolmeen eri tyyppiin; standardi, rutiini ja ei-rutiini (Lillrank 2003). Standardiprosessille tyypillistä on yksinkertaisen toiminnon laajamittainen ja identtinen toisto, jossa toiminnan syöte, muunnos ja ulostulo ovat ennalta tarkkaan määriteltyjä. Ulostulo on aina samanlainen ja sen laatua voidaan määrittää mittaamalla

(25)

Kappale 2 - Strukturoidun informaation laatu 17

poikkeama tavoitearvosta; tyydyttävä arvo on tavoitearvojen sisällä. Prosessin ulostulon ollessa määriteltävissä, on laadun arviointi lähellä informaation teknistä laatua (Lillrank 2003), jolloin informaation, tai datan, laatuja sen mittaaminen ymmärretään objektiivisesti tarkasteltavissa olevana tuotteena (Price ja Shanks 2004) (ks. kappale 2.4).

Rutiiniprosessin syöte valitaan useasta valikoimasta ja tuottaa vastaavasti ulostulona useamman valikoiman. Valikoimalla tarkoitetaan funktionaalisesti toisiaan vastaavia ulostuloja, kuten sinistä ja punaista autoa. Rutiiniprosessin tapauksessa valikoimat ovat kuitenkin ennalta määriteltävissä, mikä ei enää pidä paikkaansa ei-ruliiniprosesseissa.

Näiden prosessien tapauksessa ulostulon laatu on lähempänä neuvoteltua, subjektiivista laatua (Lillrank 2003). Rutiiniprosessin tapauksessa tyydyttävä ulostulo tuottaa odotetun valikoiman. Epätyydyttävä ulostulovalikoima aiheutuu virheestä syötteen luokittelussa ja tulkitsemisessa sekä tästä johtuvasta väärän rutiinin valitsemisesta. Ei-rutiiniprosessin tapauksessa tyydyttävä tulos on toiminnon suorittaminen ja yhteisymmärryksen saavuttaminen toimittajan ja asiakaan välille. Prosessihierarkian - ei-rutiini ylin, standardi alin - ylemmillä tasoilla on taipumus muovautua ja siirtyä alemmalle tasolle organisaation oppiessa ja toiminnan rutinoituessa sekä standardisoituessa. Liiketoimintaprosessien uudelleenjärjestelyllä tarkoitetaan yrityksen sisäisten ja yritysten välisten työvirtojen analyysia ja usein radikaalia uudelleensuunnittelua ja järjestelyä. IT:n tärkeyttä muutosten mahdollistajana on korostettu (Hammer ja Champy 1993). Käsite on saanut jokseenkin negatiivisen kaiun, ollen kaunis sana supistamisille. Hammerin mukaan ERP-järjestelmät (ks. kappale 3.1.2) ovat jatkoa samalle metodologialle.

(26)

3 INFORMAATION ARVOKETJU

Informaation arvoketju on kokoelma prosesseja, tietokantoja ja sovelluksia, jotka luovat, päivittävät, noutavat, muuntavat ja viimein esittävät informaation tietotyöntekijälle elektronisessa, tai muussa muodossa, esimerkiksi paperille tulostettuna (English 1999).

Informaation arvoketjun voidaan katsoa muodostavan informaation muodostamisprosessin teknisen osan - vrt. informaation laatuun vaikuttava konteksti. Tietotyöntekijöiden rooli informaation arvoketjussa on jaoteltavissa kappaleen 2.2 mukaisesti. Informaation arvoketju on analogia perinteisestä tuotteen, tai palvelun arvoketjusta (Porter 1985), joka alkaa tuotannon raaka-aineesta, datasta, ja päättyy valmiiseen tarjoamaan ja loppuasiakkaaseen tai informaation asiakkaaseen. Käytännössä informaation arvoketju on järjestelmäarkkitehtuuri kartta, jossa huomioidaan tietotyöntekijöiden roolit ja käyttökontekstit sekä datan manipulointi ja jalostaminen informaatioksi ketjun edetessä.

Seuraavissa kappaleissa esitellään tyypilliset informaation arvoketjun eri osat jaotellen ne operatiiviseen ja analyyttiseen sekä lähde ja sovellus osiin alla olevan esimerkkikuvan mukaisesti. Tietokantojen peruskäsitteet selvitetään liitteessä (Liite 1: Tietokantojen peruskäsitteistä)

Infonnaattor käyttö

z X

Ostaman # 1

z

/

.

Datamart K 2

Informaation käyttö

Kuva 3 Esimerkki informaation arvoketjusta

3.1 Datan lähteet

Tietokannan ja sovelluksen erittely kokonaisesta ohjelmistosta ei ole aina yksiselitteistä - näin esimerkiksi toiminnanohjausjärjestelmän tapauksessa. Tietokanta on usein kiinteästi

(27)

Kappale 3 - Informaation arvoketju 19 integroitu sovelluksen muihin toimintoihin. Käytännöllinen lähestymistapa ongelmaan on kokonaisuuden tarkastelu kolmitasoarkkitehtuurin näkökulmasta, jonka mukaisesti tietojärjestelmät on usein suunniteltu ja toteutettu. Kolmitasoarkkitehtuuri on asiakas- palvelin arkkitehtuuri, jossa sovellus jaotellaan erillisiin toiminnallisiin moduuleihin (Wikipedia). Moduulit voidaan edelleen jaotella, data. logiikka tai esitys tasoon (vrt.

informaation laadun semioottinen malli) alla olevan kuvan (Kuva 4) mukaisesti.

Erottelemalla ohjelmisto eri tasoihin, mahdollistetaan eheämpi sovelluskehitys, helpompi järjestelmien ylläpito ja varmempi järjestelmien yhteensopivuus. Jokaiselle tasolle on määritelty rajapinnat, joiden kautta eri tasoilla sijaitsevat moduulit kommunikoivat keskenään. Samalla rajapinnan takana olevat toiminnot piilotetaan yhteyttä, tai palvelua pyytävältä osapuolelta.

Presentation tier

The top-most level of the application is the user interface The main function of the interface is to translate tasks and lesults to something the user can understand

>Clísales

> GET SALES TOTAL

TOTAL ______________

Logic tier

This layer coordinates the application processes commands, makes logical dectsions and evaluations and performs calculations It also moves and processes data between the two surrounding layers

GET UST OF ALL SALES MADE LAST YEAR

ADD ALL SALES TOGETHER

Data tier

Hete information ts stored and retrieved from a database or file system. The information is then passed back to the logic trer for processing and then eventually back to the user

Database

Storage

Kuva 4 Kolmitasoarkkitehtuuri (Lähde: Wikipedia)

Vastaavanlainen jaottelu on usein erityisesti oliomaailmassa käytetty malli-näkymä- kontrolleri (MVC, model-view-controller) (Vesterholm ja Kyppö 2002). Jos looginen

(28)

kerros, eli väliohjelmistot (middleware), jaetaan useampaan tasoon, puhutaan monitasoarkkitehtuureista. Yhteys tietokantaan tapahtuu ohjeellisesti loogisella tasolla sijaitsevan sovelluspalvelimen kautta. Tällöin varmistetaan, että dataa pyytävä sovellus saa lähettävältä sovellukselta täsmälleen pyytämänsä datan, vaikka alemman tason toteutus olisikin muuttunut pyytävän sovelluksen sitä tietämättä. Suora yhteys tietokantaan ja datatasoon voidaan muodostaa esimerkiksi ODBCm (Open Database Connectivity) avulla (Vesterholm ja Kyppö 2002). Tällöin dataa pyytävän sovelluksen on huomioitava tietokantaan mahdollisesti tapahtuneet muutokset, sillä toiminnon varmistaminen kuului tässä tapauksessa sivuutetulle loogiselle tasolle. Usein korostetaankin sovelluspalvelimen käytön tärkeyttä. Edellinen jaottelu eri toiminnallisiin tasoihin on havainnollistava myös informaation laatua tarkasteltaessa. Jaottelu korostaa tietojärjestelmien roolia datan muokkaajana ja informaation generoijana loogisella tasolla ja esittäjänä esitystasolla.

Datan, ja tietotyöntekijän käytön yhteydessä informaation, lähteinä voivat toimia perinnejärjestelmien ja operatiivisten järjestelmien käyttämät tietokannat sekä tietovarastot ja datamartit. Edellä mainittujen lisäksi päätöksenteon tukena voivat toimia tietotyöntekijöiden itsenäisesti ylläpitämät ns. henkilökohtaiset tietokannat (English 1999).

Henkilökohtainen tietokanta ei yleensä ole virallinen datan lähde, ja niiden käyttö onkin merkki informaation laadun ongelmista, joista selviytyäkseen tietotyöntekijät ovat kehittäneet omat ratkaisunsa. Luonnollisesti tämä datan laadun saareke ei ole muiden tietotyöntekijöiden käytössä ja edesauttaa luottamuksen rappeutumista nykyiseen, viralliseen IT-ympäristöön. Henkilökohtaista tietokantaa ylläpidetään usein esimerkiksi Microsoft Excelin tyyppisissä sovelluksissa. Edellisen kaltaiset sovellukset voivat toimia datan lähteinä myös esimerkiksi tietovarastolle, milloin tilanne tosin vaatii erillisjärjestelyltä. Normaalit tietokannat ovat yleensä ensisijainen lähde myös tietovarastoille.

3.1.1 Perinnejärjestelmät

Perinne- tai legacy-järjestelmillä tarkoitetaan usein vanhempia, yhä käytössä olevia tietojärjestelmiä (Wikipedia, English 1999). Usein perinnejärjestelmät mielletään

(29)

Kappale 3 - Informaation arvoketju 21

haasteellisina: järjestelmät on suunniteltu toimimaan vanhentuneessa ympäristössä niin sovellusten kuin laitteiston osalta, tai järjestelmien alkuperäiset suunnittelijat ovat poistuneet organisaatiosta. Lisäksi järjestelmät voivat olla eristettyjä, vrt. automaation saareke (Mäntylä, Andersin 1998), lisäten näin nykyisessä ympäristössään datan heterogeenisuutta. Jos järjestelmä on hyvinkin vanha, voi se olla suunniteltu vanhentuneen liiketoiminnan tarpeisiin metadatan, liiketoimintasääntöjen ja muun toimintalogiikan osalta.

Järjestelmien ylläpito, päivittäminen ja laajentaminen kattamaan nykyisen liiketoiminnan tarpeet voikin olla haastavaa. Niiden käyttö voi kuitenkin joskus olla perusteltua. Jos perinnejärjestelmä tyydyttää myös nykyisen liiketoiminnan tarpeet, ei toimivan ratkaisun korvaaminen uudella ole kustannustehokasta, eikä toivottavaa. Perinnejärjestelmä on käytännössä aina operatiivinen järjestelmä (Kimball et ai. 1998).

3.1.2 Operatiiviset järjestelmät

Operatiiviset järjestelmät ja tietokannat tukevat operatiivisia prosesseja (Kimball et ai.

1998, English 1999) ja ovat ensisijainen datan luontikohde ja tuotantoalue. Data tallennetaan reaaliaikaisesti operatiivisten prosessien yhteydessä datan tuottajien toimesta tai järjestelmän automaattisesti generoimana. Toiminnanohjausjärjestelmä (ERP, Enterprise Resource Planning) on esimerkki operatiivisesta järjestelmästä. ERP-järjestelmällä tarkoitettiin alun perin kaikkien yrityksen operatiivisen prosessien kattavaa järjestelmää, jossa kaikki data säilytettiin yhdessä tietokannassa. Näin ERP-järjestelmä olisi ratkaisu järjestelmien monimuotoisuuden tuomaan datan ja informaation integrointi- ja hallintaongelmiin (Tozer 1999, Kimball et al. 1998). Kaikki yrityksen operatiiviset toiminnot kattavat ERP-järjestelmät ovat kuitenkin käytännössä erittäin harvinaisia, ja nykyään ERP-järjestelmällä tarkoitetaan järjestelmää, joka kattaa kaksi tai useampia yrityksen operatiivisista prosesseista (CIO.com). Eri yritysten ja toimialojen asettamien vaatimusten johdosta ERP-järjestelmät usein räätälöidään yrityskohtaisesti. Yritykset voivat esimerkiksi implementoida yhden tai muutamia moduuleja järjestelmätoimittajan tarjoamasta kokonaispaketista. Näin ollen yrityksillä on usein käytössä useita operatiivisia järjestelmiä, jotka ovat erikoistuneet tietyn toimialakohtaisen operatiivisen prosessin suorittamiseen ja sen aikana kerätyn ja tuotetun datan sekä transaktioiden ylläpitoon.

(30)

Lisäksi yrityksillä voi olla käytössä useita erillisiä liiketoiminta-alueittain rinnakkain toimivia operatiivisia järjestelmiä, jotka sisältävät samanlaista dataa, esimerkiksi liiketoimintayksiköittäin kerättävää asiakasinformaatiota. Operatiiviset järjestelmät on optimoitu suorituskyvyn, ylläpidon ja saatavuuden kannalta, milloin vastaavasti kyselyjen laajuus ja monimutkaisuus kärsivät. Lisäksi operatiiviset järjestelmät sisältävät normaalisti vähän historiadataa. Operatiivisten järjestelmien välinen integrointi toteutetaan EAkn periaatteiden mukaisesti (ks. kappale 3.2.2). Järjestelmien integroiminen vahvistaa arkkitehtuurin ja metadatan yhtenäisempää kehittämistä (Kimball ja Ross 2002; Tozer

1999).

3.1.3 Tietovarasto

Operatiivisten järjestelmien tarjoaman informaation käsittely, hyödyntäminen ja analysointi suoraan lähdejärjestelmistä eri puolilla organisaatiota ovat lähes mahdotonta - varsinkin kun dataa tarvitaan useammasta eri järjestelmästä. Tietovarastoon (DW, Data Warehouse) integroidaan eri operatiivisten järjestelmien data ja tarjotaan tietotyöntekijälle helppo, integroitu, eheä ja keskitetty näkymä kaikkeen organisaation oleelliseen dataan (Kimball et al. 1998). Merkittävät tietovarastoinnin uranuurtajat ovat Ralph Kimball ja Bill Inmon. Alla olevassa kuvassa on esitetty Inmonin mallin mukainen rakenne yrityksen informaation arkkitehtuurille. Analyyttinen informaation käyttö tapahtuu useimmiten joko tietovarastosta tai datamarteista. Datan laatu varmistetaan ja data järjestetään tietovarastosta erillisellä datan latausalueella tietovaraston tietomallin mukaiseksi (kuvassa integration/transformation). Kimballin malli tietovaraston rakenteelle on liitteenä (Liite 4:

Kimballin malli tietovarastolle). Kimballin malli havainnollistaa erinomaisesti datan latausalueen erottamista datan esitysalueesta. Inmonin Corporate Information Factory havainnollistaa taas paremmin tietovaraston keskeistä roolia datan integroijana. Mallit sisältävät niin eroavaisuuksia kuin yhtäläisyyksiä. Molemmat ovat saaneet myös kritiikkiä.

Usein käytetäänkin teorioiden synteesiä. Inmonin malli on kuitenkin ainakin terminologiansa puolesta useammin sovellettu lähestymistapa tietovarastointiin.

Seuraavassa kappaleessa datamartia käsitellään pääasiassa Inmonin mallin pohjalta.

(31)

Kappale 3 - Informaation arvoketju 23

Kuva 5 Corporate Information Factory (Lähde: Inmon 2000)

Inmonin neljä vaatimusta tietovarastolle ovat: aihealue orientoitunut, aika variantti, muuttumaton ja integroitu (Inmon 1993 s.29). Tietovaraston tiettyyn ulkoisen maailmaan ilmiöön, esimerkiksi asiakkaaseen tai tuotekannattavuuteen, liittyvä data on organisoitu tietovarastossa kokonaisuudeksi, jonka muodostaminen erillisiä lähdejärjestelmiä tutkimalla on vaikeaa tai jopa mahdotonta; kaikki datan muutokset ovat jäljitettävissä ja niitä voidaan käyttää historiatietoina tulevissa analyyseissä; dataa ei ole mahdollista muokata tai poistaa, vain lisätä; ja viimein, tietovarasto tarjoaa tietotytöntekijälle semanttisesti yhteensopivan näkymän lähes kaikkeen, tai kaikkeen, operatiivisten järjestelmien tuottamaan analyyttiselle käytölle oleelliseen dataan. Tietovaraston data edustaa operatiivisten järjestelmien datan tilaa tietovaraston lataushetkellä - data ei ole reaaliaikaista vaan vain niin kuranttia kuin se oli viimeisimmän latausajon tapahtuessa.

Kaikkien vaatimusten täyttäminen ei ole triviaalia, tietovarastointi projektit ovatkin usein

(32)

yritysten suurimpia ja haasteellisimpia IT-projekteja. Hankaluudet ovat usein jäljitettävissä informaation laatuun (English 1999).

Operatiivisella tietovarastolla (ODS, Operational Data Store) tarkoitetaan joko tietovarastosta ja operatiivisista järjestelmistä erillistä tai tietovaraston yhteydessä hallinnoitavaa osiota tietovarastosta (Inmon 1993, 2000, Kimball et ai. 1998, Kimball ja Ross 2002). Ero operatiivisen ja normaalin tietovaraston välillä on lataustiheydessä ja historiaulottuvuudessa (Inmon 1993, 2000). Normaalin tietovaraston tapauksessa lataustiheys vaihtelee tyypillisesti päivistä kuukauteen. Operatiivisessa tietovarastossa frekvenssi on huomattavasti tiheämpi, mahdollistaen datan reaaliaikaisemman prosessoinnin ja analysoinnin. Toisaalta operatiivinen tietovarasto ei sisällä normaalista tietovarastosta löytyvää datan historiaulottuvuutta. joka on oleellinen osa useissa analyyseissä. Operatiivinen tietovarasto kykenee siis vastaamaan vain kevyempiin, operatiivisiin kyselyihin. Operatiivinen tietovarasto on perusteltu harvan lataustiheyden tietovarastoympäristössä, josta reaaliaikaisten kyselyjen tekeminen olisi muuten rajoitettua.

Kuten muut operatiiviset tietokannat, myös operatiivinen tietovarasto toimii lähdejärjestelmänä tietovarastolle. Vastaava toiminnallisuus, esimerkiksi reaaliaikainen raportointi, on mahdollista useimmista nykyisistä ERP-järjestelmistä. Tällöin ERP- järjestelmät sisältävät operatiivista tietovarastoa vastaavan tietokannan (Kimball ja Ross 2002). Toisaalta modernit tietovarastot kyetään lataamaan yhä tiheämmin, joissakin tapauksissa tietovarasto voi sisältää lähes reaaliaikaisesti ladattavan osan. Selkeä erottelu operatiivisen ja normaalin tietovaraston välillä onkin näin ollen usein tarpeetonta operatiivisen tietovaraston sulautuessa normaaliin tietovarastoon (Kimball ja Caserta 2004).

3.1.4 Datamart

Käyttötarkoitukseltaan datamartit ovat hyvin tietovaraston kaltaisia. Pääasiallinen ero on tietomallissa ja datan kattavuudessa: datamart koostuu loogisesta tietovaraston datan alijoukosta (Inmon 2000, Kimball ja Ross 2002). Lisäksi datamart suunnitellaan erityisesti tiettyä käyttöaluetta varten, jolloin tietomallista suunnitellaan käyttöalueen kannalta mahdollisimman optimaalinen. Yhdellä yrityksellä on usein käytössä monta datamartia.

Viittaukset

LIITTYVÄT TIEDOSTOT

Being a logging contractor involves several uncertainties, amongst others, information quality in the work order received from customers. The information quality of work orders is

Therefore, poor quality could be defined as either doing the wrong thing (or failing to do the right thing) or doing the right thing the wrong way (or failing to do the right

Laitevalmistajalla on tyypillisesti hyvät teknologiset valmiudet kerätä tuotteistaan tietoa ja rakentaa sen ympärille palvelutuote. Kehitystyö on kuitenkin usein hyvin

Jos maan pesu suoritetaan on-site -menettelynä ja kaivu on sisällytetty urakkaan, kuuluu maan kaivu prosessin riippumattoman laadunvalvonnan piiriin. Riippumaton laadunval-

Ilmanvaihtojärjestelmien puhdistuksen vaikutus toimistorakennusten sisäilman laatuun ja työntekijöiden työoloihin [The effect of ventilation system cleaning on indoor air quality

Röntgenfluoresenssimenetelmät kierrä- tyspolttoaineiden pikalaadunvalvonnassa [X-ray fluorescence methods in the rapid quality control of wastederived fuels].. VTT Tiedotteita

Liike- ja julkinen rakentaminen työllisti vuonna 1997 tuotannon kerrannaisvaikutukset mukaan lukien yhteensä noin 28 000 henkilöä. Näistä työmailla työskenteli noin 14

Raportissa tarkastellaan monia kuntajohtami- sen osa-alueita kuten sitä, kenellä on vaikutusvaltaa kunnan päätöksenteossa, mil- lainen johtamismalli olisi paras tulevaisuudessa,