Combining Text And Content-Based Searches In Journalistic Image Retrieval

(1)

TEKNILLINEN KORKEAKOULU Tietotekniikan osasto

Informaatioverkostojen koulutusohjelma

Antti Lustila

Teksti- ja sisältöpohjaisten hakujen yhdistäminen journalistisessa kuvahaussa

Diplomityö, joka on jätetty opinnäytteenä tarkastettavaksi diplomi-insinöörin tutkintoa varten

Espoon Otaniemessä 9.3.2007

Valvoja professori Pirkko Oittinen Ohjaaja Stina Westman, DI

(2)

TIIVISTELMÄ

Tekijä:

Osasto:

Pääaine:

Sivuaine:

Antti Lustila

Tietotekniikan osasto

Ihmisläheiset tietojärjestelmät

Mediatekniikka informaatioverkostoissa Työn nimi:

Title in English:

Professuurin koodi ja nimi:

Työn valvoja:

Työn ohjaaja:

Teksti-ja sisältöpohjaisten hakujen yhdistäminen journalistisessa kuvahaussa

Combining Text And Content-Based Searches In Journalistic Image Retrieval

AS-75 Viestintätekniikka Prof. Pirkko Oittinen Stina Westman, DI

Tässä diplomityössä tutkittiin sisältöpohjaisten kuvahakumenetelmien hyödyntämismahdollisuuksia aikakauslehtitoimitusten kuvahakutarpeissa. Tavoitteena oli saada selville, onko sisältöpohjaisista

hakutoiminnoista hyötyä tyypillisissä aikakauslehtien kuvahakutarpeissa, ja miten käyttäjät suhtautuvat niihin.

Työn aikana tutustuttiin sisältöpohjaisen kuvahaun menetelmien kehitykseen viimeisen kymmenen vuoden aikana.

Laajemmassa kontekstissa tutustuttiin tiedonhakututkimukseen. Empiirisen tutkimuksen suunnittelussa tukeuduttiin näiden lisäksi käytettävyystestauksen menetelmiin.

Tutkimuksen mahdollistamiseksi kehitettiin sekä sisältöpohjaisia että muita hakutoimintoja sisältävä

kuvahakuohjelma. Ohjelmalla oli mahdollista yhdistellä eri hakutapoja, hakea esimerkin perusteella sekä tallentaa ja vertailla tuloskuvia.

Tiedonkeruuta varten suunniteltiin käyttäjätesti, johon kuului seitsemän simuloidun kuvahakutehtävän suoritus, tehtäväkohtaisiin ja koko testiä koskeviin kyselyihin vastaaminen ja loppuhaastattelu. Lisäksi käyttäjän testinaikaiset tekemiset tallennettiin käyttölokiin ja ruudunkaappausvideolle. Testejä suoritettiin yhteensä 14 ja lisäksi pilottitesti. Varsinaisista käyttäjistä puolet oli kuvia työssään hakevia ja käsitteleviä ammattilaisia ja puolet noviiseja, joilla ei juuri ollut kokemusta kuvahausta.

Tutkimuksessa havaittiin, että sisältöpohjaisille kuvahakutavoille on käyttöä aidoissa käyttötilanteissa, mutta tämän mahdollistamiseksi toimintojen esillepanoon ja ymmärrettävyyteen on panostettava nykyistä enemmän.

Sisältöpohjaisten hakujen sovellusalue on lopulta kohtalaisen suppea, ja suurin hyöty niistä saadaan, kun mahdollistetaan sisältöpohjaisten ja muiden hakutapojen yhdistäminen.

Sivumäärä: 115 + 30 Avainsanat: aikakauslehtikuvitus, tiedonhaku, käyttäjätestaus

Täytetään osastolla

Hyväksytty: Kirjasto:

(3)

ABSTRACT

Author: Antti Lustila

Department: Department of Computer Science and Engineering

Major: Human-centered Information Systems

Minor: Media Technology in Information Networks

Title: Combining Text And Content-Based Searches In

Journalistic Image Retrieval

Title in Finnish: Teksti- ja sisältöpohjaisten hakujen yhdistäminen journalistisessa kuvahaussa

Chair: AS-75 Viestintätekniikka

Supervisor: Prof. Pirkko Oittinen

Instructor: MSc Stina Westman

The subject of this Master’s Thesis was to study the applicability of content-based image-search methods in the context of journalistic image retrieval. The aim of the study was to find out if content-based searches are beneficial to typical image search needs in magazines and how users react to them.

Initially, the development of content-based methods during the last decade was studied. In a broader context, the field of information retrieval was studied. The planning of the empirical part of the study was based also on usability research methods.

To make information gathering possible, an image search program including both content-based and other search methods was developed. The program allowed combining different searches, searching by example, and also saving and comparing result images.

A user test was planned, consisting of seven simulated image retrieval tasks, task-related and general

questionnaires and an interview. In total, 14 tests and a pilot test were carried out. Half of the actual test users were people who search and handle images professionally, the rest were novices with little image search experience.

Content-based image retrieval methods were found beneficial in actual use cases, but more effort must be put on presenting them to the user in a more understandable manner. However, the application area for content-based image searches is rather narrow, and they are most beneficial when combined with other means of searching.

Number of pages: 115 + 30 Keywords: magazine illustration, information retrieval, user testing

Department fills

Approved: Library code:

(4)

ALKUSANAT

Tämä diplomityö tehtiin Teknillisessä korkeakoulussa Viestintätekniikan laboratoriossa Kuvatuotanto-proj ektiin liittyen.

Haluan kiittää hyvästä työympäristöstä ja tuesta työni valvojaa professori Pirkko Oittista, ohjaajaani Stina Westmania ja muita Viestintätekniikan laboratorion työntekijöitä.

Viimeisestä neljästä ja puolesta vuodesta kiitän erityisesti Informaatioverkostojen kilta Athenea ja Ipurkusessiota.

Espoossa 9.3.2007 Antti Lustila

(5)

SISÄLLYSLUETTELO

1 JOHDANTO... 1

1.1 Tutkimuksen tausta... 1

1.2 Työn tavoite...1

2 KIRJALLISUUSOSA... 3

2.1 Sisältöpohjainen kuvahaku...3

2.1.1 Yleistä... 3

2.1.2 Esimerkkihaku...5

2.1.3 Luonnoshaku...6

2.1.4 Värihaku...6

2.1.5 Tekstihaku...7

2.1.6 Vaatimuksia sisältöpohjaiselle kuvahakuohjelmalle... 8

2.1.7 MPEG-7 -metadata...9

2.2 Tiedonhakuprosessi... 10

2.2.1 Tiedonhakuprosessin vaiheet...10

2.2.2 Hakustrategiat ja-taktiikat...12

2.2.3 Selailu... 14

2.3 Journalistinen kuvahaku...15

2.4 Käyttäjätutkimus kuvahaussa...17

2.4.1 Testikokoelma ja testitehtävät...17

2.4.2 Testin suorittaminen...1 g 2.4.3 Tehtävien luokittelu... 19

2.4.4 Tehtävätyyppejä...20

3 TOTEUTETTU KUVAHAKUJÄRJESTELMÄ...22

3.1 Järjestelmä yleisesti... 22

3.2 Hakutoiminnot...24

3.2.1 Haun kulku...24

3.2.2 Tekstihaku...24

3.2.3 Värihaku...24

3.2.5 Laatuhaku...26

3.2.6 Luokkahaku...27

3.2.7 Muut haut...28

(6)

3.3.1 Kuvien vertailu...29

3.3.2 Tuloskuvien järjestäminen...29

3.3.3 Kaksiulotteinen värijärjestys...30

3.4 Kuvajoukko... 30

3.5 Hakujen tekninen toteutus... 32

3.5.1 Tekstihaut... 32

3.5.2 Sisältöpohjaiset haut... 32

4 TUTKIMUSMENETELMÄT...34

4.1 Testeistä yleisesti... 34

4.2 Käyttäjät...34

4.3 Testin kulku... 36

4.4 Testitehtävät... 37

4.4.1 Tehtävien suunnittelu... 37

4.4.2 Tehtävänannot... 38

4.5 Kyselyt...41

4.5.1 Tehtäväkohtainen kysely... 41

4.5.2 Loppukysely...42

4.6 Loppuhaastattelu...42

4.6.1 Haastattelun aiheet... 42

4.6.2 Haastattelun kulku... 42

4.6.3 Haastattelun käsittely... 43

4.7 Testidata...43

4.7.1 Käyttöloki...43

4.7.2 Videokuvan kaappaus... 44

4.7.3 Tehtävien kestojen määritys... 45

4.7.4 Tehtävän aukikirjoitus...45

5 TULOKSET... 47

5.1 Kuvahakutehtävien suoritus... 47

5.1.1 Hakumäärät...47

5.1.2 Hakutavat... 49

5.1.3 Hakusanat... 52

5.1.4 Hakuluokat... 55

5.1.5 Luonnokset... 56

(7)

5.1.7 Tuloskuvat ja hakujen onnistuminen... 60

5.1.8 Tehtäväsuoritusten kestot... 62

5.2 Tehtävien arviointi... 63

5.3 Hakutoimintojen arviointi...68

5.3.1 Hakutoiminnot koko testissä... 68

5.3.2 Tekstihaku... 69

5.3.3 Värihaku... 70

5.3.5 Laatuhaku... 73

5.3.6 Luokkahaku... 74

5.4 Loppukysely... 75

5.4.1 Perushaut... 75

5.4.2 Muut toiminnot... 79

5.4.3 Arviot kuvahakuohjelmasta kokonaisuutena... 80

5.5 Haastattelutulokset... 81

5.5.1 Ongelmat tehtävissä...81

5.5.2 Muut hakujärjestelmät...82

5.5.3 Tehtävien vaikeustaso...83

5.5.4 Tehtävien aitous... 83

5.5.5 Testin ohjeistus... 84

5.5.6 Testikysymykset... 84

5.5.7 Testin kesto... 84

5.5.8 Yleiset ongelmat... 84

5.5.9 Kehut ja parannusehdotukset...85

6 TULOSTEN TARKASTELU... 86

6.1 Hakustrategiat... 86

6.1.1 Tyypilliset haut... 86

6.1.2 Tehtävien luokittelu ja suoritetut haut...86

6.1.3 Tehtävien jako käytettyjen hakutapojen perusteella... 87

6.1.4 Hakutaktiikat...88

6.2 Hakutapojen käyttö...89

6.2.2 Värihaku...91

6.2.3 Kuvaesimerkkihaku... 91

6.2.4 Muut haut...91

6.3 Huomioita tehtävistä...92

(8)

6.4.1 Yleistä... 94

6.4.2 Tehtävien suunnittelu...94

6.4.3 Kuvahakutehtävien luokittelu... 94

6.4.4 Kuvajoukko...95

6.4.5 Haastattelut...95

6.4.6 Kyselyt... 95

6.5 Tehtäväjärjestyksen vaikutus...97

6.6 Kuvahakuohjelman kriittinen arviointi... 99

6.7 Jatkokehitys- ja jatkotutkimusmahdollisuuksia... 101

6.7.1 Parannuksia hakuohjelman käyttöliittymään... 101

6.7.2 Kuvapalvelin... 104

6.7.3 Sisältöpohjaisten hakutoimintojen kehittäminen... 105

6.7.4 Muita lähestymistapoja tutkimukseen...106

6.8 Vastaukset tutkimuskysymyksiin...106

7 JOHTOPÄÄTÖKSET...109

8 LÄHDELUETTELO... 111 LIITTEET

Liite 1: Testikuvien luokittelu Liite 2: Harjoitustehtävä

Liite 3: Tehtäväjärjestystaulukko Liite 4: Tehtäväkohtainen kysely Liite 5: Loppukysely

Liite 6: Loppuhaastattelu Liite 7: Hakumäärät tehtävittäin Liite 8: Hakusanojen luokittelu Liite 9: Tehtäväsuoritusten kestot

(9)

KUVAT

Kuva 1: Klassisen tiedonhakuprosessin malli (Bates 1989)... 10

Kuva 2: Tiedonhaun prosessi (Shneiderman ym. 1998)... 11

Kuva 3: Journalistisen kuvahaun prosessi (Markkula, Sormunen 1998)... 16

Kuva 4: Kuvahakuohjelman ikkunat... 22

Kuva 5: Kuvahakuohjelman perusikkuna... 23

Kuva 6: Yksinkertainen luonnoshaku ja ensimmäiset hakutulokset... 26

Kuva 7: Luokkahaku luokalla Nature - scenery - waterscapes - seas & lakes...27

Kuva 8: Kuvankatseluikkuna... 28

Kuva 9: Tallennettujen kuvien vertailu... 29

Kuva 10: Kaksiulotteinen värijärjestys... 30

Kuva 11: Tehtävän 1 esimerkkikuva... 39

Kuva 12: Tehtävän 2 esimerkkikuva...40

Kuva 13: Kuvankaappaus testivideosta (noviisikäyttäjä, tehtävä 2)...44

Kuva 14: Tehtäväkohtaiset suoritettujen hakujen keskiarvot, maksimit ja minimit käyttäjäryhmittäni... 48

Kuva 15: Tehtäväkohtaisten hakumäärien keskiarvoja hajonta, kaikki käyttäjät... 49

Kuva 16: Erilaisten hakutapojen suoritusmäärät testissä... 50

Kuva 17: Perushakutapojen yhteenlasketut määrä yksittäisissä ja yhdistetyissä hauissa.... 50

Kuva 18: Perushakujen käyttö yhdistetyissä ja yksittäisissä hauissa tehtävittäin...51

Kuva 19: Pika-ja esimerkkihakujen käyttö tehtävittäin... 51

Kuva 20: Testissä käytettyjen hakusanojen sijoittuminen Jörgensenin luokitteluun... 53

Kuva 21: Tehtävässä 1 piirrettyjä luonnoksia (A), tuloksettomien hakujen jälkeen paranneltuja luonnoksia (B) ja haettavaksi annettu kuva (C)...57

Kuva 22: Tehtävässä 2 piirretyt luonnokset (A) ja haettavaksi annettu kuva (B)...57

Kuva 23: Tehtävässä 3 piirrettyjä luonnoksia ja etsitty kuva... 58

(10)

Kuva 25: Käytetyimmät hakutavat tehtäväsuorituksen ensimmäisissä ja viimeisissä hauissa

... 59

Kuva 26: Tehtävän 6 tuloskuvajoukkoja... 61

Kuva 27: Tehtävän 7 tuloskuvat... 61

Kuva 28: Tehtävien suoritusajat, keskiarvot, maksimit ja minimit... 62

Kuva 29: Käyttäjien arviot tehtävien helppoudesta tehtävittäin... 63

Kuva 30: Käyttäjien arviot tehtävänantojen selkeydestä tehtävittäin... 64

Kuva 31 : Käyttäjien arviot olennaisten kuvien löytymisestä tehtävittäin... 65

Kuva 32: Käyttäjien arviot siitä, tiesivätkö he mitä hakutapaa käyttää... 66

Kuva 33: Käyttäjien arviot tehtävistä selviytymisestä... 67

Kuva 34: Samankaltaisten kuvahakujen tekeminen: käyttäjäryhmät ja ammattilaisten arviot; hajonnat... 68

Kuva 35: Hakutoimintojen saamat keskimääräiset arviot hyödyllisyydestä ja tulosten relevanssista käyttäjäryhmittäni... 69

Kuva 36: Tekstihaun hyödyllisyys ja tulosten relevanssi tehtävittäin... 70

Kuva 37: Värihaun hyödyllisyys ja tulosten relevanssi tehtävittäin... 71

Kuva 38: Luonnoshaun hyödyllisyys ja tulosten relevanssi tehtävittäin... 72

Kuva 39: Laatuhaun hyödyllisyys ja tulosten relevanssi tehtävittäin... 74

Kuva 40: Luokkahaun hyödyllisyys ja tulosten relevanssi tehtävittäin... 75

Kuva 41: Loppukyselyn hakutapakohtaiset arviot... 76

Kuva 42: Arviot siitä, kuinka hyvin tulokset vastasivat odotuksia eri hakutavoilla... 77

Kuva 43: Arviot hakutoimintojen helppokäyttöisyydestä... 78

Kuva 44: Arviot siitä, olisiko hakutoiminnot voinut toteuttaa paremmin... 79

Kuva 45: Käyttäjien arviot ohjelmasta kokonaisuutena: käyttäjäryhmien keskiarvot ja hajonnat... 81

Kuva 46: Tehtäväsuoritusten kestot eri järjestysluvuilla... 98

(11)

Kuva 48: Parannus luonnos: asiasanojen valinta... 103

Kuva 49: Parannusluonnos: tuloskuvien pikapainikkeet... 104

TAULUKOT

Taulukko 1: Ingwersenin ja Järvelinin hakutehtäväluokittelu... 20

Taulukko 2: Värivalitsimessa käytetyt värit... 25

Taulukko 3: Tehtävien sijoittuminen Jörgensenin sekä Ingwersenin ja Järvelinin luokitteluissa... 38

Taulukko 4: Ote käyttölokista (noviisikäyttäjä, tehtävä 2)... 44

Taulukko 5: Ote tehtävän aukikirjoituksesta (noviisikäyttäjä, tehtävä 2)... 46

Taulukko 6: Tehtävissä suoritettujen hakujen määrät ym. tunnuslukuja... 47

Taulukko 7: Tehtävissä käytetyt hakusanat... 54

Taulukko 8: Tehtävissä käytetyt hakuluokat... 56

Taulukko 9: Tehtäväsuoritukset, joissa ensimmäinen ja viimeinen haku tehtiin sammalla hakuvavalla, tai hakuja oli vain yksi... 60

Taulukko 10: Yleisimmät ensimmäiset hakutavat eri tehtävissä...60

Taulukko 11 : Yleisimmät viimeiset hakutavat eri tehtävissä...60

(12)

1 JOHDANTO

1.1 Tutkimuksen tausta

Tämä diplomityö on osa Teknillisen korkeakoulun viestintätekniikan laboratorion Kuvatuotanto-projektia. Projektissa tutkitaan lehtien kuvatuotantoprosessin eri vaiheita lehtikuvan otosta valmiiseen painotuotteeseen, ja keskitytään erityisesti semanttiseen kuvanlaatuun. Projektissa on mukana suomalainen lehtikonserni, paperialan yritys ja lehtien toimitusjärjestelmän toteuttajayritys ja sen päärahoittajana toimii TEKES.

Viestintätekniikan laboratoriosta siihen on osallistunut projektin eri vaiheissa viidestä seitsemään tutkijaa ja diplomityön tekijää. Projekti on käynnistetty vuonna 2005 ja sen on määrä kestää vuoden 2007 puoliväliin.

Tämä tutkimus sijoittuu kuvatuotantoprosessissa siihen vaiheeseen, kun lehtikuvat on otettuja tallennettu kuva-arkistoon ja kuvia haetaan arkistosta erilaisiin kuvatarpeisiin.

Perinteisesti kuvahaussa on käytetty tekstipohjaista hakuajossa avainasemassa ovat kuviin liitetyt kuvatekstit, asiasanat ja muut sanalliset tiedot. Diplomityössä oli tarkoitus selvittää sitä, miten eri hakutapoja ja näkymiä, niin teksti- kuin sisältöpohjaisiakin, voidaan yhdistää kuvatoimituksen työssä. Tavoitteen saavuttamiseksi tutustuttiin aikaisempaan

tutkimukseen erityisesti sisältöperusteisesta kuvahausta ja kuvatoimitusprosesseista, toteuttamalla sisältöpohjaisen kuvanhaun ja tulosten järjestämisen mahdollistava

tietokoneohjelma, ja lopulta testaamalla sitä oikeiden käyttäjien kanssa aitoja kuvatarpeita simuloivilla kuvahakutehtävillä.

1.2 Työn tavoite

Diplomityön tavoitteena oli siis selvittää sisältöperusteisten kuvanhakumenetelmien sopivuutta aikakauslehtitoimitusten kuvahakutarpeisiin. Työssä oli tarkoitus kehittää Kuvatuotantoproj ektin eräänä osa-alueena olevaa digitaalisen valopöydän konseptia.

Tutkimuksen alkuvaiheessa muotoiltiin joukko tutkimuskysymyksiä ohjaamaan

tutkimuksen etenemistä. Kysymyksiin palataan tutkimustulosten tarkastelun yhteydessä.

1. Miten sisältöpohjaista tietoa voi hyödyntää kuvahaussa ja tulosten järjestämisessä?

o Mitä sisältöpohjaisia kuvauksia voidaan käyttää?

o Miten käyttäjät ymmärtävät sisältöpohjaiset kuvaustavat?

o Miten sisältöpohjaiset hakumahdollisuudet tulisi esittää ymmärrettävästi käyttäjille?

o Miten sisältöpohjaisten hakujen tulokset tulisi esittää käyttäjille?

2. Miten käyttäjät omaksuvat sisältöpohjaiset hakutavat?

(13)

o Mitä hakustrategioita käytetään?

o Miten käyttäjät onnistuvat tehtävissä?

o Käyttävätkö ammattilais- ja noviisikäyttäjät sisältöpohjaisia hakumenetelmiä eri tavoin?

o Mitä mieltä käyttäjät ovat sisältöpohjaisista hauista?

Ensimmäinen tutkimuskysymys käsitti sisältöpohjaisten kuvausmenetelmien vaikutukset kuvahakujen muodostamiseen, hakutulosten tutkimiseen ja hakujen tarkentamiseen: Mitä vaaditaan, että käyttäjät voivat hyötyä sisältöpohjaisista kuvahakutavoista?

Jälkimmäinen tutkimuskysymys sisälsi sen, millaisia käyttäjien hakustrategiat ovat, kun tarjolla on myös sisältöperusteinen kuvanhakumahdollisuus. Käyttävätkö käyttäjät edelleen pelkästään tekstipohjaista hakua vai teksti- ja sisältöpohjaisten hakujen yhdistelmää? Miten hakustrategia muuttuu hakujen mukana ja eri tehtävätyypeissä? Miten käyttäjän kokemus kuvajournalistisista tehtävistä vaikuttaa sisältöperusteisten hakumenetelmien käyttöön ja omaksumiseen?

(14)

2 KIRJALLISUUSOSA

2.1 Sisältöpohjainen kuvahaku

2.1.1 Yleistä

Sisältöpohjainen kuvahaku tarkoittaa kuvien hakemista kuva-arkistosta käyttäen

hakutermejä, jotka koskevat suoraan kuvan visuaalista sisältöä sen sijaan, että haettaisiin asiasanojen tai muun kuvista erillisen järjestelmään syötetyn tiedon perusteella.

Sisältöpohjaisen kuvahaun lähtökohta on ihmisen luonnollisessa taipumuksessa järjestää ja luokitella asioita. Kun järjestettävää materiaalia on liikaa ihmisen käsiteltäväksi, otetaan kone apuun. Tekstitietoa on aikaisemmin järjestetty esimerkiksi kirjastojen kortistoihin, mutta nykyään tietokonepohjaiset tekstihaut toimivat paljon ihmistä tehokkaammin.

Kuvien järjestämisessä tietokoneista ei ole samalla tavalla hyötyä. Teksti, samoin kuin sitä käsittelevä tietokone, on ihmisen oma luomus, mutta kuvat ovat oikeastaan toisintoja siitä, mitä ihminen näkee (Datta ym. 2005). Kuvien tulkintaa ei ole helppo luonnehtia eikä varsinkaan opettaa tietokoneelle. Sitä kuitenkin vaadittaisiin, jotta tietokone voisi suorittaa automaattista kuva-aiheeseen lajittelua tai järjestämistä. Tärkeä oivallus sisältöpohjaisen kuvahaun kehitykselle olikin se, että samankaltaisten kuvien hakeminen ei vaadi kuvan sisällön ymmärtämistä, eikä niiden löytämiseen välttämättä tarvita kovin syvällisiä menetelmiä (Smeulders ym. 2000).

Kuvahaussa käyttäjä etsii kuvaa, joka toteuttaisi hänen mentaalisen mielikuvansa (Heidom 1999). Kuvahaun suurimpia haasteita on se, että kuvia voidaan indeksoida useilla

syntaktisilla ja semanttisilla tasoilla. Sisältöä kuten värejä ja tekstuuria voidaan kuvata lokaalisti tai globaalisti, ja semantiikalla voi olla eri tulkintatasoja käyttäjästä riippuen (Jaimes 2006). Tämä johtaa siihen, että korkean tason käsitteitä haettaessa joudutaan turvautumaan matalan tason sisältöön, eli abstrakteihin ilmiöihin pyritään pääsemään käsiksi pikselitason sisällöllä tai semanttisesti samankaltaisia kuvia haetaan visuaalista samankaltaisuutta käyttäen (Datta ym. 2005). Tätä laajaa ongelmaa kutsutaan semanttiseksi kuiluksi. Semanttinen kuilu ilmenee toisaalta siinä, miten käyttäjän hakutavoite

muunnetaan hakutoimintojen käyttöliittymän kautta hakujärjestelmän ymmärtämään muotoon (Ruthven 2000) ja toisaalta matalan tason tietosisältöjen ja käyttäjien korkean tason tietotarpeiden välimatkana (Jaimes ym. 2005).

Burfordin ym. (2003) kymmenosaisessa kuvasisällön luokittelussa semanttinen kuilu asettuu kolmannen ja neljännen tason, kaksi-ja kolmiulotteisten kuvan sisäisten suhteiden sekä viidennen tason eli kuvan sisältämien semanttisten yksiköiden väliin. Luokittelu on seuraava:

1. Havaintojen perusyksiköt: kuvan matalimman tason sisältö, reunat, värit, terävyys.

2. Geometriset perusyksiköt: yksinkertaisimmat visuaaliset rakenteet: viivat, kaaret, kuviot.

(15)

3. Visuaaliset suhteet: Objektien sijainnit toisiinsa nähden kaksiulotteisessa kuvatasossa.

4. Visuaalinen laajennus: Kappaleiden sijainnit kolmessa ulottuvuudessa, syvyysvaikutelma.

5. Semanttiset yksiköt: Kuvan kappaleiden tai niiden edustamien luokkien nimet.

6. Kontekstiabstraktio: Suoraan kuvasta pääteltävissä oleva tieto (esim. päivä vai yö) 7. Kulttuuriabstraktio: Tieto, jonka saamiseen kuvasta tarvitaan ympäröivän kulttuurin

tuntemusta (esim. kuvan uskonnollinen merkitys).

8. Tunneabstraktio: Kuvan herättämät tunnereaktiot (joko yleispäteviä tai yksilökohtaisia) 9. Tekninen abstraktio: Tieto, jonka saamiseen tarvitaan tietyn alan erityistuntemusta.

10. Metadata: Itse kuvaa kuvaava tieto (koko, tyyppi).

Sisältöpohjaisten kuvahakujärjestelmien tyypillinen toimintatapa on hakuperusteina toimivien kuvaominaisuuksien laskeminen ja indeksointi kuvien esikäsittelyvaiheessa, ennen ainuttakaan kuvahakua. Hakuperusteina toimivia ominaisuuksia voivat olla

esimerkiksi koko kuvan värihistogrammi tai paikalliset kuvailutermit (deskriptorit) kuten muoto tai tekstuuri. MPEG-7 -standardiin on määritelty joukko tällaisia deskriptoreita (Manjunath ym. 2001).

MPEG-7 -standardin ohella muutkin kehittyneimmät sisällönkuvaustekniikat hyödyntävät esimerkiksi waveleteja, kuvan muotoa, kuvan segmentointia, kuvan kulma- tai

kiinnostuspisteitä tai blobeja. Tietyssä järjestelmässä käytettävät sisällönkuvaukset valitaan kuitenkin yleensä tilanteen mukaan, yhtä hyvin laajalti käytettyä sisällönkuvausjoukkoa ei ole (Datta ym. 2005).

Viimeisen kymmenen vuoden aikana kuvahakua käsittelevän tieteellisen tutkimuksen määrä on kasvanut tasaisesti ja nopeasti. Vuoteen 2000 mennessä suurin osa

sisältöpohjaisen kuvahaun tutkimuksesta oli edellisen viiden vuoden ajalta, ja kasvu oli erityisesti digitaalisen kuvauksen yleistymisen, Internetin leviämisen ja halpenevan muistitilan ansiota (Smeulders ym. 2000).

Google Scholar -tietokannassa kuvahakuun liittyvien artikkelien määrä suhteessa kaikkiin vuosittain julkaistuihin artikkeleihin karkeasti arvioiden nelinkertaistui edelleen vuodesta 2000 vuoteen 2004. Toisaalta kolmen suuren tieteellisen julkaisijan (IEEE, ACM,

Springer) digitaalisissa kirjastoissa julkaistujen artikkeleiden määrä kasvoi vuodesta 1996 vuoteen 2004 yli kymmenkertaiseksi. Kuitenkin vain alle viidesosassa artikkeleista käsiteltiin sisältöpohjaisen sovellusta ja todellisia kuvahakuj ärj estelmiä perustutkimuksen sijaan. (Datta ym. 2005)

Markkulan ja Sormusen mukaan sisältöpohjaisten hakumenetelmien ongelma on se, että ne harvoin vastaavat suoraan mihinkään aitoon käyttäjätarpeeseen. Ne eivät myöskään kykene

(16)

tunnistamaan kuin alimman tason visuaalisia elementtejä, esimerkiksi eri kulmista kuvatun kohteen tunnistaminen samaksi ylittää niiden kyvyt (Markkula, Sormunen 2000).

Sisältöpohjaisen kuvahaun käytännön sovellusalueita on silti monia, esimerkiksi sopimattomien kuvien ennakkotunnistus ja piilottaminen (Fleck ym. 1996) tai suurten kuva-arkistojen selailun tukeminen (Ojala ym. 2004).

2.1.2 Esimerkkihaku

Useimmat sisältöpohjaiset hakumenetelmät toimivat esimerkkihakuperiaatteella.

Järjestelmä siis hakee kuvia, jotka ovat mahdollisimman lähellä haun lähtökohdaksi annettua kuvaa. Esimerkkihaku perustuu yleensä johonkin neljästä yleisimmästä kuvasta laskettavasta elementistä - väriin, tekstuuriin, muotoon tai paikkaan liittyvä tieto (Chen ym. 2000). Joissain järjestelmissä käyttäjä voi säätää eri tekijöiden kuten värin tai muodon painotusta samanlaisten kuvien haussa (Eakins ym. 2004). Hakua voidaan tarkentaa rajaamalla vertailu vain kuvista laskettuihin pääkohteiden ominaisuuksiin (Bamidele ym.

2004).

Esimerkkihaussa käytetään usein käyttäjäpalautetta hakutulosten relevanssin arvioinnissa, esimerkiksi kolmiportaisella asteikolla: hyvä relevanssi, kohtalainen relevanssi, ei

relevanssia. (Barnard, Shirahatti 2003). Relevanssiarvioiden perusteella järjestelmää ohjataan antamaan jatkossa entistä tarkempia hakutuloksia. Osittaisenkin relevanssin tulokset voivat silti olla hyödyllisiä käyttäjälle, jonka lähtötiedot ovat heikot tai jonka ensimmäinen haku ei ollut kovin onnistunut (Spink ym. 1998). Perinteisten

hakutulosmittareiden (precision & recall) soveltaminen sisältöpohjaisiin hakuihin ei ole aivan yksinkertaista, mutta alustavia mittareita tähän on kehitetty (Smith 2001).

Esimerkkihaun käyttö saattaa pahimmillaan vaikeuttaa hakujen tekemistä. Ensinnäkin haun aloittamiseen tarvitaan sopiva esimerkkikuva, jonka löytäminen aidossa hakutilanteessa voi olla hankalaa (Jaimes ym. 2005). Toiseksi yksittäinen esimerkkikuva saattaa tehdä hausta liian tarkan - esimerkkinä käytettävässä kuvassa voi helposti olla elementtejä, jotka ovat ylimääräisiä, ja joiden ei haluttaisi vaikuttavan hakuun ollenkaan. Kolmanneksi sisältöpohjaisen kuvahaun eri elementtien merkitykset eivät ole käyttäjille läheskään yhtä selviä kuin tekstihaun termien, ja niiden muokkaaminen haun kehittämiseksi on hankalaa (Eakins ym. 2004).

Visuaalinen samankaltaisuus ei sellaisenaan riitä tulosten järjestämiseen, sillä useissa tapauksissa matalan tason piirteet eivät riitä esittämään korkean tason käsitteitä hyvin, ja järjestys vaikuttaakin epäjärjestykseltä (Liu ym. 2004). Samankaltaisuuden kokeminen ja

tulkinta riippuu suuresti henkilöstä, asiayhteydestä ja käynnissä olevasta kuvahakutehtävästä (Markkula, Sormunen 2000).

Roddenin ym. (2001) mukaan tuloskuvien järjestäminen satunnaisesti saattaa jopa olla hyödyllisempää kuin visuaalisen tai kuvateksteihin perustuvan samankaltaisuuden mukaan järjestäminen. Tämä johtuu siitä, että pienet visuaalisesti samanlaiset kuvat sekoittuvat

(17)

helposti toisiinsa ollessaan lähekkäin tiheässä ruudukossa. Satunnainen järjestys saattaa mahdollistaa yllättävienkin tuloskuvien löytymisen.

2.1.3 Luonnoshaku

Luonnoshaussa haun käyttäjä itse piirtää ohjelman tarjoamilla välineillä kuvan, jota sitten käytetään sisältöpohjaisen esimerkkihaun lähtökohtana. Esimerkki luonnoshausta on Retrievr (Langreiter 2006), joka hakee käyttäjän piirroksen perusteella kuvia Flickr- kuvapalvelusta. Retrievr hyödyntää Jacobsin ym. (1995) kehittämää

luonnoshakumenetelmää, joka on toteutettu Haar-waveleteihin perustuvalla algoritmilla.

Luonnoshaun hyödyntäminen ei kuitenkaan rajoitu pelkkään esimerkkikuvan piirtämiseen.

Yksi esimerkki sen luovasta käytöstä on selailun lähtökohdan siirtäminen, joskus jopa täysin mielivaltaiseen kohtaan, kun siihenastisesta selailusta ei ole tullut tuloksia.

(McDonald, Tait 2003)

Luonnoshaku on harvoin ensisijainen hakutapa. Usein syynä on se, että luonnostyökalulla haettaessa kohteiden sijainnilla kuvassa on merkitystä. Erityisesti abstraktia teemaa ilmentävien kuvien hakeminen luonnoksen avulla on hankalaa. Kun käyttäjät tietävät tarkalleen, mitä ovat hakemassa, kuvan sijainti-informaation mukaan ottaminen hakuihin on hyödyksi, mutta muulloin se vastaavasti haittaa hakuja. Pahimmat ongelmat ovat tunnettujen kohteiden etsimisessä, kun käyttäjät keskittyivät liikaa haettavan kohteen väriin, eivätkä niinkään siihen, millainen kuva olisi kokonaisuutena. (McDonald, Tait 2003)

2.1.4 Värihaku

Sisältöpohjainen haku voi olla esimerkki- tai luonnoshaun lisäksi myös väriperusteinen, eli haetaan sellaisia kuvia, joissa hakuterminä annettu väri on hallitseva tai muuten yleinen.

Esimerkki värihakujen sovelluskohteesta voisivat olla henkilökohtaiset kuva-arkisto- ohjelmat, joilla käyttäjä hakee itselleen ennestään tuttuja kuvia (McDonald, Tait 2003).

Käyttäjä todennäköisesti muistaa, minkä värisiä vaikkapa tietyn lomamatkan kuvat olivat (Egyptin-loman keltainen hiekka), ja pääsee niihin nopeasti käsiksi ilmaisemalla haettavan värin.

Värihaun ongelma tai toisaalta mahdollisuus on siinä, että vaikka ihmiset kykenevät havaitsemaan miljoonia eri värejä, ja nykyiset tietokoneet mahdollistavat niiden esittämisen ja haun, ihmisillä ei ole käsitteistöä kuin suhteellisen pienelle värimäärälle.

Hakuväriä ei olekaan tarpeen valita suurimmalla mahdollisella tarkkuudella.

Sisältöpohjaisen kuvahaun ja esimerkiksi kuvankäsittelyohjelmien värivalitsinten käyttökonteksti ja -tarkoitus on erilainen, eivätkä niissä käytettävät valitsimet siten voi korvata toisiaan (van den Broek ym. 2004).

Van der Broek ym. (2004) tutkivat kymmenen eri kuvahakujärjestelmän värivalitsinten käyttöä, ja totesivat kolme ongelmaluokkaa: Ensinnäkin valitsimet olettavat käyttäjien

(18)

tuntevan eri väriavaruudet, vaikka asia ei usein ole niin. Toiseksi värivalitsinten

käyttöliittymät ovat monimutkaisia ja sekavia - saman värin voi esimerkiksi valita useilla tavoilla. Kolmanneksi monipuolisten valitsinten mahdollistama hyvin laaja värivalikoima on harvoin tarpeellinen. Mitä enemmän värejä on esillä, sitä vaikeampaa niiden

valitseminen on sekä havaitsemisen että motoriikan kannalta. Toisaalta ihmisen värimuisti on heikko, ja se varastoi värihavainnot 11 toisistaan erottuvaan luokkaan: punainen, vihreä, sininen, keltainen, ruskea, purppura, pinkki, oranssi, musta, valkoinen, harmaa. Näiden havaintojen pohjalta suositus värihaun värivalitsimeksi on taulukko jossa ovat edellä mainitut yksitoista väriä ja lisäksi turkoosi.

2.1.5 Tekstihaku

Pelkkään visuaaliseen sisältöön perustuva kuvahaku ei riitä kuvatoimitusten hakutarpeisiin.

Matalan tason piirteet, joilla sisältöpohjaiset menetelmät kykenevät hakemaan, eivät kuulu toimittajien ensisijaisiin hakukriteereihin, sillä suuri osa toimittajien kuvahauista ei

kohdistu kuvan sisältöön sinänsä vaan abstrakteihin teemoihin, tunnetiloihin ja kuvan tapahtumiin, joita ei automaattisilla menetelmillä voida havaita (Markkula, Sormunen 2000). Lisäksi käyttäjät vaikuttavat suosivan tuttuja hakutapoja, koska he ovat jo hyvin harjaantuneita varsinkin tekstihaun käytössä. Tekstihaku ei liiaksi rajoita heidän ajatteluaan tai toimintamahdollisuuksiaan, toisin kuin esimerkiksi avainsanojen valinta valmiista listasta (Eakins ym. 2004).

Kuvien väri-, muoto- tai tekstuuriominaisuudet eivät ole yhtä intuitiivisia niiden hakuperusteina kuin teksti, koska niiden käsittely on käyttäjille hankalaa (Eakins ym.

2004). Toinen tekstihakujen etu on se, niissä käyttäjät eivät ole rajoitettuja hakemaan pelkästään esimerkin perusteella (Jaimes ym. 2005). Tekstihaulla nimettyjä kohteita, esimerkiksi ihmisiä, on helppo löytää. Sisältöperusteisessa haussa, varsinkin kun käsitellään kuvaa kokonaisuutena, on vaikea erottaa yksittäisiä kohteita muista saman luokan kohteista (Hollink ym. 2004).

Vaikka tekstihaku on yleensä käyttäjille tuttu, se ei ole kokonaan ongelmaton.

Schneidermanin ym. (1998) mukaan tekstihakujen epästandardius haittaa käyttäjiä, koska monet suorittavat testihakuja useilla hieman toisistaan eroavilla järjestelmillä. Esimerkiksi hakutulokset esitetään yleensä relevanssin mukaisessa järjestyksessä, mutta käyttäjälle j ärj estämisperustetta ei useinkaan kerrota.

Sisältöpohjaiseen hakuun tarvittava tieto on mahdollista laskea kuvista automaattisesti, mutta tekstimuotoisten hakusanojen määrittely kuville on työlästä ja subjektiivista (Eakins ym. 2004). Koska työhön tarvitaan käytännössä asiantunteva ihminen, voi asiasanoitus olla hyvinkin kallista. Silti tekstimuotoinen annotointi ei aina ole riittävän tarkkaa. Tarkalleen oikealla hakulausekkeella ei ehkä saada lainkaan hakutuloksia, jos kuvajoukkoa ei ole asiasanoitettu kokonaisuudessaan kattavasti (Markkula, Sormunen 2000). Kuvatarpeet saattavat sisältää elementtejä ja ilmauksia, joita ei ole otettu huomioon kuvien

asiasanoituksen aikana, ja ongelmaksi voi muodostua sekin, että eri ihmiset

yksinkertaisesti käyttävät samojenkin käsitteiden kuvailuun eri sanoja (Keister 1994).

(19)

Kuvien automaattista annotointia kuvasegmenttien tunnistuksen avulla on kehitetty, mutta se ei ole vielä niin pitkällä, että se olisi laajasti hyödynnettävissä (Barnard ym. 2003).

Uusimmat automaattiset annotointimenetelmät soveltavat esimerkiksi tilastollista

oppimista tai sisältö-ja metatiedon yhdistämistä, mutta lupauksistaan huolimatta ne ovat vielä sovellusalueeltaan suppeita (Boutell, Luo 2004) tai melko epätarkkoja (Li, Wang 2006).

2.1.6 Vaatimuksia sisältöpohjaiselle kuvahakuohjelmalle

Datta ym. (2005) listaavat sisältöpohjaisen kuvahakuohjelman ominaisuuksia, joilla on merkitystä erityisesti siinä tapauksessa, kun kuvahakujärjestelmää tehdään vastaamaan oikeiden käyttäjien todellisiin hakutarpeisiin:

• Suorituskyky

o Hakutulosten on oltava relevantteja käyttäjän kontekstissa.

• Semanttinen oppiminen

o Ohjelman on pystyttävä parantamaan hakutarkkuuttaan tuloksista saadun palautteen perusteella.

• Tietomäärä

o Hakujärjestelmä on voitava mitoittaa erittäin suurille kuvamäärille.

• Heterogeenisuus

o Jos kuvajoukko on suuri ja kuvalähteitä useita, on otettava huomioon vaihtelut kuvien laadussa, resoluutiossa, metatiedoissa ynnä muussa.

• Yhtäaikainen käyttö

o Verkkopohjaisten kuvahakujärjestelmien on sovelluttava usean käyttäjän yhtäaikaiseen käyttöön.

• Multimodaalisuus

o Kuvista on oltava muutakin kuin sisältöpohjaista metadataa, ja sen on oltava laadukasta.

• Käyttöliittymä

o Ohjelman hyödyllisen käytön on oltava helppoa.

• Toimintanopeus

o Hakujen vasteaikojen on oltava riittävän lyhyitä ja algoritmien tehokkaita.

Raskas laskenta voidaan tehdä etukäteen.

• Järjestelmän arviointi

o Ohjelman hyödyllisyyttä on arvioitava suhteessa johonkin kriteeristöön.

Eakinsin ym. (2004) ehdotus ihanteelliseksi kuvahakuohjelman käyttöliittymäksi sisältää seuraavat hakuominaisuudet:

• Vapaa tekstihaku

• Kuvan tarkennuksen ja terävyyden määrittäminen

• Kuvatyypin valinta (esimerkiksi valokuva tai maalaus)

(20)

• Kuvatiedoston tyypin ja koon määritys

• Kuvan emotionaalisen vaikutuksen määritys (positiivinen vai negatiivinen)

• Kuvaan liittyvien erityistoimen valikko, mikäli tarpeellista

Lisäksi kaikkien hakujen tulisi olla käytettävissä yhtä aikaa samalla ruudulla, jotta kaikkien hakutapojen yhdistäminen on mahdollista (Eakins ym. 2004). Käyttäjille se on mieluisampi kuin ratkaisu, jossa kukin hakutoiminto on omalla välilehdellään.

Kuvahakujärjestelmän toteutuksessa tulee ottaa huomioon kuvakokoelman piirteet ja se, millaisia käyttäjiä palvelemaan järjestelmää ollaan tekemässä. Käyttäjistä tulee huomioida erityisesti heidän taitotasonsa ja eri käyttötarkoitusten tuomat vaatimukset. Toisaalta kuvahakuj ärj estelmien kehityksessä tulisi kiinnittää huomiota automaattisten algoritmien parantamiseen, toisaalta ihmiskeskeisyyteen ja käyttäjien ominaisuuksiin, jotka vaikuttavat siihen, miten kuvia etsitään ja selataan. Tarvitaan siis kokonaisvaltainen lähestymistapa, joka mallintaa loppukäyttäjää kuvaavat muuttujat ja ottaa ne myös huomioon (Jaimes

2006).

2.1.7 MPEG-7 -metadata

MPEG (Moving Picture Experts Group) on kansainvälinen tutkimusyhteenliittymä, jonka tehtävä on kehittää standardeja kuvan ja äänen koodaukseen. Esimerkiksi MPEG-1 - standardi sisältää erittäin paljon käytetyn МРЗ-äänitiedostomuodon kuvauksen, ja MPEG- 2 on Suomen digitaalisen television kuvansiirtoon käytetty standardi.

Erotuksena useimmista aikaisemmista MPEG-standardeista MPEG-7 ei ota kantaa kuvan tai äänen digitaaliseen koodaukseen, vaan sen osa multimedian käsittelyketjussa on vain sisällön kuvaileminen. (Jeannin 2001)

MPEG-7 sisältää neljä deskriptoria kuvan värisisällön numeeriseen esittämiseen (Manjunath ym. 2001):

Color Layout määrittää värien spatiaalisen jakauman ja soveltuu nopeaan kuvahakuun.

Deskriptorin arvot saadaan jakamalla tarkasteltava kuva 8x8 -kokoiseksi lokaalit hallitsevat värit sisältäväksi matriisiksi.

Color Structure sisältää sekä värihistogrammin että sisällön spatiaalisen jakauman.

Dominant Color määrittää joukon hallitsevia värejä miltä tahansa alueelta. Se sopii paikallisten kuvakohteiden esittämiseen, kun värisisällön luonnehdintaan riittää pieni määrä värejä.

Scalable Color on 256-palkkinen värihistogrammi.

Lisäksi standardissa on kolme deskriptoria kuvan tekstuurisisällölle:

(21)

Texture Browser mahdollistaa kuvahaun kolmen eri tekstuuriominaisuuden perusteella:

säännöllisyyden, suuntautumisen ja karkeuden.

Homogenous Texture Descriptor on kvantitatiivinen tekstuurikuvaus samankaltaisuushakuun.

Edge Histogram kuvaa erisuuntaisten reunojen jakautumista kuvan eri osissa.

Ojala ym. (2002) tutkivat esimerkkihakutulosten laatua eri MPEG-7 -deskriptoreihin perustuvissa esimerkkihauissa. Color Structure-deskriptorilla saadut hakutulokset olivat suhteellisesti relevanteimpia, kun taas Dominant Color -deskriptorin tulokset olivat vähiten relevantteja. Dominant Color on kuitenkin tarkoitettu kuvan osien hallitsevien värien esittämiseen, ei koko kuvan. Koko kuvan mittakaavassa se on myös testatuista deskriptoreista laskennallisesti raskain.

2.2 Tiedonhakuprosessi

2.2.1 Tiedonhakuprosessin vaiheet

Klassisessa tiedonhaun mallissa (kuva 1) etsittävä dokumentti ja hakijan tiedontarve ovat prosessin ääripäissä (Bates 1989). Dokumenttia ei ole mahdollista hakea sellaisenaan, vaan se on jollain tavalla redusoitu hakujärjestelmän tietomalliin sopivaksi. Esimerkiksi

kirjaston kortistossa kirjaa vastaa metatietokortti, jossa on tieto tekijästä, nimikkeestä ja niin edelleen. Toisaalta käyttäjä ei voi suoraan muuttaa tiedontarvettaan hauksi, vaan sen on mukauduttava hakujärjestelmän mahdollisuuksiin. Kun tietotarpeen ilmenemismuoto eli järjestelmän hyväksymä hakuja etsittävän dokumentin esitystapa kohtaavat toisensa,

saadaan hakuosuma.

Tietotarve Dokumentti Dokumentin

esitys

Osuma

Kuva 1: Klassisen tiedonhakuprosessin malli (Bates 1989)

Shneidermanin ym. (1998) mukaan tekstimuotoisen tiedon haku voidaan jakaa neljään toisistaan erottuvaan vaiheeseen (kuva 2). Ensimmäinen vaihe on hakulausekkeen muotoiluja sitä seuraa haun toteutus ja käynnistys. Kolmas vaihe on hakutulosten tarkastelu, ja viimeinen hakutulosten arviointi ja haun parantelu tarvittaessa. Ennen haun aloittamista on käyttäjän vielä tehtävä hakutarve itselleen selväksi. Hakuprosessin malli on tehty tekstitiedonhaun tutkimuksen perusteella, mutta sen vaihejako pätee myös

kuvahaussa.

(22)

Hakutarve

Hakulausekkeen muotoilu

Tulosten arviointi Lopulliset

tulokset Haun

toteutus

Tulosten tarkastelu

Kuva 2: Tiedonhaun prosessi (Shneiderman ym. 1998)

Hakuprosessin ensimmäinen vaihe on siis hakulausekkeen muotoilu. Käyttäjän on päätettävä, mistä hän hakee — mistä kuva-arkistosta tai millä hakuohjelmalla — mitä hakukenttiä hän käyttää, ja miten hakulausekkeen muotoilee. (Shneiderman ym. 1998) Semanttinen kuilu ilmenee tässä vaiheessa, kun käyttäjällä on käsitys siitä, mikä hänen korkean tason hakutarpeensa on, mutta hakujärjestelmän tarjoamat matalan tason tietosisällöt ja hakumenetelmät eivät mahdollista haun muodostamista riittävän tarkasti hakutarvetta vastaavaksi.

Toinen vaihe on haun toteutus, joka voi alkaa sekä eksplisiittisesti että implisiittisesti.

Eksplisiittinen haun aloitus tarkoittaa sitä, että käyttäjä aivan normaalisti painaa haun käynnistämispainiketta. Implisiittisessä haun aloituksessa järjestelmä voi myös suorittaa hakuja dynaamisesti sitä mukaa, kun käyttäjä muokkaa hakulauseketta. (Shneiderman ym.

1998)

Kolmas vaihe on hakutulosten tarkastelu. Tulosten määrä saattaa olla hyvin suuri, joten sitä on usein mahdollista rajoittaa ja tuloksia järjestää eri tavoin. Erilaisia tulosten

visualisointitapoja voidaan käyttää tulosjoukon havainnollistamiseen. (Shneiderman ym.

1998)

Tässä vaiheessa hakutulosten selailu on tärkeässä osassa, kuvahaussa vielä tärkeämmässä kuin tiedonhaussa yleisesti. Tämä johtuu selailtavan informaation visuaalisesta luonteesta (Hung 2005). Kuvien selaaminen on tehokasta, sillä niiden selailtavissa olevat

(23)

esitysmuodot, esimerkiksi pienet kuvakkeet, edustavat hyvin kokonaisia kuvia.

Tekstimuotoisten tietosisältöjen selailu on hankalampaa, sillä niistä yhdellä silmäyksellä on nähtävissä paljon vähemmän.

Neljäs ja viimeinen vaihe on hakutuloksen arviointi ja haun parantelu. Jos hakutulos ei tyydytä käyttäjää, voi hän muuttaa hakutermejään ja hakea uudelleen. Tässä vaiheessa tärkeää on peräkkäisten hakujen helpottaminen esimerkiksi edellisen haun suoran muokkauksen ja hakuhistorian avulla. Myöhempiä hakuja voi myös hyödyttää

mahdollisuus antaa järjestelmälle palautetta hakutulosten relevanssista. (Shneiderman ym.

1998)

Kuvahakujen lopputulokset ovat usein yksinkertaisempia kuin käyttäjän alkuperäiset tavoitteet. Tämä johtuu ongelmista haun muodostamisessa - semanttisesta kuilusta - tai siitä, että hakutavoite muokkautuu tehtävän aikana. (McDonald, Tait 2003)

Tärkeimmät kuvahakuprosessiin vaikuttavat tekijät ovat käyttäjän tehtävä ja haettavan kuvan tyyppi. Järjestelmän käytettävyyden kannalta tehtävä on oleellisin. Tehtävästä johtuvat vaatimukset haettavalle kuvalla taas saattavat olla hyvin konkreettisia ja tarkkoja, tai toisaalta kovin yleisiä ja jopa epäselviä. Hakutehtävän tyypillä on suuri vaikutus siihen, millaisia hakutapoja käyttäjät käyttävät, miten he kykenevät muodostamaan visuaalisia hakuja ja kuinka haut lopulta onnistuvat. (McDonald, Tait 2003)

2.2.2 Hakustrategiat ja-taktiikat

Suomen kielessä strategia on laajamerkityksinen termi, joka sotilassanastoa lukuun ottamatta on käytännössä taktiikan synonyymi. Sotilaskielessä strategia on tarkoittaa yksinkertaistettuna sodan voittamiseen tähtääviä toimenpiteitä, ja taktiikka yksittäisen taistelun. Tiedonhaun kontekstissa sanojen suhde on samankaltainen: Hakustrategia on suunnitelma koko haun läpiviemiseksi, hakutaktiikka käsittää seuraavan hakuaskelen (Bates 1979).

Bates (1979) jakaa erittelemänsä hakutaktiikat neljään ryhmään: haun etenemisen

valvonnan, arkistorakenteessa liikkumisen, haun muodostuksen ja hakutermien käsittelyn taktiikoihin. Etenemisen valvonnan taktiikoihin kuuluu muiden muassa kirjoitus- ja asiavirheiden korjaaminen sekä hakupolun tallentaminen. Arkistorakenteen taktiikkoja ovat esimerkiksi hakuongelmien jakaminen pienempiin osiin ja aiemmin tehtyjen hakujen hyödyntäminen. Hakun muodostuksen taktiikoita ovat vaikkapa haun laajentaminen ja karsiminen, ja hakutermien taktiikoita muiden muassa termin korvaaminen semanttisella ala- tai yläkäsitteellä.

Hung (2005) erittelee kymmenen hakusiirtoa (search move), joita yhdistelemällä käyttäjät hakunsa muodostavat. Luokittelu perustuu Batesin (1979) tekstihaun taktiikoihin, joita on sovellettu kuvien hakemiseen.

(24)

• kyllästäminen (Exhaust): ensimmäiseen hakuun sisällytetään kaikki mahdolliset hakutermit

• rinnakkaisuus (Parallel): hakua lavennetaan hakutermien synonyymeillä tai muilla läheisillä sanoilla

• karsinta (Reduce): ensimmäisessä haussa käytetään mahdollisimman pientä määrää hakutermejä

• vaihtelu (Vary): hakutermin vaihto tai muuttaminen

• jäljitys (Trace): uusien hakutermien etsiminen jo löydetystä tiedosta

• leikkaus (Intersect): hakutermien lisääminen anD-operaattorilla

• selaus (Browse): hakutuloskuvakkeiden selaaminen

• korjaus (Correct): kirjoitus-ja asiavirheiden korjaaminen

• suurennus (Enlarge): tuloskuvakkeiden suurentaminen ja sanallisen kuvauksen lukeminen

• kuvateksti (Caption): kuvatekstin lukeminen

Tavoitteellinen suhtautuminen hakutehtävään ei kuitenkaan yksin riitä. Käyttäjät pyrkivät käyttämään hienostuneita ja monimutkaisia hakustrategioita, mutteivät osaa hyödyntää hakumenetelmiä, mikä johtaa tehottomiin hakuihin ja moniin hakulausekkeen muutoksiin ennen kuin haku on valmis (Jörgensen, Jörgensen 2005).

Yang (1997) esittelee kahdeksanosaisen luokittelumallin hakukäyttäytymiselle. Kulloinkin voimassa oleva hakutapa riippuu käyttäjän mielentilasta ja siitä, kuinka selvä tehtävän tarkoitus käyttäjälle on. Tästä johtuen suoritettavan tehtävän aikana hakutapa vaihtelee ja kehittyy.

• sääntöjä noudattava (Prescriptive): mukaan otetaan ennalta saatuja hakutehtävän vaatimuksia ja rajoitteita

• kokeileva (Exploratory): käytössä tyypillisesti ennen kuin selkeä suunta on löydetty

• tarkoituksenmukainen (Purposive): hakua suunnataan, kun tavoite on selkeä

• assosiatiivinen (Associative): ennakoiva toisiinsa liittyvän tiedon yhdistäminen

• intuitiivinen (Intuitive): epämääräiset tunteet ohjaavat käyttäjää

• utelias (Curious): kiinnostusta herättävien kohteiden etsintä, tehtävätavoitteesta huolimatta

(25)

• sivuava (Tangential): selvästi tehtävänannon ulkopuoliset haut

• sattumanvarainen (Accidental): satunnaiset teot tai ongelmat hakuongelmat ohjaavat tahattomiin suuntiin

Vangin (1997) mukaan se, mitä hakustrategiaa käyttäjä kulloinkin soveltaa, riippuu

tehtävään valmistumisesta ja tehtävän vaiheesta. Tehtävän edetessä esimerkiksi kokeilevan ja tarkoituksenmukaisen haun osuudet vähenevät, kun käyttäjät siirtyvät enemmän

assosiatiivisiin hakuihin.

2.2.3 Selailu

Selaaminen on erittäin tärkeä aputoiminto journalistisessa kuvahaku-ja valintaprosessissa useastakin syystä. Ensinnäkin selaaminen tuo esiin ideoita, ja alkuperäinen kuvatarve saattaa kehittyä ja muuttua kokonaan selailtujen kuvien vaikutuksesta (Markkula, Sormunen 2000). Usein käyttäjä päätyy kuvaan, joka ei vastaa alkuperäistä ideaa, koska haun ja selailun aikana mieleen on tullut parempi ajatus (Frost 2001).

Toisaalta selaaminen myös helpottaa sopivan kuvan löytämistä. Pienikokoiset selailtavat hakutuloskuvat saadaan esille täysikokoisia nopeammin, ja kuvakkeista tuloksista saa nopeasti yleiskuvan (Anon. 2002b). Usein on paljon vaikeampaa kuvailla tarkasti kuvatarvetta kuin tunnistaa sopiva kuva selaamisen aikana (Markkula, Sormunen 2000).

Tulosten selailu onkin tärkeää juuri silloin, kun käyttäjät eivät ole varmoja hakutermeistä tai eivät tunne sovellusaluetta tarpeeksi hyvin, että voisivat käyttää tarkkoja hakusanoja.

Silti myös ammattikäyttäjillä selailu on yleinen hakustrategiana he suosivat järjestelmää, joka mahdollistaa sen. (Frost ym. 2000)

Kuvien selailumahdollisuus vaatii sen, että kuville on tehokkaat siirto- ja esitystavat.

Lisäksi suuri kuvajoukko on jäljestettävä jollain perusteella selailua varten (Forsyth 2002).

Jäijestämisperusteena voidaan käyttää useita edellä mainittuja kuvan ominaisuuksia, muun muassa metadataa, matalan tason visuaalisia ominaisuuksia kuten värejä tai tekstuuria, niiden spatiaalista jakaumaa tai asiasanoitusta (Rodden ym. 2001). Sisältöpohjaiset hakumenetelmät voisivat hyödyllisimmillään juuri hakutulosjoukon järjestämisessä selailua varten. Kun esimerkki sopivasta kuvasta löydetään, sen kanssa sisällöltään samankaltaiset kuvat voitaisiin helposti järjestää selattavaksi seuraavana (Markkula, Sormunen 1998).

Tuloskuvakkeita otetaan selailuun mieluummin paljon kuin vähän, mutta selailtava joukko ei voi olla mielivaltaisen suuri (Markkula, Sormunen 1998). Käyttäjät suostuvat selaamaan enintään noin sadan tuloskuvan joukkoja, sitä suuremmissa tulosmäärissä hakua muutetaan ennen selaamisen aloittamista (Markkula, Sormunen 2000). Optimaalisessa

kuvahakujärjestelmässä käyttäjillä tulisi olla mahdollisuus säätää selailtavan kuvajoukon kokoa (Hung 2005). Jos käyttäjällä ei ole kiire, voi hän silti selailla läpi suuriakin

kuvamääriä (Markkula, Sormunen 1998).

(26)

Kuvien määrä ei ole ainoa muuttuja, johon käyttäjien olisi selailussa syytä päästä

vaikuttamaan. Käyttäjillä pitäisi olla esimerkiksi mahdollisuus selailtavien päättää kuvien koosta, esitysresoluutiosta tai samanlaisten kuvien hakuperusteista (Hung 2005).

2.3 Journalistinen kuvahaku

Ensimmäiset kuvahakujärjestelmät olivat useimmiten taidehistoriallisia kokoelmia, mikä tarkoitti sitä, että niiden suunnittelussa on voitu keskittyä melko rajattuun ongelma- alueeseen. Vähintään sovellusalue ja käyttäjien kuvatarpeet ovat olleet melko hyvin määriteltyjä. Journalistiseen käyttöön tarkoitetussa kuvahakujärjestelmässä näin ei kuitenkaan ole, sillä kuvahakujen aihealueena on kaikki mahdollinen, mistä lehti saattaa kirjoittaa, aiheet vaihtuvat nopeasti, eikä kuvatarve aina edes vastaa tarkalleen juttuaihetta, vaan saattaa olla jotain siitä assosioitua. (Omager 1995)

Nykyiset aikakauslehtitoimitukset soveltavat tekniikkaa hyvin eritasoisesti, ja vaikka journalistisen materiaalin tuotantoprosessin pääpiirteet ovatkin vakiintuneet muun muassa

integroitujen toimitusjärjestelmien yleistymisen myötä, vaihtelee toimijoiden määrä ja heidän välinen työnjakonsa melkoisesti lehdestä toiseen (Grönlund ym. 2003). Käytännön tasolla lehtien kuvitusprosessit eivät missään nimessä ole yhdenmukaisia. Toimittajat käyttävät useita eri menetelmiä kuvituskuvien hakuun ja valintaan (Markkula, Sormunen 2000). Karkea kuvahakuprosessi on kuitenkin samanlainen ympäröivistä järjestelmistä riippumatta.

Yleinen journalistinen prosessi on nelivaiheinen: Ensin määritellään kirjoitettavan jutun lähtökohdat, ja sitten hankitaan aineisto. Seuraavaksi aineiston käsittelyn pohjalta tehdään juttuja lopuksi tarkastellaan tulosta kriittisesti (Hemánus 1990). Kuvahaussa korostuvat

erityisesti kuvitustehtävän määrittelyjä aineiston kerääminen. Kuvassa 3 on esitetty Markkulan ja Sormusen (1998) malli kuvahakuprosessista. Prosessi on iteratiivinen, kuvia valitaan, hylätään ja korvataan uusilla ehdokkailla, kunnes päästään haluttuun tulokseen.

Hyvän lehtikuvan tulisi toisaalta sisältää tietoa, olla informatiivinen tai kertova, ja toisaalta olla inhimillinen ja tunteita herättävä. Tiedonvälitys korostuu sanomalehtikuvissa,

aikakauslehdissä kuvan esteettinen arvo ja sen välittämä tunnelma ovat yleensä tärkeämpiä (Koljonen 2004). Kuvan visuaaliset ominaisuudet voivat olla tärkein syy sen valintaan aiheen sopivuuden ohella (Westman, Oittinen 2006).

Päivittäisessä sanomalehtityössä ei kuitenkaan aina ole aikaa löytää parasta kuvaa, vaan usein riittää se, että löydetään edes jotenkin sopiva. Kiire ja kuvan tärkeys sanelevat, kuinka paljon aikaa hakuihin voidaan käyttää. (Markkula, Sormunen 1998)

(27)

Muodosta haku Kuvaustehtävä

Selaa kuvakkeita lähteitä

Valitse julkaistavat kuvat

Luo kuvitusideoita (= hakuaiheita)

Selaa printtikuvia, luetteloita jne.

Kuva 3: Journalistisen kuvahaun prosessi (Markkula, Sormunen 1998) Omager (1995) jakaa journalistit kuvanhakijoina kuvatarpeen perusteella selvästi

erottuviin tyyppeihin. Ensimmäinen tyyppi on tarkka hakija, jolla on selkeästi käsitys siitä, mitä kuvaa on hakemassa. Toinen on yleinen hakija, joka vaatii, että hakutuloksissa on myös yhteyksiä muihin samaan aiheeseen liittyviin kuviin. Lisäksi on jutunkertoja, jota kuvien selaus saattaa suuresti auttaa ja tyhjän tilan täyttäjä, jolle tärkeintä on kuvan riittävä koko.

Markkulan ja Sormusen tutkimuksessa (2000) suurimmassa osassa (56 %) journalistien itse suorittamista hauista kohde oli tarkoin määrätty, kuten henkilö tai tietty rakennus. Muita suhteellisen yleisiä hakukohteita olivat yksittäiseen uutiseen liittyvät kuvat (22 %) tai abstraktit teemat (18 %). Yleisiin kohteisiin tai maantieteellisiin paikkoihin kohdistuvat haut olivat harvinaisempia.

Connisin ym. (2000) mukaan kuvilla on seitsemän peruskäyttötarkastusta Niistä useimmat tulevat kysymykseen myös aikakauslehtikontekstissa:

• Kuvitus

o Kuva liittyy esimerkiksi samanaiheiseen tekstiin.

(28)

Tiedon käsittely

e

o Kuvan sisältöä käytetään jonkin alan tiedon hankkimiseen ja prosessointiin (esimerkiksi röntgen-kuvat)

• Tiedonjakaminen

o Kuvaa käytetään jonkin tiedon välittämiseen suurelle joukolle.

• Oppiminen

o Kuvasisällöstä saatava tieto auttaa oppimisessa.

• Ideoiden luominen

o Kuvaa käytetään inspiraation lähteenä.

• Esteettinen arvo

o Kuvaa käytetään tuottamaan esteettistä mielihyvää.

• Tunteet j a vaikuttani inen

o Kuvalla aikaansaadaan tunnereaktioita tai yritetään vaikuttaa käyttäytymiseen (esimerkiksi mainonnassa tai propagandassa).

Omagerin (1995) tutkimuksessa yleisin tapa, jolla journalistit selvittivät kuvatarvettaan arkistonhoitajille, oli kuvaan haluttavan henkilön nimeäminen. Muita yleisiä

hakuelementtejä oli kuvaan liittyvä taustatieto, kuvassa oleva tapahtuma tai kuvan teema, tai tietty maa tai rakennus. Kun hakua ei nykyään välitetä arkistoa hoitavalle ihmiselle, vaan se on suoritettava tietokoneella, ei muodostettava haku enää vastaakaan suoraan hakutarvetta. Haun muodostukseen vaikuttaa tarpeen lisäksi muun muassa hakukonteksti ja käyttäjän kokemus kyseisen hakujärjestelmän ja kuvakokoelman käytössä (Jaimes 2006).

Sisältöpohjaisten hakumenetelmien hyödyntäminen journalistisessa kontekstissa on haasteellista, sillä useimmiten hakukohteena ei ole näkyvä sisältö sinänsä, vaan tietyt taustaehdot (esimerkiksi oikea tapahtumapaikka ja -aika) toteuttava kuva. Lisäksi nimettyjen kohteiden haussa tekstihaku on erittäin hyvä. (Markkula, Sormunen 1998)

2.4 Käyttäjätutkimus kuvahaussa

2.4.1 Testikokoelma ja testitehtävät

Testissä käytettävän kuvakokoelman tulisi koostua vähintään noin 25 000 (Markkula, Sormunen 2000) tai jopa 100 000 (Jörgensen 2001) kuvasta, jotta erilaisiin kuvitusideoihin löytyy riittävästi kuvia, ja kuvien selaaminen vastaa todellista työtilannetta. Ihanteellisessa testikokoelmassa kuvien määrä olisikin jo miljoonissa. Pelkkä kuvien suuri määrä ei kuitenkaan riitä, vaan tutkimustulosten reliabiliteetin ja validiteetin varmistamiseksi

(29)

kokoelman sisällössäkin tulisi ottaa huomioon kuvia työssään käyttävien todellisuus ja soveltuvuus monipuolisiin testitekniikoihin (Jörgensen 2001). Jos testikuvia on kuitenkin liian vähän, testikäyttäjien kuvanvalintakriteerit saattavat muuttua. Pienessä kuvamäärässä on todennäköisemmin aihealueita, joista ei ole kuvia juuri lainkaan, ja toisaalta vain kaikkein yleisimmistä aiheista kuvia on niin paljon, että tuloksia voi joutua selaamaan.

Pieni kuvakokoelma muuttuu myös liian nopeasti tutuksi, ja käyttäjä saattaa saada keskenään erilaisten hakujen tuloksiksi samoja kuvia, mikä ei ole kovin todennäköistä suurikokoisissa kuva-arkistoissa (Markkula, Sormunen 2000).

Markkulan ja Sormusen (2000) sisältöpohjaisen kuvahaun testikokoelman

evaluointimallissa testitehtäviä on kolmea: simuloitu kuvitustehtävä, samankaltaisuuden arviointitehtävä ja ryhmittelytehtävä. Simuloidussa kuvitustehtävässä toimittajaa

pyydetään kuvittamaan annettu artikkeli yhdellä kuvalla. Samankaltaisuuden arvioinnissa toimittaja valitsee kuvia, jotka ovat samankaltaisia kuin äsken valittu kuva.

Ryhmittelytehtävässä toimittaja ryhmittelee valitut kuvat samankaltaisuuden varmistamiseksi.

2.4.2 Testin suorittaminen

Sisältöpohjaisten kuvahakumenetelmien testaus onnistuu paremmin laboratorio-oloissa kuin aitojen käyttäjien työn yhteydessä. Tämä johtuu osaksi siitä, että sisältöpohjaiset menetelmät eivät ole laajasti käytössä kuvatoimitusten kuvapankeissa, ja niiden

sisällyttäminen olemassa oleviin järjestelmiin voisi olla hyvin kallista. Testausympäristöstä riippumatta arvioinnissa käytettävien tehtävien tulisi kuitenkin vastata aitoja työssä

kohdattuja kuvahakutehtäviä. (Markkula, Sormunen 2000)

Hyvä esimerkki sisältöpohjaisen kuvahakujärjestelmän testausmenetelmistä on Josen ym.

(1998) tekemä kahden EPIC-ohjelman version vertailutesti. Aluksi käyttäjälle annettiin johdatus testijärjestelyihin, minkä jälkeen käyttäjä vastasi esikyselyyn. Jokaisessa testissä

suoritettiin kuvahakuja molemmilla vertailtavilla järjestelmillä, joten seuraavaksi käyttäjälle esiteltiin ensimmäinen järjestelmä ja annettiin tehtävänanto. Testitehtävissä pyrittiin simuloimaan aitoja työtilanteita. Hakutehtävän suorituksen jälkeen tuli täyttää tehtävään liittyvä kysely, ja seuraavaksi samat vaiheet käytiin läpi toisen testattavan version kanssa. Viimeisenä testin vaiheena oli koko testiin liittyvään loppukyselyyn vastaaminen.

Testin loppukyselyssä käyttäjiä pyydettiin kuvailemaan testikokemuksen eri puolia seitsemänasteisilla semanttisilla differentiaaleilla, joissa käsiteltiin niin tehtäviä (esimerkiksi selkeä - epäselvä, yksinkertainen - monimutkainen), hakuprosessia

(kiinnostava - tylsä, miellyttävä - epämiellyttävä), tulosjoukkoa (hyödyllinen - hyödytön, täydellinen - puutteellinen) kuin koko järjestelmääkin (nopea - hidas, luotettava -

epäluotettava). Negatiivisten ja positiivisten termien järjestystä muutettiin satunnaisesti.

(Jose ym. 1998)

(30)

Testin aikana voidaan kerätä tieto kaikista käyttäjän suorittamista toiminnoista

lokitiedostoon, joka voidaan myöhemmin analysoida. Käyttölokin keräämisen parhaita puolia on se, että se ei mitenkään häiritse käyttäjän tekemisiä. Lokia voidaan kerätä yksittäisten käytettävyystestien lisäksi pitkältäkin ajalta ja useilta käyttäjiltä.

Aikakoodattuja lokitietoja voidaan analyysivaiheessa yhdistää muunmuotoiseen dataan, esimerkiksi ääneenajattelunauhoitteeseen, käyttäjän silmänliikkeiden seurantadataan (Granka, Rodden 2006) tai ruudulta kaapattuun videokuvaan (Goodrum ym. 2003, Hung 2005). Haittana se, että analysointiin tarvitaan automaattisia ohjelmistoja. Aitojen käyttäjien syöttämien tietojen käsittelyssä käyttäjän yksityisyys on vaarassa, jos hyvää testietiikkaa ei noudateta (Nielsen 1994).

2.4.3 Tehtävien luokittelu

Testitehtäviä ja yleisemmin hakuja voidaan luokitella esimerkiksi Jörgensenin (1999) neliluokkaisella järjestelmällä tai Ing wersenin ja Järvelinin (2005) luokittelulla, joka sisältää kahdeksan eri luokkaa. Fidelin (1997) esittämä kuvahakujen spektri ei ole yhtä tarkoin jaoteltu. Se alkaa hausta, jonka tavoitteena on kuvan sisältämä tieto (data pole) ja päättyy hakuun, jossa tavoitteena on kuvan sisältämä kohde itsessään (object pole).

Hakutehtävät voidaan asettaa joko asteikon ääripäihin tai niiden välille.

Jörgensenin luokat ovat seuraavat:

1. Haut joissa etsitään tiettyä kuvaa tietystä kohteesta (esimerkiksi Monefn maalaus Rouenin katedraalista)

2. Haut joissa etsitään kuvaa jonkin yleisen luokan tietystä yksilöstä (kuva Rouenin katedraalista)

3. Haut joissa etsitään kuvaa edustamaan jotain yleistä luokkaa tai aihealuetta (kuva katedraalista)

4. Haut, joissa etsitään kuvia, jotka välittävät jonkin abstraktin käsitteen (kuva katedraalista, joka symboloi kirkon mahtia keskiajalla).

Ingwersenin ja Järvelinin luokituksessa (taulukko 1) haut on jaettu yhteensä kahdeksaan ryhmään. Hakutehtävän luokitukseen vaikuttaa ensinnäkin se, onko haun tavoitteena itse kuva vai jokin kuvaan liittyvä dataelementti, ja toiseksi se, onko haun lähtökohtana tietoa kuvan sisällöstä vai metadatasta. Lisäksi hakutehtäväluokat on jaettu sen mukaan, onko hakuun syötetty tieto virheellistä (muddled).

(31)

Taulukko 1: Ingwersenin ja Järvelin in hakutehtäväluokittelu

T iedonhakutavoite Tunnetun tiedon tyyppi

Tietolähteen sisällön haku

Tietoyksikön haku

Tiedonhaullinen Tietty nimike (i) Tietty data-

tietämys elementti (2)

Virheellinen Virheellinen nimike (5) dataelementti (6) Tiedollinen ja Tietty aihe tai Informaatiotarve

toiminnallinen sisältö (3) (4)

tietämys

sovellusalueesta Virheellinen Virheellinen aihe tai sisältö a) informaatio (8)

2.4.4 Tehtävätyyppejä

Edellä esitetyn perusteella kuvahakuun liittyvässä käytettävyystestissä suoritettavat tehtävät voisivat olla esimerkiksi seuraavien kaltaisia:

• Annetun esimerkkikuvan löytäminen

o Annetaan käyttäjälle kuva-arkistosta löytyvä kuva, joka käyttäjän on haettava. Kuvan lisäksi voidaan antaa myös siihen liittyviä metatietoja.

• Annetun artikkelin kuvittaminen

o Annetaan käyttäjälle enimmillään valmis artikkeliteksti, vähimmillään pelkkä otsikko, ja pyydetään käyttäjää hakemaan tietty määrä artikkeliin sopivia kuvia.

• Tietyn tunnelman välittävän kuvan etsiminen

o Käyttäjälle annetaan sanallinen kuvaus tunnelmasta, jonka välittämisessä kuvan tulisi olla apuna.

• Tietyn informaation sisältävän kuvan etsiminen

o Esitetään jokin kysymys, johon vastaamiseen tarvittava faktatieto löytyy jostakin kuvasta. Esimerkiksi ”Montako mastoa on priki-tyyppisessä purjealuksessa?”

(32)

Sopivimman kuvan etsiminen tietystä aiheesta

o Painotetaan tehtävänannossa, että käyttäjän pitää valita mielestään tehtävän kontekstiin parhaiten sopiva kuva. Kuva-arkistossa on oltava useita

mahdollisia tuloskuvia, ei vain yhtä ainoaa oikeaa. Tällä korostetaan selausta ja vertailua.

(33)

3 TOTEUTETTU KUVAHAKUJÄRJESTELMÄ

3.1 Järjestelmä yleisesti

Tutkimuksen yhteydessä toteutettiin yksittäisellä PC:llä toimiva ohjelma, jolla voi hakea kuvia tietokoneella olevasta kuva-arkistosta teksti- ja sisältöpohjaisilla hauilla sekä eri hakutapoja yhdistelemällä.. Kuvien metatiedot on lisätty tietokantaan, joka sisältää kunkin kuvan tunnistenumeron, kuvaan liittyvät asiasanat ja luokittelutiedon sekä

sisältöinformaation eli kuvatiedostosta lasketut visuaaliset ominaisuudet Ohjelma laadittiin Eclipse-kehitysympäristössä Java-kielen versiolla SE 5.

Käyttäjätesteissä ohjelmaa käytettiin Viestintätekniikan laboratorion kannettavalla

tietokoneella, jonka laajakuvanäytön kokoon (1280 x 800 kuvapistettä) ohjelma sovitettiin.

Kuvahakuohjelma sisältää joukon toimintoja, jotka esitellään myöhemmin tässä luvussa..

Vaatimukset toiminnoille saatiin tutkimuksellisista tavoitteista ja kirjallisuuden pohjalta.

Ohjelman toiminnot on jaettu viiteen ikkunaan, jotka vastaavat eri käyttötilanteita (kuva 4).

Kuva 4: Kuvahakuohjelman ikkunat

(34)

Kuvassa 4 on esitetty seuraavat toimintoikkunat:

A Pääikkuna, jossa kuvahaut laaditaan, ja jossa tulokset esitetään. Lisäksi tuloskuvien tallennus tapahtuu pääikkunassa.

В Kuvankatseluikkuna, joka näyttää yksittäisen kuvan suurempana ja lisäksi sen asiasanat, luokan ja muut metatiedot. Tästä ikkunasta käynnistetään esimerkki-ja pikahaut.

C Suurennusikkuna, jossa kuvaa voi tarkastella koko täysikokoisena koko ruudun täyttävässä ikkunassa.

D Kuvien vertailuikkuna, jossa tallennettuja tuloskuvia on mahdollista vertailla.

E Kaksiulotteinen värijärjestysikkuna, jossa tuloskuvia voi järjestää kahden värin perusteella tasolle.

Kuvassa 5 on kuvankaappaus ohjelman pääikkunasta. Kuvaan on merkitty vasemmassa laidassa olevat hakutoiminnot: tekstihaku (A), värihaku (B), luonnoshaku (C), laatuhaku (D) ja luokkahaku (E), sekä muut toiminnot: haun aloitus ja resetointi (F), järjestäminen (G), käytössä olevien hakutoimintojen ilmaisin (H), viestikenttä (I), tallennettujen kuvien kenttä (J) ja tuloskuvakenttä (K). Loput haut eli kuvakohtaiset pika-ja esimerkkihaut käynnistetään yksittäisen kuvan katseluikkunasta.

Kuva 5: Kuvahakuohjelman perusikkuna