• Ei tuloksia

the Combined performance of blind image quality metrics in quality-based classification of images

N/A
N/A
Info
Lataa
Protected

Academic year: 2022

Jaa "the Combined performance of blind image quality metrics in quality-based classification of images"

Copied!
167
0
0

Kokoteksti

(1)

Viestintätekniikka Diplomityö

Johannes Hidén

Valokuvaa sokeasti arvioivien algoritmien yh­

distetty suorituskyky laatuun pohjautuvassa kuvien luokittelussa

Diplomityö, joka on jätetty opinnäytteenä tarkastettavaksi diplomi-insinöörin tutkintoa varten Espoossa 31.7.2008.

Valvoja professori Pirkko Oittinen

(2)

Tekijät, työn nimi

Johannes Hidén

Valokuvaa sokeasti arvioivien algoritmien yhdistetty suorituskyky laatuun pohjautuvassa kuvien luokittelussa

Päivämäärä: 31.7.2008 Sivumäärä: 123 S.

Tiedekunta

Elektroniikan, tietoliikenteen ja automaation tiedekunta

Professuuri

AS-75 Viestintätekniikka

Työn ohjaaja

Pirkko Oittinen

Digitaalisten valokuvien valtavaksi noussut määrä kasvattaa tarvetta niiden erilaiseen luokitteluun niin yksityisten kuvien hallinnassa kuin ammattikäyttöön tarkoitetuissa kuvahakusovelluksissakin. Tämän työn tavoitteena oli tutkia kuvanlaadun automaattista määrittämistä tällaisen luokittelun yhtenä apukei­

nona.

Kokonaislaadun teknisen, esteettisen ja merkityksellisen ulottuvuuden määrittämiseen esitettiin teoreet­

tinen malli, jossa pyrittiin ottamaan kaikki koettuun kuvanlaatuun vaikuttavat tekijät huomioon aina hen­

kilökohtaisista mieltymyksistä lähtien. Mallin perusideana on, että kuvaan kiinteästi liittyvät ominaisuu­

det tulisi laskea valmiiksi osaksi tietokantaa, minkä jälkeen attribuuttien mitatut arvot voisi nopeammin sitoa kontekstiin ja käyttäjäkohtaisiin preferensseihin laadun määrittämiseksi.

Kokeellisessa osuudessa perehdyttiin erityisesti terävyyden ja kohinan sekä näiden laadullisen yhteis­

vaikutuksen laskentaan. Sekä testattua kohina-algoritmia että terävyyden mittana käytettyä sumeusal- goritmia kehitettiin eteenpäin. Kohina-algoritmin kohdalla Pearsonin korrelaatiokertoimella mitattua kor­

relaatiota ensimmäisen testikierroksen testeissä havaittuun kohinaan saatiin kasvatettua koko kuvajou- kon osalta keskimääräisestä 34 prosentista 79 prosenttiin sekä jätettäessä terävöitetyt kuvat huomioi­

matta 79 prosentista noin 89 prosenttiin. Sumeusalgoritmin osalta kehitetyn version korrelaatio nousi alkuperäisen algoritmin 80 prosentista parametreistä riippuen 85-87 prosenttiin ensimmäisen testikier­

roksen kuvilla, kun taas korrelaatio validointitesteissä määritettyyn subjektiiviseen kokonaislaatuun nousi alkuperäisen menetelmän vajaasta 79 prosentista parametreistä riippuen 82-83 prosenttiin.

Kokonaislaadun määrittämiseksi yksittäisiä attribuutteja mittaavien algoritmien pohjalta ehdotettiin kahta erilaista menetelmää: attribuuttien suhteellista painottamista sekä moniulotteista mallinnusta. Paino- tusmenetelmällä subjektiiviseen kokonaislaatuun suhteutettu korrelaatio nousi validointitesteissä 84 prosenttiin, mikä on hieman korkeampi kuin kummallakaan yksittäistä attribuuttia mittaavista algorit­

meista. Tämän lisäksi menetelmän toissijaiseksi suorituskyvyn mittariksi esitetylle vakaudelle saatiin kokonaismenetelmän kohdalla hieman menetelmän tärkeimmällä osalla eli terävyysalgoritmilla saatua korkeampi arvo. Vaikka moniulotteisella mallinnuksella vastaavaksi korrelaatioksi saatiin vain noin 76%, suositellaan tätä menetelmää kuitenkin jatkossa käytettäväksi. Syynä tähän on painotusmenetelmän parametrien optimoimisen hankaluus varsinkin useampia attribuutteja mitatessa sekä kykenemättö­

myys mallintaa kaikkia yksittäisten attribuuttien keskinäisiä vuorovaikutussuhteita. Moniulotteinen mal­

linnus tarjoaa periaatteen tasolla automaattisen ratkaisun molempiin, kunhan menetelmän pohjaksi on saatu määritettyä riittävän suuri subjektiiviseen ja objektiiviseen dataan pohjautuva laatuavaruus.

Avainsanat: kuvanlaatu, referenssitön määritys, algoritmi, moniulotteinen mallinnus, kuvien luokittelu, kuvien hallinta, terävyys, kohina

(3)

Author

Johannes Hidén

The combined performance of blind image quality metrics in quality-based classification of images

Date: 31.7.2008 Pages: 123 p.

Faculty Professorship

Faculty of Electronics, Communications AS-75 Media Technology and Automation

Supervisor

Pirkko Oittinen

As the amount of digital photographs has become vast, the need for categorizing and classifying them has increased in both professional and private applications. This research concentrated on the concept of measuring image quality automatically as a means for such classification.

A theoretical model was proposed for measuring the technical, aesthetic and meaningful aspects of im­

age quality. The model tries to consider all the possible factors influencing overall image quality, includ­

ing personal preferences. One of the basic premises of the model was the idea of measuring the attrib­

utes that are an integral part of the image beforehand and recording them to the image database, after which the measured values can be more quickly interpreted as a context and user preference depend­

ent measure of image quality.

In the experimental part the measurement of sharpness and noise as well as their combined influence on quality was the primary subject of interest. Both the tested algorithm for measuring noise and the al­

gorithm for measuring blur as a metric of sharpness were further developed. For the newly proposed noise algorithm the mean correlation to the noise evaluations from all the images in the first subjective experiments as defined by Pearson’s correlation coefficient rose to 79% as compared to 34% of the original algorithm, whereas by excluding the sharpened images the correlation rose from 79% to about 89%. For the proposed blur algorithm the measured mean correlation was 85-87% depending on the parameters as compared to 80% per cent of the original algorithm for the images in the first subjective experiments, whereas the correlation to the image quality defined in the validation tests rose from less than 79 per cent of the original to 82-83% depending on the used parameters.

For defining overall quality based on the algorithms measuring individual attributes two different meth­

ods were proposed: the relative weighting of the attributes and multidimensional modeling. With the weighting method the correlation to subjective image quality defined in the validation tests rose to 84 per cent, which is slightly higher than either of the correlations provided by the individual components.

In addition, stability, which was defined as a secondary measure of overall performance, was also measured slightly higher for the overall quality method than for its most important component, the blur measure. Although multidimensional modeling resulted in a correlation of only 76%, it is recommended for future purposes. One reason for this is that optimizing the parameters for the weighting method is troublesome especially in case of numerous attributes. With the weighting method it is also impossible to model all the interactions between individual attributes. In principle, multidimensional modeling offers an automatic solution for both problems. The only requirement is a quality space defined by an ade­

quate amount of subjective and objective data.

Keywords: image quality, blind measurement, algorithm, multidimensional modeling, image classifica- tion, image management, sharpness, noise

(4)

ALKUSANAT

Tämä diplomityö on tehty Teknillisen korkeakoulun Viestintätekniikan laboratoriossa kevään 2008 aikana. Haluan lämpimästi kiittää professori Pirkko Oittista mielenkiintoisen aiheen tar­

joamisesta sekä tuesta työn edetessä ilmenneissä ongelmatilanteissa. Stina Westmania kiitän arvokkaista vinkeistä erityisesti subjektiivisten testien suunnittelussa, Johannes Pullaa hyödyl­

lisestä testiohjelmasta sekä muuta laboratorion henkilökuntaa mukavan työilmapiirin luomi­

sesta.

Haluan myös kiittää avopuolisoani Tanjaa mittaamattoman arvokkaasta henkisestä tuesta koko työn aikana. Lisäksi kiitän kaikkia subjektiivisiin testeihin osallistuneita henkilöitä, joita ilman koko tutkimusta ei olisi voitu tehdä.

Espoossa 1. heinäkuuta 2008

Johannes Hidén

(5)

1 JOHDANTO...1

1.1 Taustaa...1

1.2 Tutkimuksen tavoite ja rajaus... 2

1.3 Työn rakenne... 3

2 KUVANLAATU... 4

2.1 Yleistä... 4

2.1.1 Kuvanlaadun määritelmästä lyhyesti... 4

2.1.2 Subjektiivinen ja objektiivinen kuvanlaatu... 4

2.1.3 Kuvanlaadun ja sen mittaamisen merkitys... 5

2.2 Kokonaisvaltaisia kuvanlaadun käsitteitä... 5

2.2.1 Yleistä... 5

2.2.2 Vetoavuus...6

2.2.3 Laatu... 6

2.2.4 Hyödyllisyys...7

2.2.5 Kuvainformaatio...8

2.2.6 Toiston tarkkuus suhteessa todellisuuteen ja luonnollisuus...8

2.2.7 Vääristyne isyys ja häiritsevyys... 9

2.3 Matalamman tason käsitteitä...9

2.3.1 Yleistä... 9

2.3.2 Toiston tarkkuus suhteessa referenssikuvaan... 10

2.3.3 Värien luonnollisuus... 11

2.3.4 Väritasapaino... 12

2.3.5 Värikkyys... 12

2.3.6 Terävyys... 12

2.3.7 Kontrasti... 14

2.3.8 Kohina... 14

2.3.9 Pakkausvääristymät... 15

2.4 Ominaisuuksien väliset suhteet... 16

2.4.1 Merkitys kuvanlaadun tutkimuksessa... 16

2.4.2 Matalan tason ominaisuuksien keskinäisiä vuorovaikutuksia... 17

2.4.3 Matalan tason ominaisuuksien suhde kokonaisvaltaisiin laadun käsitteisiin. 18 2.4.4 Kokonaisvaltaisten käsitteiden keskinäisistä suhteista... 19

2.5 Yhteenvetoja pohdintaa kuvanlaatuun liittyvistä käsitteistä... 19

3 KUVANLAADUN SUBJEKTIIVINEN MITTAAMINEN... 21

3.1 Kuvanlaadun määrittämisestä...21

3.1.1 Miksi mitataan?...21

3.1.2 Mittausprosessi...22

3.2 Ihminen kuvan arvioijana...22

3.2.1 Psykologiset ja yksilölliset tekijät... 22

3.2.2 Perussuosituksia testejä ajatellen... 23

3.3 Kuvat arvioinnin kohteena...24

3.4 Arvioinnissa käytettävät mitat ja menetelmät... 24

3.4.1 Yleistä...24

3.4.2 Juuri havaittavissa oleva ero eli JND... 25

(6)

3.4.3 Mittausmenetelmiä...26

3.5 Menetelmien ja koejärjestelyjen valinta...27

3.5.1 Tavoitellun totuuden anatomia... 27

3.5.2 Koejärjestelyjen määrittäminen... 28

4 KUVANLAADUN KONEELLINEN MITTAAMINEN...30

4.1 Algoritmeista yleisesti...30

4.1.1 Johdanto... 30

4.1.2 Algoritmien luokittelu...30

4.1.3 Minkälainen on hyvä algoritmi?... 32

4.1.4 Algoritmien ongelmista... 35

4.2 Ihmisen näköjärjestelmän ominaisuuksien merkitys... 36

4.2.1 Kontrastiherkkyys...36

4.2.2 Värinäkö...37

4.2.3 Kuvasisällön vaikutus...37

4.3 Attribuuttien objektiivinen mittaaminen... 38

4.3.1 Yleistä...38

4.3.2 Kohina...38

4.3.3 Terävyys tai sumentuneisuus... 39

4.3.4 Kontrasti...41

4.3.5 Värikkyys...42

4.3.6 Värien luonnollisuus...43

4.3.7 Pakkausvääristymät...44

4.3.8 Yhteenveto objektiivisesti mitattavista attribuuteista...45

4.4 Koetun kokonaislaadun ennustaminen... 47

4.4.1 Attribuutin vaikutus koettuun laatuun... 47

4.4.2 Yksittäisten attribuuttien yhdistäminen kokonaisvaltaisen laadun määreeksi 47 4.4.3 Kuvasisällön vaikutus attribuutin laatuun ja painotukseen...52

4.4.4 Henkilökohtaisten mieltymysten merkitys... 54

4.4.5 Malli kokonaislaadun määrittämiseksi... 54

4.5 Algoritmien kehitystyö...59

4.5.1 Kehitystyön osa-alueita...59

4.5.2 Erilaisia lähestymistapoja...60

4.5.3 Tilastolliset menetelmät...61

4.5.4 Näkökulmia menneeseen ja tulevaan... 63

5 KUVIEN LUOKITTELU JA MUITA KUVANLAADUN AUTOMAATTISEN MITTAAMISEN SOVELLUKSIA... 64

5.1 Sovelluksista yleisesti...64

5.2 Kuvanlaadun optimointi...64

5.2.1 Laitteiden kehitystyö...64

5.2.2 Laadun parannus jälkiprosessoinnilla... 65

5.2.3 Laadun ylläpito...66

5.3 Luokittelusovelluksia...67

5.3.1 Journalistinen kuvahaku... 67

5.3.2 Yksityisten kuvien hallinta... 67

5.3.3 Kuvien jakaminen...68

5.3.4 Kuvat tiedonvälittäjinä...68

5.4 Lyhyt katsaus tulevaan...69

(7)

6.1 Tutkimusongelma... 70

6.2 Vaihe 1: Määrittelevä testikierros... 70

6.2.1 Kuvien valinta...70

6.2.2 Kuvien esikäsittely...72

6.2.3 Testihenkilöt...74

6.2.4 Subjektiivinen arviointimenetelmä... 74

6.2.5 Subjektiivisen testin arviointiympäristö ja testin kulku...75

6.2.6 Objektiiviset mittaukset...76

6.3 Vaihe 2: Kokonaislaatua ennustavan menetelmän kehittäminen...76

6.4 Vaihe 3: Kehitetyn menetelmän validointi uudella testikierroksella...77

6.4.1 Käytettävät kuvat...77

6.4.2 Testijärjestelyt...78

6.4.3 Tulosten käsittely...79

7 VAIHE 1 : MÄÄRITTELEVÄN TESTIKIERROKSEN TULOSTEN TARKASTELU. 80 7.1 Yleisiä huomioita tulosten esittämisestä... 80

7.2 Subjektiiviset testit...80

7.2.1 Subjektiiviset laadun arviot...80

7.2.2 Subjektiiviset attribuuttien arviot... 82

7.2.3 Attribuuttien arviot suhteessa laadun arvioihin... 84

7.2.4 Kyselylomakkeen vastaukset... 85

7.3 Objektiiviset testit... 86

7.3.1 Marzilianon et ai. (2002) sumentuneisuus-Zterävyysalgoritmi...86

7.3.2 Immerkaerin (1996) kohina-algoritmi... 87

7.3.3 Muut algoritmit...88

7.4 Subjektiivisten ja objektiivisten tulosten keskinäiset yhteydet...89

7.4.1 Terävyys ja laatu...89

7.4.2 Kohina ja laatu...91

7.5 Johtopäätökset ja luotettavuusanalyysi... 93

8 VAIHE 2: KUVANLAADUN LASKENTAMENETELMÄN KEHITTÄMINEN... 95

8.1 Kehitetyt attribuuttikomponentit... 95

8.1.1 Terävyyskomponentti... 95

8.1.2 Kohinakomponentti...98

8.2 Komponenttien yhdistäminen laadun arvioksi...101

8.2.1 Yleistä attribuuttien yhdistämisestä...101

8.2.2 Attribuuttilaatujen painotusmenetelmä... 101

8.2.3 Moniulotteinen mallinnus... 102

8.3 Parametrien määritys algoritmeille ja kuvaryhmille... 103

8.3.1 Parametrien valinnasta... 103

8.3.2 Kuvien ryhmittelyn tarkoitus... 104

8.3.3 Valintojen tekeminen tutkimuksen kuvaryhmille... 105

8.3.4 Kokonaismallin linearisointi... 106

8.3.5 Komponenttien yhdistystavan vaatimukset parametrien valinnassa... 107

9 VAIHE 3: VALIDOINTITESTIN TULOSTEN TARKASTELU... 108

9.1 Subjektiivisen testin tulokset... 108

9.1.1 Kuvien laadun arviot... 108

(8)

9.1.2 Kyselylomakkeen vastaukset...108

9.2 Attribuutteja mittaavien algoritmien suorituskyky... 109

9.2.1 Terävyysmenetelmä... 109

9.2.2 Kohinamenetelmä... 110

9.3 Kokonaismenetelmän suorituskyky... 111

9.3.1 Attribuuttien painotusmenetelmä...111

9.3.2 Moniulotteinen mallinnus... 113

9.3.3 Luotettavuusanalyysi ja havaintoja tuloksista...116

9.4 Menetelmän käyttökelpoisuus... 116

9.4.1 Menetelmän kyky ennustaa laatua...116

9.4.2 Menetelmän tuottamien arvioiden käytännön tulkinta... 118

9.4.3 Menetelmän optimoitavuus kuvaryhmälle sopivaksi... 118

9.4.4 Laskennallinen näkökulma...119

9.4.5 Ongelmakohtia ja puutteita... 119

10 YHTEENVETO... 121

10.1 Tutkimuksen kulkuja keskeisimmät havainnot...121

10.2 Jatkotutkimusehdotuksia... 123 LÄHDELUETTELO

LIITE 1 - LAADUN ENNUSTAMISEN KOKONAISMALLI LIITE 2 - MÄÄRITTELEVÄN TESTIN OHJEET

LIITE 3 - MÄÄRITTELEVÄN TESTIN KYSYMYKSET LIITE 4 - VALIDOINTITEST1N OHJEET

LIITE 5 - VALIDOINTITESTIN KYSYMYKSET

LIITE 6 - MÄÄRITTELEVÄN TESTIN LAADUN ARVIOT LIITE 7 - MÄÄRITTELEVÄN TESTIN ATTRIBUUTTIARVIOT

LIITE 8 - MÄÄRITTELEVÄN TESTIKIERROKSEN KYSELYN VASTAUKSET LIITE 9 - MÄÄRITTELEVÄN TESTIKIERROKSEN OBJEKTIIVISET TULOKSET LIITE 10 - KEHITETYN SUMEUSMENETELMÄN KOODI

LIITE 11 - KEHITETYN KOHINAMENETELMÄN KOODI

LIITE 12 - KOODI LAADUN MÄÄRITYKSEEN ATTRIBUUTTEJA PAINOTTAMALLA LIITE 13 - KOODI LAADUN MÄÄRITYKSEEN MONIULOTTEISELLA

MALLINNUKSELLA

LIITE 14 - VALIDOINTITESTIN KUVIEN SUBJEKTIIVISET LAADUNARVIOT LIITE 15 - VALIDOINTITESTIN KYSELYN VASTAUKSET

LIITE 16 - VALIDOINTITESTIN KUVISTA ALGORITMEILLA LASKETUT ATTRIBUUTTIEN ARVOT

LIITE 17 - VALIDOINTITESTIN KUVISTA ALGORITMEILLA LASKETUT LAADUN ARVOT

(9)

Algoritmi Ohjelmalle annettu ohjeiden sarja, jolla määritetään esi­

merkiksi jonkin attribuutin arvo

Artefaktuaalinen attribuutti Attribuutti, joka kuvassa havaittuna johtaa lähes poikke­

uksetta kuvanlaadun heikentymiseen (ISO 20462-1, 2005)

Attribuutti Kuvan jokin ominaisuus (esim. kohina, terävyys, värik­

kyys)

Attribuutti-JND Yksikkö, joka vastaa jonkin attribuutin juuri ja juuri ha­

vaittavissa olevaa muutosta (kts. JND)

Attribuutti laatu Tässä työssä käytetty käsite, joka kuvaa jonkin attribuu­

tin havaittua laatua.

CIEL AB -avaruus Vastaväreihin pohjautuva väriavaruus, jossa L on vaale­

us, a* viher-puna-akseli ja b* sini-kelta-akseli

FUN-kolmijako Kuvan laadun jakaminen toiston tarkkuuteen, hyödylli­

syyteen ja luonnollisuuteen

Globaali Koko kuvaa koskeva

Heteroskedastisuus Tilanne, jossa virhetermien eli residuaalien hajonta vaih- telee ennustavien muuttujien arvoista riippuen

Histogrammi Kuvan pikseleiden arvojakauma

ISO Kansainvälinen standardisointiorganisaatio (International Organization for Standardization)

ISO-herkkyys ISO:n standardoima kameroissa käytetty valoherkkyyden mitta

JND Just Noticeable Difference eli juuri ja juuri havaittavissa oleva ero

Kolmoisvertailumenetelmä ISO 20462-2 -standardissa määritetty subjektiivisen ar­

vioinnin menetelmä, jossa kolmea kuvaa vertaillaan sa­

manaikaisesti

(10)

Korrelaatio Mittaa kahden muuttujan kuten esimerkiksi attribuutin subjektiivisten arvioiden ja algoritmilla mitattujen arvo­

jen suhteen vahvuutta. Sen mittaamiseen käytetään yleensä Pearsonin korrelaatiokerrointa. Myös tässä työs­

sä korrelaatiolla tarkoitetaan Pearsonin korrelaatioker­

rointa, ellei muuta erikseen mainita.

Laaduttaminen Tässä työssä käytettävä käsite, jolla viitataan jonkin att­

ribuutin muuttaamiseen kyseistä attribuuttia kuvaavaksi laadun mitaksi eli attribuuttilaaduksi.

Laatuavaruus Tämän työn yhteydessä käytetty termi moniulotteisesta avaruudesta, jonka ulottuvuuksina toimivat kuvaan liit­

tyvät attribuutit

Laatu-JND Yksikkö, joka vastaa juuri ja juuri havaittavissa olevaa muutosta kuvanlaadussa (kts. JND)

Luonnollinen kuva Näkyvän valon perusteella ympäristöstä muodostettu va­

lokuva

Luminanssikanava Kuvan valoisuusjakauma, joka yksinään muistuttaa mus­

tavalkokuvaa, mutta yhdistettyinä värikanaviin muodos­

taa tavallisen värikuvan

Matlab Laskentaohjelma, josta tämän työn yhteydessä käytettiin pääasiassa 6.5.2004 julkaistua versiota 7.0.0.19920 (R14).

Monotoninen Jos kahden muuttujan välinen suhde eli funktio on mo­

notoninen, yhden muuttujan kasvaminen vaikuttaa toi­

seen muuttujaan aina samansuuntaisesti. Toisin sanoen jos muuttujan 1 kasvu laskee muuttujan 2 arvoa jonkin arvon kohdalla, se tekee samoin myös muiden arvojen kohdalla

Mieltymyksellinen attribuutti Attribuutti, jonka ihanteellinen voimakkuus riippuu tark­

kailijasta ja kuvasisällöstä (ISO 20462-1, 2005)

Outlieri Tilastollisesti merkittävä poikkeama otannassa, jolle voidaan esittää useita erilaisia määritelmiä.

Parivertailu Arviointimenetelmä, jossa kahta näytettä kerrallaan ver-

(11)

kin yksittäisen attribuutin perusteella

Regressiosuora Muuttujien arvojen perusteella pienimmän neliösumman menetelmällä määritetty muuttujien välistä yhteyttä ku­

vaava suora

Residuaali Havaitun ja ennustetun välinen erotus tai erotuksen neliö (Metsämuuronen 2006, s. 597). On huomioitava, että en­

nustettu ei tämän työn yhteydessä tarkoita algoritmin tuottamaa ennustusta, vaan algoritmin ja subjektiivisten testien tuottamien arvioiden välistä yhteyttä kuvaavan regressiosuoran tai -käyrän ennustamaa arvoa.

Saturaatio Värikylläisyys

Selektiivisyys Algoritmin kyky kiinnittää huomiota vain mitattavana olevaan attribuuttiin jättäen muut attribuutit huomiotta.

Sokea laadun arviointi Ilman referenssikuvaa tapahtuva laadun määritys

Sisäinen referenssi Sisäinen muistikuva siitä, miltä jonkin kohteen tulisi näyttää

Ulkoinen referenssi Kuvan alkuperäinen fyysinen kohde, jota kuvan on tar­

koitus jäljitellä

Väritasapaino Kuvan värikomponenttien tasapaino suhteessa toisiinsa Värikanava Kuvan yhden värin tai kahden vastavärin suhdetta ku­

vaavien arvojen jakauma

(12)

1 JOHDANTO 1.1 Taustaa

Valokuvista on tullut digitaalisen valokuvauksen kehittymisen myötä entistä merkittävämpi osa ihmisten arkea. Tämä koskee erityisesti yksityiselämää, jossa tavallisten harraste lijakuvaa- jien ja varsinkin harrastelijakuvien määrä tuntuu kasvaneen räjähdysmäisesti viime vuosien aikana. Kuvien valtava määrä sekä tietotekniikan mahdollistamat uudet tehokkaat jakelukana­

vat lisäävät tarvetta kuvien luokittelulle ja arvottamiselle, mikä toimii myös motivaationa tälle työlle.

Ehkä helpoin tapa luokitella kuvia on niiden semanttinen sisältö. Yksinkertaisimmillaan tämä tapahtuu jakamalla kuvat toisensa lähtökohtaisesti poissulkeviin kategorioihin. Tehokkaam­

maksi ja joustavammaksi luokittelu saadaan kuitenkin käyttämällä kuviin metadatana liitettä­

viä avainsanoja, joiden avulla kuva voi samanaikaisesti kuulua lukuisiin erilaisiin kuvaryhmiin (Hyvönen et ai. 2003). Tällaista avainsanoihin perustuvaa järjestelmää käytetään muun muassa kaupallisissa kuvapankeissa kuten Shutterstockissa (www.shutterstock.com). Myös tämän alan maailma on kuitenkin muuttunut huomattavasti digitaalisen valokuvauksen vallankumouksen myötä. Yksi syy on se, että monien yritysten liiketoiminta pohjautuu enenevissä määrin har- rastelijavalokuvaajien ottamiin valokuviin (Howe 2006). Tässä murroksessa on näin ollen syy­

tä tutkia edelleen mahdollisia uusia keinoja luokittelun tehostamiseksi.

Vaikka kuvien avainsanoihin pohjautuvat haut voivat olla suhteellisen tehokkaita vastaamaan hakijan tarpeisiin, ne kuitenkin vaativat käytännössä aina manuaalisen määrittämisen. Aina tähän ei haluta tai ole edes mahdollista käyttää aikaa tai resursseja, joten on perusteltua kehit­

tää myös automaattisia kuvien luokittelumenetelmiä. Yksinkertaisimmasta päästä olevia kuvan tunnistustehtäviä on erottaa automaattisesti aidot valokuvat erilaisista keinotekoisista kuvista.

Siinä onkin saavutettu hyviä tuloksia, kuten Lienhartin ja Hartmannin (2002) tutkimuksessa, jonka taustamotivaatioksi tekijät mainitsevat juuri hakukoneiden tehostamisen tekstuaalisen haun ulkopuolelle. Hu ja Bagga (2004) puolestaan pyrkivät tutkimuksessaan ennustamaan uu- tissivuston kuvien käyttötarkoitusta eli sitä, onko kyseessä esimerkiksi mainos-, logo-, esikat­

selu- tai varsinainen uutiskuva. Tämä voisi heidän mukaansa olla hyödyksi muun muassa tie­

don kaivamisessa sivuilta tai tiedon optimoinnissa matkapuhelimia varten. Sen sijaan luonnol­

listen kuvien semanttisen sisällön automaattisesta määrittelystä ollaan vielä kaukana. Mikäli kuvaluokkien määrä on rajallinen, voidaan kuitenkin saavuttaa kohtalaisia tuloksia luokan en­

nustamisessa. Esimerkiksi jo Vailayan et ai. (1999) tutkimuksessa saatiin 95,3%:n onnistu­

misprosentilla erotettua kaupunkikuvat maastokuvista ja metsäkuvat vuoristokuvista lähes yh­

tä hyvin.

Kuvien käyttötarkoituksen tai aihesisällön automaattisen päättelemisen lisäksi algoritmien avulla voidaan koettaa arvioida myös kuvan laadullisia ominaisuuksia kohinan kaltaisista ma­

talan tason suureista korkeamman tason käsitteisiin. Koska valokuvat on ennen kaikkea tarkoi­

tettu ihmisen havainnoitaviksi, tulee hyvin suunnitellun algoritmin pohjautua koehenkilöiden

(13)

mieltymyksiä mittaaviin subjektiivisiin arvioihin, jotka on perinteisesti kerätty tätä tarkoitusta varten suunnitelluin testein. Hyvin suunniteltu algoritmi voisi näin tehostaa esimerkiksi kuva- pankkien kaltaisten palveluiden hakutoimintoa tai auttaa rajaamaan laadultaan riittämättömät tai heikoimmat kuvat pois jossakin muussa käytännön sovelluksessa. Tämä kuvan analysoin­

nin osa-alue on tämän diplomityön keskeisin tutkimuksen aihe.

1.2 Ttutkimuksen tavoite ja rajaus

Tutkimuksen pääasiallisena tavoitteena on perehtyä kuvan erilaisia laadullisia tekijöitä mittaa- vien algoritmien kykyyn tuottaa ihmisten keskimääräisen subjektiivisen käsityksen kanssa hy­

vin korreloiva arvio digitaalisessa muodossa olevan kuvan laadusta. Käytännössä siis ensin testataan määritelty kuvajoukko testihenkilöiden avulla, jonka jälkeen voidaan verrata saatuja tuloksia algoritmien antamiin arvioihin. Samalla pohditaan menetelmien soveltuvuutta kuvan luokittelun tehostamiseen.

Laatu on käsitteenä kuitenkin hyvin subjektiivinen ja moniulotteinen, minkä vuoksi on myös tärkeää määrittää tarkoin, mitä oikeastaan mitataan. Työn teoriaosuudessa tarkastellaan tästä johtuen yleistä kuvanlaadun käsitteeseen ja mittaamiseen liittyvää problematiikkaa sekä pe­

rehdytään kuvanlaadun määrittämisen merkitykseen käytännössä sekä menneiden että mahdol­

listen tulevien sovelluksien valossa.

Työn kokeellista osuutta ajatellen on hyvä perustella kaksi keskeistä rajanvetoa. Ensinnäkin kuvan arvioitu laatu riippuu jo arvioijan suhteesta kuvaan. Keelan (2002, s. 4-5) jakaa arvioijat tällä mittapuulla kolmeen ryhmään: ensimmäiseen osapuoleen eli kuvaajaan, toiseen osapuo­

leen eli kuvassa esiintyviin sekä kolmanteen osapuoleen eli kuvaustapahtuman ulkopuolisiin tarkkailijoihin. Ensimmäisen voisi arvella kiinnittävän huomiota muita enemmän esimerkiksi kuvan rajaukseen ja kohteiden asetteluun, toisen puolestaan omaan ”onnistumiseen” kuvassa, ja kolmannen taas teknisempiin seikkoihin ja kuvan yleiseen esteettisyyteen.

Toisena tekijänä ihmiset ovat itse asiassa kuvanlaadun arvioinnissa sitä useammin eri mieltä, mitä korkeampaa kognitiivista käsittelyä vaativia ominaisuuksia pyydetään arvioimaan (Mar­

tens 2002). Tästä johtuen esimerkiksi esteettisyyden kaltaisten ominaisuuksien automaattista arviointia algoritmien avulla voidaan pitää paitsi hyvin haasteellisena, myös monia sovellus­

mahdollisuuksia ajatellen suhteellisen tarpeettomana, sillä ei ole kovin mielekästä laatia yhtä automaattista kuvan arvottajaa, joka olisi toteutuksestaan riippumatta väistämättä usein vah­

vasti eri mieltä kuin merkittävä osa sovelluksen käyttäjistä. Pienen käyttäjäryhmän valmiiksi määriteltyihin mieltymyksiin pohjautuvassa tai jonkinlaisella käyttäjäkohtaisia mieltymyksiä käyttäjäpalautteen kautta opettelevalla sovelluksella voisi kuitenkin mahdollisesti päästä koh­

talaisiin tuloksiin myös tällaisten hyvin korkean tason ominaisuuksien mittaamisessa. Tällai­

sen menetelmän kehittäminen vaatii kuitenkin huomattavasti laajempaa tutkimus- ja kehitys­

työtä.

Paitsi edellä mainituista syistä, myös korkeamman tason käsitteitä mittaamaan pyrkivien ai­

kaisempien tutkimusten vähäisyydestä johtuen tutkimuksessa keskitytään algoritmien osalta

(14)

matalamman tason tekijöihin kuten terävyyteen, kontrastiin, kohinaan ja värikkyyteen, joskin

teoriaosuudessa pohditaan myös syvemmän tason tekijöiden mittaamista. Koska subjektiivi­

sissa testeissä määritettävänä laadullisena ominaisuutena pidettiin ensisijaisesti nimenomaan luonnollisen kuvan ”laatua”, tarkastelijoina toimi niin sanottu kolmas osapuoli henkilökohtais­

ten vaikuttimien minimoimiseksi. Kolmantena rajanvetona kokeellisessa osuudessa käytettiin vain luonnollisia kuvia, eikä niiden osalta tutkittu pakkausvääristymien vaikutusta.

Vertailemalla algoritmien antamia arvoja subjektiivisista testeistä saatuihin tuloksiin pyrittiin saamaan jonkinlainen näkemys algoritmien yhdistetystä soveltumisesta kuvanlaadun arvioin­

tiin. Tavoitteena oli kehittää tapa yhdistää algoritmien arvoja sellaiseksi kokonaisuudeksi, joka suoriutuisi useimmissa tapauksissa paremmin kuvanlaadun ennustamisessa kuin yksikään al­

goritmeista yksinään. Lisäksi tutkittiin neljää kuva-aihepiiriä vertailemalla, voidaanko laa­

dunarvioinnin onnistumisen todeta riippuvan kuvan sisällöstä, ja onko laadunarviointimene­

telmän yksityiskohtia syytä muuttaa riippuen kuvan sisällöstä. Koska motivaatio tutkimukselle on kuvien luokittelun tehostaminen, laadunarviointimenetelmässä ei voida käyttää referenssi- kuvaa. Teoriaosuudessa käsitellään pintapuolisesti kuitenkin myös referenssikuvaan pohjautu­

via menetelmiä, koska ne voivat toimia ainakin periaatteellisena pohjana referenssittömille eli niin sanotuille sokeille menetelmille.

1.3 Työn rakenne

Suhteellisen laajan teoriaosien aluksi perehdytään hieman kuvanlaadun käsitteeseen yleisesti luvussa 2 etenemällä abstrakteimman tason käsitteistä yksiselitteisempiin käsitteisiin. Tämä on tärkeää kuvanlaadun problematiikan ymmärtämiseksi, algoritmien taustalla vaikuttavien käsit­

teiden määrittämiseksi sekä erilaisten kuvaominaisuuksien keskinäisten vuorovaikutuksien hahmottamiseksi. Luvussa 3 edetään kuvanlaadun subjektiiviseen mittaamiseen, mikä on kai­

ken kuvanlaadun arvioinnin perusta. Luvussa 4 siirrytään kuvien objektiivisempaan arvioimi­

seen eli esitellään kuvan laatuun vaikuttavien tekijöiden arvioimiseen kehitettyjä algoritmeja sekä tarkastellaan, miten korkeammankin tason laadullisia käsitteitä voitaisiin mallintaa algo­

ritmien avulla. Tämän jälkeen selvitetään luvussa 5, mitä käytännön sovelluksia kuvanlaadun arvioimisella oikeastaan on ollut ja mitä sovelluksia sillä mahdollisesti tulee jatkossa olemaan.

Luvussa 6 siirrytään kokeelliseen osuuteen esittelemällä tarkemmin varsinainen tutkimuson­

gelma sekä määritellään tutkimuksessa käytetyt menetelmät. Luvussa 7 esitellään ensimmäi­

sen eli määrittelevän testikierroksen subjektiivisten ja objektiivisten testien tuloksia sekä tutki­

taan näiden välistä korrelaatiota. Luvussa 8 esitellään tulosten pohjalta kehitetty laadunarvi- oimismenetelmä, jonka suorituskykyä arvioidaan luvussa 9 toisen testikierroksen tulosten poh­

jalta. Luvusta 10 löytyy tutkimuksen yhteenveto, jossa pohditaan saatuja tuloksia sekä esite­

tään ajatuksia aiheeseen liittyvistä jatkotutkimuskohteista.

(15)

2 KUVANLAATU 2.1 Yleistä

2.1.1 Kuvanlaadun määritelmästä lyhyesti

Kuvanlaatu koostuu käsitteenä kahdesta osasta: kuvasta ja laadusta. Jo sana kuva voidaan ymmärtää usealla tavalla. Se voi olla ihmisen tai tietokoneen piirtämä kuva, luonnollinen va­

lokuva, tai jotakin näiden kahden väliltä. Luonnollisella valokuvalla tarkoitetaan tässä näky­

vän valon perusteella muodostettua kuvaa, joka siis pyrkii pääosin vastaamaan ympäristöä sel­

laisena kuin ihminen sen näkee. Kuva voi pyrkiä myös välittämään jotain tiettyä tietoa, kuten esimerkiksi lämpökameroiden muodostamien kuvien tapauksessa. Selkeästi valokuvien ja kei­

notekoisten kuvien välimaastoon puolestaan kuuluvat muun muassa erilaiset esimerkiksi mai- noskäyttöön tarkoitetut kuvamanipuloinnit ja jotakin käytännön tarkoitusta varten käsitellyt kuvat, jotka voivat olla hyödyllisiä esimerkiksi tähti- tai lääketieteessä jonkin asian demon­

stroimiseksi.

Laatu puolestaan on käsitteenä hyvin moniulotteinen ja voi käytännössä tarkoittaa lukuisia eri asioita, kuten kohdassa 2.2.3 tuodaan esille. Lisäksi kuten johdannostakin käy ilmi, laatu on käsitteenä pohjimmiltaan hyvin subjektiivinen. Vaikka esimerkiksi kuvan käyttötarkoituksesta vallitsisi yhteisymmärrys, ei ole välttämättä yksimielistä, mikä tarkkuus tai värikkyysaste olisi kuvalle juuri se ihanteellisin. Eri ihmiset myös tarkkailevat kuvasta erilaisia asioita, ja ammat­

tilaiset kiinnittävät ehkä turhankin paljon huomiota asioihin, jotka liittyvät eniten heidän työ­

hönsä (I3A 2007, s. 8-9). He voivat esimerkiksi olla kriittisempiä kuvassa havaittavia virhete­

kijöitä kohtaan, kuten todettiin käyneen muun muassa Oliphantin et ai. (1989) tutkimuksessa.

Näistä syistä johtuen on kuvanlaadun tutkimuksessa aina syytä tiedostaa, mikä on käyttötar­

koitus, ketkä kuvaa tarvitsevat sekä mitä kuvalta käyttötarkoitus ja käyttäjäryhmä huomioon ottaen oikeastaan edellytetään.

2.1.2 Subjektiivinen ja objektiivinen kuvanlaatu

Kuvanlaadussa on pohjimmiltaan kyse siitä, miten ihminen kokee kuvan suoriutuvan tehtäväs­

tään, minkä vuoksi subjektiiviset testit ovat luonteva tapa kuvanlaadun määrittämiseen. Sub­

jektiivisten mielipiteiden keskiarvoon pohjautuvaa MOS:ia (Mean Opinion Score) onkin pit­

kään pidetty parhaana tapana mitata kuvanlaatua (Wang 2006, s.l). Ihmisten käyttö arvioiden saamiseksi on kuitenkin vähintäänkin aikaa ja resursseja vievää, mutta monia sovelluksia aja­

tellen myös mahdotonta. Tästä johtuen tarvitaan myös automaattisia eli objektiivisempia me­

netelmiä.

Objektiivisella kuvanlaadulla tarkoitetaan tyypillisesti suhteellisen yksinkertaisesti mitattavis­

sa olevia suureita, joihin esimerkiksi valokuvauslaitteiden tekniset ominaisuudet vaikuttavat suoraan. Objektiivisen laadun määrittämisen voi jakaa kahteen kategoriaan: laiteriippuvaiseen ja laiteriippumattomaan. Näistä ensimmäinen sitoo järjestelmän tekniset parametrit, kuten

(16)

DPI-luvun (eli tuuman matkalle osuvan pistemäärän) tai kontrastin ihmisen havaintoihin (Johnson ja Fairchild 2003). Toinen näkökulma menetelmien erotteluun on se, suoritetaanko arviointi suhteessa saman kuvasisällön sisältävään referenssikuvaan vai ei. Referenssikuva, jota yleensä pidetään vertausten kannalta niin sanotusti virheettömänä, antaa arvioinnille sel­

keän lähtökohdan, jota vasten niin ihmisarvioitsijan kuin tietokoneenkin on helppo mitoittaa kuvanlaatua. Verrattaessa samasta kohdekuvasta eri laitteistoparametreilla tuotettuja kuvia voidaankin usein jo yksinkertaisilla menetelmillä kuten laiteriippuvaiseen mittaamiseen tarkoi­

tetulla neliöjuuri-integraalilla (Barten 1990) saada kohtalaisen hyvä korrelaatio koetun laadun ja mitattujen arvojen välillä. Kuvan arviointi ilman referenssiä on kuitenkin huomattavasti vaativampaa suorittaa johdonmukaisesti kuvien vaihtelevan luonteen vuoksi. Monissa käytän­

nön tilanteissa referenssiä ei ole saatavilla, minkä vuoksi tällainenkin arviointi on tarpeen.

Laajemmin ymmärrettynä objektiivisen kuvanlaadun voi katsoa olevan pitkälle kehitettyjen ihmisen havainnoinnin fysiikkaan ja psykologisiinkin tekijöihin pohjautuvien ja kuvasisältöä analysoivien algoritmien monimutkainen kokoelma, joka jäljittelee subjektiivisilla testeillä saatua tilastollista keskiarvoa ihmisten mieltymyksistä. Tämänkin sokeaan eli referenssittö- mään kuvanlaatuun keskittyvän tutkimuksen tavoitteena on tukea tuota monimutkaisempien laatualgoritmien kehitystä. Luvussa 2.3 objektiivisella kuvanlaadulla tarkoitetaan kuitenkin nimenomaan sellaisia yksinkertaisia tekijöitä, joihin muun muassa laitteiston ominaisuuksilla on suora vaikutus. Algoritmeja käsittelevässä luvun alaluvussa 4.4 pohditaan tarkemmin mo­

nimutkaisempien menetelmien mahdollisuuksia.

2.1.3 Kuvanlaadun ja sen mittaamisen merkitys

Itse kuvanlaadun pohjimmainen merkitys on suhteellisen selvä: laadukas kuva suoriutuu teh­

tävästään paremmin, oli se tehtävä sitten puhtaasti tiedon välittäminen, pelkästään elämyksen tarjoaminen tai jotain näiden kahden ääripään väliltä. Laadun mittaamisen merkitys ei silti ole itsestäänselvyys. Kuten kuville itsessään, myös kuvanlaadun mittaamiselle on kuitenkin näh­

tävissä lukuisia sovellusmahdollisuuksia niin laitteiden kehitystyössä kuin esimerkiksi luon­

nontieteellisissä, sotilaallisissa tai tavallisille kuluttajille suunnatuissa käyttötarkoituksissakin.

Monissa sovelluksissa olisi suotavaa tai jopa välttämätöntä, että mittaus olisi tehtävissä auto­

maattisesti, jolloin tarvitaan tietokoneelle suunniteltuja algoritmeja. Näihin soveltamismahdol­

lisuuksiin perehdytään tarkemmin luvussa 5.

2.2 Kokonaisvaltaisia kuvanlaadun käsitteitä

2.2.1 Yleistä

Kuvanlaatua kuvaavat käsitteet jaetaan tässä ja seuraavassa luvussa (luku 2.3) karkeasti kah­

teen ryhmään. Näistä ensimmäiset kuvaavat kuvan tehtävästään suoriutumiskykyä kokonai­

suutena, ovat siten rinnastettavissa kokonaislaadun käsitteeseen ja korreloivat usein vahvasti keskenään. Niiden erilaiset näkökulmat tekevät niiden erottelun toisistaan kuitenkin hyödylli­

(17)

seksi kuvanlaadun tutkimuskentän monimuotoisuudesta johtuvan vaatimusten erilaisuuden vuoksi.

Kokonaisvaltaisiksi käsitteiksi voidaan lukea muun muassa luonnollisuus, vääristymättömyys tai yleisluontoisesti laatu. Ne eivät ole keskenään suoraan verrannollisia, mutta yhteistä niille on se, että ne ovat luonteeltaan aidosti joko positiivisia tai negatiivisia. Tästä seuraa, että nii­

den suhde kuvan laatuun tai ainakin kuvalle määritetystä tehtävästä suoriutumiseen on enim­

mäkseen monotoninen. Luonteeltaan ne ovat toista käsiteryhmää abstraktimpeja ja siten myös subjektiivisempia, minkä vuoksi myös niiden mittaaminen on vaikeampaa ja tapahtuu käytän­

nössä aina matalamman tason käsitteiden määrittämisen kautta.

Seuraavaksi käsitellään muutamia tällaisia kuvanlaadun käsitteitä alkaen kaikista korkeimman tason käsitteistä. Luvussa 2.3 jatketaan samaa listaa etenemällä teknisempien ja samalla yksi- selitteisempien käsitteiden suuntaan. Luvussa 2.4 tarkastellaan tämän jälkeen hieman, miten nämä käsitteet käytännössä suhtautuvat toisiinsa.

2.2.2 Vetoavuus

Vetoavuus ei ole kovin tyypillinen kuvanlaadun mittari, mutta ajatuksena mielenkiintoinen johdatus subjektivisimpiin ja siten hankalimpiin kuvan suorituskykyä mittaaviin käsitteisiin.

Savakis ryhmineen (2000) määrittelee kuvan vetoavuuden (engl. appeal) kiinnostuksena, jon­

ka kuva herättää kolmannen osapuolen tarkkailemana. Aihetta on heidän mukaansa tutkittu vain vähän sen vuoksi, että se koetaan hyvin subjektiivisena suureena siinä missä kuvanlaatua taas pidetään objektiivisesti mitattavana. Perusteluna käsitteen tarpeellisuudelle he mainitsevat aikaisemman tutkimuksen osoittaneen, että muun muassa kuva-aiheen mielenkiintoisuus ja kohteen virheet kuten epäonnistunut rajaus tai ihmiskohteen ilme ovat merkittävämpiä tekijöi­

tä silloin, kun ihmiset päättävät, mitä kuvia he eivät tarvitse esimerkiksi kuva-albumiinsa. He totesivat tutkimuksessaan vetoavuuden olevan yhteydessä kuvanlaatuun vain suhteessa suo- rimmin objektiivisesti mitattavissa oleviin suureisiin, joista eniten vetoavuuteen vaikutti vä­

rikkyys. Eniten kuvissa vaikuttivat kuitenkin ihmisiin, asetelmaan ja aiheeseen liittyvät asiat, joita on vaikea mitata automaattisilla algoritmeilla.

2.2.3 Laatu

”Laatua” voidaan jossain määrin pitää kaikkien kuvan hyvyyttä kuvaavien käsitteiden yläkä­

sitteenä, sillä sitä käytetään yleisesti myös muissa kuin kuvaan liittyvissä konteksteissa yleisen

tasokkuuden mittarina. Tyypillisissä asiayhteyksissä se on kuitenkin vetoavuutta helpommin arvioitavissa, minkä vuoksi se on tässä listattu vasta toisena käsitteenä. Laatu-sanan jo pelkäs­

tään kuviin liittyvien erilaisten käyttöyhteyksien ja merkitysten vuoksi on joka tapauksessa perusteltua tarkastella käsitettä hieman tarkemmin. Laatu on kuvan ansiokkuutta mittaavista termeistä moniselitteisimpiä ja vaatiikin siksi yleensä selvyyden vuoksi täsmennyksen varsin­

kin subjektiivisten testien ohjeistuksessa. Laatu-käsitteen yleisen luonteen vuoksi se on liitet­

tävissä moniin muihin yksittäisiäkin laadullisia tekijöitä mittaaviin käsitteisiin. Tämä on pe­

(18)

rusteltua ainakin silloin, kun mitattavan yksittäisen attribuutin vaikutus kuvan havaittuun ta­

sokkuuteen ei ole monotoninen tai kun halutaan muuten korostaa attribuutin ja sen aiheutta­

man laatuvaikutelman eroa. Osittain myös tästä johtuen laatu lienee myös yleisimmin käytetty kuvan tasokkuutta kuvaava käsite.

Osasyy laadun monikäsitteisyyteen on se, että laadun käsitettä käytetään sellaisenaan usein

myös silloin, kun mitataan oikeastaan vain yhtä kokonaislaatuun vaikuttavaa attribuuttia kuten pakkausvääristymiä (esimerkiksi Junli Li et ai. 2001) tai terävyyttä. Jos ei muuta erikseen mainita, laadulla viitataan kuitenkin usein kuvan jonkinlaiseen tekniseen laatuun, joka saattaa olla useampien yksittäisten attribuuttien arvoista jollain tavalla koottu yhdistelmä, kuten esi­

merkiksi Xin Lin (2002) ehdottamassa menetelmässä. Tekninen laatu tarkoittaa kuitenkin tyy­

pillisesti käytännössä jonkinlaista puutteiden poissaolon tasoa, ja näin on myös Xin Lin mene­

telmässä. Usein nämä puutteet ovat lisäksi selkeästi määritettyjä häiriö- tai vääristyneisyyste- kijöitä, kuten muun muassa Wangin et ai. (2002a) sekä Osbergerin et ai. (1998a) tutkimuksis­

sa. Tästä johtuen olisikin ehkä yksiselitteisempää, jos kuvanlaadun sijasta puhuttaisiin aina vääristyneisyydestä, häiritsevyydestä tai jostakin muusta vastaavasta puutteita kuvaavasta kä­

sitteestä aina silloin kun

se

olisi luontevaa. Näin käytettävän käsitteen perusidea olisi hel­

pommin ja nopeammin kommunikoitavissa

ja

kuvan häiriöihin pohjautuvat menetelmät olisi­

vat selkeämmin erotettavissa muunlaisista kuvan hyvyyttä mittaavista menetelmistä.

Keelan käsittelee läpi kirjansa (2002) kuvan laatua "vaikutelmana kuvan ansiokkuudesta tai oivallisuudesta sellaisen tarkkailijan tulkitsemana, joka ei ole ollut mukana kuvaustilanteessa eikä liity läheisesti kuvauksen aiheeseen”. Silloin kun laatua ei erikseen tarkemmin määritellä, tätä voi pitää kuvien yhteydessä kohtalaisen hyvänä yleismääritelmänä käsitteelle laatu. Ole­

massa olevat käytännön objektiiviset menetelmät kuitenkin sulkevat lähes poikkeuksetta ku­

van asetelmaan, rajaukseen ja muihin ei-teknisiin tekijöihin liittyvät tekijät laadun määritel­

män ulkopuolelle. Tämän voi nähdä olevan osittain ristiriidassa paitsi Keelanin määritelmän, myös sen kanssa, miten ihminen laadun yleisellä tasolla käsittää. Myös tästä johtuen voi olla hyvinkin oleellista määrittää, mitä laadulla kussakin yhteydessä tarkoitetaan, tai vaihtoehtoi­

sesti käyttää mahdollisuuksien puitteissa laadun sijaan muita kuvan hyvyyttä mittaavia käsit­

teitä.

2.2.4 Hyödyllisyys

De Ridder ja Endrikhovski (2002) mallintavat laatua summana kolmesta tekijästä: toiston tarkkuudesta, hyödyllisyydestä sekä luonnollisuudesta eli englanninkielisenä akronyyminä FUN (fidelity, usefulness, naturalness). Jokaista tekijää nähdään käytettävän myös yksin ku­

vanlaadun määrittäjänä, mutta hyödyllisyys on siinä suhteessa poikkeava käsite, että sen arvi­

ointi on aina täysin riippuvainen kuvan tarkoituksesta, kun taas esim. edellä mainittuja veto- avuutta ja laatua voi useimmiten hyvin arvioida itsenäisesti ilman tietoa kuvan käyttötarkoi­

tuksesta. De Ridder ja Endrikhovski mainitsevat esimerkkinä sumussa olevaa miestä esittävän luonnollisen kuvan, joka voi olla hyvin uskollinen todellisuudelle, mutta hyödyllisyydeltään matala mikäli tehtävänä on tunnistaa ihminen.

(19)

Hyödyllisyys-käsitettä voi periaatteessa käyttää mihin tahansa tarkoitukseen käytettävien ku­

vien kanssa. Arkista kuvaa voi esimerkiksi mitata sillä perusteella, miten hyödyllinen se on joidenkin muistojen esille tuomisessa. Tällaisessa tarkoituksessa termi on kuitenkin kaukaa haettuja sen suuruutta on tällöin hyvin hankala määrittää niin objektiivisesti kuin subjektiivi- sestikin. Luontevimmillaan hyödyllisyys onkin kuvan suorituskykyä kuvaavana mittarina sil­

loin, kun kuvan tarkoituksena on toimia lähinnä apuvälineenä jossakin järjestelmällisyyttä vaativassa työssä, kuten esimerkiksi jossakin lääketieteen, asevoimien tai videovalvonnan so­

velluksessa.

2.2.5 Kuvainformaatio

Useissa kuvien käytännön sovelluksissa kuvan hyödyllisyys on käytännössä johdettavissa suo­

raan kuvan sisältämän tiedon määrästä. Tästä syystä voidaan ajatella monia tilanteita, missä kuvainformaatio olisi luontevin kuvan suorituskyvyn mitta. Edellä mainittuja esimerkkejä käyttäen lääketieteessä kuva voi antaa tietoa taudista, sotilaallisessa käytössä tietoa maastosta

ja videovalvonnassa tunnistaa jonkun henkilön. Näin ollen kuvainformaatio toimii monessa

tilanteessa varteenotettavana vaihtoehtona hyödyllisyyden käsitteelle.

Sheikh ja Bovik (2006) esittelevät oman kuvainformaation toiston tarkkuuden mittansa VIE (Visual Information Fidelity), joka on perinteisten toistontarkkuusmittojen tapaan riippuvainen saatavilla olevasta referenssikuvasta. Poikkeuksellisen ”kokonaisvaltaiseksi” ja ainakin teori­

assa tavallisia konkreettiseen referenssiin vertaavia mittareita suorituskykyisemmäksi VIF- suureen tekee se mahdollisuus, että mitattava kuva voi olla kuvainformaatioltaan myös alkupe­

räistä eli referenssiä parempi. Useimmat referenssikuvaan vertaamiseen pohjautuvat suureet eivät tarjoa tätä mahdollisuutta, minkä vuoksi niiden suhdetta kuvan hyvyyteen ei voi auto­

maattisesti pitää monotonisena.

2.2.6 Toiston tarkkuus suhteessa todellisuuteen ja luonnollisuus

Kuvanlaatututkimuksessa luonnollisuudella viitataan yleensä käytännössä kuvan värimaail­

maan, kuten muun muassa Yendrikhovskijin et ai. (1998a) sekä de Ridderin et ai. (1995) tut­

kimuksissa. Sen voi kuitenkin ymmärtää myös laajemmin. De Ridderin et ai. edellä mainitussa FUN-kolmijaossa luonnollisuus määritetään kuvan vastaavuutena sisäisiin referensseihin ku­

ten muistiväreihin, kun taas toiston tarkkuus määräytyy ulkoisten referenssien eli todellisuu­

den kautta. Näiden kahden erottelua perustellaan muun muassa sillä, että luonnollisuutta voi­

taisiin käyttää esimerkiksi keinotodellisuuteen tai animaatioon liittyvien kuvien todellisuutta vastaamisen asteen kuvaamiseen, kun taas toiston tarkkuudella voisi kuvata taidetta tai tieteel­

lisiä kuvia.

Käytännössä nämä ulkoiset ja sisäiset referenssit eivät liene kovin kaukana toisistaan, ja esi­

merkiksi keinotodellisuuden tasokkuutta voisi hyvin kuvata myös toiston tarkkuuden eli ul­

koisten referenssien kautta. Näkökulma käsitteillä on kuitenkin eri: luonnollisuus kuvaa sitä, miten kuva ihmisen mielestä vastaa todellisuutta, kun taas toiston tarkkuus sitä, miten kuva

(20)

ihan oikeasti vastaa todellisuutta. Aivan kuten maksimaalisen luonnollisuuden ja maksimaali­

sen laadun arvioiden väliltä on löydetty useissa tutkimuksissa (mm. de Ridder et ai. 1995) sys­

temaattinen ero, on mahdollista, että ihmiset pitäisivät luonnollisimpana hieman toisenlaisia kuvia, kuin mikä oikeastaan vastaa täsmällisimmin todellisuutta.

2.2.7 Vääristyneisyys ja häiritsevyys

Vääristyne isyys on edellä listattuihin verrattuna matalamman tason käsite, sillä sitä voi helpos­

ti mitata yhden tai useamman häiriötekijän kautta - referenssin kanssa tai ilman. Häiritsevyys on vääristyneisyyden kanssa samankaltainen termi, mutta sen käyttö kohdistuu tyypillisesti vain yhteen tarkoin määriteltyyn häiriötekijään. Esimerkiksi kuvaan tai videokuvaan liitettävi­

en digitaalisten vesileimojen tapauksessa häiritsevyys on hyvin luonteva mittari, minkä vuoksi sitä on käytetty muun muassa Fariaksen et ai. tutkimuksessa (2002).

Paitsi tiettyjen häiriötekijöiden mittoina, vääristyneisyys ja tarkemmin määriteltynä häiritse­

vyyskin voidaan kuitenkin nähdä myös vaihtoehtoina teknisen laadun käsitteelle, minkä vuok­

si ne on tässä yhteydessä listattu kokonaisvaltaisten laadunkäsitteiden joukkoon. Vääristynei- syyshän voidaan nähdä mittarina siitä, kuinka vääristynyt kuva on suhteessa siihen, millainen teknisesti virheetön kuva vastaavasta kohteesta olisi. Häiritsevyys taas voidaan määritellä ku­

vaamaan, missä määrin kuvan ilmeiset puutteet loppujen lopuksi häiritsevät. Tällaisessa yh­

teydessä käsitteet voisi nähdä turhina kiertoilmaisuina laadun käsitteelle, mutta käytännön ob­

jektiiviset kuvanlaadun mittarit perustuvat nykyisellään suurelta osin nimenomaan erilaisiin häiriöihin tai puutteisiin, minkä vuoksi voi tämäntapaisten puutteita mittaavien käsitteiden käyttö olla perusteltua myös subjektiivisia mittauksia tehdessä.

2.3 Matalan tason käsitteitä

2.3.1 Yleistä

Verrattuna edellisessä alaluvussa lueteltuihin käsitteisiin, tähän ryhmään luokiteltavat suureet

ovat luonteeltaan teknisempiä, eivätkä siten yksin riitä kuvaamaan kuvan suorituskykyä koko­

naisuudessaan kuin korkeintaan tarkoin määritellyssä käyttötarkoituksessa. Toisaalta näitä ma­

talamman tason käsitteitä tarvitaan väistämättä ainakin silloin, kun kuvan hyvyyttä halutaan mitata objektiivisin menetelmin. On olemassa esimerkiksi useita kuvausjärjestelmienkin ai­

kaansaamia epäterävyyden ja punasilmäisyyden kaltaisia vikoja tai puutteita, jotka aiheuttavat melkein aina kuvanlaadun arvioidun heikkenemisen (Keelan, s.6). Mikäli matalamman tason käsitteitä saadaan yhdistettyä onnistuneesti, niillä onkin mahdollista ennustaa subjektiivista näkemystä korkeamman tason käsitteistä.

Töpferin et ai. (2002) mukaan useimmat tällaisista kokonaislaatuun vaikuttavista tekijöistä voidaan jakaa edelleen artefaktuaalisiin ja mieltymyksellisiin attribuutteihin. ISO 20462 - standardissa (2005) artefaktuaalinen attribuutti määritellään sellaiseksi, joka kuvasta havaittu­

na lähes poikkeuksetta johtaa kuvanlaadun heikkenemiseen, ja mieltymyksellinen attribuutti sellaiseksi, joka on tarkkailijasta ja kuvasisällöstä riippuva mielipidekysymys. Artefaktuaalis-

(21)

ten mittaaminen on jo siinä mielessä helpompaa, että asteikon ääripäästä löytyy se laaduk- kaimmaksi koettu vaihtoehto. Esimerkiksi kohinan koetaan yleensä vain heikentävän laatua, joten mitä vähemmän kohinaa, sitä parempi laatu. Sen sijaan kuten on arvattavissa, laatu ei kasva monotonisesti esimerkiksi saturaation, kroman tai värikkyyden funktiona, minkä muun muassa Fedorovskaja et ai. (1997) ovat kokeellisestikin osoittaneet.

Mieltymyksellistä ulottuvuutta Töpfer et ai. kuten myös Keelan (2002, s.47-60) esittävät pre- ferenssijakaumana, josta nähdään, millä suhteellisella todennäköisyydellä kukin kohta on mie­

luisin. Esimerkiksi kontrastille kaikista todennäköisimmin laadukkaimpana koettu taso eli pre- ferenssijakauman huippu olisi luultavasti jossain maksimikontrastin ja minimikontrastin väli­

maastossa.

a*

Kuva 1. Väritasapainon preferenssijakauma CIELAB-väriavaruudessa (Töpfer et ai. 2002)

Töpferin ynnä muiden tulokset väritasapainolle on käytännön esimerkin vuoksi esitetty

graafi­

sesti ylläolevassa kuvassa (Kuva 1), mistä on muun muassa huomattavissa, että parhaimmaksi miellettävyyden todennäköisyys laskee nopeammin väritasapainon muuttuessa punaviherakse- lilla (a*-akseli) kuin sinikelta-akselilla (b*-akseli). Keskeisintä tässä yksinkertaisessa väritasa- painoesimerkissä on tässä yhteydessä kuitenkin se, että se osoittaa hyvin mieltymyksellisten attribuuttien luonteen: todennäköisimmin parhaaksi miellettävä väri löytyy asteikon keskivai­

heilta. Toinen huomionarvoinen seikka on, että mieltymyksen todennäköisyys ei laske sym­

metrisesti huippukohdan molemmin puolin: sinisemmän suuntaan mieltymyksen todennäköi­

syys laskee hitaammin. Tällaiset tekijät voivat osoittautua hyvinkin oleellisiksi silloin, kun matalamman tason suureilla pyritään ennustamaan kokonaisvaltaisia laadun käsitteitä.

2.3.2 Toiston tarkkuus suhteessa referenssikuvaan

Kohdassa 2.2.6 esitettiin ulkoiseen referenssiin suhteutetun toiston tarkkuuden käsite, jota voi pitää käytännössä puhtaasti positiivisena mittana kuvan tasokkuudesta. Oli vertailukohtana sitten konkreettinen kuva tai ulkoinen referenssi, toiston tarkkuutta voi tarkkailla joko pelkäs­

tään jonkin yksittäisen

attribuutin

suhteen kuten esimerkiksi MacDonaldin

(1987)

tutkimana väriloiston tarkkuutena, tai sitten suhteessa kuvaan kokonaisuutena. Toiston tarkkuus suhtees-

(22)

sa referenssikuvaan on tässä kuitenkin eriteltynä erilliseksi, luonteeltaan kuvanlaatua vähem­

män kokonaisvaltaisesti kuvaavaksi käsitteeksi kahdesta syystä. Ensinnäkin referenssikuva ei välttämättä ole laadultaan ideaali, ja voi olla jopa kuvankäsittelytoimenpiteillä parannettavissa, jolloin esimerkiksi kappaleessa 2.2.5 mainitun VIF-suureen tulisi saada referenssiä parempi arvio. Toisekseen toiston tarkkuus suhteessa alkuperäiseen kuvaan on huomattavasti suorem­

min johdettavissa alkuperäisestä kuvasta yksinkertaisenkin matemaattisen kaavan avulla, mut­

ta tämä toiston tarkkuus voi korreloida käytännössä hyvin heikosti ihmisen havaitseman kuvi­

en samankaltaisuuden kanssa.

Puutteistaan ja referenssikuvan olemassaolon vaatimuksestaan huolimatta erilaiset konkreetti­

seen referenssikuvaan vertaavat kuvaa arvioivat mittarit ovat kuitenkin hyvin yleisiä, koska niiden kehittäminen on referenssittömiin menetelmiin verrattuna huomattavasti helpompaa, ja siten niillä myös päästään yleensä huomattavasti parempiin tuloksiin. Referenssimenetelmille löytyy myös erilaisia sovellusalueita (kts. esim. luku 5.2.3), ja mikäli referenssikuva on käyt­

tötarkoitusta silmällä pitäen todettavissa laadultaan ideaaliseksi, voidaan toiston tarkkuutta suhteessa referenssiinkin pitää jokseenkin kokonaisvaltaisena laadun käsitteenä sillä edelly­

tyksellä, että se ottaa huomioon kuvan kokemien muutosten visuaalisen häiritsevyyden.

2.3.3 Värien luonnollisuus

Vaikka luonnollisuuden voi ajatella tarkoittavan pohjimmiltaan sitä, miten luonnonmukainen eli todellisuutta vastaava jokin kuva on, luonnollisuus on käsitteenä käytännössä hyvin ihmis- lähtöinen. Tyypillisesti kuvan arviointitehtävissäkin arvioinnin suorittaja joutuu kuvan alkupe­

räisen kohteen näkemisen sijaan nojaamaan vain omiin aikaisempiin kokemuksiinsa ja odo- tuksiinsa siitä, mitä hän kuvan esittämän kohteen todelliselta vastineelta odottaisi. Värien osal­

ta luonnollisuutta voidaankin tästä johtuen pitää kappaleessa 2.2.6 esitetyn luonnollisuuden määritelmän mukaisesti kuvan värien yhtäläisyytenä sisäisen referenssin mukaiseen värimaa­

ilmaan. Värien luonnollisuus on siten vastaavaa kokonaisvaltaista käsitettä ajatellen monoto­

ninen, mutta vain yhtä kuvan kokonaisluonnollisuuden osatekijää mittaava suure.

Värimuisti viittaa ihmisen kykyyn muistaa värejä yleisellä tasolla (Yendrikhovski et ai. 1999).

Muistivärit ovat puolestaan pitkäkestoisesta muistista löytyviä tuttuihin esineisiin yhdistettäviä värejä (Bartleson 1960). Värien kohdalla voimakkain sisäinen referenssi löytynee käytännössä juuri näistä muistiväreistä, mistä johtuen värien luonnollisuutta käsittelevissä tutkimuksissa luultavasti käytetäänkin usein taivaan, ihon tai nurmikon kaltaisia ihmisille hyvin tuttuja kuva- aiheita kuten muun muassa Bodrogin ja Tarczalin (2001) sekä Parkin et ai. (2006) tutkimuk­

sissa. Ongelmalliseksi luonnollisuuden käsitteen voi nähdä sellaisissa tapauksissa, joissa ul­

koinen referenssi (eli esimerkiksi alkuperäinen maisema, josta kuva on otettu) on luonnostaan

epäluonnolliselta vaikuttava, kuten mahdollisesti esimerkiksi auringonlaskua esittävän kuvan kohdalla. Tällöin on teoriassa mahdollista syntyä merkittäväkin ero edellä esitetyn FUN- kolmijaon mukaisten värien toiston tarkkuuden ja värien luonnollisuuden välillä. Subjektiivi­

sissa testeissä tämä ero voi aiheuttaa myös epäselvyyksiä mielipiteiden muodostamisessa,

(23)

minkä vuoksi voi olla syytä tutkimuksen tavoitteet huomioiden täsmentää tai harkita tarkem­

min arvioinnin perustana käytettävää suuretta.

2.3.4 Väritasapaino

Kuvan kohde voi näyttää erilaiselta erilaisissa valaistusolosuhteissa. Esimerkiksi valkoinen kohde voi näyttää matalan värilämpötilan valaistuksessa punertavalta ja korkean värilämpöti­

lan valaistuksessa sinertävältä. Ihmissilmä ei tätä eroa kuitenkaan välttämättä huomaa, koska

ihminen suhteuttaa näkemänsä kohdetta ympäröivään valaistukseen. Valokuvaan tämä ero kui­

tenkin lähtökohtaisesti tallentuu, minkä vuoksi useimmissa kameroissa on erillinen väritasa- painon korjausmekanismi tämän värivirheen ehkäisemiseksi. (Liu et ai. 1995)

Mikäli kuvan väritasapainoa korjataan tulkitsemalla kuvaa väärin, syntyy yleensä värivirhe (Cooper et ai. 2000). Tämä puolestaan voi vaikuttaa edellä käsiteltyyn värien luonnollisuuteen negatiivisella tavalla. Luonteeltaan väritasapaino on kuitenkin hyvin subjektiivinen preferens- sisuure, mikä kuvasisältöriippuvaisuuden ohella vaikeuttaa huomattavasti yhteyden löytämistä luonnollisuuden kaltaisiin korkeamman tason käsitteisiin.

2.3.5 Värikkyys

Myös värikkyys on luonteeltaan selvä preferenssisuure: paras kuva ei ole äärimmäisen värikäs,

mutta ei myöskään tyystin väritön. Tästä johtuen sitä onkin käytetty korkeintaan epäsuorana laatutekijänä kuten värikkyyden erona (Palus 2005). Mikäli värikkyydestä halutaan johtaa ko­

konaisvaltaisempia kuvan oivallisuutta mallintavia suureita, on päätettävä ideaali värikkyyden taso sekä millä tapaa laatu heikkenee kun värikkyys poikkeaa tästä ideaalista. Automaattisia menetelmiä ajatellen suureen ideaalikohdan määrittämisen tekee ongelmalliseksi se, että eri kuvakohteiden kuuluukin olla värikkyydeltään eritasoisia: esimerkiksi vihreät niityt tai kukka- asetelmat ovat luonnostaan värikkäämpiä kuin harmaa katumaisema. Ihanteellisin värikkyyden taso riippuu myös siitä, tavoite Haanko kuvalta kokonaisvaltaisesti parasta laatua vai suurinta luonnollisuuden tasoa, sillä kuten kappaleessa 2.4 todetaan, näiden välillä on havaittu syste­

maattinen ero.

2.3.6 Terävyys

Terävyyttä voidaan pitää hyvin keskeisenä ja useissa yhteyksissä jopa keskeisimpänä koko- naislaatuun vaikuttavana yksittäisenä tekijänä. Tätä näkemystä edustaa muun muassa Johnso­

nin ja Fairchildin (2000) tutkimus. Terävyys ei myöskään ole kovin mieltymyksellinen tekijä siinä missä esimerkiksi värikkyys, sillä pääsääntöisesti kuvilta halutaan mahdollisimman kor­

keaa terävyyttä, kunhan keinotekoinen terävöitys ei aiheuta kuvaan vääristyneisyyttä tai liial­

lista rosoisuutta. Näistä syistä johtuen terävyyttä myös tutkitaan suhteellisen paljon. Objektii­

visia menetelmiä ajatellen se sisältää useampia ongelmakohtia, mutta se ei ole täysin yksiselit­

teistä kuitenkaan edes subjektiivisia arviointeja ajatellen.

(24)

Kuva 2. Kumpi on terävämpi? Entä kumpi laadultaan parempi?

Kuva 2 havainnollistaa terävyyden mittaamisen yhtä keskeistä ongelmakohtaa. Vasemman­

puoleisissa kuvissa kuvan hana ja kukka ovat terävämpiä kuin oikeanpuoleisissa kuvissa, mut­

ta vastaavasti tausta sumeampi. Näiden kuvien kohdalla on suhteellisen oletettavaa, että ih- misarvioitsija valitsisi vasemmanpuoleiset kuvat laadultaan paremmiksi. Mutta arvioidaanko vasemmanpuoleiset kuvat tämän seurauksena myös terävämmiksi? Tätä valintaa vastaan on se tosiasia, että erityisesti voikukkaa esittävissä kuvissa tausta on pinta-alaltaan suurempi. On kuitenkin tärkeää, että kuvan keskeinen sisältö on terävästi esitetty, ja ihmiselle on useimmiten hyvin intuitiivinen tehtävä valita, mikä kuvassa on keskeistä. Ongelmallisemmaksi tehtävä tu­

lee, mikäli kuvan keskeinen kohde ei ole yksimielisesti päätettävissä, jolloin ihmisten arviois­

sa voi esiintyä suurtakin hajontaa.

On perusteltua olettaa, että vasemmanpuoleiset kuvat valittaisiin subjektiivisissa testeissä pait­

si oikeanpuoleisia laadukkaammiksi myös terävämmiksi. Koska terävien alueiden pinta-alat eivät tätä päätöstä tue, tämä johtaa nopeasti siihen päätelmään, että terävyydenkin arvioon vai­

kuttaa se, mitkä asiat ovat kuvassa terävästi esitettyinä. Ainakin mikäli terävyyden arviolla pyritään ennustamaan kokonais laatua, terävyyden ja laadun välillä tulisikin vallita tämänkal­

tainen vahva yhteys. Objektiivisia menetelmiä ajatellen tämä on kuitenkin melko vaikea on­

gelma: miten voidaan määrittää kuvan keskeinen sisältö, jos ihmisetkään eivät ole välttämättä siitä yksimielisiä? Kohteen sijainti kuvassa ei ratkaise kysymystä, sillä kuvan keskeinen kohde

(25)

voi näistä esimerkkikuvista poiketen hyvin sijaita myös kuvan reuna-alueilla. Tarkemmin tätä ongelmaa pohditaan algoritmeja käsittelevässä luvun osassa 4.3.3.

2.3.7 Kontrasti

Kontrasti tarkoittaa kuvan osioiden erotettavuutta toisistaan. Kuvankäsittelyssä se määritellään yleensä kuvan tummimpien ja kirkkaimpien pisteiden välisenä suhteena, jota usein manipuloi­

daan kuvan laadun parantamiseksi (Matkovic et ai., 2005). Toisaalta, kuten Peli (1990) toteaa, havaittu kontrasti voi vaihdella huomattavasti kuvan eri alueiden välillä ja sen voi lisäksi mää­

ritellä usein eri tavoin.

Korkeakontrastisen kuvan alueet erottuvat toisistaan matalakontrastisen kuvan alueita selke­

ämmin, mistä johtuen korkea kontrasti saa kuvan usein näyttämään myös terävämmältä, mikä puolestaan vaikuttaa osaltaan koettuun kuvanlaatuun. Toisaalta kuten Töpfer et ai. (2002) esi­

merkkinä mainitsevat, kontrasti on luonteeltaan mieltymyksellinen attribuutti, joten pelkkä kontrastin maksimointi ei ole mielekästä. Terävyys onkin käsitteenä ehkä suoremmin yhdistet­

tävissä ihmisen havaitsemaan kokonais laatuun, kun taas kontrasti on teknisempi ja samalla myös vahvemmin laiteriippuvainen suure. Tästä johtuen terävyys soveltunee paremmin soke­

aan laiteriippumattomaan kuvanlaadun arviointiin, kun taas kontrasti laitteiden teknisten omi­

naisuuksien ja niiden kuvanlaadulleen merkityksen vertailuun.

2.3.8 Kohina

Kohina on tyypillinen, esimerkiksi analogisista TV-lähetyksistä tuttu häiriötekijä (Dosselman

& Yang, 2007). Se tarkoittaa kuvassa esiintyvää satunnaista pikseliarvojen vaihtelua, jota voi syntyä esimerkiksi pimeässä pitkällä valotusajalla otettuihin kuviin. Koska kohina on lähes poikkeuksetta ei-toivottu ominaisuus, se kuuluu käsitteenä helpoimpiin ja yksiselitteisimmin kokonaisvaltaiseen laatuun vaikuttavien tekijöiden ryhmään eli artefaktuaalisiin attribuuttei­

hin: mitä enemmän kuvassa on kohinaa, sitä alhaisempi on luultavasti niin luonnollisuuden, hyödyllisyyden kuin toiston tarkkuudenkin taso.

Kohinan tyyppejä on kuitenkin erilaisia. Esimerkiksi Li (2002) käsitteli erikseen summautu­

van valkoisen gaussisen kohinan ja impulssikohinan objektiivista mittaamista. Näistä ensim­

mäinen on tyypillinen, kuvan yksittäisiä pikseleiden arvoja joko laskeva tai nostava kohinan muoto, joka on jossain määrin läsnä käytännössä kaikissa luonnollisissa kuvissa. Impulssiko- hina on luonteeltaan satunnaisempaa eli vain joitakin kuvan kohtia koskevaa, mutta voi poike­

ta huomattavasti gaussista kohinaa vahvemmin yksittäisen pikselin toivotusta arvosta. Yksi tyypillinen esimerkki tämänlaisesta kohinasta on ns. suola ja pippuri -tyyppinen kohina (Chan et ai. 2005). Kuva 3 puolestaan havainnollistaa, kuinka kohina voi olla myös taajuudeltaan huomattavan erilaista, mikä vaikuttaa huomattavasti sen havaittavuuteen.

(26)

32 cpd

Kuva 3. Puna-viher-kanavan kohinaa viidellä eri taajuudella (Johnson ja Fairchild, 2005). Lyhenne cpd tarkoittaa kohinan jaksoja visuaalisen näkökulman astetta kohden.

Erityyppisten kohinoiden olemassaolo hankaloittaa kohinan määrän arvioimista. Objektiivisia menetelmiä ajatellen on myös monenlaisia kuvaelementtejä, jotka voidaan luultavasti tulkita virheellisesti kohinaksi. Käsitteen periaatteellinen yksinkertaisuus ja suhteellisen suora suhde korkeampiin laadun käsitteisiin eivät siis kuitenkaan tarkoita sitä, että sen objektiivinen mit­

taaminen olisi välttämättä muiden käsitteiden mittaamista helpompaa. Merkittävästi helpom­

paa saattaa olla korkeintaan määrittää sen suhde kokonaisvaltaisiin laadun käsitteisiin.

2.3.9 Pakkausvääristymät

Myös pakkausvääristymät ovat luonteeltaan artefaktuaalisia. Niitä syntyy, kun kuva pakataan häviöllisesti tavumäärältään pienempään kokoon kuvan säilyttämistä tai siirtoa varten. Kuvan

laatua arvioidessa voi olla tarkkaan tiedossa, minkälaiseen menetelmään kuvan pakkaus perus­

tuu, jolloin myös vääristymien tyyppi ja syntytapa on tiedossa. Tämä tekee pakkausvääristy- mistä luonteeltaan attribuuteista teknisimmän ja helpoimmin mitattavan, mistä johtuen ne ovat tämän kuvanlaadulleen suureiden listan viimeisenä.

Vääristymien näkyvyys ja häiritsevyys riippuvat kuvan sisällöstä, mistä johtuen subjektiivisia testejä suoritetaan myös pakkausvääristymien kohdalla kuten muun muassa Sheikhin ja Hovi­

kin tutkimuksessa (2006), jossa he käyttivät omaa subjektiivisten kuvanlaatuarvioiden tieto­

kantaansa (Sheikh et ai. n.d.). Pakkausvääristymienkään laadullista vaikutusta ennustamaan pyrkivät objektiiviset mittaukset eivät siis ole käytännössä aivan niin yksinkertaisia kuin mitä

voisi olettaa ottaen huomioon vääristymien keinotekoisen matemaattisen syntytavan. Erityyp-

(27)

pisten kuva-alueiden häiriöherkkyyteen vaikuttaa myös se, mihin pakkausmenetelmän toimin­

ta perustuu.

Kuva 4. Alkuperäinen kuva sekä sen visuaalisesti häviöllisesti pakatut versiot JPEG- ja JPEG2000-muodoissa

Kuva 4 havainnollistaa pakkausvääristymien näkyvyyttä yleisesti käytetyn kuvanpakkausfor- maatin JPEG:n sekä sen seuraajan JPEG2000:n osalta. Ilmaisella IrfanView-ohjelmalla tätä esimerkkiä varten rankasti pakatut kuvat ovat tiedostokooltaan jokseenkin samankokoisia, mutta JPEG2000-pakkauksessa kuvan pakkausartefaktit ovat pääosin huomaamattomampia.

Vaikka JPEG2000 siis tarjoaakin alhaisemman vääristyneisyyden samalla bittimäärällä, se on kuitenkin laskennallisesti raskaampi (Marcellin et ai., 2000, s. 16). Vääristymien häiritsevyyttä tutkivia subjektiivisia ja objektiivisia mittauksia ajatellen mielenkiintoisempia seikkoja ovat kuitenkin vääristymien erilainen luonne sekä se, että JPEG-kuvan laatikoituminen on erityisen huomattavaa kuvan tasaisilla alueilla. Useimmiten valokuvat pakataan kuitenkin visuaalisesti jokseenkin häviöttömästi, missä tapauksessa pakkausvääristymien mittaamiselle ei still-kuvien

kohdalla ole tarvetta.

2.4 Ominaisuuksien väliset suhteet

2.4.1 Merkitys kuvanlaadun tutkimuksessa

Kaikki kuvanlaadulliset tekijät ovat toistensa kanssa jonkinlaisessa vuorovaikutuksessa. Tois­

ten välinen vuorovaikutus on heikkoa tai lähes olematonta, kun taas toisten välillä vuorovaiku­

tus voi olla hyvinkin vahvaa. Vuorovaikutuksen vahvuuden lisäksi kiinnostavia tekijöitä ovat merkittävän vuorovaikutuksen todennäköisyys sekä sen merkitys tutkimuksen tavoitteiden saavuttamisessa.

(28)

V jr

X, .44'"

___ —---

Objektiiviset Matalan tason

--- --- Kokonaisvaltaiset

suureet attribuutit laadun käsitteet

Kuva 5. Kuvanlaadulleen mittojen keskinäiset suhteet ja niiden merkitys

Kuva 5 havainnollistaa yksinkertaistetusti eri käsitteiden välisten suhteiden merkitystä kuvan­

laadun tutkimuksessa. Käsitelaatikoiden väliset paksut vihreät nuolet kuvastavat haluttua vuo­

rovaikutusta. Esimerkiksi terävyyttä mittaavan objektiivisen suureen tulisi korreloida mahdol­

lisimman hyvin vastaavan matalan tason attribuutin eli subjektiivisen terävyyden kanssa, jon­

ka puolestaan toivotaan ennustavan mahdollisimman hyvin kokonaislaatua. Sininen suhteelli­

sen yhtenäisellä katkoviivalla varustettu nuoli oikeanpuolimmaisen laatikon yläpuolella kuvas­

taa neutraalia vuorovaikutusta. Esimerkiksi luonnollisuus ja hyödyllisyys ovat yhteydessä toi­

siinsa, mutta koska molemmat ovat yleensä tutkimuksen pääasiallisia tavoitteita, eikä kum­

paakaan kannata määritellä toisen kautta, niiden välisellä suhteella ei ole merkitystä lopputu­

loksen kannalta.

Kuvan keltainen hieman katkonaisempi viiva viittaa suhteeseen, jolla on riski olla hieman hai­

tallinen tutkimuksen tavoitteille. Mikäli kuvaa on muokattu vain yhden attribuutin suhteen, se voi kuitenkin vaikuttaa subjektiivisiin arvioihin myös muiden attribuuttien osalta. Jossain ta­

pauksessa tämä voi olla järkeenkäypää, mikäli esimerkiksi värikkyyden muutos vaikuttaa ko­

hinan näkyvyyteen. Sen sijaan mikäli esimerkiksi heikosti suunniteltu koejärjestely johtaa koehenkilön hakemaan kuvasta väkisin eroavaisuuksia mitattavan attribuutin suhteen, tämä attribuuttien välinen vuorovaikutus voi vääristää tuloksia.

Vasemmanpuoleisimman laatikon yläpuolella oleva punainen hyvin katkonainen viiva tarkoit­

taa vuorovaikutussuhdetta, joka on yleensä luonteeltaan ei-toivottu. Ellei kahden matalan ta­

son attribuutin välillä ole todettu subjektiivisissa testeissä merkittävää vuorovaikutusta, niitä vastaavien objektiivisten suureiden välillä huomattu vuorovaikutus viittaa siihen, että jokin yhteen suureeseen liittyvä tekijä tulkitaan virheellisesti toiseen suureeseen vaikuttavaksi asiak­

si. Algoritmin suorituskyvyn maksimoimiseksi tällainen vuorovaikutus tulisi luonnollisesti pyrkiä minimoimaan. Objektiivisen suureen vuorovaikutus johonkin erityyppiseen matalan tason attribuuttiin (esimerkiksi objektiivisen terävyyden suhde objektiiviseen kohinaan) on tietenkin yhtä lailla ei-toivottua, mutta näitä ikään kuin ristiin meneviä suhteita ei ole yksin­

kertaistuksen vuoksi piirretty mukaan havainnekuvaan.

2.4.2 Matalan tason ominaisuuksien keskinäisiä vuorovaikutuksia

Kuten edellä todettiin, luonteeltaan haitallisimpia ovat objektiivisten mittojen väliset ei- toivotut vuorovaikutukset. Tässä niitä ei kuitenkaan käsitellä, sillä ne ovat algoritmiriippuvai- sia ja kuuluvat siten tutkimuksen kokeellisiin ja algoritmeja käsitteleviin osuuksiin. Jotta näi-

Viittaukset

LIITTYVÄT TIEDOSTOT

Hilkka Pajukangas, Taiga Korpelainen, Antti Miettinen, Tua Nylén & Petteri Muukkonen* *petteri.muukkonen@helsinki.fi.. Värien valinnalla kartassa on suuri vaikutus kartan

Tutustu internetistä monien eri lähteiden kautta värien psykologisiin ja symbolisiin vaikutuksiin ja hae merkitykset seuraaville väreille. Pohdi myös millaisissa tiloissa

3.2.3 Classification utilizing directional R (reflectance) signatures in multi-image data When all images were combined, there were trees with up to 15 observations. Using

In this work, horizontal ALS-based metrics were found to be good predictor variables, and even better than point cloud metrics, in the classification of LU/LC,

Panel C of Table 3 shows the performance of the combined value and quality portfolio when changes in ownership concentration (from year-end t-2 to t-1) measured with the

that people engaged in a subjective preference-estimation task use different estimation rules, which is also reflected in their viewing behaviour. The findings reported in this

Therefore, poor quality could be defined as either doing the wrong thing (or failing to do the right thing) or doing the right thing the wrong way (or failing to do the right

Ongelmia usein aiheuttaa itse havaintojärjestelmä, ihmisen silmän fysiologiset ominaisuudet sekä käyttäjän odotukset verrattuna toteutukseen (Galitz, 2007, s.