the Combined performance of blind image quality metrics in quality-based classification of images

(1)

Viestintätekniikka Diplomityö

Johannes Hidén

Valokuvaa sokeasti arvioivien algoritmien yh

distetty suorituskyky laatuun pohjautuvassa kuvien luokittelussa

Diplomityö, joka on jätetty opinnäytteenä tarkastettavaksi diplomi-insinöörin tutkintoa varten Espoossa 31.7.2008.

Valvoja professori Pirkko Oittinen

(2)

Tekijät, työn nimi

Johannes Hidén

Valokuvaa sokeasti arvioivien algoritmien yhdistetty suorituskyky laatuun pohjautuvassa kuvien luokittelussa

Päivämäärä: 31.7.2008 Sivumäärä: 123 S.

Tiedekunta

Elektroniikan, tietoliikenteen ja automaation tiedekunta

Professuuri

AS-75 Viestintätekniikka

Työn ohjaaja

Pirkko Oittinen

Digitaalisten valokuvien valtavaksi noussut määrä kasvattaa tarvetta niiden erilaiseen luokitteluun niin yksityisten kuvien hallinnassa kuin ammattikäyttöön tarkoitetuissa kuvahakusovelluksissakin. Tämän työn tavoitteena oli tutkia kuvanlaadun automaattista määrittämistä tällaisen luokittelun yhtenä apukei

nona.

Kokonaislaadun teknisen, esteettisen ja merkityksellisen ulottuvuuden määrittämiseen esitettiin teoreet

tinen malli, jossa pyrittiin ottamaan kaikki koettuun kuvanlaatuun vaikuttavat tekijät huomioon aina hen

kilökohtaisista mieltymyksistä lähtien. Mallin perusideana on, että kuvaan kiinteästi liittyvät ominaisuu

det tulisi laskea valmiiksi osaksi tietokantaa, minkä jälkeen attribuuttien mitatut arvot voisi nopeammin sitoa kontekstiin ja käyttäjäkohtaisiin preferensseihin laadun määrittämiseksi.

Kokeellisessa osuudessa perehdyttiin erityisesti terävyyden ja kohinan sekä näiden laadullisen yhteis

vaikutuksen laskentaan. Sekä testattua kohina-algoritmia että terävyyden mittana käytettyä sumeusal- goritmia kehitettiin eteenpäin. Kohina-algoritmin kohdalla Pearsonin korrelaatiokertoimella mitattua kor

relaatiota ensimmäisen testikierroksen testeissä havaittuun kohinaan saatiin kasvatettua koko kuvajou- kon osalta keskimääräisestä 34 prosentista 79 prosenttiin sekä jätettäessä terävöitetyt kuvat huomioi

matta 79 prosentista noin 89 prosenttiin. Sumeusalgoritmin osalta kehitetyn version korrelaatio nousi alkuperäisen algoritmin 80 prosentista parametreistä riippuen 85-87 prosenttiin ensimmäisen testikier

roksen kuvilla, kun taas korrelaatio validointitesteissä määritettyyn subjektiiviseen kokonaislaatuun nousi alkuperäisen menetelmän vajaasta 79 prosentista parametreistä riippuen 82-83 prosenttiin.

Kokonaislaadun määrittämiseksi yksittäisiä attribuutteja mittaavien algoritmien pohjalta ehdotettiin kahta erilaista menetelmää: attribuuttien suhteellista painottamista sekä moniulotteista mallinnusta. Paino- tusmenetelmällä subjektiiviseen kokonaislaatuun suhteutettu korrelaatio nousi validointitesteissä 84 prosenttiin, mikä on hieman korkeampi kuin kummallakaan yksittäistä attribuuttia mittaavista algorit

meista. Tämän lisäksi menetelmän toissijaiseksi suorituskyvyn mittariksi esitetylle vakaudelle saatiin kokonaismenetelmän kohdalla hieman menetelmän tärkeimmällä osalla eli terävyysalgoritmilla saatua korkeampi arvo. Vaikka moniulotteisella mallinnuksella vastaavaksi korrelaatioksi saatiin vain noin 76%, suositellaan tätä menetelmää kuitenkin jatkossa käytettäväksi. Syynä tähän on painotusmenetelmän parametrien optimoimisen hankaluus varsinkin useampia attribuutteja mitatessa sekä kykenemättö

myys mallintaa kaikkia yksittäisten attribuuttien keskinäisiä vuorovaikutussuhteita. Moniulotteinen mal

linnus tarjoaa periaatteen tasolla automaattisen ratkaisun molempiin, kunhan menetelmän pohjaksi on saatu määritettyä riittävän suuri subjektiiviseen ja objektiiviseen dataan pohjautuva laatuavaruus.

Avainsanat: kuvanlaatu, referenssitön määritys, algoritmi, moniulotteinen mallinnus, kuvien luokittelu, kuvien hallinta, terävyys, kohina

(3)

Author

Johannes Hidén

The combined performance of blind image quality metrics in quality-based classification of images

Date: 31.7.2008 Pages: 123 p.

Faculty Professorship

Faculty of Electronics, Communications AS-75 Media Technology and Automation

Supervisor

Pirkko Oittinen

As the amount of digital photographs has become vast, the need for categorizing and classifying them has increased in both professional and private applications. This research concentrated on the concept of measuring image quality automatically as a means for such classification.

A theoretical model was proposed for measuring the technical, aesthetic and meaningful aspects of im

age quality. The model tries to consider all the possible factors influencing overall image quality, includ

ing personal preferences. One of the basic premises of the model was the idea of measuring the attrib

utes that are an integral part of the image beforehand and recording them to the image database, after which the measured values can be more quickly interpreted as a context and user preference depend

ent measure of image quality.

In the experimental part the measurement of sharpness and noise as well as their combined influence on quality was the primary subject of interest. Both the tested algorithm for measuring noise and the al

gorithm for measuring blur as a metric of sharpness were further developed. For the newly proposed noise algorithm the mean correlation to the noise evaluations from all the images in the first subjective experiments as defined by Pearson’s correlation coefficient rose to 79% as compared to 34% of the original algorithm, whereas by excluding the sharpened images the correlation rose from 79% to about 89%. For the proposed blur algorithm the measured mean correlation was 85-87% depending on the parameters as compared to 80% per cent of the original algorithm for the images in the first subjective experiments, whereas the correlation to the image quality defined in the validation tests rose from less than 79 per cent of the original to 82-83% depending on the used parameters.

For defining overall quality based on the algorithms measuring individual attributes two different meth

ods were proposed: the relative weighting of the attributes and multidimensional modeling. With the weighting method the correlation to subjective image quality defined in the validation tests rose to 84 per cent, which is slightly higher than either of the correlations provided by the individual components.

In addition, stability, which was defined as a secondary measure of overall performance, was also measured slightly higher for the overall quality method than for its most important component, the blur measure. Although multidimensional modeling resulted in a correlation of only 76%, it is recommended for future purposes. One reason for this is that optimizing the parameters for the weighting method is troublesome especially in case of numerous attributes. With the weighting method it is also impossible to model all the interactions between individual attributes. In principle, multidimensional modeling offers an automatic solution for both problems. The only requirement is a quality space defined by an ade

quate amount of subjective and objective data.

Keywords: image quality, blind measurement, algorithm, multidimensional modeling, image classifica- tion, image management, sharpness, noise

(4)

ALKUSANAT

Tämä diplomityö on tehty Teknillisen korkeakoulun Viestintätekniikan laboratoriossa kevään 2008 aikana. Haluan lämpimästi kiittää professori Pirkko Oittista mielenkiintoisen aiheen tar

joamisesta sekä tuesta työn edetessä ilmenneissä ongelmatilanteissa. Stina Westmania kiitän arvokkaista vinkeistä erityisesti subjektiivisten testien suunnittelussa, Johannes Pullaa hyödyl

lisestä testiohjelmasta sekä muuta laboratorion henkilökuntaa mukavan työilmapiirin luomi

sesta.

Haluan myös kiittää avopuolisoani Tanjaa mittaamattoman arvokkaasta henkisestä tuesta koko työn aikana. Lisäksi kiitän kaikkia subjektiivisiin testeihin osallistuneita henkilöitä, joita ilman koko tutkimusta ei olisi voitu tehdä.

Espoossa 1. heinäkuuta 2008

Johannes Hidén

(5)

1 JOHDANTO...1

1.1 Taustaa...1

1.2 Tutkimuksen tavoite ja rajaus... 2

1.3 Työn rakenne... 3

2 KUVANLAATU... 4

2.1 Yleistä... 4

2.1.1 Kuvanlaadun määritelmästä lyhyesti... 4

2.1.2 Subjektiivinen ja objektiivinen kuvanlaatu... 4

2.1.3 Kuvanlaadun ja sen mittaamisen merkitys... 5

2.2 Kokonaisvaltaisia kuvanlaadun käsitteitä... 5

2.2.1 Yleistä... 5

2.2.2 Vetoavuus...6

2.2.3 Laatu... 6

2.2.4 Hyödyllisyys...7

2.2.5 Kuvainformaatio...8

2.2.6 Toiston tarkkuus suhteessa todellisuuteen ja luonnollisuus...8

2.2.7 Vääristyne isyys ja häiritsevyys... 9

2.3 Matalamman tason käsitteitä...9

2.3.1 Yleistä... 9

2.3.2 Toiston tarkkuus suhteessa referenssikuvaan... 10

2.3.3 Värien luonnollisuus... 11

2.3.4 Väritasapaino... 12

2.3.5 Värikkyys... 12

2.3.6 Terävyys... 12

2.3.7 Kontrasti... 14

2.3.8 Kohina... 14

2.3.9 Pakkausvääristymät... 15

2.4 Ominaisuuksien väliset suhteet... 16

2.4.1 Merkitys kuvanlaadun tutkimuksessa... 16

2.4.2 Matalan tason ominaisuuksien keskinäisiä vuorovaikutuksia... 17

2.4.3 Matalan tason ominaisuuksien suhde kokonaisvaltaisiin laadun käsitteisiin. 18 2.4.4 Kokonaisvaltaisten käsitteiden keskinäisistä suhteista... 19

2.5 Yhteenvetoja pohdintaa kuvanlaatuun liittyvistä käsitteistä... 19

3 KUVANLAADUN SUBJEKTIIVINEN MITTAAMINEN... 21

3.1 Kuvanlaadun määrittämisestä...21

3.1.1 Miksi mitataan?...21

3.1.2 Mittausprosessi...22

3.2 Ihminen kuvan arvioijana...22

3.2.1 Psykologiset ja yksilölliset tekijät... 22

3.2.2 Perussuosituksia testejä ajatellen... 23

3.3 Kuvat arvioinnin kohteena...24

3.4 Arvioinnissa käytettävät mitat ja menetelmät... 24

3.4.1 Yleistä...24

3.4.2 Juuri havaittavissa oleva ero eli JND... 25

(6)

3.4.3 Mittausmenetelmiä...26

3.5 Menetelmien ja koejärjestelyjen valinta...27

3.5.1 Tavoitellun totuuden anatomia... 27

3.5.2 Koejärjestelyjen määrittäminen... 28

4 KUVANLAADUN KONEELLINEN MITTAAMINEN...30

4.1 Algoritmeista yleisesti...30

4.1.1 Johdanto... 30

4.1.2 Algoritmien luokittelu...30

4.1.3 Minkälainen on hyvä algoritmi?... 32

4.1.4 Algoritmien ongelmista... 35

4.2 Ihmisen näköjärjestelmän ominaisuuksien merkitys... 36

4.2.1 Kontrastiherkkyys...36

4.2.2 Värinäkö...37

4.2.3 Kuvasisällön vaikutus...37

4.3 Attribuuttien objektiivinen mittaaminen... 38

4.3.1 Yleistä...38

4.3.2 Kohina...38

4.3.3 Terävyys tai sumentuneisuus... 39

4.3.4 Kontrasti...41

4.3.5 Värikkyys...42

4.3.6 Värien luonnollisuus...43

4.3.7 Pakkausvääristymät...44

4.3.8 Yhteenveto objektiivisesti mitattavista attribuuteista...45

4.4 Koetun kokonaislaadun ennustaminen... 47

4.4.1 Attribuutin vaikutus koettuun laatuun... 47

4.4.2 Yksittäisten attribuuttien yhdistäminen kokonaisvaltaisen laadun määreeksi 47 4.4.3 Kuvasisällön vaikutus attribuutin laatuun ja painotukseen...52

4.4.4 Henkilökohtaisten mieltymysten merkitys... 54

4.4.5 Malli kokonaislaadun määrittämiseksi... 54

4.5 Algoritmien kehitystyö...59

4.5.1 Kehitystyön osa-alueita...59

4.5.2 Erilaisia lähestymistapoja...60

4.5.3 Tilastolliset menetelmät...61

4.5.4 Näkökulmia menneeseen ja tulevaan... 63

5 KUVIEN LUOKITTELU JA MUITA KUVANLAADUN AUTOMAATTISEN MITTAAMISEN SOVELLUKSIA... 64

5.1 Sovelluksista yleisesti...64

5.2 Kuvanlaadun optimointi...64

5.2.1 Laitteiden kehitystyö...64

5.2.2 Laadun parannus jälkiprosessoinnilla... 65

5.2.3 Laadun ylläpito...66

5.3 Luokittelusovelluksia...67

5.3.1 Journalistinen kuvahaku... 67

5.3.2 Yksityisten kuvien hallinta... 67

5.3.3 Kuvien jakaminen...68

5.3.4 Kuvat tiedonvälittäjinä...68

5.4 Lyhyt katsaus tulevaan...69

(7)

6.1 Tutkimusongelma... 70

6.2 Vaihe 1: Määrittelevä testikierros... 70

6.2.1 Kuvien valinta...70

6.2.2 Kuvien esikäsittely...72

6.2.3 Testihenkilöt...74

6.2.4 Subjektiivinen arviointimenetelmä... 74

6.2.5 Subjektiivisen testin arviointiympäristö ja testin kulku...75

6.2.6 Objektiiviset mittaukset...76

6.3 Vaihe 2: Kokonaislaatua ennustavan menetelmän kehittäminen...76

6.4 Vaihe 3: Kehitetyn menetelmän validointi uudella testikierroksella...77

6.4.1 Käytettävät kuvat...77

6.4.2 Testijärjestelyt...78

6.4.3 Tulosten käsittely...79

7 VAIHE 1 : MÄÄRITTELEVÄN TESTIKIERROKSEN TULOSTEN TARKASTELU. 80 7.1 Yleisiä huomioita tulosten esittämisestä... 80

7.2 Subjektiiviset testit...80

7.2.1 Subjektiiviset laadun arviot...80

7.2.2 Subjektiiviset attribuuttien arviot... 82

7.2.3 Attribuuttien arviot suhteessa laadun arvioihin... 84

7.2.4 Kyselylomakkeen vastaukset... 85

7.3 Objektiiviset testit... 86

7.3.1 Marzilianon et ai. (2002) sumentuneisuus-Zterävyysalgoritmi...86

7.3.2 Immerkaerin (1996) kohina-algoritmi... 87

7.3.3 Muut algoritmit...88

7.4 Subjektiivisten ja objektiivisten tulosten keskinäiset yhteydet...89

7.4.1 Terävyys ja laatu...89

7.4.2 Kohina ja laatu...91

7.5 Johtopäätökset ja luotettavuusanalyysi... 93

8 VAIHE 2: KUVANLAADUN LASKENTAMENETELMÄN KEHITTÄMINEN... 95

8.1 Kehitetyt attribuuttikomponentit... 95

8.1.1 Terävyyskomponentti... 95

8.1.2 Kohinakomponentti...98

8.2 Komponenttien yhdistäminen laadun arvioksi...101

8.2.1 Yleistä attribuuttien yhdistämisestä...101

8.2.2 Attribuuttilaatujen painotusmenetelmä... 101

8.2.3 Moniulotteinen mallinnus... 102

8.3 Parametrien määritys algoritmeille ja kuvaryhmille... 103

8.3.1 Parametrien valinnasta... 103

8.3.2 Kuvien ryhmittelyn tarkoitus... 104

8.3.3 Valintojen tekeminen tutkimuksen kuvaryhmille... 105

8.3.4 Kokonaismallin linearisointi... 106

8.3.5 Komponenttien yhdistystavan vaatimukset parametrien valinnassa... 107

9 VAIHE 3: VALIDOINTITESTIN TULOSTEN TARKASTELU... 108

9.1 Subjektiivisen testin tulokset... 108

9.1.1 Kuvien laadun arviot... 108

(8)

9.1.2 Kyselylomakkeen vastaukset...108

9.2 Attribuutteja mittaavien algoritmien suorituskyky... 109

9.2.1 Terävyysmenetelmä... 109

9.2.2 Kohinamenetelmä... 110

9.3 Kokonaismenetelmän suorituskyky... 111

9.3.1 Attribuuttien painotusmenetelmä...111

9.3.2 Moniulotteinen mallinnus... 113

9.3.3 Luotettavuusanalyysi ja havaintoja tuloksista...116

9.4 Menetelmän käyttökelpoisuus... 116

9.4.1 Menetelmän kyky ennustaa laatua...116

9.4.2 Menetelmän tuottamien arvioiden käytännön tulkinta... 118

9.4.3 Menetelmän optimoitavuus kuvaryhmälle sopivaksi... 118

9.4.4 Laskennallinen näkökulma...119

9.4.5 Ongelmakohtia ja puutteita... 119

10 YHTEENVETO... 121

10.1 Tutkimuksen kulkuja keskeisimmät havainnot...121

10.2 Jatkotutkimusehdotuksia... 123 LÄHDELUETTELO

LIITE 1 - LAADUN ENNUSTAMISEN KOKONAISMALLI LIITE 2 - MÄÄRITTELEVÄN TESTIN OHJEET

LIITE 3 - MÄÄRITTELEVÄN TESTIN KYSYMYKSET LIITE 4 - VALIDOINTITEST1N OHJEET

LIITE 5 - VALIDOINTITESTIN KYSYMYKSET

LIITE 6 - MÄÄRITTELEVÄN TESTIN LAADUN ARVIOT LIITE 7 - MÄÄRITTELEVÄN TESTIN ATTRIBUUTTIARVIOT

LIITE 8 - MÄÄRITTELEVÄN TESTIKIERROKSEN KYSELYN VASTAUKSET LIITE 9 - MÄÄRITTELEVÄN TESTIKIERROKSEN OBJEKTIIVISET TULOKSET LIITE 10 - KEHITETYN SUMEUSMENETELMÄN KOODI

LIITE 11 - KEHITETYN KOHINAMENETELMÄN KOODI

LIITE 12 - KOODI LAADUN MÄÄRITYKSEEN ATTRIBUUTTEJA PAINOTTAMALLA LIITE 13 - KOODI LAADUN MÄÄRITYKSEEN MONIULOTTEISELLA

MALLINNUKSELLA

LIITE 14 - VALIDOINTITESTIN KUVIEN SUBJEKTIIVISET LAADUNARVIOT LIITE 15 - VALIDOINTITESTIN KYSELYN VASTAUKSET

LIITE 16 - VALIDOINTITESTIN KUVISTA ALGORITMEILLA LASKETUT ATTRIBUUTTIEN ARVOT

LIITE 17 - VALIDOINTITESTIN KUVISTA ALGORITMEILLA LASKETUT LAADUN ARVOT

(9)

Algoritmi Ohjelmalle annettu ohjeiden sarja, jolla määritetään esi

merkiksi jonkin attribuutin arvo

Artefaktuaalinen attribuutti Attribuutti, joka kuvassa havaittuna johtaa lähes poikke

uksetta kuvanlaadun heikentymiseen (ISO 20462-1, 2005)

Attribuutti Kuvan jokin ominaisuus (esim. kohina, terävyys, värik

kyys)

Attribuutti-JND Yksikkö, joka vastaa jonkin attribuutin juuri ja juuri ha

vaittavissa olevaa muutosta (kts. JND)

Attribuutti laatu Tässä työssä käytetty käsite, joka kuvaa jonkin attribuu

tin havaittua laatua.

CIEL AB -avaruus Vastaväreihin pohjautuva väriavaruus, jossa L on vaale

us, a* viher-puna-akseli ja b* sini-kelta-akseli

FUN-kolmijako Kuvan laadun jakaminen toiston tarkkuuteen, hyödylli

syyteen ja luonnollisuuteen

Globaali Koko kuvaa koskeva

Heteroskedastisuus Tilanne, jossa virhetermien eli residuaalien hajonta vaih- telee ennustavien muuttujien arvoista riippuen

Histogrammi Kuvan pikseleiden arvojakauma

ISO Kansainvälinen standardisointiorganisaatio (International Organization for Standardization)

ISO-herkkyys ISO:n standardoima kameroissa käytetty valoherkkyyden mitta

JND Just Noticeable Difference eli juuri ja juuri havaittavissa oleva ero

Kolmoisvertailumenetelmä ISO 20462-2 -standardissa määritetty subjektiivisen ar

vioinnin menetelmä, jossa kolmea kuvaa vertaillaan sa

manaikaisesti

(10)

Korrelaatio Mittaa kahden muuttujan kuten esimerkiksi attribuutin subjektiivisten arvioiden ja algoritmilla mitattujen arvo

jen suhteen vahvuutta. Sen mittaamiseen käytetään yleensä Pearsonin korrelaatiokerrointa. Myös tässä työs

sä korrelaatiolla tarkoitetaan Pearsonin korrelaatioker

rointa, ellei muuta erikseen mainita.

Laaduttaminen Tässä työssä käytettävä käsite, jolla viitataan jonkin att

ribuutin muuttaamiseen kyseistä attribuuttia kuvaavaksi laadun mitaksi eli attribuuttilaaduksi.

Laatuavaruus Tämän työn yhteydessä käytetty termi moniulotteisesta avaruudesta, jonka ulottuvuuksina toimivat kuvaan liit

tyvät attribuutit

Laatu-JND Yksikkö, joka vastaa juuri ja juuri havaittavissa olevaa muutosta kuvanlaadussa (kts. JND)

Luonnollinen kuva Näkyvän valon perusteella ympäristöstä muodostettu va

lokuva

Luminanssikanava Kuvan valoisuusjakauma, joka yksinään muistuttaa mus

tavalkokuvaa, mutta yhdistettyinä värikanaviin muodos

taa tavallisen värikuvan

Matlab Laskentaohjelma, josta tämän työn yhteydessä käytettiin pääasiassa 6.5.2004 julkaistua versiota 7.0.0.19920 (R14).

Monotoninen Jos kahden muuttujan välinen suhde eli funktio on mo

notoninen, yhden muuttujan kasvaminen vaikuttaa toi

seen muuttujaan aina samansuuntaisesti. Toisin sanoen jos muuttujan 1 kasvu laskee muuttujan 2 arvoa jonkin arvon kohdalla, se tekee samoin myös muiden arvojen kohdalla

Mieltymyksellinen attribuutti Attribuutti, jonka ihanteellinen voimakkuus riippuu tark

kailijasta ja kuvasisällöstä (ISO 20462-1, 2005)

Outlieri Tilastollisesti merkittävä poikkeama otannassa, jolle voidaan esittää useita erilaisia määritelmiä.

Parivertailu Arviointimenetelmä, jossa kahta näytettä kerrallaan ver-

(11)

kin yksittäisen attribuutin perusteella

Regressiosuora Muuttujien arvojen perusteella pienimmän neliösumman menetelmällä määritetty muuttujien välistä yhteyttä ku

vaava suora

Residuaali Havaitun ja ennustetun välinen erotus tai erotuksen neliö (Metsämuuronen 2006, s. 597). On huomioitava, että en

nustettu ei tämän työn yhteydessä tarkoita algoritmin tuottamaa ennustusta, vaan algoritmin ja subjektiivisten testien tuottamien arvioiden välistä yhteyttä kuvaavan regressiosuoran tai -käyrän ennustamaa arvoa.

Saturaatio Värikylläisyys

Selektiivisyys Algoritmin kyky kiinnittää huomiota vain mitattavana olevaan attribuuttiin jättäen muut attribuutit huomiotta.

Sokea laadun arviointi Ilman referenssikuvaa tapahtuva laadun määritys

Sisäinen referenssi Sisäinen muistikuva siitä, miltä jonkin kohteen tulisi näyttää

Ulkoinen referenssi Kuvan alkuperäinen fyysinen kohde, jota kuvan on tar

koitus jäljitellä

Väritasapaino Kuvan värikomponenttien tasapaino suhteessa toisiinsa Värikanava Kuvan yhden värin tai kahden vastavärin suhdetta ku

vaavien arvojen jakauma

(12)

1 JOHDANTO 1.1 Taustaa

Valokuvista on tullut digitaalisen valokuvauksen kehittymisen myötä entistä merkittävämpi osa ihmisten arkea. Tämä koskee erityisesti yksityiselämää, jossa tavallisten harraste lijakuvaa- jien ja varsinkin harrastelijakuvien määrä tuntuu kasvaneen räjähdysmäisesti viime vuosien aikana. Kuvien valtava määrä sekä tietotekniikan mahdollistamat uudet tehokkaat jakelukana

vat lisäävät tarvetta kuvien luokittelulle ja arvottamiselle, mikä toimii myös motivaationa tälle työlle.

Ehkä helpoin tapa luokitella kuvia on niiden semanttinen sisältö. Yksinkertaisimmillaan tämä tapahtuu jakamalla kuvat toisensa lähtökohtaisesti poissulkeviin kategorioihin. Tehokkaam

maksi ja joustavammaksi luokittelu saadaan kuitenkin käyttämällä kuviin metadatana liitettä

viä avainsanoja, joiden avulla kuva voi samanaikaisesti kuulua lukuisiin erilaisiin kuvaryhmiin (Hyvönen et ai. 2003). Tällaista avainsanoihin perustuvaa järjestelmää käytetään muun muassa kaupallisissa kuvapankeissa kuten Shutterstockissa (www.shutterstock.com). Myös tämän alan maailma on kuitenkin muuttunut huomattavasti digitaalisen valokuvauksen vallankumouksen myötä. Yksi syy on se, että monien yritysten liiketoiminta pohjautuu enenevissä määrin har- rastelijavalokuvaajien ottamiin valokuviin (Howe 2006). Tässä murroksessa on näin ollen syy

tä tutkia edelleen mahdollisia uusia keinoja luokittelun tehostamiseksi.

Vaikka kuvien avainsanoihin pohjautuvat haut voivat olla suhteellisen tehokkaita vastaamaan hakijan tarpeisiin, ne kuitenkin vaativat käytännössä aina manuaalisen määrittämisen. Aina tähän ei haluta tai ole edes mahdollista käyttää aikaa tai resursseja, joten on perusteltua kehit

tää myös automaattisia kuvien luokittelumenetelmiä. Yksinkertaisimmasta päästä olevia kuvan tunnistustehtäviä on erottaa automaattisesti aidot valokuvat erilaisista keinotekoisista kuvista.

Siinä onkin saavutettu hyviä tuloksia, kuten Lienhartin ja Hartmannin (2002) tutkimuksessa, jonka taustamotivaatioksi tekijät mainitsevat juuri hakukoneiden tehostamisen tekstuaalisen haun ulkopuolelle. Hu ja Bagga (2004) puolestaan pyrkivät tutkimuksessaan ennustamaan uu- tissivuston kuvien käyttötarkoitusta eli sitä, onko kyseessä esimerkiksi mainos-, logo-, esikat

selu- tai varsinainen uutiskuva. Tämä voisi heidän mukaansa olla hyödyksi muun muassa tie

don kaivamisessa sivuilta tai tiedon optimoinnissa matkapuhelimia varten. Sen sijaan luonnol

listen kuvien semanttisen sisällön automaattisesta määrittelystä ollaan vielä kaukana. Mikäli kuvaluokkien määrä on rajallinen, voidaan kuitenkin saavuttaa kohtalaisia tuloksia luokan en

nustamisessa. Esimerkiksi jo Vailayan et ai. (1999) tutkimuksessa saatiin 95,3%:n onnistu

misprosentilla erotettua kaupunkikuvat maastokuvista ja metsäkuvat vuoristokuvista lähes yh

tä hyvin.

Kuvien käyttötarkoituksen tai aihesisällön automaattisen päättelemisen lisäksi algoritmien avulla voidaan koettaa arvioida myös kuvan laadullisia ominaisuuksia kohinan kaltaisista ma

talan tason suureista korkeamman tason käsitteisiin. Koska valokuvat on ennen kaikkea tarkoi

tettu ihmisen havainnoitaviksi, tulee hyvin suunnitellun algoritmin pohjautua koehenkilöiden

(13)

mieltymyksiä mittaaviin subjektiivisiin arvioihin, jotka on perinteisesti kerätty tätä tarkoitusta varten suunnitelluin testein. Hyvin suunniteltu algoritmi voisi näin tehostaa esimerkiksi kuva- pankkien kaltaisten palveluiden hakutoimintoa tai auttaa rajaamaan laadultaan riittämättömät tai heikoimmat kuvat pois jossakin muussa käytännön sovelluksessa. Tämä kuvan analysoin

nin osa-alue on tämän diplomityön keskeisin tutkimuksen aihe.

1.2 Ttutkimuksen tavoite ja rajaus

Tutkimuksen pääasiallisena tavoitteena on perehtyä kuvan erilaisia laadullisia tekijöitä mittaavien algoritmien kykyyn tuottaa ihmisten keskimääräisen subjektiivisen käsityksen kanssa hy

vin korreloiva arvio digitaalisessa muodossa olevan kuvan laadusta. Käytännössä siis ensin testataan määritelty kuvajoukko testihenkilöiden avulla, jonka jälkeen voidaan verrata saatuja tuloksia algoritmien antamiin arvioihin. Samalla pohditaan menetelmien soveltuvuutta kuvan luokittelun tehostamiseen.

Laatu on käsitteenä kuitenkin hyvin subjektiivinen ja moniulotteinen, minkä vuoksi on myös tärkeää määrittää tarkoin, mitä oikeastaan mitataan. Työn teoriaosuudessa tarkastellaan tästä johtuen yleistä kuvanlaadun käsitteeseen ja mittaamiseen liittyvää problematiikkaa sekä pe

rehdytään kuvanlaadun määrittämisen merkitykseen käytännössä sekä menneiden että mahdol

listen tulevien sovelluksien valossa.

Työn kokeellista osuutta ajatellen on hyvä perustella kaksi keskeistä rajanvetoa. Ensinnäkin kuvan arvioitu laatu riippuu jo arvioijan suhteesta kuvaan. Keelan (2002, s. 4-5) jakaa arvioijat tällä mittapuulla kolmeen ryhmään: ensimmäiseen osapuoleen eli kuvaajaan, toiseen osapuo

leen eli kuvassa esiintyviin sekä kolmanteen osapuoleen eli kuvaustapahtuman ulkopuolisiin tarkkailijoihin. Ensimmäisen voisi arvella kiinnittävän huomiota muita enemmän esimerkiksi kuvan rajaukseen ja kohteiden asetteluun, toisen puolestaan omaan ”onnistumiseen” kuvassa, ja kolmannen taas teknisempiin seikkoihin ja kuvan yleiseen esteettisyyteen.

Toisena tekijänä ihmiset ovat itse asiassa kuvanlaadun arvioinnissa sitä useammin eri mieltä, mitä korkeampaa kognitiivista käsittelyä vaativia ominaisuuksia pyydetään arvioimaan (Mar

tens 2002). Tästä johtuen esimerkiksi esteettisyyden kaltaisten ominaisuuksien automaattista arviointia algoritmien avulla voidaan pitää paitsi hyvin haasteellisena, myös monia sovellus

mahdollisuuksia ajatellen suhteellisen tarpeettomana, sillä ei ole kovin mielekästä laatia yhtä automaattista kuvan arvottajaa, joka olisi toteutuksestaan riippumatta väistämättä usein vah

vasti eri mieltä kuin merkittävä osa sovelluksen käyttäjistä. Pienen käyttäjäryhmän valmiiksi määriteltyihin mieltymyksiin pohjautuvassa tai jonkinlaisella käyttäjäkohtaisia mieltymyksiä käyttäjäpalautteen kautta opettelevalla sovelluksella voisi kuitenkin mahdollisesti päästä koh

talaisiin tuloksiin myös tällaisten hyvin korkean tason ominaisuuksien mittaamisessa. Tällai

sen menetelmän kehittäminen vaatii kuitenkin huomattavasti laajempaa tutkimus- ja kehitys

työtä.

Paitsi edellä mainituista syistä, myös korkeamman tason käsitteitä mittaamaan pyrkivien ai

kaisempien tutkimusten vähäisyydestä johtuen tutkimuksessa keskitytään algoritmien osalta

(14)

matalamman tason tekijöihin kuten terävyyteen, kontrastiin, kohinaan ja värikkyyteen, joskin

teoriaosuudessa pohditaan myös syvemmän tason tekijöiden mittaamista. Koska subjektiivi

sissa testeissä määritettävänä laadullisena ominaisuutena pidettiin ensisijaisesti nimenomaan luonnollisen kuvan ”laatua”, tarkastelijoina toimi niin sanottu kolmas osapuoli henkilökohtais

ten vaikuttimien minimoimiseksi. Kolmantena rajanvetona kokeellisessa osuudessa käytettiin vain luonnollisia kuvia, eikä niiden osalta tutkittu pakkausvääristymien vaikutusta.

Vertailemalla algoritmien antamia arvoja subjektiivisista testeistä saatuihin tuloksiin pyrittiin saamaan jonkinlainen näkemys algoritmien yhdistetystä soveltumisesta kuvanlaadun arvioin

tiin. Tavoitteena oli kehittää tapa yhdistää algoritmien arvoja sellaiseksi kokonaisuudeksi, joka suoriutuisi useimmissa tapauksissa paremmin kuvanlaadun ennustamisessa kuin yksikään al

goritmeista yksinään. Lisäksi tutkittiin neljää kuva-aihepiiriä vertailemalla, voidaanko laa

dunarvioinnin onnistumisen todeta riippuvan kuvan sisällöstä, ja onko laadunarviointimene

telmän yksityiskohtia syytä muuttaa riippuen kuvan sisällöstä. Koska motivaatio tutkimukselle on kuvien luokittelun tehostaminen, laadunarviointimenetelmässä ei voida käyttää referenssikuvaa. Teoriaosuudessa käsitellään pintapuolisesti kuitenkin myös referenssikuvaan pohjautu

via menetelmiä, koska ne voivat toimia ainakin periaatteellisena pohjana referenssittömille eli niin sanotuille sokeille menetelmille.

1.3 Työn rakenne

Suhteellisen laajan teoriaosien aluksi perehdytään hieman kuvanlaadun käsitteeseen yleisesti luvussa 2 etenemällä abstrakteimman tason käsitteistä yksiselitteisempiin käsitteisiin. Tämä on tärkeää kuvanlaadun problematiikan ymmärtämiseksi, algoritmien taustalla vaikuttavien käsit

teiden määrittämiseksi sekä erilaisten kuvaominaisuuksien keskinäisten vuorovaikutuksien hahmottamiseksi. Luvussa 3 edetään kuvanlaadun subjektiiviseen mittaamiseen, mikä on kai

ken kuvanlaadun arvioinnin perusta. Luvussa 4 siirrytään kuvien objektiivisempaan arvioimi

seen eli esitellään kuvan laatuun vaikuttavien tekijöiden arvioimiseen kehitettyjä algoritmeja sekä tarkastellaan, miten korkeammankin tason laadullisia käsitteitä voitaisiin mallintaa algo

ritmien avulla. Tämän jälkeen selvitetään luvussa 5, mitä käytännön sovelluksia kuvanlaadun arvioimisella oikeastaan on ollut ja mitä sovelluksia sillä mahdollisesti tulee jatkossa olemaan.

Luvussa 6 siirrytään kokeelliseen osuuteen esittelemällä tarkemmin varsinainen tutkimuson

gelma sekä määritellään tutkimuksessa käytetyt menetelmät. Luvussa 7 esitellään ensimmäi

sen eli määrittelevän testikierroksen subjektiivisten ja objektiivisten testien tuloksia sekä tutki

taan näiden välistä korrelaatiota. Luvussa 8 esitellään tulosten pohjalta kehitetty laadunarvi- oimismenetelmä, jonka suorituskykyä arvioidaan luvussa 9 toisen testikierroksen tulosten poh

jalta. Luvusta 10 löytyy tutkimuksen yhteenveto, jossa pohditaan saatuja tuloksia sekä esite

tään ajatuksia aiheeseen liittyvistä jatkotutkimuskohteista.

(15)

2 KUVANLAATU 2.1 Yleistä

2.1.1 Kuvanlaadun määritelmästä lyhyesti

Kuvanlaatu koostuu käsitteenä kahdesta osasta: kuvasta ja laadusta. Jo sana kuva voidaan ymmärtää usealla tavalla. Se voi olla ihmisen tai tietokoneen piirtämä kuva, luonnollinen va

lokuva, tai jotakin näiden kahden väliltä. Luonnollisella valokuvalla tarkoitetaan tässä näky

vän valon perusteella muodostettua kuvaa, joka siis pyrkii pääosin vastaamaan ympäristöä sel

laisena kuin ihminen sen näkee. Kuva voi pyrkiä myös välittämään jotain tiettyä tietoa, kuten esimerkiksi lämpökameroiden muodostamien kuvien tapauksessa. Selkeästi valokuvien ja kei

notekoisten kuvien välimaastoon puolestaan kuuluvat muun muassa erilaiset esimerkiksi mai- noskäyttöön tarkoitetut kuvamanipuloinnit ja jotakin käytännön tarkoitusta varten käsitellyt kuvat, jotka voivat olla hyödyllisiä esimerkiksi tähti- tai lääketieteessä jonkin asian demon

stroimiseksi.

Laatu puolestaan on käsitteenä hyvin moniulotteinen ja voi käytännössä tarkoittaa lukuisia eri asioita, kuten kohdassa 2.2.3 tuodaan esille. Lisäksi kuten johdannostakin käy ilmi, laatu on käsitteenä pohjimmiltaan hyvin subjektiivinen. Vaikka esimerkiksi kuvan käyttötarkoituksesta vallitsisi yhteisymmärrys, ei ole välttämättä yksimielistä, mikä tarkkuus tai värikkyysaste olisi kuvalle juuri se ihanteellisin. Eri ihmiset myös tarkkailevat kuvasta erilaisia asioita, ja ammat

tilaiset kiinnittävät ehkä turhankin paljon huomiota asioihin, jotka liittyvät eniten heidän työ

hönsä (I3A 2007, s. 8-9). He voivat esimerkiksi olla kriittisempiä kuvassa havaittavia virhete

kijöitä kohtaan, kuten todettiin käyneen muun muassa Oliphantin et ai. (1989) tutkimuksessa.

Näistä syistä johtuen on kuvanlaadun tutkimuksessa aina syytä tiedostaa, mikä on käyttötar

koitus, ketkä kuvaa tarvitsevat sekä mitä kuvalta käyttötarkoitus ja käyttäjäryhmä huomioon ottaen oikeastaan edellytetään.

2.1.2 Subjektiivinen ja objektiivinen kuvanlaatu

Kuvanlaadussa on pohjimmiltaan kyse siitä, miten ihminen kokee kuvan suoriutuvan tehtäväs

tään, minkä vuoksi subjektiiviset testit ovat luonteva tapa kuvanlaadun määrittämiseen. Sub

jektiivisten mielipiteiden keskiarvoon pohjautuvaa MOS:ia (Mean Opinion Score) onkin pit

kään pidetty parhaana tapana mitata kuvanlaatua (Wang 2006, s.l). Ihmisten käyttö arvioiden saamiseksi on kuitenkin vähintäänkin aikaa ja resursseja vievää, mutta monia sovelluksia aja

tellen myös mahdotonta. Tästä johtuen tarvitaan myös automaattisia eli objektiivisempia me

netelmiä.

Objektiivisella kuvanlaadulla tarkoitetaan tyypillisesti suhteellisen yksinkertaisesti mitattavis

sa olevia suureita, joihin esimerkiksi valokuvauslaitteiden tekniset ominaisuudet vaikuttavat suoraan. Objektiivisen laadun määrittämisen voi jakaa kahteen kategoriaan: laiteriippuvaiseen ja laiteriippumattomaan. Näistä ensimmäinen sitoo järjestelmän tekniset parametrit, kuten

(16)

DPI-luvun (eli tuuman matkalle osuvan pistemäärän) tai kontrastin ihmisen havaintoihin (Johnson ja Fairchild 2003). Toinen näkökulma menetelmien erotteluun on se, suoritetaanko arviointi suhteessa saman kuvasisällön sisältävään referenssikuvaan vai ei. Referenssikuva, jota yleensä pidetään vertausten kannalta niin sanotusti virheettömänä, antaa arvioinnille sel

keän lähtökohdan, jota vasten niin ihmisarvioitsijan kuin tietokoneenkin on helppo mitoittaa kuvanlaatua. Verrattaessa samasta kohdekuvasta eri laitteistoparametreilla tuotettuja kuvia voidaankin usein jo yksinkertaisilla menetelmillä kuten laiteriippuvaiseen mittaamiseen tarkoi

tetulla neliöjuuri-integraalilla (Barten 1990) saada kohtalaisen hyvä korrelaatio koetun laadun ja mitattujen arvojen välillä. Kuvan arviointi ilman referenssiä on kuitenkin huomattavasti vaativampaa suorittaa johdonmukaisesti kuvien vaihtelevan luonteen vuoksi. Monissa käytän

nön tilanteissa referenssiä ei ole saatavilla, minkä vuoksi tällainenkin arviointi on tarpeen.

Laajemmin ymmärrettynä objektiivisen kuvanlaadun voi katsoa olevan pitkälle kehitettyjen ihmisen havainnoinnin fysiikkaan ja psykologisiinkin tekijöihin pohjautuvien ja kuvasisältöä analysoivien algoritmien monimutkainen kokoelma, joka jäljittelee subjektiivisilla testeillä saatua tilastollista keskiarvoa ihmisten mieltymyksistä. Tämänkin sokeaan eli referenssittö- mään kuvanlaatuun keskittyvän tutkimuksen tavoitteena on tukea tuota monimutkaisempien laatualgoritmien kehitystä. Luvussa 2.3 objektiivisella kuvanlaadulla tarkoitetaan kuitenkin nimenomaan sellaisia yksinkertaisia tekijöitä, joihin muun muassa laitteiston ominaisuuksilla on suora vaikutus. Algoritmeja käsittelevässä luvun alaluvussa 4.4 pohditaan tarkemmin mo

nimutkaisempien menetelmien mahdollisuuksia.

2.1.3 Kuvanlaadun ja sen mittaamisen merkitys

Itse kuvanlaadun pohjimmainen merkitys on suhteellisen selvä: laadukas kuva suoriutuu teh

tävästään paremmin, oli se tehtävä sitten puhtaasti tiedon välittäminen, pelkästään elämyksen tarjoaminen tai jotain näiden kahden ääripään väliltä. Laadun mittaamisen merkitys ei silti ole itsestäänselvyys. Kuten kuville itsessään, myös kuvanlaadun mittaamiselle on kuitenkin näh

tävissä lukuisia sovellusmahdollisuuksia niin laitteiden kehitystyössä kuin esimerkiksi luon

nontieteellisissä, sotilaallisissa tai tavallisille kuluttajille suunnatuissa käyttötarkoituksissakin.

Monissa sovelluksissa olisi suotavaa tai jopa välttämätöntä, että mittaus olisi tehtävissä auto

maattisesti, jolloin tarvitaan tietokoneelle suunniteltuja algoritmeja. Näihin soveltamismahdol

lisuuksiin perehdytään tarkemmin luvussa 5.

2.2 Kokonaisvaltaisia kuvanlaadun käsitteitä

2.2.1 Yleistä

Kuvanlaatua kuvaavat käsitteet jaetaan tässä ja seuraavassa luvussa (luku 2.3) karkeasti kah

teen ryhmään. Näistä ensimmäiset kuvaavat kuvan tehtävästään suoriutumiskykyä kokonai

suutena, ovat siten rinnastettavissa kokonaislaadun käsitteeseen ja korreloivat usein vahvasti keskenään. Niiden erilaiset näkökulmat tekevät niiden erottelun toisistaan kuitenkin hyödylli

(17)

seksi kuvanlaadun tutkimuskentän monimuotoisuudesta johtuvan vaatimusten erilaisuuden vuoksi.

Kokonaisvaltaisiksi käsitteiksi voidaan lukea muun muassa luonnollisuus, vääristymättömyys tai yleisluontoisesti laatu. Ne eivät ole keskenään suoraan verrannollisia, mutta yhteistä niille on se, että ne ovat luonteeltaan aidosti joko positiivisia tai negatiivisia. Tästä seuraa, että nii

den suhde kuvan laatuun tai ainakin kuvalle määritetystä tehtävästä suoriutumiseen on enim

mäkseen monotoninen. Luonteeltaan ne ovat toista käsiteryhmää abstraktimpeja ja siten myös subjektiivisempia, minkä vuoksi myös niiden mittaaminen on vaikeampaa ja tapahtuu käytän

nössä aina matalamman tason käsitteiden määrittämisen kautta.

Seuraavaksi käsitellään muutamia tällaisia kuvanlaadun käsitteitä alkaen kaikista korkeimman tason käsitteistä. Luvussa 2.3 jatketaan samaa listaa etenemällä teknisempien ja samalla yksi- selitteisempien käsitteiden suuntaan. Luvussa 2.4 tarkastellaan tämän jälkeen hieman, miten nämä käsitteet käytännössä suhtautuvat toisiinsa.

2.2.2 Vetoavuus

Vetoavuus ei ole kovin tyypillinen kuvanlaadun mittari, mutta ajatuksena mielenkiintoinen johdatus subjektivisimpiin ja siten hankalimpiin kuvan suorituskykyä mittaaviin käsitteisiin.

Savakis ryhmineen (2000) määrittelee kuvan vetoavuuden (engl. appeal) kiinnostuksena, jon

ka kuva herättää kolmannen osapuolen tarkkailemana. Aihetta on heidän mukaansa tutkittu vain vähän sen vuoksi, että se koetaan hyvin subjektiivisena suureena siinä missä kuvanlaatua taas pidetään objektiivisesti mitattavana. Perusteluna käsitteen tarpeellisuudelle he mainitsevat aikaisemman tutkimuksen osoittaneen, että muun muassa kuva-aiheen mielenkiintoisuus ja kohteen virheet kuten epäonnistunut rajaus tai ihmiskohteen ilme ovat merkittävämpiä tekijöi

tä silloin, kun ihmiset päättävät, mitä kuvia he eivät tarvitse esimerkiksi kuva-albumiinsa. He totesivat tutkimuksessaan vetoavuuden olevan yhteydessä kuvanlaatuun vain suhteessa suo- rimmin objektiivisesti mitattavissa oleviin suureisiin, joista eniten vetoavuuteen vaikutti vä

rikkyys. Eniten kuvissa vaikuttivat kuitenkin ihmisiin, asetelmaan ja aiheeseen liittyvät asiat, joita on vaikea mitata automaattisilla algoritmeilla.

2.2.3 Laatu

”Laatua” voidaan jossain määrin pitää kaikkien kuvan hyvyyttä kuvaavien käsitteiden yläkä

sitteenä, sillä sitä käytetään yleisesti myös muissa kuin kuvaan liittyvissä konteksteissa yleisen

tasokkuuden mittarina. Tyypillisissä asiayhteyksissä se on kuitenkin vetoavuutta helpommin arvioitavissa, minkä vuoksi se on tässä listattu vasta toisena käsitteenä. Laatu-sanan jo pelkäs

tään kuviin liittyvien erilaisten käyttöyhteyksien ja merkitysten vuoksi on joka tapauksessa perusteltua tarkastella käsitettä hieman tarkemmin. Laatu on kuvan ansiokkuutta mittaavista termeistä moniselitteisimpiä ja vaatiikin siksi yleensä selvyyden vuoksi täsmennyksen varsin

kin subjektiivisten testien ohjeistuksessa. Laatu-käsitteen yleisen luonteen vuoksi se on liitet

tävissä moniin muihin yksittäisiäkin laadullisia tekijöitä mittaaviin käsitteisiin. Tämä on pe

(18)

rusteltua ainakin silloin, kun mitattavan yksittäisen attribuutin vaikutus kuvan havaittuun ta

sokkuuteen ei ole monotoninen tai kun halutaan muuten korostaa attribuutin ja sen aiheutta

man laatuvaikutelman eroa. Osittain myös tästä johtuen laatu lienee myös yleisimmin käytetty kuvan tasokkuutta kuvaava käsite.

Osasyy laadun monikäsitteisyyteen on se, että laadun käsitettä käytetään sellaisenaan usein

myös silloin, kun mitataan oikeastaan vain yhtä kokonaislaatuun vaikuttavaa attribuuttia kuten pakkausvääristymiä (esimerkiksi Junli Li et ai. 2001) tai terävyyttä. Jos ei muuta erikseen mainita, laadulla viitataan kuitenkin usein kuvan jonkinlaiseen tekniseen laatuun, joka saattaa olla useampien yksittäisten attribuuttien arvoista jollain tavalla koottu yhdistelmä, kuten esi

merkiksi Xin Lin (2002) ehdottamassa menetelmässä. Tekninen laatu tarkoittaa kuitenkin tyy

pillisesti käytännössä jonkinlaista puutteiden poissaolon tasoa, ja näin on myös Xin Lin mene

telmässä. Usein nämä puutteet ovat lisäksi selkeästi määritettyjä häiriö- tai vääristyneisyyste- kijöitä, kuten muun muassa Wangin et ai. (2002a) sekä Osbergerin et ai. (1998a) tutkimuksis

sa. Tästä johtuen olisikin ehkä yksiselitteisempää, jos kuvanlaadun sijasta puhuttaisiin aina vääristyneisyydestä, häiritsevyydestä tai jostakin muusta vastaavasta puutteita kuvaavasta kä

sitteestä aina silloin kun

se

olisi luontevaa. Näin käytettävän käsitteen perusidea olisi hel

pommin ja nopeammin kommunikoitavissa

ja

kuvan häiriöihin pohjautuvat menetelmät olisi

vat selkeämmin erotettavissa muunlaisista kuvan hyvyyttä mittaavista menetelmistä.

Keelan käsittelee läpi kirjansa (2002) kuvan laatua "vaikutelmana kuvan ansiokkuudesta tai oivallisuudesta sellaisen tarkkailijan tulkitsemana, joka ei ole ollut mukana kuvaustilanteessa eikä liity läheisesti kuvauksen aiheeseen”. Silloin kun laatua ei erikseen tarkemmin määritellä, tätä voi pitää kuvien yhteydessä kohtalaisen hyvänä yleismääritelmänä käsitteelle laatu. Ole

massa olevat käytännön objektiiviset menetelmät kuitenkin sulkevat lähes poikkeuksetta ku

van asetelmaan, rajaukseen ja muihin ei-teknisiin tekijöihin liittyvät tekijät laadun määritel

män ulkopuolelle. Tämän voi nähdä olevan osittain ristiriidassa paitsi Keelanin määritelmän, myös sen kanssa, miten ihminen laadun yleisellä tasolla käsittää. Myös tästä johtuen voi olla hyvinkin oleellista määrittää, mitä laadulla kussakin yhteydessä tarkoitetaan, tai vaihtoehtoi

sesti käyttää mahdollisuuksien puitteissa laadun sijaan muita kuvan hyvyyttä mittaavia käsit

teitä.

2.2.4 Hyödyllisyys

De Ridder ja Endrikhovski (2002) mallintavat laatua summana kolmesta tekijästä: toiston tarkkuudesta, hyödyllisyydestä sekä luonnollisuudesta eli englanninkielisenä akronyyminä FUN (fidelity, usefulness, naturalness). Jokaista tekijää nähdään käytettävän myös yksin ku

vanlaadun määrittäjänä, mutta hyödyllisyys on siinä suhteessa poikkeava käsite, että sen arvi

ointi on aina täysin riippuvainen kuvan tarkoituksesta, kun taas esim. edellä mainittuja vetoavuutta ja laatua voi useimmiten hyvin arvioida itsenäisesti ilman tietoa kuvan käyttötarkoi

tuksesta. De Ridder ja Endrikhovski mainitsevat esimerkkinä sumussa olevaa miestä esittävän luonnollisen kuvan, joka voi olla hyvin uskollinen todellisuudelle, mutta hyödyllisyydeltään matala mikäli tehtävänä on tunnistaa ihminen.

(19)

Hyödyllisyys-käsitettä voi periaatteessa käyttää mihin tahansa tarkoitukseen käytettävien ku

vien kanssa. Arkista kuvaa voi esimerkiksi mitata sillä perusteella, miten hyödyllinen se on joidenkin muistojen esille tuomisessa. Tällaisessa tarkoituksessa termi on kuitenkin kaukaa haettuja sen suuruutta on tällöin hyvin hankala määrittää niin objektiivisesti kuin subjektiivi- sestikin. Luontevimmillaan hyödyllisyys onkin kuvan suorituskykyä kuvaavana mittarina sil

loin, kun kuvan tarkoituksena on toimia lähinnä apuvälineenä jossakin järjestelmällisyyttä vaativassa työssä, kuten esimerkiksi jossakin lääketieteen, asevoimien tai videovalvonnan so

velluksessa.

2.2.5 Kuvainformaatio

Useissa kuvien käytännön sovelluksissa kuvan hyödyllisyys on käytännössä johdettavissa suo

raan kuvan sisältämän tiedon määrästä. Tästä syystä voidaan ajatella monia tilanteita, missä kuvainformaatio olisi luontevin kuvan suorituskyvyn mitta. Edellä mainittuja esimerkkejä käyttäen lääketieteessä kuva voi antaa tietoa taudista, sotilaallisessa käytössä tietoa maastosta

ja videovalvonnassa tunnistaa jonkun henkilön. Näin ollen kuvainformaatio toimii monessa

tilanteessa varteenotettavana vaihtoehtona hyödyllisyyden käsitteelle.

Sheikh ja Bovik (2006) esittelevät oman kuvainformaation toiston tarkkuuden mittansa VIE (Visual Information Fidelity), joka on perinteisten toistontarkkuusmittojen tapaan riippuvainen saatavilla olevasta referenssikuvasta. Poikkeuksellisen ”kokonaisvaltaiseksi” ja ainakin teori

assa tavallisia konkreettiseen referenssiin vertaavia mittareita suorituskykyisemmäksi VIF- suureen tekee se mahdollisuus, että mitattava kuva voi olla kuvainformaatioltaan myös alkupe

räistä eli referenssiä parempi. Useimmat referenssikuvaan vertaamiseen pohjautuvat suureet eivät tarjoa tätä mahdollisuutta, minkä vuoksi niiden suhdetta kuvan hyvyyteen ei voi auto

maattisesti pitää monotonisena.

2.2.6 Toiston tarkkuus suhteessa todellisuuteen ja luonnollisuus

Kuvanlaatututkimuksessa luonnollisuudella viitataan yleensä käytännössä kuvan värimaail

maan, kuten muun muassa Yendrikhovskijin et ai. (1998a) sekä de Ridderin et ai. (1995) tut

kimuksissa. Sen voi kuitenkin ymmärtää myös laajemmin. De Ridderin et ai. edellä mainitussa FUN-kolmijaossa luonnollisuus määritetään kuvan vastaavuutena sisäisiin referensseihin ku

ten muistiväreihin, kun taas toiston tarkkuus määräytyy ulkoisten referenssien eli todellisuu

den kautta. Näiden kahden erottelua perustellaan muun muassa sillä, että luonnollisuutta voi

taisiin käyttää esimerkiksi keinotodellisuuteen tai animaatioon liittyvien kuvien todellisuutta vastaamisen asteen kuvaamiseen, kun taas toiston tarkkuudella voisi kuvata taidetta tai tieteel

lisiä kuvia.

Käytännössä nämä ulkoiset ja sisäiset referenssit eivät liene kovin kaukana toisistaan, ja esi

merkiksi keinotodellisuuden tasokkuutta voisi hyvin kuvata myös toiston tarkkuuden eli ul

koisten referenssien kautta. Näkökulma käsitteillä on kuitenkin eri: luonnollisuus kuvaa sitä, miten kuva ihmisen mielestä vastaa todellisuutta, kun taas toiston tarkkuus sitä, miten kuva

(20)

ihan oikeasti vastaa todellisuutta. Aivan kuten maksimaalisen luonnollisuuden ja maksimaali

sen laadun arvioiden väliltä on löydetty useissa tutkimuksissa (mm. de Ridder et ai. 1995) sys

temaattinen ero, on mahdollista, että ihmiset pitäisivät luonnollisimpana hieman toisenlaisia kuvia, kuin mikä oikeastaan vastaa täsmällisimmin todellisuutta.

2.2.7 Vääristyneisyys ja häiritsevyys

Vääristyne isyys on edellä listattuihin verrattuna matalamman tason käsite, sillä sitä voi helpos

ti mitata yhden tai useamman häiriötekijän kautta - referenssin kanssa tai ilman. Häiritsevyys on vääristyneisyyden kanssa samankaltainen termi, mutta sen käyttö kohdistuu tyypillisesti vain yhteen tarkoin määriteltyyn häiriötekijään. Esimerkiksi kuvaan tai videokuvaan liitettävi

en digitaalisten vesileimojen tapauksessa häiritsevyys on hyvin luonteva mittari, minkä vuoksi sitä on käytetty muun muassa Fariaksen et ai. tutkimuksessa (2002).

Paitsi tiettyjen häiriötekijöiden mittoina, vääristyneisyys ja tarkemmin määriteltynä häiritse

vyyskin voidaan kuitenkin nähdä myös vaihtoehtoina teknisen laadun käsitteelle, minkä vuok

si ne on tässä yhteydessä listattu kokonaisvaltaisten laadunkäsitteiden joukkoon. Vääristynei- syyshän voidaan nähdä mittarina siitä, kuinka vääristynyt kuva on suhteessa siihen, millainen teknisesti virheetön kuva vastaavasta kohteesta olisi. Häiritsevyys taas voidaan määritellä ku

vaamaan, missä määrin kuvan ilmeiset puutteet loppujen lopuksi häiritsevät. Tällaisessa yh

teydessä käsitteet voisi nähdä turhina kiertoilmaisuina laadun käsitteelle, mutta käytännön ob

jektiiviset kuvanlaadun mittarit perustuvat nykyisellään suurelta osin nimenomaan erilaisiin häiriöihin tai puutteisiin, minkä vuoksi voi tämäntapaisten puutteita mittaavien käsitteiden käyttö olla perusteltua myös subjektiivisia mittauksia tehdessä.

2.3 Matalan tason käsitteitä

2.3.1 Yleistä

Verrattuna edellisessä alaluvussa lueteltuihin käsitteisiin, tähän ryhmään luokiteltavat suureet

ovat luonteeltaan teknisempiä, eivätkä siten yksin riitä kuvaamaan kuvan suorituskykyä koko

naisuudessaan kuin korkeintaan tarkoin määritellyssä käyttötarkoituksessa. Toisaalta näitä ma

talamman tason käsitteitä tarvitaan väistämättä ainakin silloin, kun kuvan hyvyyttä halutaan mitata objektiivisin menetelmin. On olemassa esimerkiksi useita kuvausjärjestelmienkin ai

kaansaamia epäterävyyden ja punasilmäisyyden kaltaisia vikoja tai puutteita, jotka aiheuttavat melkein aina kuvanlaadun arvioidun heikkenemisen (Keelan, s.6). Mikäli matalamman tason käsitteitä saadaan yhdistettyä onnistuneesti, niillä onkin mahdollista ennustaa subjektiivista näkemystä korkeamman tason käsitteistä.

Töpferin et ai. (2002) mukaan useimmat tällaisista kokonaislaatuun vaikuttavista tekijöistä voidaan jakaa edelleen artefaktuaalisiin ja mieltymyksellisiin attribuutteihin. ISO 20462 - standardissa (2005) artefaktuaalinen attribuutti määritellään sellaiseksi, joka kuvasta havaittu

na lähes poikkeuksetta johtaa kuvanlaadun heikkenemiseen, ja mieltymyksellinen attribuutti sellaiseksi, joka on tarkkailijasta ja kuvasisällöstä riippuva mielipidekysymys. Artefaktuaalis-

(21)

ten mittaaminen on jo siinä mielessä helpompaa, että asteikon ääripäästä löytyy se laaduk- kaimmaksi koettu vaihtoehto. Esimerkiksi kohinan koetaan yleensä vain heikentävän laatua, joten mitä vähemmän kohinaa, sitä parempi laatu. Sen sijaan kuten on arvattavissa, laatu ei kasva monotonisesti esimerkiksi saturaation, kroman tai värikkyyden funktiona, minkä muun muassa Fedorovskaja et ai. (1997) ovat kokeellisestikin osoittaneet.

Mieltymyksellistä ulottuvuutta Töpfer et ai. kuten myös Keelan (2002, s.47-60) esittävät pre- ferenssijakaumana, josta nähdään, millä suhteellisella todennäköisyydellä kukin kohta on mie

luisin. Esimerkiksi kontrastille kaikista todennäköisimmin laadukkaimpana koettu taso eli pre- ferenssijakauman huippu olisi luultavasti jossain maksimikontrastin ja minimikontrastin väli

maastossa.

a*

Kuva 1. Väritasapainon preferenssijakauma CIELAB-väriavaruudessa (Töpfer et ai. 2002)

Töpferin ynnä muiden tulokset väritasapainolle on käytännön esimerkin vuoksi esitetty

graafi

sesti ylläolevassa kuvassa (Kuva 1), mistä on muun muassa huomattavissa, että parhaimmaksi miellettävyyden todennäköisyys laskee nopeammin väritasapainon muuttuessa punaviherakse- lilla (a*-akseli) kuin sinikelta-akselilla (b*-akseli). Keskeisintä tässä yksinkertaisessa väritasa- painoesimerkissä on tässä yhteydessä kuitenkin se, että se osoittaa hyvin mieltymyksellisten attribuuttien luonteen: todennäköisimmin parhaaksi miellettävä väri löytyy asteikon keskivai

heilta. Toinen huomionarvoinen seikka on, että mieltymyksen todennäköisyys ei laske sym

metrisesti huippukohdan molemmin puolin: sinisemmän suuntaan mieltymyksen todennäköi

syys laskee hitaammin. Tällaiset tekijät voivat osoittautua hyvinkin oleellisiksi silloin, kun matalamman tason suureilla pyritään ennustamaan kokonaisvaltaisia laadun käsitteitä.

2.3.2 Toiston tarkkuus suhteessa referenssikuvaan

Kohdassa 2.2.6 esitettiin ulkoiseen referenssiin suhteutetun toiston tarkkuuden käsite, jota voi pitää käytännössä puhtaasti positiivisena mittana kuvan tasokkuudesta. Oli vertailukohtana sitten konkreettinen kuva tai ulkoinen referenssi, toiston tarkkuutta voi tarkkailla joko pelkäs

tään jonkin yksittäisen

attribuutin

suhteen kuten esimerkiksi MacDonaldin

(1987)

tutkimana väriloiston tarkkuutena, tai sitten suhteessa kuvaan kokonaisuutena. Toiston tarkkuus suhtees-

(22)

sa referenssikuvaan on tässä kuitenkin eriteltynä erilliseksi, luonteeltaan kuvanlaatua vähem

män kokonaisvaltaisesti kuvaavaksi käsitteeksi kahdesta syystä. Ensinnäkin referenssikuva ei välttämättä ole laadultaan ideaali, ja voi olla jopa kuvankäsittelytoimenpiteillä parannettavissa, jolloin esimerkiksi kappaleessa 2.2.5 mainitun VIF-suureen tulisi saada referenssiä parempi arvio. Toisekseen toiston tarkkuus suhteessa alkuperäiseen kuvaan on huomattavasti suorem

min johdettavissa alkuperäisestä kuvasta yksinkertaisenkin matemaattisen kaavan avulla, mut

ta tämä toiston tarkkuus voi korreloida käytännössä hyvin heikosti ihmisen havaitseman kuvi

en samankaltaisuuden kanssa.

Puutteistaan ja referenssikuvan olemassaolon vaatimuksestaan huolimatta erilaiset konkreetti

seen referenssikuvaan vertaavat kuvaa arvioivat mittarit ovat kuitenkin hyvin yleisiä, koska niiden kehittäminen on referenssittömiin menetelmiin verrattuna huomattavasti helpompaa, ja siten niillä myös päästään yleensä huomattavasti parempiin tuloksiin. Referenssimenetelmille löytyy myös erilaisia sovellusalueita (kts. esim. luku 5.2.3), ja mikäli referenssikuva on käyt

tötarkoitusta silmällä pitäen todettavissa laadultaan ideaaliseksi, voidaan toiston tarkkuutta suhteessa referenssiinkin pitää jokseenkin kokonaisvaltaisena laadun käsitteenä sillä edelly

tyksellä, että se ottaa huomioon kuvan kokemien muutosten visuaalisen häiritsevyyden.

2.3.3 Värien luonnollisuus

Vaikka luonnollisuuden voi ajatella tarkoittavan pohjimmiltaan sitä, miten luonnonmukainen eli todellisuutta vastaava jokin kuva on, luonnollisuus on käsitteenä käytännössä hyvin ihmis- lähtöinen. Tyypillisesti kuvan arviointitehtävissäkin arvioinnin suorittaja joutuu kuvan alkupe

räisen kohteen näkemisen sijaan nojaamaan vain omiin aikaisempiin kokemuksiinsa ja odo- tuksiinsa siitä, mitä hän kuvan esittämän kohteen todelliselta vastineelta odottaisi. Värien osal

ta luonnollisuutta voidaankin tästä johtuen pitää kappaleessa 2.2.6 esitetyn luonnollisuuden määritelmän mukaisesti kuvan värien yhtäläisyytenä sisäisen referenssin mukaiseen värimaa

ilmaan. Värien luonnollisuus on siten vastaavaa kokonaisvaltaista käsitettä ajatellen monoto

ninen, mutta vain yhtä kuvan kokonaisluonnollisuuden osatekijää mittaava suure.

Värimuisti viittaa ihmisen kykyyn muistaa värejä yleisellä tasolla (Yendrikhovski et ai. 1999).

Muistivärit ovat puolestaan pitkäkestoisesta muistista löytyviä tuttuihin esineisiin yhdistettäviä värejä (Bartleson 1960). Värien kohdalla voimakkain sisäinen referenssi löytynee käytännössä juuri näistä muistiväreistä, mistä johtuen värien luonnollisuutta käsittelevissä tutkimuksissa luultavasti käytetäänkin usein taivaan, ihon tai nurmikon kaltaisia ihmisille hyvin tuttuja kuva- aiheita kuten muun muassa Bodrogin ja Tarczalin (2001) sekä Parkin et ai. (2006) tutkimuk

sissa. Ongelmalliseksi luonnollisuuden käsitteen voi nähdä sellaisissa tapauksissa, joissa ul

koinen referenssi (eli esimerkiksi alkuperäinen maisema, josta kuva on otettu) on luonnostaan

epäluonnolliselta vaikuttava, kuten mahdollisesti esimerkiksi auringonlaskua esittävän kuvan kohdalla. Tällöin on teoriassa mahdollista syntyä merkittäväkin ero edellä esitetyn FUN- kolmijaon mukaisten värien toiston tarkkuuden ja värien luonnollisuuden välillä. Subjektiivi

sissa testeissä tämä ero voi aiheuttaa myös epäselvyyksiä mielipiteiden muodostamisessa,

(23)

minkä vuoksi voi olla syytä tutkimuksen tavoitteet huomioiden täsmentää tai harkita tarkem

min arvioinnin perustana käytettävää suuretta.

2.3.4 Väritasapaino

Kuvan kohde voi näyttää erilaiselta erilaisissa valaistusolosuhteissa. Esimerkiksi valkoinen kohde voi näyttää matalan värilämpötilan valaistuksessa punertavalta ja korkean värilämpöti

lan valaistuksessa sinertävältä. Ihmissilmä ei tätä eroa kuitenkaan välttämättä huomaa, koska

ihminen suhteuttaa näkemänsä kohdetta ympäröivään valaistukseen. Valokuvaan tämä ero kui

tenkin lähtökohtaisesti tallentuu, minkä vuoksi useimmissa kameroissa on erillinen väritasa- painon korjausmekanismi tämän värivirheen ehkäisemiseksi. (Liu et ai. 1995)

Mikäli kuvan väritasapainoa korjataan tulkitsemalla kuvaa väärin, syntyy yleensä värivirhe (Cooper et ai. 2000). Tämä puolestaan voi vaikuttaa edellä käsiteltyyn värien luonnollisuuteen negatiivisella tavalla. Luonteeltaan väritasapaino on kuitenkin hyvin subjektiivinen preferenssisuure, mikä kuvasisältöriippuvaisuuden ohella vaikeuttaa huomattavasti yhteyden löytämistä luonnollisuuden kaltaisiin korkeamman tason käsitteisiin.

2.3.5 Värikkyys

Myös värikkyys on luonteeltaan selvä preferenssisuure: paras kuva ei ole äärimmäisen värikäs,

mutta ei myöskään tyystin väritön. Tästä johtuen sitä onkin käytetty korkeintaan epäsuorana laatutekijänä kuten värikkyyden erona (Palus 2005). Mikäli värikkyydestä halutaan johtaa ko

konaisvaltaisempia kuvan oivallisuutta mallintavia suureita, on päätettävä ideaali värikkyyden taso sekä millä tapaa laatu heikkenee kun värikkyys poikkeaa tästä ideaalista. Automaattisia menetelmiä ajatellen suureen ideaalikohdan määrittämisen tekee ongelmalliseksi se, että eri kuvakohteiden kuuluukin olla värikkyydeltään eritasoisia: esimerkiksi vihreät niityt tai kukka- asetelmat ovat luonnostaan värikkäämpiä kuin harmaa katumaisema. Ihanteellisin värikkyyden taso riippuu myös siitä, tavoite Haanko kuvalta kokonaisvaltaisesti parasta laatua vai suurinta luonnollisuuden tasoa, sillä kuten kappaleessa 2.4 todetaan, näiden välillä on havaittu syste

maattinen ero.

2.3.6 Terävyys

Terävyyttä voidaan pitää hyvin keskeisenä ja useissa yhteyksissä jopa keskeisimpänä kokonaislaatuun vaikuttavana yksittäisenä tekijänä. Tätä näkemystä edustaa muun muassa Johnso

nin ja Fairchildin (2000) tutkimus. Terävyys ei myöskään ole kovin mieltymyksellinen tekijä siinä missä esimerkiksi värikkyys, sillä pääsääntöisesti kuvilta halutaan mahdollisimman kor

keaa terävyyttä, kunhan keinotekoinen terävöitys ei aiheuta kuvaan vääristyneisyyttä tai liial

lista rosoisuutta. Näistä syistä johtuen terävyyttä myös tutkitaan suhteellisen paljon. Objektii

visia menetelmiä ajatellen se sisältää useampia ongelmakohtia, mutta se ei ole täysin yksiselit

teistä kuitenkaan edes subjektiivisia arviointeja ajatellen.

(24)

Kuva 2. Kumpi on terävämpi? Entä kumpi laadultaan parempi?

Kuva 2 havainnollistaa terävyyden mittaamisen yhtä keskeistä ongelmakohtaa. Vasemman

puoleisissa kuvissa kuvan hana ja kukka ovat terävämpiä kuin oikeanpuoleisissa kuvissa, mut

ta vastaavasti tausta sumeampi. Näiden kuvien kohdalla on suhteellisen oletettavaa, että ih- misarvioitsija valitsisi vasemmanpuoleiset kuvat laadultaan paremmiksi. Mutta arvioidaanko vasemmanpuoleiset kuvat tämän seurauksena myös terävämmiksi? Tätä valintaa vastaan on se tosiasia, että erityisesti voikukkaa esittävissä kuvissa tausta on pinta-alaltaan suurempi. On kuitenkin tärkeää, että kuvan keskeinen sisältö on terävästi esitetty, ja ihmiselle on useimmiten hyvin intuitiivinen tehtävä valita, mikä kuvassa on keskeistä. Ongelmallisemmaksi tehtävä tu

lee, mikäli kuvan keskeinen kohde ei ole yksimielisesti päätettävissä, jolloin ihmisten arviois

sa voi esiintyä suurtakin hajontaa.

On perusteltua olettaa, että vasemmanpuoleiset kuvat valittaisiin subjektiivisissa testeissä pait

si oikeanpuoleisia laadukkaammiksi myös terävämmiksi. Koska terävien alueiden pinta-alat eivät tätä päätöstä tue, tämä johtaa nopeasti siihen päätelmään, että terävyydenkin arvioon vai

kuttaa se, mitkä asiat ovat kuvassa terävästi esitettyinä. Ainakin mikäli terävyyden arviolla pyritään ennustamaan kokonais laatua, terävyyden ja laadun välillä tulisikin vallita tämänkal

tainen vahva yhteys. Objektiivisia menetelmiä ajatellen tämä on kuitenkin melko vaikea on

gelma: miten voidaan määrittää kuvan keskeinen sisältö, jos ihmisetkään eivät ole välttämättä siitä yksimielisiä? Kohteen sijainti kuvassa ei ratkaise kysymystä, sillä kuvan keskeinen kohde

(25)

voi näistä esimerkkikuvista poiketen hyvin sijaita myös kuvan reuna-alueilla. Tarkemmin tätä ongelmaa pohditaan algoritmeja käsittelevässä luvun osassa 4.3.3.

2.3.7 Kontrasti

Kontrasti tarkoittaa kuvan osioiden erotettavuutta toisistaan. Kuvankäsittelyssä se määritellään yleensä kuvan tummimpien ja kirkkaimpien pisteiden välisenä suhteena, jota usein manipuloi

daan kuvan laadun parantamiseksi (Matkovic et ai., 2005). Toisaalta, kuten Peli (1990) toteaa, havaittu kontrasti voi vaihdella huomattavasti kuvan eri alueiden välillä ja sen voi lisäksi mää

ritellä usein eri tavoin.

Korkeakontrastisen kuvan alueet erottuvat toisistaan matalakontrastisen kuvan alueita selke

ämmin, mistä johtuen korkea kontrasti saa kuvan usein näyttämään myös terävämmältä, mikä puolestaan vaikuttaa osaltaan koettuun kuvanlaatuun. Toisaalta kuten Töpfer et ai. (2002) esi

merkkinä mainitsevat, kontrasti on luonteeltaan mieltymyksellinen attribuutti, joten pelkkä kontrastin maksimointi ei ole mielekästä. Terävyys onkin käsitteenä ehkä suoremmin yhdistet

tävissä ihmisen havaitsemaan kokonais laatuun, kun taas kontrasti on teknisempi ja samalla myös vahvemmin laiteriippuvainen suure. Tästä johtuen terävyys soveltunee paremmin soke

aan laiteriippumattomaan kuvanlaadun arviointiin, kun taas kontrasti laitteiden teknisten omi

naisuuksien ja niiden kuvanlaadulleen merkityksen vertailuun.

2.3.8 Kohina

Kohina on tyypillinen, esimerkiksi analogisista TV-lähetyksistä tuttu häiriötekijä (Dosselman

& Yang, 2007). Se tarkoittaa kuvassa esiintyvää satunnaista pikseliarvojen vaihtelua, jota voi syntyä esimerkiksi pimeässä pitkällä valotusajalla otettuihin kuviin. Koska kohina on lähes poikkeuksetta ei-toivottu ominaisuus, se kuuluu käsitteenä helpoimpiin ja yksiselitteisimmin kokonaisvaltaiseen laatuun vaikuttavien tekijöiden ryhmään eli artefaktuaalisiin attribuuttei

hin: mitä enemmän kuvassa on kohinaa, sitä alhaisempi on luultavasti niin luonnollisuuden, hyödyllisyyden kuin toiston tarkkuudenkin taso.

Kohinan tyyppejä on kuitenkin erilaisia. Esimerkiksi Li (2002) käsitteli erikseen summautu

van valkoisen gaussisen kohinan ja impulssikohinan objektiivista mittaamista. Näistä ensim

mäinen on tyypillinen, kuvan yksittäisiä pikseleiden arvoja joko laskeva tai nostava kohinan muoto, joka on jossain määrin läsnä käytännössä kaikissa luonnollisissa kuvissa. Impulssiko- hina on luonteeltaan satunnaisempaa eli vain joitakin kuvan kohtia koskevaa, mutta voi poike

ta huomattavasti gaussista kohinaa vahvemmin yksittäisen pikselin toivotusta arvosta. Yksi tyypillinen esimerkki tämänlaisesta kohinasta on ns. suola ja pippuri -tyyppinen kohina (Chan et ai. 2005). Kuva 3 puolestaan havainnollistaa, kuinka kohina voi olla myös taajuudeltaan huomattavan erilaista, mikä vaikuttaa huomattavasti sen havaittavuuteen.

(26)

32 cpd

Kuva 3. Puna-viher-kanavan kohinaa viidellä eri taajuudella (Johnson ja Fairchild, 2005). Lyhenne cpd tarkoittaa kohinan jaksoja visuaalisen näkökulman astetta kohden.

Erityyppisten kohinoiden olemassaolo hankaloittaa kohinan määrän arvioimista. Objektiivisia menetelmiä ajatellen on myös monenlaisia kuvaelementtejä, jotka voidaan luultavasti tulkita virheellisesti kohinaksi. Käsitteen periaatteellinen yksinkertaisuus ja suhteellisen suora suhde korkeampiin laadun käsitteisiin eivät siis kuitenkaan tarkoita sitä, että sen objektiivinen mit

taaminen olisi välttämättä muiden käsitteiden mittaamista helpompaa. Merkittävästi helpom

paa saattaa olla korkeintaan määrittää sen suhde kokonaisvaltaisiin laadun käsitteisiin.

2.3.9 Pakkausvääristymät

Myös pakkausvääristymät ovat luonteeltaan artefaktuaalisia. Niitä syntyy, kun kuva pakataan häviöllisesti tavumäärältään pienempään kokoon kuvan säilyttämistä tai siirtoa varten. Kuvan

laatua arvioidessa voi olla tarkkaan tiedossa, minkälaiseen menetelmään kuvan pakkaus perus

tuu, jolloin myös vääristymien tyyppi ja syntytapa on tiedossa. Tämä tekee pakkausvääristy- mistä luonteeltaan attribuuteista teknisimmän ja helpoimmin mitattavan, mistä johtuen ne ovat tämän kuvanlaadulleen suureiden listan viimeisenä.

Vääristymien näkyvyys ja häiritsevyys riippuvat kuvan sisällöstä, mistä johtuen subjektiivisia testejä suoritetaan myös pakkausvääristymien kohdalla kuten muun muassa Sheikhin ja Hovi

kin tutkimuksessa (2006), jossa he käyttivät omaa subjektiivisten kuvanlaatuarvioiden tieto

kantaansa (Sheikh et ai. n.d.). Pakkausvääristymienkään laadullista vaikutusta ennustamaan pyrkivät objektiiviset mittaukset eivät siis ole käytännössä aivan niin yksinkertaisia kuin mitä

voisi olettaa ottaen huomioon vääristymien keinotekoisen matemaattisen syntytavan. Erityyp-

(27)

pisten kuva-alueiden häiriöherkkyyteen vaikuttaa myös se, mihin pakkausmenetelmän toimin

ta perustuu.

Kuva 4. Alkuperäinen kuva sekä sen visuaalisesti häviöllisesti pakatut versiot JPEG- ja JPEG2000-muodoissa

Kuva 4 havainnollistaa pakkausvääristymien näkyvyyttä yleisesti käytetyn kuvanpakkausfor- maatin JPEG:n sekä sen seuraajan JPEG2000:n osalta. Ilmaisella IrfanView-ohjelmalla tätä esimerkkiä varten rankasti pakatut kuvat ovat tiedostokooltaan jokseenkin samankokoisia, mutta JPEG2000-pakkauksessa kuvan pakkausartefaktit ovat pääosin huomaamattomampia.

Vaikka JPEG2000 siis tarjoaakin alhaisemman vääristyneisyyden samalla bittimäärällä, se on kuitenkin laskennallisesti raskaampi (Marcellin et ai., 2000, s. 16). Vääristymien häiritsevyyttä tutkivia subjektiivisia ja objektiivisia mittauksia ajatellen mielenkiintoisempia seikkoja ovat kuitenkin vääristymien erilainen luonne sekä se, että JPEG-kuvan laatikoituminen on erityisen huomattavaa kuvan tasaisilla alueilla. Useimmiten valokuvat pakataan kuitenkin visuaalisesti jokseenkin häviöttömästi, missä tapauksessa pakkausvääristymien mittaamiselle ei still-kuvien

kohdalla ole tarvetta.

2.4 Ominaisuuksien väliset suhteet

2.4.1 Merkitys kuvanlaadun tutkimuksessa

Kaikki kuvanlaadulliset tekijät ovat toistensa kanssa jonkinlaisessa vuorovaikutuksessa. Tois

ten välinen vuorovaikutus on heikkoa tai lähes olematonta, kun taas toisten välillä vuorovaiku

tus voi olla hyvinkin vahvaa. Vuorovaikutuksen vahvuuden lisäksi kiinnostavia tekijöitä ovat merkittävän vuorovaikutuksen todennäköisyys sekä sen merkitys tutkimuksen tavoitteiden saavuttamisessa.

(28)

V jr

X, _.44'"

___ —---

Objektiiviset Matalan tason

--- --- Kokonaisvaltaiset

suureet attribuutit laadun käsitteet

Kuva 5. Kuvanlaadulleen mittojen keskinäiset suhteet ja niiden merkitys

Kuva 5 havainnollistaa yksinkertaistetusti eri käsitteiden välisten suhteiden merkitystä kuvan

laadun tutkimuksessa. Käsitelaatikoiden väliset paksut vihreät nuolet kuvastavat haluttua vuo

rovaikutusta. Esimerkiksi terävyyttä mittaavan objektiivisen suureen tulisi korreloida mahdol

lisimman hyvin vastaavan matalan tason attribuutin eli subjektiivisen terävyyden kanssa, jon

ka puolestaan toivotaan ennustavan mahdollisimman hyvin kokonaislaatua. Sininen suhteelli

sen yhtenäisellä katkoviivalla varustettu nuoli oikeanpuolimmaisen laatikon yläpuolella kuvas

taa neutraalia vuorovaikutusta. Esimerkiksi luonnollisuus ja hyödyllisyys ovat yhteydessä toi

siinsa, mutta koska molemmat ovat yleensä tutkimuksen pääasiallisia tavoitteita, eikä kum

paakaan kannata määritellä toisen kautta, niiden välisellä suhteella ei ole merkitystä lopputu

loksen kannalta.

Kuvan keltainen hieman katkonaisempi viiva viittaa suhteeseen, jolla on riski olla hieman hai

tallinen tutkimuksen tavoitteille. Mikäli kuvaa on muokattu vain yhden attribuutin suhteen, se voi kuitenkin vaikuttaa subjektiivisiin arvioihin myös muiden attribuuttien osalta. Jossain ta

pauksessa tämä voi olla järkeenkäypää, mikäli esimerkiksi värikkyyden muutos vaikuttaa ko

hinan näkyvyyteen. Sen sijaan mikäli esimerkiksi heikosti suunniteltu koejärjestely johtaa koehenkilön hakemaan kuvasta väkisin eroavaisuuksia mitattavan attribuutin suhteen, tämä attribuuttien välinen vuorovaikutus voi vääristää tuloksia.

Vasemmanpuoleisimman laatikon yläpuolella oleva punainen hyvin katkonainen viiva tarkoit

taa vuorovaikutussuhdetta, joka on yleensä luonteeltaan ei-toivottu. Ellei kahden matalan ta

son attribuutin välillä ole todettu subjektiivisissa testeissä merkittävää vuorovaikutusta, niitä vastaavien objektiivisten suureiden välillä huomattu vuorovaikutus viittaa siihen, että jokin yhteen suureeseen liittyvä tekijä tulkitaan virheellisesti toiseen suureeseen vaikuttavaksi asiak

si. Algoritmin suorituskyvyn maksimoimiseksi tällainen vuorovaikutus tulisi luonnollisesti pyrkiä minimoimaan. Objektiivisen suureen vuorovaikutus johonkin erityyppiseen matalan tason attribuuttiin (esimerkiksi objektiivisen terävyyden suhde objektiiviseen kohinaan) on tietenkin yhtä lailla ei-toivottua, mutta näitä ikään kuin ristiin meneviä suhteita ei ole yksin

kertaistuksen vuoksi piirretty mukaan havainnekuvaan.

2.4.2 Matalan tason ominaisuuksien keskinäisiä vuorovaikutuksia

Kuten edellä todettiin, luonteeltaan haitallisimpia ovat objektiivisten mittojen väliset ei- toivotut vuorovaikutukset. Tässä niitä ei kuitenkaan käsitellä, sillä ne ovat algoritmiriippuvai- sia ja kuuluvat siten tutkimuksen kokeellisiin ja algoritmeja käsitteleviin osuuksiin. Jotta näi-

the Combined performance of blind image quality metrics in quality-based classification of images

Valokuvaa sokeasti arvioivien algoritmien yh­

distetty suorituskyky laatuun pohjautuvassa kuvien luokittelussa

ALKUSANAT

Espoossa 1. heinäkuuta 2008

1 JOHDANTO 1.1 Taustaa

1.2 Ttutkimuksen tavoite ja rajaus

matalamman tason tekijöihin kuten terävyyteen, kontrastiin, kohinaan ja värikkyyteen, joskin

1.3 Työn rakenne

2 KUVANLAATU 2.1 Yleistä

2.2 Kokonaisvaltaisia kuvanlaadun käsitteitä

”Laatua” voidaan jossain määrin pitää kaikkien kuvan hyvyyttä kuvaavien käsitteiden yläkä­

sitteenä, sillä sitä käytetään yleisesti myös muissa kuin kuvaan liittyvissä konteksteissa yleisen

Osasyy laadun monikäsitteisyyteen on se, että laadun käsitettä käytetään sellaisenaan usein

se

ja

vat selkeämmin erotettavissa muunlaisista kuvan hyvyyttä mittaavista menetelmistä.

ja videovalvonnassa tunnistaa jonkun henkilön. Näin ollen kuvainformaatio toimii monessa

tilanteessa varteenotettavana vaihtoehtona hyödyllisyyden käsitteelle.

ihan oikeasti vastaa todellisuutta. Aivan kuten maksimaalisen luonnollisuuden ja maksimaali­

Paitsi tiettyjen häiriötekijöiden mittoina, vääristyneisyys ja tarkemmin määriteltynä häiritse­

2.3 Matalan tason käsitteitä

Verrattuna edellisessä alaluvussa lueteltuihin käsitteisiin, tähän ryhmään luokiteltavat suureet

Töpferin ynnä muiden tulokset väritasapainolle on käytännön esimerkin vuoksi esitetty

Kohdassa 2.2.6 esitettiin ulkoiseen referenssiin suhteutetun toiston tarkkuuden käsite, jota voi pitää käytännössä puhtaasti positiivisena mittana kuvan tasokkuudesta. Oli vertailukohtana sitten konkreettinen kuva tai ulkoinen referenssi, toiston tarkkuutta voi tarkkailla joko pelkäs­

attribuutin

(1987)

Puutteistaan ja referenssikuvan olemassaolon vaatimuksestaan huolimatta erilaiset konkreetti­

sissa. Ongelmalliseksi luonnollisuuden käsitteen voi nähdä sellaisissa tapauksissa, joissa ul­

koinen referenssi (eli esimerkiksi alkuperäinen maisema, josta kuva on otettu) on luonnostaan

Kuvan kohde voi näyttää erilaiselta erilaisissa valaistusolosuhteissa. Esimerkiksi valkoinen kohde voi näyttää matalan värilämpötilan valaistuksessa punertavalta ja korkean värilämpöti­

lan valaistuksessa sinertävältä. Ihmissilmä ei tätä eroa kuitenkaan välttämättä huomaa, koska

Myös värikkyys on luonteeltaan selvä preferenssisuure: paras kuva ei ole äärimmäisen värikäs,

On perusteltua olettaa, että vasemmanpuoleiset kuvat valittaisiin subjektiivisissa testeissä pait­

Myös pakkausvääristymät ovat luonteeltaan artefaktuaalisia. Niitä syntyy, kun kuva pakataan häviöllisesti tavumäärältään pienempään kokoon kuvan säilyttämistä tai siirtoa varten. Kuvan

voisi olettaa ottaen huomioon vääristymien keinotekoisen matemaattisen syntytavan. Erityyp-

2.4 Ominaisuuksien väliset suhteet

___ —---

Objektiiviset Matalan tason

--- --- Kokonaisvaltaiset

suureet attribuutit laadun käsitteet

Valokuvaa sokeasti arvioivien algoritmien yh

”Laatua” voidaan jossain määrin pitää kaikkien kuvan hyvyyttä kuvaavien käsitteiden yläkä

ihan oikeasti vastaa todellisuutta. Aivan kuten maksimaalisen luonnollisuuden ja maksimaali

Paitsi tiettyjen häiriötekijöiden mittoina, vääristyneisyys ja tarkemmin määriteltynä häiritse

Kohdassa 2.2.6 esitettiin ulkoiseen referenssiin suhteutetun toiston tarkkuuden käsite, jota voi pitää käytännössä puhtaasti positiivisena mittana kuvan tasokkuudesta. Oli vertailukohtana sitten konkreettinen kuva tai ulkoinen referenssi, toiston tarkkuutta voi tarkkailla joko pelkäs

Puutteistaan ja referenssikuvan olemassaolon vaatimuksestaan huolimatta erilaiset konkreetti

sissa. Ongelmalliseksi luonnollisuuden käsitteen voi nähdä sellaisissa tapauksissa, joissa ul

Kuvan kohde voi näyttää erilaiselta erilaisissa valaistusolosuhteissa. Esimerkiksi valkoinen kohde voi näyttää matalan värilämpötilan valaistuksessa punertavalta ja korkean värilämpöti

On perusteltua olettaa, että vasemmanpuoleiset kuvat valittaisiin subjektiivisissa testeissä pait