Viestintätekniikka Diplomityö
Johannes Hidén
Valokuvaa sokeasti arvioivien algoritmien yh
distetty suorituskyky laatuun pohjautuvassa kuvien luokittelussa
Diplomityö, joka on jätetty opinnäytteenä tarkastettavaksi diplomi-insinöörin tutkintoa varten Espoossa 31.7.2008.
Valvoja professori Pirkko Oittinen
Tekijät, työn nimi
Johannes Hidén
Valokuvaa sokeasti arvioivien algoritmien yhdistetty suorituskyky laatuun pohjautuvassa kuvien luokittelussa
Päivämäärä: 31.7.2008 Sivumäärä: 123 S.
Tiedekunta
Elektroniikan, tietoliikenteen ja automaation tiedekunta
Professuuri
AS-75 Viestintätekniikka
Työn ohjaaja
Pirkko Oittinen
Digitaalisten valokuvien valtavaksi noussut määrä kasvattaa tarvetta niiden erilaiseen luokitteluun niin yksityisten kuvien hallinnassa kuin ammattikäyttöön tarkoitetuissa kuvahakusovelluksissakin. Tämän työn tavoitteena oli tutkia kuvanlaadun automaattista määrittämistä tällaisen luokittelun yhtenä apukei
nona.
Kokonaislaadun teknisen, esteettisen ja merkityksellisen ulottuvuuden määrittämiseen esitettiin teoreet
tinen malli, jossa pyrittiin ottamaan kaikki koettuun kuvanlaatuun vaikuttavat tekijät huomioon aina hen
kilökohtaisista mieltymyksistä lähtien. Mallin perusideana on, että kuvaan kiinteästi liittyvät ominaisuu
det tulisi laskea valmiiksi osaksi tietokantaa, minkä jälkeen attribuuttien mitatut arvot voisi nopeammin sitoa kontekstiin ja käyttäjäkohtaisiin preferensseihin laadun määrittämiseksi.
Kokeellisessa osuudessa perehdyttiin erityisesti terävyyden ja kohinan sekä näiden laadullisen yhteis
vaikutuksen laskentaan. Sekä testattua kohina-algoritmia että terävyyden mittana käytettyä sumeusal- goritmia kehitettiin eteenpäin. Kohina-algoritmin kohdalla Pearsonin korrelaatiokertoimella mitattua kor
relaatiota ensimmäisen testikierroksen testeissä havaittuun kohinaan saatiin kasvatettua koko kuvajou- kon osalta keskimääräisestä 34 prosentista 79 prosenttiin sekä jätettäessä terävöitetyt kuvat huomioi
matta 79 prosentista noin 89 prosenttiin. Sumeusalgoritmin osalta kehitetyn version korrelaatio nousi alkuperäisen algoritmin 80 prosentista parametreistä riippuen 85-87 prosenttiin ensimmäisen testikier
roksen kuvilla, kun taas korrelaatio validointitesteissä määritettyyn subjektiiviseen kokonaislaatuun nousi alkuperäisen menetelmän vajaasta 79 prosentista parametreistä riippuen 82-83 prosenttiin.
Kokonaislaadun määrittämiseksi yksittäisiä attribuutteja mittaavien algoritmien pohjalta ehdotettiin kahta erilaista menetelmää: attribuuttien suhteellista painottamista sekä moniulotteista mallinnusta. Paino- tusmenetelmällä subjektiiviseen kokonaislaatuun suhteutettu korrelaatio nousi validointitesteissä 84 prosenttiin, mikä on hieman korkeampi kuin kummallakaan yksittäistä attribuuttia mittaavista algorit
meista. Tämän lisäksi menetelmän toissijaiseksi suorituskyvyn mittariksi esitetylle vakaudelle saatiin kokonaismenetelmän kohdalla hieman menetelmän tärkeimmällä osalla eli terävyysalgoritmilla saatua korkeampi arvo. Vaikka moniulotteisella mallinnuksella vastaavaksi korrelaatioksi saatiin vain noin 76%, suositellaan tätä menetelmää kuitenkin jatkossa käytettäväksi. Syynä tähän on painotusmenetelmän parametrien optimoimisen hankaluus varsinkin useampia attribuutteja mitatessa sekä kykenemättö
myys mallintaa kaikkia yksittäisten attribuuttien keskinäisiä vuorovaikutussuhteita. Moniulotteinen mal
linnus tarjoaa periaatteen tasolla automaattisen ratkaisun molempiin, kunhan menetelmän pohjaksi on saatu määritettyä riittävän suuri subjektiiviseen ja objektiiviseen dataan pohjautuva laatuavaruus.
Avainsanat: kuvanlaatu, referenssitön määritys, algoritmi, moniulotteinen mallinnus, kuvien luokittelu, kuvien hallinta, terävyys, kohina
Author
Johannes Hidén
The combined performance of blind image quality metrics in quality-based classification of images
Date: 31.7.2008 Pages: 123 p.
Faculty Professorship
Faculty of Electronics, Communications AS-75 Media Technology and Automation
Supervisor
Pirkko Oittinen
As the amount of digital photographs has become vast, the need for categorizing and classifying them has increased in both professional and private applications. This research concentrated on the concept of measuring image quality automatically as a means for such classification.
A theoretical model was proposed for measuring the technical, aesthetic and meaningful aspects of im
age quality. The model tries to consider all the possible factors influencing overall image quality, includ
ing personal preferences. One of the basic premises of the model was the idea of measuring the attrib
utes that are an integral part of the image beforehand and recording them to the image database, after which the measured values can be more quickly interpreted as a context and user preference depend
ent measure of image quality.
In the experimental part the measurement of sharpness and noise as well as their combined influence on quality was the primary subject of interest. Both the tested algorithm for measuring noise and the al
gorithm for measuring blur as a metric of sharpness were further developed. For the newly proposed noise algorithm the mean correlation to the noise evaluations from all the images in the first subjective experiments as defined by Pearson’s correlation coefficient rose to 79% as compared to 34% of the original algorithm, whereas by excluding the sharpened images the correlation rose from 79% to about 89%. For the proposed blur algorithm the measured mean correlation was 85-87% depending on the parameters as compared to 80% per cent of the original algorithm for the images in the first subjective experiments, whereas the correlation to the image quality defined in the validation tests rose from less than 79 per cent of the original to 82-83% depending on the used parameters.
For defining overall quality based on the algorithms measuring individual attributes two different meth
ods were proposed: the relative weighting of the attributes and multidimensional modeling. With the weighting method the correlation to subjective image quality defined in the validation tests rose to 84 per cent, which is slightly higher than either of the correlations provided by the individual components.
In addition, stability, which was defined as a secondary measure of overall performance, was also measured slightly higher for the overall quality method than for its most important component, the blur measure. Although multidimensional modeling resulted in a correlation of only 76%, it is recommended for future purposes. One reason for this is that optimizing the parameters for the weighting method is troublesome especially in case of numerous attributes. With the weighting method it is also impossible to model all the interactions between individual attributes. In principle, multidimensional modeling offers an automatic solution for both problems. The only requirement is a quality space defined by an ade
quate amount of subjective and objective data.
Keywords: image quality, blind measurement, algorithm, multidimensional modeling, image classifica- tion, image management, sharpness, noise
ALKUSANAT
Tämä diplomityö on tehty Teknillisen korkeakoulun Viestintätekniikan laboratoriossa kevään 2008 aikana. Haluan lämpimästi kiittää professori Pirkko Oittista mielenkiintoisen aiheen tar
joamisesta sekä tuesta työn edetessä ilmenneissä ongelmatilanteissa. Stina Westmania kiitän arvokkaista vinkeistä erityisesti subjektiivisten testien suunnittelussa, Johannes Pullaa hyödyl
lisestä testiohjelmasta sekä muuta laboratorion henkilökuntaa mukavan työilmapiirin luomi
sesta.
Haluan myös kiittää avopuolisoani Tanjaa mittaamattoman arvokkaasta henkisestä tuesta koko työn aikana. Lisäksi kiitän kaikkia subjektiivisiin testeihin osallistuneita henkilöitä, joita ilman koko tutkimusta ei olisi voitu tehdä.
Espoossa 1. heinäkuuta 2008
Johannes Hidén
1 JOHDANTO...1
1.1 Taustaa...1
1.2 Tutkimuksen tavoite ja rajaus... 2
1.3 Työn rakenne... 3
2 KUVANLAATU... 4
2.1 Yleistä... 4
2.1.1 Kuvanlaadun määritelmästä lyhyesti... 4
2.1.2 Subjektiivinen ja objektiivinen kuvanlaatu... 4
2.1.3 Kuvanlaadun ja sen mittaamisen merkitys... 5
2.2 Kokonaisvaltaisia kuvanlaadun käsitteitä... 5
2.2.1 Yleistä... 5
2.2.2 Vetoavuus...6
2.2.3 Laatu... 6
2.2.4 Hyödyllisyys...7
2.2.5 Kuvainformaatio...8
2.2.6 Toiston tarkkuus suhteessa todellisuuteen ja luonnollisuus...8
2.2.7 Vääristyne isyys ja häiritsevyys... 9
2.3 Matalamman tason käsitteitä...9
2.3.1 Yleistä... 9
2.3.2 Toiston tarkkuus suhteessa referenssikuvaan... 10
2.3.3 Värien luonnollisuus... 11
2.3.4 Väritasapaino... 12
2.3.5 Värikkyys... 12
2.3.6 Terävyys... 12
2.3.7 Kontrasti... 14
2.3.8 Kohina... 14
2.3.9 Pakkausvääristymät... 15
2.4 Ominaisuuksien väliset suhteet... 16
2.4.1 Merkitys kuvanlaadun tutkimuksessa... 16
2.4.2 Matalan tason ominaisuuksien keskinäisiä vuorovaikutuksia... 17
2.4.3 Matalan tason ominaisuuksien suhde kokonaisvaltaisiin laadun käsitteisiin. 18 2.4.4 Kokonaisvaltaisten käsitteiden keskinäisistä suhteista... 19
2.5 Yhteenvetoja pohdintaa kuvanlaatuun liittyvistä käsitteistä... 19
3 KUVANLAADUN SUBJEKTIIVINEN MITTAAMINEN... 21
3.1 Kuvanlaadun määrittämisestä...21
3.1.1 Miksi mitataan?...21
3.1.2 Mittausprosessi...22
3.2 Ihminen kuvan arvioijana...22
3.2.1 Psykologiset ja yksilölliset tekijät... 22
3.2.2 Perussuosituksia testejä ajatellen... 23
3.3 Kuvat arvioinnin kohteena...24
3.4 Arvioinnissa käytettävät mitat ja menetelmät... 24
3.4.1 Yleistä...24
3.4.2 Juuri havaittavissa oleva ero eli JND... 25
3.4.3 Mittausmenetelmiä...26
3.5 Menetelmien ja koejärjestelyjen valinta...27
3.5.1 Tavoitellun totuuden anatomia... 27
3.5.2 Koejärjestelyjen määrittäminen... 28
4 KUVANLAADUN KONEELLINEN MITTAAMINEN...30
4.1 Algoritmeista yleisesti...30
4.1.1 Johdanto... 30
4.1.2 Algoritmien luokittelu...30
4.1.3 Minkälainen on hyvä algoritmi?... 32
4.1.4 Algoritmien ongelmista... 35
4.2 Ihmisen näköjärjestelmän ominaisuuksien merkitys... 36
4.2.1 Kontrastiherkkyys...36
4.2.2 Värinäkö...37
4.2.3 Kuvasisällön vaikutus...37
4.3 Attribuuttien objektiivinen mittaaminen... 38
4.3.1 Yleistä...38
4.3.2 Kohina...38
4.3.3 Terävyys tai sumentuneisuus... 39
4.3.4 Kontrasti...41
4.3.5 Värikkyys...42
4.3.6 Värien luonnollisuus...43
4.3.7 Pakkausvääristymät...44
4.3.8 Yhteenveto objektiivisesti mitattavista attribuuteista...45
4.4 Koetun kokonaislaadun ennustaminen... 47
4.4.1 Attribuutin vaikutus koettuun laatuun... 47
4.4.2 Yksittäisten attribuuttien yhdistäminen kokonaisvaltaisen laadun määreeksi 47 4.4.3 Kuvasisällön vaikutus attribuutin laatuun ja painotukseen...52
4.4.4 Henkilökohtaisten mieltymysten merkitys... 54
4.4.5 Malli kokonaislaadun määrittämiseksi... 54
4.5 Algoritmien kehitystyö...59
4.5.1 Kehitystyön osa-alueita...59
4.5.2 Erilaisia lähestymistapoja...60
4.5.3 Tilastolliset menetelmät...61
4.5.4 Näkökulmia menneeseen ja tulevaan... 63
5 KUVIEN LUOKITTELU JA MUITA KUVANLAADUN AUTOMAATTISEN MITTAAMISEN SOVELLUKSIA... 64
5.1 Sovelluksista yleisesti...64
5.2 Kuvanlaadun optimointi...64
5.2.1 Laitteiden kehitystyö...64
5.2.2 Laadun parannus jälkiprosessoinnilla... 65
5.2.3 Laadun ylläpito...66
5.3 Luokittelusovelluksia...67
5.3.1 Journalistinen kuvahaku... 67
5.3.2 Yksityisten kuvien hallinta... 67
5.3.3 Kuvien jakaminen...68
5.3.4 Kuvat tiedonvälittäjinä...68
5.4 Lyhyt katsaus tulevaan...69
6.1 Tutkimusongelma... 70
6.2 Vaihe 1: Määrittelevä testikierros... 70
6.2.1 Kuvien valinta...70
6.2.2 Kuvien esikäsittely...72
6.2.3 Testihenkilöt...74
6.2.4 Subjektiivinen arviointimenetelmä... 74
6.2.5 Subjektiivisen testin arviointiympäristö ja testin kulku...75
6.2.6 Objektiiviset mittaukset...76
6.3 Vaihe 2: Kokonaislaatua ennustavan menetelmän kehittäminen...76
6.4 Vaihe 3: Kehitetyn menetelmän validointi uudella testikierroksella...77
6.4.1 Käytettävät kuvat...77
6.4.2 Testijärjestelyt...78
6.4.3 Tulosten käsittely...79
7 VAIHE 1 : MÄÄRITTELEVÄN TESTIKIERROKSEN TULOSTEN TARKASTELU. 80 7.1 Yleisiä huomioita tulosten esittämisestä... 80
7.2 Subjektiiviset testit...80
7.2.1 Subjektiiviset laadun arviot...80
7.2.2 Subjektiiviset attribuuttien arviot... 82
7.2.3 Attribuuttien arviot suhteessa laadun arvioihin... 84
7.2.4 Kyselylomakkeen vastaukset... 85
7.3 Objektiiviset testit... 86
7.3.1 Marzilianon et ai. (2002) sumentuneisuus-Zterävyysalgoritmi...86
7.3.2 Immerkaerin (1996) kohina-algoritmi... 87
7.3.3 Muut algoritmit...88
7.4 Subjektiivisten ja objektiivisten tulosten keskinäiset yhteydet...89
7.4.1 Terävyys ja laatu...89
7.4.2 Kohina ja laatu...91
7.5 Johtopäätökset ja luotettavuusanalyysi... 93
8 VAIHE 2: KUVANLAADUN LASKENTAMENETELMÄN KEHITTÄMINEN... 95
8.1 Kehitetyt attribuuttikomponentit... 95
8.1.1 Terävyyskomponentti... 95
8.1.2 Kohinakomponentti...98
8.2 Komponenttien yhdistäminen laadun arvioksi...101
8.2.1 Yleistä attribuuttien yhdistämisestä...101
8.2.2 Attribuuttilaatujen painotusmenetelmä... 101
8.2.3 Moniulotteinen mallinnus... 102
8.3 Parametrien määritys algoritmeille ja kuvaryhmille... 103
8.3.1 Parametrien valinnasta... 103
8.3.2 Kuvien ryhmittelyn tarkoitus... 104
8.3.3 Valintojen tekeminen tutkimuksen kuvaryhmille... 105
8.3.4 Kokonaismallin linearisointi... 106
8.3.5 Komponenttien yhdistystavan vaatimukset parametrien valinnassa... 107
9 VAIHE 3: VALIDOINTITESTIN TULOSTEN TARKASTELU... 108
9.1 Subjektiivisen testin tulokset... 108
9.1.1 Kuvien laadun arviot... 108
9.1.2 Kyselylomakkeen vastaukset...108
9.2 Attribuutteja mittaavien algoritmien suorituskyky... 109
9.2.1 Terävyysmenetelmä... 109
9.2.2 Kohinamenetelmä... 110
9.3 Kokonaismenetelmän suorituskyky... 111
9.3.1 Attribuuttien painotusmenetelmä...111
9.3.2 Moniulotteinen mallinnus... 113
9.3.3 Luotettavuusanalyysi ja havaintoja tuloksista...116
9.4 Menetelmän käyttökelpoisuus... 116
9.4.1 Menetelmän kyky ennustaa laatua...116
9.4.2 Menetelmän tuottamien arvioiden käytännön tulkinta... 118
9.4.3 Menetelmän optimoitavuus kuvaryhmälle sopivaksi... 118
9.4.4 Laskennallinen näkökulma...119
9.4.5 Ongelmakohtia ja puutteita... 119
10 YHTEENVETO... 121
10.1 Tutkimuksen kulkuja keskeisimmät havainnot...121
10.2 Jatkotutkimusehdotuksia... 123 LÄHDELUETTELO
LIITE 1 - LAADUN ENNUSTAMISEN KOKONAISMALLI LIITE 2 - MÄÄRITTELEVÄN TESTIN OHJEET
LIITE 3 - MÄÄRITTELEVÄN TESTIN KYSYMYKSET LIITE 4 - VALIDOINTITEST1N OHJEET
LIITE 5 - VALIDOINTITESTIN KYSYMYKSET
LIITE 6 - MÄÄRITTELEVÄN TESTIN LAADUN ARVIOT LIITE 7 - MÄÄRITTELEVÄN TESTIN ATTRIBUUTTIARVIOT
LIITE 8 - MÄÄRITTELEVÄN TESTIKIERROKSEN KYSELYN VASTAUKSET LIITE 9 - MÄÄRITTELEVÄN TESTIKIERROKSEN OBJEKTIIVISET TULOKSET LIITE 10 - KEHITETYN SUMEUSMENETELMÄN KOODI
LIITE 11 - KEHITETYN KOHINAMENETELMÄN KOODI
LIITE 12 - KOODI LAADUN MÄÄRITYKSEEN ATTRIBUUTTEJA PAINOTTAMALLA LIITE 13 - KOODI LAADUN MÄÄRITYKSEEN MONIULOTTEISELLA
MALLINNUKSELLA
LIITE 14 - VALIDOINTITESTIN KUVIEN SUBJEKTIIVISET LAADUNARVIOT LIITE 15 - VALIDOINTITESTIN KYSELYN VASTAUKSET
LIITE 16 - VALIDOINTITESTIN KUVISTA ALGORITMEILLA LASKETUT ATTRIBUUTTIEN ARVOT
LIITE 17 - VALIDOINTITESTIN KUVISTA ALGORITMEILLA LASKETUT LAADUN ARVOT
Algoritmi Ohjelmalle annettu ohjeiden sarja, jolla määritetään esi
merkiksi jonkin attribuutin arvo
Artefaktuaalinen attribuutti Attribuutti, joka kuvassa havaittuna johtaa lähes poikke
uksetta kuvanlaadun heikentymiseen (ISO 20462-1, 2005)
Attribuutti Kuvan jokin ominaisuus (esim. kohina, terävyys, värik
kyys)
Attribuutti-JND Yksikkö, joka vastaa jonkin attribuutin juuri ja juuri ha
vaittavissa olevaa muutosta (kts. JND)
Attribuutti laatu Tässä työssä käytetty käsite, joka kuvaa jonkin attribuu
tin havaittua laatua.
CIEL AB -avaruus Vastaväreihin pohjautuva väriavaruus, jossa L on vaale
us, a* viher-puna-akseli ja b* sini-kelta-akseli
FUN-kolmijako Kuvan laadun jakaminen toiston tarkkuuteen, hyödylli
syyteen ja luonnollisuuteen
Globaali Koko kuvaa koskeva
Heteroskedastisuus Tilanne, jossa virhetermien eli residuaalien hajonta vaih- telee ennustavien muuttujien arvoista riippuen
Histogrammi Kuvan pikseleiden arvojakauma
ISO Kansainvälinen standardisointiorganisaatio (International Organization for Standardization)
ISO-herkkyys ISO:n standardoima kameroissa käytetty valoherkkyyden mitta
JND Just Noticeable Difference eli juuri ja juuri havaittavissa oleva ero
Kolmoisvertailumenetelmä ISO 20462-2 -standardissa määritetty subjektiivisen ar
vioinnin menetelmä, jossa kolmea kuvaa vertaillaan sa
manaikaisesti
Korrelaatio Mittaa kahden muuttujan kuten esimerkiksi attribuutin subjektiivisten arvioiden ja algoritmilla mitattujen arvo
jen suhteen vahvuutta. Sen mittaamiseen käytetään yleensä Pearsonin korrelaatiokerrointa. Myös tässä työs
sä korrelaatiolla tarkoitetaan Pearsonin korrelaatioker
rointa, ellei muuta erikseen mainita.
Laaduttaminen Tässä työssä käytettävä käsite, jolla viitataan jonkin att
ribuutin muuttaamiseen kyseistä attribuuttia kuvaavaksi laadun mitaksi eli attribuuttilaaduksi.
Laatuavaruus Tämän työn yhteydessä käytetty termi moniulotteisesta avaruudesta, jonka ulottuvuuksina toimivat kuvaan liit
tyvät attribuutit
Laatu-JND Yksikkö, joka vastaa juuri ja juuri havaittavissa olevaa muutosta kuvanlaadussa (kts. JND)
Luonnollinen kuva Näkyvän valon perusteella ympäristöstä muodostettu va
lokuva
Luminanssikanava Kuvan valoisuusjakauma, joka yksinään muistuttaa mus
tavalkokuvaa, mutta yhdistettyinä värikanaviin muodos
taa tavallisen värikuvan
Matlab Laskentaohjelma, josta tämän työn yhteydessä käytettiin pääasiassa 6.5.2004 julkaistua versiota 7.0.0.19920 (R14).
Monotoninen Jos kahden muuttujan välinen suhde eli funktio on mo
notoninen, yhden muuttujan kasvaminen vaikuttaa toi
seen muuttujaan aina samansuuntaisesti. Toisin sanoen jos muuttujan 1 kasvu laskee muuttujan 2 arvoa jonkin arvon kohdalla, se tekee samoin myös muiden arvojen kohdalla
Mieltymyksellinen attribuutti Attribuutti, jonka ihanteellinen voimakkuus riippuu tark
kailijasta ja kuvasisällöstä (ISO 20462-1, 2005)
Outlieri Tilastollisesti merkittävä poikkeama otannassa, jolle voidaan esittää useita erilaisia määritelmiä.
Parivertailu Arviointimenetelmä, jossa kahta näytettä kerrallaan ver-
kin yksittäisen attribuutin perusteella
Regressiosuora Muuttujien arvojen perusteella pienimmän neliösumman menetelmällä määritetty muuttujien välistä yhteyttä ku
vaava suora
Residuaali Havaitun ja ennustetun välinen erotus tai erotuksen neliö (Metsämuuronen 2006, s. 597). On huomioitava, että en
nustettu ei tämän työn yhteydessä tarkoita algoritmin tuottamaa ennustusta, vaan algoritmin ja subjektiivisten testien tuottamien arvioiden välistä yhteyttä kuvaavan regressiosuoran tai -käyrän ennustamaa arvoa.
Saturaatio Värikylläisyys
Selektiivisyys Algoritmin kyky kiinnittää huomiota vain mitattavana olevaan attribuuttiin jättäen muut attribuutit huomiotta.
Sokea laadun arviointi Ilman referenssikuvaa tapahtuva laadun määritys
Sisäinen referenssi Sisäinen muistikuva siitä, miltä jonkin kohteen tulisi näyttää
Ulkoinen referenssi Kuvan alkuperäinen fyysinen kohde, jota kuvan on tar
koitus jäljitellä
Väritasapaino Kuvan värikomponenttien tasapaino suhteessa toisiinsa Värikanava Kuvan yhden värin tai kahden vastavärin suhdetta ku
vaavien arvojen jakauma
1 JOHDANTO 1.1 Taustaa
Valokuvista on tullut digitaalisen valokuvauksen kehittymisen myötä entistä merkittävämpi osa ihmisten arkea. Tämä koskee erityisesti yksityiselämää, jossa tavallisten harraste lijakuvaa- jien ja varsinkin harrastelijakuvien määrä tuntuu kasvaneen räjähdysmäisesti viime vuosien aikana. Kuvien valtava määrä sekä tietotekniikan mahdollistamat uudet tehokkaat jakelukana
vat lisäävät tarvetta kuvien luokittelulle ja arvottamiselle, mikä toimii myös motivaationa tälle työlle.
Ehkä helpoin tapa luokitella kuvia on niiden semanttinen sisältö. Yksinkertaisimmillaan tämä tapahtuu jakamalla kuvat toisensa lähtökohtaisesti poissulkeviin kategorioihin. Tehokkaam
maksi ja joustavammaksi luokittelu saadaan kuitenkin käyttämällä kuviin metadatana liitettä
viä avainsanoja, joiden avulla kuva voi samanaikaisesti kuulua lukuisiin erilaisiin kuvaryhmiin (Hyvönen et ai. 2003). Tällaista avainsanoihin perustuvaa järjestelmää käytetään muun muassa kaupallisissa kuvapankeissa kuten Shutterstockissa (www.shutterstock.com). Myös tämän alan maailma on kuitenkin muuttunut huomattavasti digitaalisen valokuvauksen vallankumouksen myötä. Yksi syy on se, että monien yritysten liiketoiminta pohjautuu enenevissä määrin har- rastelijavalokuvaajien ottamiin valokuviin (Howe 2006). Tässä murroksessa on näin ollen syy
tä tutkia edelleen mahdollisia uusia keinoja luokittelun tehostamiseksi.
Vaikka kuvien avainsanoihin pohjautuvat haut voivat olla suhteellisen tehokkaita vastaamaan hakijan tarpeisiin, ne kuitenkin vaativat käytännössä aina manuaalisen määrittämisen. Aina tähän ei haluta tai ole edes mahdollista käyttää aikaa tai resursseja, joten on perusteltua kehit
tää myös automaattisia kuvien luokittelumenetelmiä. Yksinkertaisimmasta päästä olevia kuvan tunnistustehtäviä on erottaa automaattisesti aidot valokuvat erilaisista keinotekoisista kuvista.
Siinä onkin saavutettu hyviä tuloksia, kuten Lienhartin ja Hartmannin (2002) tutkimuksessa, jonka taustamotivaatioksi tekijät mainitsevat juuri hakukoneiden tehostamisen tekstuaalisen haun ulkopuolelle. Hu ja Bagga (2004) puolestaan pyrkivät tutkimuksessaan ennustamaan uu- tissivuston kuvien käyttötarkoitusta eli sitä, onko kyseessä esimerkiksi mainos-, logo-, esikat
selu- tai varsinainen uutiskuva. Tämä voisi heidän mukaansa olla hyödyksi muun muassa tie
don kaivamisessa sivuilta tai tiedon optimoinnissa matkapuhelimia varten. Sen sijaan luonnol
listen kuvien semanttisen sisällön automaattisesta määrittelystä ollaan vielä kaukana. Mikäli kuvaluokkien määrä on rajallinen, voidaan kuitenkin saavuttaa kohtalaisia tuloksia luokan en
nustamisessa. Esimerkiksi jo Vailayan et ai. (1999) tutkimuksessa saatiin 95,3%:n onnistu
misprosentilla erotettua kaupunkikuvat maastokuvista ja metsäkuvat vuoristokuvista lähes yh
tä hyvin.
Kuvien käyttötarkoituksen tai aihesisällön automaattisen päättelemisen lisäksi algoritmien avulla voidaan koettaa arvioida myös kuvan laadullisia ominaisuuksia kohinan kaltaisista ma
talan tason suureista korkeamman tason käsitteisiin. Koska valokuvat on ennen kaikkea tarkoi
tettu ihmisen havainnoitaviksi, tulee hyvin suunnitellun algoritmin pohjautua koehenkilöiden
mieltymyksiä mittaaviin subjektiivisiin arvioihin, jotka on perinteisesti kerätty tätä tarkoitusta varten suunnitelluin testein. Hyvin suunniteltu algoritmi voisi näin tehostaa esimerkiksi kuva- pankkien kaltaisten palveluiden hakutoimintoa tai auttaa rajaamaan laadultaan riittämättömät tai heikoimmat kuvat pois jossakin muussa käytännön sovelluksessa. Tämä kuvan analysoin
nin osa-alue on tämän diplomityön keskeisin tutkimuksen aihe.
1.2 Ttutkimuksen tavoite ja rajaus
Tutkimuksen pääasiallisena tavoitteena on perehtyä kuvan erilaisia laadullisia tekijöitä mittaa- vien algoritmien kykyyn tuottaa ihmisten keskimääräisen subjektiivisen käsityksen kanssa hy
vin korreloiva arvio digitaalisessa muodossa olevan kuvan laadusta. Käytännössä siis ensin testataan määritelty kuvajoukko testihenkilöiden avulla, jonka jälkeen voidaan verrata saatuja tuloksia algoritmien antamiin arvioihin. Samalla pohditaan menetelmien soveltuvuutta kuvan luokittelun tehostamiseen.
Laatu on käsitteenä kuitenkin hyvin subjektiivinen ja moniulotteinen, minkä vuoksi on myös tärkeää määrittää tarkoin, mitä oikeastaan mitataan. Työn teoriaosuudessa tarkastellaan tästä johtuen yleistä kuvanlaadun käsitteeseen ja mittaamiseen liittyvää problematiikkaa sekä pe
rehdytään kuvanlaadun määrittämisen merkitykseen käytännössä sekä menneiden että mahdol
listen tulevien sovelluksien valossa.
Työn kokeellista osuutta ajatellen on hyvä perustella kaksi keskeistä rajanvetoa. Ensinnäkin kuvan arvioitu laatu riippuu jo arvioijan suhteesta kuvaan. Keelan (2002, s. 4-5) jakaa arvioijat tällä mittapuulla kolmeen ryhmään: ensimmäiseen osapuoleen eli kuvaajaan, toiseen osapuo
leen eli kuvassa esiintyviin sekä kolmanteen osapuoleen eli kuvaustapahtuman ulkopuolisiin tarkkailijoihin. Ensimmäisen voisi arvella kiinnittävän huomiota muita enemmän esimerkiksi kuvan rajaukseen ja kohteiden asetteluun, toisen puolestaan omaan ”onnistumiseen” kuvassa, ja kolmannen taas teknisempiin seikkoihin ja kuvan yleiseen esteettisyyteen.
Toisena tekijänä ihmiset ovat itse asiassa kuvanlaadun arvioinnissa sitä useammin eri mieltä, mitä korkeampaa kognitiivista käsittelyä vaativia ominaisuuksia pyydetään arvioimaan (Mar
tens 2002). Tästä johtuen esimerkiksi esteettisyyden kaltaisten ominaisuuksien automaattista arviointia algoritmien avulla voidaan pitää paitsi hyvin haasteellisena, myös monia sovellus
mahdollisuuksia ajatellen suhteellisen tarpeettomana, sillä ei ole kovin mielekästä laatia yhtä automaattista kuvan arvottajaa, joka olisi toteutuksestaan riippumatta väistämättä usein vah
vasti eri mieltä kuin merkittävä osa sovelluksen käyttäjistä. Pienen käyttäjäryhmän valmiiksi määriteltyihin mieltymyksiin pohjautuvassa tai jonkinlaisella käyttäjäkohtaisia mieltymyksiä käyttäjäpalautteen kautta opettelevalla sovelluksella voisi kuitenkin mahdollisesti päästä koh
talaisiin tuloksiin myös tällaisten hyvin korkean tason ominaisuuksien mittaamisessa. Tällai
sen menetelmän kehittäminen vaatii kuitenkin huomattavasti laajempaa tutkimus- ja kehitys
työtä.
Paitsi edellä mainituista syistä, myös korkeamman tason käsitteitä mittaamaan pyrkivien ai
kaisempien tutkimusten vähäisyydestä johtuen tutkimuksessa keskitytään algoritmien osalta
matalamman tason tekijöihin kuten terävyyteen, kontrastiin, kohinaan ja värikkyyteen, joskin
teoriaosuudessa pohditaan myös syvemmän tason tekijöiden mittaamista. Koska subjektiivisissa testeissä määritettävänä laadullisena ominaisuutena pidettiin ensisijaisesti nimenomaan luonnollisen kuvan ”laatua”, tarkastelijoina toimi niin sanottu kolmas osapuoli henkilökohtais
ten vaikuttimien minimoimiseksi. Kolmantena rajanvetona kokeellisessa osuudessa käytettiin vain luonnollisia kuvia, eikä niiden osalta tutkittu pakkausvääristymien vaikutusta.
Vertailemalla algoritmien antamia arvoja subjektiivisista testeistä saatuihin tuloksiin pyrittiin saamaan jonkinlainen näkemys algoritmien yhdistetystä soveltumisesta kuvanlaadun arvioin
tiin. Tavoitteena oli kehittää tapa yhdistää algoritmien arvoja sellaiseksi kokonaisuudeksi, joka suoriutuisi useimmissa tapauksissa paremmin kuvanlaadun ennustamisessa kuin yksikään al
goritmeista yksinään. Lisäksi tutkittiin neljää kuva-aihepiiriä vertailemalla, voidaanko laa
dunarvioinnin onnistumisen todeta riippuvan kuvan sisällöstä, ja onko laadunarviointimene
telmän yksityiskohtia syytä muuttaa riippuen kuvan sisällöstä. Koska motivaatio tutkimukselle on kuvien luokittelun tehostaminen, laadunarviointimenetelmässä ei voida käyttää referenssi- kuvaa. Teoriaosuudessa käsitellään pintapuolisesti kuitenkin myös referenssikuvaan pohjautu
via menetelmiä, koska ne voivat toimia ainakin periaatteellisena pohjana referenssittömille eli niin sanotuille sokeille menetelmille.
1.3 Työn rakenne
Suhteellisen laajan teoriaosien aluksi perehdytään hieman kuvanlaadun käsitteeseen yleisesti luvussa 2 etenemällä abstrakteimman tason käsitteistä yksiselitteisempiin käsitteisiin. Tämä on tärkeää kuvanlaadun problematiikan ymmärtämiseksi, algoritmien taustalla vaikuttavien käsit
teiden määrittämiseksi sekä erilaisten kuvaominaisuuksien keskinäisten vuorovaikutuksien hahmottamiseksi. Luvussa 3 edetään kuvanlaadun subjektiiviseen mittaamiseen, mikä on kai
ken kuvanlaadun arvioinnin perusta. Luvussa 4 siirrytään kuvien objektiivisempaan arvioimi
seen eli esitellään kuvan laatuun vaikuttavien tekijöiden arvioimiseen kehitettyjä algoritmeja sekä tarkastellaan, miten korkeammankin tason laadullisia käsitteitä voitaisiin mallintaa algo
ritmien avulla. Tämän jälkeen selvitetään luvussa 5, mitä käytännön sovelluksia kuvanlaadun arvioimisella oikeastaan on ollut ja mitä sovelluksia sillä mahdollisesti tulee jatkossa olemaan.
Luvussa 6 siirrytään kokeelliseen osuuteen esittelemällä tarkemmin varsinainen tutkimuson
gelma sekä määritellään tutkimuksessa käytetyt menetelmät. Luvussa 7 esitellään ensimmäi
sen eli määrittelevän testikierroksen subjektiivisten ja objektiivisten testien tuloksia sekä tutki
taan näiden välistä korrelaatiota. Luvussa 8 esitellään tulosten pohjalta kehitetty laadunarvi- oimismenetelmä, jonka suorituskykyä arvioidaan luvussa 9 toisen testikierroksen tulosten poh
jalta. Luvusta 10 löytyy tutkimuksen yhteenveto, jossa pohditaan saatuja tuloksia sekä esite
tään ajatuksia aiheeseen liittyvistä jatkotutkimuskohteista.
2 KUVANLAATU 2.1 Yleistä
2.1.1 Kuvanlaadun määritelmästä lyhyesti
Kuvanlaatu koostuu käsitteenä kahdesta osasta: kuvasta ja laadusta. Jo sana kuva voidaan ymmärtää usealla tavalla. Se voi olla ihmisen tai tietokoneen piirtämä kuva, luonnollinen va
lokuva, tai jotakin näiden kahden väliltä. Luonnollisella valokuvalla tarkoitetaan tässä näky
vän valon perusteella muodostettua kuvaa, joka siis pyrkii pääosin vastaamaan ympäristöä sel
laisena kuin ihminen sen näkee. Kuva voi pyrkiä myös välittämään jotain tiettyä tietoa, kuten esimerkiksi lämpökameroiden muodostamien kuvien tapauksessa. Selkeästi valokuvien ja kei
notekoisten kuvien välimaastoon puolestaan kuuluvat muun muassa erilaiset esimerkiksi mai- noskäyttöön tarkoitetut kuvamanipuloinnit ja jotakin käytännön tarkoitusta varten käsitellyt kuvat, jotka voivat olla hyödyllisiä esimerkiksi tähti- tai lääketieteessä jonkin asian demon
stroimiseksi.
Laatu puolestaan on käsitteenä hyvin moniulotteinen ja voi käytännössä tarkoittaa lukuisia eri asioita, kuten kohdassa 2.2.3 tuodaan esille. Lisäksi kuten johdannostakin käy ilmi, laatu on käsitteenä pohjimmiltaan hyvin subjektiivinen. Vaikka esimerkiksi kuvan käyttötarkoituksesta vallitsisi yhteisymmärrys, ei ole välttämättä yksimielistä, mikä tarkkuus tai värikkyysaste olisi kuvalle juuri se ihanteellisin. Eri ihmiset myös tarkkailevat kuvasta erilaisia asioita, ja ammat
tilaiset kiinnittävät ehkä turhankin paljon huomiota asioihin, jotka liittyvät eniten heidän työ
hönsä (I3A 2007, s. 8-9). He voivat esimerkiksi olla kriittisempiä kuvassa havaittavia virhete
kijöitä kohtaan, kuten todettiin käyneen muun muassa Oliphantin et ai. (1989) tutkimuksessa.
Näistä syistä johtuen on kuvanlaadun tutkimuksessa aina syytä tiedostaa, mikä on käyttötar
koitus, ketkä kuvaa tarvitsevat sekä mitä kuvalta käyttötarkoitus ja käyttäjäryhmä huomioon ottaen oikeastaan edellytetään.
2.1.2 Subjektiivinen ja objektiivinen kuvanlaatu
Kuvanlaadussa on pohjimmiltaan kyse siitä, miten ihminen kokee kuvan suoriutuvan tehtäväs
tään, minkä vuoksi subjektiiviset testit ovat luonteva tapa kuvanlaadun määrittämiseen. Sub
jektiivisten mielipiteiden keskiarvoon pohjautuvaa MOS:ia (Mean Opinion Score) onkin pit
kään pidetty parhaana tapana mitata kuvanlaatua (Wang 2006, s.l). Ihmisten käyttö arvioiden saamiseksi on kuitenkin vähintäänkin aikaa ja resursseja vievää, mutta monia sovelluksia aja
tellen myös mahdotonta. Tästä johtuen tarvitaan myös automaattisia eli objektiivisempia me
netelmiä.
Objektiivisella kuvanlaadulla tarkoitetaan tyypillisesti suhteellisen yksinkertaisesti mitattavis
sa olevia suureita, joihin esimerkiksi valokuvauslaitteiden tekniset ominaisuudet vaikuttavat suoraan. Objektiivisen laadun määrittämisen voi jakaa kahteen kategoriaan: laiteriippuvaiseen ja laiteriippumattomaan. Näistä ensimmäinen sitoo järjestelmän tekniset parametrit, kuten
DPI-luvun (eli tuuman matkalle osuvan pistemäärän) tai kontrastin ihmisen havaintoihin (Johnson ja Fairchild 2003). Toinen näkökulma menetelmien erotteluun on se, suoritetaanko arviointi suhteessa saman kuvasisällön sisältävään referenssikuvaan vai ei. Referenssikuva, jota yleensä pidetään vertausten kannalta niin sanotusti virheettömänä, antaa arvioinnille sel
keän lähtökohdan, jota vasten niin ihmisarvioitsijan kuin tietokoneenkin on helppo mitoittaa kuvanlaatua. Verrattaessa samasta kohdekuvasta eri laitteistoparametreilla tuotettuja kuvia voidaankin usein jo yksinkertaisilla menetelmillä kuten laiteriippuvaiseen mittaamiseen tarkoi
tetulla neliöjuuri-integraalilla (Barten 1990) saada kohtalaisen hyvä korrelaatio koetun laadun ja mitattujen arvojen välillä. Kuvan arviointi ilman referenssiä on kuitenkin huomattavasti vaativampaa suorittaa johdonmukaisesti kuvien vaihtelevan luonteen vuoksi. Monissa käytän
nön tilanteissa referenssiä ei ole saatavilla, minkä vuoksi tällainenkin arviointi on tarpeen.
Laajemmin ymmärrettynä objektiivisen kuvanlaadun voi katsoa olevan pitkälle kehitettyjen ihmisen havainnoinnin fysiikkaan ja psykologisiinkin tekijöihin pohjautuvien ja kuvasisältöä analysoivien algoritmien monimutkainen kokoelma, joka jäljittelee subjektiivisilla testeillä saatua tilastollista keskiarvoa ihmisten mieltymyksistä. Tämänkin sokeaan eli referenssittö- mään kuvanlaatuun keskittyvän tutkimuksen tavoitteena on tukea tuota monimutkaisempien laatualgoritmien kehitystä. Luvussa 2.3 objektiivisella kuvanlaadulla tarkoitetaan kuitenkin nimenomaan sellaisia yksinkertaisia tekijöitä, joihin muun muassa laitteiston ominaisuuksilla on suora vaikutus. Algoritmeja käsittelevässä luvun alaluvussa 4.4 pohditaan tarkemmin mo
nimutkaisempien menetelmien mahdollisuuksia.
2.1.3 Kuvanlaadun ja sen mittaamisen merkitys
Itse kuvanlaadun pohjimmainen merkitys on suhteellisen selvä: laadukas kuva suoriutuu teh
tävästään paremmin, oli se tehtävä sitten puhtaasti tiedon välittäminen, pelkästään elämyksen tarjoaminen tai jotain näiden kahden ääripään väliltä. Laadun mittaamisen merkitys ei silti ole itsestäänselvyys. Kuten kuville itsessään, myös kuvanlaadun mittaamiselle on kuitenkin näh
tävissä lukuisia sovellusmahdollisuuksia niin laitteiden kehitystyössä kuin esimerkiksi luon
nontieteellisissä, sotilaallisissa tai tavallisille kuluttajille suunnatuissa käyttötarkoituksissakin.
Monissa sovelluksissa olisi suotavaa tai jopa välttämätöntä, että mittaus olisi tehtävissä auto
maattisesti, jolloin tarvitaan tietokoneelle suunniteltuja algoritmeja. Näihin soveltamismahdol
lisuuksiin perehdytään tarkemmin luvussa 5.
2.2 Kokonaisvaltaisia kuvanlaadun käsitteitä
2.2.1 Yleistä
Kuvanlaatua kuvaavat käsitteet jaetaan tässä ja seuraavassa luvussa (luku 2.3) karkeasti kah
teen ryhmään. Näistä ensimmäiset kuvaavat kuvan tehtävästään suoriutumiskykyä kokonai
suutena, ovat siten rinnastettavissa kokonaislaadun käsitteeseen ja korreloivat usein vahvasti keskenään. Niiden erilaiset näkökulmat tekevät niiden erottelun toisistaan kuitenkin hyödylli
seksi kuvanlaadun tutkimuskentän monimuotoisuudesta johtuvan vaatimusten erilaisuuden vuoksi.
Kokonaisvaltaisiksi käsitteiksi voidaan lukea muun muassa luonnollisuus, vääristymättömyys tai yleisluontoisesti laatu. Ne eivät ole keskenään suoraan verrannollisia, mutta yhteistä niille on se, että ne ovat luonteeltaan aidosti joko positiivisia tai negatiivisia. Tästä seuraa, että nii
den suhde kuvan laatuun tai ainakin kuvalle määritetystä tehtävästä suoriutumiseen on enim
mäkseen monotoninen. Luonteeltaan ne ovat toista käsiteryhmää abstraktimpeja ja siten myös subjektiivisempia, minkä vuoksi myös niiden mittaaminen on vaikeampaa ja tapahtuu käytän
nössä aina matalamman tason käsitteiden määrittämisen kautta.
Seuraavaksi käsitellään muutamia tällaisia kuvanlaadun käsitteitä alkaen kaikista korkeimman tason käsitteistä. Luvussa 2.3 jatketaan samaa listaa etenemällä teknisempien ja samalla yksi- selitteisempien käsitteiden suuntaan. Luvussa 2.4 tarkastellaan tämän jälkeen hieman, miten nämä käsitteet käytännössä suhtautuvat toisiinsa.
2.2.2 Vetoavuus
Vetoavuus ei ole kovin tyypillinen kuvanlaadun mittari, mutta ajatuksena mielenkiintoinen johdatus subjektivisimpiin ja siten hankalimpiin kuvan suorituskykyä mittaaviin käsitteisiin.
Savakis ryhmineen (2000) määrittelee kuvan vetoavuuden (engl. appeal) kiinnostuksena, jon
ka kuva herättää kolmannen osapuolen tarkkailemana. Aihetta on heidän mukaansa tutkittu vain vähän sen vuoksi, että se koetaan hyvin subjektiivisena suureena siinä missä kuvanlaatua taas pidetään objektiivisesti mitattavana. Perusteluna käsitteen tarpeellisuudelle he mainitsevat aikaisemman tutkimuksen osoittaneen, että muun muassa kuva-aiheen mielenkiintoisuus ja kohteen virheet kuten epäonnistunut rajaus tai ihmiskohteen ilme ovat merkittävämpiä tekijöi
tä silloin, kun ihmiset päättävät, mitä kuvia he eivät tarvitse esimerkiksi kuva-albumiinsa. He totesivat tutkimuksessaan vetoavuuden olevan yhteydessä kuvanlaatuun vain suhteessa suo- rimmin objektiivisesti mitattavissa oleviin suureisiin, joista eniten vetoavuuteen vaikutti vä
rikkyys. Eniten kuvissa vaikuttivat kuitenkin ihmisiin, asetelmaan ja aiheeseen liittyvät asiat, joita on vaikea mitata automaattisilla algoritmeilla.
2.2.3 Laatu
”Laatua” voidaan jossain määrin pitää kaikkien kuvan hyvyyttä kuvaavien käsitteiden yläkä
sitteenä, sillä sitä käytetään yleisesti myös muissa kuin kuvaan liittyvissä konteksteissa yleisen
tasokkuuden mittarina. Tyypillisissä asiayhteyksissä se on kuitenkin vetoavuutta helpommin arvioitavissa, minkä vuoksi se on tässä listattu vasta toisena käsitteenä. Laatu-sanan jo pelkästään kuviin liittyvien erilaisten käyttöyhteyksien ja merkitysten vuoksi on joka tapauksessa perusteltua tarkastella käsitettä hieman tarkemmin. Laatu on kuvan ansiokkuutta mittaavista termeistä moniselitteisimpiä ja vaatiikin siksi yleensä selvyyden vuoksi täsmennyksen varsin
kin subjektiivisten testien ohjeistuksessa. Laatu-käsitteen yleisen luonteen vuoksi se on liitet
tävissä moniin muihin yksittäisiäkin laadullisia tekijöitä mittaaviin käsitteisiin. Tämä on pe
rusteltua ainakin silloin, kun mitattavan yksittäisen attribuutin vaikutus kuvan havaittuun ta
sokkuuteen ei ole monotoninen tai kun halutaan muuten korostaa attribuutin ja sen aiheutta
man laatuvaikutelman eroa. Osittain myös tästä johtuen laatu lienee myös yleisimmin käytetty kuvan tasokkuutta kuvaava käsite.
Osasyy laadun monikäsitteisyyteen on se, että laadun käsitettä käytetään sellaisenaan usein
myös silloin, kun mitataan oikeastaan vain yhtä kokonaislaatuun vaikuttavaa attribuuttia kuten pakkausvääristymiä (esimerkiksi Junli Li et ai. 2001) tai terävyyttä. Jos ei muuta erikseen mainita, laadulla viitataan kuitenkin usein kuvan jonkinlaiseen tekniseen laatuun, joka saattaa olla useampien yksittäisten attribuuttien arvoista jollain tavalla koottu yhdistelmä, kuten esimerkiksi Xin Lin (2002) ehdottamassa menetelmässä. Tekninen laatu tarkoittaa kuitenkin tyy
pillisesti käytännössä jonkinlaista puutteiden poissaolon tasoa, ja näin on myös Xin Lin mene
telmässä. Usein nämä puutteet ovat lisäksi selkeästi määritettyjä häiriö- tai vääristyneisyyste- kijöitä, kuten muun muassa Wangin et ai. (2002a) sekä Osbergerin et ai. (1998a) tutkimuksis
sa. Tästä johtuen olisikin ehkä yksiselitteisempää, jos kuvanlaadun sijasta puhuttaisiin aina vääristyneisyydestä, häiritsevyydestä tai jostakin muusta vastaavasta puutteita kuvaavasta kä
sitteestä aina silloin kun
se
olisi luontevaa. Näin käytettävän käsitteen perusidea olisi helpommin ja nopeammin kommunikoitavissa
ja
kuvan häiriöihin pohjautuvat menetelmät olisivat selkeämmin erotettavissa muunlaisista kuvan hyvyyttä mittaavista menetelmistä.
Keelan käsittelee läpi kirjansa (2002) kuvan laatua "vaikutelmana kuvan ansiokkuudesta tai oivallisuudesta sellaisen tarkkailijan tulkitsemana, joka ei ole ollut mukana kuvaustilanteessa eikä liity läheisesti kuvauksen aiheeseen”. Silloin kun laatua ei erikseen tarkemmin määritellä, tätä voi pitää kuvien yhteydessä kohtalaisen hyvänä yleismääritelmänä käsitteelle laatu. Ole
massa olevat käytännön objektiiviset menetelmät kuitenkin sulkevat lähes poikkeuksetta ku
van asetelmaan, rajaukseen ja muihin ei-teknisiin tekijöihin liittyvät tekijät laadun määritel
män ulkopuolelle. Tämän voi nähdä olevan osittain ristiriidassa paitsi Keelanin määritelmän, myös sen kanssa, miten ihminen laadun yleisellä tasolla käsittää. Myös tästä johtuen voi olla hyvinkin oleellista määrittää, mitä laadulla kussakin yhteydessä tarkoitetaan, tai vaihtoehtoi
sesti käyttää mahdollisuuksien puitteissa laadun sijaan muita kuvan hyvyyttä mittaavia käsit
teitä.
2.2.4 Hyödyllisyys
De Ridder ja Endrikhovski (2002) mallintavat laatua summana kolmesta tekijästä: toiston tarkkuudesta, hyödyllisyydestä sekä luonnollisuudesta eli englanninkielisenä akronyyminä FUN (fidelity, usefulness, naturalness). Jokaista tekijää nähdään käytettävän myös yksin ku
vanlaadun määrittäjänä, mutta hyödyllisyys on siinä suhteessa poikkeava käsite, että sen arvi
ointi on aina täysin riippuvainen kuvan tarkoituksesta, kun taas esim. edellä mainittuja veto- avuutta ja laatua voi useimmiten hyvin arvioida itsenäisesti ilman tietoa kuvan käyttötarkoi
tuksesta. De Ridder ja Endrikhovski mainitsevat esimerkkinä sumussa olevaa miestä esittävän luonnollisen kuvan, joka voi olla hyvin uskollinen todellisuudelle, mutta hyödyllisyydeltään matala mikäli tehtävänä on tunnistaa ihminen.
Hyödyllisyys-käsitettä voi periaatteessa käyttää mihin tahansa tarkoitukseen käytettävien ku
vien kanssa. Arkista kuvaa voi esimerkiksi mitata sillä perusteella, miten hyödyllinen se on joidenkin muistojen esille tuomisessa. Tällaisessa tarkoituksessa termi on kuitenkin kaukaa haettuja sen suuruutta on tällöin hyvin hankala määrittää niin objektiivisesti kuin subjektiivi- sestikin. Luontevimmillaan hyödyllisyys onkin kuvan suorituskykyä kuvaavana mittarina sil
loin, kun kuvan tarkoituksena on toimia lähinnä apuvälineenä jossakin järjestelmällisyyttä vaativassa työssä, kuten esimerkiksi jossakin lääketieteen, asevoimien tai videovalvonnan so
velluksessa.
2.2.5 Kuvainformaatio
Useissa kuvien käytännön sovelluksissa kuvan hyödyllisyys on käytännössä johdettavissa suo
raan kuvan sisältämän tiedon määrästä. Tästä syystä voidaan ajatella monia tilanteita, missä kuvainformaatio olisi luontevin kuvan suorituskyvyn mitta. Edellä mainittuja esimerkkejä käyttäen lääketieteessä kuva voi antaa tietoa taudista, sotilaallisessa käytössä tietoa maastosta
ja videovalvonnassa tunnistaa jonkun henkilön. Näin ollen kuvainformaatio toimii monessa
tilanteessa varteenotettavana vaihtoehtona hyödyllisyyden käsitteelle.
Sheikh ja Bovik (2006) esittelevät oman kuvainformaation toiston tarkkuuden mittansa VIE (Visual Information Fidelity), joka on perinteisten toistontarkkuusmittojen tapaan riippuvainen saatavilla olevasta referenssikuvasta. Poikkeuksellisen ”kokonaisvaltaiseksi” ja ainakin teori
assa tavallisia konkreettiseen referenssiin vertaavia mittareita suorituskykyisemmäksi VIF- suureen tekee se mahdollisuus, että mitattava kuva voi olla kuvainformaatioltaan myös alkupe
räistä eli referenssiä parempi. Useimmat referenssikuvaan vertaamiseen pohjautuvat suureet eivät tarjoa tätä mahdollisuutta, minkä vuoksi niiden suhdetta kuvan hyvyyteen ei voi auto
maattisesti pitää monotonisena.
2.2.6 Toiston tarkkuus suhteessa todellisuuteen ja luonnollisuus
Kuvanlaatututkimuksessa luonnollisuudella viitataan yleensä käytännössä kuvan värimaail
maan, kuten muun muassa Yendrikhovskijin et ai. (1998a) sekä de Ridderin et ai. (1995) tut
kimuksissa. Sen voi kuitenkin ymmärtää myös laajemmin. De Ridderin et ai. edellä mainitussa FUN-kolmijaossa luonnollisuus määritetään kuvan vastaavuutena sisäisiin referensseihin ku
ten muistiväreihin, kun taas toiston tarkkuus määräytyy ulkoisten referenssien eli todellisuu
den kautta. Näiden kahden erottelua perustellaan muun muassa sillä, että luonnollisuutta voi
taisiin käyttää esimerkiksi keinotodellisuuteen tai animaatioon liittyvien kuvien todellisuutta vastaamisen asteen kuvaamiseen, kun taas toiston tarkkuudella voisi kuvata taidetta tai tieteel
lisiä kuvia.
Käytännössä nämä ulkoiset ja sisäiset referenssit eivät liene kovin kaukana toisistaan, ja esi
merkiksi keinotodellisuuden tasokkuutta voisi hyvin kuvata myös toiston tarkkuuden eli ul
koisten referenssien kautta. Näkökulma käsitteillä on kuitenkin eri: luonnollisuus kuvaa sitä, miten kuva ihmisen mielestä vastaa todellisuutta, kun taas toiston tarkkuus sitä, miten kuva
ihan oikeasti vastaa todellisuutta. Aivan kuten maksimaalisen luonnollisuuden ja maksimaali
sen laadun arvioiden väliltä on löydetty useissa tutkimuksissa (mm. de Ridder et ai. 1995) sys
temaattinen ero, on mahdollista, että ihmiset pitäisivät luonnollisimpana hieman toisenlaisia kuvia, kuin mikä oikeastaan vastaa täsmällisimmin todellisuutta.
2.2.7 Vääristyneisyys ja häiritsevyys
Vääristyne isyys on edellä listattuihin verrattuna matalamman tason käsite, sillä sitä voi helpos
ti mitata yhden tai useamman häiriötekijän kautta - referenssin kanssa tai ilman. Häiritsevyys on vääristyneisyyden kanssa samankaltainen termi, mutta sen käyttö kohdistuu tyypillisesti vain yhteen tarkoin määriteltyyn häiriötekijään. Esimerkiksi kuvaan tai videokuvaan liitettävi
en digitaalisten vesileimojen tapauksessa häiritsevyys on hyvin luonteva mittari, minkä vuoksi sitä on käytetty muun muassa Fariaksen et ai. tutkimuksessa (2002).
Paitsi tiettyjen häiriötekijöiden mittoina, vääristyneisyys ja tarkemmin määriteltynä häiritse
vyyskin voidaan kuitenkin nähdä myös vaihtoehtoina teknisen laadun käsitteelle, minkä vuok
si ne on tässä yhteydessä listattu kokonaisvaltaisten laadunkäsitteiden joukkoon. Vääristynei- syyshän voidaan nähdä mittarina siitä, kuinka vääristynyt kuva on suhteessa siihen, millainen teknisesti virheetön kuva vastaavasta kohteesta olisi. Häiritsevyys taas voidaan määritellä ku
vaamaan, missä määrin kuvan ilmeiset puutteet loppujen lopuksi häiritsevät. Tällaisessa yh
teydessä käsitteet voisi nähdä turhina kiertoilmaisuina laadun käsitteelle, mutta käytännön ob
jektiiviset kuvanlaadun mittarit perustuvat nykyisellään suurelta osin nimenomaan erilaisiin häiriöihin tai puutteisiin, minkä vuoksi voi tämäntapaisten puutteita mittaavien käsitteiden käyttö olla perusteltua myös subjektiivisia mittauksia tehdessä.
2.3 Matalan tason käsitteitä
2.3.1 Yleistä
Verrattuna edellisessä alaluvussa lueteltuihin käsitteisiin, tähän ryhmään luokiteltavat suureet
ovat luonteeltaan teknisempiä, eivätkä siten yksin riitä kuvaamaan kuvan suorituskykyä kokonaisuudessaan kuin korkeintaan tarkoin määritellyssä käyttötarkoituksessa. Toisaalta näitä ma
talamman tason käsitteitä tarvitaan väistämättä ainakin silloin, kun kuvan hyvyyttä halutaan mitata objektiivisin menetelmin. On olemassa esimerkiksi useita kuvausjärjestelmienkin ai
kaansaamia epäterävyyden ja punasilmäisyyden kaltaisia vikoja tai puutteita, jotka aiheuttavat melkein aina kuvanlaadun arvioidun heikkenemisen (Keelan, s.6). Mikäli matalamman tason käsitteitä saadaan yhdistettyä onnistuneesti, niillä onkin mahdollista ennustaa subjektiivista näkemystä korkeamman tason käsitteistä.
Töpferin et ai. (2002) mukaan useimmat tällaisista kokonaislaatuun vaikuttavista tekijöistä voidaan jakaa edelleen artefaktuaalisiin ja mieltymyksellisiin attribuutteihin. ISO 20462 - standardissa (2005) artefaktuaalinen attribuutti määritellään sellaiseksi, joka kuvasta havaittu
na lähes poikkeuksetta johtaa kuvanlaadun heikkenemiseen, ja mieltymyksellinen attribuutti sellaiseksi, joka on tarkkailijasta ja kuvasisällöstä riippuva mielipidekysymys. Artefaktuaalis-
ten mittaaminen on jo siinä mielessä helpompaa, että asteikon ääripäästä löytyy se laaduk- kaimmaksi koettu vaihtoehto. Esimerkiksi kohinan koetaan yleensä vain heikentävän laatua, joten mitä vähemmän kohinaa, sitä parempi laatu. Sen sijaan kuten on arvattavissa, laatu ei kasva monotonisesti esimerkiksi saturaation, kroman tai värikkyyden funktiona, minkä muun muassa Fedorovskaja et ai. (1997) ovat kokeellisestikin osoittaneet.
Mieltymyksellistä ulottuvuutta Töpfer et ai. kuten myös Keelan (2002, s.47-60) esittävät pre- ferenssijakaumana, josta nähdään, millä suhteellisella todennäköisyydellä kukin kohta on mie
luisin. Esimerkiksi kontrastille kaikista todennäköisimmin laadukkaimpana koettu taso eli pre- ferenssijakauman huippu olisi luultavasti jossain maksimikontrastin ja minimikontrastin väli
maastossa.
a*
Kuva 1. Väritasapainon preferenssijakauma CIELAB-väriavaruudessa (Töpfer et ai. 2002)
Töpferin ynnä muiden tulokset väritasapainolle on käytännön esimerkin vuoksi esitetty
graafisesti ylläolevassa kuvassa (Kuva 1), mistä on muun muassa huomattavissa, että parhaimmaksi miellettävyyden todennäköisyys laskee nopeammin väritasapainon muuttuessa punaviherakse- lilla (a*-akseli) kuin sinikelta-akselilla (b*-akseli). Keskeisintä tässä yksinkertaisessa väritasa- painoesimerkissä on tässä yhteydessä kuitenkin se, että se osoittaa hyvin mieltymyksellisten attribuuttien luonteen: todennäköisimmin parhaaksi miellettävä väri löytyy asteikon keskivai
heilta. Toinen huomionarvoinen seikka on, että mieltymyksen todennäköisyys ei laske sym
metrisesti huippukohdan molemmin puolin: sinisemmän suuntaan mieltymyksen todennäköi
syys laskee hitaammin. Tällaiset tekijät voivat osoittautua hyvinkin oleellisiksi silloin, kun matalamman tason suureilla pyritään ennustamaan kokonaisvaltaisia laadun käsitteitä.
2.3.2 Toiston tarkkuus suhteessa referenssikuvaan
Kohdassa 2.2.6 esitettiin ulkoiseen referenssiin suhteutetun toiston tarkkuuden käsite, jota voi pitää käytännössä puhtaasti positiivisena mittana kuvan tasokkuudesta. Oli vertailukohtana sitten konkreettinen kuva tai ulkoinen referenssi, toiston tarkkuutta voi tarkkailla joko pelkäs
tään jonkin yksittäisen
attribuutin
suhteen kuten esimerkiksi MacDonaldin(1987)
tutkimana väriloiston tarkkuutena, tai sitten suhteessa kuvaan kokonaisuutena. Toiston tarkkuus suhtees-sa referenssikuvaan on tässä kuitenkin eriteltynä erilliseksi, luonteeltaan kuvanlaatua vähem
män kokonaisvaltaisesti kuvaavaksi käsitteeksi kahdesta syystä. Ensinnäkin referenssikuva ei välttämättä ole laadultaan ideaali, ja voi olla jopa kuvankäsittelytoimenpiteillä parannettavissa, jolloin esimerkiksi kappaleessa 2.2.5 mainitun VIF-suureen tulisi saada referenssiä parempi arvio. Toisekseen toiston tarkkuus suhteessa alkuperäiseen kuvaan on huomattavasti suorem
min johdettavissa alkuperäisestä kuvasta yksinkertaisenkin matemaattisen kaavan avulla, mut
ta tämä toiston tarkkuus voi korreloida käytännössä hyvin heikosti ihmisen havaitseman kuvi
en samankaltaisuuden kanssa.
Puutteistaan ja referenssikuvan olemassaolon vaatimuksestaan huolimatta erilaiset konkreetti
seen referenssikuvaan vertaavat kuvaa arvioivat mittarit ovat kuitenkin hyvin yleisiä, koska niiden kehittäminen on referenssittömiin menetelmiin verrattuna huomattavasti helpompaa, ja siten niillä myös päästään yleensä huomattavasti parempiin tuloksiin. Referenssimenetelmille löytyy myös erilaisia sovellusalueita (kts. esim. luku 5.2.3), ja mikäli referenssikuva on käyt
tötarkoitusta silmällä pitäen todettavissa laadultaan ideaaliseksi, voidaan toiston tarkkuutta suhteessa referenssiinkin pitää jokseenkin kokonaisvaltaisena laadun käsitteenä sillä edelly
tyksellä, että se ottaa huomioon kuvan kokemien muutosten visuaalisen häiritsevyyden.
2.3.3 Värien luonnollisuus
Vaikka luonnollisuuden voi ajatella tarkoittavan pohjimmiltaan sitä, miten luonnonmukainen eli todellisuutta vastaava jokin kuva on, luonnollisuus on käsitteenä käytännössä hyvin ihmis- lähtöinen. Tyypillisesti kuvan arviointitehtävissäkin arvioinnin suorittaja joutuu kuvan alkupe
räisen kohteen näkemisen sijaan nojaamaan vain omiin aikaisempiin kokemuksiinsa ja odo- tuksiinsa siitä, mitä hän kuvan esittämän kohteen todelliselta vastineelta odottaisi. Värien osal
ta luonnollisuutta voidaankin tästä johtuen pitää kappaleessa 2.2.6 esitetyn luonnollisuuden määritelmän mukaisesti kuvan värien yhtäläisyytenä sisäisen referenssin mukaiseen värimaa
ilmaan. Värien luonnollisuus on siten vastaavaa kokonaisvaltaista käsitettä ajatellen monoto
ninen, mutta vain yhtä kuvan kokonaisluonnollisuuden osatekijää mittaava suure.
Värimuisti viittaa ihmisen kykyyn muistaa värejä yleisellä tasolla (Yendrikhovski et ai. 1999).
Muistivärit ovat puolestaan pitkäkestoisesta muistista löytyviä tuttuihin esineisiin yhdistettäviä värejä (Bartleson 1960). Värien kohdalla voimakkain sisäinen referenssi löytynee käytännössä juuri näistä muistiväreistä, mistä johtuen värien luonnollisuutta käsittelevissä tutkimuksissa luultavasti käytetäänkin usein taivaan, ihon tai nurmikon kaltaisia ihmisille hyvin tuttuja kuva- aiheita kuten muun muassa Bodrogin ja Tarczalin (2001) sekä Parkin et ai. (2006) tutkimuk
sissa. Ongelmalliseksi luonnollisuuden käsitteen voi nähdä sellaisissa tapauksissa, joissa ul
koinen referenssi (eli esimerkiksi alkuperäinen maisema, josta kuva on otettu) on luonnostaan
epäluonnolliselta vaikuttava, kuten mahdollisesti esimerkiksi auringonlaskua esittävän kuvan kohdalla. Tällöin on teoriassa mahdollista syntyä merkittäväkin ero edellä esitetyn FUN- kolmijaon mukaisten värien toiston tarkkuuden ja värien luonnollisuuden välillä. Subjektiivisissa testeissä tämä ero voi aiheuttaa myös epäselvyyksiä mielipiteiden muodostamisessa,
minkä vuoksi voi olla syytä tutkimuksen tavoitteet huomioiden täsmentää tai harkita tarkem
min arvioinnin perustana käytettävää suuretta.
2.3.4 Väritasapaino
Kuvan kohde voi näyttää erilaiselta erilaisissa valaistusolosuhteissa. Esimerkiksi valkoinen kohde voi näyttää matalan värilämpötilan valaistuksessa punertavalta ja korkean värilämpöti
lan valaistuksessa sinertävältä. Ihmissilmä ei tätä eroa kuitenkaan välttämättä huomaa, koska
ihminen suhteuttaa näkemänsä kohdetta ympäröivään valaistukseen. Valokuvaan tämä ero kuitenkin lähtökohtaisesti tallentuu, minkä vuoksi useimmissa kameroissa on erillinen väritasa- painon korjausmekanismi tämän värivirheen ehkäisemiseksi. (Liu et ai. 1995)
Mikäli kuvan väritasapainoa korjataan tulkitsemalla kuvaa väärin, syntyy yleensä värivirhe (Cooper et ai. 2000). Tämä puolestaan voi vaikuttaa edellä käsiteltyyn värien luonnollisuuteen negatiivisella tavalla. Luonteeltaan väritasapaino on kuitenkin hyvin subjektiivinen preferens- sisuure, mikä kuvasisältöriippuvaisuuden ohella vaikeuttaa huomattavasti yhteyden löytämistä luonnollisuuden kaltaisiin korkeamman tason käsitteisiin.
2.3.5 Värikkyys
Myös värikkyys on luonteeltaan selvä preferenssisuure: paras kuva ei ole äärimmäisen värikäs,
mutta ei myöskään tyystin väritön. Tästä johtuen sitä onkin käytetty korkeintaan epäsuorana laatutekijänä kuten värikkyyden erona (Palus 2005). Mikäli värikkyydestä halutaan johtaa kokonaisvaltaisempia kuvan oivallisuutta mallintavia suureita, on päätettävä ideaali värikkyyden taso sekä millä tapaa laatu heikkenee kun värikkyys poikkeaa tästä ideaalista. Automaattisia menetelmiä ajatellen suureen ideaalikohdan määrittämisen tekee ongelmalliseksi se, että eri kuvakohteiden kuuluukin olla värikkyydeltään eritasoisia: esimerkiksi vihreät niityt tai kukka- asetelmat ovat luonnostaan värikkäämpiä kuin harmaa katumaisema. Ihanteellisin värikkyyden taso riippuu myös siitä, tavoite Haanko kuvalta kokonaisvaltaisesti parasta laatua vai suurinta luonnollisuuden tasoa, sillä kuten kappaleessa 2.4 todetaan, näiden välillä on havaittu syste
maattinen ero.
2.3.6 Terävyys
Terävyyttä voidaan pitää hyvin keskeisenä ja useissa yhteyksissä jopa keskeisimpänä koko- naislaatuun vaikuttavana yksittäisenä tekijänä. Tätä näkemystä edustaa muun muassa Johnso
nin ja Fairchildin (2000) tutkimus. Terävyys ei myöskään ole kovin mieltymyksellinen tekijä siinä missä esimerkiksi värikkyys, sillä pääsääntöisesti kuvilta halutaan mahdollisimman kor
keaa terävyyttä, kunhan keinotekoinen terävöitys ei aiheuta kuvaan vääristyneisyyttä tai liial
lista rosoisuutta. Näistä syistä johtuen terävyyttä myös tutkitaan suhteellisen paljon. Objektii
visia menetelmiä ajatellen se sisältää useampia ongelmakohtia, mutta se ei ole täysin yksiselit
teistä kuitenkaan edes subjektiivisia arviointeja ajatellen.
Kuva 2. Kumpi on terävämpi? Entä kumpi laadultaan parempi?
Kuva 2 havainnollistaa terävyyden mittaamisen yhtä keskeistä ongelmakohtaa. Vasemman
puoleisissa kuvissa kuvan hana ja kukka ovat terävämpiä kuin oikeanpuoleisissa kuvissa, mut
ta vastaavasti tausta sumeampi. Näiden kuvien kohdalla on suhteellisen oletettavaa, että ih- misarvioitsija valitsisi vasemmanpuoleiset kuvat laadultaan paremmiksi. Mutta arvioidaanko vasemmanpuoleiset kuvat tämän seurauksena myös terävämmiksi? Tätä valintaa vastaan on se tosiasia, että erityisesti voikukkaa esittävissä kuvissa tausta on pinta-alaltaan suurempi. On kuitenkin tärkeää, että kuvan keskeinen sisältö on terävästi esitetty, ja ihmiselle on useimmiten hyvin intuitiivinen tehtävä valita, mikä kuvassa on keskeistä. Ongelmallisemmaksi tehtävä tu
lee, mikäli kuvan keskeinen kohde ei ole yksimielisesti päätettävissä, jolloin ihmisten arviois
sa voi esiintyä suurtakin hajontaa.
On perusteltua olettaa, että vasemmanpuoleiset kuvat valittaisiin subjektiivisissa testeissä pait
si oikeanpuoleisia laadukkaammiksi myös terävämmiksi. Koska terävien alueiden pinta-alat eivät tätä päätöstä tue, tämä johtaa nopeasti siihen päätelmään, että terävyydenkin arvioon vai
kuttaa se, mitkä asiat ovat kuvassa terävästi esitettyinä. Ainakin mikäli terävyyden arviolla pyritään ennustamaan kokonais laatua, terävyyden ja laadun välillä tulisikin vallita tämänkal
tainen vahva yhteys. Objektiivisia menetelmiä ajatellen tämä on kuitenkin melko vaikea on
gelma: miten voidaan määrittää kuvan keskeinen sisältö, jos ihmisetkään eivät ole välttämättä siitä yksimielisiä? Kohteen sijainti kuvassa ei ratkaise kysymystä, sillä kuvan keskeinen kohde
voi näistä esimerkkikuvista poiketen hyvin sijaita myös kuvan reuna-alueilla. Tarkemmin tätä ongelmaa pohditaan algoritmeja käsittelevässä luvun osassa 4.3.3.
2.3.7 Kontrasti
Kontrasti tarkoittaa kuvan osioiden erotettavuutta toisistaan. Kuvankäsittelyssä se määritellään yleensä kuvan tummimpien ja kirkkaimpien pisteiden välisenä suhteena, jota usein manipuloi
daan kuvan laadun parantamiseksi (Matkovic et ai., 2005). Toisaalta, kuten Peli (1990) toteaa, havaittu kontrasti voi vaihdella huomattavasti kuvan eri alueiden välillä ja sen voi lisäksi mää
ritellä usein eri tavoin.
Korkeakontrastisen kuvan alueet erottuvat toisistaan matalakontrastisen kuvan alueita selke
ämmin, mistä johtuen korkea kontrasti saa kuvan usein näyttämään myös terävämmältä, mikä puolestaan vaikuttaa osaltaan koettuun kuvanlaatuun. Toisaalta kuten Töpfer et ai. (2002) esi
merkkinä mainitsevat, kontrasti on luonteeltaan mieltymyksellinen attribuutti, joten pelkkä kontrastin maksimointi ei ole mielekästä. Terävyys onkin käsitteenä ehkä suoremmin yhdistet
tävissä ihmisen havaitsemaan kokonais laatuun, kun taas kontrasti on teknisempi ja samalla myös vahvemmin laiteriippuvainen suure. Tästä johtuen terävyys soveltunee paremmin soke
aan laiteriippumattomaan kuvanlaadun arviointiin, kun taas kontrasti laitteiden teknisten omi
naisuuksien ja niiden kuvanlaadulleen merkityksen vertailuun.
2.3.8 Kohina
Kohina on tyypillinen, esimerkiksi analogisista TV-lähetyksistä tuttu häiriötekijä (Dosselman
& Yang, 2007). Se tarkoittaa kuvassa esiintyvää satunnaista pikseliarvojen vaihtelua, jota voi syntyä esimerkiksi pimeässä pitkällä valotusajalla otettuihin kuviin. Koska kohina on lähes poikkeuksetta ei-toivottu ominaisuus, se kuuluu käsitteenä helpoimpiin ja yksiselitteisimmin kokonaisvaltaiseen laatuun vaikuttavien tekijöiden ryhmään eli artefaktuaalisiin attribuuttei
hin: mitä enemmän kuvassa on kohinaa, sitä alhaisempi on luultavasti niin luonnollisuuden, hyödyllisyyden kuin toiston tarkkuudenkin taso.
Kohinan tyyppejä on kuitenkin erilaisia. Esimerkiksi Li (2002) käsitteli erikseen summautu
van valkoisen gaussisen kohinan ja impulssikohinan objektiivista mittaamista. Näistä ensim
mäinen on tyypillinen, kuvan yksittäisiä pikseleiden arvoja joko laskeva tai nostava kohinan muoto, joka on jossain määrin läsnä käytännössä kaikissa luonnollisissa kuvissa. Impulssiko- hina on luonteeltaan satunnaisempaa eli vain joitakin kuvan kohtia koskevaa, mutta voi poike
ta huomattavasti gaussista kohinaa vahvemmin yksittäisen pikselin toivotusta arvosta. Yksi tyypillinen esimerkki tämänlaisesta kohinasta on ns. suola ja pippuri -tyyppinen kohina (Chan et ai. 2005). Kuva 3 puolestaan havainnollistaa, kuinka kohina voi olla myös taajuudeltaan huomattavan erilaista, mikä vaikuttaa huomattavasti sen havaittavuuteen.
32 cpd
Kuva 3. Puna-viher-kanavan kohinaa viidellä eri taajuudella (Johnson ja Fairchild, 2005). Lyhenne cpd tarkoittaa kohinan jaksoja visuaalisen näkökulman astetta kohden.
Erityyppisten kohinoiden olemassaolo hankaloittaa kohinan määrän arvioimista. Objektiivisia menetelmiä ajatellen on myös monenlaisia kuvaelementtejä, jotka voidaan luultavasti tulkita virheellisesti kohinaksi. Käsitteen periaatteellinen yksinkertaisuus ja suhteellisen suora suhde korkeampiin laadun käsitteisiin eivät siis kuitenkaan tarkoita sitä, että sen objektiivinen mit
taaminen olisi välttämättä muiden käsitteiden mittaamista helpompaa. Merkittävästi helpom
paa saattaa olla korkeintaan määrittää sen suhde kokonaisvaltaisiin laadun käsitteisiin.
2.3.9 Pakkausvääristymät
Myös pakkausvääristymät ovat luonteeltaan artefaktuaalisia. Niitä syntyy, kun kuva pakataan häviöllisesti tavumäärältään pienempään kokoon kuvan säilyttämistä tai siirtoa varten. Kuvan
laatua arvioidessa voi olla tarkkaan tiedossa, minkälaiseen menetelmään kuvan pakkaus perustuu, jolloin myös vääristymien tyyppi ja syntytapa on tiedossa. Tämä tekee pakkausvääristy- mistä luonteeltaan attribuuteista teknisimmän ja helpoimmin mitattavan, mistä johtuen ne ovat tämän kuvanlaadulleen suureiden listan viimeisenä.
Vääristymien näkyvyys ja häiritsevyys riippuvat kuvan sisällöstä, mistä johtuen subjektiivisia testejä suoritetaan myös pakkausvääristymien kohdalla kuten muun muassa Sheikhin ja Hovi
kin tutkimuksessa (2006), jossa he käyttivät omaa subjektiivisten kuvanlaatuarvioiden tieto
kantaansa (Sheikh et ai. n.d.). Pakkausvääristymienkään laadullista vaikutusta ennustamaan pyrkivät objektiiviset mittaukset eivät siis ole käytännössä aivan niin yksinkertaisia kuin mitä
voisi olettaa ottaen huomioon vääristymien keinotekoisen matemaattisen syntytavan. Erityyp-
pisten kuva-alueiden häiriöherkkyyteen vaikuttaa myös se, mihin pakkausmenetelmän toimin
ta perustuu.
Kuva 4. Alkuperäinen kuva sekä sen visuaalisesti häviöllisesti pakatut versiot JPEG- ja JPEG2000-muodoissa
Kuva 4 havainnollistaa pakkausvääristymien näkyvyyttä yleisesti käytetyn kuvanpakkausfor- maatin JPEG:n sekä sen seuraajan JPEG2000:n osalta. Ilmaisella IrfanView-ohjelmalla tätä esimerkkiä varten rankasti pakatut kuvat ovat tiedostokooltaan jokseenkin samankokoisia, mutta JPEG2000-pakkauksessa kuvan pakkausartefaktit ovat pääosin huomaamattomampia.
Vaikka JPEG2000 siis tarjoaakin alhaisemman vääristyneisyyden samalla bittimäärällä, se on kuitenkin laskennallisesti raskaampi (Marcellin et ai., 2000, s. 16). Vääristymien häiritsevyyttä tutkivia subjektiivisia ja objektiivisia mittauksia ajatellen mielenkiintoisempia seikkoja ovat kuitenkin vääristymien erilainen luonne sekä se, että JPEG-kuvan laatikoituminen on erityisen huomattavaa kuvan tasaisilla alueilla. Useimmiten valokuvat pakataan kuitenkin visuaalisesti jokseenkin häviöttömästi, missä tapauksessa pakkausvääristymien mittaamiselle ei still-kuvien
kohdalla ole tarvetta.
2.4 Ominaisuuksien väliset suhteet
2.4.1 Merkitys kuvanlaadun tutkimuksessa
Kaikki kuvanlaadulliset tekijät ovat toistensa kanssa jonkinlaisessa vuorovaikutuksessa. Tois
ten välinen vuorovaikutus on heikkoa tai lähes olematonta, kun taas toisten välillä vuorovaiku
tus voi olla hyvinkin vahvaa. Vuorovaikutuksen vahvuuden lisäksi kiinnostavia tekijöitä ovat merkittävän vuorovaikutuksen todennäköisyys sekä sen merkitys tutkimuksen tavoitteiden saavuttamisessa.
V jr
X, .44'"
___ —---
Objektiiviset Matalan tason
--- --- Kokonaisvaltaiset
suureet attribuutit laadun käsitteet
Kuva 5. Kuvanlaadulleen mittojen keskinäiset suhteet ja niiden merkitys
Kuva 5 havainnollistaa yksinkertaistetusti eri käsitteiden välisten suhteiden merkitystä kuvan
laadun tutkimuksessa. Käsitelaatikoiden väliset paksut vihreät nuolet kuvastavat haluttua vuo
rovaikutusta. Esimerkiksi terävyyttä mittaavan objektiivisen suureen tulisi korreloida mahdol
lisimman hyvin vastaavan matalan tason attribuutin eli subjektiivisen terävyyden kanssa, jon
ka puolestaan toivotaan ennustavan mahdollisimman hyvin kokonaislaatua. Sininen suhteelli
sen yhtenäisellä katkoviivalla varustettu nuoli oikeanpuolimmaisen laatikon yläpuolella kuvas
taa neutraalia vuorovaikutusta. Esimerkiksi luonnollisuus ja hyödyllisyys ovat yhteydessä toi
siinsa, mutta koska molemmat ovat yleensä tutkimuksen pääasiallisia tavoitteita, eikä kum
paakaan kannata määritellä toisen kautta, niiden välisellä suhteella ei ole merkitystä lopputu
loksen kannalta.
Kuvan keltainen hieman katkonaisempi viiva viittaa suhteeseen, jolla on riski olla hieman hai
tallinen tutkimuksen tavoitteille. Mikäli kuvaa on muokattu vain yhden attribuutin suhteen, se voi kuitenkin vaikuttaa subjektiivisiin arvioihin myös muiden attribuuttien osalta. Jossain ta
pauksessa tämä voi olla järkeenkäypää, mikäli esimerkiksi värikkyyden muutos vaikuttaa ko
hinan näkyvyyteen. Sen sijaan mikäli esimerkiksi heikosti suunniteltu koejärjestely johtaa koehenkilön hakemaan kuvasta väkisin eroavaisuuksia mitattavan attribuutin suhteen, tämä attribuuttien välinen vuorovaikutus voi vääristää tuloksia.
Vasemmanpuoleisimman laatikon yläpuolella oleva punainen hyvin katkonainen viiva tarkoit
taa vuorovaikutussuhdetta, joka on yleensä luonteeltaan ei-toivottu. Ellei kahden matalan ta
son attribuutin välillä ole todettu subjektiivisissa testeissä merkittävää vuorovaikutusta, niitä vastaavien objektiivisten suureiden välillä huomattu vuorovaikutus viittaa siihen, että jokin yhteen suureeseen liittyvä tekijä tulkitaan virheellisesti toiseen suureeseen vaikuttavaksi asiak
si. Algoritmin suorituskyvyn maksimoimiseksi tällainen vuorovaikutus tulisi luonnollisesti pyrkiä minimoimaan. Objektiivisen suureen vuorovaikutus johonkin erityyppiseen matalan tason attribuuttiin (esimerkiksi objektiivisen terävyyden suhde objektiiviseen kohinaan) on tietenkin yhtä lailla ei-toivottua, mutta näitä ikään kuin ristiin meneviä suhteita ei ole yksin
kertaistuksen vuoksi piirretty mukaan havainnekuvaan.
2.4.2 Matalan tason ominaisuuksien keskinäisiä vuorovaikutuksia
Kuten edellä todettiin, luonteeltaan haitallisimpia ovat objektiivisten mittojen väliset ei- toivotut vuorovaikutukset. Tässä niitä ei kuitenkaan käsitellä, sillä ne ovat algoritmiriippuvai- sia ja kuuluvat siten tutkimuksen kokeellisiin ja algoritmeja käsitteleviin osuuksiin. Jotta näi-