• Ei tuloksia

The quality evaluation of digital images and an image agent -based approach to the selection of print images

N/A
N/A
Info
Lataa
Protected

Academic year: 2022

Jaa "The quality evaluation of digital images and an image agent -based approach to the selection of print images"

Copied!
119
0
0

Kokoteksti

(1)

Automaatio-ja systeemitekniikan osasto

Mikael Malanin

Digitaalisten kuvien laadunarviointi ja kuva-agentti -pohjainen lähestymistapa painokuvien valintaan

Diplomityö, joka on jätetty opinnäytteenä tarkastettavaksi diplomi-insinöörin tutkintoa varten Espoossa 13.12.2005.

Valvoja professori Hannu Saarelma

Ohjaaja Dl Mari Laine

(2)

Automaatio- ja systeemitekniikan osasto

Tekijä: Mikael Malanin Päiväys: 13.12.2005 Sivumäärä: 77

Työn nimi: Digitaalisten kuvien laadunarviointi ja kuva-agentti -pohjainen lähestymistapa painokuvien valintaan

Professuuri: Viestintätekniikka Koodi: AS-75 Työn valvoja: Professori Hannu Saarelma

Työn ohjaaja: DI Mari Laine

Diplomityössä tehtiin lyhyt selvitys agenttipohjaisista ohjelmista ja agenttien soveltumisesta

digitaalisten kuvien hallintaan. Tämän jälkeen laadittiin uudet kuva-agentin ja laatuagentin konseptit.

Kuva-agentti on ohjelma, jota voidaan käyttää kuvien hakemiseen niiden laadullisten ja sisällöllisten piirteiden perusteella. Laatuagentti on työkalu laadunanalyysiin. Työssä keskityttiin erityisesti laatuagenttiin ja sen käyttämiin laskennallisiin algoritmeihin. Algoritmit rajattiin tutkittujen

laatuattribuuttien perusteella, jotka olivat terävyys, kohina ja pakkausvääristymät. Viittä eri algoritmia testattiin Matlab-ympäristössä.

Päädyttiin esittämään, että laatuagentti on osa kuva-agentin konseptia, joka lisäksi muodostuu sisältöagentista, indeksoinnista, hausta, käyttöliittymästä ja tietokannasta. Laatuagentti analysoi tietokannassa olevia kuvia eri laatuattribuuttien suhteen. Kullekin laatuattribuutille lasketaan oma laatuluku, joka tallennetaan tietokantaan. Kuvanhakutilanteessa etukäteen laskettuja arvoja voidaan käyttää hyväksi kuvia valittaessa. Laatuagenttiin soveltuvia algoritmeja valittaessa tulee kiinnittää huomiota sekä algoritmien laskennalliseen tehokkuuteen että ennustustarkkuuteen. Laatuagentti ei ole

”älykäs agentti”.

Tämän lisäksi diplomityössä mitattiin tutkittujen laatuattribuuttien havaittavuutta ja aikakauslehden hyväksyttävää laatutasoa subjektiivisin testein. Testeissä käytettiin viittä eri testikuvaa, jotka edustivat aikakauslehdissä tyypillisesti esiintyviä kuva-aiheita. Tutkittujen attribuuttien havaittavuuden ja hyväksyttävyyden välillä havaittiin voimakas lineaarinen suhde. Terävyyden osalta määritettiin myös preferenssiarvoja eri kuva-aiheille. Preferensseissä havaittiin eroja eri koehenkilöiden ja kuva-aiheiden välillä. Lisäksi subjektiivisten testien tuloksia verrattiin laatualgoritmeilla saatuihin tuloksiin.

Testattujen algoritmien subjektiivisen kuvanlaadun selitysasteet olivat välillä 0,4429 ja 0,7506.

Avainsanat: kuvanlaatu, referenssitön laadunanalyysi, kuva-agentti, terävyys, additiivinen kohina, pakkausvääristymät

(3)

THESIS

Department of Automation and Systems Technology

Author: Mikael Malanin Date: 13.12.2005

Pages: 77

Title of thesis: The quality evaluation of digital images and an image agent -based approach to the selection of print images

Professorship: Media Technology Professorship code: AS-75 Supervisor: Professori Hannu Saarelma

Instructor: DI Mari Laine

The objective of this master’s thesis was to make a short evaluation of agent based programs and the applicability of agents to the control of digital images. New concepts of image agent and quality agent were proposed. The image agent is a program which can be used to find images with specified content and quality. The quality agent is a tool for image quality analysis. The intention was to concentrate especially to the quality agent and its quality algorithms. The algorithms were defined according to the quality attributes under study. These attributes were sharpness, additive noise and compression artefacts. Five different algorithms were tested in the Matlab-environment.

A proposal was made that the concept of the image agent consists of the quality agent, the content agent, indexing, retrieval, an user interface and a database. The quality agent analyzes quality attributes of the database images. The quality value is calculated for each of the attributes and saved to the database. During image retrieval the quality values are used to select the required images. Attention should be paid for the computational efficiency and the accuracy of quality prediction when selecting the algorithms. Quality agent is not an “intelligent agent”.

In addition the perception of the attributes and acceptable quality levels for magazines were

measured by subjective experiments. Five different test images were used and they represented the common themes of images in magazines. A strong linear correlation was detected between the perception and acceptability of the studied attributes. Preference values for sharpness with different image content were also measured. Differences in preference values between different test persons and image contents were detected. The results of the subjective tests were compared with the values calculated by the quality algorithms. The coefficients of determination of quality algorithms for subjective quality varied between 0,4429 and 0,7506.

Key words: image quality, no-reference quality analysis, image agent, sharpness, additive noise, compression artefacts

(4)

Tämä diplomityö on tehty Teknillisen korkeakoulun Viestintätekniikan laboratoriossa vuoden 2005 aikana. Tuolta ajalta jäi paljon hyviä muistoja eri ihmisistä ja tapahtumista ja lisäksi opetuksia tutkimustyön tekemisestä.

Haluaisin kiittää professori Pirkko Oittista mielenkiintoisen aiheen tarjoamisesta, neuvoista ja kannustuksesta. Haluan kiittää työni ohjaajaa DI Mari Lainetta kannustavasta ohjauksesta sekä runsaasta ja hyödyllisestä palautteesta. Lisäksi haluan kiittää työni valvojaa professori Hannu Saarelmaa neuvoista ja kannustuksesta.

Koehenkilötestit olivat tärkeä osa diplomityötäni, kiitos kaikille testeihin osallistuneille. Diplomityön edistymisen kannalta tärkeää oli myös Viestintätekniikan laboratorion hyvä työilmapiiri. Erityisesti haluan mainita omat huonetoverini ja heiltä saamani tuen. Myös opiskelutoverini antoivat useita diplomityöhöni ja sen tekemiseen liittyviä hyödyllisiä neuvoja, ja Turussa olevalta kotiväeltä sain jatkuvaa tukea.

Espoon Otaniemessä 13.12.2005

\VWuxj \VW—

Mikael Malanin

(5)

1 Johdanto... 1

1.1 Tutkimuksen tausta... 1

1.2 Tutkimuksen tavoite ja toteutus... 1

1.3 Tutkimuksen rakenne...2

2 Kuvanlaatu... 2

2.1 Määritelmä ja mittaaminen... 2

2.2 Kuvanlaatuympyrä ja kuvanlaatuprosessi...4

2.3 Laatuattribuutit... 6

2.4 Kokonaislaatu...9

3 Referenssitön objektiivinen laadunanalyysi... 10

3.1 Määritelmä... 10

3.2 Terävyys... 11

3.3 Kohina... 14

3.4 JPEG-pakkausvääristymät... 16

4 Subjektiivinen laadunarviointi...19

4.1 Johdanto... 19

4.2 Testien suunnittelu...20

4.3 Subjektiiviset tutkimusmenetelmät... 22

4.4 Testitulosten analyysi...23

4.4.1 Järjestys-ja parivertailutestitulosten asettaminen intervalliasteikolle... 23

4.4.2 Regressioanalyysi... 24

5 Agenttiteknologia...25

5.1 Määritelmä...25

5.2 Informaatioagentit... 27

5.3 Agenttipohj aisen j ärj estelmän toteutus... 27

6 Kuvahakukoneet ja kuva-agentti... 28

6.1 Määritelmä... 28

6.2 Piirteiden laskenta ja indeksointi... 28

(6)

7 Tutkimusongelmat, -aineisto- ja -menetelmät... 31

7.1 Tutkimusongelmat... 31

7.2 Tutkimusaineisto... 31

7.2.1 Testikuvien valinta... 31

7.2.2 Testikuvien käsittely... 33

7.2.3 T estikuvien tulostus... 34

7.3 Käytetyt tutkimusmenetelmät...34

7.3.1 Koehenkilöt j a koeympäristö... 34

7.3.2 Subjektiivisten testien kulku... 35

7.3.3 Objektiiviset testit... 36

8 Tulokset... 36

8.1 Terävyys...36

8.1.1 Erojen havaittavuus... 36

8.1.2 Hyväksyttävyys j a preferenssit...40

8.1.3 Laskennalliset algoritmit...43

8.1.4 Objektiivisten ja subjektiivisten mittausten korrelaatio... 45

8.2 Kohina...48

8.2.1 Eroj en havaittavuus... 48

8.2.2 Hyväksyttävyys...52

8.2.3 Laskennalliset algoritmit...54

8.2.4 Objektiivisten ja subjektiivisten mittausten korrelaatio...55

8.3 Pakkausvääristymät...58

8.3.1 Eroj en havaittavuus... 58

8.3.2 Hyväksyttävyys...61

8.3.3 Laskennalliset algoritmit...63

8.3.4 Objektiivisten ja subjektiivisten mittausten korrelaatio...64

8.4 Algoritmien suoritusnopeus...67

8.5 Luotettavuusanalyysi...67

(7)

9 Ehdotus kuva-agentin toteutuksesta...72

9.1 Johdanto...72

9.2 Laatuagentti... 73

9.3 Sisältöagentti... 73

9.4 Kuvahaku...74

9.5 Esimerkki kuvahausta... 75

9.6 Laatuagentin demo...77 LÄHDELUETTELO

LIITTEET

(8)

1 Johdanto

1.1 Tutkimuksen tausta

Tämän tutkimuksen aiheena on digitaalisessa muodossa olevien kuvien laatu, ja laadun valvontaa helpottavat menetelmät. Kuvanlaadun tarkkailu on tarpeellista, koska digitaalisiin kuviin kohdistuu useita laatua heikentäviä häiriöitä kuvauksen, käsittelyn, pakkauksen, tallennuksen ja siirron aikana.

Tällä hetkellä ainoa hyvin toimiva tapa kuvien visuaalisen laadun selvittämiseksi on yhden tai

useamman henkilön suorittama subjektiivinen arvio. Käytännössä tällainen arviointi on kuitenkin aikaa vievää ja kallista.

Vaihtoehtoinen tapa on objektiivinen arvio, joka perustuu johonkin laskennalliseen algoritmiin.

Tällaiset algoritmit ovat yksinkertaisimmillaan pikselipohjaisia mittoja ja monimutkaisimmillaan ihmisen näköjärjestelmää mallintavia. Lisäksi on saatavilla puhtaasti matemaattisia menetelmiä, jotka perustuvat ennakkotietoon laatuhäiriöiden tyypeistä esimerkiksi jollakin tietyllä pakkausalgoritmilla.

Suuri osa laskennallisista algoritmeista keskittyy yksittäisen laatutekijän eli -attribuutin, kuten kohinan tai terävyyden ennustamiseen. Sen sijaan kokonaisvaltaista laatua ennustavia menetelmiä on

vähemmän.

Tutkimus on tehty osana Teknillisen korkeakoulun Viestintätekniikan laboratorion projektia

”Kuvatuotannon digitaalisen ohjauksen ja hallinnan kehittäminen”. Projektin kokonaistavoitteena on kasvattaa tietoa prosessi- ja projektiluonteisten kuvatuotantoketjujen ohjauksesta sekä osaamista kuvainformaation semanttisten piirteiden laskennasta. Projektin teollinen tavoite on kuvatuotannon tehokkuuden ja kokonaislaadun paraneminen.

1.2 Tutkimuksen tavoite ja toteutus

Tutkimuksessa tehdään lyhyt selvitys agenttipohjaisista ohjelmista ja agenttien soveltumisesta digitaalisten kuvien hallintaan. Tämän jälkeen laaditaan uudet kuva-agentin ja laatuagentin konseptit.

Kuva-agentti on ohjelma, jota voidaan käyttää kuvien hakemiseen niiden laadullisten ja sisällöllisten pirteiden perusteella, ja sen pääasiallinen käyttöliittymä on digitaalinen valopöytä. Kuva-agentin konsepti esitetään yleisellä tasolla ja siihen ei liity yksityiskohtien dokumentointia.

Laatuagentti on ohjelma, joka analysoi kuvan laatua käyttämällä hyväkseen erilaisia

kuvanlaatualgoritmeja. Laatuagentin tuottama tieto mahdollistaa kuvien laatuun perustuvan jaottelun, sekä toimenpide-ehdotusten antamisen, mikäli kuvanlaatu on liian huono johonkin käyttökohteeseen.

Laatuagentti on osa kuva-agentin konseptia, mutta sitä voidaan haluttaessa käyttää myös muihin tarkoituksiin, esimerkiksi laadun tarkkailuun kuvatuotantoketjun aikana.

Tutkimukseen kuuluu selvitys olemassa olevista kuvanlaatualgoritmeista. Tutkitut algoritmit rajautuvat tutkittujen laatuattribuuttien perusteella, jotka ovat terävyys, kohina ja pakkausvääristymät. Tutkimus perustuu pääasiassa kirjallisuusselvitykseen, mutta joitakin algoritmeja kokeillaan myös itse.

(9)

Lisäksi laatuattribuutteja tutkitaan subjektiivisin testein, ja attribuuteille määritetään aikakauslehden vaatima laatutaso. Mittaus tapahtuu sekä kaikille kuville, että yksittäisissä kuvaluokissa. Mitattu laatutaso ilmaistaan numeerisina hälytysrajoina. Kuvaluokka viittaa kuvan sisällölliseen kontekstiin, ja käytetyt kuvaluokat määritetään tutkimuksen yhteydessä.

Käytännössä laatuagentti laskee numeerisen arvon jokaiselle toteutetulle laatuattribuutille. Näin saatua laatuarvoa voidaan kuvia haettaessa verrata käyttökohteelle määriteltyyn vaatimustasoon kyseisen laatuattribuutin osalta. Mahdollisia käyttökohteita ovat aikakauslehtien lisäksi esimerkiksi WWW-sivu tai sanomalehti. Laatuagentista toteutetaan Matlab-ympäristössä toimiva demo.

Tutkimuksen tutkimuskysymykset ovat seuraavat:

Millainen on kuva-agentin konsepti?

Millaisia laskenta-algoritmeja on olemassa tutkimuksen kohteena olevien laatuattribuuttien mittaamiseen, ja miten ne soveltuvat laatuagenttiin?

Miten laatuhäiriöt (pakkausvääristymät, kohina, epäterävyys) ovat subjektiivisesti havaittavissa, ja millaiset ovat laatuhäiriöiden hälytysrajat aikakauslehdessä sekä kaikille kuville että kuvaluokittain?

1.3 Tutkimuksen rakenne

Luvussa 2 käsitellään kuvanlaadun määritelmää ja sisältöä. Luvuissa 3 ja 4 kerrotaan objektiivisista ja subjektiivisista menetelmistä kuvanlaadun mittaukseen. Luvuissa 5 ja 6 kerrotaan agenteista, sekä niiden soveltamisesta kuvien analysoimiseen. Luvut 7 ja 8 sisältävät työn kokeellisen osuuden, jossa kerrotaan käytetyistä tutkimusmenetelmistä ja tuloksista. Luvussa 9 esitetään ehdotus kuva-agentin konseptiksi sekä laatuagentin demo.

2 Kuvanlaatu

2.1 Määritelmä ja mittaaminen

Kuvilla on tärkeä merkitys painotuotteissa, mutta niiden onnistunut käyttö vaatii käyttökohteeseen soveltuvaa laatutasoa. Yksi tämän työn aiheista on kuvanlaadun mittaaminen, mutta sitä ennen on syytä tarkastella lähemmin, mitä laadulla kuvien yhteydessä tarkoitetaan. Kuvanlaatua ei voida määritellä yksikäsitteisesti, sillä sekä ”kuva” että ”laatu” voidaan ymmärtää monella eri tavalla.

Perinteisesti laatu on kuvien yhteydessä määritetty signaalinkäsittelynäkökulmasta, ja sillä on tarkoitettu samankaltaisuutta käsitellyn ja alkuperäisen kuvan välillä (Ridder & Endrikhovski 2002).

Laatu voidaan kuitenkin ymmärtää myös laajemmin, ja esimerkiksi Janssenin (1999, s. 78) mukaan määrittää seuraavalla tavalla: ”miten tarkasti jokin asia tyydyttää sille asetetut vaatimukset”. Jos laatu ymmärretään näin, silloin kuvanlaatu riippuu siitä, mitä tarkoitetaan kuvilla, mihin niitä käytetään, ja mitä vaatimuksia noille käyttötarkoituksille on. Esimerkiksi röntgenkuvista tai mainosjulisteista puhuttaessa sekä itse kuvat että niiden käyttötarkoitukset ja käyttövaatimukset ovat hyvin erilaiset.

(10)

Kuvanlaatua voidaan lähestyä myös arvioinnin näkökulmasta, jolloin voidaan tehdä jako objektiiviseen ja subjektiiviseen laatuun. Objektiivinen laatu perustuu kuvanlaadun fysikaaliseen mittaamiseen, subjektiivinen laatu perustuu ihmisten tekemiin arvioihin. (Engeldrum 2000)

Objektiivinen kuvanlaadunarviointi voi olla laatumääritelmästä riippuen joko vertailua

originaalikuvaan tai perustua joihinkin fysikaalisiin suureisiin, jolloin on kyseessä referenssitön eli sokea laadunanalyysi (Engeldrum 1999). Ensimmäisessä tavassa kuvan laadukkuutta mitataan sen perusteella, kuinka lähellä se on originaalikuvaa. Toisessa tavassa laatua arvioidaan suoraan joidenkin määrättyjen attribuuttien perusteella. Tämän työn kohdalla kuvanlaatua arvioidaan jälkimmäisellä tavalla. Kuvatietokannassa olevista kuvista ei ole olemassa originaalikuvia, joiden perusteella laatua voitaisiin arvioida.

Objektiivinen laadunarviointi voidaan käytännössä tehdä kolmella eri tavalla. Ensimmäinen tapa on käyttää pikselipohjaisia mittoja, kuten keskineliöpoikkeamaa (mean square error MSE), signaali- kohinasuhdetta (signal to noise ratio SNR) tai huippu-signaali-kohinasuhdetta (peak signal to noise ratio PSNR). Toinen tapa ovat erilaiset ennakko-oletuksiin pohjaavat matemaattiset menetelmät, jotka hyödyntävät olemassa olevaa tietoa pakkausalgoritmeista ja erityyppisistä vääristymistä. Kolmas tapa on ottaa huomioon myös ihmisen näköjärjestelmän ominaisuuksia, kuten spatiotemporaalinen

kontrastinherkkyysfunktio (Pappas & Saffanek 2000; Winkler 2005). Eri laadunarvioinnin tavat sisältävät menetelmiä sekä referenssilliseen että referenssittömään analyysiin, mutta useimmiten referenssittömän laadunanalyysin menetelmät ovat ennakko-oletuksiin perustuvia matemaattisia menetelmiä.

Pikselipohjaiset mitat ovat houkuttelevia kahden seikan vuoksi. Ne on yleensä helppo laskea, joten ne vaativat vain vähän laskentatehoa. Toiseksi ne ovat riippumattomia katseluolosuhteista ja yksittäisistä katsojista. Katseluolosuhteet vaikuttavat suuresti subjektiivisiin arvioihin, mutta erilaisia

katseluolosuhteita voi olla rajattoman paljon, mikä tekee niiden huomioon ottamisen vaikeaksi. Lisäksi katseluolosuhteista on vain harvoin saatavissa tarkkaa tietoa. (Wang & Bovik 2002) Pikselipohj aisten mittojen huono puoli on, että koska ne eivät ota lainkaan huomioon näköjärjestelmän ominaisuuksia ja katseluolosuhteita, niiden antamat tulokset ovat epätarkkoja. Menetelmät eivät ota huomioon sitä, että kuvissa esiintyvien häiriöiden havaittavuus riippuu niiden kontekstista. Kaksi kuvaa, jotka PSNR arvojensa perusteella ovat yhtä laadukkaita, saattavat subjektiivisessa arviossa erota huomattavasti toisistaan. (Winkler 2005).

Ennakko-oletuksiin pohjaavat matemaattiset menetelmät, jotka hyödyntävät vääristymistä olemassa olevaa tietoa antavat yleensä tarkempia tuloksia kuin pikselipohjaiset menetelmät, mutta ovat silti laskentatehokkaita. Esimerkiksi JPEG-pakatuista kuvista tiedetään, että blokkirajat esiintyvät aina kahdeksan pikselin välein. Näiden menetelmien huonona puolena on niiden huono yleistettävyys.

(Winkler 2005) JPEG-kuvien analyysiin tarkoitettu menetelmä ei sovellu PNG-kuvan laadunarviointiin. Yksittäisistä menetelmistä kerrotaan lisää luvussa 3.

Näköjärjestelmän huomioon ottavat menetelmät ovat laskennallisesti raskaita, mutta

katseluolosuhteiden moninaisuuden ja ihmisen näköjärjestelmän huonon tuntemuksen vuoksi ne eivät

(11)

perinteisesti ole antaneet juurikaan tarkempia tuloksia kuin muut menetelmät (Martens & Meesters 1998). Niiden kehitystyö on kuitenkin jatkuvasti meneillään, ja tuloksiin on odotettavissa parannusta.

Näissä menetelmissä on yleensä ainakin osa seuraavista vaiheista: väriprosessointi, kanavaerottelu, kontrastinherkkyys, maskaus ja yhdistäminen. Menetelmät voidaan jakaa yksikanavaisiin ja monikanavaisiin menetelmiin joiden erona on, että yksikanavaisista menetelmistä puuttuu kanavaerottelu ja usein myös maskaus. (Winkler 2005)

Väriprosessointi tarkoittaa käytännössä väriavaruuden muunnosta tai kirkkauden säätöä. Värimuunnos tapahtuu normaalisti sellaiseen väriavaruuteen, jossa on erotettuna luminanssi- ja kaksi

vastavärikanavaa. Tämä vastaa ihmisen näköjärjestelmässä tapahtuvaa käsittelyä. Kanavaerottelu tarkoittaa sitä, että kuvasignaali jaetaan tiettyjä spatiaalitaajuuksia sisältäviin kaistoihin. Ihmisen kontrastinherkkyys vaihtelee eri spatiaalitaajuuksilla, ja tämän vuoksi taajuuksia kannattaa käsitellä erikseen. Kontrastinherkkyys on lisäksi suurempi luminanssille kuin vastaväreille. Kontrastinherkkyys eri taajuuksille huomioiden voidaan ihmiselle näkymätön kuvainformaatio karsia. Seuraavaksi

kuhunkin kanavaan sovelletaan sopivaa maskia. Maskauksen avulla pyritään huomioimaan kontekstin vaikutus erilaisten häiriöiden, kuten kohinan, näkyvyyteen. Maskauksen jälkeen yksittäisillä kanavilla esiintyviä häiriöitä voidaan mitata ja lopuksi yhdistää eri kanavilta lasketut häiriöt yhdeksi

laatuluvuksi. (Winkler 2005)

Yksi esimerkki näköjärjestelmäpohjaisesta mallista on Dalyn (1993) esittämä VDP-malli (Visible Differences Predictor), jonka avulla voidaan tutkia kahden kuvan välillä olevia eroja. VDP-malli sisältää kolme pääkomponenttia, jotka ovat: 1. amplitudinen epälineaarisuus (näköjärjestelmän adaptoituminen eri valaistusolosuhteisiin), 2. kaksiulotteinen kontrastinherkkyysfunktio (visuaalinen herkkyys spatiaalitaajuuksien funktiona) ja 3. havaitseminen (maskaus funktio, psykometrinen funktio ja summaus). Tämä malli on kohtalaisen tunnettu.

Toinen esimerkki on Fairchildin & Johnsonin (2002) esittämä iCAM-viitekehys värikuvien välisille eroille. Mallin pohjana on S-CIELAB, joka yhdistää perinteiset värierokaavat ja näköjärjestelmän spatiaaliset ominaisuudet huomioivan esisuodatuksen (Zhang &Wandell 1996). iCam-viitekehyksessä on tämän lisäksi myös muita esisuodatusvaiheita, kuten spatiaalinen taajuusadaptointi, spatiaalinen lokalisointi ja lokaali kontrastin havaitseminen.

2.2 Kuvanlaatuympyrä ja kuvanlaatuprosessi

Engeldrum (1999) on esittänyt ”kuvanlaatuympyräksi” kutsumansa mallin, joka pyrkii kokoamaan kaikki kuvanlaatuun liittyvät alueet ja käsitteet yhteen viitekehykseen, ja yhdistää toisiinsa

objektiivisen ja subjektiivisen laadun. Malli on esitetty kuvassa 1.

(12)

Kuvanlaa- tumallit

Järjestel­

mämallit Visuaaliset

algoritmit Subjektiiviset

havainnot (laatuattribuutit)

Subjektiivinen kokonaislaatu

Teknologiset attribuutit

Kuvan fysikaaliset

attribuutit

Kuva 1. Kuvanlaatuympyrä (Engeldrum 2002)

Kuvanlaatuympyrän ideana on osoittaa teknologisten muuttujien ja kuluttajien kokeman

kokonaislaadun välinen yhteys. Mallia voidaan kulkea myötäpäivään, ja jokainen laatikko kuvaa mitattavissa olevia attribuutteja. Teknologiset attribuutit ovat kuvajäijestelmän teknisiä ominaisuuksia, kuten resoluutio tai paperin tyyppi. Kuvan fysikaaliset attribuutit ovat ominaisuuksia kuten densiteetti tai värit. Laatuattribuutit kuvaavat kuvaa katsovan henkilön havaintoa kuten terävyys tai rakeisuus.

Subjektiivinen kokonaislaatu muodostuu yksittäisistä laatuattribuuteista, ja sitä kuvataan intervalliskaalalla olevalla numeroarvolla, esimerkiksi välillä 0-100.

Mallissa olevat ellipsit kuvaavat eri attribuuttien välillä olevia malleja, joiden avulla voidaan ennustaa yhden laatikon attribuutteja toisen laatikon attribuuttien perusteella. Järjestelmämallit ennustavat kuvien fysikaalisia attribuutteja teknologisten attribuuttien avulla. Tällainen malli voi esimerkiksi ennustaa kuvan kontrastia tulostimen mustetason perusteella.

Visuaaliset algoritmit ennustavat havaittuja laatuattribuutteja kuvan fysikaalisten attribuuttien perusteella. Esimerkiksi havaittua terävyyttä voidaan ennustaa erilaisten kuvadataa analysoivien algoritmien perusteella. Kuvanlaatumallit ennustavat kuvan havaittua kokonaislaatua yksittäisten laatuattribuuttien perusteella. Tässä työssä pyritään esittämään menetelmä kokonaislaadun

ennustamiseen kuvan fysikaalisten attribuuttien perusteella, joten työn kannalta olennaisia ovat ennen kaikkea visuaaliset algoritmit ja kuvanlaatumallit.

Kuvanlaatua voidaan tarkastella myös prosessina. Laatu ei ole vakio, vaan se vaihtelee kuvaprosessin eri vaiheissa. Laadukaskin digitaalinen kuva näyttää tulostettuna huonolta, mikäli käytetty tulostin ja

(13)

paperi ovat sopimattomia. Lisäksi käyttökontekstit kuvaprosessin eri vaiheissa vaihtelevat.

Kuvanlaatua on tarkasteltu prosessinäkökulmasta kuvassa 2.

tulostaminen

havaitseminen kuvaaminen

käsittely

prosessoitu kuva: FP kuvauskohde: Fa

havaittu kuva: Fh kuvattu kuva: Fk

tulostettu kuva: Ft

järjestelmämallit

visuaaliset algoritmit

Kuva 2. Kuvanlaadun prosessinäkökulma

Tässä työssä tutkitaan menetelmiä havaitun kuvan Fh laadun ennustamiseksi tulostamattoman kuvan Fp perusteella, kun tulostus- ja havaitsemisolosuhteet ovat ennalta määrätyt. Tulostusmenetelmänä on aikakauslehtipainatuksen simulaatio, ja katseluolosuhteet jäljittelevät normaalia lehdenlukutilannetta.

2.3 Laatuattribuutit

Kuten edellisessä kappaleessa todettiin, laatuattribuutit ovat kuvaa katsovan henkilön yksittäisiä laatuhavaintoja, kuten terävyys tai rakeisuus. Yksittäiset laatuattribuutit eivät kerro kuvan kokonaislaatua, mutta niitä yhdistämällä myös sitä voidaan ennustaa.

Eräs tapa tarkastella yksittäisiä laatuattribuutteja on Keelanin (2002) esittämä jaottelu kolmen eri kriteerin suhteen:

1. attribuutin riippuvuus arvionäkökulmasta, 2. attribuutin luonne ja

(14)

3. attribuutin riippuvuus kuvaj ärj estelmän ominaisuuksista.

Arvionäkökulmia ovat primäärinen, sekundaarinen ja tertiäärinen. Kun valokuvaaja arvioi itse ottamaansa valokuvaa, kyseessä on primäärinen arvio. Sekundaarinen arvio on kyseessä, kun valokuvan kohde arvioi kuvaa. Tertiäärinen arvio on kyseessä silloin, kun arvioija ei ole itse ollut lainkaan osallinen kuvaustapahtumaan. Kaikissa kolmessa tapauksessa arvioijan suhde kuvaan on erilainen, ja siksi myös arvion tulokset ovat odotettavasti erilaisia. Primäärisiä ja sekundaarisia arvioita voidaan kuitenkin usein tarkastella yhtenä kokonaisuutena ja puhua pelkästään primäärisestä arviosta.

Tertiääriseen arvioon verrattuna primääristä arviota on vaikeaa ennustaa. Tämän tutkimuksen osalta olennainen on tertiäärinen arvio. Aikakauslehden ja minkä tahansa joukkoviestimen kuvia koskevat arviot kuuluvat pääasiassa tähän ryhmään.

Attribuutin luonne kertoo sen soveltuvuudesta objektiiviseen arviointiin. Eri luonnetyyppejä ovat henkilökohtainen, esteettinen, artefaktuaalinen tai mieltymys. Näistä henkilökohtaiset attribuutit soveltuvat objektiiviseen arviointiin kaikkein huonoiten, koska ne ovat täysin riippuvaisia arvion suorittajasta. Esimerkiksi valokuvan onnistuneisuus tietyn muiston taltioinnissa on henkilökohtainen attribuutti. Henkilökohtaiset attribuutit vaikuttavat vahvasti primääriseen ja sekundaariseen arvioon, mutta eivät juurikaan tertiääriseen.

Esteettiset attribuutit liittyvät kuvien esteettisiin ominaisuuksiin. Ne soveltuvat jossain määrin objektiiviseen arviointiin, vaikka on olemassa useita eri näkökulmia siitä, millainen on esteettisesti onnistunut valokuva. Kuitenkin valaistuksen ja asettelun suhteen ollaan melko yksimielisiä.

Valokuvauskonventioiden johdosta suurin osa ihmisistä pitää esteettisesti onnistuneina sellaisia kuvia, jotka täyttävät vähintään yhden seuraavista ehdoista: 1. pääkohde ei sijaitse aivan kuvan keskellä, 2.

kameran orientaatio kuvastaa kohteen muotoa, 3. pääkohde on tarpeeksi suuri näkyäkseen riittävän tarkasti. Esteettiset näkökohdat vaikuttavat sekä primääriseen että tertiääriseen arvioon, mutta eivät välttämättä samalla tavoin.

Attribuutit voivat olla luonteeltaan myös artefaktuaalisia, eli kuvaj ärj estelmän puutteiden aiheuttamia häiriöitä, kuten epäterävyys, kohina, punasilmäisyys ja pakkausvääristymät. Artefaktuaalisille

attribuutille on ominaista, että jos pystytään luomaan objektiivinen asteikko, joka korreloi positiivisesti attribuutin kanssa, alhaisilla arvoilla attribuuttia ei havaita lainkaan ja havaitsemiskynnyksen jälkeen arvioitu kuvanlaatu laskee attribuutin arvon kasvaessa. Artefaktuaaliset attribuutit vaikuttavat samalla tavoin sekä primääriseen että tertiääriseen arvioon ja soveltuvat parhaiten objektiiviseen arviointiin.

Myös tässä tutkimuksessa kuvailtu laatuagentti keskittyy arvioimaan artefaktuaalisia attribuutteja.

Attribuutti voi lisäksi olla luonteeltaan mieltymysattribuutti. Mieltymysattribuuteilla on optimaalinen arvo, joka riippuu arvioijan mieltymyksistä ja kuvan sisällöstä. Kontrasti on esimerkki

mieltymysattribuutista. Jotkut ihmiset pitävät suuresta kontrastista, kun taas toiset vähäisemmästä, vaikka kyseessä olisi sama kuva. Myös värien-ja sävyjentoisto ovat mieltymysattribuutteja. Jos mieltymysattribuutille halutaan määrittää yleispätevä optimaalinen arvo, se on kuvattava tilastollisena jakaumana. Mieltymysattribuutit vaikuttavat sekä primääriseen että tertiääriseen arvioon, mutta eivät

välttämättä samalla tavalla. (Keelan 2002)

(15)

ominaisuuksista, ja ovatko ne näin ollen järjestelmän suunnittelijoiden kontrolloitavissa.

Kuvajärjestelmällä tarkoitetaan tässä ketjua, joka alkaa kuvantaltiointivälineistä, kuten kamera, ja päättyy kuvantoistovälineisiin, kuten näytöt tai painoviestimet. Näiden vaiheiden välillä on useita välivaiheita, kuten käsittelyalgoritmeja ja painatustekniikkaa. Esimerkiksi kohina on attribuutti, joka riippuu kuvaj äij estelmän ominaisuuksista. Kohinaa voi syntyä sekä kuvan taltiointi, käsittely, että tulostusvaiheessa. (Keelan 2002)

Taulukkoon 1 on listattu eri kuvanlaatuattribuutteja ryhmiteltynä luonteen mukaan ja arvioituna asteikolla: -1, 0 tai +1 kolmen eri ominaisuuden suhteen.

1. soveltuvuus objektiiviseen kuvaukseen: +1 = suoraviivainen, 0 = vaikea, -1 = hyvin hankala 2. primäärisen ja tertiäärisen arvion suhde: +1 = vahva korrelaatio, 0 = osittainen korrelaatio, -1 = ei korrelaatiota

3. riippuvuus kuvaj ärj estelmästä: +1 = vahva riippuvuus, 0 = jonkinlainen riippuvuus, -1 = ei riippuvuutta

Laatuattribuutin yhteispistemäärä kertoo, kuinka hyvin se soveltuu objektiiviseen laatuarviointiin.

Taulukko 1. Joukko laatuattribuutteja ja niiden ominaisuuksia (Keelan 2002)

attribuutti

soveltuvuus objektiiviseen

arviointiin

primäärisen ja tertiäärisen

arvion suhde

kuvajärjes-

telmäriippuvuus yhteensä

artefaktuaalinen

terävyys +1 +1 +1 +3

rakeisuus +1 +1 +1 +3

punasilmäisyys +1 +1 +1 +3

digitaaliset artefaktit +1 +1 +1 +3

mieltymys

väritasapaino +1 +1 +1 +3

kontrasti +1 0 +1 +2

värikkyys (värikylläisyys) +1 0 +1 +2

muistivärien toisto +1 0 +1 +2

esteettinen

valaistus 0 0 0 0

sommittelu 0 0 0 0

henkilökohtainen

muiston taltiointi -1 -1 -1 -3

kohteen ydinasian taltiointi -1 -1 -1 -3

(16)

Parhaiten objektiiviseen laatuarviointiin soveltuvat kaikki artefaktuaaliset attribuutit, eli terävyys, rakeisuus, punasilmäisyys ja digitaaliset artefaktit, sekä mieltymysattribuuteista väri tasapaino.

Nämäkään eivät kuitenkaan ole täysin riippumattomia esimerkiksi esteettisistä näkökohdista.

Esimerkiksi terävyyden säätö on yleisesti valokuvauksessa käytetty tyylikeino. Terävyyttä säätelemällä vaikutetaan esimerkiksi siihen, mihin katsoja kiinnittää valokuvassa huomiota.

Eri laatuattribuutit eivät ole välttämättä toisistaan riippumattomia, vaan yhden attribuutin

havaitseminen saattaa olla riippuvainen toisesta attribuutista. Tämä ongelma voidaan jakaa kahteen osaan:

- Attribuuttien välillä oleva vuorovaikutus, eli miten yksi attribuutti vaikuttaa toisen attribuutin havaitsemiseen. Esimerkiksi rakeisuus vaikeuttaa terävyyden havaitsemista.

Kokonaislaadun ennustaminen yksittäisten attribuuttien havaitsemisen perusteella.

Näistä kahdesta ongelmasta ensimmäinen on monimutkaisempi. Käytännössä attribuuttien välillä on kuitenkin vain vähän sellaisia interaktioita, jotka ovat havaitsemisen kannalta merkittäviä. Erityisesti tämä koskee artefaktuaalisia attribuutteja. Koska kuvanlaatuun vaikuttavia attribuutteja on suuri määrä, on ongelmallista toteuttaa testejä, joissa kuvanlaatua tutkitaan varioimalla useita muuttujia kerrallaan.

Testien laajuus kasvaisi liian suureksi.

Riippumattomuus havaitsemisen suhteen ei tarkoita sitä, että attribuuttien välillä ei ole lainkaan

yhteyttä. Kaksi eri laatuattribuuttia saattaa korreloida keskenään, koska turvajärjestelmän ominaisuudet ja prosessit vaikuttavat niihin molempiin. Esimerkiksi epäterävöitys vähentää sekä terävyyttä että

kohinaa. Korrelaatio aiheuttaa vaikeuksia tutkijalle, joka haluaa tutkia yhden attribuutin vaikutuksia havaittuun laatuun, koska on vaikeaa luoda testikuvia, joissa muut attribuutit eivät ole muuttujina.

(Keelan 2002)

Myös Engeldrum (2002) on käsitellyt eri laatuattribuuttien välisiä eroja. Hän jaottelee attribuutteja kahteen ryhmään sen perusteella, voiko niiden ja kuvan kokonaislaadun välistä yhteyttä kuvata

monotonisella vai ei-monotonisella funktiolla. Hänen mukaansa attribuuttien ja kokonaislaadun yhteys on usein monotoninen ja lineaarinen, mutta ei kaikissa tapauksissa. Esimerkiksi saturaatio ja värikkyys ovat attribuutteja, joiden yhteys kokonaislaatuun on ei-monotoninen.

2.4 Kokonaislaatu

Kokonaislaadun ennustaminen yksittäisten attribuuttien perusteella ei ole täysin suoraviivaista. Ennen kokonaislaatua kuvaavan yhtälön muodostamista on ensinnäkin päätettävä millaisessa lukuavaruudessa laatua mitataan. Esimerkiksi Bartleson (1982) käytti intervalliasteikkoa välillä 1-9. (Asteikoista

enemmän luvussa 4.1)

On olemassa useita menetelmiä eri attribuuttien yhdistämiselle. Yksi lähestymistapa on arvioida eri ratkaisuja kustannusfunktion avulla ja valita kustannustehokkain ratkaisu. Jokaisen muuttujan

poikkeama optimista painotetaan, minkä jälkeen muuttujat yhdistetään keskineliön neliöjuurella (RMS, root mean square). Painotus asettaa eri attribuutit samalle mitta-asteikolle. (Keelan 2002)

(17)

RMS-menetelmä on Minkowskin summasäännön erikoistapaus. Minkowskin menetelmä perustuu и:nen juuren ottamiseen л:ten potenssien summasta. Tämä voidaan esittää seuraavan kaavan avulla (Keelan 2002):

A ö«=-

f Л1/и"

Z(-A

в,Ут

V i

(kaava 1) jossa,

A g, on j':n attribuutin aiheuttama laadunmuutos Aßm on kokonaislaadunmuutos

3 Referenssitön objektiivinen laadunanalyysi

3.1 Määritelmä

Referenssitön laadunanalyysi on mittausta, joka tapahtuu ilman vertailukuvaa ja pelkästään mittauksen kohteena olevan kuvan perusteella. Se on ainut käyttökelpoinen menetelmä kun vertailukuvaa ei ole saatavilla. Ihmiselle referenssitön analyysi on luonnollinen tapa analysoida kuvanlaatua (Sheikh ym.

2002).

Koska ihmisen näköjärjestelmän ominaisuuksia ei ymmärretä täydellisesti, suuri osa referenssittömistä menetelmistä perustuu erilaisten ennalta oletettujen vääristymien mittaamiseen ja laatu arvio lasketaan vääristymien suuruuden perusteella. Algoritmista riippumatta menetelmien toimintaperiaate on usein seuraavanlainen (Tong ym. 2004b):

1. Etsitään jokin paikallinen piirre X(i j), jonka ominaisuudet ovat erilaiset häiriöllisen ja häiriöttömän kuvan kohdalla, ja (i,j) on vääristymän sijainti.

2. Arvioidaan X(i,j):n perusteella paikallinen vääristymä Ld(i,j).

3. Lasketaan paikallisten vääristymien keskiarvo koko kuva-alueella ja saadaan globaali vääristymämitta Dm.

4. Globaalin vääristymämitan perusteella ennustetaan ihmisen havaitsemaa kuvanlaatua Ps. Onnistumisen kannalta olennaista on analyysiin soveltuvien paikallisten piirteiden X(i,j) löytäminen ja se miten paikallisia vääristymiä arvioidaan.

Tong. ym. (2005) esittävät hiukan toisenlaisen, oppimiseen perustuvan menetelmän referenssittömään kuvanlaadunanalyysiin. Menetelmän ideana on luoda kaksi testiryhmää, joista toinen on ”heikko”-ja toinen ”hyvänlaatuinen. Seuraavaksi rakennetaan luokittelija, joka pyrkii erottelemaan nämä kaksi ryhmää mahdollisimman kauaksi toisistaan, käyttäen piirteitä kuten terävyys ja blokkisuus. Tämän jälkeen luokittelija voi kertoa kuinka lähellä tai kaukana yksittäinen analysoitava kuva on kumpaakin ryhmää, ja kuvalle saadaan tämän perusteella laatuarvio.

Tässä tutkimuksessa käsitellään kolmea eri laatuattribuuttia, jotka ovat terävyys, kohina ja

pakkausvääristymät. Jokaisen suhteen tutkitaan ainakin yhtä laskennallista menetelmää käytännön

(18)

toteutuksella. Tutkitut menetelmät on valittu kirjallisuuskatsauksen ja toteutettavuuden perusteella.

Toteutettavuudella tarkoitetaan sitä, että algoritmista on ollut riittävän yksityiskohtaista tietoa saatavissa, ja sen toteutus on aikataulun puitteissa ollut mahdollista.

Laatuagentin konseptiin on mahdollista integroida muitakin laatuattribuutteja kuin tässä esitetyt.

Tämän tutkimuksen puitteissa ei kuitenkaan keskitytä enempää muihin mahdollisiin laatuattribuutteihin ja niiden laskennallisiin menetelmiin.

3.2 Terävyys

Termillä terävyys viitataan yleensä vähäiseen pisteen- tai linjanleviämiseen, jolloin epäterävyys on terävyyden vastakohta. Terävyydellä saatetaan joskus viitata myös tangentiaaliseen terävyyteen, jonka vastakohta on rosoisuus. (Katajamäki & Saarelma 1998) Tässä työssä pitäydytään yleiseen

määritelmään.

Matemaattisesti kuvan epäterävöitymistä voidaan kuvata seuraavalla funktiolla (Miyata ym. 1999):

g(x, y) = h(x, y) * fix, y) (kaava 2)

jossa,

g = epäterävä kuva /= terävä kuva

h = pisteenleviämisfunktio (point spread function PSF).

Kuvien terävyys vaihtelee yleensä suuresti kuvan eri alueilla. Tämä johtuu sekä kameroiden optiikasta että valokuvaajan tahdosta. Syvyysterävyyden säätely on valokuvaajien yleisesti käyttämä tyylikeino.

Terävyyden vaihtelun vuoksi terävyyden analysointi on hyvä keskittää ainoastaan kuvan terävimmälle alueelle. (Katajamäki & Saarelma 1998)

Ihmissilmän yksityiskohtien erotuskyky on tarkempi luminanssikanavan kuin kromaattisten sini­

keltaisen ja puna-vihreän kanavan suhteen (Fairchild 1998). Tämän johdosta terävyyttä havaitaan tarkimmin luminanssin suhteen (Owens ym. 1997).

Havaittu terävyys riippuu myös muista laatuattribuuteista. Johnson ym. (2000) tutkivat resoluution, kontrastin, kohinan ja terävöityksen vaikutusta havaittuun terävyyteen varioimalla testikuvia yhtä aikaa usean eri attribuutin suhteen. Käytettyjä resoluutioarvoja olivat 300, 150 ja 100 dpi. Lisätty kohina oli additiivista ja valkoista. Valkoisuus tarkoittaa, että kohinan taajuusspektri on tasainen eli kohina on spatiaalisesti riippumatonta. Kontrastia säädettiin sigmoidilla (S-kirjaimen muotoinen)

exponenttifimktiolla eksponentin arvon ollessa 1,1 ja 1,2. Kuvien terävöitykseen käytettiin Adobe Photoshop -ohjelmiston sharpen-työkalua. Kokeiden perusteella huomattiin, että resoluutio vaikutti eniten havaittuun terävyyteen. Kontrastin lisäyksen huomattiin lisäävän havaittua terävyyttä. Kohinan lisäyksen huomattiin lisäävään havaittua terävyyttä tiettyyn rajaan saakka, ja sen jälkeen vähentävän sitä. Terävöityksen huomattiin lisäävän myös havaittua terävyyttä.

Zhang ym.(2005) tutkivat terävöityksen havaitsemiskynnyksen ja terävyyspreferenssien välistä yhteyttä erisisältöisiä testikuvia käyttäen. Testikuvat olivat luonnollisia henkilö-ja maisemakuvia, ja ne

(19)

tulostettiin ennen testausta. Testikuvia terävöitettiin USM (Unsharp Mask Filter) -menetelmällä.

Koehenkilöitä oli 21 ja erilaisia kuva-aiheita 7. Preferenssejä tutkittiin luokittelulla ja havaintokynnystä MOCS (Method of Constant Stimuli) -menetelmällä, jossa satunnaisesti voimakkuudeltaan varioitua vertailuärsykettä verrataan vakioiseen standardiärsykkeeseen. Havaittiin, että preferenssien

keskihajonta oli kolme - viisi kertaa havaitsemiskynnysten keskihajontaa suurempaa sekä eri

koehenkilöiden, että kuvasisältöjen välillä. Koehenkilöt pitivät yleensä enemmän terävöitetyistä kuin alkuperäisistä kuvista. Preferenssit riippuivat suuresti kuvasisällöstä. Koehenkilöt eivät halunneet ihon ja erityisesti kasvojen olevan kovin teräviä. Sen sijaan rakennusten ja tekstuurien haluttiin olevan hyvin

teräviä.

Terävyyttä voidaan analysoida objektiivisesti useilla eri tavoilla, jotka voidaan karkeasti jakaa taajuus- ja paikka-avaruuden menetelmiin. Perinteisten taajuusmuunnosten lisäksi myös aallokemuunnosta on

alettu soveltamaan terävyyden määrittämiseen. Useimmille menetelmille on yhteistä se, että kuvasta etsitään reuna-alueita, reunapikselien avulla lasketaan paikalliset terävyysarvot joko paikka- tai taajuusavaruutta hyödyntäen ja lopuksi arvot yhdistetään globaaliksi terävyysarvoksi (Katajamäki &

Saarelma 1998).

Tong ym. (2004a) menetelmässä terävyyden mittaaminen perustuu Harr-aallokemuunnokseen ja erilaisten reunatyyppien analyysiin. Reunat voidaan perinteisesti luokitella kolmeen eri ryhmään:

diracrakenne, askelrakenne ja kattorakenne. Askelrakenne voidaan edelleen jakaa A-ja G-

askelrakenteisiin. Jaottelu tehdään sen mukaan, miten pikselien intensiteetti vaihtelee reunojen kohdalla (kuva 3). Katto-ja G-askelrakenteen kohdalla parametri a (0 < a < л/2) kuvaa reunan terävyyttä.

Mitä suurempi a on, sitä terävämpi reuna on kyseessä. Suurin osa tavallisista terävistä kuvista sisältää kaikkia eri reunatyyppejä, mutta mikäli kuva on epäterävä, dirac- ja A-askelrakenteita ei esiinny lainkaan. Tämän lisäksi katto-ja G-askelrakenteet menettävät terävyyttään. Menetelmä tutkii kuvan terävyyttä sillä perusteella, sisältääkö se Dirac-ja A-askelrakenteita. Se havaitsee sekä kameran kohdistusvirheistä että liikkeestä johtuvat epäterävyydet.

(20)

c) A-askelrakenne d) G-askelrakenne Kuva 3. Eri reunatyypit (Tong ym. 2004a)

Dijkin ym. (2002) menetelmässä kuvasta etsitään ensin viivoja ja reunoja, joiden kohdalta lasketaan sen jälkeen gaussinen derivaatta. Vertaamalla tuloksia mallifunktioihin saadaan selville tarkastellun reunan tai viivan leveys ja amplitudi.

Rooms ym. (2002) esittävät aallokemuunnokseen perustuvan menetelmän. Terävyyttä tutkitaan kuvan terävimmistä reunoista, joille lasketaan Lipschitz-eksponentti. Lipschitz-eksponentti kertoo, kuinka tasainen kuva on tietyssä pisteessä, ja sen avulla voidaan laskea gaussisen pisteenleviämisfunktion varianssi.

Caviedes ja Gurbuz (2002) esittävät menetelmän, jossa terävyyttä mitataan reunojen huipukkuutena.

Kuvasta etsitään reunapikselit, ja niiden kohdalla suoritetaan 8x8 pikselin alueilla DCT-muunnos (diskreetti kosinimuunnos). Kunkin DCT-matriisin kertoimista muodostetaan tämän jälkeen kahden muuttujan todennäköisyysfimktio. Todennäköisyysfunktiolle lasketaan huipukkuus, joka kuvaa lokaalia terävyyttä. Globaali terävyys saadaan lokaalien terävyyksien keskiarvona.

Marzilianon ym. (2002) menetelmä perustuu oletukseen siitä, että kuvan tärkeimmät reunat ovat teräviä. Ensin kuvasta haetaan vertikaaliset reunat jollakin reunanhakualgoritmilla. Kynnysarvoa säätelemällä vaikutetaan siihen, että vain tärkeimmät reunat otetaan huomioon, ja kohinaa ja merkityksettömiä reunoja ei huomioida. Tutkimuksesta ei selviä tarkemmin mitä menetelmää ja kynnysarvoa algoritmin toteutukseen on käytetty. Reunojen alku-ja loppukohta on määritetty

lähimmiksi lokaaleiksi intensiteetin maksimi- ja minimikohdiksi horisontaalisuunnassa. Näiden kahden pisteen välinen etäisyys antaa lokaalin terävyysarvon. Globaali terävyys saadaan laskemalla lokaalien terävyysarvojen keskiarvo. Algoritmin toimivuus on testattu jpeg2000-pakatuilla, sekä gaussisesti alipäästösuodatetuilla kuvilla.

(21)

Myös Ong ym. (2003) esittävät menetelmän, joka perustuu reunojen leveyksien laskemiseen

intensiteetin maksimien ja minimien perusteella. Menetelmä kuitenkin eroaa Marzilianon ym. (2002) menetelmästä siinä, että reunojen kohdalta lasketaan gradientti ja leveyttä tutkitaan reunapikselin kasvusuunnassa.

Katajamäki ja Saarelma (1998) esittävät terävyydenanalyysiin menetelmän, joka soveltuu myös kohinan ja pakkausvääristymien arviointiin. Alkuperäistä kuvaa epäterävöitetään, jotta päästäisiin eroon kohinasta. Epäterävöitykseen käytetyt menetelmät ovat mediaani- ja alipäästösuodatus. Lokaalit terävyysarvot lasketaan kuvan luminanssikomponentin reunapikseleistä, jakamalla reunan gradientin itseisarvo reunan kontrastierotuksella. Globaali terävyys lasketaan lokaalien terävyyksien perusteella huomioimalla tietty prosenttiosuus kaikkein terävimmistä reunoista. Menetelmän toimivuutta testattiin sekä 128 x 128 pikselin kokoisilla synteettisillä että 400 x 800 kokoisilla luonnollisilla kuvilla.

Alkuperäisen kuvan lisäksi kustakin kuvasta tehtiin kuusi epäterävöitettyä versiota suodattamalla kuvan jokaista värikanavaa 1-6 pikselin säteisellä gaussisella binomi-alipäästösuodattimella. Tulosten

perusteella havaittiin menetelmän ennustavan hyvin havaittua terävyyttä. Myös Nurminen (2004) on testannut kyseistä menetelmää.

3.3 Kohina

Digitaalisissa kuvissa esiintyy ei-toivottua vaihtelua eli kohinaa, jota voi syntyä sekä kuvan taltioinnin, käsittelyn että tulostuksen aikana. Kohinaa on kolmea eri tyyppiä: additiivista, multiplikatiivista ja impulssikohinaa. Additiivinen kohina on signaalista riippumatonta, multiplikatiivinen kohina signaaliriippuvaista. Impulssikohina puolestaan tarkoittaa tilannetta, jossa yksittäinen kuvapikseli poikkeaa merkittävästi ympäristöstään, esimerkiksi näytössä olevan vian vuoksi. Impulssikohinaa kutsutaan myös nimellä ”suola ja pippuri -kohina”. (Bernstein 1987)

Matemaattisen yksinkertaisuuden vuoksi kohinan suhteen tehdään usein oletus, että kuvassa esiintyvä kohina on additiivista nollakeskiarvoista Gaussista kohinaa, ja lisäksi valkoista. Valkoisuus tarkoittaa, että kohinan taajuusspektri on tasainen eli kohina on spatiaalisesti riippumatonta. (Katajamäki &

Saarelma 1998) Kohinaa sisältävää kuvaa g voidaan tällöin kuvata seuraavalla yhtälöllä (Miyata 1995):

g{x, У) = /(*, y) + n(x, y) (kaava 3)

jossa,

f= kohinaton kuva ja n = additiivinen kohina.

Kohinan mittaamiseen on olemassa useita eri menetelmiä. Yksinkertaisin tapa on jokin ensimmäisen kertaluvun tilastollinen suure kuten keskihajonta tai varianssi (Katajamäki & Saarelma 1998).

Kayargadde ja Martens (1996) tutkivat, miten ihmisen havaitsema kohina riippuu attribuuteista kuten kohinan keskihajonta, kohinan kaistanleveys ja kuvan keskimääräinen luminanssi. Heidän mukaansa havaittuun kohinaan vaikutti eniten kohinan keskihajonta, ja muut parametrit vaikuttivat vain vähän.

Tämän vuoksi keskihajontaa ja varianssia voidaan pitää hyvinä mittareina havaitulle kohinalle.

(22)

Jotta kohinan varianssia voitaisiin mitata luonnollisista kuvista, niistä on ensin löydettävä alue, jonka kuuluisi olla tasainen tai ne on esisuodatettava. Suodattamalla pyritään poistamaan kuvaan oikeasti kuuluva rakenne. Suodatetusta kuvasta voidaan tämän jälkeen laskea varianssi. Esimerkiksi

Immerkaerin (1995) menetelmä perustuu siihen, että kuva suodatetaan kahden Laplace-suotimen erotuksella N:

N = 2(L2-L{) = 1 -2

1 jossa,

A =

l2=- 2 2

-2 4 -2

1 -2

1

0 1 0 1 -4 1 0 1 0

1 0 1 0-4 0 1 0 1

(kaava 4)

Kuvan varianssi voidaan laskea seuraavan kaavan mukaan:

_______ 1_______

36(tV - 2)(H - 2) X(I(x,y)*N)2 jossa,

W= kuvan leveys pikseleinä H = kuvan korkeus pikseleinä

* = konvoluutionotaatio

(kaava 5)

Käytännössä kohinan taajuusspektri vaihtelee kuvasta toiseen, ja myös taajuusalueella, jonka ihmissilmä erottaa. Menetelmät, joissa kuva ennen kohinan analyysia suodatetaan saattavat antaa virheellisiä tuloksia, jos oletus kohinan laadusta ei pidä paikkansa. Tämä koskettaa myös Immerkaerin (1995) menetelmää, joka kuitenkin antaa Katajamäen ja Saarelman (1998) mukaan hyvin tarkkoja tuloksia, jos kohina todella on additiivista valkoista kohinaa. Menetelmä on myös laskennallisesti nopea, ja soveltuu sen vuoksi hyvin automaattiseen laadunanalyysiin, jossa käsitellään suuria kuvatietokantoja. Sitä päätettiin siksi testata myös tässä tutkimuksessa.

Kohinan visuaalinen havaittavuus riippuu kuvan rakenteesta. Kohina näkyy sitä paremmin, mitä tasaisempi tausta kuvassa on. Runsas tekstuuri sen sijaan peittää hyvin kohinaa. (Winkler & Süsstrunk 2004) Luonnollisissa kuvissa kohinan määrä myös yleensä vaihtelee kuvan eri kohdissa, erityisesti eri kirkkausalueilla (Katajamäki & Saarelma 1998). Tämän vuoksi keskihajonta ja varianssi eivät voi kuvastaa täydellisesti ihmisen havaitsemaa kohinaa. Tarkempia tuloksia saadaan monimutkaisemmilla menetelmillä ja jäljittelemällä ihmisen näköjärjestelmää.

(23)

Matsuin (2003) menetelmä esittää matemaattisen mallin ihmisen näköjäijestelmästä, jossa subjektiivinen laatu nähdään yhteistyönä silmien kuvanhavaintomekanismien ja aivojen

kuvankäsittelymekanismien välillä. Malli pyrkii ottamaan huomioon katseluolosuhteet ja katseltavan kuvan sisällön. Mallissa on neljä osaa, jotka vastaavat silmän optista systeemiä, verkkokalvoa, aivojen näkökeskusta ja katseluolosuhteisiin mukautumista. Menetelmää on testattu analyyttisilla testikuvilla, jolloin korrelaatio subjektiivisten testien kanssa oli >0,96.

Damera-Venkata ym. (2000) esittää kohinan mittaamiseen näköjärjestelmäpohjaisen mallin, joka huomioi kontrastinherkkyyden eri taajuuskaistoilla ja katseluetäisyyksillä, lokaalien luminanssien vaihtelun, eri spatiaalitaajuuksien kontrastien vuorovaikutuksen, sekä maskauksen.

Kohinan mittaamiseen on myös alettu hyödyntämään aallokemuunnosta. Esimerkiksi Luo (2004) esittää kohinan arvioimiseksi fast lifting aalloke -algoritmiin perustuvan menetelmän, joka pyrkii huomioimaan ihmisen näköjärjestelmän ominaisuudet. Kuva hajotetaan spatiaalitaajuuksien

perusteella eri osakaistoihin. Kuvan rakenne on pääosin osakaistojen suurissa kertoimissa, ja kohina pienissä kertoimissa. Jokaista osakaistaa käsitellään erikseen, ja tietyn kynnysarvon alittavat kertoimet määritetään kohinaksi. Kokonaiskohina saadaan laskemalla yhteen eri osakaistojen kohina ja

painottamalla niitä eri kertoimilla. Kohina on vallitsevampaa korkeataajuuksisissa komponenteissa, ja tämän vuoksi niitä painotetaan mataliin taajuuksiin nähden. Kokeelliset tulokset osoittivat Luon mukaan vahvaa korrelaatiota menetelmällä toteutettujen objektiivisten mittausten ja subjektiivisten arvioiden välillä. Myös Portilla (2004) esittää aallokeavaruutta hyödyntävän menetelmän, joka soveltuu sekä kohinan mittaamiseen että poistamiseen. Menetelmien käytännön toteutus ei ollut tämän työn aikataulun puitteissa mahdollista, ja niitä ei sen vuoksi toteutettu.

3.4 JPEG-pakkausvääristymät

Eri palkkausalgoritmit aiheuttavat erityyppisiä vääristymiä, jotka kaikki johtuvat informaation katoamisesta. Tässä tutkimuksessa keskitytään JPEG-algoritmin aiheuttamiin vääristymän, koska JPEG-pakkaus on tällä hetkellä ylivoimaisesti käytetyin luonnollisten kuvien pakkausmenetelmä. Se ottaa huomioon ihmisen näköjärjestelmän ominaisuudet ja soveltuu hyvin luonnollisille kuville, mutta heikommin grafiikalle ja tekstille. JPEG-pakkaus sisältää sekä häviöllisiä että häviöttömiä vaiheita, ja kuvan laatuja tiivistyssuhde ovat säädettävissä. Ihmissilmälle näkymätöntä informaatiota hävitetään kokonaan. Luonnollisilla kuvilla tiivistyssuhde on yleensä 5 - 50.

JPEG-pakkauksessa on seuraavat vaiheet (Wallace 1991, ITU-T 1992):

1. Kuvan muunto RGB-väriavaruudesta YCbCr-väriavaruuteen (ei pakollinen vaihe) 2. Kromaattisten kanavien alinäytteistys

3. Kuvan jako 8x8 osakuviin

4. DCT-muunnos (Discrete Cosine Transform) osakuvittain 8x8 pikselin muunnosytimellä 5. DCT-kertoimien kvantisointi

6. Zigzag-skannaus

(24)

7. Juoksunpituuskoodaus 8. Huffman-koodaus

Informaatiota katoaa JPEG-pakkauksen yhteydessä sitä enemmän, mitä suurempi pakkausaste on käytössä, ja myös kuvan visuaalinen laatu kärsii pakkausasteen kasvaessa. Visuaalisen laadun kärsiminen esiintyy kuvassa objekteina, joita kutsutaan pakkausvääristymiksi. Selkeästi havaittavat pakkausvääristymät voivat olla hyvin ongelmallisia ja jopa estää kuvan hyödyntämisen. (Häme 2005) Pakkausvääristymiä on useaa eri tyyppiä. Kuvissa olevilla tasaisilla pinnoilla epäjatkuvuudet voidaan havaita tummuustason äkillisinä muutoksina blokkirajojen kohdalla, vaikka alkuperäisessä kuvassa tummuuden muutos olisi ollut tasainen, (kuva 4) Tämä aiheutuu siitä, että DCT-muunnoksessa blokin nollatajuuskomponentti edustaa blokin keskimääräistä intensitettitasoa, ja kun nollataajuuskomponentti kvantisoidaan, vierekkäisten blokkien välille voi syntyä vääristymänä ilmenevä ero. Hyvin korkeilla pakkasasteilla kvantiso inti tasojen välinen suuri ero aiheuttaa laajoja yhtenäisiä väripintoja, joiden välillä on selkeät rajat. (Häme 2005)

Kuva 4. Alkuperäisen kuvan tasainen muutos ja pakatun kuvan portaittainen muutos (Häme 2005).

Myös terävät reunat aiheuttavat ongelmia JPEG-pakkauksen yhteydessä. Suurien taajuuksien poisto aiheuttaa reunojen suttaantumista, sillä korkeat taajuudet eivät ole vaimentamassa käytettyjen pienien taajuuksien aiheuttamaa jälkeä, (kuva 5) (Häme 2005)

Kuva 5. Alkuperäinen teräväreunainen kuva ja pakattu vääristymiä sisältävä kuva (Häme 2005)

(25)

Hyvin suurilla pakkasasteilla vääristymät saavat yhä moninaisempia piirteitä. Niitä kuitenkin yhdistää vierekkäisten pikselien samankaltaisuus blokin sisällä ja epäjatkuvuus blokkien välillä, (kuva 6) (Häme 2005)

Kuva 6. Vääristymien moninaisuutta pakkausasteen kasvaessa (Häme 2005) Pakkausvääristymien arviointiin on olemassa useita erilaisia menetelmiä, joista osa perustuu

referenssikuvan käyttöön ja osa on referenssittömiä. Ensin mainittuja menetelmiä ovat muun muassa keskineliön neliöjuuri (Root Mean Square, RMS) ja rakenteellinen samankaltaisuus (Measure of Structural Similarity, SSIM) (ks. Wang ym. 2004). Jälkimmäisiin menetelmiin kuuluu seuraavassa kappaleessa esitetty Wangin, Sheikhin ja Hovikin algoritmi (WSB). Myös Häme (2005) on kehittänyt referenssivapaata menetelmää pakkausvääristymien analysointiin. Menetelmä on kuitenkin vielä tällä hetkellä laskennallisesti raskas ja kehitykseltään kesken.

Hämeen (2005) menetelmä perustuu hahmontunnistukselliseen luokitteluun. Aluksi kuvasta haetaan ääriviivat Canny-reunanhakualgoritmilla. Tämän jälkeen pakkausvääristymiä etsitään spatiaalitason analyysilla, 8x8 pikselin blokki kerrallaan. Blokkien vaihtumiskohdasta kerätään informaatiota, jonka perusteella voidaan luokitella kuvan kyseinen kohta vääristymäkohdaksi tai vääristymättömäksi.

Vääristymät luokitellaan kolmeen eri tyyppiin, ja menetelmä kertoo eri vääristymätyyppien

esiintymistiheyden. Käytettyjä tyyppejä ovat tasaisen alueen porrastuminen, reunojen vääristyminen ja suurten pakkasasteiden aiheuttamat epäj atkuvuusvääristymät. Laskennallisesti menetelmä on raskas, mutta se soveltuu myös vääristymien poistamiseen.

WSB-algoritmi on kehitetty siten, että se olisi laskennallisesti nopea, ja vähän muistia vaativa. Se soveltuu siksi hyvin myös kuva-agenttiin. Määritetään:

x(m,n) = kuvasignaali, m e (l,M)ja n e (1, N), M = kuvan korkeus pikseleinä,

N= kuvan leveys pikseleinä ja

dh (m, n) = x(m, n +1) - x(m, n), n e [l, N -1]

(kaava 7)

Aluksi arvioidaan horisontaalisesti blokkiintuneisuutta Bh keskimääräisinä eroina blokkien rajoilla:

(kaava 8)

(26)

Seuraavaksi arvioidaan horisontaalisesti kuvasignaalin terävyyttä kahdessa vaiheessa. Ensin lasketaan näytteiden keskimääräisiä eroja Ah toisiinsa nähden:

Ah= —и 7 8

rïï£z""

1

K(u

)|-«1 (kaava 9)

M {N- l)tr

Sitten arvioidaan kohdat, joissa dh vaihtaa merkkiä. Määritetään ensin: n e [l, N - 2] ja

zh(m,n) = 1 horisontaalinen merkinvaihto

0 muulloin (kaava 11)

Horisontaalisten merkinvaihtojen esiintymistiheys voidaan laskea seuraavalla tavalla:

(kaava 12)

1 M N-2

--- У У z. (m,n)

Samojen menetelmien avulla voidaan laskea vertikaaliset Bv, Av ja Zv. Tämän jälkeen horisontaaliset ja vertikaaliset arviot yhdistetään seuraavasti:

Bh + Bv

LJ — ---, A = Ah + Av z _ Zf, + Zy

(kaava 13) Lopuksi lasketaan kokonaislaatuluku:

S = a + ßBr' AYlZn (kaava 14)

Vakioiden a,ß,yx,y2,Z3määritystä varten Wang ym. (2002) suorittivat subjektiivisia testejä. He valitsivat 30 erilaista kuvaa, joita pakattiin satunnaisesti pakkasasteilla 5-100, jolloin alkuperäiset kuvat mukaan lukien saatiin 120 testikuvaa. Kuvat olivat pääasiassa henkilö-ja maisemakuvia. Tämän jälkeen 53 koehenkilöä suoritti luokittelun, jossa he arvioivat jokaisen kuvan laatua arvoilla 1-10 (1 = huonoin, 10 = paras). Jokaisen kuvan saamista arvioista laskettiin tämän jälkeen keskiarvot. Vakioiden arvoiksi he saivat:

a = -245.9,/? = 261.9,7, = -0.024, y2 = 0.0160,y3 = 0.0064

4 Subjektiivinen laadunarviointi

4.1 Johdanto

Subjektiivinen laadunarviointi on yleisesti käytetty toimintatapa kuvanlaadun mittaamiseen.

Koehenkilöille näytetään testikuvia, ja heidän antamiensa arvioiden perusteella määritetään yksittäisen testikuvan laatu. Yhdistämällä useiden koehenkilöiden arvioita saadaan tilastollisesti merkitseviä

(27)

tuloksia. Tarvittavien testien lukumäärä riippuu monesta tekijästä ja siitä, miten luotettaviin tuloksiin pyritään.

Onnistuneiden subjektiivisten testien avulla voidaan muodostaa asteikkoja kuvanlaadulle, ja testejä kutsutaankin usein nimellä psykometrinen skaalaus. Mahdollisia asteikkoja on neljä: nominaali-, ordinaali-, intervalli-ja suhdeasteikko. Asteikkojaottelu on peräisin 40-luvulta, ja sen esitti ensimmäisen kerran psykologi S.S. Stevens. (Edinger 2000; Bartleson 1984).

Nominaali- eli luokka-asteikolla havainnot luokitellaan kahteen tai useampaan luokkaan

samanlaisuutensa tai erilaisuutensa perusteella. Mittauksen kohteet ovat siinä mielessä tasa-arvoisia, ettei millään luokalla ole enempää mitattavaa ominaisuutta kuin toisella luokalla. Luokkia ei siis voi laittaa järjestykseen mitattavan ominaisuuden suhteen. Esimerkiksi jaottelu punaiseen, siniseen ja vihreään väriin tapahtuu nominaaliasteikolla. (Edinger 2000, Tilastokeskus 2003)

Ordinaali- eli järjestysasteikolla mitattavasta kohteesta voidaan sanoa, onko sillä mitattavaa

ominaisuutta enemmän, yhtä paljon vai vähemmän kuin toisella kohteella. Järjestysasteikko kertoo siis arvioitavien kohteiden paremmuusjärjestyksen, mutta se ei kerro sitä, miten paljon jokin kohde on toista parempi. (Edinger 2000, Tilastokeskus 2003)

Intervalliasteikko on järjestysasteikon kehittyneempi muoto, jossa samalla etäisyydellä on sama merkitys eri kohdissa asteikkoa. Esimerkiksi lämpötilan nousu -20 asteesta -10 asteeseen on yhtä suuri kuin nousu +10 asteesta +20 asteeseen. 0-piste on mielivaltainen: Celsiuksen nolla on Fahrenheitin 32 astetta. Lisäämällä intervalliasteikkoon absoluuttinen nollapiste päästään suhdeasteikkoon.

Suhdeasteikolla mitattavia muuttujia ovat esimerkiksi pituus ja paino. (Edinger 2000, Tilastokeskus 2003)

Kuvanlaatumittauksissa nominaaliasteikko on käytännössä hyödytön, intervalliasteikko ja

suhdeasteikko sen sijaan ovat käyttökelpoisimpia. Näistä jälkimmäistä on kuitenkin usein liian työlästä määrittää. (Edinger 2000)

4.2 Testien suunnittelu

Subjektiivisia testejä suunniteltaessa on kiinnitettävä huomiota ainakin seuraaviin seikkoihin:

testikuvat, koehenkilöt, koehenkilöiden ohjeistus, testiympäristö, testien monimutkaisuus ja tulosten analyysiin käytettävät menetelmät. (Edinger 2000; Engeldrum 2001)

Edingerin (2000) mukaan testikuvien täytyy olla hyvälaatuisia, niin että ne vaihtelevat keskenään vain tutkittavan attribuutin suhteen. Kuvien välillä olevien erojen tulee olla riittävän pieniä, jotta tuloksia voidaan analysoida tilastollisin menetelmin. Engeldrumin (2001) mukaan testikuvia valittaessa tulisi kiinnittää huomiota siihen, miten kuvat valitaan, mikä on tutkittujen attribuuttien vaihteluväli, minkä kokoisia kuvia käytetään ja millaisia kuvat ovat sisällöltään. Kuvien valinta voidaan toteuttaa

esimerkiksi arpomalla ne jostakin suuresta tietokannasta, valitsemalla ne jonkin tietokannan valmiista kuvaluokista, valitsemalla tutkimuskohteelle olennaisia kuvia tai täysin sattumanvaraisesti. Näistä viimeksi mainittu on yleisimmin käytetty, mutta toisaalta huonoin mahdollinen menettelytapa.

(28)

Sisällöltään testikuvien on hyvä olla neutraaleja, sillä muussa tapauksessa testitulokset eivät ole luotettavia. Neutraalius tarkoittaa tässä yhteydessä sitä, että kuvat eivät ole tunteita herättäviä.

Testikuvat voivat olla joko analyyttisia tai luonnollisia. Analyyttiset kuvat ovat joko jonkin standardin mukaisia, tai tiettyjä testejä varten suunniteltuja. Analyyttisia testikuvia voidaan arvioida sekä

visuaalisin testein että erilaisin mittauksin. Ne sopivat hyvin esimerkiksi optisten häiriöiden tai väritasapainon arvioimiseen. Luonnolliset kuvat ovat jollakin kuvantallennusvälineellä tehtyjä

taltiointeja jostakin fysikaalisen maailman kohteesta. Ne soveltuvat parhaiten visuaalisiin testeihin, ja esimerkiksi terävyyden tai kokonaislaadun arvioimiseen. (Field 1999)

Myös testikuvien säilyttämiseen ja käsittelyyn on kiinnitettävä huomiota, jotta kuvat säilyvät samanlaisina kaikille koehenkilöille. Lisäksi kuvat täytyy merkata tunnisteella. Tunniste kannattaa sijoittaa mieluiten kuvan taustapuolelle siten, että se ei herätä huomiota. (Engeldrum 2001)

Koehenkilöitä valittaessa tulee kiinnittää huomiota siihen, että heidän määränsä on riittävä. Tulosten luotettavuuden varmistamiseksi koehenkilöitä tulee Edingerin (2000) mukaan olla vähintään 30.

Engeldrumin (2001) mukaan sopiva määrä on noin 10-30. Suurempi koehenkilöiden määrä takaa tarkemmat tulokset, mutta lisää testien työmäärää. Sopiva koehenkilöiden määrä riippuu myös tulosten analyysiin käytettävästä menetelmästä.

Koehenkilöiden tulee soveltua arvioimaan tutkittua laatuattribuuttia. Esimerkiksi värisokea henkilö ei sovellu värien laatua arvioiviin testeihin. Arviointitehtävästä riippuen on myös kiinnitettävä huomiota siihen, käytetäänkö arvioijina asiantuntijoita vai vasta-alkajia. Asiantuntijat erottavat yleensä

laatuattribuuttien pienempiä vaihteluita kuin vasta-alkajat. Tuotekehityksessä mukana olevat henkilöt ovat kriittisempiä hyväksyttävän kuvanlaadun suhteen kuin keskivertohenkilöt. (Edinger 2000, Engeldrum 2001)

Onnistuneet testit vaativat Edingerin (2000) mukaan kunnollisen ohjeistuksen siitä, mitä koehenkiöiden tulee tehdä. Ohjeet eivät kuitenkaan saa johdattaa koehenkilöitä heidän arvioissaan. Muussa

tapauksessa testin tuloksia ei voida pitää luotettavina. Engeldrumin (2001) mukaan koehenkilöille pitää selvittää, mitä attribuuttia he arvioivat, mikä on arvion konteksti ja mitä kriteerejä arviossa tulisi

käyttää. Arvion konteksti voi olla esimerkiksi ”sellaisten kuvien laatu, joita annetaan ystäville ja perheenjäsenille”. Käytettävät arviointikriteerit tulee valita tutkittavan attribuutin perusteella, ja ne voi esittää koehenkilölle sanallisesti tai esimerkkikuvia käyttäen.

Koehenkilöiden ja ohjeistuksen lisäksi myös testiympäristö vaikuttaa tuloksiin. Sopivaa ympäristöä valittaessa on kiinnitettävä huomiota riittävään valaistukseen, häiriöttömyyteen ja neutraalisuuteen.

Esimerkiksi väärän värinen valo voi vaikuttaa häiritsevästi. (Edinger 2000)

Edingerin (2000) mukaan testijärjestetyissä tulee välttää monimutkaisuutta. On tärkeää miettiä

etukäteen, millä tavoin ja kenen toimesta testitulokset kirjataan ylös. Myös testin kokonaiskestoon tulee kiinnittää huomiota. Yhden subjektiivisen testin optimaalinen maksimikesto on noin puoli tuntia.

Tämän jälkeen koehenkilöiden keskittyminen alkaa häiriintyä, ja tällä voi olla vaikutusta arvioihin.

Engeldrumin (2001) mukaan pilottitestit ja käytettävän testijärjestyksen tarkka kirjaaminen ovat olennaisia työkaluja testien onnistumisen takaamiseksi.

(29)

4.3 Subjektiiviset tutkimusmenetelmät

Tutkimusmenetelmille on yhteistä pyrkimys fyysisen ärsykkeen ja koehenkilön havainnon välisen suhteen mittaamiseen. Yksittäisiä menetelmiä on useita, ja niistä osa soveltuu monimuuttuja-alyysiin, osa yhden muuttujan analyysiin kerrallaan. Yleisimpiä menetelmiä yhden muuttujan analyysiin ovat parivertailu, järjestysvertailu, luokitteluja ankkuroitu arvio. (Edinger 2000)

Parivertailussa koehenkilö vertaa testikuvia toisiinsa kaksi kerrallaan, ja jokaisella kerralla hän nimeää mielestään paremman kuvan. Testi on lopussa, kun kaikkia kuvia on verrattu toisiinsa. Parivertailun avulla saadaan tarkkoja tuloksia, mutta se ei sovi kovin suurelle kuvajeukolle, koska testin kesto kasvaisi liian pitkäksi. (Bartleson 1984, Edinger 2000)

Jäijestysvertailu on menetelmänä lähellä parivertailua. Siinä koehenkilö saa kerralla arvioitavakseen kaikki testikuvat, ja hänen tehtävänsä on laittaa ne järjestykseen jonkin ennalta määrätyn attribuutin perusteella. Jäijestysvertailussakin koehenkilö joutuu tekemään parivertailua miettiessään vertailtavien kuvien järjestystä, mutta referenssinä hänellä on koko saija. Järjestysvertailun etuna parivertailuun nähden on, että siihen sopivat suuretkin turvajoukot. (Bartleson 1984, Edinger 2000) Järjestys-ja parivertailu antavat lähellä toisiaan olevia tuloksia, eivät kuitenkaan identtisiä. (Cui 2000)

Sekä pari- että jäijestysvertailu antaa tuloksena paremmuusjärjestyksen, eikä kerro suoranaisesti verrattavien välisistä eroavaisuuksista. Erot voivat olla yhtä hyvin pieniä kuin suuria. Tästä syystä testikuvat on suunniteltava huolellisesti. Jos erot ovat liian suuria, saadaan selville pelkkä

paremmuusjärjestys. Jos erot taas ovat liian pieniä, ei objektien välillä pystytä tekemään eroa. Valinnat ovat onnistuneita, kun kuvien väliset erot eivät ole itsestään selviä, mutta ne ovat kuitenkin tuloksista havaittavissa. Tällöin testituloksista voidaan tilastollisia menetelmiä hyväksikäyttäen muodostaa intervalliasteikko. (Bartleson 1984)

Luokittelu on sekä pienelle että suurelle turvajoukolle sopiva menetelmä. Koehenkilöt saavat kaikki testikuvat kerralla, jonka jälkeen he järjestävät ne joihinkin ennalta määrättyihin luokkiin. Tällaisia luokkia voivat olla esimerkiksi ”hyväksyttävä” ja ”ei-hyväksyttävä”. Luokittelun ongelmana on intervalliasteikon muodostaminen käytetyille luokille. Koehenkilöt pyrkivät yleensä käyttämään kaikkia käytössä olevia luokkia riippumatta siitä, miten etäällä ne ovat toisistaan. Yksinkertaisin tapa analysoida luokittelun tuloksia on laskea keskiarvoluokittelu jokaiselle testikuvalle. Tämä edellyttää oletuksen siitä, että koehenkilöt pystyvät luokittelemaan testikuvat intervalliasteikolla, mikä ei yleensä pidä paikkaansa. (Bartleson 1984, Edinger 2000, Engeldrum 2000)

Ankkuroitu arvio perustuu siihen, että kahden esimerkkikuvan avulla asetetaan asteikon alku- ja päätepisteet. Tämän jälkeen koehenkilö asettaa testikuvia asteikon päätepisteiden välille. Asteikko voi olla esimerkiksi välillä 1-10, ja asettelutarkkuus 0,5. Testien onnistumisen kannalta on tärkeää, minne asteikon päätepisteet on asetettu. Testikuvien tulisi sopia päätepisteiden väliin ja jakautua

mahdollisimman tasaisesti. (Edinger 2000)

(30)

4.4 Testitulosten analyysi

4.4.1 Järjestys- ja parivertailutestitulosten asettaminen intervalliasteikolle Järjestys- ja parivertailutestin tulokset voidaan esittää histogrammimatriisina (H), jossa rivit merkitsevät järjestyssijoja, ja sarakkeet kutakin testiärsykettä. Soluista voidaan lukea jokaisen

testiärsykkeen esiintymät eri jäijestyssijoilla. Tulosten perusteella voidaan laskea arvo Mr, joka kertoo sijoitusten keskiarvon. Sijoitusten keskiarvo kuvaa testikuvien sijoitusta järjestysasteikolla, sijoitusten välisistä välimatkoista ei sen sijaan voida tehdä johtopäätöksiä. Sijoitusten keskiarvo saadaan

seuraavan kaavan avulla (Engeldrum 2000):

Mr =J [12 3 ... n] H, (kaava 15)

jossa

J = koehenkilöiden määrä,

vektori [1 2 3 ... n] kuvaa järjestyssij oja ja H = histogrammimatriisi.

Sijoitusten keskiarvon perusteella testikuville voidaan määrittää arvo R, joka kuvaa niiden keskinäistä järjestystä järjestysasteikolla (Bartleson 1984). Lisäksi voidaan laskea Mc, joka sisältää saman

informaation kuin Mr, mutta käänteisesti. Mc pienenee samalla kun tutkittu muuttuja kasvaa. Mc lasketaan seuraavan kaavan perusteella (Bartleson 1984):

M c = n-M r

5 (kaava 16)

jossa

n = testiärsykkeiden määrä.

Thurstonen (1927; ref. Bartleson 1984) parivertailulain perusteella mittauksista saadut järjestysasteikolla olevat sijoitusten keskiarvot voidaan asettaa intervalliasteikolle. Jotta tätä

menetelmää voidaan käyttää, on tehtävä oletus, että saadakseen testikuvat järjestettyä koehenkilön on täytynyt verrata keskenään kaikkia testikuvia joko suoraan tai epäsuoraan.

Thurstonen laki perustuu siihen, että useat tekijät vaikuttavat satunnaisesti samaan testiärsykkeeseen eri aikoina. Useiden testien tapauksessa ärsykkeiden aiheuttamat vastineet muodostavat

normaalijakauman. Kun kahta eri ärsykettä verrataan keskenään, verrataan itse asiassa kahta pistettä kahdella eri jakaumalla. Koska keskenään vertailtavat ärsykkeet sijaitsevat normaalijakaumalla, myös useiden mittausten perusteella saadut erot sijaitsevat normaalijakaumalla. Täten voidaan laatia

intervalliasteikko, jossa etäisyydet viittaavat normaalijakauman alueisiin. Mittayksikkönä käytetään normaalimuuttujaa z. Thurstonen laki sisältää ärsykkeiden variansseista riippuvia erilaisia tapauksia.

Yleisimmin käytetty Thurstonen tapaus viisi on sellainen, jossa varianssin oletetaan olevan kaikilla ärsykkeillä yhtä suuri.

Viittaukset

LIITTYVÄT TIEDOSTOT

Myös sekä metsätähde- että ruokohelpipohjaisen F-T-dieselin tuotanto ja hyödyntä- minen on ilmastolle edullisempaa kuin fossiilisen dieselin hyödyntäminen.. Pitkän aikavä-

Jos valaisimet sijoitetaan hihnan yläpuolelle, ne eivät yleensä valaise kuljettimen alustaa riittävästi, jolloin esimerkiksi karisteen poisto hankaloituu.. Hihnan

Vuonna 1996 oli ONTIKAan kirjautunut Jyväskylässä sekä Jyväskylän maalaiskunnassa yhteensä 40 rakennuspaloa, joihin oli osallistunut 151 palo- ja pelastustoimen operatii-

At this point in time, when WHO was not ready to declare the current situation a Public Health Emergency of In- ternational Concern,12 the European Centre for Disease Prevention

(f) Classify each of the test images with a nearest neighbor classifer: For each of the test images, compute its Euclidean distance to all (2,500) of the training images, and let

(f) Classify each of the test images with a nearest neighbor classifer: For each of the test images, compute its Euclidean distance to all (2,500) of the training images, and let

(f) Classify each of the test images with a nearest neighbor classifer: For each of the test images, compute its Euclidean distance to all (2,500) of the training images, and let

that people engaged in a subjective preference-estimation task use different estimation rules, which is also reflected in their viewing behaviour. The findings reported in this