Polven nivelrikon vakavuuden arviointi röntgenkuvista ohjaamattoman oppimisen keinoin

(1)

Visa Nykänen

Polven nivelrikon vakavuuden arviointi röntgenkuvista ohjaamattoman oppimisen keinoin

Tietotekniikan pro gradu -tutkielma 15. tammikuuta 2020

Jyväskylän yliopisto

(2)

Tekijä:Visa Nykänen

Yhteystiedot:Visa.K.Nykanen@student.jyu.fi

Ohjaajat:Sami Äyrämö, Susanne Jauhiainen, Esko Niinimäki ja Juha Paloneva

Työn nimi:Polven nivelrikon vakavuuden arviointi röntgenkuvista ohjaamattoman oppimisen keinoin

Title in English:Assessment of the severity of osteoarthritis of the knee from X-ray images using unsupervised learning

Työ:Pro gradu -tutkielma

Opintosuunta:Laskennalliset tieteet Sivumäärä:64+0

Tiivistelmä:Tutkielman tavoitteena oli toteuttaa automaattinen menetelmä polven nivelrikkoon liittyvien muuttujien laskemiseen röntgenkuvista ja selvittää minkälainen klusterointi saadaan aikaan laskettujen muuttujien perusteella. Muuttujat laskettiin reunantunnistukseen perustuvalla menetelmällä ja menetelmää arvioitiin tarkastelemalla laskettujen muuttujien yhteyksiä aineistossa oleviin asiantuntijoiden tekemiin nivelrikon vakavuusluokituk- siin Osteoarthritis Initiative:n kokoamassa aineistossa. Lopulta menetelmän avulla laskettujen arvojen perusteella tehtiin klusterointi K-means++-algoritmia käyttäen. Klusteroinnin havaittiin yleisestä nivelrikon vakavuuden arviointiin tarkoitetusta luokittelujärjestelmästä KL-luokituksesta poiketen jakavan vakavan nivelrikon mediaaliseen ja lateraaliseen sen perusteella, kummallako puolella nivelrikkoon liittyvät havainnot tehtiin. Lisäksi varhaisen nivelrikon havaittiin jakautuvan kahtia eminentian terävöitymisestä laskettujen muuttujien perusteella.

Avainsanat:nivelrikko, röntgenkuva, koneoppiminen, ohjaamaton oppiminen, klusterointi, konenäkö, reunantunnistus

Abstract: The aim of this thesis was to implement an automatic method for calculating features related to osteoarthritis of the knee from X-ray images and to find out what kind of a

(3)

clustering can be achieved using the calculated features. The features were calculated using a method based on edge detection and the results were evaluated by reviewing the connections between the calculated variables and severity classifications done by field experts in data collected by Osteoarthritis Initiative. Finally the calculated variables were clustered using the K-means++-algorithm. The clustering was found to divide severe osteoarthritis into two groups based on whether the findings related to osteoarthritis were found on the lateral or the medial side of the knee. Also early osteoarthritis was found to be divided into two groups based on the calculated variables regarding sharpening of the tibial eminence.

Keywords:osteoarthritis, X-ray, machine learning, unsupervised learning, clustering, computer vision, edge detection

(4)

Lääketieteen sanastoa

Nivelrikko Artroosi, nivelkuluma, ei-tulehduksellinen nivelen kulumasai- raus

Mediaalinen Keskitason puolella sijaitseva, keskitasossa sijaitseva, sisäpuo- linen, sisä-

Lateraalinen Kaukana keskitasosta sijaitseva, sivulla sijaitseva, sivunpuolei- nen, ulko-, sivu-

Eminentia Kohouma, kyhmy, harju. Tutkielmassa erityisesti sääriluun ylä- pinnan nivelpintojen väliharju (eminentia intercondylaris) Osteofyytti Luupiikki, uudisluukasvama, luukalvosta kasvava hyvänlaatui-

nen ylimääräinen luu-uloke

Skleroosi Kovettuminen, kovettuma

Laadittu käyttäen MOT:n lääketieteen sanakirjaa (MOT Lääketiede 2.0a2018).

(5)

Kuviot

Kuvio 1. Kuvagradientit esimerkkikuvassa . . . 6

Kuvio 2. Reunantunnistusmenetelmien tulokset esimerkkikuvassa . . . 7

Kuvio 3. Dendrogrammi hierarkkisen klusteroinnin tuloksista Iris-testidatassa . . . 12

Kuvio 4. Esimerkki DBSCAN-algoritmilla toteutetun klusteroinnin tuloksista . . . 13

Kuvio 5. K-means-algoritmin eteneminen esimerkkidatassa. Todelliset luokat esite- tään muotoina ja löydetyt klusterit väreinä. . . 14

Kuvio 6. Esimerkit eri KL-luokitusten polvien röntgenkuvista . . . 21

Kuvio 7. Esimerkki polven lokalisointimenetelmän toiminnasta: ehdotukset polven keskikohdasta punaisina pisteinä sekä valittu ROI neliöitynä . . . 29

Kuvio 8. Muuttujien laskentaan käytetyn menetelmän toiminta vaiheittain . . . 32

Kuvio 9. Minimaalisen nivelraon jakaumat . . . 35

Kuvio 10. Esimerkkejä tapauksista, joissa sääriluun sivureunan löytyminen epäonnistuu . 36 Kuvio 11. Osteofyytin pinta-alan jakaumat . . . 38

Kuvio 12. Osteofyytin keskimääräisen poikkeaman jakaumat . . . 39

Kuvio 13. Eminentian korkeuden jakaumat . . . 41

Kuvio 14. Eminentian kulman jakaumat . . . 42

Taulukot

Taulukko 1. Muuttujien väliset korrelaatiot . . . 34

Taulukko 2. Muuttujien keskiarvot ja 95% luottamusvälit KL-luokittain . . . 37

Taulukko 3. Muuttujien keskiarvot ja 95% luottamusvälit OARSI-luokittain . . . 40

Taulukko 4. Klusterit ristiintaulukoituna KL-luokituksen kanssa . . . 45

Taulukko 5. Klusterien keskiarvot ja -hajonnat Z-pisteytettyinä . . . 45

Taulukko 11. Klusterien keskiarvot ja -hajonnat Z-pisteytettyinä. . . 48

Taulukko 12. Klusterit ristiintaulukoituna KL-luokituksen kanssa KSSHP-aineistossa . . . . 49

Taulukko 13. Klusterit ristiintaulukoituna KL-luokituksen kanssa KSSHP-aineistossa . . . . 49

(6)

Sisältö

1 JOHDANTO . . . 1

2 REUNANTUNNISTUS . . . 3

2.1 Konvoluutio . . . 3

2.2 Esikäsittely . . . 4

2.3 Reunantunnistusmenetelmät . . . 5

3 KLUSTEROINTI . . . 9

3.1 Samankaltaisuuden mittaaminen . . . 9

3.2 Hierarkkinen klusterointi . . . 11

3.3 Tiheysperusteinen klusterointi . . . 12

3.4 Prototyyppipohjainen klusterointi . . . 14

3.5 Klusterien validointi ja tulkinta . . . 16

3.5.1 Ulkoinen validointi . . . 16

3.5.2 Sisäinen validointi . . . 17

3.5.3 Suhteellinen validointi . . . 18

3.5.4 Klusterien tulkinnasta . . . 19

4 POLVEN NIVELRIKKO JA SEN TIETOKONEAVUSTEINEN DIAGNOSOINTI 20 4.1 Polven nivelrikkoon liittyvät muuttujat ja luokitusjärjestelmät . . . 20

4.2 Polven nivelrikon tietokoneavusteinen diagnosointi röntgenkuvista . . . 22

4.2.1 Polven nivelrikon tietokoneavusteinen diagnosointi . . . 22

4.2.2 Polven automaattinen paikannus . . . 26

5 POLVEN NIVELRIKKOA SELITTÄVIEN MUUTTUJIEN AUTOMAATTINEN HAVAITSEMINEN RÖNTGENKUVA-AINEISTOSTA . . . 27

5.1 Aineiston kuvaus . . . 27

5.2 Polven sijainnin määrittäminen röntgenkuvista . . . 28

5.2.1 Lokalisointimenetelmän kuvaus . . . 28

5.2.2 Lokalisointimenetelmän soveltaminen tutkielman aineistoon . . . 30

5.3 Muuttujien laskemiseen käytetty menetelmä . . . 30

5.4 Laskettujen muuttujien arviointi . . . 33

5.4.1 Nivelraon kaventuminen. . . 34

5.4.2 Osteofyytit . . . 36

5.4.3 Eminentian terävöityminen. . . 40

6 KLUSTEROINNIN SOVELTAMINEN AUTOMAATTISESTI LASKETTUI- HIN POLVEN NIVELRIKKOA SELITTÄVIIN MUUTTUJIIN. . . 43

6.1 Klusterointi pelkkien KL-luokitukseen liittyvien muuttujien perusteella . . . 44

6.1.1 Validoimalla valittu klusterien määrä . . . 44

6.1.2 5 klusteria . . . 45

6.2 Klusterointi kaikkien laskettujen muuttujien perusteella . . . 46

6.2.1 Validoimalla valittu klusterien määrä . . . 46

(7)

6.2.2 5 klusteria . . . 47

6.3 Klusterointien soveltaminen uuteen dataan . . . 48

7 YHTEENVETO. . . 50

LÄHTEET . . . 52

(8)

1 Johdanto

Tekoälyn hyödyntäminen terveydenhuollon alalla on ilmiselvistä syistä edullista niin alan ammattilaisille kuin myös alan palveluja tarvitseville. Rutiininomaisten tehtävien hoitami- nen koneavusteisesti säästää lääkäriltä aikaa, jota voidaan nyt käyttää tehtäviin, joihin ih- mistä vielä tarvitaan. Toisaalta koneavusteinen päätöksenteko myös vähentää mahdollisuutta sille, että tehtäviin päätöksiin vaikuttaisi lääkärin omat harhat ja ennakkokäsitykset. On myös mahdollista, että tietokone voi joissain diagnostisissa tehtävissä havaita diagnosoita- van vaivan varhaisemmassa vaiheessa kuin ihminen, jolloin vaivan edistymistä voidaan vielä hidastaa tai jopa pysäyttää.

Polven nivelrikko on yksi yleisimmistä ikääntyvän väestön toimintakykyä rajoittavista vai- voista. Vaiva vaikuttaa yli 60-vuotiaiden joukossa arviolta kolmeentoista prosenttiin naisista ja kymmeneen prosenttiin miehistä (Heidari 2011). Nivelrikko diagnosoidaan tiettyjen nivelen rakenteen muutosten perusteella. Muutokset voidaan esittää röntgenkuvista laskettavina muuttujina ja vaivan vakavuuden arviointiin näiden muuttujien perustella on kehitetty erilaisia luokittelujärjestelmiä, joista tunnetuimpia on Kellgren ja Lawrence 1957 esittelemä 5-luokkainen KL-luokitus (Kohn, Sassoon ja Fernando 2016).

KL-luokitusta ollaan kuitenkin kritisoitu, sillä sen esittämien vakavuusluokkien määritel- mät ovat osin tulkinnanvaraisia ja vaihtelevat julkaisujen välillä (Schiphof, Boers ja Bierma- Zeinstra 2008). Näin ollen eri asiantuntijoiden arviot saman polven nivelrikon vakavuus- luokasta varsinkin vaivan varhaisessa vaiheessa saattavat vaihdella jonkin verran. Erityises- ti ohjatun oppimisen, eli koneoppimissuuntauksen, jossa mallin luomiseen käytettävä data on valmiiksi jaoteltu luokkiin, näkökulmasta tämä on haastavaa. Mikäli koneoppimismal- lia luotaessa käytettävässä datassa on merkittäviä määriä ominaisuuksiltaan samankaltaisia havaintoja eri luokissa, ei näiden luokkien välistä erottelua voida tehdä kovinkaan suurella varmuudella.

Ohjaamattoman oppimisen klusterointimenetelmissä datan ei oleteta olevan valmiiksi luoki- teltua, vaan siinä pyritään löytämään luokat ilman ennakkotietoa siten, että kuhunkin luokkaan kuuluvat datapisteet ovat saman kaltaisia toistensa kanssa ja erilaisia muihin löydettyi-

(9)

hin luokkiin nähden. Tutkielman päällimmäinen tutkimuskysymys onkin klusterointia käyt- täen selvittää, minkälainen luokitus saadaan aikaan ainoastaan röntgenkuvista automaattisesti lasketuista nivelrikon edistymistä selittävistä muuttujista. Jatkokysymyksenä selvitetään kuinka klusteroimalla syntyvä luokitus vertautuu edellä esiteltyyn KL-luokitukseen. Mie- lenkiintoista on myös nähdä kuinka monta luokkaa ylipäätään tarvitaan selittämään kyllin suurta osaa lasketuissa muuttujissa esiintyvästä vaihtelusta.

Klusterointia varten tutkielmassa toteutetaan reunantunnistukseen perustuva menetelmä polven nivelrikkoon liittyvien muuttujien automaattiseen laskemiseen. Erityisesti tavoitteena on KL-luokituksen ulkopuolella olevan muuttujan sääriluun yläpinnan eminentian terävöitymi- sestä (engl.tibial eminence sharpening) tarkastelu. Tutkielman toisena tutkimuskysymykse- nä on kysymys siitä, kuinka kyseinen muuttuja voidaan havaita röntgenkuvista automaattisesti ja kuinka se vaikuttaa saavutettuihin klusterointituloksiin. Muuttujan on arvioitu olevan erityisen hyödyllinen varhaisessa vaiheessa olevan nivelrikon havaitsemisessa, joten sen käytännöllinen hyöty saattaa olla merkittävä.

Tutkielman luvussa 2 käydään läpi reunantunnistuksen teoriaa tutkielman empiirisessä osiossa toteutettavan polven nivelrikkoon liittyvien muuttujien laskemiseen käytetyn menetel- män pohjana. Luku 3 käsittelee klusteroinnin teoriataustaa empiirisessä osiossa toteutettavan klusterointiin perustuvan nivelrikon luokituksen pohjana. Luvussa 4 tutustutaan polven nivelrikkoa selittäviin muuttujiin, KL-luokitukseen sekä tietokoneavusteisiin menetelmiin niiden määrittämiseksi. Luku 5 esittelee tutkielmassa toteutetun menetelmän nivelrikkoa se- littävien muuttujien laskemiseksi tuloksia arvioiden. Luvussa 6 esitellään ja analysoidaan laskettujen muuttujien perusteella tehdyn klusteroinnin tuloksia.

(10)

2 Reunantunnistus

Reunantunnistus on tehtävä konenäössä, jonka tarkoituksena on löytää annetusta kuvasta muutoksia kuvan intensiteetissä ja yhdistää ne fyysisiin ilmiöihin (Ziou ja Tabbone 2000).

Reunantunnistus jakautuu yleensä kolmeen vaiheeseen: kuvan esikäsittelyyn, kuvan differentioimiseen ja haluttujen reunojen tunnistamiseen differentioimisen tuloksesta. Pyrkimyk- senä on löytää kuvasta oikeat reunat ja välttää havaitsemasta kohinasta johtuvia tai muuten mielenkiinnon ulkopuolella olevia reunoja. Tehtävä on haastava toteuttaa yleispätevästi, sil- lä sen määrittäminen mikä milloinkin on kiinnostava reuna ja mikä ei, tulee yleensä tehdä tapauskohtaisesti.

2.1 Konvoluutio

Reunantunnistusmenelmien ymmärtämiseksi täytyy ensin määritellä, mitä tarkoitetaan kon- voluutiolla erityisesti kuva-analyysin yhteydessä. Konvoluutio on yleisesti menetelmä, jonka avulla selvitetään kuinka annettu funktiogvaikuttaa toisen annetun funktion f muotoon (Smith 1997). Jatkuvassa tapauksessa konvoluutio määritellään integraalina

∀t∈R, (f∗g)(t) = Z _∞

−∞

f(τ)g(t−τ)dτ. (2.1)

Diskreetissä tapauksessa vastaavasti summana

∀n∈Z,(f∗g)[n] =

∞ m=−∞

∑

f[m]g[n−m], (2.2)

missä nyt f jagovat lukujonoja funktioiden sijaan. Konvoluutio lienee kuitenkin helpompi hahmottaa formaalin määritelmänsä sijaan eräänlaisena suodattimena, joka käsittelee funk- tiota ikkunoittain. Tarkastellaan esimerkiksi tapausta, jossag[n] =







1/3 jos −1≤n≤1

0 muuten

. Nyt

(f∗g)[n] =

∞ m=−∞

∑

f[m]g[n−m]

=

n+1 m=n−1

∑

f[m]g[n−m]

(11)

= 1 3

n+1 m=n−1

∑

f[m],

konvoluutiog:n suhteen voidaan siis ajatella kolmen luvun kokoisena ikkunana, joka laskee kussakinn:ssä f[n]:n, sitä edeltävän ja sitä seuraavan luvun keskiarvon.

Kuva-analyysissa konvoluution käsittelyssä ovatkin kaksiulotteiset äärelliset matriisit: käsit- telyssä oleva kuva itse ja jokin valittu suodatinmatriisi. Itse konvoluutio toimii täysin samalla tavalla, mutta yleensä suodatinmatriisista ilmoitetaan ainoastaan sen ydin (engl. kernel) eli nollasta poikkeavat arvot. Ydin määritellään usein parittoman kokoisena neliömatriisina siten, että kullakin hetkellä kuvasta tarkasteltava pikseli sijoittuu ytimen keskikohtaan. Kon- voluutio etenee siis rivi riviltä käsitellen kunkin pikselin kuvassa summaten sitä ympäröivät pikselit konvoluutioytimen arvoilla painottaen. Kuvia konvoloitaessa kuvan äärellisyydestä johtuen tulee tehdä päätös siitä, kuinka menetellään kuva-alueen reunoissa. Jos kaikki kuva- alueen ulkopuolelta vaaditut pisteet jätetään täysin huomiotta, on konvoluution tuloksena saatava kuva alkuperäistä hieman pienempi. Vaihtoehtoisia menettelytapoja ovat esimerkiksi reunan jatkaminen nollapikseleillä tai alkuperäisen kuvan peilaaminen reunan ulkopuolelle (Szeliski 2010).

2.2 Esikäsittely

Reunantunnistusta varten kuva tulee esikäsitellä siten, että halutut reunat ovat helpommin löydettävissä varsinaisessa reunantunnistusvaiheessa. Esikäsittelyyn kuuluu yleensä kuvan sumentaminen jotain tehtävää varten kehitettyä suodatinta käyttäen. Kuvaa sumentamalla pyritään vähentämään kuvasta kohinaa, joka vaikuttaisi reunantunnistuksen tuloksiin. Kohi- na voi johtua esimerkiksi kuvan kuvaamislaitteiston ominaisuuksista tai itse kuvassa esiin- tyvien objektien ominaisuuksista kuten tekstuureista. Kohina on erityisen haitallista reunan- tunnistustehtävissä, sillä kuvan differentioiminen yleensä vahvistaa sen vaikutusta (Ziou ja Tabbone 2000).

Muutamia yleisiä sumentamiseen käytettyjä menetelmiä ovat keskiarvosumennus, mediaa- nisumennus ja Gaussin sumennus (Ziou ja Tabbone 2000). Mediaanisumennuksessa kukin pikseli korvataan sen n-ympäristön mediaanina. Vastaavasti keskiarvosumennuksessa kukin

(12)

pikseli korvataan sen ympäristön keskiarvona, se voidaan esittää myös konvoluutiona seu- raavanlaisellan×n-ytimellä

K= 1 n²







1 . . . 1

... . .. ...

1 . . . 1





 .

Gaussin sumennuksessa kukin pikseli korvataan taasen painotettuna keskiarvona siten että tarkasteltavan pikselin lähellä sijaitsevat pikselit saavat korkeamman painon kuin etäisemmät normaalijakaumaan perustuvan kaksiulotteisen Gaussin funktionG(x,y,σ) = ¹

2π σ²exp(−^x²^+y²

2σ² ) mukaan laskettavin painokertoimin. Ohessa on esimerkki 3x3-kokoisesta Gaussin sumen- nusytimestä, missäσ =^√¹

2

G= 1 π







0,24 0,37 0,24 0,37 1 0,37 0,24 0,37 0,24





 .

Sumennus vähentää kuvassa esiintyvää kohinaa, mutta väkisinkin myös johtaa informaation häviämiseen. Sumennusmenetelmää valittaessa onkin pohdittava, mikä on hyväksyttävä määrä informaation menetystä käsittelyssä olevan reunantunnistustehtävän tapauksessa.

2.3 Reunantunnistusmenetelmät

Kuvan intensiteetin muutosten havaitsemiseksi kuva tulee differentioida. Differentioimiseen käytetään yleisesti kuvagradienttia. Kuvagradientti määritellään funktionI(x,y)R²→Ren- simmäisenä derivaattanaI⁰(x,y), missä I(x,y) on kuvan pikseli-intensiteetti pisteessä (x,y).

Koska kuva on kuitenkin diskreetti, eikä sen gradienttia välttämättä ole määritelty, ei gradienttia pystytä laskemaan analyyttisesti vaan sitä tulee estimoida. Estimointi suoritetaan käyttäen konvoluutiota tehtävään tarkoitetulla suodatinmatriisilla. Yksi tunnetuimmista kuvagradientin laskemiseen käytetyistä suodattimista on Sobel-operaattori (Sobel ja Feldman 1973), joka määritellään seuraavanlaisina 3x3 matriiseina.

∇_y=







−1 −2 −1

0 0 0

1 2 1





 ,∇_x=







−1 0 1

−2 0 2

−1 0 1





 .

(13)

(a) Sobel-kuvagradientti x:n suhteen

(b) Sobel-kuvagradientti y:n suhteen

Kuvio 1: Kuvagradientit esimerkkikuvassa

Sobel-ydin siis laskee pikselin molemmin puolin olevien pikseleiden intensiteettien ero- tuksen painottaen tarkasteltavan pikselin läheisiä pikseleitä etäisempiä enemmän. Merkitään kuvagradientti y:n suhteen

I_y⁰(x,y) = (∇_y∗I)(x,y) (2.3) ja x:n suhteen

I_x⁰(x,y) = (∇_x∗I)(x,y). (2.4) Esimerkit kuvagradienteista x:n ja y:n suhteen löytyvät kuvasta 1. Mikäli reunantunnistus- tehtävässä ollaan kiinnostuneita kuvan koko gradientista, eikä pelkästään sen x-akselin tai

(14)

y-akselin suuntaisesta komponentista saadaan lopulta koko gradientin magnitudi laskemalla q

I_x⁰(x,y)²+I_y⁰(x,y)². (2.5) Käytännössä neliöjuurioperaattorin laskennallisen vaativuuden takia käytetään magnitudista usein jotain approksimaatiota kuten itseisarvojen summaa (Ziou ja Tabbone 2000). Vastaa- vasti gradientin suunta saadaan laskemalla

tan⁻¹(I_y⁰(x,y)/I_x⁰(x,y)). (2.6) Mikäli kiinnostuksen kohteena ovat kuvassa pelkästään intensiteetin putoamiset tai nousut,

(a) Kynnysarvolla 40 kynnystetty kuvagradientti

(b) Cannyn algoritmin tulokset, missäk₁=40 ja k₂=120

Kuvio 2: Reunantunnistusmenetelmien tulokset esimerkkikuvassa

(15)

voidaan gradientista karsia tarpeen mukaan magnitudin perusteella positiiviset tai negatiivi- set arvot.

Kuvagradientin tuloksista pyritään lopuksi vielä tunnistamaan ne reunat, jotka ovat reunan- tunnistustehtävän kannalta olennaisia ja vastaavasti siis karsimaan epäolennaisia. Yksinker- tainen tapa karsia epäolennaisia reunoja on määrittää jokin kynnysarvo gradientin suuruudel- le ja korvata sitä pienemmät arvot nollalla ja suuremmat jollain nollaa suuremmalla vakiolla.

Kynnysarvon avulla saadut reunat sisältävät kuitenkin yleensä reunan lisäksi huomattavan määrän pikseleitä todellisen reunan ympäristöstä ja tuloksia täytyy edelleen jatkokäsitellä todellisen reunan löytämiseksi (kuva 2).

Yksinkertaista kynnysarvoa edistyneempi menetelmä on ei-maksimaalisten arvojen poisto (engl.non-maximum suppression), joka pyrkii löytämään gradientin lokaaleja maksimiarvo- ja gradienttivektorin suunnassa eli kohtisuorassa reunaa vastaan. Tämä menetelmä on käy- tössä Cannyn reunantunnistusalgoritmissa (Canny 1986), joka on yksi tunnetuimmista reu- nantunnistusalgoritmeista. Cannyn algoritmissa nämä tulokset vielä käsitellään niin sanotussa hystereesissä, jossa kahteen kynnysarvoonk₁ jak₂ perustuen hylätään heikkoja reunoja toisin sanoen reunoja, joissa gradientin arvo on jokaisessa pisteessä pienempi kuink₁ja säi- lytetään kaikki sellaiset reunat, joissa vähintään yhdessä pisteessä gradientin arvo on suu- rempi kuin k₂. Käytännössä siis Cannyn menetelmä sallii raja-arvon k₂ ylittävien reunojen pudota välillä raja-arvojenk₂jak₁väliin (Szeliski 2010).

(16)

3 Klusterointi

Ohjaamaton oppiminen on koneoppimisen suuntaus, jossa käytettävästä datasta haetaan yh- teyksiä ja riippuvuuksia pelkästään datasta itsestään löytyvän informaation perusteella. Klus- terointi on ohjaamattoman oppimisen tehtävä, jonka tavoitteena on ryhmitellä annettu data ominaisuuksiensa perusteella ohjatun oppimisen luokittelumenetelmistä poiketen ilman eril- listä ennakkotietoa datassa esiintyvistä luokista. Datasta siis pyritään löytämään klustereita eli osajoukkoja, joiden sisällä havainnot ovat keskenään samanlaisia ja vastaavasti erilaisia muiden osajoukkojen havaintoihin verrattuna (Hastie, Tibshirani ja Friedman 2009). Erilai- sia klusterointimenetelmiä on kehitetty useita, sillä esimerkiksi juuri sen määrittäminen mi- tä havaintojen samankaltaisuudella tarkoitetaan ei ole täysin yksiselitteistä. Myös se kuinka klusterit näyttäytyvät eri sovelluksissa vaihtelee huomattavasti, joten sopivan algoritmin valinta saattaa vaikuttaa merkittävästi saataviin tuloksiin. Esimerkiksi laajasti käytössä oleva K-means-algoritmi tapaa löytää ellipsoidimaisia klustereita, mikä ei sovelluksesta riippuen välttämättä ole toivottavaa (Xu ja Wunsch 2005). Ennakkotiedon puutteesta johtuen tämän- kaltaisten ongelmien havaitseminen ei usein ole mutkatonta, näinpä tulosten validoinnin ja tulkinnan merkitys korostuu.

Klusterointimenetelmät lajitellaan usein niiden toimintaperiaatteen mukaan hierarkkisiksi, tiheyspohjaisiksi tai prototyyppipohjaisiksi. Tässä luvussa käydään lyhyesti läpi näiden eri kategorioiden perusperiaatteet ja muutamia menetelmiä. On kuitenkin hyvä huomata, että jaottelu on varsin karkea ja sisältää osin päällekkäisyyttä. Lisäksi on myös olemassa esitellyn jaottelun ulkopuolisia klusterointimenetelmiä, esimerkiksi verkkoaineistojen klusteroinnissa käytettävät spektraali- ja verkkoperusteiset menetelmät (Zaki ja Meira Jr 2014).

3.1 Samankaltaisuuden mittaaminen

Klusterointia toteuttaessa täytyy ensin määritellä, mitä tarkoitetaan datapisteiden samankaltaisuudella. Jatkuvien muuttujien tapauksessa mittaus voidaan tehdä esimerkiksi geometri- seen etäisyyteen perustuen käyttäen ns. Minkowski-etäisyyttä, joka määritellään pisteiden

(17)

x,y∈R^N välille seuraavalla kaavalla:

D_n(x,y) = (

N i=1

∑

|x_i−y_i|ⁿ)¹ⁿ. (3.1)

Yleisesti käytettyjä esimerkkejä Minkowski-etäisyydestä ovat euklidinen etäisyys, jossan= 2 ja kortteli-etäisyys (engl.City Block Distance), jossan=1. Muita vaihtoehtoja samankaltaisuuden määrittelylle jatkuvien muuttujien tapauksessa on esimerkiksi tarkastella havaintojen korrelaatioita Pearsonin korrelaatiokertoimen avulla tai havaintojen välistä kulmaa ko- sinietäisyyden avulla (Xu ja Wunsch 2005). Diskreettien muuttujienx_i,x_j tapauksessa etäi- syydeksi voidaan määrittää

S(x_j,x_i) =







0 josx_i=x_j w muuten

, (3.2)

missäwon jokin sopivaksi valittu paino. Järjestysasteikollista diskreettiä muuttujaa saattaa tosin olla perusteltua käsitellä jatkuvana samankaltaisuutta laskiessa (Xu ja Wunsch 2009).

On hyvä huomata, että samankaltaisuuden laskemiseen oletetaan kussakin datapisteessä kaikkien muuttujien olevan määritetty. Tämä ei toteudu käytännön aineistoissa kovinkaan usein, joten puuttuvien arvojen käsittely tulee ottaa huomioon jo samankaltaisuutta laskiessa. Mikä- li puuttuvia arvoja on vain harvoissa havainnoissa, voidaan ne poistaa aineistosta kokonaan.

Muussa tapauksessa puuttuvat arvot voidaan käsitellä estimoimalla niiden arvoja muuhun aineistoon perustuen tai asettamalla niiden vaikutus etäisyyden laskussa nollaksi (Theodoridis ja Koutroumbas 2009).

Olennaista on myös huomata, että osa etäisyysmitoista ei ole skaala-invariantteja eli ne eivät ota huomioon muuttujien kokoluokkaa. Tästä johtuen suuria arvoja saavien muuttujien merkitys saattaa korostua tarpeettoman paljon etäisyyttä laskiessa. Ongelmaan voidaan puuttua datan normalisoinnilla. Yleinen normalisointitapa on niin sanottu Z-pisteytys, jossa muuttujien arvoista vähennetään niiden keskiarvo ja jaetaan ne niiden keskihajonnalla (Zaki ja Meira Jr 2014). Havainnollex_k,k∈ {1, ...,n}tämä saadaan laskettua siis kaavalla

x^stand._k =x_k−µ

sd , (3.3)

missä

µ = 1 n

n

∑

i=1

x_i, (3.4)

(18)

ja

sd= s 1

n−1

n

∑

i=1

(x_i−µ)². (3.5)

Näin kunkin muuttujan keskiarvoksi saadaan nolla ja keskihajonnaksi yksi, jolloin muuttujien väliset suhteet eivät aiheuta arvaamattomia vaikutuksia etäisyyksien laskentaan ja lopulta klusteroinnin tuloksiin.

3.2 Hierarkkinen klusterointi

Hierarkkiset klusterointimenetelmät toimivat joko osittavasti, jolloin alkutilanteessa kaikkien datapisteiden ajatellaan kuuluvan samaan klusteriin tai yhdistävästi, jolloin alkutilanteessa kaikkien datapisteiden ajatellaan kuuluvan omiin klustereihinsa (Theodoridis ja Kout- roumbas 2009). Hierarkkisissa menetelmissä täytyy määritellä vielä samankaltaisuuden mi- tan lisäksi ns. linkitysmenetelmä eli se, kuinka klusterien välinen etäisyys lasketaan. Yleises- ti käytettyjä tapoja ovat kokonaislinkitys (englComplete Linkage) ja yksittäislinkitys (engl.

Single Linkage). Kokonaislinkityksessä kahden klusterin väliseksi etäisyydeksi määritetään klusterien toisistaan kauimpana olevien havaintojen välinen etäisyys siinä, missä yksittäis- linkityksessä etäisyys määritetään lähimpien havaintojen välisenä etäisyytenä. Linkitysme- netelmässä voidaan myös käyttää klusteria kuvaamaan jotain valittua klusteriprototyyppiä eli yleensä jotain sopivaa klusterista laskettua keskilukua kuten keskiarvoa tai mediaania ja laskea etäisyydet näiden prototyyppien perusteella. Yhdistävä menetelmä etenee yhdistämällä valitun samankaltaisuuskriteerin ja linkitysmenetelmän perusteella läheisiä klustereita niin kauan, kunnes kaikki havainnot ovat samassa klusterissa. Osittava menetelmä vastaavasti pyrkii etsimään jaettavaa klusteria esimerkiksi klusterien hajonnan tai koon perusteella. Yh- distävä menetelmä on menettelytavoista yleisempi, sillä osittava menetelmä on hankalampi toteuttaa ja yleisesti myös laskennallisesti vaativampi (Xu ja Wunsch 2005).

Hierarkkisessa klusteroinnissa klusteroinnin tulokset voidaan esittää puumaisessa dendrogrammi-kuvaajassa. Dendrogrammissa klusteroinnin tulokset esitetään siten, että lehtisolmuissa ovat yksittäiset datapisteet ja muut solmut kuvaavat klusterien yhdistymistä tai erkaantumista (kuva 3). Klusterien etäisyys toisistaan esitetään dendrogrammissa yleensä dendrogrammin korkeutena. Dendrogrammin avulla pystytään arvioimaan, kuinka monta klusteria datassa

(19)

todellisesti on ja se on muutenkin varsin selkeä ja havainnollistava kuvaus klusteroinnin ra- kenteesta; tämä on eräs hierarkkisen klusteroinnin eduista. Hierarkkisen klusteroinnin ongelmia taas ovat sen herkkyys datassa esiintyvälle kohinalle ja poikkeaville havainnoille. On- gelmallista hierarkkisessa klusteroinnissa on myös sen ahneus, sillä se etenee etsimällä aina jollain perusteella parhaan jako- tai yhdistymiskohdan puuttumatta aikaisemmissa vaiheissa tehtyihin virheisiin (Xu ja Wunsch 2005).

Kuvio 3: Dendrogrammi hierarkkisen klusteroinnin tuloksista Iris-testidatassa

3.3 Tiheysperusteinen klusterointi

Tiheysperusteisessa klusteroinnissa klusterit määritellään pisteisiin, joiden ympäristössä on havaintoja tiheämmin kuin muualla datassa. Näin ollen tiheysperustaiset menetelmät eivät käytä havaintojen läheisyyttä samalla tavalla kuin esimerkiksi edellä esitellyt hierarkkiset menetelmät ja on esimerkiksi mahdollista että samassa klusterissa olevat pisteet ovat itse asiassa kauempana toisistaan kuin jonkin muun klusterin havainnoista (Zaki ja Meira Jr 2014). Tämän johdosta tiheysperusteinen klusterointi pystyy havaitsemaan muodoltaan

(20)

monenlaisia klustereita siinä, missä useissa muissa menetelmissä vaarana on muodostaa hy- perpallomaisia klustereita, vaikka klusterien muoto todellisuudessa olisi monimutkaisempi.

Tiheysperusteisissa menetelmissä merkittävää on myös se, että harvan ympäristön pisteet voidaan määritellä kohinaksi. Tämän takia tiheysperusteiset menetelmät ovat varsin hyviä käsittelemään aineiston poikkeavia havaintoja ja kohinaa.

Tunnetuin tiheysperusteinen klusterointialgoritmi on DBSCAN (Density Based Spatial Clus- tering of Applications with Noise) (Ester ym. 1996). DBSCAN määrittelee aineiston havainnot ydinpisteiksi, reunapisteiksi tai kohinaksi niidenε-ympäristön perusteella.ε-ympäristöllä tarkoitetaan tässä pistejoukkoa, jonka alkiot ovat korkeintaanε:n etäisyydellä tarkasteltavas- ta pisteestä. Ydinpisteiksi määritellään ne pisteet, joidenε-ympäristössä on vähintään jokin valittu minimimäärämhavaintoja. Reunapisteitä ovat sellaiset pisteet, joissa ydinpisteen eh- to ei toteudu, mutta jotka kuuluvat jonkin ydinpisteen ε-ympäristöön. Loput havainnoista määritellään kohinaksi. Esimerkki DBSCAN-algoritmilla toteutetun klusteroinnin tuloksista algoritmille soveltuvassa esimerkkidatassa löytyy kuvasta 4

Kuvio 4: Esimerkki DBSCAN-algoritmilla toteutetun klusteroinnin tuloksista

(21)

3.4 Prototyyppipohjainen klusterointi

Prototyyppipohjaisissa klusterointimenetelmissä aineisto pyritään jakamaan annettuun mää- rään klustereita tyypillisten alkioidensa ts. prototyyppien perusteella (Zaki ja Meira Jr 2014).

Prototyyppipohjaisissa menetelmissä siis edellä esitellyistä menetelmistä poiketen klusterien määrä on algoritmille määritettävä parametri ja menetelmä löytää aina annetun määrän klustereita, vaikka todellisuudessa klusterien määrä olisi eri. Prototyyppipohjaisten menetelmien etuna on helppo ja selkeä tulkittavuus, sillä ihmisen on helppo hahmottaa eri luokat niitä kuvaavien tyypillisten alkioiden avulla (Borgelt 2006).

(a) Alkutilanne: satunnaisesti valitut prototyypit ja niitä lähimmät pisteet

(b) Toinen iteraatio: prototyypit alkutilanteen klusterien keskiarvoina ja niitä lähimmät pisteet.

(c) Kolmas iteraatio (d) Neljäs iteraatio: konvergenssi

Kuvio 5: K-means-algoritmin eteneminen esimerkkidatassa. Todelliset luokat esitetään muotoina ja löydetyt klusterit väreinä.

(22)

Laajimmin käytetty prototyyppipohjainen menetelmä on niin sanottu K-means-algoritmi, jonka yleistä etenemistapaa voidaan kuvata seuraavasti mukaillen Zaki ja Meira Jr 2014:

1. Määritä alkuarvotk:lle klusteriprototyypille.

2. Etsi kullekin prototyypille sitä läheisimmät alkiot ja määritä ne kuulumaan kyseistä prototyyppiä vastaavaan klusteriin.

3. Määritä syntyneiden klusterien keskiarvot uusiksi prototyypeiksi.

4. Toista kohdasta 2, kunnes prototyypit eivät enää muutu.

Kuva 5 havainnollistaa algoritmin etenemistä yksinkertaisessa esimerkkidatassa.

K-means-algoritmi voidaan myös esittää ahneena optimointialgoritmina, jonka tavoitteena on löytää klusterien sisäisten keskineliövirheiden summan

SSE=

k

∑

i=1

|C_i|

∑

j=1

kx_{i j}−µ_ik² (3.6)

minimi, missäC_i ∀ i∈ {1, ...,k} ovat löydetyt k klusteria, µ_i ∀ i∈ {1, ...,k} niitä vastaavat prototyypit ja x_{i j} ∀ j ∈ {1, ...,|C_i|} i:nnen klusterin j:s alkio (Xu ja Wunsch 2005).

Yleinen tapa valita alkuarvot prototyypeille K-means-algoritmissa on yksinkertaisesti valita aineistosta satunnaisetk pistettä ensimmäiksi prototyypeiksi. Tämä on kuitenkin ongelmallista, sillä alkuarvojen valinta vaikuttaa klusteroinnin tuloksiin. Usein K-means-algoritmia sovelletaankin dataan useammin kuin kerran ja lopulliseksi klusterointitulokseksi määrite- tään havaitun keskineliövirheiden summan minimin perusteella paras. Myös vaihtoehtoisia alkuarvon määritystapoja on mahdollista soveltaa. Esimerkiksi K-means-algoritmin variaa- tiossa K-means++ ainoastaan ensimmäinen prototyyppi määritetään täysin satunnaisesti ja sitä seuraavat painotetaan siten, että aiemmin valittuja prototyyppejä etäisemmät pisteet valitaan todennäköisemmin (Arthur ja Vassilvitskii 2007).

Muita prototyyppipohjaisia klusterointimenetelmiä ovat esimerkiksi K-mediaani- ja K-medoi- di-algoritmit, joissa prototyyppeinä käytetään vastaavasti kaikkien muuttujien mediaaneista muodostettua vektoria tai medoidia eli aineistoon kuuluvaa keskimmäistä havaintoa. Näiden lisäksi prototyyppipohjaisiin menetelmiin kuuluu ns. pehmeitä klusterointimenetelmiä eli menetelmiä, joissa klusterien reunat voivat osin olla päällekkäisiä (Borgelt 2006). Havain- tojen ei siis määritetä yksinkertaisesti kuuluvan tai olevan kuulumatta annettuun klusteriin

(23)

vaan kuulumiselle määritetään todennäköisyys. Esimerkki pehmeästä klusterointimenetel- mästä on uskottavuuden maksimointialgoritmi, jonka avulla voidaan etsiä suurimman uskottavuuden perusteella parhaiten aineistoa selittävä normaalijakaumista muodostettu sekamalli (Hastie, Tibshirani ja Friedman 2009).

3.5 Klusterien validointi ja tulkinta

Koska klusteroinnin tavoitteena on löytää aineistosta luokkia ilman ennakkotietoa olemassa olevista luokista, ei validoinnissa voida ohjatun oppimisen luokittelumenetelmistä poiketen yleisessä tapauksessa käyttää kyseistä pohjatietoa. Näin ollen klusteroinnin validointi on haastava tehtävä ja tulosten laadun arviointi nojaa pitkälti heuristisiin arvioihin (Hastie, Tibshirani ja Friedman 2009). Myös validointimenetelmiä on tästä johtuen kehitetty useita ja validointia tehdäänkin usein soveltamalla klusterointiin useampia menetelmiä ja tekemällä päätelmiä niiden yhteisistä tuloksista.

Yleisesti validoinnin avulla suoritettavia tehtäviä on arvioida syntyneiden klusterien oikeelli- suutta ja selvittää kuinka monta klusteria klusterointiin tarvitaan niiden menetelmien tapauksessa, joissa klusterien määrä on käsin määritettävä parametri. Validointimenetelmät voidaan jaotella ulkoisiin, sisäisiin tai suhteellisiin (Halkidi, Batistakis ja Vazirgiannis 2001). Tässä alaluvussa esitellään lyhyesti tyyppien perusideat ja muutama kunkin tyypin validointime- netelmä idean havainnollistamiseksi. Tarkempaa tietoa monista muista validointimenetelmiä on koonnut esim. Zaki ja Meira Jr 2014.

3.5.1 Ulkoinen validointi

Ulkoisissa validointimenetelmissä klusteroinnin tuloksia arvioidaan jotain aineistosta tunnettua ositusta vasten (Halkidi, Batistakis ja Vazirgiannis 2001). Yleensä klusterointi suoritetaan aineistoissa, joissa tällaista ennakkotietoa ei ole, joten ulkoinen validointi on useimmiten käytännöllistä lähinnä klusterointimenetelmien testaamiseen valmiiksi luokitellussa datassa. Ulkoisen validoinnin menetelmät perustuvat klusterien ja todellisten luokkien ris- tiintaulukointiin. Ristiintaulukointi on myös varsin selkeä tapa havainnollistaa klusteroinnin tuloksia todellisten luokkien ollessa saatavilla.

(24)

OlkoonC_i∀i∈ {1, ...,k}löydetytkklusteria,T_j∀ j∈ {1, ...,r}todellinen tunnettu aineiston ositus ja n koko aineiston havaintojen lukumäärä. Klusteroinnin puhtaus P (engl. purity) määritellään kaavalla

P= 1 n

k i=1

∑

j∈1,..,rmax(|C_i∩T_j|). (3.7)

Jos k=r, puhtauden maksimiarvo on siis 1 vastaten tilannetta, jossa klusterointi vastaa to- dellista ositusta täydellisesti. Puhtauden laskemisessa on mahdollista, että yhdelle todelliselle luokalle voidaan määrittää useita vastaavia klustereita. Tämä voi heikentää puhtausarvon tulkittavuutta joissain tapauksissa. Vastaava menetelmä, jossa sallitaan kullekin todelliselle luokalle vain yksi vastaava klusteri, tunnetaan nimellä maksimien yhteen sovittaminen (engl.

Maximum matching) (Zaki ja Meira Jr 2014).

Toinen yleinen ulkoisen validoinnin menetelmä on käyttää informaatioteoriaan perustuvaa entropian käsitettä, joka kuvaa sitä, kuinka paljon informaatiota annettu todennäköisyyksiin perustuva ilmiö keskimäärin tuottaa. Klusteroinnin validoinnissa ehdollinen entropia kuvaa klusteroinnin jälkeen aineistoon jäljelle jäävän entropian määrää (Zaki ja Meira Jr 2014).

Merkitään p_{i j} = ^|T^j^∩C_n ⁱ^| ja p_C_i = ^|C_nⁱ^|. p_{i j} on siis todennäköisyys, että havainto kuuluu se- kä klusteriinC_i että luokkaan T_j ja p_C_i todennäköisyys, että havainto kuuluu klusteriinC_i. Ehdollinen entropia määritellään klusteroinnilleCkaavalla

H(T|C) =−

k i=1

∑

r j=1

∑

P(T_j∩C_i)log(P(T_j|C_i)) =−

k i=1

∑

r

∑

j=1

p_{i j}log(p_{i j}

p_C_i). (3.8) Ehdollinen entropia saa arvoja väliltä [0,log(k)], missä 0 vastaa parasta vastaavuutta ja log(k)vastaavasti huonointa. Käytännössä huonoin vastaavuus vastaa siis sitä tilannetta, jossa klusterointi ei lisää informaation määrää lainkaan.

3.5.2 Sisäinen validointi

Sisäiset menetelmät kuvaavat datasta ja klusteroinnin tuloksista itsestään laskettujen tulosten avulla klusterien sisäistä ja välistä vaihtelua (Halkidi, Batistakis ja Vazirgiannis 2001). Klus- terien sisäinen vaihtelu halutaan minimoida ja klusterien väliset etäisyydet maksimoida. Eri- laiset sisäiset validointi-indeksit perustuvatkin eri tapoihin laskea näitä arvoja ja niiden väli- siä suhteita. Selkeyden vuoksi kaavat esitetään tässä alaluvussa euklidisen etäisyyden avulla, mutta periaatteessa myös muita etäisyysmittoja on mahdollista käyttää.

(25)

Davies-Bouldin-indeksi (Davies ja Bouldin 1979) määritetään klusterien parittaisten vertai- lujen perusteella siten, että klusterienC_ijaC_j sisäinen vaihtelu kuvataan niiden keskihajon- tojen summana ja niiden välinen etäisyys taas klusterien keskiarvojen etäisyytenä toisistaan.

Kullekin klusterille etsitään se klusteri, joka maksimoi kyseisen suhteen ja näin saadut arvot summataan. Lopulta siis

DB= 1 k

k

∑

i=1

maxj6=i

sd(C_i) +sd(C_j) kC_i−C_jk

. (3.9)

Indeksi saa suuria arvoja kun klusterien keskiarvot ovat lähellä toisiaan ja keskihajonnat suuria, näinpä siis pienet arvot ovat toivottavia.

Niin sanotussa siluetti-indeksissä (Rousseeuw 1987) sisäinen vaihtelu lasketaan laskemalla kullekin klusterinC_i pisteellexsen keskimääräinen etäisyys muihin saman klusterin pisteisiin, siis

m(x) = 1

|C_i| −1

|Ci| i=1

∑

kx−x_ik. (3.10)

Jakaja on|C_i| −1, silläx:n etäisyyttä itseensä ei oteta huomioon. Klusterien välistä etäisyyttä kuvataan taas laskemalla kullekin klusterinC_ipisteellexkeskimääräinen etäisyys sitä lähinnä olevan klusterin pisteisiin, eli

M(x) = min

Cj∈{C1,...,C_k},x/∈Cj

( 1

|C_j|

|Cj| i=1

∑

kx−x_ik). (3.11)

Yhden pisteen siluettiarvos(x)määritetään näiden arvojen perusteella laskemalla s(x) = M(x)−m(x)

max(M(x),m(x)). (3.12)

Nähdään selvästi, että siluettiarvo saa siis arvoja väliltä [−1,1], missä lähellä 1:tä kertovat pisteen olevan lähellä muita saman klusterin pisteitä ja suhteellisen kaukana lähimmän klusterin pisteistä. Arvot lasketaan kullekin pisteelle ja lopullinen indeksin arvo saadaan kaikkien pisteiden siluettiarvon keskiarvona.

3.5.3 Suhteellinen validointi

Suhteellisessa validoinnissa selvitetään eri klusterointien välisiä suhteita (Zaki ja Meira Jr 2014). Suhteellista validointia voidaan käyttää esimerkiksi etsittävien klustereiden määrän

(26)

määrittämiseen soveltamalla jotain edellä esitellyistä ulkoisista tai sisäisistä validointimene- telmistä verraten indeksien tuloksia eri klusterien määrän välillä. Suhteellisella validoinnilla voidaan myös arvioida klusteroinnin vakautta, eli sitä kuinka läheisesti samasta jakaumas- ta tuleville aineistoille tehdyt klusteroinnit vastaavat toisiaan (Zaki ja Meira Jr 2014). Tämä voidaan tehdä esimerkiksi vertailemalla klusterointeja aineistosta muodostettujen bootstrap- otosten välillä. Myös klusteroitavuuden, eli sen onko aineistossa todellisuudessa edes mer- kityksellisiä klustereita, selvittäminen voidaan tehdä suhteellisen validoinnin keinoin (Zaki ja Meira Jr 2014). Klusteroitavuutta voidaan kuvata esimerkiksi vertailemalla klusteroinnin tuloksia satunnaisesti tasajakautuneen aineiston klusterointiin tai aineistosta satunnaisesti muodostettuun klusterointiin.

3.5.4 Klusterien tulkinnasta

Lopulta on kuitenkin hyvä huomioida että, koska validointi perustuu lähinnä heuristisiin arvioihin siitä miltä klusterin odotettaisiin näyttävän, korostuu tulosten tulkinnan merkitys klusteroinnin tulosten todellisen käytännön arvon selvittämisessä. Klusteroinnin tavoitteena on usein löytää datasta arvaamattomia ja ihmiselle hankalasti havaittavia yhteyksiä, jolloin klusterien todellisen arvon arvioiminen saattaa vaatia merkittävää lisätutkimusta ja käytän- nön kokeiluja (Xu ja Wunsch 2005).

(27)

4 Polven nivelrikko ja sen tietokoneavusteinen diagnosointi

Tässä luvussa selvitetään kirjallisuudesta löytyviä tietokoneavusteisia menetelmiä polven nivelrikon diagnosointiin. Tätä pohjustetaan ensin esittelemällä polven nivelrikkoa selittä- vät muuttujat sekä niiden perusteella tehtävät nivelrikon vakavuuden arviointiin tarkoitetut luokittelujärjestelmät.

4.1 Polven nivelrikkoon liittyvät muuttujat ja luokitusjärjestelmät

Polven nivelrikon edistymiseen liittyvät erilaiset muutokset nivelen rakenteessa, joiden perusteella nivelrikon vakavuutta voidaan arvioida. Näitä muutoksia voidaan arvioida röntgen- kuvista havaittavien muuttujien perusteella. Muutoksia ovat röntgenkuvista selkeästi havait- tavissa oleva nivelvälin kaventuminen, joka johtuu nivelruston kulumisesta. Toinen muutos on osteofyytit eli luupiikit nivelen ympäristössä. Osteofyytit voidaan havaita röntgenkuvis- ta sääri- ja reisiluun ulkoreunasta ulkonevina epäsäännöllisyyksinä. Röntgenkuvista voidaan havaita lisäksi subkondraalinen skleroosi, eli rustonalaisen luun kalkkeutuminen, jonka voi havaita luunpinnassa esiintyvinä muuta pintaa vaaleampina kohtina (Swagerty ja Hellinger 2001).

Polven nivelrikon diagnosoinnissa röntgenkuvien perusteella laajimmin käytössä oleva luo- kittelujärjestelmä on Kellgren ja Lawrence 1957 esittelemä KL-luokitus (Kohn, Sassoon ja Fernando 2016). Luokitus perustuu edellä esitettyihin nivelen rakenteen muutoksia kuvaaviin muuttujiin. KL-luokitus jakaa nivelrikon vakavuuden viiteen luokkaan. Suomalaisen Lääkä- riseuran Duodecimin ja Suomen Ortopediyhdistys ry:n asettama työryhmä 2018 määrittelee KL-luokat seuraavasti:

• 0, Ei nivelrikkoa: ei muutoksia nivelen rakenteessa.

• 1, Mahdollinen nivelrikko: mahdollinen nivelraon kaventuminen ja mahdollinen reu- naosteofyytti.

• 2, Minimaalinen nivelrikko: selvät osteofyytit ja mahdollinen nivelraon kaventuminen.

(28)

• 3, Kohtalainen nivelrikko: useita kohtalaisia osteofyyttejä, selvä nivelraon kaventuminen ja jonkin verran skleroosia ja mahdollinen luiden päiden deformiteetti.

• 4, Vakava nivelrikko: Kookkaita osteofyyttejä, merkittävä nivelraon kaventuminen, vaikea skleroosi ja selvä luiden päiden deformiteetti.

Esimerkit kunkin luokan polvien röntgenkuvista löytyvät kuvasta 6

(a) KL 0 (b) KL 1 (c) KL 2

(d) KL 3 (e) KL 4

Kuvio 6: Esimerkit eri KL-luokitusten polvien röntgenkuvista (kuvat: Osteoarthritis Initiati- ve (OAI) 2008)

Nivelrikon kokonaisvaltaista edistymistä kuvaavan KL-luokituksen lisäksi myös yksittäis- ten polven nivelrikkoa selittävien muuttujien vakavuuden arviointiin on kehitetty niin sanottu OARSI-luokittelujärjestelmä (Osteoarthritis Research Society International) (Altman ja Gold 2007). OARSI-luokituksen avulla voidaan arvioida sääriluun ja reisiluun osteofyytte- jä ja nivelvälin kaventumista mediaalisella ja lateraalisella puolella asteikolla 0–3, missä 3 vastaa vakavinta astetta ja 0 vastaavasti muuttujan olevan muuttumattomalla tasolla. OARSI-

(29)

luokitteluun kuuluu myös skleroosin ja hankauksen (engl.attrition) esiintymisen määrittä- minen binäärisesti.

Luokittelujärjestelmien ulkopuolinen, mutta mahdollisesti varhaiseen nivelrikkoon liittyvä muuttuja on sääriluun eminentian terävöityminen. Donnelly ym. 1996 esittää tavan kuvata kyseistä muuttujaa eminentian korkeuden sekä huipun kulman perusteella ja näyttää, että muuttujalla on heikko yhteys nivelrikon edistymiseen tarkastelemalla muuttujan korrelaatioita KL-luokituksen ja muiden nivelrikkoa selittävien muuttujien välillä. Lisäksi tutkimuksen perusteella lateraalipuolella eminentian kulman terävöitymisellä vaikuttaisi olevan heikko yhteys kipuun polvessa. Kinds ym. 2012 taas antaa viitettä, että eminentian korkeuden avulla pystyisi mahdollisesti ennakoimaan nivelrikon edistymistä. Tulokseen päädyttiin vertailemalla pitkittäisaineistossa muuttujan arvoja polvissa, joiden KL-luokitus oli kasvanut luokasta 0 tai 1 viidessä vuodessa luokkaan välille 2–4 ja polvia, joiden luokka oli pysynyt luokkaa 2 alempana.

4.2 Polven nivelrikon tietokoneavusteinen diagnosointi röntgenkuvista

Tietokoneavusteinen diagnosointi on yksi tapa lisätä diagnosoinnin objektiivisuutta ja tois- tettavuutta. Polven nivelrikon yleisyyden takia tietokoneavusteisia menetelmiä onkin kehitetty varsin useita. Menetelmät perustuvat useimmiten yllä esiteltyjen muuttujien sekä KL- luokituksen automaattiseen määrittämiseen. Näinpä tietokoneen avulla tehtävä diagnosointi nähdään usein kuvien luokittelutehtävänä. Tässä osiossa esitellään muutama tutkielman kannalta mielenkiintoinen polven nivelrikon tietokoneavusteiseen diagnosointiin käytetty mene- telmä. Yleiskatsauksen useista muista menetelmistä tarjoaa Gornale, Patravali ja Manza 2016 laatima alan tutkimusta kartoittava artikkeli.

4.2.1 Polven nivelrikon tietokoneavusteinen diagnosointi

Suuri osa polven nivelrikon diagnosoinnin automaattisista menetelmistä perustuu kuva-aineiston parametrisointiin joko nivelrikkoa tai kuvan yleistä rakennetta selittäviin muuttujiin. Me- netelmät voivat olla puoliautomaattisia tai automaattisia. Puoliautomaattisissa menetelmissä ohjelma tarvitsee käyttäjän määrittämään tiettyjä kriittisiä pisteitä röntgenkuvista muuttujien

(30)

automaattista laskemista varten (Marijnissen ym. 2008). Puoliautomaattisissa menetelmissä etuna on läpinäkyvyys, tarkkuus ja toistettavuus, mutta ongelmallista niissä on se, että ne vaativat huomattavan määrän käsin tehtävää työtä ja eivät siten juuri vähennä diagnosointiin kuluvaa aikaa. Lisäksi ihmisen sisällyttäminen diagnosointiprosessiin lisää mahdollisuutta virheille ja systemaattiselle harhalle tuloksissa.

Näin ollen kysyntä täysin automaattisille diagnosointimenetelmille on varsin selvä. WNDC- HARM (Weighted Neighbor Distances using a Compound Hierarchy of Algorithms Repre- senting Morphology) on Lior Shamir ym. 2008 esittelemä yleiskäyttöinen menetelmä lääke- tieteellisten kuvantamistulosten automaattiseen analysointiin. Menetelmä perustuu useisiin yleisesti tunnettuihin konenäössä käytettyihin muunnoksiin ja kuvan rakennetta kuvaaviin koostemuuttujiin. Näin ollen menetelmä ei vaadi käytännössä mitään prioritietoa mielenkiinnon kohteena olevasta diagnosointitehtävästä ja kaikki informaatio saadaan itse käsitte- lyssä olevasta kuvasta. Polven nivelrikon diagnosointiin sovellettaessa menetelmä saavuttaa kohtalaisen hyvän luokittelutarkkuuden toisistaan yli yhden KL-luokan päässä toisistaan olevien polvien erotteluun, mutta vierekkäiset luokat tuottavat ongelmia (L. Shamir ym. 2009).

Kaikkien luokkien välisessä luokittelutehtävässä menetelmä saavuttaa luokittelutarkkuuden 47 %. Menetelmässä ongelmallista on, että luokitteluun käytetyt muuttujat ovat varsin hei- kosti tulkittavissa tai yhdistettävissä todellisiin polven nivelrikkoa selittäviin muuttujiin.

Täysin automaattinen eksplisiittisesti polven nivelrikkoa selittävien muuttujien laskemiseen käytetty menetelmä on Oka ym. 2008 esittelemä KOACAD (Knee osteoarthritis computer aided diagnosis). Menetelmä etsii reunantunnistusmenetelmien avulla polven röntgenkuvas- ta mielenkiinnon kohteena olevat reunat: sääri- ja reisiluun pinnat sekä ulkoreunat. Löydet- tyjen reunojen perusteella lasketaan nivelvälin minimikohdat ja pinta-alat sekä lateraali- että mediaalipuolilta, osteofyyttien pinta-ala ja sääri- ja reisiluun välinen kulma. Oka ym. 2008 näyttää merkitsevän yhteyden menetelmän avulla laskettujen muuttujien ja KL-luokituksen sekä OARSI-luokitusten välille. Menetelmän osoitetaan myös saavuttavan hyvän toistetta- vuuden soveltamalla sitä samasta polvesta muutaman viikon välein ja eri kulmista otettuihin kuviin. Lisäksi Oka ym. 2010 tutki laskettujen muuttujien kynnysarvojen perusteella teh- tävää luokittelua ryhmien jotka sisältävät KL-luokkia 0–1 ja 2–4 sekä luokkia 0–2 ja 3–4 välille saavuttaen hyviä tuloksia etenkin mediaalisen nivelraon kaventumisen osalta. Kaik-

(31)

kien muuttujien perusteella tehtävää luokittelua, eikä yksittäisten luokkien välistä luokittelua muuttujiin perustuen ole tehty.

Siinä missä polven reunat KOACAD-menetelmässä selvitetään käyttäen esitietona ainoastaan informaatiota nivelen sijainnista ja siitä minkä tyyppisiä reunoja nivel sisältää, voidaan esitietona käyttää myös informaatiota polven yleisestä muodosta. Tähän tehtävään soveltuu tilastolliset muotomallit (engl.Statistical Shape Models, SSM). Lyhyesti ilmaistuna tilastolliset muotomallit toimivat käsin määritettyjen etsittävän objektin pintaa seuraavien kriittisten pisteiden sijainnin jakauman perusteella, Cootes 1992 tarjoaa tarkemman selvityksen me- netelmän toiminnasta. Tilastolliset muotomallit toimivat hyvin tehtävissä, joissa halutut ob- jektit ovat kuvissa helposti arvattavissa sijainneissa ja joiden muoto vaihtelee helposti mal- linnettavalla tavalla. Näin ollen lääketieteellisen kuvantamisen tulokset ja erityisesti polven röntgenkuvat ovat varsin selvästi menetelmälle sopiva sovellusala; lääketieteellisessä kuvan- tamisessa noudatetaan useimmiten jotain tunnettua standardia ja vaihtelu polven muodossa on pääosin varsin arvattavaa.

Lindner ym. 2013 ja Thomson ym. 2015 ovatkin tutkineet muotomallien toimivuutta luiden reunojen tunnistamiseen polven röntgenkuvista automaattisesti ja osoittaneet, että menetel- mä toimii hyvin. Thomson ym. 2015 lisäksi testasi kuvien luokittelua nivelrikollisiin (KL 2–4) ja nivelrikottomiin (KL 0–1) muotomalleihin perustuvien polven muotoa kuvaavien muuttujien perusteella saavuttaen edeltäviin menetelmiin verrattavissa olevia tuloksia. Muo- toon perustuvien muuttujien havaittiin kuitenkin kuvaavan selvästi lähinnä nivelvälin korkeutta, eivätkä ne siis ottaneet juuri huomioon osteofyyttejä. Thomson ym. 2016 testasikin jatkotutkimuksessa vielä menetelmää, jossa osteofyytteihin kiinnitettiin erityisesti huomio- ta ja saavutti siihen mennessä toteutetuista automaattisista menetelmistä parhaat tulokset osteofyyttien tunnistamisessa sekä binäärisessä nivelrikon luokittelutehtävässä. Kaikkien luokkien välisessä luokittelussa menetelmän avulla päästään 50 % luokittelutarkkuuteen. Myös- kään näissä menetelmissä nivelrikon luokittelemiseen käytetyt muuttujat eivät tosin ole täy- sin mutkattomasti tulkittavissa. Mielenkiintoista olisikin nähdä voitaisiinko nivelrikkoa kuvaavat muuttujat laskea KOACAD:ia vastaavalla tavalla muotomallien avulla saatavista reu- napisteistä.

Viime aikoina useissa konenäkötehtävissä hyvin pärjänneiden konvolutionaalisten syvien

(32)

neuroverkkojen soveltuvuutta myös polven nivelrikon automaattiseen diagnosointiin rönt- genkuvista on tutkittu melko laajasti. Neuroverkko on alun perin koneoppimisen luokitte- lumenetelmä, joka pyrkii jäljittelemään aivojen toimintaa käyttämällä luokitteluun useita yksinkertaisia linkitettyjä luokittelijoita: "neuroneita". Neuroverkot koostuvat sisääntuloker- roksesta, joka vastaanottaa luokiteltavan datan, tietystä määrästä piilokerroksia, joiden avulla lasketaan dataa selittävät muuttujat sekä ulostulokerroksesta, joka kertoo lopulta luokittelun tuloksen (Goodfellow, Bengio ja Courville 2016).

Syvissä neuroverkoissa idea on lisätä piilokerroksien määrää monimutkaisempien ja yksi- tyiskohtaisempien muuttujien havaitsemiseksi. Konvolutionaalisessa syvässä neuroverkossa neuroverkon piilokerroksissa käytetään konvoluutioytimiä, joiden avulla pystytään havaitsemaan muuttujia kuva-aineistosta (Goodfellow, Bengio ja Courville 2016). Käytännössä konvolutionaalisten syvien neuroverkkojen avulla pystytään automaattisesti luomaan konvo- luutioytimiä, jotka auttavat löytämään kuva-aineistosta mielenkiinnon kohteena olevia piir- teitä siinä, missä ne perinteisesti ollaan luotu käsin (ks. luku 2). Neuroverkkoja on kritisoitu jossain määrin siitä, että ne toimivat pitkälti mustana laatikkona, eikä ole aina selvää mil- lä perusteella ne päätyvät niihin päätöksiin, joita ne tekevät. Yksi tapa havainnollistaa pää- töksentekoa konvolutionaalisten neuroverkkojen tapauksessa on esittää luokitelluista kuvista ns. aktivaatiokartat, joista voi nähdä mitkä alueet kuvassa vaikuttivat luokittelutulokseen (O’Shea ja Nash 2015).

Tiulpin ym. 2018 ja Antony ym. 2017 ovat tutkineet KL-luokituksen automaattista määrit- tämistä syvien neuroverkkojen avulla ja saavuttaneet hyviä tuloksia. Tällä hetkellä parhaa- seen saavutettuun kaikkien KL-luokkien välillä tehtävään luokittelutarkkuuteen 67 % ollaan päästy juuri neuroverkkojen avulla (Tiulpin ja Saarakkala 2019). Antony 2017 ja Tiulpin ja Saarakkala 2019 ovat lisäksi tutkineet neuroverkkojen käyttöä yksittäisten polven nivelrikkoa selittävien muuttujien OARSI-luokitusten määrittämiseen ja vastaavasti saaneet hyviä tuloksia. Myös OARSI-luokituksen automaattisen määrittämisen osalta parhaat tulokset on saavuttanut Tiulpin ja Saarakkala 2019. Saavutetut luokittelutarkkuudet vaihtelevat muuttujien välillä 64% – 81%.

Tiulpin ym. 2019 ovat lisäksi tutkineet polven nivelrikkoa seuraavan pitkittäisaineiston perusteella, voidaanko röntgenkuvista jo nivelrikon varhaisessa vaiheessa neuroverkkojen avul-

(33)

la ennustaa, sitä minkä polvien nivelrikon vakavuus tulee edistymään. Analyysi tehtiin luo- kittelemalla aineisto edistyjiin ja ei-edistyjiin sen perusteella, oliko polvien KL-luokitus kasvanut käyntien välillä. Tutkimus saavutti lupaavia tuloksia ja erityisesti tämän tutkielman kannalta mielenkiintoista on, että osassa syntyneen neuroverkkomallin aktivaatiokartoista eminentian huiput olivat näkyvillä. Tämä antaa lisää mahdollista viitettä siihen, että emi- nentioiden terävöitymisen avulla pystyttäisiin joissain tapauksissa ennakoimaan nivelrikon edistymistä.

4.2.2 Polven automaattinen paikannus

Ennen diagnosointia polven sijainti röntgenkuvassa tulee saada määritettyä. Yksinkertaisim- mat automaattiset tehtävään käytetyt menetelmät perustuvat liukuvan ikkunan käyttöön siten, että käsin määritettyjä polven keskikohdan sisältäviä kuvia liu’utetaan kuvassa laskien alueiden vastaavuus ikkunoihin. Eniten ikkunoita vastaava sijainti määritetään polven sijainniksi.

Tällä menetelmällä saadut tulokset ovat kuitenkin varsin heikkoja. Hyvään lokalisointitark- kuuteen ollaan päästy esimerkiksi edellä esiteltyihin neuroverkkoihin (Antony ym. 2017) pe- rustuvilla menetelmillä. Tutkielmassa käytetty anatomisesti perusteltuihin ehdotuksiin kiinnostuksen kohteena olevasta alueesta perustuva lokalisointimenetelmä (Tiulpin ym. 2017) kuvaillaan tarkemmin tutkielman empiiristä osiota käsittelevässä luvussa 5.

(34)

5 Polven nivelrikkoa selittävien muuttujien automaattinen havaitseminen röntgenkuva-aineistosta

Tutkielman empiirisessä osuudessa toteutettiin menetelmä, jonka avulla voidaan laskea polven nivelrikkoa selittäviä muuttujia automaattisesti röntgenkuvista pohjautuen Oka ym. 2008 toteuttamaan KOACAD-menetelmään. Menetelmän avulla laskettiin kyseiset muuttujat avoimesti saatavan röntgenkuva-aineiston otoksesta ja tuloksia arvioitiin tarkastelemalla muuttujien korrelaatioita aineistossa oleviin ammattilaisten tekemiin OARSI- ja KL-luokituksiin.

Menetelmään päädyttiin sen läpinäkyvyyden ja helpon tulkittavuuden perusteella. Lisäksi muuttujien haluttiin olevan jatkuvia tutkielmassa toteutettavaa klusterointia varten.

5.1 Aineiston kuvaus

Aineistona tutkielmassa käytettiin kahta otosta OAI:n (Osteoarthritis Initiative) nivelrikkoon liittyvää dataa ja kuvantamistuloksia kokoavasta pitkittäisaineistosta, joka on avoimesti saatavilla osoitteesta https://nda.nih.gov/oai. Tutkielmassa aineistosta hyödynnettiin alkuperäi- sen tutkimuksen ensimmäisen käynnin yhteydessä otettuja polven röntgenkuvia sekä niistä tehtyjä KL- ja OARSI-luokituksia. Otoksista ensimmäistä käytettiin menetelmän kehittämi- sessä ja toista testaamisessa. Näin menetellen pyrittiin vähentämään testitulosten harhaa ja varmistamaan, että menetelmä toimii myös kehityksessä käytetyn datan ulkopuolella. Otok- set valittiin siten, että valituissa kuvissa olisi vähintään 100 havaintoa kustakin KL-luokasta.

Testidataan valittiin lopulta yhteensä 485 röntgenkuvaa, joista 10 osoittautui tyhjiksi. Lo- pulta aineistossa on siis 475 röntgenkuvaa eli 950 polvea, joissa eri KL-luokat jakautuvat seuraavasti:

KL-luokitus 0 1 2 3 4 ei määritetty

Määrä 235 192 217 192 107 1

.

Röntgenkuvat aineistossa ovat taivutetuista polvista etu-taka-suunnassa kuvattuja kuvia (engl.

Bilateral posteroanterior fixed flexion X-ray). Röntgenkuvat esitetään DICOM-muodossa (Digital Imaging and Communications in Medicine), joka on standardin mukainen tapa koota

(35)

lääketieteellisiä kuvantamistuloksia sekä niihin liittyvää metadataa. Kuvien keskimääräinen resoluutio on 3190×2636 kuvapistettä, keskihajonta x-akselilla on 841 pikseliä ja y-akselilla 645 pikseliä.

5.2 Polven sijainnin määrittäminen röntgenkuvista

Tutkielmassa päädyttiin polven sijainnin määrittämisessä käyttämään Tiulpin ym. 2017 ke- hittämää menetelmää, sillä Tiulpin ym. 2017 osoittivat sen toimivan hyvin useissa eri polven röntgenkuvia kokoavissa aineistoissa. Lisäksi menetelmän toteutus ja valmiiksi opetettu tu- kivektorikonemalli (engl.Support Vector Machine, SVM) oli helposti saatavilla menetelmän kehittäneen tutkimusryhmän julkisella GitHub-tilillä. Menetelmä tarjoaa ensin ehdotuksia kiinnostuksen kohteena olevasta alueesta (engl.Region of Interest, ROI) polven keskikohdan sijainnille sekä keskikohtaa ympäröivän koko nivelen sisältävän neliön koolle. Muodostu- neista ehdotuksista paras valitaan pisteyttämällä ne SVM-mallilla, joka on opetettu luokittelemaan ehdotukset joko onnistuneiksi tai epäonnistuneiksi.

5.2.1 Lokalisointimenetelmän kuvaus

OlkoonW kuvan leveys jaHkuvan korkeus. Ehdotukset luodaan siten, että x-akselilla keski- kohdaksi ehdotetaan kuvan keskikohtaa ja sen ympäristössä sijaitsevia pisteitä ¹₂W+ j∀j∈ {−¹₄W,−¹₄W+p,−¹₄W+2p, ...,¹₄W}, missä pon valittu pikseliarvo pisteiden välillä. Tiul- pin ym. 2017 päätyivät arvoon p=95 tarkastelemalla arvon merkitystä menetelmän saa- vuttamaan nopeuteen ja ehdotuksen vastaavuuteen käsin merkittyyn ROI:hin. Vastaavuuden laskemiseen käytetään Jaccardin indeksiä ts. IoU-arvoa (Intersect over Union), joka laskee ehdotetun ROI:nAja käsin merkityn ROI:nBleikkauksen koon suhteen niiden unionin ko- koon

IoU =|A∩B|

|A∪B|.

Menetelmässä erityisesti on mielenkiintoista tapa, jolla y-akselin keskikohdan ehdotukset muodostetaan. Menetelmä hyödyntää tietoa polven anatomiasta pyrkien löytämään polvi- lumpion aiheuttaman huipun ja sitä seuraavan nivelvälistä johtuvan nopean pudotuksen kuvan intensiteettien vertikaalisessa marginaalijakaumassa. Marginaalijakauma saavutetaan sum-

(36)

maamalla pikselien intensiteettiarvot riveittäin. Marginaalijakauma konvoloidaan keskiarvo- suodattimella huippujen määrän vähentämiseksi ja konvoluution tuloksesta otetaan itseisar- vo, sillä kiinnostuksen kohteena ovat sekä huiput että laaksot. Itseisarvotetusta tuloksesta etsitään huippukohdat ja niistä y-akselin keskikohdan ehdotuksiksi valitaan suurimmat 10%.

Lopulta ROI:n kooksi ehdotetaan käsin muodostettujen ROI-alueiden kokojen keskiarvon ja keskihajonnan perusteella laskettuja arvoja ^H_Z

i ∀Z_i ∈ {3,0; 3,2; 3,4; 3,6; 3,8; 4,0; 5,0}.

Kuvio 7: Esimerkki polven lokalisointimenetelmän toiminnasta: ehdotukset polven keskikohdasta punaisina pisteinä sekä valittu ROI neliöitynä (röntgenkuva: Osteoarthritis Initiati- ve (OAI) 2008)

Syntyneistä ehdotetuista kuva-alueista muodostetaan gradienttihistogrammit (engl. Histo- gram of Oriented Gradients, HOG), jotka kuvaa eri suuntaisten kuvagradienttien esiintymis- määriä annetun ROI-ehdotuksen eri kuva-alueilla. HOG-vektorit luokitellaan SVM-mallilla, joka on opetettu käsin annotoiduilla ROI-ehdotuksilla luokittelemaan ehdotukset joko onnistuneiksi tai epäonnistuneiksi. SVM-mallin luomiseen käytetyssä opetusdatassa epäonnis- tuneiksi määriteltiin alle 0,8 IoU-arvon saavuttaneet ehdotukset. Opetusdatassa luokat koo-

(37)

dataan arvoiksi -1 ja 1, joten valmiissa mallissa siis SVM antaa positiivisia arvoja onnistuneiksi luokitelluille ehdotuksille ja negatiivisia epäonnistuneille. Suurimman arvon saava ROI-ehdotus valitaan lopulta kiinnostuksen kohteena olevaksi alueeksi. Kuva 7 näyttää me- netelmän tekemät ehdotukset polvien keskikohdille sekä lopulta valitun ROI-ehdotuksen.

5.2.2 Lokalisointimenetelmän soveltaminen tutkielman aineistoon

Tutkielmassa käytetyssä aineistossa menetelmä vaikuttaa toimivan hyvin. Selvästi epäonnis- tuneita tunnistuksia datassa on 36 kappaletta (4,5%). Lisäksi 71 kuvaa aineistosta karsiutuu tunnistusvaiheessa, sillä niiden DICOM-tiedostoista puuttuu menetelmän tarvitsema meta- tieto ImagerPixelSpacing, joka kertoo kuinka monta millimetriä kukin pikseli vastaa. Pää- asiallisesti ehdotukset polven keskikohdasta sisältävät todellisen polven keskikohdan ja epä- onnistumiset tapahtuvat oikean ehdotuksen valitsemisessa. Jatkossa saattaisi olla perusteltua tarkastella, voitaisiinko ehdotusten määrää vähentää edelleen hyödyntämällä kuvan horison- taalista marginaalijakaumaa vastaavasti keskikohdan löytämiseen myös x-akselilla.

5.3 Muuttujien laskemiseen käytetty menetelmä

Reunantunnistusta varten röntgenkuvista löydetyt ROI-alueet esikäsitellään peilaamalla va- semmat polvet oikeita vastaaviksi, skaalaamalla kuvat 400×400-kokoisiksi ja tasaamalla kuvien intensiteettiä. Kuvia myös sumennetaan 5 kertaa 5×5 mediaanisumennuksella. Esi- käsittelyn jälkeen rajataan kuva nivelvälin ympäristöön sääri- ja reisiluun pintojen löytämi- seksi. Nivelvälin tulisi polven lokalisointimenetelmän toimintatavasta johtuen olla lähellä käsittelyssä olevan ROI:n keskikohtaa y-akselilla, joten tätä tietoa voidaan käyttää hyväksi alueen rajaamisessa. Testien perusteella päädyttiin rajaamaan ROI y-akselilla alueelle [0,4R, 0,75R], missä R on koko ROI-alueen korkeus pikseleissä ja kuva esitetään matriisina eli indeksit kasvavat y-akselilla alaspäin. X-akselin osalta erillistä rajausta ei enää tehdä, sillä lokalisointimenetelmän muodostama ROI vastaa pääasiassa hyvin haluttuja rajoja.

Nivelvälin sisältävällä esikäsitellyllä alueella muodostetaan horisontaalisen 3×3-Sobel-ytimen avulla kuvagradientti, joka sisältää vain sellaisia reunoja, joissa yläpuolella on tummempaa ja alapuolella vaaleampaa. Näin menetellen pyritään löytämään sääriluun reuna. Sääriluun

(38)

reuna etsitään ennen reisiluun reunaa, sillä kuvagradientin tulosten havaittiin sisältävän huomattavasti vähemmän kohinaa tummasta vaaleaan kuin vaaleasta tummaan reunoja tarkaste- levassa kuvagradientissa ja ensin tunnistetun reunan sijainnin avulla voidaan tehdä päätelmiä siitä, missä toiseksi havaittavan tulisi sijaita. Kuvagradientti kynnystetään siten, että jäljel- le jäävät vain ne reunat, joissa gradientin magnitudi ylittää heuristisesti määritetyn arvon 35. Kynnystyksen tuloksesta hylätään vielä epätodennäköisesti sääriluun reunaan kuuluvia lyhyitä reunanpätkiä, joiden kaikki pisteet ovat kaukana kuvan keskipisteestä x-akselilla. Jäl- jelle jäävistä alueista etsitään ensin sääriluun takareuna ja sitten etureuna takareunan sijaintia hyväksikäyttäen. Sääriluun takareunan pikseliarvoihin sovitetaan lineaarinen regressiosuora ja sovitetun suoran ja alkuperäisen pikselijoukon ensimmäinen ja viimeinen leikkauskoh- ta määritetään eminentian alku- ja loppukohdaksi (kuva 8 a). Alkuperäisestä tutkimuksesta menettely poikkeaa siten, että alkuperäisessä menettelytavassa regressiosuoran määrittämi- nen tehtiin etu- ja takareunan keskiarvon perusteella pelkän takareunan sijaan. Tutkielmaa tehdessä kahden erillisen reunan löytäminen eminentian alueella ei kuitenkaan tuntunut on- nistuvan kovin hyvin. Lisäksi menetelmän avulla on tarkoitus myös tarkastella eminentian terävöitymistä mahdollisena polven nivelrikkoa selittävänä muuttujana ja etureunan lisäämi- nen tuloksiin vaikuttaisi eminentian muotoon tuloksia heikentävällä tavalla. Sääriluun kan- tavaksi pinnaksi määritellään eminentian ulkopuolelle jäävät alueet, joissa nyt otetaan keskiarvo sääriluun taka- ja etureunasta (kuva 8 b). Keskiarvoistamisella pyritään vähentämään kuvantamislaitteen ja polven välisestä kulmasta johtuvaa harhaa nivelvälin laskemisessa.

Eminentian huippukohdat etsitään hakemalla löydetystä sääriluun reunasta derivaatan nol- lakohtia edeten löydetyistä eminentian reunakohdista kohti kuvan keskipistettä. Sääriluun kantaville pinnoille lasketaan lineaarinen regressiosuora ja huippukohtien korkeus lasketaan löydettyjen eminentian huippukohtien etäisyytenä sovitettuun suoraan (kuva 8 b). Eminen- tian korkeutta selittävän muuttujan laskentaan käytettävään menetelmään otettiin mallia Ma- rijnissen ym. 2008 tutkimuksesta, jossa muuttuja lasketaan vastaavalla tavalla käyttäen automaattisesti löydetyn pinnan ja eminentian sijainnin sijaan tutkimuksessa esitellyn ohjelman operaattorin käsin määrittämiä maamerkkejä. Korkeuden lisäksi eminentian huipun kulma lasketaan huipun molemmin puolin sijaitsevien seitsemän reunaan kuuluvan pikselin perusteella määritettyjen suorien leikkauksen kulmana.

(39)

(a) Sääriluun takareuna ja eminentian al- kukohdan määrittämiseen käytetty regressiosuora

(b) Eminentian huippujen kohdan määrit- täminen, sääriluun etu- ja takareuna se- kä niiden keskiarvo, keskiarvoisen reunan mukaan määritetty regressiosuora kanta- van pinnan tasona

(c) Nivelraon minimikohdat lateraalisella ja mediaalisella puolella

(d) Sääriluun sivureunat ja löydetty lateraalinen osteofyytti

Kuvio 8: Muuttujien laskentaan käytetyn menetelmän toiminta vaiheittain (röntgenkuva: Os- teoarthritis Initiative (OAI) 2008)

Reisiluun reunaa varten otetaan vastaavasti horisontaalinen kuvagradientti 3×3-Sobel-ytimen avulla sisältäen vain reunoja, joissa yläpuolella on vaaleaa ja alapuolella tummaa. Gradientti kynnystetään samoin kuin sääriluun tapauksessa ja reisiluun reunaksi valitaan kuvassa sää-