• Ei tuloksia

3. Menetelmä ja aineisto

3.2 Aineiston rakenne ja spatiaalinen jakautuminen

3.2.1 Muuttujien esittely

Aineiston havaintoyksiköillä on 23 muuttujaa, joiden lisäksi niitä hyödyntäen on rakennettu muutama myöhemmin esiteltävä apumuuttuja. Tässä yhteydessä käydään läpi jokainen aineiston varsinainen muuttuja mitta-asteikoittain, sekä esitellään numeeristen muuttujien keskeisimpiä tunnuslukuja. Esiteltyjen muuttujien tarkat kuvailutiedot löytyvät tutkielman liitteistä.

Luokitteluasteikko

Tilastoalue

Kiinteistönvälitysalan Keskusliiton hintaseurantapalveluun viedyistä kaupoista on aina kirjattu kauppakohteena olleen huoneiston asuinalue. Kysymyksessä on osin subjektiivinen tulkinta, ja ilmeisesti markkinointimielessä halutuimpien asuinalueiden koetut rajat yltävät toisinaan varsin pitkälle. Esimerkiksi huomattavan monet Kaakinmaalla sijainneet huoneistot on myyty Pyynikkiin kuuluvina. Tutkimuksessa on kuitenkin pyritty sijoittamaan jokainen havaintoyksikkö sille Tampereen kaupungin määrittämälle tilastoalueelle, jossa se osoitteensa perusteella tosiasiallisesti sijaitsee.

28 Tämä on toteutettu käsityönä. Muuttujan tiedot eivät siis ole suoraan peräisin hintaseurantapalvelusta. Tilastoaluejakoa on hyödynnetty, koska kyseisten alueiden rajat ovat objektiivisesti todettavissa, ja koska niiden perusteella määräytynyt muuttuja mahdollistaa mielenkiintoisten havainnollistusten rakentamisen. Tilastoalueet mukailevat kaupunkilaisten mielikuvia asuinalueista, mutta eivät täysin vastaa niitä.

Osa koetuista kaupunginosista on esimerkiksi sulautettu jaossa toisiinsa.

Katuosoite

Huoneistokaupan yhteydessä kirjattu asunnon tarkka osoite. Tilastoaluetta sekä huoneiston ajallisia ja maantieteellisiä etäisyyksiä kuvaavat muuttujat on muodostettu tämän muuttujan avulla.

Järjestysasteikko

HuoneistonKunto

Muuttuja kuvaa myydyn huoneiston koettua kuntoa. Tulkinta on subjektiivinen, koska yhteismitallisia ja virallisia standardeja attribuutin arvon määräytymiselle ei ”uutta”

lukuun ottamatta ole olemassa. Aineistosta löytyviä arvoja ovat uusi, erinomainen, hyvä, tyydyttävä, huono ja tuntematon.

Välimatka-asteikko

Rakennusvuosi

Muuttujan arvo kertoo minä vuonna kerrostalo, jossa huoneisto sijaitsee, on rakennettu.

Suhdeasteikko Asuinala

Huoneiston asuinpinta-ala neliömetreissä mitattuna.

29 AsunnonIkä

Kuluva vuosi, josta on vähennetty muuttujan Rakennusvuosi arvo.

Huoneita

Tieto huoneistossa sijaitsevien seinillä rajattujen asuinhuoneiden lukumäärästä.

Kerrosnumero

Havaintoyksikön sijaintikerros taloyhtiössä.

Kauppahinta

Kaupantekohetkellä maksettu hinta, joka ei välttämättä ole sama asia kuin huoneiston velaton hinta.

VelatonHinta

Muuttuja kuvaa osakehuoneiston todellista hintaa, jossa otetaan huomioon sekä kaupanteonhetkellä maksettu osuus kokonaishinnasta että osakkeen mukana ostajalle päätynyt huoneistoon kohdistuva velka.

Velkaosuus

Velattoman hinnan ja kauppahinnan erotus. Muuttuja kuvaa ostettuun osakehuoneistoon kohdistuvan velan määrää, joka on tietenkin eri asia kuin kuluttajan ottama mahdollinen asuntolaina.

Neliöhinta

Velaton hinta jaettuna huoneiston asuinalalla. Muuttuja, jonka muodostumista regressioanalyysissa tarkastellaan.

MyyntiaikaPv

Muuttujan arvo kuvaa sitä aikaa päivissä mitattuna, joka huoneiston myymiseen välittäjältä kaiken kaikkiaan meni.

30

Kilometreissä mitattu etäisyys huoneistolta Tampereen ydinkeskustassa sijaitsevalle Keskustorille, kun eteneminen tapahtuu jalankulkijalle sopivia reittejä. Tieto on noudettu jokaiselle havaintoyksikölle käsityönä Google Maps -palvelusta, ja samoin on toimittu muidenkin etäisyysmuuttujien kohdalla. Työvaihe toteutettiin maksimissaan tunnin pituisissa erissä noin kuukauden mittaisen ajanjakson aikana, jotta aineistoon ei päätyisi virheitä keskittymiskyvyn herpaantumisen takia.

KilometritAutolla

Kilometreissä mitattu etäisyys asunnolta Keskustorille, kun sovelletaan nopeinta henkilöautolle sopivaa reittiä. Muuttujan arvoa ei muodostettu lyhimmän reitin mukaan, koska tuolloin Google Maps olisi valinnut osalle tilastoyksiköistä ajankäytön näkökulmasta tehottoman metsätien tai muun vastaavan epäoptimaalisen reitin, jota tuskin käytännössä mielletään ainakaan ympärivuotiseksi vaihtoehdoksi.

AikaJalan

Minuuteissa mitattu etäisyys asunnolta Keskustorille, kun hyödynnetään nopeinta jalankulkuun soveltuvaa reittiä. Google Maps soveltaa arviossaan 4,83 km/h kävelyvauhtia, mutta ottaa huomioon myös maastonmuodoista johtuvat hidastavat tekijät.

AikaAutolla

Minuuteissa mitattu etäisyys huoneistolta Keskustorille, kun hyödynnetään nopeinta henkilöautolle soveltuvaa reittiä. Aika-arvion taustalla sovelletaan arkikeskiviikkona klo 15:00 vallitsevaa ruuhkatilannetta. Ajankohta on tutkimuksen tekijän osin mielivaltainen valinta, mutta tuolloin liikennettä on oletettavasti sen verran, että

31 liikennevirtojen keskittymisestä johtuvat erot alueiden välillä nousevat esiin, ilman että kysymyksessä on varsinainen ruuhka-aika. Google Maps esittää arviolleen eräänlaisen vaihteluvälin, ja muuttujan arvoksi on valittu sen arvoista keskimmäinen.

AikaJulkisella

Muuttujan arvo kuvaa sitä aikaa minuuteissa mitattuna, joka kuluu kotiovelta Keskustorille kuljettaessa, kun hyödynnetään linja-autoa. Lähtöajankohtana on tässä tapauksessa se hetki, kun lähdetään kotoa kävelemään pysäkille, josta lähtee linja-auto aikavälillä 15:00 – 15:20. Jos kyseisellä aikavälillä ei lähde yhtään vuoroa, matkustusaikaan lasketaan odottaminen aikavälin lopusta eteenpäin. Tietty tarkka kellonaika ei ole tämän muuttujan osalta yhtä mielekäs valinta kuin henkilöauton kohdalla. Ihmiset todennäköisesti ottavat huomioon kulkumuodon tietynlaisen epäautonomisuuden, ja ainakin jossain määrin suunnittelevat toimintansa aikataulujen ympärille. Jos havaintoyksikkö sijaitsee niin lähellä Keskustoria, ettei linja-auton hyödyntäminen ole järkevää, muuttujan arvo on sama kuin muuttujalla ”Aika jalan”.

Dummy-muuttujat

Uudiskohde / Hissi / Sauna / Parveke / Laatuasunto / Asuinalue

Dummy-muuttujat saavat joko arvon 1 tai 0, riippuen siitä, täyttääkö havaintoyksikkö jonkin kriteerin. Kysymyksessä on uudiskohde, jos taloyhtiö ja huoneisto ovat vastarakennettuja, eikä niillä siten ole ollut aiempia omistajia. Hissi saa arvon 1, mikäli taloyhtiöstä sellainen löytyy. Sauna ja parveke ovat sen sijaan huoneistokohtaisia muuttujia, eikä esimerkiksi taloyhtiön saunaa huomioida tässä yhteydessä huoneiston hintaan vaikuttavana seikkana. Laatuasunto viittaa huoneistoon, jonka kuntoluokitus on joko uusi, erinomainen tai hyvä. Kuntoluokitukset eivät perustu uudiskohdetta lukuun ottamatta mihinkään objektiiviseen standardiin, mutta tämä muuttuja pyrkii kattamaan kaikki ne huoneistot, joiden kohdalla suurin osa kuluttajista tuskin pitää suurempaa remonttia tarpeellisena. Seuraavan luvun regressioissa muodostetaan myös tiettyjä tilastoalueita kuvaavia dummy-muuttujia, jotka kertovat numeerisesti, sijaitseeko havaintoyksikkö muuttujan täsmentämällä alueella.

32

Keskiarvo Mediaani Keskihajonta Vaihteluväli Minimi Maksimi

Välimatka-asteikko

Rakennusvuosi 1982,28 1980 25,217 166 1855 2021

Suhdeasteikko

Asuinala 59,95 57 25,7 586,3 13,7 600

AsunnonIkä 38,72 41 25,23 166 0 166

Kauppahinta 155 144,66 130 000,00 100 733,14 826 071,60 3 928,40 830 000,00

VelatonHinta 188 951,06 162 000,00 114 956,58 1 485 715,00 15 285,00 1 501 000,00

Velkaosuus 33 806,40 2 288,58 75 129,07 1 050 700,00 0 1 050 700,00

Neliöhinta 3 282,34 3 253,97 1 382,81 9 695,30 212,29 9 907,09

MyyntiaikaPv 95,6 48 136,25 1 251,00 1 1 252,00

Hoitovastike 215,77 205 89 1 026,70 1 1 027,70

HoitovastikeNeliö 3,64 3,57 0,77 7,99 0,01 8

KilometritJalan 4,25 4,3 3,14 10,33 0,17 10,5

KilometritAutolla 5,2 5,4 3,76 12,75 0,35 13,1

AikaJalan 52,69 54 38,84 127 2 129

AikaAutolla 14,64 14 7,3 26 3 29

AikaJulkisella 18,51 17 9,25 37 2 39

Taulukko 2 Kvantitatiivisten muuttujien tunnuslukuja

33 3.2.2 Havaintoja aineiston ja aikamuuttujien spatiaalisesta ulottuvuudesta

Tutustutaan seuraavaksi tiettyihin havaintoaineiston ominaisuuksiin maantieteen ja aikaresurssin näkökulmasta. Se on tarkoituksenmukaista, koska visuaalisen esitystavan avulla on helpompi hahmottaa millä tavalla havaintoaineisto kaupungin alueelle jakautuu. Sillä puolestaan on merkitystä esimerkiksi silloin, kun arvioidaan tutkimustulosten yleistettävyyttä. Tampereen kaupunki jakaa maa-alueensa seitsemään eri suuralueeseen. Nämä puolestaan koostuvat useista suunnittelualueista, jotka ovat edelleen purettavissa pienemmiksi tilastoalueiksi.

Seuraavissa havainnollistuksissa erilaisten aineistoon liittyvien ominaisuuksien esittely tapahtuu juuri tilastoalueiden tasolla. Kuten edellä kerrottiin, ne mukailevat suurimmaksi osaksi kaupunginosia, joiden rajat ovat arkielämässä kuitenkin ainakin osin subjektiivisia. Osa kaupunginosista on myös jaossa sulautettu toisiinsa, ja esimerkiksi Tampella käsittää sekä Kanta- että Ranta-Tampellan, mutta myös vieressä sijaitsevan Armonkallion.

34

Kuva 7 Tampereen tilastoalueet ilman Pohjoista suuraluetta

35 Kuvassa 7 on esitelty Tampereen kaupungin tilastoalueet kaikilta muilta suuralueilta paitsi pohjoisimmalta. Lopulliseen havaintoaineistoon ei kyseiseltä suuralueelta päätynyt yhtään huoneistotransaktiota. Se on myös maantieteelliseltä kooltaan hyvin suuri, jolloin tarkastelun kannalta tärkein osa kaupunkia ei skaalaudu luettavasti sivulle, jos sen sisällyttää havainnollistukseen mukaan. Pohjoinen suuralue koostuu Aiton, Kämmenen ja Terän suunnittelualueista. Suuralueella sijaitsee paljon maaseutumaisia pientaloalueita, luonnonsuojelualueita sekä vapaa-ajan asuntoja.

Tilanne on kuitenkin kaupungistumiskehityksen myötä osin muuttumassa kuluvan vuosikymmenen aikana, kun esimerkiksi Aiton suunnittelualueeseen kuuluvien Nurmen ja Sorilan tilastoalueille rakennetaan paljon uutta asumiskapasiteettia.

Tutkimuksessa on tehty päätös tulkita Tammerkosken tilastoalueella sijaitseva Keskustori kaupungin ydinkeskustaksi. Se siis toimii sinä kiintopisteenä, johon etäisyys muualta suhteutetaan. Tori on kuvassa 7 merkitty punaisella pisteellä.

Kuva 8 Havaintoyksiköiden lukumäärät tilastoalueittain

36 Kuva 8 havainnollistaa tilastoyksiköiden alueellista jakautumista. Siitä käy myös selväksi, että monet tilastoalueet ovat täysin vailla havaintoja. Tähän on olemassa useita mahdollisia syitä. Esimerkiksi omistus- ja vuokratonttien välinen suhde vaihtelee voimakkaasti ympäri kaupunkia, kuten myös kunkin tilastoalueen pääasiallisen rakennuskannan luonne. Kuten Alonso-Muth-Mills -mallin yhteydessä todettiin, maa-alueeseen kohdistuvan kysynnän ollessa suurempaa, on järkevää rakentaa tiheämmin ja ylöspäin. Palvelukeskittymien ulkopuolella sijaitsee enemmän pientaloalueita, joiden piirissä tapahtuneet kaupat ovat rajautuneet aineiston ulkopuolelle. On myös muistettava, että havaintoaineistosta löytyvät vain ne huoneistokaupat, jotka on kirjattu Kiinteistönvälitysalan Keskusliiton hintaseurantapalveluun.

Ylivoimaisesti suurin edustus aineistossa on Hervannan tilastoalueella. Tämä ei ole yllättävää, koska kysymyksessä on maantieteellisesti suurehko kokonaisuus, joka pitää sisällään erään kaupungin suurimmista asumiskeskittymistä. Hervannassa aineistoon päätyneitä huoneistokauppoja toteutettiin yhteensä 440 kappaletta. Toisella sijalla on Härmälän tilastoalue, josta havaintoyksikköjä aineistoon päätyi 264 kappaletta. Alueella on harjoitettu viime vuosina runsaasti uudisrakentamista, ja havainnoista peräti 66 % koostuu uudiskohteista. Härmälän havaintoyksiköiden keskimääräinen rakennusvuosi onkin 2012. Kolmanneksi eniten havaintoja on Kaukajärveltä. Alueen 207 huoneistosta vain 5 % on uudiskohteita, mutta alueella sijaitsee varsin paljon kohtuuhintaisia ja omalla tontillaan sijaitsevia asunto-osakeyhtiöitä. Kaukajärven kohteiden keskimääräinen rakennusvuosi on 1982.

Hervantaa ja Kaukajärveä lukuun ottamatta havainnot keskittyvät varsin lähelle Tammerkosken tilastoalueella sijaitsevaa Keskustoria. Lähellä keskustaa sijaitsevien tilastoalueiden rakennuskanta on suurimmaksi osaksi rakennettu vuosien 1960 ja 1985 välissä. Härmälän lisäksi myös Lielahdessa on harjoitettu paljon uudisrakentamista.

Tilastoalueen 145 huoneistokaupasta peräti 98 % kohdistui uudiskohteeseen. Alueen vahva edustus aineistossa on siis käytännössä täysin uudisrakentamisen, tässä tapauksessa kahden uuden kerrostalon, ansiota. On toki myös huomattava, että Lielahden tilastoalue on kooltaan pienempi, kuin se alue, joka arkikielessä Lielahdeksi mielletään. Lisäksi suuri osa siitä on lohkottu kaupanalan käyttöön.

37

Kuva 9 Tilastoalueiden keskimääräiset ajalliset keskustaetäisyydet jalan

Yllä oleva lämpökartta havainnollistaa tilastoalueiden sisällä vallitsevia keskimääräisiä minuuteissa mitattuja keskustaetäisyyksiä silloin, kun siirtyminen tapahtuu jalan.

Näkymä vastaa odotuksia, koska suomalainen kaupunki-infrastruktuuri huomioi jalankulkijat yleensä hyvin. Kulkeminen kävellen on yksityisautoilua suoraviivaisempaa ja julkista liikennettä autonomisempaa. Koska Tampereenkin tiestöä voidaan pitää jalankulkijan näkökulmasta tehokkaana, käytännössä ainoat tilastoalueiden välistä hierarkiaa luovat tekijät ovat tässä yhteydessä absoluuttinen etäisyys ja luonto.

Esimerkiksi vesistöjen sijainnit eivät suoraan ilmene tilastoaluejaosta. Lentävänniemi sijaitsee linnuntietä kuljettaessa suhteellisen lähellä Keskustoria, mutta välissä sijaitseva Näsijärvi pakottaa kävelijän kiertämään sen rantaviivaa myötäillen.

Vastaavanlainen tilanne on myös Härmälässä, jossa esteen muodostaa Pyhäjärvi.

Näin todellisuus eroaa edellä esitellyistä ja varsin pelkistetyistä kaupunkitaloustieteen malleista, mutta niiden etäisyyttä koskevat johtopäätökset pätevät yhä – välimatka vain mitataan suoran säteen sijaan lyhimmän tai nopeimman käytettävissä olevan reitin mukaan.

38

Kuva 10 Tilastoalueiden keskimääräiset ajalliset keskustaetäisyydet yksityisautolla

Kuva 10 havainnollistaa eroavaisuuksia ajallisessa keskustaetäisyydessä, mutta tällä kertaa yksityisautoilijan näkökulmasta. Kuten edellä todettiin, muuttujan tiedot on noudettu Google Maps -palvelusta. Palvelun estimoimat ajominuutit perustuvat arkikeskiviikkona klo 15.00 vallitsevaan ruuhka-arvioon. Alueiden välinen hierarkia rakentuu edelleen ensisijaisesti maantieteellisen välimatkan varaan, mutta nyt on havaittavissa myös liikenneinfrastruktuurista ja liikenteen määrästä kumpuavia eroja.

Esimerkiksi Härmälästä Keskustorille ajaa keskimäärin 21 minuutissa matkan ollessa keskimäärin 6,8 km; siinä missä keskimäärin 9,9 km välimatkan päässä Villilässä sijaitsevalta tilastoyksiköltä ajaa Keskustorille keskimäärin 19 minuutissa. Juuri tästä syystä on järkevää keskittyä matkustamisen ajalliseen kustannukseen pelkkien ajokilometrien sijaan. Lisäksi tasaisempi ajaminen on polttoaineen näkökulmasta taloudellisempaa, verrattuna sykleittäin kulkevan ruuhkan ehdoilla etenemiseen.

Tutkielman liitteistä löytyy taulukko, josta ilmenee jokaisen tilastoalueen keskimääräiset ajokilometrit ja -minuutit ydinkeskustaan.

39

Kuva 11 Tilastoalueiden keskimääräiset ajalliset keskustaetäisyydet linja-autolla

Yllä olevasta kuvasta on havaittavissa vastaavat minuuteissa mitatut etäisyydet Keskustorille, mutta tällä kertaa hyödyntäen linja-autoa. Jos Google Maps on tulkinnut kävelyn julkista liikennevälinettä nopeammaksi tavaksi siirtyä, niin muuttuja kuvaa jalankulkuun kuluvaa aikaa. Aineisto on peräisin ajalta, jolloin raitiotien liikennöinti ei ollut vielä alkanut, mutta jolloin raitiotieverkon rakennustyöt olivat jo käynnissä. On kuitenkin oletettavaa, että uusi kulkumuoto oli jo tuolloin hinnoiteltu sisään sen tulevan reitin varrella sijaitsevien osakehuoneistojen markkina-arvoihin. Havainnollistuksen värisävyjen intensiteetit kuvaavat samoja ajallisia portaita kuin henkilöautojen yhteydessä, lukuun ottamatta uutta luokkaa hierarkian yläpäässä. Verratessa kuvia 10 ja 11 käy nopeasti selväksi, kuinka linja-auto näyttäytyy aikaresurssin näkökulmasta yksityisautoilua tehottomampana kulkumuotona. Tilanne voisi etenkin lähempänä ydinkeskustaa sijaitsevien tilastoalueiden kohdalla muuttua esimerkiksi silloin, jos myös pysäköintipaikan etsimiseen ja sieltä torille siirtymiseen kuluva aika olisi mahdollista huomioida. Nythän muuttujien arvot on muodostettu suoran kotoa torille siirtymisen pohjalta, joka ei arkielämässä ole henkilöautolla aina mahdollista.

40

Kuva 12 Julkisen liikenteen suhteellinen tehokkuus yksityisautoiluun verrattuna

Kuva 12 havainnollistaa eräänlaista julkisen liikenteen suhteellista tehokkuutta, kun sitä verrataan yksityisautoiluun. Sen pohjalla on suhdeluku, joka on muodostettu jakamalla tilastoalueella vallitsevaa keskimääräistä julkisen liikenteen matkustusaikaa kuvaava muuttuja alueen keskimääräisillä yksityisautoilun ajominuuteilla. Arvon ollessa 1, matkustusmuodot ovat aikaresurssin näkökulmasta toistensa substituutteja.

Suhdeluvun saadessa tätä suurempia arvoja, muuttuu yksityisautoilu ajankäytön näkökulmasta houkuttelevammaksi vaihtoehdoksi. Ykköstä pienemmät arvot taas puoltavat julkisen liikenteen hyödyntämistä. Lähellä ydinkeskustaa sijaitsevien alueiden tulkinta ei ole mielekästä, koska tuolloin puhutaan varsin vaatimattomista eroista, jolloin absoluuttisesti pienet poikkeamat voivat näyttäytyä suhteellisesti suurina. Lisäksi jos Google Maps on tulkinnut kävelyn linja-autoa nopeammaksi etenemistavaksi arkikeskiviikkona klo 15.00; niin suhdeluku vertaakin jalankulkua autolla ajamiseen. Kuvasta on kuitenkin mielenkiintoista havaita, kuinka esimerkiksi Hatanpäältä tai Kalevanrinteeltä matkatessa linja-auto näyttäytyy nopeampana vaihtoehtona. Arki-intuitio taas puoltaa ajatusta, jonka mukaan suuri osa ulommilla oransseilla ja punaisilla alueilla ajavista linjoista kiertäisi matkallaan varsin monia naapurustoja, hyödyntääkseen kuljetuskapasiteettiaan mahdollisimman tehokkaasti.

41

4. Analyysi

Seuraavaksi siirrytään mallien muodostamiseen ja tutkimuksen tuloksiin. Ensin tarkastellaan selitettävän muuttujan ja riippumattomien muuttujien valintaan johtaneita seikkoja. Tämän jälkeen käydään läpi tutkimuksen spatiaalisissa autoregressiomalleissa hyödynnetyn W-matriisin muodostamisen yksityiskohtia, sekä todetaan spatiaalisen autokorrelaation esiintyminen havaintoaineistossa. Ennen tutkimustuloksiin siirtymistä, esitellään niiden löytämistä varten rakennetut neljä mallia.

Tuloksien läpikäymisen jälkeen on vuorossa tutkimukseen ja sen löydöksiin liittyvä pohdinta.

4.1 Muuttujien valinta

Tutkimuksen ensisijaisena tavoitteena on selvittää, kuinka paljon osakehuoneiston neliöhinta muuttuu etäisyyden ydinkeskustaan kasvaessa. Selitettävän muuttujan tulee siis kuvata neliöhintaa. Jotta regressiokertoimien tulkinta olisi mahdollisimman mielekästä, Neliöhinta-muuttujasta muodostetaan logaritmoimalla muuttuja LogNeliöhinta. Tuolloin yhtälön oikealla puolella sijaitsevien riippumattomien muuttujien saamat regressiokertoimet kuvaavat sitä prosenteissa mitattua keskimääräistä muutosta selitettävässä muuttujassa, joka tapahtuu, kun riippumattoman muuttujan arvo kasvaa yhden yksikön.

Havaintoaineisto pitää sisällään runsaasti kvantitatiivisia muuttujia, mutta niitä kaikkia ei ole mahdollista sisällyttää selittävinä muuttujina samaan malliin, johtuen esimerkiksi multikollineaarisuudesta. Etäisyysmuuttujat korreloivat luonnollisesti voimakkaasti keskenään, mutta vastaavaa voi tapahtua myös muiden muuttujien kesken. Liitteiden sivulta 68 löytyy numeeristen muuttujien korrelaatiotaulukko. Lisäksi tieto esimerkiksi hoitovastikkeen suuruudesta tai huoneiston kerrosnumerosta puuttuu osalta havaintoyksiköistä, jolloin täytyy tehdä valinta mahdollisimman kattavan otoksen ja mainittujen muuttujien sisällyttämisen väliltä. Tutkimuksessa päädyttiin näistä ensimmäiseen, koska esimerkiksi kerrosnumeron sisällyttäminen olisi tarkoittanut peräti 290 havaintoyksikön pudottamista analyysista.

42

Multikollineaarisuuden arvioimiseksi on käytetty korrelaatiotaulukon lisäksi myös VIF-mittaria. Taulukosta 3 on havaittavissa mallinnukseen asti päässeet muuttujat niiden saamine VIF-arvoineen. Tässä yhteydessä on etäisyysmuuttujana hyödynnetty muuttujaa AikaAutolla, mutta arvot eivät juuri yllä esitellyistä poikkea myöskään muiden etäisyyttä kuvaavien muuttujien kohdalla. Kyseiset VIF-arvot löytyvät tutkielman liitteistä muita etäisyysmuuttujia tarkastelevien mallien tulostaulukoiden yhteydestä. Suurin yksittäinen arvo taulukossa 3 on suuruudeltaan alle 2,5; ja niiden kaikkien keskiarvo on 1,62. Tutkimuksessa sovellettavat mallit eivät siis kärsi multikollineaarisuudesta.

Malleihin asti päässeistä yhdeksästä selittävästä muuttujasta viiden voidaan katsoa liittyvän sellaisiin huoneistokohtaisiin attribuutteihin, joiden laatu tai määrä on ainakin tiettyyn pisteeseen asti aistein todennettavissa kuljettaessa sisällä asunnossa. Yksi muuttuja, eli Hissi, liittyy sen sijaan puhtaasti kerrostalokohtaiseen ominaisuuteen.

Mukana olevan eksplisiittisen etäisyysmuuttujan lisäksi myös Hervantaa kuvaava lokaatiomuuttuja kantaa sisällään muiden aluekohtaisten ominaisuuksien lisäksi tietynlaisia etäisyyskomponentteja, liittyen esimerkiksi alueella sijaitseviin työpaikkoihin ja palveluihin. Yksi mukaan valittu ja analyysissa tilastollisesti erittäin merkitseväksi havaittu muuttuja liittyy mielenkiintoisella tavalla itse huoneiston sijaan siihen kohdistuvan velan määrään.

43 Lopuksi testataan, esiintyykö valittujen muuttujien pohjalta rakennetussa

OLS-mallissa (kaava 15, sivu 45) heteroskedastisuutta.

Breusch-Pagan -testi

Breusch-Pagan -testin nollahypoteesi jäännöstermin varianssin vakioisuudesta hylätään. Heteroskedastisuus tulee siis ottaa malleissa huomioon, jotta kerroinestimaattien tilastollinen merkitsevyys näyttäytyy oikean suuruisena. Se tapahtuu malleissa myöhemmin esiteltävillä tavoilla.

4.2 W-matriisi ja Moranin I -testi

Tutkimuksessa sovellettu W-matriisi on rakennettu havaintoyksiköiden sijaintikoordinaattien pohjalta. Ne haettiin pääasiassa automatisoidusti hyödyntäen Stataan saatavilla olevaa OpenCage Geocoding -moduulia. Osa tiedoista saatiin kuitenkin vain kadun tarkkuudella, ja niitä tuli vielä tarkentaa käsityönä. Syntyneen matriisin koko on 3454 x 3454, eli sen rivit ja sarakkeet pitävät sisällään kaikki havaintoyksiköt. Ne siis risteävät soluissa sekä toistensa että myös itsensä kanssa, aivan kuten edeltävän luvun SAR-malleja käsitelleessä alaluvussa kuvattiin. Solujen arvot kertovat kuinka voimakkaasti niissä kohtaavien havaintoyksiköiden ominaisuuksia, tämän tutkimuksen tapauksessa virhetermejä ja selitettävien muuttujien arvoja, painotetaan toisiinsa nähden spatiaalisen autokorrelaation huomioivassa regressiossa. Koska valtaosa aineiston huoneistoista sijaitsee sellaisissa kerrostaloissa, joista on päätynyt aineistoon myös muita asuntoja, on yksittäisten havaintoyksiköiden katuosoitteen perusteella haettuja koordinaatteja tullut hieman muuttaa manuaalisesti. Muussa tapauksessa niiden sijainnit olisivat identtisiä,

44 eikä W-matriisin muodostaminen olisi mahdollista. Toteutetut muutokset ovat kuitenkin hyvin marginaalisia, ja jokainen huoneisto asettuu edelleen oman kerrostalonsa seinien sisälle. Analyysissa hyödynnetty W-matriisi on koottu inverse distance -periaatteella. Sitä sovellettaessa havaintoyksiköt saavat matriisissa sitä suuremmat keskinäiset painot, mitä lähempänä ne toisiaan sijaitsevat. Matriisi normalisoitiin hyödyntäen row-menetelmää, koska spectral-normalisointi synnytti teoreettisen maksimin ylittäviä autokorrelaatioparametrin arvoja. Ratkaisu ehkäisi myös tilannetta, jossa tietyt jopa useita kymmeniä havaintoyksiköitä sisältävät taloyhtiöt olisivat dominoineet regressioissa liiaksi. Matriisien normalisointiin liittyviin yksityiskohtiin voi tutustua esimerkiksi Statan SP -manuaalin avulla (Stata 2021), jossa on tietoa liittyen toimenpiteen tarpeeseen ja sen toteutustapoihin.

Spatiaalisen autokorrelaation esiintyminen aineistossa varmistetaan Moranin I -testillä.

Sen nollahypoteesin mukaan virhetermit ovat spatiaalisella tasolla riippumattomasti ja identtisesti jakautuneita. Käytännössä testaaminen tapahtuu suorittamalla ensin OLS-regressio, jonka tuloksia arvioidaan jo määritettyä W-matriisia vasten.

Kun edellisessä alaluvussa valittujen muuttujien avulla muodostetulle OLS-mallille (seuraavan sivun kaava 15) suoritetaan Moranin I -testi soveltamalla yllä kuvattua W-matriisia, aineistossa havaitaan selvää spatiaalista autokorrelaatiota. Tämä tarkoittaa sitä, että spatiaalisten autoregressiomallien hyödyntämiselle löytyy analyysissa vankka peruste.

Taulukko 5 Moranin I

45 4.3 Neljä mallia

Aineistossa esiintyvä heteroskedastisuus ja spatiaalinen autokorrelaatio tulee huomioida Statan avulla toteutettavissa mallinnuksissa. Tutkimuksessa päädyttiin muodostamaan neljä erilaista mallia. Mallit 1 ja 2 pohjautuvat perinteiseen pienimmän neliösumman menetelmään (kaava 15), mutta niistä ensimmäisessä hyödynnetään Huber-White -keskivirheitä, ja jälkimmäisessä tilastoalueittain klusteroituja keskivirheitä. Näin keskivirheet tulevat korjatuksi kahdella eri tavalla: ensimmäisessä mallissa huomioidaan heteroskedastisuus, ja toisessa tilastoalueiden sisäinen korrelaatio. Keskivirheiden klusterointi onkin se perinteinen tapa huomioida spatiaalinen autokorrelaatio OLS-estimoinnin yhteydessä. Malli 3 on SAR-malli (kaava 16), joka ottaa spatiaalisen autokorrelaation huomioon lähellä sijaitsevien havaintojen virhetermien kautta. Malli 4 on ns. SAR-SAR -malli (kaava 17), ja se pyrkii huomioimaan autokorrelaation naapurihavaintojen virhetermien lisäksi myös niiden selitettävän muuttujan arvojen avulla.

Regressio on malleissa 3 ja 4 toteutettu hyödyntäen GS2SLS -menetelmää, joka sallii malleissa ilmenevän heteroskedastisuuden huomioimisen erillisellä käskyllä (Stata 2021, 156).

46 4.4 Tutkimustulokset

Seuraavaksi siirrytään tutkimuksen tuloksiin. Taulukon 6 malleissa on hyödynnetty etäisyysmuuttujaa AikaAutolla. Muiden muuttujien osalta vastaavat taulukot löytyvät tutkielman liitteistä, alkaen sivulta 69. Sieltä löytyvät myös mallien Stata-tulosteet.

Selitettävä

muuttuja LogNeliöhinta

Etäisyysmuuttuja AikaAutolla

Malli Malli 1 Malli 2 Malli 3 Malli 4

Mallin kuvaus OLS (Huber-White) OLS (Cluster) SAR SAR-SAR

VIF Selittävä muuttuja Regressiokerroin

Keskivirhe 0,0000001 0,0000002 0,00000007 0,00000006

2,26 Hissi 0,1073 * 0,1073 * 0,0595 * 0,0718 *

* ja ** viittaavat 0,1 % ja 1 % merkitsevyystasoihin

Taulukko 6 AikaAutolla-muuttujan regressiomallit

47 Mallin 4 kerroinestimaatteja ei ole mahdollista tulkita yhtä suoraviivaisesti kuin muiden mallien kohdalla. Koska mallissa on mukana myös muiden havaintoyksiköiden selitettävien muuttujien arvojen W-matriisin mukainen vaikutus, syntyy rekursiivinen prosessi, jossa havaintojen voidaan katsoa vaikuttavan eräänlaisessa ketjussa toisiinsa – selitettävä muuttujahan löytyy mallin yhtälöstä sekä vasemmalta että oikealta puolelta. Toisen havainnon selitettävän muuttujan arvo vaikuttaa ensimmäisen arvoon, jolloin myös toisen havainnon selitettävän muuttujan arvo vaihtuu. Tästä syystä muuttujien hintavaikutuksia tulee tarkastella regressiokertoimien sijaan muutosten eräänlaisten keskimääräisten vaikutusten kautta. Niitä koskeva täydellinen taulukko löytyy liitteiden sivulta 74.

Taulukosta 7 löytyvät derivaatat on mahdollista rinnastaa hintavaikutusten arvioinnissa muiden mallien kerroinestimaatteihin. Koska malleissa mielenkiinnon kohteena on Neliöhinta-muuttujan logaritmoitu muoto, yllä olevat derivaatat ja taulukon 6 regressiokertoimet muiden kuin mallin 4 osalta kuvaavat sitä keskimääräistä prosentuaalista muutosta osakehuoneiston neliöhinnassa, joka tapahtuu silloin, kun selittävän muuttujan arvo kasvaa yhdellä. Esimerkiksi mallin 1 mukaan asunnon ja

Selitettävä Taulukko 7 Muuttujien hintavaikutukset SAR-SAR -mallissa

48 Keskustorin välisen automatkan pituuden kasvaessa yhdellä minuutilla, huoneiston neliöhinta laskee keskimäärin noin 3,72 %,

Muuttujien kerroinestimaattien keskivirheet kasvavat selvästi, kun siirrytään Huber-White -keskivirheitä hyödyntävästä OLS-mallista tilastoalueittain klusteroituja keskivirheitä soveltavaan, mutta muuten vastaavaan malliin. Ne ovat kuitenkin

Muuttujien kerroinestimaattien keskivirheet kasvavat selvästi, kun siirrytään Huber-White -keskivirheitä hyödyntävästä OLS-mallista tilastoalueittain klusteroituja keskivirheitä soveltavaan, mutta muuten vastaavaan malliin. Ne ovat kuitenkin