5. Tutkimuksen tulokset
5.2 Regressiomallit asuntojen neliöhintoihin vaikuttavista tekijöistä
Regressiomalleja on tämän tutkimuksen kannalta perusteltua luoda useampia, jotta mukana olevia muuttujia ja niiden vaikutuksia on mahdollista havainnoida tarpeeksi laajasti. Lisäksi use-amman mallin avulla voidaan karsia virheitä ja löytää luotettavimmat kuvaajat aineistolle. Ensim-mäisessä regressiomallissa keskityn kuntakohtaisen aineiston tutkimiseen ja siten myös valitut muuttujat ovat velkatilastossa kuntatason muuttujia. Tämä osio on tutkimuksen hypoteesien osalta tärkeämpi, mutta toisaalta velkatilaston ollessa kuntakohtaisessa tilastossa vuositasoinen,
ei tulokset välttämättä ole otoksen suppeuden vuoksi niin luotettavia, kuin käytettäessä koko Suomen velkatilastoa. Suomen tasoista ja kuntatasoista velkatietoa käyttävien mallien lisäksi esi-tän asuntokuntakohtaiseen tietoon perustuvan mallin, joissa kunnan tulo- ja asuntovelkamäärät on jaettu asuntokuntien määrällä ja käytetty näitä muuttujia velkamäärämuuttujien tilalla. Tässä on tarkoituksena vähentää kunnan asukasmäärän muutoksen vaikutusta tuloksiin. Kaikissa yhtä-löissä selitettävänä muuttujana on lnPK eli asuntojen keskimääräinen neliöhinta kunnittain.
Ensimmäisen hypoteesin testaaminen: malli tulojen ja velkojen vaikutuksesta kuntakohtaisiin asuntojen hintoihin
Ensimmäisessä mallissa tarkoitukseni on testata kuntakohtaisten velka- ja tulotietojen vaikutusta asuntojen hintoihin. Ensimmäisenä testasin mallia, jossa oli mukana kunnan asukkaiden yhteen-laskettu asuntovelkamäärä ja rahatulon määrä sekä korkoprosentti ja asuntokuntien lukumäärä.
Tällä mallilla tilannetta ei kuitenkaan voitu mitata, koska sekä asuntokuntien lukumäärä, että kunnan rahatulon määrä korreloivat erittäin vahvasti asuntokuntien yhteenlasketun asuntovelan määrän kanssa. Tämän pystyy huomaamaan jo aiemmin esittämästäni korrelaatioanalyysistä (Taulukko 1.). Regressioanalyysissä vastaavan huomion voi tehdä tarkastelemalla VIF-lukua, joka kuvaa mukana olevien muuttujien keskinäistä korrelaatiota eli multikollineaarisuutta. Yleensä VIF-luvun ollessa joillain muuttujilla yli kymmenen, pidetään regressioanalyysin tarkkuuden kärsi-vän liikaa. Tässä tapauksessa VIF-luvut olivat huomattavasti yli raja-arvona pidetyn kymmenen.
Tästä syystä päädyin poistamaan analyysissä käyttämistäni muuttujista kokonaan pois kunnan yhteenlasketun velka- ja tulomäärän. Molemmat näistä tekijöistä korreloivat vahvasti asuntokun-tien lukumäärän kanssa, mikä on tietenkin jo maalaisjärjellä ymmärrettävä asia. Toisaalta kaikki tekijät ovat kuitenkin aiemman teorian mukaan merkittävässä osassa asuntojen hintojen muo-dostumisessa. Ratkaisuna ongelmaan jaoin kunnan kokonaisvelan ja -tulon määrän asuntokun-tien lukumäärällä ja sain aikaan muuttujat, jotka kuvaavat kunkin kunnan keskimääräistä asunto-kuntakohtaista velka- ja tulomäärää. Näiden muuttujien avulla muodostin seuraavan regressio-mallin, mutta siinäkin asuntokuntakohtaisen tulo- ja velkamäärän VIF-luvut olivat vielä yli
kymmenen. Myös korrelaatioanalyysissä näiden muuttujien keskinäinen korrelaatio on yli 0,9, joten multikollineaarisuusongelma on melko ilmeinen.
Lopulta tätä kuntakohtaista mallia on kuvattava kahden erillisen mallin avulla. Malleista toinen kuvaa tulojen, asuntokuntien määrän ja korkotason vaikutusta asuntojen neliöhintaan. Tässä mallissa kaikki tekijät olivat tilastollisesti merkitseviä alle 0,001 tasolla. Myös mallin korjattu seli-tysaste on erinomainen, 89 prosenttia. Suhteellisesti eniten asuntojen neliöhintaan vaikutti tässä mallissa asuntokuntien määrä ja vaikutus on oletusten mukainen eli positiivinen. Lähes yhtä pal-jon neliöhintaan vaikutti tulojen määrä. Korkotason vaikutus oli tilastollisesti merkitsevä ja nega-tiivinen, kuten teorian mukaan oletettiinkin, mutta suhteessa muihin tekijöihin koron vaikutus on pieni. Alla on estimoitu yhtälö mallista. Mallissa on esitetty logaritmimuuttujien antamia kertoi-mia, joten niiden voimakkuuden vertailu tarkasti on haastavaa. Korko on mukana normaalina arvona. Standardoiduilla kertoimilla asuntokuntien lukumäärä oli kuitenkin vaikuttavin tekijä.
𝑙𝑛𝑃𝐾 = − 𝛼 + 𝛽1∗ 𝑙𝑛𝑇𝐴𝐾 − 𝛽2∗ 𝐼𝐴𝐾 + 𝛽3∗ 𝑙𝑛𝐴𝐾
Toisessa yhtälössä oli mukana tutkimukseni kannalta keskeisin tekijä eli asuntovelan määrä, joka oli edellä mainituista syistä muokattu asuntokuntakohtaiseksi keskiarvoksi. Muuten malli oli vas-taava kuin edellä kuvattu vaihtoehto. Tässä mallissa kaikkien muuttujien merkitsevyys oli alle 0,001 kuten vaihtoehtoisessakin mallissa. Samoin tämän mallin suhteessa eniten neliöhintaan vaikuttava tekijä on asuntokuntien lukumäärä. Asuntokuntakohtainen velkamäärä vaikutti asun-tojen neliöhintaan myöskin positiivisesti ja lähes yhtä vahvasti, kuin asuntokuntien lukumäärä-kin. Koron merkitys oli negatiivinen ja suhteellisesti heikko, kuten ensimmäisessäkin vaihtoeh-dossa. Alla on esitetty tämän mallin estimoitu yhtälö, jossa yllä esitetyn mukaisesti kertoimet ovat luonnollisen logaritmimuuttujan kertoimia. Korko on mukana reaaliarvona.
𝑙𝑛𝑃𝐾 = − 𝛼 + 𝛽1∗ 𝑙𝑛𝐿𝐴𝐾 − 𝛽2∗ 𝐼𝐴𝐾 + 𝛽3∗ 𝐴𝐾
Näin saadut tulokset vaikuttavat luotettavilta, koska velka- ja tulotiedoilla muodostetut erilliset mallit antavat melko yhtenevän vastauksen asuntojen neliöhintojen muodostumiseen.
Molempien mallien selitysaste on lähes 90 prosenttia ja tulokset ovat myös linjassa aiemman teorian kanssa. Näin ollen voimme pitää tutkimuksen ensimmäisen hypoteesia voimassa. Asun-tojen hinAsun-tojen ja asuntovelan määrän välillä on havaittavissa yhteys, vaikka huomioon otetaankin muut talouden tekijät ja kyseessä olevan kaupungin asukkaiden määrää kuvaava asuntokuntien lukumäärä. Kausaliteettia ei tällä mallilla kuitenkaan voida vielä osoittaa ja sen tutkimiseen sy-vennyn seuraavassa kappaleessa aikaistetun aineiston avulla.
Toisen hypoteesin testaaminen: velkojen ja tulojen suhteen vaikutus kuntakohtaisiin asunto-jen hintoihin
Toisessa mallissa käytän samoihin tietoihin perustuvia muuttujia kuin ensimmäisessäkin mal-lissa, mutta muuttujat on muodostettu hieman eri tavalla. Tavoitteenani on kuvata tällä mallilla velan saatavuuden vaikutusta asuntojen hintoihin. Velan saatavuuden mittarina käytän asunto-velkamäärän ja rahatulon suhdetta, joka on muodostettu kuntakohtaisesta aineistosta. Käytän mallissa edelleen asuntokuntien lukumäärää selittävänä tekijänä, koska edellisessä mallissa ha-vaitsin sen olevan tärkeä osa asuntojen hintojen muodostumista ja sitä ei siksi voi jättää huomio-matta tämän tyyppisessä tutkimuksessa. Lisäksi mukana on asuntovelan kuntakohtaisesta ai-neistosta saatu korkotaso, joka kuvaa luoton hintaa. Luoton hintakin toki määrittyy lainanhaki-jalle arvioidun luottotappioriskin mukaan ja kuvaa siten osittain lainan saatavuutta. Pääasiassa korkotaso määräytyy kuitenkin lainamarkkinoiden ja keskuspankkien sopimusten mukaan ja ny-kyisillä lainamarkkinoilla riskipreemiot ovat pieniä. Siksi nykytilanteessa on epätodennäköistä, että lainanhakijan laina jäisi toteutumatta liian suuren koron takia.
Edellä kuvatuilla tekijöillä muodostettu malli antaa myös aiemman teorian mukaisen tuloksen.
Tässä tapauksessa multikollineaarisuus ei tuota ongelmia analyysin tarkkuuteen, koska VIF-luvut pysyvät kaikkien muuttujien kohdalla yhden tienoilla. Myös mallin korjattu selitysaste on hyvä, noin 83 prosenttia. Tuloksen mukaan kaikki tekijät ovat tilastollisesti merkitseviä alle 0,01 tasolla ja kuten edellisessäkin mallissa, korko on ainoa negatiivisesti asuntojen hintoihin vaikuttava te-kijä. Mallin kertoimien perusteella edelleen suhteellisesti vaikuttavin tekijä asuntojen hintojen muodostumisessa on asuntokuntien lukumäärä. Velkojen ja tulojen suhde on kuitenkin
kertoimeltaan vaikuttava ja siten voimme pitää voimassa tämän mallin mukaan myös tutkimuk-sen kolmannen hypoteesin. Asuntovelkojen saatavuudella näyttää olevan selkeä yhteisvaikutus asuntojen hintojen kanssa. Tässä haluan kuitenkin mainita, että velkojen ja tulojen suhde ei vält-tämättä kuvaa velan saatavuutta kokonaisvaltaisesti, vaan saatavuuteen vaikuttaa useat muutkin tekijät. Velan saatavuuden kuvaaminen absoluuttisesti on haastavaa ja siksi tätä tulosta voita-neen käyttää estimaattina muistaen kuitenkin muuttujan taustan. Alla on ilmaistu aikaansaatu malli yhtälömuodossa.
𝑙𝑛𝑃𝐾 = 𝛼 + 𝛽1∗ 𝑉𝐾 − 𝛽2∗ 𝐼𝐴𝐾 + 𝛽3∗ 𝐴𝐾
Tämän lisäksi testasin, voisiko tulotietoa käyttää tässä mallissa selittävänä tekijänä poistamatta muita muuttujia mallista, koska tulot eivät korreloi asuntovelan ja tulojen suhteen erityisen mer-kittävästi ja siksi malli voisi toimia. Lisäksi tälle testille on perusteluna se, ettei tulo- ja velkatietoa voitu käyttää yhtä aikaa ensimmäisessä mallissa ja näiden tekijöiden vaikutusta olisi kuitenkin mielenkiintoista tutkia samanaikaisesti. Tuloksena mallista saadaan se, että tulojen määrä vai-kuttaa olevan erittäin ratkaiseva tekijä asuntojen hintojen muodostumisessa. Tulojen lisääminen malliin aiheuttaa myös tulojen ja velkojen suhteen tilastollisen merkitsevyyden katoamisen reg-ressioyhtälöstä. Tämä on aiempien tutkimusten vastainen tulos ja siksi sitä tulee vielä tarkastella ainakin ennustavan mallin avulla. Voidaan siis sanoa, että velkojen ja tulojen suhteella voi olla vaikutusta asuntojen hintoihin, mutta tulojen lisääminen muuttaa tilannetta olennaisesti. Toisen hypoteesin voimaan jääminen ei tällä perusteella vaikuta vielä varmalta, vaan tilannetta on tut-kittava tarkemmin ennustavien mallien avulla.
Kolmannen hypoteesin testaaminen: Suomen tulo- ja velkamäärien vaikutus kuntakohtaisiin asuntojen hintoihin
Kolmannessa mallissa keskityn tutkimaan koko Suomen velka- ja tulomäärien kehityksen vaiku-tusta kuntakohtaisiin asuntojen hintoihin. Tässä yhtälössä on mukana asuntokuntakohtaisen asuntovelan määrän lisäksi koko Suomen asuntolainojen keskimääräinen korkotaso, koko Suo-men keskimääräinen tulotaso per asuntokunta ja kuntakohtainen asuntokuntien lukumäärä.
Yhtälö siis kuvaa koko Suomen taloustilanteen vaikutusta näiden yhdeksän kunnan asuntojen neliöhintoihin ottaen huomioon myös kunkin kunnan asuntokuntien lukumäärän. Kyseisissä kaupungeissa asuu nopin 40 prosenttia Suomen kansalaisista, joten vertailua näiden kaupunkien asuntojen neliöhintojen ja koko Suomen taloustietojen välillä voi pitää perusteltuna. Alapuolella on kuvattu regressioanalyysin tuottama yhtälö:
𝑙𝑛𝑃𝐾 = −𝛼 + 𝛽1∗ 𝑙𝑛𝐿𝐴𝐴+ 𝛽2∗ 𝑙𝑛𝑇𝐴 − 𝛽3∗ 𝑙𝑛 𝐼𝐴+ 𝛽4∗ 𝐴𝐾
Tämän testin tulos on ennakko-oletuksiin nähden poikkeava. Näillä muuttujilla tehdyssä tarkas-telussa valituista talouden muuttujista ainoastaan velkamäärällä on merkitsevä alle 0,01 tilastolli-nen vaikutus asuntojen hintoihin. Edelleen, kuten kuntakohtaisen aineiston tarkastelussakin, suhteellisesti vaikuttavin tekijä kuntakohtaisten asuntojen hintojen muodostumisessa on tokuntien lukumäärä, jonka merkitsevyys on myös alle 0,01. Sinänsä ei ole yllättävää, että asun-tojen kysyntää kuvaava asuntokuntien lukumäärä on merkittävin tekijä asunasun-tojen hinasun-tojen muo-dostumisessa, mutta korkotason ja tulojen merkityksettömyys on vastoin aiemman teorian anta-maa oletusta. Kuviossa on yliviivattu ne muuttujat, jotka eivät ole merkitseviä ja siten jäävät pois mallista. Mallin korjattu selitysaste on hyvä, 71,6 prosenttia.
Mallin VIF-luvut olivat alle kymmenen, mutta kuitenkin reilusti korkeammat kuin kuntakohtaisen aineiston mallissa. Varianssianalyysissä voidaan huomata, että asuntolainan asuntokuntakohtai-nen määrä korreloi koko Suomen aineistossa vahvasti koron kanssa -0,87 korrelaatiokertoimella.
Siksi edellistä mallia ei voi pitää täysin luotettavana. Kun malli jaetaan kahteen osaan, kuten kun-takohtaisen aineiston tapauksessa ensimmäisessä mallissa, tulokset muuttuvat hieman. Erilli-sissä malleissa myös korkotaso ja rahatulo ovat merkitseviä tekijöitä, joskin huomattavasti pie-nemmällä suhteellisella kertoimella, kuin asuntokuntien lukumäärä. Tästä voidaan tehdä johto-päätös, että koko Suomen kotitalouksien talousaineiston tarkastelu ei kuvaa kuntakohtaisia asuntojen neliöhintoja kovin hyvin. Tilastollisesti merkitseviä kertoimia malli toki tuottaa, mutta kuntakohtaisen tulo- ja velka-aineiston vertailu kuntakohtaiseen asuntojen neliöhintaan näyttäisi olevan järkevämpää.
Edellä esitettyjen tuloksen perusteella kuntakohtaisiin asuntojen hintoihin on vaikuttanut vali-tulla ajanjaksolla selkeimmin kaupungistuminen, vaikka muillakin tekijöillä näyttää olevan selkeä vaikutus. Vuosina 2006–2020 talouden tekijät ovat pysyneet melko vakaina lukuun ottamatta pientä taantumaa vuoden 2007 finanssikriisin jälkeen. Vuonna 2007 alkanut lama ei kuitenkaan vaikuttanut Suomen asuntomarkkinoihin yhtä voimakkaasti kuin esimerkiksi USA:ssa tai Espan-jassa. Trendeinä tällä ajanjaksolla voidaan huomata tasainen velkamäärän kasvaminen ja Euroo-pan keskusEuroo-pankin ohjaama matalan koron politiikka. Tulotaso Suomessa on myöskin säilynyt melko tasaisena, joskin pientä nousua on havaittu viimeisen 15 vuoden aikana. Näiden tietojen pohjalta on mielestäni oletettavaa, että talouden tekijöiden ja asuntomarkkinoiden välillä oleva yhteisvaikutus on aikaisempiin aineistoihin perustuviin tutkimuksiin verratessa heikompaa. Mi-käli tähän tutkimukseen olisi ollut saatavilla esimerkiksi aineisto, joka ulottuisi 1980-luvun alku-puolelle, uskoisin vaikutussuhteiden olevan tilastoissa voimakkaampia ja tätä puoltaa myös aiemmat tutkimukset (Booth ym. 1994; Oikarinen 2009a; Oikarinen 2009b).
Kokonaisuutena arvioitaessa näistä malleista mielestäni paras on ensimmäinen regressiomalli, vaikka se jouduttiinkin jakamaan kahteen osaan. Perusteluna mielipiteelleni on se, että malli huomioi nimenomaan kuntakohtaista velka- ja tulotietoa ja on lisäksi kaikkein lähimpänä aiem-man teorian ennustamaa tulosta. Tuloksen luotettavuutta toki laskee se, ettei velka- ja tulotietoja ole saatavilla neljännesvuositasolla ja siksi näiden tietojen otos on vuositasoinen ja siksi suppea-hko. Kaikki tulokset olivat kuitenkin mielestäni kohtuullisen luotettavia niin tilastollisesta kuin teoreettisestakin näkökulmasta. Tästä syystä testaan seuraavakasi syy-seuraussuhteita näillä sa-moilla yhtälöillä käyttäen aikaistettua neliöhinta-aineistoa.