Huffin mallin kalibrointi empiirisen asiointiaineiston
perusteella
Kimmo Nurmio ja Antti Rehunen Suomen ympäristökeskus
Sisällys
Johdanto ... 3
Huffin malli ja MCI-malli ... 3
Aineistot ja kalibrointimenetelmä ... 5
Tutkimusalue ja asiointikohteet ... 6
Aineistot ... 8
Parametrien estimointi ... 9
Mallin toimivuuden arviointi ... 13
Kalibroinnin tulokset ... 14
Kalibrointitulosten yhteenveto ... 14
Mallin soveltaminen vähittäiskaupan suuryksikön vaikutusten arvioinnissa (erikoiskauppa) ... 16
Sovellettava malli ja skenaario ... 17
Tulokset... 17
Tulosten tulkintaa ... 21
Kirjallisuus ... 22
Johdanto
Tässä dokumentissa kuvataan lyhyesti menetelmä Huffin mallin ja sen kaltaisen MCI-mallin kalibrointiin empiirisen asiointiaineiston perusteella. Ensin dokumentissa esitällään tiivistetysti mallien tausta ja perusperiaatteet, jonka jälkeen kuvataan kalibrointiin ja mallin soveltamiseen käytetyt aineistot ja menetelmä sekä tarkemmin itse kalibrointi ja sen periaatteet. Tässä yhteydessä malli kalibroidaan ja sovelletaan tapauskohtaisesti alue- ja yhdyskuntarakenteen näkökulmasta seudullisessa mittakaavassa, mutta sama kalibrointi menetelmä soveltuu myös muunlaisiin tarkasteluihin. Lopuksi esitellään lyhyt ja yksinkertaistettu esimerkki kalibroidun mallin soveltamisesta vähittäiskaupan suuryksiköiden vaikutusten arvioinnissa.
Huffin malli ja MCI-malli
Vetovoimamallit mittaavat matemaattisesti kohteen houkuttelevuutta vetovoimaa sekä kohteen
suhteellista sijaintia kuvaavien tekijöiden avulla. Vetovoimamallit perustuvat yksinkertaiseen analogiaan, jossa tietyn kohteen vuorovaikutus tietyssä paikassa on riippuvainen sekä keskuksen koosta että
keskuksen ja paikan välisestä etäisyydestä. Tämän perusanalogian kehitettiin niin kutsuttu ”The Law of Retail Gravitation” -malli, jossa tietyn keskuksen vuorovaikutus tietyssä paikassa on suoraan
verrannollinen keskuksen kokoon ja kääntäen verrannollinen etäisyyden neliöön. Jatkossa mallia testattiin useiden tutkijoiden toimesta empiirisillä aineistoilla ja tuloksena syntyi useita erilaisia muunnelmia. Mallia esimerkiksi laajennettiin niin, että sillä pystyttiin määrittämään missä kahden eri keskuksen välisen vuorovaikutuksen raja kulkee (breaking point), kun alkuperäinen malli pystyi
kuvaamaan ainoastaan sitä, miten alueen ostovoima voidaan jakaa keskusten välillä. Deterministisiset mallit kärsivät kuitenkin siitä, että ne eivät kyenneet kuvaamaan ostojen suuntautumista silloin, kun useat myymälät kilpailivat samoista asiakkaista. Mallit olivat siis siinä mielessä tiukasti deterministisiä, että tietty kysyntäpiste, kuten kotitalous, ei voinut kuulua kuin yhden keskuksen vaikutus- ja markkina- alueeseen. Todellisuudessa kuluttaja asioi ja hyödyntää useita eri keskuksia ja näin ollen keskuksien vaikutusalueet eivät ole toisensa poissulkevia vaan osittain päällekkäisiä – jopa sisäkkäisiä (kuva 1).
Deterministissä malleissa usein käytettyä etäisyyshaittaparametria on kritisoitu usein myös siitä, että riippumatta ostosmatkan tyypistä ja siitä mitä tavaraa ostetaan, on parametri ollut vakio. Monien tutkimusten mukaan parametrin arvo riippuu
kuitenkin merkittävästi tuotteesta mitä ollaan hankkimassa ja vakioitua parametria ei siksi voi käyttää. Tiettyjä tavaroita, kuten erikoistavaroita, ollaan valmiimpia hankkimaan kauempaa. Tällöin etäisyyden vaikutus ei ole niin voimakas kuin esimerkiksi päivittäistavaroita hankittaessa.
Yhtenä ensimmäisistä vastausta determinististen mallien puutteisiin tarjosi David L. Huff
kehittäessään probabilistisen vetovoimamallin kuvaamaan tietyn kysyntäpisteen, kuten kuluttajan,
Kuva 1. Vaikutusalueiden päällekkäisyys.
Pienen keskuksen vaikutusalue voi jäädä kokonaan suuremman sisään (Löffler 1998:
268).
todennäköisyyttä kuulua valittujen keskusten markkina-alueeseen. Alkujaan Huff kehitti mallin ennustamaan keskuksen saamaa potentiaalista myyntiä. Tällöin kysyntäpisteiden saamat arvot kuvasivat tietyn keskuksen siinä sijainnissa saamaa markkinaosuutta, jonka pohjalta voitiin arvioida potentiaalinen myynti keskuksille. Tämä potentiaalinen markkinaosuus voidaan kuitenkin myös tulkita todennäköisyydeksi, että tietyssä pisteessä asuva kuluttaja asioi tietyssä keskuksessa. Huffin malli perustuu hyötyteoreettisiin periaatteisiin, joiden mukaan kuluttajat käyttäytyvät rationaalisesti ja valitsevat sen keskuksen, josta saavat suurimman hyödyn suhteessa muista keskuksista saataviin hyötyihin.
Hyötyä mallissa voidaan kuvata usealla eri tavalla, mutta käytännössä useimmiten on käytetty keskuksen kokoa, jonka oletetaan tarkoittavan suurempaa tuote- ja liikevalikoimaa sekä usein myös halvempia hintoja ja näin ollen suurempaa hyötyä kuluttajalle. Etäisyys voidaan sitä vastoin tulkita kustannuksena, joka kasvaa epälineaarisesti kun etäisyys keskukseen kasvaa. Huffin malli ei perustu myöskään täysin normatiivisiin oletuksiin kuluttajien käyttäytymisestä niin kuin deterministiset
vetovoimamallit, vaan siinä hyödynnetään empiirisesti mitattua todellista asiointia, jonka avulla malli kalibroidaan vastaamaan paremmin alueen kuluttajien todellista ostokäyttäytymistä. Toisin sanoen objektiiviset muuttujat, kuten keskuksen koko ja etäisyys, kalibroidaan empiirisen aineiston perusteella vastaamaan paremmin kuluttajien todellista käsitystä siitä, millainen on tietystä keskuksesta saatava hyöty ja miten etäisyys siihen vaikuttaa.
Huffin mallista on kehitetty useita erilaisia variaatioita, joista Nakanishin ja Cooperin kehittämä MCI-malli (Multiplicative Competitive Interaction Model) on yksi varhaisimpia esimerkkejä. Tässä mallissa
vetovoimana voidaan käyttää useita vetovoimatekijöitä (kts. Nakanishi & Cooper 1974).
Alkuperäisessä MCI-mallissa etäisyyttä ei esitetä erillisenä tekijänä niin kuin perinteisesti Huffin mallissa tai vetovoimalleissa yleensä, vaan se katsotaan olevan yksi tekijä muiden joukossa kuvaamaan
kuluttajalle asiointikohdetta. Kyseisessä muodossa esitettynä malli soveltuu esimerkiksi tuotemerkkien välisten myyntiosuuksien arvioimiseen, joten spatiaalista ulottuvuutta ei välttämättä tarvita. Malliin voidaan kuitenkin helposti liittää spatiaalinen ulottuvuus ottamalla valintatilanne i spatiaalisesti kuluttajan maantieteellisenä sijaintina, esimerkiksi pisteenä tai alueena ja sisällyttämällä saavutettavuus yhdeksi muuttujaksi.
Huffin malli: [1]
𝑃𝑖𝑗 = todennäköisyys, että kuluttaja pisteessä i asioi kauppakeskuksessa j
𝑆𝑗 = kauppakeskuksen vetovoima (mitattuna tietylle tuoteryhmälle osoitettuna myyntipinta-alana)
𝑇𝑖𝑗 = kuluttajan etäisyys sijainnista i kauppakeskukseen j matka-aikana mitattuna
λ = empiirisesti määriteltävä parametri, joka heijastaa matka-ajan vaikutusta erityyppisiin ostosmatkoihin [1]
Malli [2] eroaa alkuperäisestä Huffin mallista [1] siinä, että vetovoima voi olla usean tekijän muodostama kokonaisuus, ja että jokaiselle vetovoimatekijälle voidaan estimoida parametri kuvaamaan kyseisen tekijän herkkyyttä. Vetovoimatekijöille empiirisesti estimoitava parametri voidaan esittää myös alkuperäisessä Huffin mallissa vetovoimatekijän 𝑆𝑗 eksponenttina.
Aineistot ja kalibrointimenetelmä
Vetovoimamallin määrittelyyn ja käyttöön liittyy olennaisesti jokin alue ja ongelma, johon mallia sovelletaan. Molempien muotoilu vaikuttavat esimerkiksi käytettävissä olevien aineistojen kautta.
Parhaimman tuloksen malli antaa silloin, kun se määritellään ja kalibroidaan tiettyä käyttötarkoitusta varten tiettyyn kontekstiin. Sovellettaessa mallia täysin eri käyttötarkoitukseen, esimerkiksi eri alueella, joudutaan mallin antamiin tuloksiin suhtautumaan suuremmalla varauksella. Mallin käyttötarkoituksesta riippuen, joudutaan tekemään myös erilaisia ratkaisuja, kuten millaiset yksiköt tai kokonaisuudet
muodostavat tutkimusalueen asiointikohteet, joiden vaikutusalueita mallinnetaan.
Kun tarkastelutasona on alue- ja yhdyskuntarakenne, määritellään ja kalibroidaan malli seudullisessa mittakaavassa. Kalibrointimenetelmää on kehitetty soveltamalla sitä seudulliseen tilaa vaativan kaupan sekä muun erikoiskaupan palveluverkkoon sekä päivittäistavarakauppaan. Malli määritellään ja
kalibroidaan jokaiselle tutkimusalueelle ja tuoteryhmälle (ET, TIVA, PT) erikseen. Tämän jälkeen
empiirisesti kalibroidun mallin tulosta – ruutukohtaista teoreettista asiointitodennäköisyyttä – sovelletaan yksinkertaisessa esimerkkitapauksessa tarkoituksena arvioida mallin soveltuvuutta seudullisen
vähittäiskaupan suuryksikön vaikutusten arviointiin. Mallin soveltaminen jakautuu alla lueteltuihin päävaiheisiin, tarkemmin prosessi on esitetty kuvassa 2.
1. Muodostetaan tutkimusongelma ja tutkimusalue
2. Määritellään ongelmaan soveltuva kaupan palveluverkko (asiointikohteet)
3. Kalibroidaan malli valitulla menetelmällä empiirisen asiointiaineiston perusteella (estimoidaan mallin parametrit).
4. Tuotetaan mallilla ruutukohtaiset asiointitodennäköisyydet valittuihin asiointikohteisiin 5. Sovelletaan mallin tuottamaa todennäköisyyttä
MCI-malli: [2]
𝑃𝑖𝑗 = todennäköisyys että kuluttaja pisteessä i asioi kohteessa j
𝐴ℎ𝑗 = mittari ominaisuudelle h (h = 1,2,.H), joka heijastaa kohteen j vetovoimaa γ = parametri kuvaamaan todennäköisyyden 𝑃𝑖𝑗 herkkyyttä vetovoimatekijään h 𝐷𝑖𝑗 = saavutettavuus kuluttajan sijainnista i kohteeseen j
λ = parametri kuvaamaan todennäköisyyden 𝑃𝑖𝑗herkkyyttä saavutettavuuteen (etäisyyshaitta) n = keskusten lukumäärä
Kuva 2. Menetelmän prosessikaavio.
Tutkimusalue ja asiointikohteet
Tutkimusalueen rajaus riippuu tarkasteltavasta ongelmasta, johon mallia sovelletaan. Esimerkiksi erikois- ja päivittäistavarakaupassa on luonnollista käyttää laajuudeltaan aluetta, joka vastaa pääpiirteissään käytetyn tuoteryhmittelyn asiointialuetta ja muodostaa näin luonnollisen
aluekokonaisuuden, jossa suurin osa tuoteryhmän asioinnista tapahtuu. Päivittäistavarakauppa on luonteeltaan melko paikallista, jolloin myös asiointialue on laajuudeltaan usein pieni mutta tässä yhteydessä myös päivittäistavarakauppaa on tarkasteltu samassa mittakaavassa kuin erikoiskauppaa.
Erikoiskaupan osalta luonnollinen tutkimusalue on selkeästi laajempi, koska erikoistavaroita kuluttajat ovat halukkaampia hakemaan kaukaakin tarpeet tyydyttävästä keskuksesta. Asiointidynamiikassa on kuitenkin suuria alueellisia sekä tuotekohtaisia eroja, jolloin eri alueilla asiointialueet muodostavat erilaisia kokonaisuuksia. Myös tietyt erikoistavarat voivat olla paikallisia luonteeltaan ja riippuen käytetystä tuoteryhmittelystä voivat asiointialueet vaihdella paljonkin.
Mallin sovellusalueiksi on rajattu yhdyskuntarakenteen toiminnalliset alueet (2012) selvityksessä määritellyt kaupunkiseutujen asiointialueet (kuva 2). Kuntapohjaiset asiointialueet on määritelty Suuri Vaikutusaluetutkimus (SVT) 2011 aineiston perusteella rajaamalla ensin keskuskunniksi sellaiset kunnat, joissa vähintään 60 prosenttia asioinnista tapahtuu omassa kunnassa eikä mihinkään muuhun kuntaan suuntaudu yli 10 prosenttia asioinnista. Muut kunnat on liitetty sen kunnan asiointialueeseen, johon sieltä asioidaan eniten. Asiointialue muodostaa laajan toiminnallisen aluekokonaisuuden, jonka sisällä
tapahtuu suurin osa asioinnista ja ostovoiman siirtymät alueen ulkopuolelle minimoituvat. Asiointialuetta vastaavana käsitteenä on käytetty esimerkiksi markkina-aluetta.
Kuva 3. Esimerkkinä Tampereen seudun asiointialue ja määritellyt asiointikohteet.
Kuten mallissa sovellettava tutkimusalue, niin myös asiointikohteet riippuvat tutkimusongelmasta ja mallin käyttötarkoituksesta, sekä usein myös käytettävistä aineistoista. Käyttötarkoitus määrittää
tarkastellaanko yksittäisten päivittäistavarakauppojen, vai vain esimerkiksi suurimpien kauppakeskusten vaikutusalueita. Vai halutaanko tarkastella seudullisen kaupan palveluverkon, kuten keskusta-alueiden, alakeskusten ja muiden merkittävien myymäläkeskittymien vaikutusalueita tietyn tuoteryhmän mukaan.
Malli ei rajoita sitä, millaisia asiointikohteet voivat olla, mutta on hyvin olennaista, että asiointikohteet on määritelty johdonmukaisesti mallin käyttötarkoituksesta riippuen.
Tässä tutkimuksessa seudullinen kaupan palveluverkko (asiointikohteet) muodostuvat keskusta-alueista ja keskustojen ulkopuolisista merkittävimmistä myymäläkeskittymistä. Asiointikohteet on määritelty Suomen ympäristökeskuksessa yhdyskuntarakenteen monikeskuksisuus ja kauppa (YKR-Moka) sekä keskustojen elinvoimaisuus ja asema yhdyskuntarakenteessa (YKR-Kela) tutkimuksissa kehitettyä keskusta- ja kaupan alue rajausta hyödyntäen. Tutkimuksissa kehitetty menetelmä tunnistaa keskusta- alueiksi sellaiset alueet, jotka sisältävät jalankulkuetäisyydellä muita alueita enemmän ja tiiviimmin palveluiden ja vähittäiskaupan työpaikkoja sekä väestöä. Toimintoja ja työpaikkoja täytyy myös olla riittävän monipuolisesti usealta toimialalta. Keskustojen ulkopuoliset kaupan alueet on rajattu
menetelmällä, joka ei perustu 250-metrin ruudukkoon ja ruututietoihin. Tässä melko yksinkertaisessa menetelmässä vähintään viiden työpaikan tai 1000 kerrosneliömetrin kaupparakennuksista
muodostetaan 75–250 metrin etäisyysvyöhyke kaupan koon mukaan. Toisiaan leikkaavat vyöhykkeet on
yhdistetty yhtenäisiksi alueiksi, joista on edelleen valittu merkittävimmät alueet työpaikkamäärän perusteella (kts. Rehunen ym. 2014: 21.) Rajauksen toimipaikkatiedot perustuvat Tilastokeskuksen yritys- ja toimipaikkarekisterin sekä Väestörekisterikeskuksen ylläpitämän rakennus- ja
huoneistorekisterin tietoihin.
Aineistot
Mallin käyttötarkoituskohtainen kalibrointi perustuu Suomen ympäristökeskuksessa käytössä olevaan TNS Gallup Oy:n Suuri vaikutusaluetutkimus (SVT) 2011 aineistoon. Aineistoa on hyödynnetty Suomen ympäristökeskuksessa muun muassa vähittäiskaupan suuryksiköiden alue- ja yhdyskuntarakenteellisia vaikutuksia tarkastelleessa tutkimushankkeessa. Aineiston perusjoukon muodostavat kotitaloudet, joissa vastaajina ovat olleet vähintään 15 vuotta täyttäneet jäsenet. Ensimäistä kertaa Internet-kyselynä
toteutetussa kyselyssä vastaajilta kysyttiin, mistä kunnasta talouteen on viimeksi hankittu 39:ää eri tuotetta tai palvelua. Vastaaja pystyi myös tarkentamaan, mistä erityisestä ostopaikasta, kuten
kauppakeskuksesta tai keskusta-alueelta, tuotteita on hankittu. Tutkimuksen kokonaisvastaajamäärä on noin 30 000 kotitaloutta. Kyselyn kohdejoukon otanta ei perustu täysin satunnaisotantaan, vaan
tarkoituksena siinä oli tuottaa alueellisesti mahdollisimman kattava otos. Vuonna 2011 toteutetussa internet-kyselyssä suuret kaupunkiseudut ovat paremmin edustettuina aikaisempiin postitse
toteutettuihin kyselyihin verrattuna mutta toisaalta pienet maaseutukunnat ovat selvästi heikommin edustettuina.
Suomen ympäristökeskuksessa kyselyaineisto on käytössä sekä postinumero- että kuntatason aineistoina, joissa molemmissa on mukana tarkemmat yksittäiset ostopaikat. Käytetyssä aineistossa ostopaikka on siis ilmoitettu joko kunnan, kuntaa tarkemman aluejaon tai yksittäisen kaupan tai keskusta-alueen tarkkuudella. Vastaajien asuinpaikka on ilmoitettu sitä vastoin ainoastaan kunnan ja postinumeroalueen tarkkuudella. Tarkempaa tietoa vastaajien asuinpaikasta ei ollut saatavilla, mutta useimmilla kaupunkiseuduilla postinumeroalueet muodostavat sen verran pieniä kokonaisuuksia, että aineiston spatiaalinen tarkkuus on tämän tutkimuksen tarkoitukseen sekä käytetyn yleistason mallin kalibrointiin riittävä. Koska SVT-aineistossa vastaajat olivat myös ilmoittaneet tuotteen ostopaikan, pystyttiin mainitut ostopaikat ja täten asioinnin suuntautuminen liittämään tiettyyn keskusta-alueeseen tai kaupan alueeseen. Vastaaja oli esimerkiksi ilmoittanut ostopaikaksi Tampereen keskustan, jolloin tämän asiointitapahtuman (tuotteen hankinnan) kohteeksi voitiin määritellä edellä kuvatulla menetelmällä rajattu Tampereen keskusta-alue.
Toinen hyvin keskeinen aineistokokonaisuus on Suomen ympäristökeskuksen ylläpitämän ja ympäristöhallinnossa kehitetyn yhdyskuntarakenteen seurantajärjestelmän (YKR) tiedot.
Paikkatietopohjainen seurantajärjestelmä on kehitetty yhdyskuntarakenteessa tapahtuvien muutosten, valtakunnallisesti ja ajallisesti vertailukelpoisten seurantojen ja analyysien tuottamiseen.
Yhdyskuntarakenteen seurantajärjestelmä (YKR) voidaan katsoa koostuvan sen sisältämistä tiedoista, aluejaoista ja kehitetyistä menetelmistä yhdyskuntarakenteen kehityksen analysointiin. YKR perustuu 250 metrin ruututietoihin. Maanpeitetietoja lukuun ottamatta kaikki tiedot ovat Tilastokeskuksen tuottamia tai eri lähteistä koostamia. Tutkimuksessa on hyödynnetty seuraavia YKR-ruutuaineistoja:
1. Kaupan toimipaikat (2010) 2. Vähittäiskaupan työpaikat (2009) 3. Väestö (2011)
4. Rakennukset (2011)
Kolmas keskeinen aineistokokonaisuus kattaa Tilastokeskuksen yritys- ja toimipaikkarekisterin (2011) sekä Väestörekisterikeskuksen ylläpitämän rakennus- ja huoneistorekisterin (RHR 2011) tiedot. Tässä tutkimuksessa aineistoista on hyödynnetty Suomen ympäristökeskuksessa kaupan tutkimushankkeita varten korjattua ja tarkastettua yritys- ja toimipaikkarekisteriä, jonka tiedot on edelleen yhdistetty rakennus- ja huoneistorekisterin tietoihin. Toimipaikka-aineistoa on paranneltu muun muassa täydentämällä ja korjaamalla varsinkin suurimpien yritysten ja toimipaikkojen sijaintitietoja. Aineiston korjaamisen ja yhdistämisen tuloksena saadaan kokoon aineisto, josta voidaan tuottaa laskennallisia kaupan kerrosaloja ja työpaikkamääriä.
Lisäksi tutkimuksessa on käytetty AC Nielsen Oy:n tuottamaa päivittäistavarakauppa-aineistoa vuodelta 2012. Jotta tämä aineisto saatiin vastaamaan paremmin vuoden 2011 asiointitietoja, tutkimuksessa ei huomioitu aineiston sisältämiä vuonna 2012 aloittaneita toimipaikkoja. Aineisto sisältää tietoja
esimerkiksi päivittäistavarakauppojen myyntipinta-aloista.
Mallin vaatimat saavutettavuuslaskennat perustuvat Liikenneviraston ylläpitämään valtakunnalliseen Digiroad-tieverkkoaineistoon, joka sisältää koko Suomen tie- ja katuverkon sekä niihin liittyvät tärkeimmät ominaisuustiedot. Tätä tutkimusta varten vektorimuotoinen topologinen tieverkosto muunnettiin kuitenkin mallin saavutettavuuslaskentoja varten rasterimuotoon.
Parametrien estimointi
Tutkimuksessa sovelletaan lähtökohtaisesti Huffin mallin pohjautuvaa MCI-mallia [2], joka mahdollistaa usean vetovoimamuuttujan. Saavutettavuustekijää 𝐷𝑖𝑗 kuvaavana muuttujana tutkimuksessa on käytetty sekä linnuntie-etäisyyttä että kuluttajan käyttämää matka-aikaa autolla kohteeseen tieverkkoa pitkin mitattuna. Matka-aikojen laskenta ruuduista kaikkiin asiointikohteisiin suoritettiin
paikkatietojärjestelmässä kustannusetäisyys (cost distance) analyysillä Spatial analyst työkaluilla.
Vektori muotoinen Digiroad tieverkkoaineisto on ensin muunnettu 25 x 25 metrin solukokoon siten, että jokainen solu saa tieverkon nopeutta vastaavan impedanssiarvon. Arvo kuvaa solun ylittämisen
kustannusta eli tässä tapauksessa aikaa sekunteina, joka kuluu yhden solun läpikulkuun. Arvo
muodostuu tien kohdalla nopeusrajoituksen mukaan käänteislukuna, eli kun nopeusrajoitus on korkea, on kustannus vastaavasti alhainen. Tieverkon ulkopuolella impedanssiarvo on muodostettu
kävelyvauhdin mukaan. Kevyen liikenteen väylien kohdalla solu saa myös kävelyvauhtia vastaavan impedanssiarvon. 250 metrin ruuduille saavutettavuus arvo saadaan saavutettavuuspinnan 25 metrin solujen keskiarvosta. Rasterilähtöistä menetelmää sovellettiin etenkin sen takia, että laskentaprosessi on näin huomattavasti nopeampi vektorimuotoiseen verkostoanalyysiin verrattuna.
Koska SVT-aineistossa vastaajien sijainti oli tiedossa tarkimmillaan vain postinumeroalueen tarkkuudella, jouduttiin mallin kalibrointia varten saavutettavuusmittareille muodostamaan
postinumeroaluekohtainen arvo – väestöpainotettu etäisyyden keskiarvo. Kalibrointia varten ruudulle laskettua saavutettavuusarvoa (linnuntie ja matka-aika) painotettiin ruudun väestömäärällä. Painotettujen arvojen perusteella laskettiin lopullinen väestöpainotettu saavutettavuus jakamalla postinumeroalueelta tiettyyn asiointikohteeseen suuntautuvien väestöpainotettujen saavutettavuuksien summa
painottamattomien saavutettavuuksien summalla. Painotus kasvattaa niiden ruutujen roolia
postinumeroalueen saavutettavuusarvon muodostumisessa, joissa on paljon väestöä. Tällöin arvo kuvaa hieman paremmin postinumeroalueen asukkaiden keskimääräistä etäisyyttä asiointikohteisiin kuin esimerkiksi postinumeroalueen fyysisestä keskipisteestä laskettu etäisyys. Lopputuloksena jokainen postinumeroalue sisältää saavutettavuustiedon kaikkiin keskuksiin.
Vetovoimatekijän määrittely on usein mallin muodostamisen haastavin vaihe. Lähtökohdaksi muuttujan muodostamisessa otettiin yksinkertaisuus, mutta kuten malli [2] mahdollistaa, voi vetovoimatekijä olla myös usean muuttujan muodostama kokonaisuus. Mallin sen salliessa, vetovoiman kuvaamiseen tutkimuksessa kokeiltiin useita eri muuttujia ja niiden yhdistelmiä. Tämä tehtiin laskemalla työssä rajatuille keskusta- ja kaupan alueille erilaisia kohteen kaupallista vetovoimaa mahdollisesti heijastavia tekijöitä (Liite 1). Laskettujen muuttujien soveltuvuutta vetovoimatekijäksi testattiin tämän jälkeen kalibroimalla malli empiirisen asiointiaineiston perusteella ja arvioimalla tuloksia. Kalibroinnilla haetaan mallin tuntemattomille parametreille tutkimusalueen asiointia parhaiten vastaavat estimaatit.
Mallin kalibrointi perustuu Suuri Vaikutusaluetutkimus 2011 (SVT) aineistoon. Useissa tutkimuksissa on todettu, että etäisyyden vaikutus asiointiin riippuu muun muassa siitä, mitä tuotetta ollaan hankkimassa.
Toisia tuotteita ollaan valmiimpia hakemaan kaukaa, kun taas toiset tuotteet, kuten päivittäistavarat, hankitaan usein lähempää.
Parametrien estimointia varten SVT-aineiston tuoteryhmät luokiteltiin neljään luokkaan:
päivittäistavaroihin (PT), erikoistavaroihin (ET), tilaa vaativiin tavaroihin (TIVA) ja palveluihin (PALV), joista keskityttiin pääasiassa erikoiskauppaan. Vastaavanlainen luokitus on käytössä myös kaavoituksen yhteydessä tehtävässä kaupan palveluverkon suunnittelussa. Tuoteryhmäluokittelun lähtökohtana on käytetty Suomen ympäristökeskuksessa SVT-aineiston pohjalta tehtyä luokittelua (taulukko 1). Kaksi SVT-tuoteryhmää (autokauppa, kotimaan matkailukohteet) jätettiin kokonaan luokittelun ulkopuolelle, sillä ne erosivat luonteeltaan muista liian paljon.
Taulukko 1. SVT-tuoteryhmien luokittelu.
SVT-aineiston tuoteryhmä Luokka SVT-aineiston tuoteryhmä Luokka
Kosmetiikka ET Ravintolapalvelut PALV
Alkoholi ET Kahvila- tai lounasravintolapalvelut PALV
Kodin viihde-elektroniikka ET Pankkikonttorissa asiointi PALV
Kodin tietotekniikkalaitteet ET Vakuutusyhtiön konttorissa asiointi PALV
DVD, CD, Tietokonepelit yms. ET Matkatoimistossa asiointi PALV
Matkapuhelimet, liittymät, laajakaista ET Kampaamot / parturit, kauneushoitolat PALV
Kellot ja korut ET Kirjastossa käynti PALV
Silmälasit, piilolasit ym. optikkotuotteet ET Julkiset lääkäri- ja terveydenhoitopalvelut PALV
Kirjat ET Kulttuuripalvelut PALV
Naisten vaatteet ET Julkiset koulutuspalvelut PALV
Miesten vaatteet ET Yksityiset lääkäri- ja terveydenhoitopalvelut PALV
Lasten vaatteet ET Elokuvissa käynti PALV
Naisten jalkineet ET Vakuutusyhtiön konttorissa asiointi PALV
Miesten jalkineet ET Matkatoimistossa asiointi PALV
Urheiluvälineet ja -asusteet ET Elintarvikkeet arkisin PT
Kodinkoneet TIVA Elintarvikkeet viikonloppuisin PT
Huonekalut ja sisustustarvikkeet TIVA Pesu- ja puhdistusaineet, paperit PT Rauta- rakennus- ja remonttitarvikkeet TIVA
Mallin epälineaarisen luonteen johdosta sen parametrien estimointi tilastollisesti yksinkertaisesti ja pätevästi on melko monimutkaista. Tämä onnistuu kuitenkin yksinkertaisemmin muuntamalla malli ensin lineaariseksi parametrien suhteen. Menetelmänä sovelletaan Nakanishin ja Cooperin kehittämää ”log- centering” -menetelmää, jolla malli muunnetaan lineaariseksi logaritmimuunnoksella ja geometrisilla keskiarvoilla (kts. Nakanishi & Cooper 1982). Muunnos linearisoi ja keskittää muuttujat niin, että ne täyttävät paremmin lineaarisen mallin vaatimat oletukset (esim. normaalius). Tällöin myös
regressiomallin virhe eli residuaalit voidaan olettaa olevan normaalijakautuneita. Muuttujien ja
residuaalien ollessa normaali- tai lähes normaalijakautuneita, pätevät myös tilastolliset merkitsevyystestit valitulla merkitsevyysasteella, jolloin parametrien estimaattien tilastollinen merkitsevyys voidaan
todentaa.
Mallissa [3] 𝑃̃𝑖on siis niihin asiointikohteisiin suuntautuvien asiointiosuuksien ja 𝐷̃𝑖etäisyyksien geometrinen keskiarvo, joihin postinumeroalueelta (valintatilanteesta i) on empiirisessä aineistossa asiointia. Vastaavasti 𝐴̃𝑗 on vetovoimamuuttujan geometrinen keskiarvo kaikista asiointikohteista j laskettuna. Kuitenkin, kun empiirisessä aineistossa ei kaikilta postinumeroalueilta ole erikoiskaupassa asiointia kaikkiin kohteisiin j, lasketaan geometrinen keskiarvo vetovoimamuuttujalle 𝐴ℎvain niistä asioinnin kohteista, joihin postinumeroalueelta i on empiirisessä aineistossa asiointia ja esitetään 𝐴̃ℎ𝑖.
Mallin tuntemattomien parametrien estimaatit on tuotettu lineaarisella regressioanalyysilla käyttäen pienimmän neliösumman estimaattia (PNS) linearisoituun aineistoon. Parametrien estimaatit kullekin muuttujalle saadaan sen kulmakertoimesta (β) usean muuttujan lineaarisessa regressiomallissa, jossa riippuvana muuttujana on muunnoksen jälkeinen asiointiosuus ja riippumattomina muunnettu
saavutettavuus sekä yksi tai useampi muunnettu vetovoimamuuttuja.
Malli [2] muunnettuna: [3]
missä 𝑃̃𝑖 , 𝐴̃𝑗ja 𝐷̃𝑖 ovat muuttujien 𝑃𝑖𝑗, 𝐴ℎ𝑗 ja 𝐷𝑖𝑗 geometrisia keskiarvoja valintatilanteelle i
Parametrien estimaattien lisäksi saadaan myös selville niiden tilastollinen merkitsevyys ja voidaan samalla arvioida tietyn muuttujan keskeisyyttä ja käyttökelpoisuutta mallissa. Keskeisyyttä voidaan arvioida esimerkiksi sen perusteella, kuinka paljon selittävä riippumaton muuttuja kasvattaa lineaarisen regressiomallin selitysastetta (R2). Käyttökelpoiseksi tai parhaaksi malliksi ei kuitenkaan voida
välttämättä julistaa sellaista mallia, joka on parhain esimerkiksi selitysasteella mitattuna, ja jonka kaikki muuttujat ovat tilastollisesti merkitseviä esimerkiksi viiden prosentin merkitsevyysasteella. Mallin määrittelyssä täytyy ottaa huomioon myös riippumattomien muuttujien välinen keskinäinen lineaarinen riippuvuus eli kollinearisuus. Tämä ei sinänsä vaikuta regressiomallin selitysasteeseen välttämättä negatiivisesti, mutta voi vääristää haitallisesti regressiomallin kertoimia ja täten tuntemattomien parametrien estimaatteja. Kun mallin kalibroinnin keskeisin tehtävä on löytää parhaat estimaatit tuntemattomille parametreille, käyttökelpoisessa mallissa riippumattomien muuttujien välinen keskinäinen riippuvuus ei saa kasvaa liian suureksi. Tämä erityisesti vaikuttaa siihen, millaisilla muuttujien yhdistelmillä voidaan selittää asiointia, sillä useat tutkimuksessa käytetyt muuttujat, kuten vähittäiskaupan työpaikkamäärät ja kaupan rakennusten kerrosalat, korreloivat vahvasti tai melko vahvasti keskenään. Tällä ei kuitenkaan ole kovinkaan suurta vaikutusta mallien selitysasteeseen, sillä mitä enemmän muuttujia malli sisältää sitä vähemmän uudet muuttujat selittävät asiointia ja sitä
enemmän kollinearisuus kasvaa. Tällaisten muuttujien informaatio siis sisältyy suurelta osin malliin jo muiden muuttujien kautta. Kollinearisuus ei ole ongelma yhden vetovoimamuuttujan malleissa. Kun riippumattomia muuttujia kuitenkin lisätään, kasvaa se merkittävästi, jolloin regressiokertoimien tasapaino ja luotettavuus saattaa heiketä. Lineaarisen mallin, sen sisältämien muuttujien ja niiden
parametrien käyttökelpoisuutta sekä selittävyyden että kollinearisuuden osalta voidaan arvioida erilaisten tilastollisten tunnuslukujen perusteella.
1. Selitysaste, R2 (Coefficient of determination, R-squared)
Kuvaa kuinka suuren osan lineaarinen regressiomalli selittää asioinnin (riippuvan muuttujan) vaihtelusta.
2. Selitysasteen muutos (R-squared change)
Kuvaa kuinka paljon yksi riippumaton muuttuja kasvattaa lineaarisen regressiomallin selitysastetta (R2). Käytetty arvioimaan yhden muuttujan keskeisyyttä mallissa.
3. Condition Index, δk
Tunnistaa regressiomallin (pääkomponenteista) x-ulottuvuuksista sellaiset, joilla havaittavaa lineaarista riippuvuutta muiden x-ulottuvuuksien kanssa. Tällöin pienimmän neliösumman käyttö mahdollisesti ongelmallista. Kollinearisuus on selkeä, jos δk > 30. Vaikutusta voi olla myös, jos δk > 10.
4. Variance inflation factor, VIF
Yksinkertainen kollinearisuuden mittari regressiomallin riippumattoman muuttujan kertoimelle b, jonka minimi on 1,0. Kollinearisuus on selkeä, jos VIF > 10.
Yllä esitettyjä tunnuslukujen kriittisiä arvoja ei kuitenkaan tulkittu yksiselitteisesti, vaan niitä pidettiin pikemminkin varoittavina raja-arvoina, jolloin regressiomallin kertoimiin piti suhtautua suuremmalla varauksella.
Kun mallin käyttötarkoitukseen soveltuvat parhaat mallit ovat muodostettu sekä tuntemattomat parametrit 𝑦̂ ja 𝜆̂ estimoitu, voidaan postinumeroaluekohtaiset asiointitodennäköisyyksien estimaatit muodostaa mallilla [4]. Postinumeroaluekohtaisia mallinnettuja arvoja voidaan tämän jälkeen verrata SVT-aineiston havaittuihin arvoihin.
Mallin toimivuuden arviointi
Hyvin tärkeä osa mallin muodostamista on vaihe, jossa arvioidaan sen kykyä toistaa havaittu aineisto.
Samalla voidaan arvioida mallin taustalla vaikuttavien teorioiden ja oletusten toimivuutta. Mallin toimivuuden testaaminen on siis yksi osatehtävä, jossa tilastollisesti mitataan sitä, millä tarkkuudella mallilla ennustetut arvot, 𝑋̂ = [𝑥̂1, 𝑥̂2, … , 𝑥̂𝑛] toistavat havaitut arvot, 𝑋 = [𝑥1, 𝑥2, … , 𝑥𝑛]. Osaltaan tätä vaihetta tukee jo aikaisemmin saatu tieto lineaarisen mallin selittävyydestä, mutta tässä viimeistään todennetaan estimoitujen parametrien ja mallin toimivuus.
Tehtävää varten on olemassa useita erilaisia yhteensopivuus (goodness-of-fit) -mittareita, joita voidaan käyttää kahteen eri tarkoitukseen. Tilastollisella yhteensopivuus mittarilla voidaan arvioida ja vertailla kuinka tarkasti yksi tai useampi malli toistaa samaa havaintoaineistoa tai kuinka tarkasti yksi malli toistaa kahta tai useampaa eri havaintoaineistoa. Toinen tarkoitus liittyy hypoteesien testaukseen, jossa mittarin avulla testataan onko ero havaituissa ja ennustetuissa arvoissa tilastollisesti merkitsevä. Testauksen avulla malli joko hylätään liian epätarkkana tai todetaan sen olevan tilastollisesti riittävän tarkka. Usein nollahypoteesiksi asetetaan tilanne, että havaittujen ja ennustettujen arvojen erot eivät ole merkittäviä ja hylätä se, jos laskettu testisuure ylittää tietyn kriittisen arvon valitulla luottamusvälillä.
Tässä yhteydessä testausta on sovellettu tilanteeseen, jossa vertaillaan ja arvioidaan kuinka tarkasti yksi tai useampi malli pystyy toistamaan yhtä ja samaa havaintoaineistoa. Malli ei muutu, mutta siinä käytetyt muuttujat, niiden määrä ja parametrit vaihtelevat, jolloin testauksen avulla voidaan arvioida parametrien estimaattien ja muuttujien toimivuutta havaittujen arvojen ennustamisessa. Lopullisina testisuureina on käytetty RMSE (root mean squared error) sekä SRMSE (Standardised root mean squared error) – testisuureita (kts. esim. Knudsen & Fotheringham 1986). Pelkistettynä RMSE ja SRMSE kuvaavat siis, kuinka paljon ennustetut arvot eroavat havaituista arvoista keskimäärin. SRMSE on käyttökelpoisempi
Malli [4]:
missä asiointi todennäköisyydet 𝑃̂𝑖𝑗 ja tuntemattomat parametrit 𝑦̂ ja 𝜆̂ ovat esitetty estimaatteina.
varsinkin tilanteessa, jossa mallin suorituskykyä vertaillaan eri alueiden välillä, koska se suhteutetaan tutkimusalueen keskimääräiseen havaittuun asiointiosuuteen. Perinteistä ja hyvin usein myös
yhteensopivuusmittarina sovellettua korrelaatiokerrointa (r) käytettiin lisäksi arvioinnin tukena.
Kalibroinnin tulokset
Taulukossa 2 on kuvattu molempien tutkimusalueiden keskimääräiset parametrien arvot linnuntie- etäisyydelle, matka-aika etäisyydelle sekä keskeisimmille vetovoimamuuttujille erikoiskaupan osalta.
Keskimääräiset arvot kuvaavat parametrin odotusarvoa riippumatta mitä muita muuttujia malli sisältää.
Taulukossa 3 on puolestaan kuvattu kalibroinnin ja mallin testauksen tuloksena tuotetut tilastolliset tunnusluvut muutaman esimerkkimalli osalta. Tarkemmin erilaiset testatut mallit, niiden tilastolliset tunnusluvut ja parametrin estimaatit ovat kuvattu liitteessä 2. Liitteessä on myös kuvattu
päivittäistavarakaupan kalibroinnin tulokset taulukoina.
Taulukko 2. Yhteenveto kalibroitujen mallien parametrien estimaateista.
Alue Muuttuja Parametri
Parametrin
keskimääräinen estimaatti
Tyypillinen vaihteluväli
JKL Linnuntie-etäisyys -1,2 -1,35 - -1,02
Matka-aika etäisyys -1,5 -1,78 - -1,30
Erikoiskaupan kerrosala γ 0,7 0,60 - 0,74
Erikoiskaupan työpaikkojen lukumäärä γ 0,8 0,72 - 0,92
Vähittäiskaupan työpaikkojen lukumäärä γ 1,0 0,86 - 1,1
Tampere Linnuntie-etäisyys -1,3 -1,41 - -1,23
Matka-aika etäisyys -1,8 -1,95 - -1,70
Erikoiskaupan kerrosala γ 0,6 0,55 - 0,66
Erikoiskaupan työpaikkojen lukumäärä γ 0,6 0,54 - 0,67
Vähittäiskaupan työpaikkojen lukumäärä γ 0,8 0,7 - 0,87
Taulukko 3. Mallin tilastolliset tunnusluvut
Alue Mallin muuttujat R2 RMSE SRMSE Korrelaatio (Pearson)
Jyväskylä 1. Linnuntie-etäisyys
2. Kaupan rakennusten kerrosala 0,675 0,1383 0,5749 0,809 Jyväskylä
1. Matka-aika etäisyys
2. Erikoiskaupan toimipaikkarakennusten kerrosala
0,6 0,1581 0,657 0,747
Tampere 1. Linnuntie-etäisyys
2. Kaupan rakennusten kerrosala 0,563 0,1128 0,8762 0,765
Tampere 1. Matka-aika etäisyys
2. Erikoiskaupan rakennusten kerrosala 0,552 0,1376 0,9656 0,729
Kalibrointitulosten yhteenveto
Molemmilla tarkastelualueilla parhaimpiin tuloksiin päästään käyttämällä vetovoimamuuttujana niiden rakennusten kerrosalaa, joiden pääkäyttötarkoitus on kauppa. Tämä antaa paremmat tulokset kuin jos keskuksen vetovoimaa kuvattaisiin esimerkiksi vain niiden rakennusten kerrosalalla, joiden
pääkäyttötarkoitus on erikoiskauppa. Koska tarkkaa tietoa ei ole siitä, kuinka paljon kauppaa tai erityisesti erikoiskauppaa on todellisuudessa keskuksissa, ovat testatut vetovoimamuuttujat vain
suuntaa-antavia arvioita kaupan todellisista kerrosaloista. Lähes vastaaviin tuloksiin päästään myös monien muiden muuttujien kautta, kuten erikoiskaupan laskennallisia työpaikkamääriä tai koko
vähittäiskaupan työpaikkamäärää käyttämällä. Myös toimipakkojen määrät ja työssäkäynnin määrät sekä keskuksen kaupan tarjonnan monipuolisuutta kuvaavat muuttujat antavat samankaltaisia tuloksia
tilastollisilla tunnusluvuilla mitattuna. Kerrosalatiedot, etenkin kaupan alaa kuvaavat kerrosalatiedot, ovat kuitenkin mallin soveltamisen näkökulmasta parhaita muuttujia, koska tieto on usein saatavilla
esimerkiksi uusista ja tulevista vähittäiskaupan suuryksikköhankkeista.
Menetelmäkehityksen aikana arvioitiin myös parantaako usean vetovoimamuuttujan käyttö mallin tarkkuutta. Yhteenvetona todettakoon, että usean muuttujan käyttö ei paranna mallia merkittävästi kun käytettävissä oli liitteessä 1 kuvatut muuttujat ja empiirinen aineisto on tarkimmillaan postinumerotasolla.
Olennaisin syy tähän on se, että käytetyt muuttujat ovat melko samankaltaisia ja kuvaavat osittain samaa asiaa hieman eri näkökulmista, jolloin lisättävän muuttujan informaatio on jo suurelta osin mukana mallissa toisen muuttujan kautta. Voidaan muun muassa ajatella, että kokonaisuudessaan keskusta-alueen kaupan kerrosalaa kuvaava muuttuja, kuvaa samalla myös epäsuorasti esimerkiksi keskustan kaupan yksiköiden tarjonnan monipuolisuutta. Suurempi tarjonta tarkoittaa usein siis myös monipuolisempaa tarjontaa. Usean muuttujan käyttö aiheuttaa lisäksi jo aiemmin kuvatun kollinearisuus ongelman, joka voi vääristää parametrien estimaatteja. Tällöin ei myöskään varmasti tiedetä parantaako lisämuuttujat mallia vai ovatko parametrit vain vääristyneitä.
Ennakko-odotuksiin nähden on yllättävää että saavutettavuusmuuttujien välille ei suurta eroa synny.
Kokonaisuudessaan linnuntie-etäisyyden käyttö tuottaa kuitenkin hieman parempia tuloksia ja on myös selkeästi helpommin otettavissa käyttöön Huffin malliin, koska laskenta operaatio on huomattavasti yksinkertaisempi matka-aikojen laskentaan verrattuna. Osaltaan tulokset johtuvat siitä, että molemmat käytetyt muuttujat ovat vain yleispiirteisiä mittareita kuvaamaan saavutettavuutta valituilla
kaupunkiseuduilla, joissa kuitenkin merkittävä osa asiointiliikenteestä ja muusta liikkumisesta tehdään myös jalan tai joukkoliikenteellä. Tuloksiin vaikuttaa voimakkaasti myös saavutettavuuden yleistäminen postinumerotasolle vastaamaan havaintoaineiston tarkkuutta. Useissa muissa tutkimuksissa, joissa vastaajien sijainti on tunnettu tarkasti esimerkiksi osoitteen tarkkuudella, on matka-aika ollut pääasiassa parempi muuttuja kuvaamaan saavutettavuutta. Etäisyysmuuttujien parametrien arvot olivat myös loogisia. Erikoiskaupassa parametrin negatiivinen arvo selkeästi aina yli -2, joka kuvaa sitä että etäisyyden vaikutus ei ole kovin jyrkkä. Päivittäistavarakaupassa arvot sitä vastoin pienempiä, esimerkiksi matka-ajalle parametri aina alle -2. Etäisyyden vaikutus on jyrkempi ja päivittäistavaroita haetaan usein lähempää. Etäisyys koetaan siis suurempana kustannuksena.
Tilastollisten tunnuslukujen näkökulmasta tarkasteltuna mallin tulokset vastaavat odotuksia.
Yksinkertaistettuna mallit kuvaavat tutkimusalueilla keskimäärin noin puolet asioinnin vaihtelusta.
Keskimääräinen ennustevirhe asiointiosuuksissa havaintoaineistoon verrattuna (RMSE) vaihtelee mallista riippuen 10 - 20 prosentin (0,1 - 0,2) välillä. Tulos siis osoittaa sen, että vetovoimamallien
tuloksiin täytyy suhtautua aina tietyllä varauksella. Mallin kalibroinnin suurin hyöty on kuitenkin juuri siinä, että kun sen tuloksena mallin toimivuus tiedetään, voidaan mallin tuloksiin suhtautua oikealla
painoarvolla. Ennustevirheitä tulkittaessa täytyy kuitenkin aina muistaa, että se perustuu havaittuun asiointiaineistoon, joka sisältää myös virheitä ja satunnaisuuksia ja joita ei pidä tulkita todellisina asiointiosuuksina. Kalibroinnissa käytetty SVT-aineisto sisältää satunnaisuuksia erityisesti harvaan asutuilla seudulla, missä vastaajia on vähän. Erilaisten poikkeavien ja merkittävien havaintojen vaikutus voi olla hyvinkin suuri mallin parametrien estimaatteihin sekä tilastollisiin tunnuslukuihin.
Mallin soveltaminen vähittäiskaupan suuryksikön vaikutusten arvioinnissa (erikoiskauppa)
Seuraavassa yksinkertaisessa esimerkissä sovelletaan edellä kuvatulla menetelmällä
postinumeroaluetasolla kalibroitua mallia 250 metrin ruututasolla pyrkimyksenä arvioida hypoteettisen vähittäiskaupan suuryksikköhankkeen seudullisia vaikutuksia. Skenaario muodostetaan Tampereen asiointialueelle. Mallilla [4] muodostetaan ensin keskusta- ja kaupan alueille nykytilanteen mukaiset vaikutusalueet käyttäen mallissa etäisyysmuuttujana linnuntie-etäisyyttä ja vetovoimamuuttujana kaikkien niiden rakennusten kerrosalaa, jotka sisältävät sekä erikoiskaupan toimipaikkoja että työpaikkoja. Tämän jälkeen kaupan palveluverkkoa muutetaan kasvattamalla tiettyä kaupan aluetta vaiheittain 10 000 kerrosneliömetriä. Jokaisen muutoksen vaikutukset arvioidaan yksinkertaisesti keskusten asiakasmäärissä tapahtuvina muutoksina. Lukuja täytyy tulkita esimerkinomaisina, sillä keskusta- ja kaupan alueiden erikoiskauppaa kuvaavat lukemat ovat vain suuntaa-antavia arvioita todellisuudesta. Skenaariossa myös oletetaan että väestön muutosta ei tapahdu ja liikenneverkko pysyy muuttumattomana sekä muut keskustat ja kaupan alueet eivät muutu.
Kuva 4. Vaiheet prosessikaaviona.
Sovellettava malli ja skenaario
Mallin yhteenveto R2 RMSE SRMSE Korrelaatio
(Pearson)
Malli 4 0,592 0,1187 0,9185 0,764
Mallin parametrit ja muuttujat Parametri B (parametrin estimaatti)
B luottamusväli
(95%) R2 muutos
Malli 4
Linnuntie-etäisyys -1,298 -1,382; -1,214 0,291
Erikoiskaupan toimi- ja työpaikkarakennusten
kerrosala γ 0,564 0,523; 0,606 0,301
Kuva 4. Toteutettu hypoteettinen skenaario ja lähimmät muut keskusta- ja kaupan alueet.
Tulokset
Mallilla laskettujen todennäköisyyksien perusteella ruuduissa asuva väestö jaettiin asiointikohteiden kesken. Luku kuvaa karkeasti keskuksen vaikutusalueen väestömäärää. Vaikutusalueen väestömäärä muunnettiin laskennallisiksi asiointikerroiksi olettamalla että jokainen asukas asioi erikoiskaupassa keskimäärin noin 13 kertaa vuodessa. Luku on laskettu SVT-aineiston pohjalta arvioitujen erikoiskaupan tuoteryhmien keskiarvona. Kuvat 5 ja 6 on esittävät 10 suurinta absoluuttista ja suhteellista muutosta laskennallisissa asiointimäärissä.
Kuva 5. Absoluuttiset muutokset laskennallisissa asiakasmäärissä (10 suurinta muutosta).
Kuva 6. Suhteellinen muutos laskennallisissa asiakasmäärissä (10 suurinta muutosta)
Asiointimäärien absoluuttisella muutoksella mitattuna Tampereen keskusta kärsii eniten. Tämä oli odotettavissa, sillä Tampereen keskustan vaikutusalue on laajin ja asiointimäärät suuria. Suhteellisesti mitattuna vaikutukset ovat kuitenkin suurimpia Kangasalan keskuksissa, jotka ovat toteutettua
skenaariota lähimpänä. Vaikutusalueiden tarkastelu osoittaa, että todennäköisyys asioida Ilkossa kasvaa lähes koko alueella (kuvat 7 ja 8), kaukana tarkastelualueen reunoilla tai hyvin lähellä muita suuria keskuksia kuitenkin hyvin marginaalisesti. Selkeimmin Ilkon vaikutusalue voimistuu idän suunnassa.
Kokonaisuudessaan todennäköisyydet jäävät melko alhaisiksi, sillä mallilla muodostetut keskusten vaikutusalueet ovat hyvin päällekkäisiä ja asiointi hajautuu useaan keskukseen. Toisaalta tämä kuvaa Tampereen kaupunkiseudun monipuolista tarjontaa, kun ydinkeskustan ulkopuolisia keskuksia on paljon.
Kuva 7. Kangasalan Ilkon nykytilanteen mallinnetut asiointitodennäköisyydet linnuntie-etäisyydellä.
Kuva 8. Kangasalan Ilkon skenaarion mallinnetut asiointitodennäköisyydet linnuntie-etäisyydellä.
Kuva 9. Postinumeroalueilta Kangasalan Ilkkoon suuntautuvan erikoiskaupan asiointiosuudet.
Kuva 10. Postinumeroalueille mallinnetut asiointitodennäköisyydet Kangasalan Ilkkoon.
Kun verrataan mallinnettuja todennäköisyyksiä ja havaittuja asiointiosuuksia postinumerotasolla, huomataan että malli aliarvio todennäköisyyksiä suhteessa asiointiosuuksiin erityisesti hieman kauempana idässä. Lähialueilla tulokset ovat parempia.
Tulosten tulkintaa
Ensisilmäyksellä mallinnettuja vaikutuksia lähimpiin keskuksiin kuvaavat luvut vaikuttavat pieniltä, kun kyseessä on kuitenkin 60 000 kerrosneliömetrin kaupan alueen laajennus. Mallin tuottamien tulosten soveltaminen vaatii kuitenkin, että sen toimivuus ja puutteet ymmärretään, jolloin ne voidaan ottaa tulosten tulkinnassa ja soveltamisessa huomioon. Edellä kuvatuissa tuloksissa täytyy esimerkiksi ottaa seuraavat puutteet ja mallin ominaisuudet huomioon.
1. Toteutettu yksinkertainen skenaario ei huomioi muun muassa väestönkasvua ja muilla keskusta- ja kaupan alueilla tapahtuvia muutoksia, jotka mahdollisesti kompensoivat tai kasvattavat
vaikutuksia.
2. Toteutettu skenaario sijoittuu melko etäälle noin 5-7 kilometrin päähän muista keskuksista, jolloin vaikutuksen jakautuvat melko tasaisesti useiden keskusten välillä ottaen lisäksi huomioon
erikoiskaupan luonne. Tuotteita haetaan siitä keskuksesta, joka vastaa kuluttajan sen hetkisiä tarpeita, jolloin asiointi hajautuu useampaan keskukseen. Tämä tulee mallin tuloksissa esiin siinä, että keskusten vaikutusalueet ovat hyvin päällekkäisiä ja laajoja.
3. Mallissa on käytetty vetovoimamuuttujana kaikkien niiden rakennusten kerrosalaa, jotka sisältävät erikoiskaupan toimipaikkoja ja työpaikkoja. Käytetty muuttuja kuvaa vain karkeasti erikoiskaupan todellista määrää keskuksissa ja positiivisesti vääristää erityisesti sellaisten keskusten erikoiskauppaa kuvaavia lukuja ja täten myös laskennallisia asiakasmääriä, joissa toimipaikat ovat jakautuneet useisiin rakennuksiin ja joita pääasiallisesti käytetään muuhun kuin kauppaan.
4. Kuten mallin kalibroinnissa kävi ilmi, kuvaa käytetty yleispiirteinen malli postinumerotasolla tilastollisesti noin 50-60% kuluttajien käyttäytymisestä. Vaikutusten näkökulmasta tämä voidaan karkeasti tulkita niin, että malli kuvaa noin puolet potentiaalisista vaikutuksista, kun kuluttajat muuttavat asiointikäyttäytymistään. Malli toimii siis vaikutusten arvioinnin tukena ja loput
vaikutuksista selvitetään muilla keinoin. Mallin tuottamia laskennallisia asiakasmäärämuutoksia voidaan muilla arvioilla muuttaa suuntaan tai toiseen. Vaikutukset Kangasalan suuntaan ovat todennäköisesti suurempia, jos alueen laajennus sisältää esimerkiksi vetovoimaisia
hypermarketteja.
5. Kuvista 10 ja 11 havaittiin myös, että malli aliarvioi Ilkon vetovoimaa erityisesti kauempana idässä, jolloin vaikutukset erityisesti Kangasalan keskustaan voivat olla todellisuudessa suurempia. Empiirisen aineiston tulkinnassa täytyy kuitenkin myös olla varovainen.
Kirjallisuus
Knudsen, D. C. & A.S. Fotheringham (1986). Matrix Comparison, Goodness-of-Fit, and Spatial Interaction Modeling. International Regional Science Review, Vol. 10
No. 2, s. 127–147.
Nakanishi, M. & L.G. Cooper (1974). Parameter Estimation for a Multiplicative Interaction Model – Least Squares Approach. Journal of Marketing Research Vol. XI,
s. 303–311.
Rehunen, A., Helminen, V., Kosonen, P., Viinikka, A. & H. Käyhkö (2014). Keskustaalueet ja vähittäiskauppa kaupunkiseuduilla. Ympäristöministeriön raportteja.
126 s. Ympäristöministeriö, Helsinki.
Nakanishi, M. & L.G. Cooper (1982). Simplified estimation procedures for MCI models.
Marketing Science Vol. 1 No. 3, s. 314–322.
Nurmio, K. (2014). Vetovoimamalli kaupan palveluverkon suunnittelussa ja vaikutusten arvioinnissa. Pro gradu tutkielma, aluetiede. 105 s. Helsingin yliopisto, geotieteiden ja maantieteen laitos.
Liite 1. Tutkimuksessa käytetyt vetovoimamuuttujat ja niiden kuvaukset.
Muuttuja Kuvaus Tietolähde Vuosi
Kerrosala yhteensä Rakennusten kerrosala, joissa kauppaa
Tilastokeskuksen
toimipaikkarekisteri & RHR
2011 Kaupan kerrosala Rakennusten kerrosala, joiden
pääkäyttötarkoitus on kauppa
Tilastokeskuksen
toimipaikkarekisteri & RHR
2011 TIVA-kaupan kerrosala Rakennusten kerrosala, joiden
pääkäyttötarkoitus on tiva- kauppa
Tilastokeskuksen
toimipaikkarekisteri & RHR
2011
Tavaratalokaupan kerrosala Rakennusten kerrosala, joiden pääkäyttötarkoitus on tavaratalokauppa
Tilastokeskuksen
toimipaikkarekisteri & RHR
2011
Erikoiskaupan kerrosala Rakennusten kerrosala, joiden pääkäyttötarkoitus on erikoiskauppa
Tilastokeskuksen
toimipaikkarekisteri & RHR
2011
Erikoiskaupan rakennusten kerrosala
Rakennusten kerrosala, joissa erikoiskaupan toimipaikkoja ja työpaikkoja
Tilastokeskuksen
toimipaikkarekisteri & RHR
2011
Kaupan työpaikat yhteensä Kaupan työpaikkojen määrä (osin arvio)
Tilastokeskuksen toimipaikkarekisteri
2011 Erikoiskaupan työpaikat
yhteensä
Erikoiskaupan työpaikkojen määrä (osin arvio)
Tilastokeskuksen toimipaikkarekisteri
2011 Päivittäistavarakaupan
työpaikat yhteensä
Päivittäistavarakaupan työpaikkojen määrä (osin arvio)
Tilastokeskuksen toimipaikkarekisteri
2011 Tilaa vaativan kaupan työpaikat
yhteensä
Tilaa vaativan kaupan
työpaikkojen määrä (osin arvio)
Tilastokeskuksen toimipaikkarekisteri
2011
Tavaratalokaupan työpaikat yhteensä
Tavaratalokaupan työpaikkojen määrä (osin arvio)
Tilastokeskuksen toimipaikkarekisteri
2011
Toimipaikat yhteensä Kaikki kaupan toimipaikat yhteensä (auto ja
huoltamokauppa ei mukana)
Tilastokeskuksen toimipaikkarekisteri
2011
Erikoiskaupan toimipaikat yhteensä
Erikoiskaupan toimipaikkojen määrä
Tilastokeskuksen toimipaikkarekisteri
2011 Päivittäistavarakaupan
toimipaikat yhteensä
Päivittäistavarakaupan toimipaikkojen määrä
Tilastokeskuksen toimipaikkarekisteri
2011 Tilaa vaativan kaupan
toimipaikat yhteensä
Tilaa vaativan kaupan toimipaikkojen määrä
Tilastokeskuksen toimipaikkarekisteri
2011 Tavaratalokaupan toimipaikat
yhteensä
Tavaratalokaupan toimipaikkojen määrä
Tilastokeskuksen toimipaikkarekisteri
2011 Vähittäiskaupan toimipaikat
yhteensä
Vähittäiskaupan toimipaikkojen määrä
YKR, Kaupan toimipaikat 2010 Erikoiskaupan toimipaikat
yhteensä
Päivittäistavaroita myyvien kauppojen määrä, sisältää kioskit ja tavaratalot
YKR, Kaupan toimipaikat 2010
Päivittäistavarakaupan toimipaikat yhteensä
Erikoistavaroita myyvien kauppojen määrä, sisältää myös hypermarketit
YKR, Kaupan toimipaikat 2010
Tilaa vaativan kaupan toimipaikat yhteensä
Tilaa vaativia tavaroita myyvien kauppojen määrä
YKR, Kaupan toimipaikat 2010 Vähittäiskaupan työpaikat
yhteensä
Vähittäiskaupan työpaikkojen lukumäärä
YKR, Työpaikat 2009
Myymälärakennukset Myymälärakennuksiksi luokiteltavien rakennusten määrä
YKR, Rakennukset 2011
Myymälärakennusten kerrosala Myymälärakennuksiksi luokiteltavien rakennusten kerrosala
YKR, Rakennukset 2011
Päivittäistavarakaupan myyntipinta-ala
Päivittäistavaroiden myyntipinta- ala (rajattu pois 2012 aloittaneet)
AC Nielsen 2012
Päivittäistavarakauppojen pinta-ala
Päivittäistavarakauppojen kokonaismyyntipinta-ala (rajattu pois 2012 aloittaneet)
AC Nielsen 2012
Toimialojen määrä Erilaisten toimialojen määrä Tilastokeskuksen toimipaikkarekisteri
2011 Monipuolisuus indeksi (HHI) Herfindahlin indeksi, joka kuvaa
toimialarakenteen monipuolisuutta
Tilastokeskuksen toimipaikkarekisteri
2011
Työmatkojen määrä Postinumeroalueelta asiointikohteeseen suuntautuvien työmatkojen määrä yhteensä
YKR, Työssäkäynti 2010
Liite 2. Erikoiskaupan ja päivittäistavarakaupan kalibroinnin tuloksia
Jyväskylä (erikoiskauppa ET) Parametri B (parametrin estimaatti)
B luottamusväli (95%)
R2 muutos
Malli 1
Linnuntie-etäisyys -1,177 -1,328; -1,025 0,239
Kaupan pääkäyttötarkoitus kerrosala γ 0,799 0,725; 0,873 0,437
Malli 2
Linnuntie-etäisyys -1,285 -1,476; -1,095 0,249
Erikoiskaupan pääkäyttötarkoitus kerrosala γ 0,668 0,586; 0,750 0,339
Malli 3
Linnuntie-etäisyys -1,125 -1,287; -0,962 0,218
Erikoiskaupan toimipaikkarakennusten kerrosala γ 0,53 0,474; 0,586 0,408
Malli 4
Linnuntie-etäisyys -1,139 -1,296; -0,982 0,241
Erikoiskaupan toimi- ja työpaikkarakennusten
kerrosala γ 0,675 0,604; 0,746 0,401
Malli 5
Matka-aika etäisyys -1,568 -1,779; -1,356 0,226
Kaupan pääkäyttötarkoitus kerrosala γ 0,818 0,743; 0,894 0,437
Malli 6
Matka-aika etäisyys -1,65 -1,924; -1,376 0,215
Erikoiskaupan pääkäyttötarkoitus kerrosala γ 0,679 0,593; 0,764 0,339
Malli 7
Matka-aika etäisyys -1,442 -1,672; -1,212 0,198
Erikoiskaupan toimipaikkarakennusten kerrosala γ 0,535 0,477; 0,592 0,408
Malli 8
Matka-aika etäisyys -1,492 -1,714; -1,270 0,219
Erikoiskaupan toimi- ja työpaikkarakennusten
kerrosala γ 0,693 0,619; 0,766 0,401
Jyväskylä (ET) R2 RMSE SRMSE Korrelaatio (Pearson)
Malli 1 0,675 0,1383 0,5749 0,809
Malli 2 0,588 0,1873 0,7345 0,69
Malli 3 0,626 0,1549 0,6436 0,759
Malli 4 0,642 0,1628 0,6478 0,746
Malli 5 0,662 0,1389 0,5771 0,807
Malli 6 0,554 0,1917 0,7517 0,675
Malli 7 0,6 0,1581 0,657 0,747
Malli 8 0,62 0,1676 0,667 0,732
Tampere (erikoiskauppa ET) Parametri B (parametrin estimaatti) B luottamusväli (95%) R2 muutos
Malli 1
Linnuntie-etäisyys -1,331 -1,419; -1,244 0,288
Kaupan pääkäyttötarkoitus kerrosala γ 0,679 0,625; 0,733 0,274
Malli 2
Linnuntie-etäisyys -1,372 -1,478; -1,266 0,267
Erikoiskaupan pääkäyttötarkoitus kerrosala γ 0,537 0,488; 0,585 0,283
Malli 3
Linnuntie-etäisyys -1,293 -1,377; -1,208 0,291
Erikoiskaupan toimipaikkarakennusten kerrosala γ 0,555 0,514; 0,597 0,297
Malli 4
Linnuntie-etäisyys -1,298 -1,382; -1,214 0,291
Erikoiskaupan toimi- ja työpaikkarakennusten
kerrosala γ 0,564 0,523; 0,606 0,301
Malli 5
Matka-aika etäisyys -1,844 -1,963; -1,724 0,262
Kaupan pääkäyttötarkoitus kerrosala γ 0,727 0,673; 0,781 0,307
Malli 6
Matka-aika etäisyys -1,873 -2,017; -1,729 0,249
Erikoiskaupan pääkäyttötarkoitus kerrosala γ 0,56 0,512; 0,609 0,303
Malli 7
Matka-aika etäisyys -1,788 -1,902; -1,673 0,264
Erikoiskaupan toimipaikkarakennusten kerrosala γ 0,592 0,550; 0,633 0,33
Malli 8
Matka-aika etäisyys -1,796 -1,910; -1,682 0,264
Erikoiskaupan toimi- ja työpaikkarakennusten
kerrosala γ 0,601 0,560; 0,642 0,335
Tampere (ET) R2 RMSE SRMSE Korrelaatio (Pearson)
Malli 1a 0,563 0,1128 0,8762 0,765
Malli 2b 0,55 0,1359 0,9548 0,738
Malli 3c 0,587 0,1195 0,9248 0,761
Malli 4c 0,592 0,1187 0,9185 0,764
Malli 5c 0,569 0,114 0,8859 0,761
Malli 6c 0,552 0,1376 0,9656 0,729
Malli 7c 0,594 0,1172 0,9072 0,769
Malli 8c 0,599 0,1162 0,8994 0,772
Jyväskylä (päivittäistavarakauppa PT) Parametri B (parametrin estimaatti) Luottamusväli (95%) R2 muutos
Malli 1
Linnuntie-etäisyys -1,728 -1,943; -1,513 0,412
PT-kauppojen kokonaisala γ 0,596 0,473; 0,719 0,199
Malli 2
Linnuntie-etäisyys -1,766 -1,969; -1,564 0,412
Pt-kaupan myyntipinta-ala γ 0,97 0,800; 1,140 0,243
Malli 3
Matka-aika etäisyys -2,206 -2,534; -1,878 0,319
PT-kauppojen kokonaisala γ 0,618 0,481; 0,755 0,207
Malli 4
Matka-aika etäisyys -2,275 -2,587; -1,962 0,319
Pt-kaupan myyntipinta-ala γ 1,01 0,818; 1,202 0,255
Jyväskylä (PT) R2 RMSE SRMSE Korrelaatio (Pearson)
Malli 1a 0,61 0,183 0,5372 0,808
Malli 2b 0,655 0,1711 0,5024 0,834
Malli 3c 0,527 0,1887 0,5538 0,793
Malli 4c 0,575 0,1745 0,5121 0,826
Tampere (päivittäistavarakauppa PT) Parametri B (parametrin estimaatti) Luottamusväli (95%) R2 muutos
Malli 1
Linnuntie-etäisyys -1,509 -1,612; -1,406 0,617
PT-kauppojen kokonaisala γ 0,274 0,184; 0,364 0,028
Malli 2
Linnuntie-etäisyys -1,473 -1,577; -1,369 0,617
Pt-kaupan myyntipinta-ala γ 0,258 0,141; 0,376 0,015
Malli 3
Matka-aika etäisyys -2,096 -2,240; -1,953 0,609
PT-kauppojen kokonaisala γ 0,313 0,223; 0,404 0,36
Malli 4
Matka-aika etäisyys -2,047 -2,191; -1,903 0,609
Pt-kaupan myyntipinta-ala γ 0,324 0,205; 0,442 0,023
Tampere (PT) R2 RMSE SRMSE Korrelaatio (Pearson)
Malli 1a 0,645 0,1379 0,5782 0,875
Malli 2b 0,632 0,1427 0,5981 0,866
Malli 3c 0,645 0,1262 0,5289 0,897
Malli 4c 0,632 0,1324 0,5552 0,886