Huffin mallin kalibrointi empiirisen asiointiaineiston perusteella

(1)

Huffin mallin kalibrointi empiirisen asiointiaineiston

perusteella

Kimmo Nurmio ja Antti Rehunen Suomen ympäristökeskus

(2)

Sisällys

Johdanto ... 3

Huffin malli ja MCI-malli ... 3

Aineistot ja kalibrointimenetelmä ... 5

Tutkimusalue ja asiointikohteet ... 6

Aineistot ... 8

Parametrien estimointi ... 9

Mallin toimivuuden arviointi ... 13

Kalibroinnin tulokset ... 14

Kalibrointitulosten yhteenveto ... 14

Mallin soveltaminen vähittäiskaupan suuryksikön vaikutusten arvioinnissa (erikoiskauppa) ... 16

Sovellettava malli ja skenaario ... 17

Tulokset... 17

Tulosten tulkintaa ... 21

Kirjallisuus ... 22

(3)

Johdanto

Tässä dokumentissa kuvataan lyhyesti menetelmä Huffin mallin ja sen kaltaisen MCI-mallin kalibrointiin empiirisen asiointiaineiston perusteella. Ensin dokumentissa esitällään tiivistetysti mallien tausta ja perusperiaatteet, jonka jälkeen kuvataan kalibrointiin ja mallin soveltamiseen käytetyt aineistot ja menetelmä sekä tarkemmin itse kalibrointi ja sen periaatteet. Tässä yhteydessä malli kalibroidaan ja sovelletaan tapauskohtaisesti alue- ja yhdyskuntarakenteen näkökulmasta seudullisessa mittakaavassa, mutta sama kalibrointi menetelmä soveltuu myös muunlaisiin tarkasteluihin. Lopuksi esitellään lyhyt ja yksinkertaistettu esimerkki kalibroidun mallin soveltamisesta vähittäiskaupan suuryksiköiden vaikutusten arvioinnissa.

Huffin malli ja MCI-malli

Vetovoimamallit mittaavat matemaattisesti kohteen houkuttelevuutta vetovoimaa sekä kohteen

suhteellista sijaintia kuvaavien tekijöiden avulla. Vetovoimamallit perustuvat yksinkertaiseen analogiaan, jossa tietyn kohteen vuorovaikutus tietyssä paikassa on riippuvainen sekä keskuksen koosta että

keskuksen ja paikan välisestä etäisyydestä. Tämän perusanalogian kehitettiin niin kutsuttu ”The Law of Retail Gravitation” -malli, jossa tietyn keskuksen vuorovaikutus tietyssä paikassa on suoraan

verrannollinen keskuksen kokoon ja kääntäen verrannollinen etäisyyden neliöön. Jatkossa mallia testattiin useiden tutkijoiden toimesta empiirisillä aineistoilla ja tuloksena syntyi useita erilaisia muunnelmia. Mallia esimerkiksi laajennettiin niin, että sillä pystyttiin määrittämään missä kahden eri keskuksen välisen vuorovaikutuksen raja kulkee (breaking point), kun alkuperäinen malli pystyi

kuvaamaan ainoastaan sitä, miten alueen ostovoima voidaan jakaa keskusten välillä. Deterministisiset mallit kärsivät kuitenkin siitä, että ne eivät kyenneet kuvaamaan ostojen suuntautumista silloin, kun useat myymälät kilpailivat samoista asiakkaista. Mallit olivat siis siinä mielessä tiukasti deterministisiä, että tietty kysyntäpiste, kuten kotitalous, ei voinut kuulua kuin yhden keskuksen vaikutus- ja markkina- alueeseen. Todellisuudessa kuluttaja asioi ja hyödyntää useita eri keskuksia ja näin ollen keskuksien vaikutusalueet eivät ole toisensa poissulkevia vaan osittain päällekkäisiä – jopa sisäkkäisiä (kuva 1).

Deterministissä malleissa usein käytettyä etäisyyshaittaparametria on kritisoitu usein myös siitä, että riippumatta ostosmatkan tyypistä ja siitä mitä tavaraa ostetaan, on parametri ollut vakio. Monien tutkimusten mukaan parametrin arvo riippuu

kuitenkin merkittävästi tuotteesta mitä ollaan hankkimassa ja vakioitua parametria ei siksi voi käyttää. Tiettyjä tavaroita, kuten erikoistavaroita, ollaan valmiimpia hankkimaan kauempaa. Tällöin etäisyyden vaikutus ei ole niin voimakas kuin esimerkiksi päivittäistavaroita hankittaessa.

Yhtenä ensimmäisistä vastausta determinististen mallien puutteisiin tarjosi David L. Huff

kehittäessään probabilistisen vetovoimamallin kuvaamaan tietyn kysyntäpisteen, kuten kuluttajan,

Kuva 1. Vaikutusalueiden päällekkäisyys.

Pienen keskuksen vaikutusalue voi jäädä kokonaan suuremman sisään (Löffler 1998:

268).

(4)

todennäköisyyttä kuulua valittujen keskusten markkina-alueeseen. Alkujaan Huff kehitti mallin ennustamaan keskuksen saamaa potentiaalista myyntiä. Tällöin kysyntäpisteiden saamat arvot kuvasivat tietyn keskuksen siinä sijainnissa saamaa markkinaosuutta, jonka pohjalta voitiin arvioida potentiaalinen myynti keskuksille. Tämä potentiaalinen markkinaosuus voidaan kuitenkin myös tulkita todennäköisyydeksi, että tietyssä pisteessä asuva kuluttaja asioi tietyssä keskuksessa. Huffin malli perustuu hyötyteoreettisiin periaatteisiin, joiden mukaan kuluttajat käyttäytyvät rationaalisesti ja valitsevat sen keskuksen, josta saavat suurimman hyödyn suhteessa muista keskuksista saataviin hyötyihin.

Hyötyä mallissa voidaan kuvata usealla eri tavalla, mutta käytännössä useimmiten on käytetty keskuksen kokoa, jonka oletetaan tarkoittavan suurempaa tuote- ja liikevalikoimaa sekä usein myös halvempia hintoja ja näin ollen suurempaa hyötyä kuluttajalle. Etäisyys voidaan sitä vastoin tulkita kustannuksena, joka kasvaa epälineaarisesti kun etäisyys keskukseen kasvaa. Huffin malli ei perustu myöskään täysin normatiivisiin oletuksiin kuluttajien käyttäytymisestä niin kuin deterministiset

vetovoimamallit, vaan siinä hyödynnetään empiirisesti mitattua todellista asiointia, jonka avulla malli kalibroidaan vastaamaan paremmin alueen kuluttajien todellista ostokäyttäytymistä. Toisin sanoen objektiiviset muuttujat, kuten keskuksen koko ja etäisyys, kalibroidaan empiirisen aineiston perusteella vastaamaan paremmin kuluttajien todellista käsitystä siitä, millainen on tietystä keskuksesta saatava hyöty ja miten etäisyys siihen vaikuttaa.

Huffin mallista on kehitetty useita erilaisia variaatioita, joista Nakanishin ja Cooperin kehittämä MCI-malli (Multiplicative Competitive Interaction Model) on yksi varhaisimpia esimerkkejä. Tässä mallissa

vetovoimana voidaan käyttää useita vetovoimatekijöitä (kts. Nakanishi & Cooper 1974).

Alkuperäisessä MCI-mallissa etäisyyttä ei esitetä erillisenä tekijänä niin kuin perinteisesti Huffin mallissa tai vetovoimalleissa yleensä, vaan se katsotaan olevan yksi tekijä muiden joukossa kuvaamaan

kuluttajalle asiointikohdetta. Kyseisessä muodossa esitettynä malli soveltuu esimerkiksi tuotemerkkien välisten myyntiosuuksien arvioimiseen, joten spatiaalista ulottuvuutta ei välttämättä tarvita. Malliin voidaan kuitenkin helposti liittää spatiaalinen ulottuvuus ottamalla valintatilanne i spatiaalisesti kuluttajan maantieteellisenä sijaintina, esimerkiksi pisteenä tai alueena ja sisällyttämällä saavutettavuus yhdeksi muuttujaksi.

Huffin malli: [1]

𝑃𝑖𝑗 = todennäköisyys, että kuluttaja pisteessä i asioi kauppakeskuksessa j

𝑆_𝑗 = kauppakeskuksen vetovoima (mitattuna tietylle tuoteryhmälle osoitettuna myyntipinta-alana)

𝑇_𝑖𝑗 = kuluttajan etäisyys sijainnista i kauppakeskukseen j matka-aikana mitattuna

λ = empiirisesti määriteltävä parametri, joka heijastaa matka-ajan vaikutusta erityyppisiin ostosmatkoihin [1]

(5)

Malli [2] eroaa alkuperäisestä Huffin mallista [1] siinä, että vetovoima voi olla usean tekijän muodostama kokonaisuus, ja että jokaiselle vetovoimatekijälle voidaan estimoida parametri kuvaamaan kyseisen tekijän herkkyyttä. Vetovoimatekijöille empiirisesti estimoitava parametri voidaan esittää myös alkuperäisessä Huffin mallissa vetovoimatekijän 𝑆_𝑗 eksponenttina.

Aineistot ja kalibrointimenetelmä

Vetovoimamallin määrittelyyn ja käyttöön liittyy olennaisesti jokin alue ja ongelma, johon mallia sovelletaan. Molempien muotoilu vaikuttavat esimerkiksi käytettävissä olevien aineistojen kautta.

Parhaimman tuloksen malli antaa silloin, kun se määritellään ja kalibroidaan tiettyä käyttötarkoitusta varten tiettyyn kontekstiin. Sovellettaessa mallia täysin eri käyttötarkoitukseen, esimerkiksi eri alueella, joudutaan mallin antamiin tuloksiin suhtautumaan suuremmalla varauksella. Mallin käyttötarkoituksesta riippuen, joudutaan tekemään myös erilaisia ratkaisuja, kuten millaiset yksiköt tai kokonaisuudet

muodostavat tutkimusalueen asiointikohteet, joiden vaikutusalueita mallinnetaan.

Kun tarkastelutasona on alue- ja yhdyskuntarakenne, määritellään ja kalibroidaan malli seudullisessa mittakaavassa. Kalibrointimenetelmää on kehitetty soveltamalla sitä seudulliseen tilaa vaativan kaupan sekä muun erikoiskaupan palveluverkkoon sekä päivittäistavarakauppaan. Malli määritellään ja

kalibroidaan jokaiselle tutkimusalueelle ja tuoteryhmälle (ET, TIVA, PT) erikseen. Tämän jälkeen

empiirisesti kalibroidun mallin tulosta – ruutukohtaista teoreettista asiointitodennäköisyyttä – sovelletaan yksinkertaisessa esimerkkitapauksessa tarkoituksena arvioida mallin soveltuvuutta seudullisen

vähittäiskaupan suuryksikön vaikutusten arviointiin. Mallin soveltaminen jakautuu alla lueteltuihin päävaiheisiin, tarkemmin prosessi on esitetty kuvassa 2.

1. Muodostetaan tutkimusongelma ja tutkimusalue

2. Määritellään ongelmaan soveltuva kaupan palveluverkko (asiointikohteet)

3. Kalibroidaan malli valitulla menetelmällä empiirisen asiointiaineiston perusteella (estimoidaan mallin parametrit).

4. Tuotetaan mallilla ruutukohtaiset asiointitodennäköisyydet valittuihin asiointikohteisiin 5. Sovelletaan mallin tuottamaa todennäköisyyttä

MCI-malli: [2]

𝑃_𝑖𝑗 = todennäköisyys että kuluttaja pisteessä i asioi kohteessa j

𝐴_ℎ𝑗 = mittari ominaisuudelle h (h = 1,2,.H), joka heijastaa kohteen j vetovoimaa γ = parametri kuvaamaan todennäköisyyden 𝑃_𝑖𝑗 herkkyyttä vetovoimatekijään h 𝐷𝑖𝑗 = saavutettavuus kuluttajan sijainnista i kohteeseen j

λ = parametri kuvaamaan todennäköisyyden 𝑃𝑖𝑗herkkyyttä saavutettavuuteen (etäisyyshaitta) n = keskusten lukumäärä

(6)

Kuva 2. Menetelmän prosessikaavio.

Tutkimusalue ja asiointikohteet

Tutkimusalueen rajaus riippuu tarkasteltavasta ongelmasta, johon mallia sovelletaan. Esimerkiksi erikois- ja päivittäistavarakaupassa on luonnollista käyttää laajuudeltaan aluetta, joka vastaa pääpiirteissään käytetyn tuoteryhmittelyn asiointialuetta ja muodostaa näin luonnollisen

aluekokonaisuuden, jossa suurin osa tuoteryhmän asioinnista tapahtuu. Päivittäistavarakauppa on luonteeltaan melko paikallista, jolloin myös asiointialue on laajuudeltaan usein pieni mutta tässä yhteydessä myös päivittäistavarakauppaa on tarkasteltu samassa mittakaavassa kuin erikoiskauppaa.

Erikoiskaupan osalta luonnollinen tutkimusalue on selkeästi laajempi, koska erikoistavaroita kuluttajat ovat halukkaampia hakemaan kaukaakin tarpeet tyydyttävästä keskuksesta. Asiointidynamiikassa on kuitenkin suuria alueellisia sekä tuotekohtaisia eroja, jolloin eri alueilla asiointialueet muodostavat erilaisia kokonaisuuksia. Myös tietyt erikoistavarat voivat olla paikallisia luonteeltaan ja riippuen käytetystä tuoteryhmittelystä voivat asiointialueet vaihdella paljonkin.

Mallin sovellusalueiksi on rajattu yhdyskuntarakenteen toiminnalliset alueet (2012) selvityksessä määritellyt kaupunkiseutujen asiointialueet (kuva 2). Kuntapohjaiset asiointialueet on määritelty Suuri Vaikutusaluetutkimus (SVT) 2011 aineiston perusteella rajaamalla ensin keskuskunniksi sellaiset kunnat, joissa vähintään 60 prosenttia asioinnista tapahtuu omassa kunnassa eikä mihinkään muuhun kuntaan suuntaudu yli 10 prosenttia asioinnista. Muut kunnat on liitetty sen kunnan asiointialueeseen, johon sieltä asioidaan eniten. Asiointialue muodostaa laajan toiminnallisen aluekokonaisuuden, jonka sisällä

(7)

tapahtuu suurin osa asioinnista ja ostovoiman siirtymät alueen ulkopuolelle minimoituvat. Asiointialuetta vastaavana käsitteenä on käytetty esimerkiksi markkina-aluetta.

Kuva 3. Esimerkkinä Tampereen seudun asiointialue ja määritellyt asiointikohteet.

Kuten mallissa sovellettava tutkimusalue, niin myös asiointikohteet riippuvat tutkimusongelmasta ja mallin käyttötarkoituksesta, sekä usein myös käytettävistä aineistoista. Käyttötarkoitus määrittää

tarkastellaanko yksittäisten päivittäistavarakauppojen, vai vain esimerkiksi suurimpien kauppakeskusten vaikutusalueita. Vai halutaanko tarkastella seudullisen kaupan palveluverkon, kuten keskusta-alueiden, alakeskusten ja muiden merkittävien myymäläkeskittymien vaikutusalueita tietyn tuoteryhmän mukaan.

Malli ei rajoita sitä, millaisia asiointikohteet voivat olla, mutta on hyvin olennaista, että asiointikohteet on määritelty johdonmukaisesti mallin käyttötarkoituksesta riippuen.

Tässä tutkimuksessa seudullinen kaupan palveluverkko (asiointikohteet) muodostuvat keskusta-alueista ja keskustojen ulkopuolisista merkittävimmistä myymäläkeskittymistä. Asiointikohteet on määritelty Suomen ympäristökeskuksessa yhdyskuntarakenteen monikeskuksisuus ja kauppa (YKR-Moka) sekä keskustojen elinvoimaisuus ja asema yhdyskuntarakenteessa (YKR-Kela) tutkimuksissa kehitettyä keskusta- ja kaupan alue rajausta hyödyntäen. Tutkimuksissa kehitetty menetelmä tunnistaa keskusta- alueiksi sellaiset alueet, jotka sisältävät jalankulkuetäisyydellä muita alueita enemmän ja tiiviimmin palveluiden ja vähittäiskaupan työpaikkoja sekä väestöä. Toimintoja ja työpaikkoja täytyy myös olla riittävän monipuolisesti usealta toimialalta. Keskustojen ulkopuoliset kaupan alueet on rajattu

menetelmällä, joka ei perustu 250-metrin ruudukkoon ja ruututietoihin. Tässä melko yksinkertaisessa menetelmässä vähintään viiden työpaikan tai 1000 kerrosneliömetrin kaupparakennuksista

muodostetaan 75–250 metrin etäisyysvyöhyke kaupan koon mukaan. Toisiaan leikkaavat vyöhykkeet on

(8)

yhdistetty yhtenäisiksi alueiksi, joista on edelleen valittu merkittävimmät alueet työpaikkamäärän perusteella (kts. Rehunen ym. 2014: 21.) Rajauksen toimipaikkatiedot perustuvat Tilastokeskuksen yritys- ja toimipaikkarekisterin sekä Väestörekisterikeskuksen ylläpitämän rakennus- ja

huoneistorekisterin tietoihin.

Aineistot

Mallin käyttötarkoituskohtainen kalibrointi perustuu Suomen ympäristökeskuksessa käytössä olevaan TNS Gallup Oy:n Suuri vaikutusaluetutkimus (SVT) 2011 aineistoon. Aineistoa on hyödynnetty Suomen ympäristökeskuksessa muun muassa vähittäiskaupan suuryksiköiden alue- ja yhdyskuntarakenteellisia vaikutuksia tarkastelleessa tutkimushankkeessa. Aineiston perusjoukon muodostavat kotitaloudet, joissa vastaajina ovat olleet vähintään 15 vuotta täyttäneet jäsenet. Ensimäistä kertaa Internet-kyselynä

toteutetussa kyselyssä vastaajilta kysyttiin, mistä kunnasta talouteen on viimeksi hankittu 39:ää eri tuotetta tai palvelua. Vastaaja pystyi myös tarkentamaan, mistä erityisestä ostopaikasta, kuten

kauppakeskuksesta tai keskusta-alueelta, tuotteita on hankittu. Tutkimuksen kokonaisvastaajamäärä on noin 30 000 kotitaloutta. Kyselyn kohdejoukon otanta ei perustu täysin satunnaisotantaan, vaan

tarkoituksena siinä oli tuottaa alueellisesti mahdollisimman kattava otos. Vuonna 2011 toteutetussa internet-kyselyssä suuret kaupunkiseudut ovat paremmin edustettuina aikaisempiin postitse

toteutettuihin kyselyihin verrattuna mutta toisaalta pienet maaseutukunnat ovat selvästi heikommin edustettuina.

Suomen ympäristökeskuksessa kyselyaineisto on käytössä sekä postinumero- että kuntatason aineistoina, joissa molemmissa on mukana tarkemmat yksittäiset ostopaikat. Käytetyssä aineistossa ostopaikka on siis ilmoitettu joko kunnan, kuntaa tarkemman aluejaon tai yksittäisen kaupan tai keskusta-alueen tarkkuudella. Vastaajien asuinpaikka on ilmoitettu sitä vastoin ainoastaan kunnan ja postinumeroalueen tarkkuudella. Tarkempaa tietoa vastaajien asuinpaikasta ei ollut saatavilla, mutta useimmilla kaupunkiseuduilla postinumeroalueet muodostavat sen verran pieniä kokonaisuuksia, että aineiston spatiaalinen tarkkuus on tämän tutkimuksen tarkoitukseen sekä käytetyn yleistason mallin kalibrointiin riittävä. Koska SVT-aineistossa vastaajat olivat myös ilmoittaneet tuotteen ostopaikan, pystyttiin mainitut ostopaikat ja täten asioinnin suuntautuminen liittämään tiettyyn keskusta-alueeseen tai kaupan alueeseen. Vastaaja oli esimerkiksi ilmoittanut ostopaikaksi Tampereen keskustan, jolloin tämän asiointitapahtuman (tuotteen hankinnan) kohteeksi voitiin määritellä edellä kuvatulla menetelmällä rajattu Tampereen keskusta-alue.

Toinen hyvin keskeinen aineistokokonaisuus on Suomen ympäristökeskuksen ylläpitämän ja ympäristöhallinnossa kehitetyn yhdyskuntarakenteen seurantajärjestelmän (YKR) tiedot.

Paikkatietopohjainen seurantajärjestelmä on kehitetty yhdyskuntarakenteessa tapahtuvien muutosten, valtakunnallisesti ja ajallisesti vertailukelpoisten seurantojen ja analyysien tuottamiseen.

Yhdyskuntarakenteen seurantajärjestelmä (YKR) voidaan katsoa koostuvan sen sisältämistä tiedoista, aluejaoista ja kehitetyistä menetelmistä yhdyskuntarakenteen kehityksen analysointiin. YKR perustuu 250 metrin ruututietoihin. Maanpeitetietoja lukuun ottamatta kaikki tiedot ovat Tilastokeskuksen tuottamia tai eri lähteistä koostamia. Tutkimuksessa on hyödynnetty seuraavia YKR-ruutuaineistoja:

(9)

1. Kaupan toimipaikat (2010) 2. Vähittäiskaupan työpaikat (2009) 3. Väestö (2011)

4. Rakennukset (2011)

Kolmas keskeinen aineistokokonaisuus kattaa Tilastokeskuksen yritys- ja toimipaikkarekisterin (2011) sekä Väestörekisterikeskuksen ylläpitämän rakennus- ja huoneistorekisterin (RHR 2011) tiedot. Tässä tutkimuksessa aineistoista on hyödynnetty Suomen ympäristökeskuksessa kaupan tutkimushankkeita varten korjattua ja tarkastettua yritys- ja toimipaikkarekisteriä, jonka tiedot on edelleen yhdistetty rakennus- ja huoneistorekisterin tietoihin. Toimipaikka-aineistoa on paranneltu muun muassa täydentämällä ja korjaamalla varsinkin suurimpien yritysten ja toimipaikkojen sijaintitietoja. Aineiston korjaamisen ja yhdistämisen tuloksena saadaan kokoon aineisto, josta voidaan tuottaa laskennallisia kaupan kerrosaloja ja työpaikkamääriä.

Lisäksi tutkimuksessa on käytetty AC Nielsen Oy:n tuottamaa päivittäistavarakauppa-aineistoa vuodelta 2012. Jotta tämä aineisto saatiin vastaamaan paremmin vuoden 2011 asiointitietoja, tutkimuksessa ei huomioitu aineiston sisältämiä vuonna 2012 aloittaneita toimipaikkoja. Aineisto sisältää tietoja

esimerkiksi päivittäistavarakauppojen myyntipinta-aloista.

Mallin vaatimat saavutettavuuslaskennat perustuvat Liikenneviraston ylläpitämään valtakunnalliseen Digiroad-tieverkkoaineistoon, joka sisältää koko Suomen tie- ja katuverkon sekä niihin liittyvät tärkeimmät ominaisuustiedot. Tätä tutkimusta varten vektorimuotoinen topologinen tieverkosto muunnettiin kuitenkin mallin saavutettavuuslaskentoja varten rasterimuotoon.

Parametrien estimointi

Tutkimuksessa sovelletaan lähtökohtaisesti Huffin mallin pohjautuvaa MCI-mallia [2], joka mahdollistaa usean vetovoimamuuttujan. Saavutettavuustekijää 𝐷_𝑖𝑗 kuvaavana muuttujana tutkimuksessa on käytetty sekä linnuntie-etäisyyttä että kuluttajan käyttämää matka-aikaa autolla kohteeseen tieverkkoa pitkin mitattuna. Matka-aikojen laskenta ruuduista kaikkiin asiointikohteisiin suoritettiin

paikkatietojärjestelmässä kustannusetäisyys (cost distance) analyysillä Spatial analyst työkaluilla.

Vektori muotoinen Digiroad tieverkkoaineisto on ensin muunnettu 25 x 25 metrin solukokoon siten, että jokainen solu saa tieverkon nopeutta vastaavan impedanssiarvon. Arvo kuvaa solun ylittämisen

kustannusta eli tässä tapauksessa aikaa sekunteina, joka kuluu yhden solun läpikulkuun. Arvo

muodostuu tien kohdalla nopeusrajoituksen mukaan käänteislukuna, eli kun nopeusrajoitus on korkea, on kustannus vastaavasti alhainen. Tieverkon ulkopuolella impedanssiarvo on muodostettu

kävelyvauhdin mukaan. Kevyen liikenteen väylien kohdalla solu saa myös kävelyvauhtia vastaavan impedanssiarvon. 250 metrin ruuduille saavutettavuus arvo saadaan saavutettavuuspinnan 25 metrin solujen keskiarvosta. Rasterilähtöistä menetelmää sovellettiin etenkin sen takia, että laskentaprosessi on näin huomattavasti nopeampi vektorimuotoiseen verkostoanalyysiin verrattuna.

Koska SVT-aineistossa vastaajien sijainti oli tiedossa tarkimmillaan vain postinumeroalueen tarkkuudella, jouduttiin mallin kalibrointia varten saavutettavuusmittareille muodostamaan

(10)

postinumeroaluekohtainen arvo – väestöpainotettu etäisyyden keskiarvo. Kalibrointia varten ruudulle laskettua saavutettavuusarvoa (linnuntie ja matka-aika) painotettiin ruudun väestömäärällä. Painotettujen arvojen perusteella laskettiin lopullinen väestöpainotettu saavutettavuus jakamalla postinumeroalueelta tiettyyn asiointikohteeseen suuntautuvien väestöpainotettujen saavutettavuuksien summa

painottamattomien saavutettavuuksien summalla. Painotus kasvattaa niiden ruutujen roolia

postinumeroalueen saavutettavuusarvon muodostumisessa, joissa on paljon väestöä. Tällöin arvo kuvaa hieman paremmin postinumeroalueen asukkaiden keskimääräistä etäisyyttä asiointikohteisiin kuin esimerkiksi postinumeroalueen fyysisestä keskipisteestä laskettu etäisyys. Lopputuloksena jokainen postinumeroalue sisältää saavutettavuustiedon kaikkiin keskuksiin.

Vetovoimatekijän määrittely on usein mallin muodostamisen haastavin vaihe. Lähtökohdaksi muuttujan muodostamisessa otettiin yksinkertaisuus, mutta kuten malli [2] mahdollistaa, voi vetovoimatekijä olla myös usean muuttujan muodostama kokonaisuus. Mallin sen salliessa, vetovoiman kuvaamiseen tutkimuksessa kokeiltiin useita eri muuttujia ja niiden yhdistelmiä. Tämä tehtiin laskemalla työssä rajatuille keskusta- ja kaupan alueille erilaisia kohteen kaupallista vetovoimaa mahdollisesti heijastavia tekijöitä (Liite 1). Laskettujen muuttujien soveltuvuutta vetovoimatekijäksi testattiin tämän jälkeen kalibroimalla malli empiirisen asiointiaineiston perusteella ja arvioimalla tuloksia. Kalibroinnilla haetaan mallin tuntemattomille parametreille tutkimusalueen asiointia parhaiten vastaavat estimaatit.

Mallin kalibrointi perustuu Suuri Vaikutusaluetutkimus 2011 (SVT) aineistoon. Useissa tutkimuksissa on todettu, että etäisyyden vaikutus asiointiin riippuu muun muassa siitä, mitä tuotetta ollaan hankkimassa.

Toisia tuotteita ollaan valmiimpia hakemaan kaukaa, kun taas toiset tuotteet, kuten päivittäistavarat, hankitaan usein lähempää.

Parametrien estimointia varten SVT-aineiston tuoteryhmät luokiteltiin neljään luokkaan:

päivittäistavaroihin (PT), erikoistavaroihin (ET), tilaa vaativiin tavaroihin (TIVA) ja palveluihin (PALV), joista keskityttiin pääasiassa erikoiskauppaan. Vastaavanlainen luokitus on käytössä myös kaavoituksen yhteydessä tehtävässä kaupan palveluverkon suunnittelussa. Tuoteryhmäluokittelun lähtökohtana on käytetty Suomen ympäristökeskuksessa SVT-aineiston pohjalta tehtyä luokittelua (taulukko 1). Kaksi SVT-tuoteryhmää (autokauppa, kotimaan matkailukohteet) jätettiin kokonaan luokittelun ulkopuolelle, sillä ne erosivat luonteeltaan muista liian paljon.

Taulukko 1. SVT-tuoteryhmien luokittelu.

SVT-aineiston tuoteryhmä Luokka SVT-aineiston tuoteryhmä Luokka

Kosmetiikka ET Ravintolapalvelut PALV

Alkoholi ET Kahvila- tai lounasravintolapalvelut PALV

Kodin viihde-elektroniikka ET Pankkikonttorissa asiointi PALV

Kodin tietotekniikkalaitteet ET Vakuutusyhtiön konttorissa asiointi PALV

DVD, CD, Tietokonepelit yms. ET Matkatoimistossa asiointi PALV

Matkapuhelimet, liittymät, laajakaista ET Kampaamot / parturit, kauneushoitolat PALV

Kellot ja korut ET Kirjastossa käynti PALV

Silmälasit, piilolasit ym. optikkotuotteet ET Julkiset lääkäri- ja terveydenhoitopalvelut PALV

Kirjat ET Kulttuuripalvelut PALV

Naisten vaatteet ET Julkiset koulutuspalvelut PALV

(11)

Miesten vaatteet ET Yksityiset lääkäri- ja terveydenhoitopalvelut PALV

Lasten vaatteet ET Elokuvissa käynti PALV

Naisten jalkineet ET Vakuutusyhtiön konttorissa asiointi PALV

Miesten jalkineet ET Matkatoimistossa asiointi PALV

Urheiluvälineet ja -asusteet ET Elintarvikkeet arkisin PT

Kodinkoneet TIVA Elintarvikkeet viikonloppuisin PT

Huonekalut ja sisustustarvikkeet TIVA Pesu- ja puhdistusaineet, paperit PT Rauta- rakennus- ja remonttitarvikkeet TIVA

Mallin epälineaarisen luonteen johdosta sen parametrien estimointi tilastollisesti yksinkertaisesti ja pätevästi on melko monimutkaista. Tämä onnistuu kuitenkin yksinkertaisemmin muuntamalla malli ensin lineaariseksi parametrien suhteen. Menetelmänä sovelletaan Nakanishin ja Cooperin kehittämää ”log- centering” -menetelmää, jolla malli muunnetaan lineaariseksi logaritmimuunnoksella ja geometrisilla keskiarvoilla (kts. Nakanishi & Cooper 1982). Muunnos linearisoi ja keskittää muuttujat niin, että ne täyttävät paremmin lineaarisen mallin vaatimat oletukset (esim. normaalius). Tällöin myös

regressiomallin virhe eli residuaalit voidaan olettaa olevan normaalijakautuneita. Muuttujien ja

residuaalien ollessa normaali- tai lähes normaalijakautuneita, pätevät myös tilastolliset merkitsevyystestit valitulla merkitsevyysasteella, jolloin parametrien estimaattien tilastollinen merkitsevyys voidaan

todentaa.

Mallissa [3] 𝑃̃_𝑖on siis niihin asiointikohteisiin suuntautuvien asiointiosuuksien ja 𝐷̃_𝑖etäisyyksien geometrinen keskiarvo, joihin postinumeroalueelta (valintatilanteesta i) on empiirisessä aineistossa asiointia. Vastaavasti 𝐴̃_𝑗 on vetovoimamuuttujan geometrinen keskiarvo kaikista asiointikohteista j laskettuna. Kuitenkin, kun empiirisessä aineistossa ei kaikilta postinumeroalueilta ole erikoiskaupassa asiointia kaikkiin kohteisiin j, lasketaan geometrinen keskiarvo vetovoimamuuttujalle 𝐴_ℎvain niistä asioinnin kohteista, joihin postinumeroalueelta i on empiirisessä aineistossa asiointia ja esitetään 𝐴̃_ℎ𝑖.

Mallin tuntemattomien parametrien estimaatit on tuotettu lineaarisella regressioanalyysilla käyttäen pienimmän neliösumman estimaattia (PNS) linearisoituun aineistoon. Parametrien estimaatit kullekin muuttujalle saadaan sen kulmakertoimesta (β) usean muuttujan lineaarisessa regressiomallissa, jossa riippuvana muuttujana on muunnoksen jälkeinen asiointiosuus ja riippumattomina muunnettu

saavutettavuus sekä yksi tai useampi muunnettu vetovoimamuuttuja.

Malli [2] muunnettuna: [3]

missä 𝑃̃_𝑖 , 𝐴̃_𝑗ja 𝐷̃_𝑖 ovat muuttujien 𝑃_𝑖𝑗, 𝐴_ℎ𝑗 ja 𝐷_𝑖𝑗 geometrisia keskiarvoja valintatilanteelle i

(12)

Parametrien estimaattien lisäksi saadaan myös selville niiden tilastollinen merkitsevyys ja voidaan samalla arvioida tietyn muuttujan keskeisyyttä ja käyttökelpoisuutta mallissa. Keskeisyyttä voidaan arvioida esimerkiksi sen perusteella, kuinka paljon selittävä riippumaton muuttuja kasvattaa lineaarisen regressiomallin selitysastetta (R²). Käyttökelpoiseksi tai parhaaksi malliksi ei kuitenkaan voida

välttämättä julistaa sellaista mallia, joka on parhain esimerkiksi selitysasteella mitattuna, ja jonka kaikki muuttujat ovat tilastollisesti merkitseviä esimerkiksi viiden prosentin merkitsevyysasteella. Mallin määrittelyssä täytyy ottaa huomioon myös riippumattomien muuttujien välinen keskinäinen lineaarinen riippuvuus eli kollinearisuus. Tämä ei sinänsä vaikuta regressiomallin selitysasteeseen välttämättä negatiivisesti, mutta voi vääristää haitallisesti regressiomallin kertoimia ja täten tuntemattomien parametrien estimaatteja. Kun mallin kalibroinnin keskeisin tehtävä on löytää parhaat estimaatit tuntemattomille parametreille, käyttökelpoisessa mallissa riippumattomien muuttujien välinen keskinäinen riippuvuus ei saa kasvaa liian suureksi. Tämä erityisesti vaikuttaa siihen, millaisilla muuttujien yhdistelmillä voidaan selittää asiointia, sillä useat tutkimuksessa käytetyt muuttujat, kuten vähittäiskaupan työpaikkamäärät ja kaupan rakennusten kerrosalat, korreloivat vahvasti tai melko vahvasti keskenään. Tällä ei kuitenkaan ole kovinkaan suurta vaikutusta mallien selitysasteeseen, sillä mitä enemmän muuttujia malli sisältää sitä vähemmän uudet muuttujat selittävät asiointia ja sitä

enemmän kollinearisuus kasvaa. Tällaisten muuttujien informaatio siis sisältyy suurelta osin malliin jo muiden muuttujien kautta. Kollinearisuus ei ole ongelma yhden vetovoimamuuttujan malleissa. Kun riippumattomia muuttujia kuitenkin lisätään, kasvaa se merkittävästi, jolloin regressiokertoimien tasapaino ja luotettavuus saattaa heiketä. Lineaarisen mallin, sen sisältämien muuttujien ja niiden

parametrien käyttökelpoisuutta sekä selittävyyden että kollinearisuuden osalta voidaan arvioida erilaisten tilastollisten tunnuslukujen perusteella.

1. Selitysaste, R2 (Coefficient of determination, R-squared)

 Kuvaa kuinka suuren osan lineaarinen regressiomalli selittää asioinnin (riippuvan muuttujan) vaihtelusta.

2. Selitysasteen muutos (R-squared change)

 Kuvaa kuinka paljon yksi riippumaton muuttuja kasvattaa lineaarisen regressiomallin selitysastetta (R2). Käytetty arvioimaan yhden muuttujan keskeisyyttä mallissa.

3. Condition Index, δk

 Tunnistaa regressiomallin (pääkomponenteista) x-ulottuvuuksista sellaiset, joilla havaittavaa lineaarista riippuvuutta muiden x-ulottuvuuksien kanssa. Tällöin pienimmän neliösumman käyttö mahdollisesti ongelmallista. Kollinearisuus on selkeä, jos δk > 30. Vaikutusta voi olla myös, jos δk > 10.

4. Variance inflation factor, VIF

 Yksinkertainen kollinearisuuden mittari regressiomallin riippumattoman muuttujan kertoimelle b, jonka minimi on 1,0. Kollinearisuus on selkeä, jos VIF > 10.

(13)

Yllä esitettyjä tunnuslukujen kriittisiä arvoja ei kuitenkaan tulkittu yksiselitteisesti, vaan niitä pidettiin pikemminkin varoittavina raja-arvoina, jolloin regressiomallin kertoimiin piti suhtautua suuremmalla varauksella.

Kun mallin käyttötarkoitukseen soveltuvat parhaat mallit ovat muodostettu sekä tuntemattomat parametrit 𝑦̂ ja 𝜆̂ estimoitu, voidaan postinumeroaluekohtaiset asiointitodennäköisyyksien estimaatit muodostaa mallilla [4]. Postinumeroaluekohtaisia mallinnettuja arvoja voidaan tämän jälkeen verrata SVT-aineiston havaittuihin arvoihin.

Mallin toimivuuden arviointi

Hyvin tärkeä osa mallin muodostamista on vaihe, jossa arvioidaan sen kykyä toistaa havaittu aineisto.

Samalla voidaan arvioida mallin taustalla vaikuttavien teorioiden ja oletusten toimivuutta. Mallin toimivuuden testaaminen on siis yksi osatehtävä, jossa tilastollisesti mitataan sitä, millä tarkkuudella mallilla ennustetut arvot, 𝑋̂ = [𝑥̂₁, 𝑥̂₂, … , 𝑥̂_𝑛] toistavat havaitut arvot, 𝑋 = [𝑥₁, 𝑥₂, … , 𝑥_𝑛]. Osaltaan tätä vaihetta tukee jo aikaisemmin saatu tieto lineaarisen mallin selittävyydestä, mutta tässä viimeistään todennetaan estimoitujen parametrien ja mallin toimivuus.

Tehtävää varten on olemassa useita erilaisia yhteensopivuus (goodness-of-fit) -mittareita, joita voidaan käyttää kahteen eri tarkoitukseen. Tilastollisella yhteensopivuus mittarilla voidaan arvioida ja vertailla kuinka tarkasti yksi tai useampi malli toistaa samaa havaintoaineistoa tai kuinka tarkasti yksi malli toistaa kahta tai useampaa eri havaintoaineistoa. Toinen tarkoitus liittyy hypoteesien testaukseen, jossa mittarin avulla testataan onko ero havaituissa ja ennustetuissa arvoissa tilastollisesti merkitsevä. Testauksen avulla malli joko hylätään liian epätarkkana tai todetaan sen olevan tilastollisesti riittävän tarkka. Usein nollahypoteesiksi asetetaan tilanne, että havaittujen ja ennustettujen arvojen erot eivät ole merkittäviä ja hylätä se, jos laskettu testisuure ylittää tietyn kriittisen arvon valitulla luottamusvälillä.

Tässä yhteydessä testausta on sovellettu tilanteeseen, jossa vertaillaan ja arvioidaan kuinka tarkasti yksi tai useampi malli pystyy toistamaan yhtä ja samaa havaintoaineistoa. Malli ei muutu, mutta siinä käytetyt muuttujat, niiden määrä ja parametrit vaihtelevat, jolloin testauksen avulla voidaan arvioida parametrien estimaattien ja muuttujien toimivuutta havaittujen arvojen ennustamisessa. Lopullisina testisuureina on käytetty RMSE (root mean squared error) sekä SRMSE (Standardised root mean squared error) – testisuureita (kts. esim. Knudsen & Fotheringham 1986). Pelkistettynä RMSE ja SRMSE kuvaavat siis, kuinka paljon ennustetut arvot eroavat havaituista arvoista keskimäärin. SRMSE on käyttökelpoisempi

Malli [4]:

missä asiointi todennäköisyydet 𝑃̂_𝑖𝑗 ja tuntemattomat parametrit 𝑦̂ ja 𝜆̂ ovat esitetty estimaatteina.

(14)

varsinkin tilanteessa, jossa mallin suorituskykyä vertaillaan eri alueiden välillä, koska se suhteutetaan tutkimusalueen keskimääräiseen havaittuun asiointiosuuteen. Perinteistä ja hyvin usein myös

yhteensopivuusmittarina sovellettua korrelaatiokerrointa (r) käytettiin lisäksi arvioinnin tukena.

Kalibroinnin tulokset

Taulukossa 2 on kuvattu molempien tutkimusalueiden keskimääräiset parametrien arvot linnuntie- etäisyydelle, matka-aika etäisyydelle sekä keskeisimmille vetovoimamuuttujille erikoiskaupan osalta.

Keskimääräiset arvot kuvaavat parametrin odotusarvoa riippumatta mitä muita muuttujia malli sisältää.

Taulukossa 3 on puolestaan kuvattu kalibroinnin ja mallin testauksen tuloksena tuotetut tilastolliset tunnusluvut muutaman esimerkkimalli osalta. Tarkemmin erilaiset testatut mallit, niiden tilastolliset tunnusluvut ja parametrin estimaatit ovat kuvattu liitteessä 2. Liitteessä on myös kuvattu

päivittäistavarakaupan kalibroinnin tulokset taulukoina.

Taulukko 2. Yhteenveto kalibroitujen mallien parametrien estimaateista.

Alue Muuttuja Parametri

Parametrin

keskimääräinen estimaatti

Tyypillinen vaihteluväli

JKL Linnuntie-etäisyys -1,2 -1,35 - -1,02

Matka-aika etäisyys -1,5 -1,78 - -1,30

Erikoiskaupan kerrosala ^γ 0,7 0,60 - 0,74

Erikoiskaupan työpaikkojen lukumäärä ^γ 0,8 0,72 - 0,92

Vähittäiskaupan työpaikkojen lukumäärä γ 1,0 0,86 - 1,1

Tampere Linnuntie-etäisyys -1,3 -1,41 - -1,23

Matka-aika etäisyys -1,8 -1,95 - -1,70

Erikoiskaupan kerrosala ^γ 0,6 0,55 - 0,66

Erikoiskaupan työpaikkojen lukumäärä ^γ 0,6 0,54 - 0,67

Vähittäiskaupan työpaikkojen lukumäärä γ 0,8 0,7 - 0,87

Taulukko 3. Mallin tilastolliset tunnusluvut

Alue Mallin muuttujat R2 RMSE SRMSE Korrelaatio (Pearson)

Jyväskylä 1. Linnuntie-etäisyys

2. Kaupan rakennusten kerrosala 0,675 0,1383 0,5749 0,809 Jyväskylä

1. Matka-aika etäisyys

2. Erikoiskaupan toimipaikkarakennusten kerrosala

0,6 0,1581 0,657 0,747

Tampere 1. Linnuntie-etäisyys

2. Kaupan rakennusten kerrosala 0,563 0,1128 0,8762 0,765

Tampere 1. Matka-aika etäisyys

2. Erikoiskaupan rakennusten kerrosala 0,552 0,1376 0,9656 0,729

Kalibrointitulosten yhteenveto

Molemmilla tarkastelualueilla parhaimpiin tuloksiin päästään käyttämällä vetovoimamuuttujana niiden rakennusten kerrosalaa, joiden pääkäyttötarkoitus on kauppa. Tämä antaa paremmat tulokset kuin jos keskuksen vetovoimaa kuvattaisiin esimerkiksi vain niiden rakennusten kerrosalalla, joiden

pääkäyttötarkoitus on erikoiskauppa. Koska tarkkaa tietoa ei ole siitä, kuinka paljon kauppaa tai erityisesti erikoiskauppaa on todellisuudessa keskuksissa, ovat testatut vetovoimamuuttujat vain

(15)

suuntaa-antavia arvioita kaupan todellisista kerrosaloista. Lähes vastaaviin tuloksiin päästään myös monien muiden muuttujien kautta, kuten erikoiskaupan laskennallisia työpaikkamääriä tai koko

vähittäiskaupan työpaikkamäärää käyttämällä. Myös toimipakkojen määrät ja työssäkäynnin määrät sekä keskuksen kaupan tarjonnan monipuolisuutta kuvaavat muuttujat antavat samankaltaisia tuloksia

tilastollisilla tunnusluvuilla mitattuna. Kerrosalatiedot, etenkin kaupan alaa kuvaavat kerrosalatiedot, ovat kuitenkin mallin soveltamisen näkökulmasta parhaita muuttujia, koska tieto on usein saatavilla

esimerkiksi uusista ja tulevista vähittäiskaupan suuryksikköhankkeista.

Menetelmäkehityksen aikana arvioitiin myös parantaako usean vetovoimamuuttujan käyttö mallin tarkkuutta. Yhteenvetona todettakoon, että usean muuttujan käyttö ei paranna mallia merkittävästi kun käytettävissä oli liitteessä 1 kuvatut muuttujat ja empiirinen aineisto on tarkimmillaan postinumerotasolla.

Olennaisin syy tähän on se, että käytetyt muuttujat ovat melko samankaltaisia ja kuvaavat osittain samaa asiaa hieman eri näkökulmista, jolloin lisättävän muuttujan informaatio on jo suurelta osin mukana mallissa toisen muuttujan kautta. Voidaan muun muassa ajatella, että kokonaisuudessaan keskusta-alueen kaupan kerrosalaa kuvaava muuttuja, kuvaa samalla myös epäsuorasti esimerkiksi keskustan kaupan yksiköiden tarjonnan monipuolisuutta. Suurempi tarjonta tarkoittaa usein siis myös monipuolisempaa tarjontaa. Usean muuttujan käyttö aiheuttaa lisäksi jo aiemmin kuvatun kollinearisuus ongelman, joka voi vääristää parametrien estimaatteja. Tällöin ei myöskään varmasti tiedetä parantaako lisämuuttujat mallia vai ovatko parametrit vain vääristyneitä.

Ennakko-odotuksiin nähden on yllättävää että saavutettavuusmuuttujien välille ei suurta eroa synny.

Kokonaisuudessaan linnuntie-etäisyyden käyttö tuottaa kuitenkin hieman parempia tuloksia ja on myös selkeästi helpommin otettavissa käyttöön Huffin malliin, koska laskenta operaatio on huomattavasti yksinkertaisempi matka-aikojen laskentaan verrattuna. Osaltaan tulokset johtuvat siitä, että molemmat käytetyt muuttujat ovat vain yleispiirteisiä mittareita kuvaamaan saavutettavuutta valituilla

kaupunkiseuduilla, joissa kuitenkin merkittävä osa asiointiliikenteestä ja muusta liikkumisesta tehdään myös jalan tai joukkoliikenteellä. Tuloksiin vaikuttaa voimakkaasti myös saavutettavuuden yleistäminen postinumerotasolle vastaamaan havaintoaineiston tarkkuutta. Useissa muissa tutkimuksissa, joissa vastaajien sijainti on tunnettu tarkasti esimerkiksi osoitteen tarkkuudella, on matka-aika ollut pääasiassa parempi muuttuja kuvaamaan saavutettavuutta. Etäisyysmuuttujien parametrien arvot olivat myös loogisia. Erikoiskaupassa parametrin negatiivinen arvo selkeästi aina yli -2, joka kuvaa sitä että etäisyyden vaikutus ei ole kovin jyrkkä. Päivittäistavarakaupassa arvot sitä vastoin pienempiä, esimerkiksi matka-ajalle parametri aina alle -2. Etäisyyden vaikutus on jyrkempi ja päivittäistavaroita haetaan usein lähempää. Etäisyys koetaan siis suurempana kustannuksena.

Tilastollisten tunnuslukujen näkökulmasta tarkasteltuna mallin tulokset vastaavat odotuksia.

Yksinkertaistettuna mallit kuvaavat tutkimusalueilla keskimäärin noin puolet asioinnin vaihtelusta.

Keskimääräinen ennustevirhe asiointiosuuksissa havaintoaineistoon verrattuna (RMSE) vaihtelee mallista riippuen 10 - 20 prosentin (0,1 - 0,2) välillä. Tulos siis osoittaa sen, että vetovoimamallien

tuloksiin täytyy suhtautua aina tietyllä varauksella. Mallin kalibroinnin suurin hyöty on kuitenkin juuri siinä, että kun sen tuloksena mallin toimivuus tiedetään, voidaan mallin tuloksiin suhtautua oikealla

(16)

painoarvolla. Ennustevirheitä tulkittaessa täytyy kuitenkin aina muistaa, että se perustuu havaittuun asiointiaineistoon, joka sisältää myös virheitä ja satunnaisuuksia ja joita ei pidä tulkita todellisina asiointiosuuksina. Kalibroinnissa käytetty SVT-aineisto sisältää satunnaisuuksia erityisesti harvaan asutuilla seudulla, missä vastaajia on vähän. Erilaisten poikkeavien ja merkittävien havaintojen vaikutus voi olla hyvinkin suuri mallin parametrien estimaatteihin sekä tilastollisiin tunnuslukuihin.

Mallin soveltaminen vähittäiskaupan suuryksikön vaikutusten arvioinnissa (erikoiskauppa)

Seuraavassa yksinkertaisessa esimerkissä sovelletaan edellä kuvatulla menetelmällä

postinumeroaluetasolla kalibroitua mallia 250 metrin ruututasolla pyrkimyksenä arvioida hypoteettisen vähittäiskaupan suuryksikköhankkeen seudullisia vaikutuksia. Skenaario muodostetaan Tampereen asiointialueelle. Mallilla [4] muodostetaan ensin keskusta- ja kaupan alueille nykytilanteen mukaiset vaikutusalueet käyttäen mallissa etäisyysmuuttujana linnuntie-etäisyyttä ja vetovoimamuuttujana kaikkien niiden rakennusten kerrosalaa, jotka sisältävät sekä erikoiskaupan toimipaikkoja että työpaikkoja. Tämän jälkeen kaupan palveluverkkoa muutetaan kasvattamalla tiettyä kaupan aluetta vaiheittain 10 000 kerrosneliömetriä. Jokaisen muutoksen vaikutukset arvioidaan yksinkertaisesti keskusten asiakasmäärissä tapahtuvina muutoksina. Lukuja täytyy tulkita esimerkinomaisina, sillä keskusta- ja kaupan alueiden erikoiskauppaa kuvaavat lukemat ovat vain suuntaa-antavia arvioita todellisuudesta. Skenaariossa myös oletetaan että väestön muutosta ei tapahdu ja liikenneverkko pysyy muuttumattomana sekä muut keskustat ja kaupan alueet eivät muutu.

Kuva 4. Vaiheet prosessikaaviona.

(17)

Sovellettava malli ja skenaario

Mallin yhteenveto _R2 _RMSE _SRMSE Korrelaatio

(Pearson)

Malli 4 0,592 0,1187 0,9185 0,764

Mallin parametrit ja muuttujat _Parametri B (parametrin estimaatti)

B luottamusväli

(95%) R²muutos

Malli 4

Linnuntie-etäisyys -1,298 -1,382; -1,214 0,291

Erikoiskaupan toimi- ja työpaikkarakennusten

kerrosala γ 0,564 0,523; 0,606 0,301

Kuva 4. Toteutettu hypoteettinen skenaario ja lähimmät muut keskusta- ja kaupan alueet.

Tulokset

Mallilla laskettujen todennäköisyyksien perusteella ruuduissa asuva väestö jaettiin asiointikohteiden kesken. Luku kuvaa karkeasti keskuksen vaikutusalueen väestömäärää. Vaikutusalueen väestömäärä muunnettiin laskennallisiksi asiointikerroiksi olettamalla että jokainen asukas asioi erikoiskaupassa keskimäärin noin 13 kertaa vuodessa. Luku on laskettu SVT-aineiston pohjalta arvioitujen erikoiskaupan tuoteryhmien keskiarvona. Kuvat 5 ja 6 on esittävät 10 suurinta absoluuttista ja suhteellista muutosta laskennallisissa asiointimäärissä.

(18)

Kuva 5. Absoluuttiset muutokset laskennallisissa asiakasmäärissä (10 suurinta muutosta).

Kuva 6. Suhteellinen muutos laskennallisissa asiakasmäärissä (10 suurinta muutosta)

Asiointimäärien absoluuttisella muutoksella mitattuna Tampereen keskusta kärsii eniten. Tämä oli odotettavissa, sillä Tampereen keskustan vaikutusalue on laajin ja asiointimäärät suuria. Suhteellisesti mitattuna vaikutukset ovat kuitenkin suurimpia Kangasalan keskuksissa, jotka ovat toteutettua

skenaariota lähimpänä. Vaikutusalueiden tarkastelu osoittaa, että todennäköisyys asioida Ilkossa kasvaa lähes koko alueella (kuvat 7 ja 8), kaukana tarkastelualueen reunoilla tai hyvin lähellä muita suuria keskuksia kuitenkin hyvin marginaalisesti. Selkeimmin Ilkon vaikutusalue voimistuu idän suunnassa.

(19)

Kokonaisuudessaan todennäköisyydet jäävät melko alhaisiksi, sillä mallilla muodostetut keskusten vaikutusalueet ovat hyvin päällekkäisiä ja asiointi hajautuu useaan keskukseen. Toisaalta tämä kuvaa Tampereen kaupunkiseudun monipuolista tarjontaa, kun ydinkeskustan ulkopuolisia keskuksia on paljon.

Kuva 7. Kangasalan Ilkon nykytilanteen mallinnetut asiointitodennäköisyydet linnuntie-etäisyydellä.

(20)

Kuva 8. Kangasalan Ilkon skenaarion mallinnetut asiointitodennäköisyydet linnuntie-etäisyydellä.

Kuva 9. Postinumeroalueilta Kangasalan Ilkkoon suuntautuvan erikoiskaupan asiointiosuudet.

(21)

Kuva 10. Postinumeroalueille mallinnetut asiointitodennäköisyydet Kangasalan Ilkkoon.

Kun verrataan mallinnettuja todennäköisyyksiä ja havaittuja asiointiosuuksia postinumerotasolla, huomataan että malli aliarvio todennäköisyyksiä suhteessa asiointiosuuksiin erityisesti hieman kauempana idässä. Lähialueilla tulokset ovat parempia.

Tulosten tulkintaa

Ensisilmäyksellä mallinnettuja vaikutuksia lähimpiin keskuksiin kuvaavat luvut vaikuttavat pieniltä, kun kyseessä on kuitenkin 60 000 kerrosneliömetrin kaupan alueen laajennus. Mallin tuottamien tulosten soveltaminen vaatii kuitenkin, että sen toimivuus ja puutteet ymmärretään, jolloin ne voidaan ottaa tulosten tulkinnassa ja soveltamisessa huomioon. Edellä kuvatuissa tuloksissa täytyy esimerkiksi ottaa seuraavat puutteet ja mallin ominaisuudet huomioon.

1. Toteutettu yksinkertainen skenaario ei huomioi muun muassa väestönkasvua ja muilla keskusta- ja kaupan alueilla tapahtuvia muutoksia, jotka mahdollisesti kompensoivat tai kasvattavat

vaikutuksia.

2. Toteutettu skenaario sijoittuu melko etäälle noin 5-7 kilometrin päähän muista keskuksista, jolloin vaikutuksen jakautuvat melko tasaisesti useiden keskusten välillä ottaen lisäksi huomioon

erikoiskaupan luonne. Tuotteita haetaan siitä keskuksesta, joka vastaa kuluttajan sen hetkisiä tarpeita, jolloin asiointi hajautuu useampaan keskukseen. Tämä tulee mallin tuloksissa esiin siinä, että keskusten vaikutusalueet ovat hyvin päällekkäisiä ja laajoja.

(22)

3. Mallissa on käytetty vetovoimamuuttujana kaikkien niiden rakennusten kerrosalaa, jotka sisältävät erikoiskaupan toimipaikkoja ja työpaikkoja. Käytetty muuttuja kuvaa vain karkeasti erikoiskaupan todellista määrää keskuksissa ja positiivisesti vääristää erityisesti sellaisten keskusten erikoiskauppaa kuvaavia lukuja ja täten myös laskennallisia asiakasmääriä, joissa toimipaikat ovat jakautuneet useisiin rakennuksiin ja joita pääasiallisesti käytetään muuhun kuin kauppaan.

4. Kuten mallin kalibroinnissa kävi ilmi, kuvaa käytetty yleispiirteinen malli postinumerotasolla tilastollisesti noin 50-60% kuluttajien käyttäytymisestä. Vaikutusten näkökulmasta tämä voidaan karkeasti tulkita niin, että malli kuvaa noin puolet potentiaalisista vaikutuksista, kun kuluttajat muuttavat asiointikäyttäytymistään. Malli toimii siis vaikutusten arvioinnin tukena ja loput

vaikutuksista selvitetään muilla keinoin. Mallin tuottamia laskennallisia asiakasmäärämuutoksia voidaan muilla arvioilla muuttaa suuntaan tai toiseen. Vaikutukset Kangasalan suuntaan ovat todennäköisesti suurempia, jos alueen laajennus sisältää esimerkiksi vetovoimaisia

hypermarketteja.

5. Kuvista 10 ja 11 havaittiin myös, että malli aliarvioi Ilkon vetovoimaa erityisesti kauempana idässä, jolloin vaikutukset erityisesti Kangasalan keskustaan voivat olla todellisuudessa suurempia. Empiirisen aineiston tulkinnassa täytyy kuitenkin myös olla varovainen.

Kirjallisuus

Knudsen, D. C. & A.S. Fotheringham (1986). Matrix Comparison, Goodness-of-Fit, and Spatial Interaction Modeling. International Regional Science Review, Vol. 10

No. 2, s. 127–147.

Nakanishi, M. & L.G. Cooper (1974). Parameter Estimation for a Multiplicative Interaction Model – Least Squares Approach. Journal of Marketing Research Vol. XI,

s. 303–311.

Rehunen, A., Helminen, V., Kosonen, P., Viinikka, A. & H. Käyhkö (2014). Keskustaalueet ja vähittäiskauppa kaupunkiseuduilla. Ympäristöministeriön raportteja.

126 s. Ympäristöministeriö, Helsinki.

Nakanishi, M. & L.G. Cooper (1982). Simplified estimation procedures for MCI models.

Marketing Science Vol. 1 No. 3, s. 314–322.

Nurmio, K. (2014). Vetovoimamalli kaupan palveluverkon suunnittelussa ja vaikutusten arvioinnissa. Pro gradu tutkielma, aluetiede. 105 s. Helsingin yliopisto, geotieteiden ja maantieteen laitos.

(23)

Liite 1. Tutkimuksessa käytetyt vetovoimamuuttujat ja niiden kuvaukset.

Muuttuja Kuvaus Tietolähde Vuosi

Kerrosala yhteensä Rakennusten kerrosala, joissa kauppaa

Tilastokeskuksen

toimipaikkarekisteri & RHR

2011 Kaupan kerrosala Rakennusten kerrosala, joiden

pääkäyttötarkoitus on kauppa

Tilastokeskuksen

2011 TIVA-kaupan kerrosala Rakennusten kerrosala, joiden

pääkäyttötarkoitus on tiva- kauppa

Tilastokeskuksen

2011

Tavaratalokaupan kerrosala Rakennusten kerrosala, joiden pääkäyttötarkoitus on tavaratalokauppa

Tilastokeskuksen

2011

Erikoiskaupan kerrosala Rakennusten kerrosala, joiden pääkäyttötarkoitus on erikoiskauppa

Tilastokeskuksen

2011

Erikoiskaupan rakennusten kerrosala

Rakennusten kerrosala, joissa erikoiskaupan toimipaikkoja ja työpaikkoja

Tilastokeskuksen

2011

Kaupan työpaikat yhteensä Kaupan työpaikkojen määrä (osin arvio)

Tilastokeskuksen toimipaikkarekisteri

2011 Erikoiskaupan työpaikat

yhteensä

Erikoiskaupan työpaikkojen määrä (osin arvio)

2011 Päivittäistavarakaupan

työpaikat yhteensä

Päivittäistavarakaupan työpaikkojen määrä (osin arvio)

2011 Tilaa vaativan kaupan työpaikat

yhteensä

Tilaa vaativan kaupan

työpaikkojen määrä (osin arvio)

2011

Tavaratalokaupan työpaikat yhteensä

Tavaratalokaupan työpaikkojen määrä (osin arvio)

2011

Toimipaikat yhteensä Kaikki kaupan toimipaikat yhteensä (auto ja

huoltamokauppa ei mukana)

2011

Erikoiskaupan toimipaikat yhteensä

Erikoiskaupan toimipaikkojen määrä

2011 Päivittäistavarakaupan

toimipaikat yhteensä

Päivittäistavarakaupan toimipaikkojen määrä

2011 Tilaa vaativan kaupan

toimipaikat yhteensä

Tilaa vaativan kaupan toimipaikkojen määrä

2011 Tavaratalokaupan toimipaikat

yhteensä

Tavaratalokaupan toimipaikkojen määrä

2011 Vähittäiskaupan toimipaikat

yhteensä

Vähittäiskaupan toimipaikkojen määrä

YKR, Kaupan toimipaikat 2010 Erikoiskaupan toimipaikat

yhteensä

Päivittäistavaroita myyvien kauppojen määrä, sisältää kioskit ja tavaratalot

YKR, Kaupan toimipaikat 2010

Päivittäistavarakaupan toimipaikat yhteensä

Erikoistavaroita myyvien kauppojen määrä, sisältää myös hypermarketit

YKR, Kaupan toimipaikat 2010

Tilaa vaativan kaupan toimipaikat yhteensä

Tilaa vaativia tavaroita myyvien kauppojen määrä

YKR, Kaupan toimipaikat 2010 Vähittäiskaupan työpaikat

yhteensä

Vähittäiskaupan työpaikkojen lukumäärä

YKR, Työpaikat 2009

Myymälärakennukset Myymälärakennuksiksi luokiteltavien rakennusten määrä

YKR, Rakennukset 2011

Myymälärakennusten kerrosala Myymälärakennuksiksi luokiteltavien rakennusten kerrosala

YKR, Rakennukset 2011

Päivittäistavarakaupan myyntipinta-ala

Päivittäistavaroiden myyntipinta- ala (rajattu pois 2012 aloittaneet)

AC Nielsen 2012

(24)

Päivittäistavarakauppojen pinta-ala

Päivittäistavarakauppojen kokonaismyyntipinta-ala (rajattu pois 2012 aloittaneet)

AC Nielsen 2012

Toimialojen määrä Erilaisten toimialojen määrä Tilastokeskuksen toimipaikkarekisteri

2011 Monipuolisuus indeksi (HHI) Herfindahlin indeksi, joka kuvaa

toimialarakenteen monipuolisuutta

2011

Työmatkojen määrä Postinumeroalueelta asiointikohteeseen suuntautuvien työmatkojen määrä yhteensä

YKR, Työssäkäynti 2010

Liite 2. Erikoiskaupan ja päivittäistavarakaupan kalibroinnin tuloksia

Jyväskylä (erikoiskauppa ET) _Parametri B (parametrin estimaatti)

B luottamusväli (95%)

R² muutos

Malli 1

Kaupan pääkäyttötarkoitus kerrosala γ 0,799 0,725; 0,873 0,437

Malli 2

Erikoiskaupan pääkäyttötarkoitus kerrosala γ 0,668 0,586; 0,750 0,339

Malli 3

Erikoiskaupan toimipaikkarakennusten kerrosala γ 0,53 0,474; 0,586 0,408

Malli 4

kerrosala γ 0,675 0,604; 0,746 0,401

Malli 5

Matka-aika etäisyys -1,568 -1,779; -1,356 0,226

Malli 6

Malli 7

Malli 8

kerrosala γ 0,693 0,619; 0,766 0,401

(25)

Jyväskylä (ET) R2 RMSE SRMSE Korrelaatio (Pearson)

Malli 1 0,675 0,1383 0,5749 0,809

Malli 2 0,588 0,1873 0,7345 0,69

Malli 3 0,626 0,1549 0,6436 0,759

Malli 4 0,642 0,1628 0,6478 0,746

Malli 5 0,662 0,1389 0,5771 0,807

Malli 6 0,554 0,1917 0,7517 0,675

Malli 7 0,6 0,1581 0,657 0,747

Malli 8 0,62 0,1676 0,667 0,732

Tampere (erikoiskauppa ET) Parametri B (parametrin estimaatti) B luottamusväli (95%) R²muutos

Malli 1

Malli 2

Malli 3

Malli 4

kerrosala γ 0,564 0,523; 0,606 0,301

Malli 5

Malli 6

Malli 7

Malli 8

kerrosala γ 0,601 0,560; 0,642 0,335

(26)

Tampere (ET) R2 RMSE SRMSE Korrelaatio (Pearson)

Malli 1^a 0,563 0,1128 0,8762 0,765

Malli 2^b 0,55 0,1359 0,9548 0,738

Malli 3^c 0,587 0,1195 0,9248 0,761

Malli 4^c 0,592 0,1187 0,9185 0,764

Malli 5^c 0,569 0,114 0,8859 0,761

Malli 6^c 0,552 0,1376 0,9656 0,729

Malli 7^c 0,594 0,1172 0,9072 0,769

Malli 8^c 0,599 0,1162 0,8994 0,772

Jyväskylä (päivittäistavarakauppa PT) Parametri B (parametrin estimaatti) Luottamusväli (95%) R²muutos

Malli 1

PT-kauppojen kokonaisala γ 0,596 0,473; 0,719 0,199

Malli 2

Pt-kaupan myyntipinta-ala γ 0,97 0,800; 1,140 0,243

Malli 3

Malli 4

Jyväskylä (PT) R2 RMSE SRMSE Korrelaatio (Pearson)

Malli 1^a 0,61 0,183 0,5372 0,808

Malli 2^b 0,655 0,1711 0,5024 0,834

Malli 3^c 0,527 0,1887 0,5538 0,793

Malli 4^c 0,575 0,1745 0,5121 0,826

(27)

Tampere (päivittäistavarakauppa PT) Parametri B (parametrin estimaatti) Luottamusväli (95%) R²muutos

Malli 1

Malli 2

Malli 3

Malli 4

Tampere (PT) R2 RMSE SRMSE Korrelaatio (Pearson)

Malli 1^a 0,645 0,1379 0,5782 0,875

Malli 2^b 0,632 0,1427 0,5981 0,866

Malli 3^c 0,645 0,1262 0,5289 0,897

Malli 4^c 0,632 0,1324 0,5552 0,886