• Ei tuloksia

Aikasarjan ARIMA-mallipohjaisesta kausitasoituksesta

N/A
N/A
Info
Lataa
Protected

Academic year: 2022

Jaa "Aikasarjan ARIMA-mallipohjaisesta kausitasoituksesta"

Copied!
15
0
0

Kokoteksti

(1)

Aikasarjan ARIMA -mallipohjaisesta kausitasoituksesta

Arto Kokkinen* Tutkija, Helsingin yliopisto;

Talous- ja sosiaalihistoria Yliaktuaari, Tilastokeskus

Faiz Alsuhail*♣♣

valtiot. yo Helsingin yliopisto

* Artikkelissa esitetyt näkemykset ovat kirjoittajien omia, eivätkä välttämättä vastaa Tilastokeskuksen tai Helsingin yliopiston virallista kantaa. Kirjoittajat kiittävät Tilastokes- kusta empiirisen osan aineistosta.

Arto Kokkinen kiittää Yrjö Jahnssonin säätiön rahoit- tamaa, prof. Riitta Hjerppen johtamaa Suomen talouden konvergenssi 1945-2000 -tutkimushanketta taloudellisesta tuesta.

♣♣ Faiz Alsuhail työskenteli kesällä 2005 Tilastokeskukses- sa harjoittelijana.

1 Tilastokeskuksessa käytettiin aiemmin X11-ARIMA ja X12-ARIMA -menetelmiä.

1. Johdanto

T

ilastokeskus siirtyy vuoden 2005 loppuun mennessä käyttämään suhdanneaikasarjojen kau- sitasoituksissa ARIMA-mallipohjaista TRAMO/

SEATS -menetelmää.1 Osassa tutkijoiden käyt- tämistä aineistoista (mm. kansantalouden tilin- pidon suhdannetiedoissa) siirryttiin tähän me- netelmään jo vuonna 2004.

Vuotta tiheämmin havaintoja sisältävissä taloudellisissa suhdanneaikasarjoissa esiintyy

usein voimakasta vuoden sisäisille havaintojak- soille tyypillistä vaihtelua. Tätä vaihtelua kut- sutaan kausivaihteluksi. Asia voidaan hahmot- taa esimerkiksi tarkastelemalla kuvaa 1, jossa eri neljännesten vientivolyymit poikkeavat sys- temaattisesti toisistaan. Tavaraviennin volyy- min alkuperäisen sarjan havainnoista voidaan laskea muutos vuoden takaisesta vastaavan kauden havainnosta, mutta vertaus edelliseen havaintoon ei tuota järkevää tulosta. Vuoden takaisen muutoksen lisäksi vertaus edelliseen havaintoon olisi myös toivottavaa, sillä sen pe- rusteella havaitaan käännepisteet tarkastelta- vassa muuttujassa. Jotta tähän päästäisiin, ai- kasarja on jaettava komponentteihin ja vuoden sisäinen kausivaihtelu tasoitettava.

Taloudelliset aikasarjat esitetään usein jaet- tavaksi neljään eri komponenttiin, joilla on seu- raavanlaiset määritelmät. Trendi kuvaa ilmiön rakenteellisista syistä johtuvaa hidasta ja pitkä- aikaista muutosta. Suhdannesyklillä (business

(2)

cycle) taas viitataan vaihteluun, joka johtuu esi- merkiksi taloudellisista suhdanteista. Kyseessä on keskipitkän aikavälin vaihtelu. Koska tren- din ja suhdannesyklin erottaminen toisistaan yksikäsitteisellä ja selkeällä tavalla on hankalaa, komponentit estimoidaan yleensä yhdessä. Kir- jallisuudessa puhutaan tällöin trendisyklistä (trendcycle), jolla tarkoitetaan juuri näiden kahden komponentin yhteisvaikutusta. Jatkos- sa, kun puhumme trendistä, tarkoitamme ni- menomaan trendisykliä.

Kausivaihtelun ajatellaan olevan vuosittais- ta ja jokseenkin säännöllistä vaihtelua trendin ympärillä. Syinä kausivaihtelun esiintymiseen ovat esimerkiksi vuodenajan vaihtelun tai eri tuotteille otollisten vuoden sisäisten myynti- kausien tuomat muutokset tarkasteltavassa il- miössä. Aikasarjan neljännen komponentin eli epäsäännöllisen vaihtelun oletetaan olevan val- koista kohinaa, joka ei sisällä aikasarjan ana- lyysin kannalta hyödyllistä tietoa.

Suhdanneaikasarjojen kausitasoituksissa on havaittavissa kaksi pääsuuntausta: mallipohjai- set menetelmät ja ad hoc -suotimiin perustu- vat menetelmät. Ad hoc -lähestymistavan me- netelmissä aikasarjat tasoitetaan kiinteällä suo- dinkaavalla. Sofistikoituja liukuvia keskiarvo- ja käyttävät X11–X12 -perheen menetelmät ovat esimerkkejä ad hoc -suotimista. Muina esimerkkeinä käyvät mm. Dainties, Sabl ja BV4. Mallipohjaisista menetelmistä mainitta- koon TRAMO/SEATS:n lisäksi aikasarjara- kenneyhtälömalleihin pohjautuva STAMP.

Tässä kirjoituksessa tarkastelemme ARIMA- mallipohjaisen TRAMO/SEATS-menetelmän perusominaisuuksia

ARIMA-mallipohjaisen kausitasoituksen lähtökohtana on mallintaa ensin havaintosarjan vaihtelu ARIMA-mallin avulla. Saatua ARIMA- mallia käytetään hyväksi, kun aikasarjan vaih-

telu jaetaan trendiin, kausikomponenttiin ja epäsäännöllisen vaihtelun komponenttiin.

Komponentteihin jako tehdään siten, että saa- dut komponentit ovat esitettävissä ARIMA- malleina.

Merkittävimpänä erona ad hoc -lähestymis- tapaan on, että TRAMO/SEATS:ssa kullekin aikasarjalle muodostetaan oma, sarjakohtainen suodinkaava, jolla aineisto tasoitetaan. Mene- telmä sisältää myös tehokkaan tavan tehdä työ- ja kauppapäiväkorjauksia ja tunnistaa poikkea- via havaintoja. TRAMO/SEATS antaa myös mahdollisuuden ennusteiden, keskivirheiden ja luottamusvälien muodostamiseen.

Kausitasoitusmenetelmiä ryhdyttiin käyttä- mään taloutta kuvaavien suhdanneaikasarjojen analysoinnissa 1920-luvulla. Tietokoneiden yleistyminen mahdollisti suurten aikasarja-ai- neistojen kausitasoitusmenetelmien kehityksen 1950- ja 60-luvuilla Niin sanottu X-11-mene- telmä otettiin käyttöön USA:ssa v. 1965. Tä- män menetelmän yksi versio otettiin Suomes- sa käyttöön 1960-luvun lopussa, ja sitä käytet- tiin Tilastokeskuksessa aina vuoteen 1994 saak- ka. Tällöin siirryttiin siitä muunnettuun X11- ARIMA -menetelmän soveltamiseen (Öller ja Nyblom 2002). Oleellisin pääuudistus oli ARIMA-mallien avulla tuotettujen lisähavain- tojen luominen sarjan loppupäähän viimeisten tasoitettujen havaintojen revisoitumisen vähen- tämiseksi.

Suurimman uskottavuuden menetelmällä estimoitujen aikasarjamallien muuntaminen ta- soitussuotimiksi keksittiin 1980-luvun alku- vuosina (Bell, Burman, Hillmer ja Tiao). Bank of England otti ensimmäisenä ARIMA-mallei- hin pohjautuvan tasoitusohjelman käyttöön vuonna 1982. Nykyinen tämän koulukunnan tunnetuin suurten aikasarjajoukkojen kausita- soituksissa käytetty menetelmä TRAMO/

(3)

SEATS pohjautuu tähän ohjelmaan (Öller ja Nyblom 2002). Ohjelman ja menetelmän ny- kymuotoon saattajia ovat olleet Maravall ja Gomez (ks. esim. Maravall ja Gomez 1996).

Kausitasoituksessa puututaan alkuperäisen sarjan auto- korrelaatiorakenteeseen

Kausikomponentti vaikeuttaa ihmisen kykyä havaita suhdanneaikasarjan käännepisteet suh- teessa edelliseen havaintoon. Myös pidemmän ajan kehityksen suunta ja muodot ovat vaikeas- ti hahmotettavissa alkuperäisestä havaintosar- jasta. Kausivaihtelu mielletäänkin usein vuot- ta tiheämmin havaintoja sisältävässä aikasarjas- sa kiusankappaleeksi, jolla ei ole paljoakaan tekemistä pidemmän ajan kehityskuvan kans- sa. Tästä ei pidä tehdä sellaista johtopäätöstä, että kausivaihtelu olisi vakioista ja determinis- tistä, ja että sen mallintaminen ja tasoittaminen olisi vain triviaali pikkuseikka suurempien asioiden tiellä (ks. myös Takala 1994, 69–71).

Aina kun aikasarjaa kausitasoitetaan, puu- tutaan alkuperäisen aikasarjan autokorrelaatio- rakenteeseen. Mikäli käytettävä suodin (olipa se sitten yleinen ad hoc -suodin tai väärään malliin pohjautuva) ei tartu vain ja ainoastaan aikasarjan kausivaihtelutaajuuksiin tai trendiä estimoitaessa trendin taajuuksiin, vääristetään alkuperäisen aikasarjan autokorrelaatioraken- ne vieraaksi alkuperäisen ilmiön ajassa toistu- ville ominaisuuksille. Tämän vuoksi suhdanne- aikasarjan tasoittamiseen ensin esimerkiksi kiinteällä suotimella, ja näin saadun kausitasoi- tetun tai trendisarjan dynaamiseen mallintami- seen on syytä suhtautua varauksellisesti (ks.

myös Rahiala 1994, 107, 126).

ARIMA-mallipohjainen kausitasoitus ja TRAMO/SEATS-menetelmä tarjoavat tähän

ongelmaan yhden analyyttisen ratkaisun. Alku- peräinen sarja esipuhdistetaan muun muassa poikkeavista havainnoista ja työ- tai kauppa- päivien lukumäärien vaihteluista siten, että esi- käsitelty sarja voidaan ARIMA-mallintaa. Tätä koko esikäsitellyn sarjan autokorrelaatioraken- teen mallinnusta käytetään hyväksi, kun aika- sarjan eri taajuusalueiden vaihtelu jaetaan kom- ponentteihin. Dekomponointi toteutetaan si- ten, että kukin komponentti kuvaa vain juuri siihen komponenttiin liittyvää osaa koko sar- jan autokorrelaatiorakenteesta ja vaihtelusta, eli komponentit ovat keskenään ortogonaalisia.

Sekä esikäsitelty sarja että sen komponentit ovat ARIMA-mallinnettu samalla kertaa kun- nioittaen alkuperäisen sarjan dynaamisia, ajas- sa toistuvia ominaisuuksia. Luotettavan histo- ria-analyysin lisäksi tämä mahdollistaa muun muassa koko aikasarjan2 ja sen komponenttien yhtäaikaisen ennustamisen käyttäen hyväksi kullekin komponentille konstruoituja keskivir- heitä ja luottamusvälejä.

Yksikäsitteisen hajotelman ratkaisu

Koska mainitut komponentit ovat alun perin havaitsemattomia (ks. kuvio 1), ne voidaan muodostaa lukuisilla eri tavoilla. Jaettaessa ha- vaintosarjaa komponentteihin törmätään myös

2 Aikasarjan komponentit muodostetaan esipuhdistetusta aikasarjasta. Lopuksi havaintosarjan puhdistuksessa poiste- tut tekijät yhdistetään muodostettuihin komponentteihin.

Tasomuutokset liitetään mukaan trendiin ja muut poikkea- vat havainnot aikasarjan epäsäännölliseen osaan. Determi- nistiset työ- ja kauppapäiväkorjaustekijät liitetään osaksi kausivaihtelukomponenttia. Lopulta koko alkuperäisen ai- kasarjan vaihtelu on jaettu komponentteihin ja kaikkia sys- temaattisen vaihtelun tekijöitä voidaan ennustaa samanai- kaisesti.

(4)

ARIMA-mallipohjaisessa lähestymistavassa identifioituvuusongelmaan. TRAMO/SEATS- menetelmässä aikasarjan dekomponoinnissa haetaan ratkaisu, jossa epäsäännöllisen kompo- nentin varianssi maksimoituu. Tätä ratkaisua kutsutaan kanoniseksi dekompositioksi ja se tuottaa aikasarjalle yksikäsitteisen hajotelman.

Vuoden aikana laskettujen kausivaihtelu- termien summan tulisi olla likimain nolla.

Trendi taas mielletään deterministiseksi pitkän aikavälin kehitykseksi, jota voidaan kuvata en- simmäisen asteen yhtälöllä, jolloin trendin kak- sinkertainen differensointi tuottaa vakioisen nollasarjan.

Käytännössä kuitenkin ajatellaan, että vuo- den sisäisten kausivaihtelutermien summa ja kahdesti differensoitu trendi noudattavat sto- kastisia prosesseja, joiden odotusarvo on nolla

(Maravall 2004). Nämä prosessit voivat olla sel- laisia, että poikkeamat odotusarvosta korreloi- vat keskenään (Planas 1997).

TRAMO/SEATS:ssa on lähtökohtana, että aikasarjan komponentit ovat keskenään orto- gonaalisia. Tulkinnallisesti tämä tarkoittaa, että syyt, jotka aiheuttavat aineiston kausivaihtelua (kuten vuodenaika) ovat riippumattomia ai- neiston pitkän aikavälin trendin takana olevis- ta syistä (investoinnit, tutkimus- ja kehitystoi- minta). Lisäksi oletetaan, että aikasarja koos- tuu komponenteista, jotka ovat lineaaristen stokastisten prosessien realisaatioita. Tällöin kutakin komponenttia (epäsäännöllistä termiä lukuun ottamatta) voidaan kuvata ARIMA- mallilla.

Kuvio 1. Tavaroiden viennin volyymi, alkuperäinen sarja.

(5)

2. Kaksivaiheinen TRAMO/

SEATS-menetelmä

TRAMO/SEATS-menetelmä voidaan ymmär- tää kaksivaiheisena menetelmänä, jossa ensim- mäisessä vaiheessa (TRAMO) muodostetaan havaitun sarjan ARIMA-esitys. Tätä ennen poistetaan havaintojaksojen pituuseroista joh- tuva deterministinen vaihtelu (työ/kauppapäi- väkorjaus) sekä poikkeavat havainnot siten, että ARIMA-mallinnus onnistuu paremmin.

Tasoituksen toisessa vaiheessa (SEATS) saatu ARIMA-malli jaetaan haluttuihin komponent- teihin.

TRAMO (Time series Regression with ARIMA noise, Missing values and Outliers) vai- heessa luodaan malli, jossa on sekä regressio- että ARIMA-osa. Mallin regressio-osan tarkoi- tuksena on esipuhdistaa aineistoa ennen ARIMA- sovitusta. Tällä tarkoitetaan työ/kauppapäivä- tekijöistä johtuvien kalenterivaikutusten pois- tamista sekä poikkeavien äärihavaintojen etsi- mistä ja korjaamista. Lisäksi puuttuvia havain- toja interpoloidaan. Esipuhdistetun aineiston ARIMA-sovite jaetaan myöhemmin trendiin ja kausivaihteluun. Sovitteen ulkopuolelle jäävä osa on epäsäännöllistä vaihtelua.

SEATS (Signal Extraction in ARIMA Time Series) pyrkii erottamaan signaalin, eli kausi- vaihteluista puhdistetun aikasarjan, TRAMO:n muodostamasta ARIMA-prosessista. Aikasarja pyritään SEATS:n avulla jakamaan trendiin, kausivaihteluun sekä epäsäännöllisen vaihtelun komponenttiin, joka on valkoista kohinaa. Mi- käli aikasarjassa esiintyy säännöllisyyttä, jota ei spektrianalyysin perusteella voida liittää tren- diin tai kausivaihteluun, otetaan käyttöön nel- jäs komponentti, jota kutsutaan hetkellisen vaihtelun komponentiksi. Kyseessä on apukom- ponentti, jonka tarkoituksena on vangita aika-

sarjan vaihtelu, joka ei kuulu trendiä tai kausi- vaihtelua kuvaavaan osaan. Kaikilla kompo- nenteilla (pl. epäsäännöllinen osa) on ARIMA- muotoinen esitys. Aggregoimalla SEATS:n muodostamat komponentit päästään TRAMO:n antamaan esipuhdistettua aineistoa kuvaavaan ARIMA-esitykseen. Siis

zt = pt + st + ct + ut , (2.1) jossa zt on esipuhdistetun aikasarjan havainto, pt on trendi, st kausivaihtelu, ct (mahdollinen) hetkellisen vaihtelun komponentti ja ut epä- säännöllisen vaihtelun komponentti.3

Signaalin erottaminen puhdistetusta aika- sarjasta perustuu ajatukseen, jossa aikasarjan havainnot voidaan esittää signaalin mt ja sen ulkopuolisen kohinan nt summana. Tavoittee- na on muodostaa sekä signaalille, että sen ul- kopuoliselle osalle ARIMA-muotoiset mallit.

Signaalilla tarkoitamme kausipuhdistettua ai- kasarjaa, joka on muotoa mt= pt(+ ct) + ut. Kun kyseessä on tilanne, jossa aikasarja halutaan ja- kaa kahteen komponenttiin, voidaan käyttää Wiener-Kolmogorov -suodinta. Esimerkki täl- laisesta tilanteesta on juuri signaalin erottami- nen aikasarjan muusta osasta (Box Hillmer ja Tiao 1978).

Jotta Wiener-Kolmogorov -suodinta olisi mahdollista käyttää TRAMO/SEATS-tasoitus- menetelmän yhteydessä, jossa aikasarja pyri- tään jakamaan useisiin komponentteihin, muo- dostetaan kullekin komponentille oma W–K -suodin, jota käytetään kyseistä komponenttia erotettaessa. Signaali-kohina- hajotelma teh- dään siis useaan kertaan eri komponentteja muodostettaessa.

3 Lopuksi esipuhdistuksessa irrotetut tekijät liitetään myös komponentteihin. Ks. edellinen alaviite.

(6)

Signaalin ja muiden aikasarjan osien (keskine- liövirheen mielessä) optimaaliset ennusteet ovat näiden komponenttien ehdolliset odotus- arvot. Tällöin kukin aikasarjan komponentti on voitava esittää ARIMA-mallina, jossa virheter- mit noudattavat normaalijakaumaa. Tällöin myös signaalin ja esipuhdistetun aikasarjan ha- vaintojen (z1, z2,…,zT) yhteisjakauma on multi- normaalinen ja signaalin mt optimaalinen esti- maatti on aikasarjahavainnoista koostuva lineaa- rikombinaatio

E(mt| z1, z2,…,zT) =α1z1+α2z2+ … +αTzT (2.2) (Kaiser ja Maravall 2000).

Kun käytössä on äärettömän pitkä aika- sarja, on White (1963) osoittanut, että yllä ole- van lineaarikombinaation kertoimet voidaan laskea Wiener-Kolmogorov -suotimen avulla.

Formaalisti suodin määritellään signaalin mt ja aikasarjan (esipuhdistettujen) havaintojen au- tokovariansseja generoivien funktioiden osa- määränä

(2.3)

josta sieventämällä saadaan (ks. yksityiskohdat Planas 1997, Hillmer ja Tiao 1982)

(2.4)

Kaavassa esiintyvä B on viiveoperaattori ja F sen käänteisoperaattori. Signaalin ja havain- tosarjan virhetermien varianssien suhdetta Vm/ Va merkitään km:lla. Osamäärälausekkeen po- lynomit ovat puolestaan havaintosarjan, signaa- lin ja sen ulkopuolisen osan ARIMA-esityksis- tä,

(2.5)

Suotimen kaavassa (2.4) esiintyy signaalin ulkopuolelle jäävän nt:n AR-polynomin osia, jotka saadaan selville (esikäsitellyn) havainto- sarjan spektrin avulla. Tässä tulee muistaa, että havaintosarjalle muodostetun ARIMA-mallin AR-polynomi voidaan jakaa tulomuotoon φ(B)

= φm(B)φn(B). Kukin AR-polynomin juuri nä- kyy havaintosarjan spektrikuvaajan huippuna.

Tutkimalla huippujen esiintymistaajuuksia, voidaan juuret jakaa esimerkiksi trendi- ja kau- sijuuriin. Jälkimmäisten avulla saadaan selville signaalin ulkopuolisen osan AR-polynomin ra- kenne. Tämän jälkeen myös yhtälön MA-osat ovat selvitettävissä (Maravall 2004).

Edellä mainittu suodinkaava muodostaa kuitenkin äärettömän määrän kertoimia ehdol- lisen odotusarvon lineaarikombinaatioon. Käy- tännössä suotimen υ(B,F) antamien termien lukumäärää rajoitetaan. Koska Wiener-Kolmo- gorov -filtteri antaa tarkentuvia estimaatteja, on turvallista ajatella, että signaalin oleellisin dynamiikka tiivistyy äärelliseen määrään aika- sarjahavaintoja (Kaiser ja Maravall 2000).

Tämä oletus on tärkeä jo sen vuoksi, että usein tarkasteltavien aikasarjojen pituus on rajalli- nen. Jos signaalille saatu esitysmuoto katkais- taan L:n periodin jälkeen, on signaalin esti- maattorin esitysmuoto

(2.6) jossa havainnot zt voidaan korvata niiden en- nusteilla, mikäli signaalin estimointiin tarvitaan termejä, jotka ovat havaintohorisontin ulko- puolella. Näiden ennusteiden muodostamises-

(7)

sa käytetään TRAMO-vaiheessa muodostettua havaintosarjan ARIMA-esitystä sekä Burman- Wilson algoritmia (Burman 1980).

Signaalin estimointi on luonnollisesti sitä tarkempaa, mitä parempia ennusteita aikasar- jan tuleville ja menneille havainnoille saadaan.

Jos havaintoja ei tarvitse korvata niiden ennus- teilla, on signaalin estimointi Wiener-Kolmo- gorov -suotimella tarkkaa. Tämä pätee erityi- sesti aikasarjan keskimmäisille havainnoille.

3. Empiirinen sovellus: tavaroiden viennin volyymin ARIMA- mallipohjainen jako

komponentteihin

Seuraavassa tarkastellaan kansantalouden nel- jännesvuositilinpidon mukaisen tavaroiden viennin volyymin (mrd. € vuoden 2000 hin- noin) kausitasoitusta ja komponentteihin jakoa TRAMO/SEATS-menetelmällä.

Kuviosta 1 havaitaan (kausivaihtelun lisäk- si) tavaraviennin varianssin kasvavan ajan ku- luessa. Tämä viittaa multiplikatiiviseen kompo- nenttien suhteeseen (zt = pt * st * ut). Logarit- moimalla alkuperäinen sarja päästään kaavan (2.1) summamuotoiseen esitystapaan (log zt = log pt + log st + log ut).

Alkuperäisen sarjan mallinnus onnistuu täs- sä tapauksessa logaritmointia lukuun ottamat- ta ilman muita esipuhdistustoimenpiteitä (työ/

kauppapäiväkorjaus, outlier-käsittely jne). Mal- linnus ja dekomponointi on toteutettu Euro- statin nettisivuilta löytyvällä DEMETRA-käyt- töliittymällä.4 Esimerkkimme tapauksessa vali-

taan malli5 (0,1,1) x (0,1,1)4 joka saa alhaisen BIC-kriteerin arvon, jäännökset (sekä neliöidyt jäännökset) ovat tilastollisten testien perusteel- la satunnaisia, jäännökset noudattavat normaa- lijakaumaa otoskeskiarvolla 0 ja pienellä vari- anssilla, ja malli on lisäksi vähäparametrinen (Box ja Jenkins 1976).Estimoitu malli jäännös- tarkasteluineen löytyy taulukosta 1.6

Aikaulottuvuuden lisäksi aikasarjaa voidaan tarkastella myös taajuusalueella, jolloin tutki- taan aikasarjan spektriä. Spektrianalyysissa ta- voitteena on usein määrittää, kuinka suuren

4 Vastaavasti voitaisiin käyttää esim. Tramo/Seats Win (TSW) -ohjelmaa, joka on niin ikään ladattavissa interne- tistä. Komponenttien mallit on saatu Demetran log-tiedos- tosta. (Vastaava log-tiedosto löytyy myös TSW:ssä, sillä De-

metra käyttää samaa ohjelmarunkoa kuin TSW – ainoa mer- kittävä ero lienee vain Demetrassa mukana olevat EU-mai- den kalenterit kalenterikorjauksien lomapäiväkorjauksia varten esipuhdistusosassa. Ohjelman tekijät päivittävät uusilla hienosäädöillä TSW:a useammin).

5 Mallinnuksessa voidaan käyttää apuna ohjelman auto- maattimallinnustyökalua, jonka mallinvalinta perustuu BIC-kriteerin minimointiin. Automaattimallinnuksessa es- timoidaan kaikki (3,2,3)x(1,1,1)4-mallia vähäparametrisem- mat mallit (mukaan lukien mainittu malli), ja valitaan pie- nimmän BIC-arvon saanut malli lisäehtona se, että malli on dekomponointia ajatellen hyväksyttävä. BIC-kriteeriä mini- moitaessa minimoidaan käytännössä mallin jäännösvarians- sia, mutta kriteeri rankaisee lisäparametrien käytöstä.

6 Mallivalinnan voi tehdä myös täysin itse käyttäen hyväk- si ohjelmasta tulostettavia autokorrelaatio- ja osittaisauto- korrelaatiofunktioita sekä AIC- ja BIC-informaatiokritee- reitä. Myös parametrit on määrättävissä itse. Yleensä ottaen ei ole tarkoituksenmukaista nojata vain automaattimallin- nukseen käsiteltävien aikasarjojen osalta, vaan automaatti- mallinnuksen ehdotusta (ml. sen ehdottamat esipuhdistus- tekijät) on pidettävä yhtenä mahdollisena vaihtoehtona ja kenties hyvänä lähtökohtana aikasarjan mallinnustarkaste- lussa. Muun muassa esipuhdistustekijöiden osalta on mal- lintajan käytettävä omaa harkintaa ja pohdittava myös ai- kasarjan sisältöä (haluttaessa esipuhdistukset voi myös kiel- tää). Malli ja valitut esipuhdistustekijät kiinnitetään esim.

kalenterivuodeksi (mallin parametrit voi estimoida aina uuden havainnon myötä uudestaan). Vuoden päästä mallin- valinta yleensä tarkistetaan.

(8)

osan eri taajuuksilla esiintyvät toistuvat syklit selittävät aikasarjan koko vaihtelusta. Suhdan- neaikasarjoja dekomponoitaessa spektritarkas- telua voidaan käyttää komponenttien identi- fioimiseen aikasarjan spektristä.

Spektrianalyysin avulla voidaan myös ar- vioida aikasarjan dekomponoinnin onnistu- mista. Mikäli vaihtelut eri taajuuksilla halu- taan mallintaa eri komponentteihin, estimoi- tujen komponenttien mallien spektritarkas- telusta nähdään, onko kuhunkin komponent- tiin onnistuttu mallintamaan vain juuri siihen yhdistettävä vaihtelu, erityisesti jos kompo- nenttien vaihtelun halutaan summautuvan esi- puhdistetun alkuperäisen sarjan koko vaihte- luun. 7

Taajuustarkastelu on esitettävissä myös pe- rioditarkasteluna, jolloin piikit kertovat kuin- ka monta periodia kyseinen vaihtelu vaatii käy- däkseen läpi kaikki vaiheensa eli koko syklin.

Kuviossa 2 on esitetty esipuhdistusvaiheen jäl- keisen, (TRAMO-osan tuloksen) tässä tapauk- sessa vain logaritmoidun, aikasarjan estimoi- tuun malliin (0,1,1) x (0,1,1)4 perustuva spektri periodeittain. Mikäli kyseessä olisi puhtaasti valkoisen kohinan sarja, spektrissä näkyisi vain vaakasuunnassa suora viiva ilman piikkejä. Lo- garitmoidun neljännesvuosittaisen tavaroiden viennin volyymin tapauksessa havaitaan piikit periodeilla 2 ja 4 sekä lähellä ääretöntä. Mal- lilla (0,1,1) x (0,1,1)4 (mukaan lukien valkoisen kohinan jäännös at) on mallinnettu koko ku- vion 2 spektrin vaihtelu.

Piikit periodeilla 2 ja 4 assosioituvat sarjas- sa esiintyvään vuoden sisäiseen kausivaihte- luun. Periodin 2 piikki tulkitaan siten, että ai- kasarjassa esiintyy syklinen vaihtelu, joka käy läpi oman vaihekiertonsa kahdessa periodissa (esim. neljännekset IV ja I muodostavat talvi- kuukaudet ja neljännekset II ja III kesäkuukau- det, toisaalta neljännekset I ja II muodostavat kevätkuukaudet ja III ja IV syksykuukaudet).

Piikki periodilla 4 tulkitaan sellaiseksi syklisek- si vaihteluksi, joka kestää neljä periodia kerral- laan (sama kausi toistuu kerran vuodessa, ky- Taulukko 1. Esipuhdistetun alkuperäisen sarjan malli ja jäännöstarkastelu.

7 Niin kutsuttua gain-funktiota ja sen neliötä voidaan myös käyttää suotimen toimivuuden arvioinnissa, ts. voidaan tar- kastella onko onnistuttu suodattamaan vain ao. komponen- tin taajuuksiin liittyvä vaihtelu (ks. Rahiala, 1994).

(9)

seessä siis kuhunkin neljännekseen assosioitu- va kausivaihtelu).

Piikki lähellä periodia ääretön kuvaa vaih- telua, joka vaatii oman vaihekiertonsa (syklin- sä) läpikäymiseen lähes äärettömän määrän pe- riodeja. Tällainen vaihekierto ei toistu lähes koskaan, joten sen sisältämä vaihtelu assosioi- tuu trendiin. Mitä lähempänä ääretöntä piikki on, sitä tasaisempi mallinnettu trendi on. Ku- viosta 2 voidaan havaita myös, ettei alkuperäi- sen logaritmoidun sarjan spektrin kuvaaja ole korkeussuunnassa alaosastaan aivan kiinni vaa- ka-akselissa. Ilman piikkejä alaosaan voidaan hahmottaa piirrettäväksi vaakasuora viiva kor- keussuunnassa hyvin lähelle vaaka-akselia. Tä- män alapuolinen alue kuvaa aikasarjassa esiin- tyvää valkoisen kohinan vaihtelua.

Jaettaessa esipuhdistetun alkuperäisen ARIMA- mallinnetun sarjan vaihtelua ARIMA-malleja noudattaviin komponentteihin SEATS:ssa, yk- sikäsitteiseen dekomponointiin päästään nou- dattamalla periaatetta, jonka mukaan mallin epäsäännöllisen komponentin varianssi maksi- moidaan ja muiden komponenttien pseudoin- novaatioiden (taulukon 2 apt ja ast) varianssit minimoidaan. Tätä kutsutaan kanoniseksi de- komponoinniksi. Kuviossa 2 tämä tarkoittaa sitä, että lähelle vaaka-akselia hahmottamam- me vaakasuoran viivan alapuolella oleva valkoi- sen kohinan vaihtelu imetään trendin ja kausi- komponentin mallien pseudoinnovaatioista minimiin ja siirretään epäsäännölliseen kompo- nenttiin.

Kuvioiden 3 ja 4 estimoitujen trendin ja

Kuvio 2. Logaritmoidun (esipuhdistetun) sarjan vaihtelu spektri-esityksenä perustuen estimoituun malliin (0,1,1) x (0,1,1)4.

(10)

Taulukko 2. Komponenttien sekä kausitasoitetun sarjan (SAt) ARIMA-mallit ja innovaatioiden keskihajonnat.

Kuvio 3. Estimoidun mallin trendisykli-komponentin spektri.

kausikomponentin spektreistä havaitaan näin tapahtuneen. Kuvioista havaitaan, että trendiin ja kausikomponenttiin on mallinnettu vain juu- ri ao. komponenttiin assosioituva vaihtelu ai-

kasarjan koko vaihtelusta. Trendin ja kausi- komponentin mallien avulla kummallekin voi- daan muodostaa oma optimaalinen suotimen- sa, jolla kyseinen komponentti voidaan suodat-

(11)

taa esikäsitellystä alkuperäisestä sarjasta.8 Komponenttien suotimet perustuvat esipuh- distetun alkuperäisen sarjan omaan autokova- rianssirakenteeseen. Kuviosta 5 nähdään, että aikasarjan muu vaihtelu muilla taajuuksilla on mallinnettu epäsäännöllisen vaihtelun kompo- nenttiin.

On huomattava, että spektrin piikkien ja esipuhdistetun alkuperäisen sarjan ARIMA-

mallin AR-polynomin epästationaaristen juur- ten välillä on yhteys. Mallin (0,1,1)x(0,1,1)4 epästationaarisen AR-osan viivepolynomi voi- daan jakaa seuraavasti:

(1–B)(1–B4) = (1–B)2(1 +B+B2+B3)

= (1–B)2S. (3.1)

Yleisesti ottaen aikasarjan spektritarkaste- lussa nähdään, että kerrottaessa aikasarja teki- jällä (1–B)2 (ts. differensoitaessa sarja kahdes- ti) poistetaan aikasarjan spektristä trendin pe- rustaajuudet eli piikki hyvin lähellä taajuutta nolla (tai periodia ääretön) poistuu. Vastaavasti kerrottaessa neljännesvuosiaikasarja tekijällä (1 +B+B2+B3) poistetaan spektristä perusta-

Kuvio 4. Estimoidun mallin kausikomponentin spektri (tämä komponentti näine taajuuksineen poistetaan kausitasoitetusta sarjasta).

8 Myös kausitasoitetulle sarjalle muodostetaan oma malli ja optimaalinen sarjakohtainen suodin vastaavasti. Kausitasoi- tetun sarjan estimaattorin spektri näyttää muutoin samalta kuin trendin spektri, mutta se sisältää kuvion 2 alaosaan jäävän valkoisen kohinan vaihtelun. Toisin sanoen sen spektri näyttää samalta kuin kuvion 2 alkuperäisen sarjan spektri, kun kausipiikit on poistettu.

(12)

vaa laatua olevat kausitajuudet (ja kausipiikit).

Tätä jälkimmäistä tekijää kutsutaan usein aggre- gointioperaattoriksi, ja sitä merkitään S:llä.

Mikäli vuosittaisen kausivaihtelun oletettai- siin olevan täysin determinististä ja summau- tuvan joka vuosi nollaksi, kausivaihtelu st ja sen taajuudet spektrissä voitaisiin poistaa täysin operaatiolla S siten, että Sst = 0. Vastaavasti mi- käli trendi ajateltaisiin täysin deterministisek- si, trendi (ja sen taajuudet spektrissä) voitaisiin poistaa kaksinkertaisella differensoinnilla ja operaatio (1–B)2 pt tuottaisi myös vakioisen nollasarjan.

TRAMO/SEATS lähtee kuitenkin siitä, että kausitekijöiden summa voi poiketa hieman nol- lasta, ja kausitekijä voi myös muuttua ajassa.

Siksi kausikomponentti mallinnetaan S:n sisäl-

tämien epästationaaristen AR-juurten lisäksi MA-juurilla (sekä mahdollisilla stationaarisilla AR-juurilla) ja hyvin pienivarianssisella inno- vaatiolla, siis Sst = θs(B)ast. Kausikomponentin malliksi saadaan usein ARIMA (3,0,3) -malli.

Täysin deterministinen trendisykli ei liene myöskään realistinen suhdannesarjojen analyy- sissä, ja näin ollen trendisyklille mallinnetaan epästationaaristen (ja mahdollisten stationaa- risten) AR-juurten lisäksi myös MA-osa sekä pienivarianssinen innovaatio, siis esimerkkim- me tapauksessa (1–B)2 pt = θp(B)apt. Useimmi- ten TRAMO/SEATS:n trendin malli onkin muotoa (0,2,2).

Kuten kaavasta 3.1 havaitaan, esipuhdiste- tun alkuperäisen sarjan AR-osa jakaantuu esi- merkkimme tapauksessa täsmälleen kompo-

Kuvio 5. Estimoituun malliin perustuvan epäsäännöllisen vaihtelun spektri.

(13)

nenttien AR-osien tuloksi. Vastaavalla tavalla komponenttien MA-juuria ja lopullisia malleja määritettäessä dekomponoinnin lähtökohta on MA-osien summautuminen esikäsitellyn sarjan MA-osaksi. Komponenttien mallit pyritään myös saamaan tasapainoon ARI- ja MA-osien- sa suhteen.9 Komponenttien mallit mukaan lu- kien kausitasoitetun sarjan (SAt) malli on esi- tetty taulukossa 2.

Kausitasoituksen ja trendimallinnuksen on- nistumista on mallinnuslogiikan ja mm. jään- nösten tilastollisten testien lisäksi syytä tarkas- tella aina myös graafisesti mielellään samassa

kuvassa alkuperäisen sarjan kanssa. Lopulliset trendin ja kausitasoitetun sarjan kuvaajat aika- ulottuvuudessa löytyvät kuviosta 6 yhdessä al- kuperäisen tavaroiden viennin volyymin kans- sa. Esimerkkimme tapauksessa trendisykli- ja kausitasoitettu sarja esittävät alkuperäisen sar- jan informaation ilmiön kehityksestä varsin kii- tettävästi ilman vuoden sisäistä kausivaihtelua.

Mallinnukseen liittyvien jäännöstarkastelujen lisäksi komponentteihin jako ja kausitasoitus on syytä hyväksyä myös graafisen tarkastelun perusteella.

4. Lopuksi

Vuotta tiheämmin havaintoja sisältävän aika- sarjan tarkastelu hankaloituu usein vuoden si-

Kuvio 6. Tavaroiden viennin volyymin alkuperäisen, trendin ja kausitasoitetun sarjan kuvaajat.

9 Epästationaaristen AR- ja stationaaristen AR-juurten lu- kumäärän summa on tällöin yhtä suuri kuin MA-polynomin juurten lukumäärä.

(14)

säisten havaintojen voimakkaan kausivaihtelun takia. Mikäli halutaan tarkastella muuttujan muutosta edellisestä havainnosta ja havaita käännepisteet tarkasteltavassa ilmiössä, kausi- vaihtelu on tasoitettava aikasarjasta. Vaikka kausivaihtelu koetaan usein muuta aikasarjan analysointia häiritseväksi tekijäksi, komponen- tin tasoittamiseen ja muiden komponenttien identifioimiseen on syytä suhtautua vakavasti.

Aina kun tavalla tai toisella identifioitu kausi- komponentti tasoitetaan, puututaan alkuperäi- sen aikasarjan ajassa toistuvia ominaisuuksia kuvaavaan autokorrelaatiorakenteeseen.

Koska aikasarjan dynaamisia ominaisuuksia kuvaava autokorrelaatiorakenne on kullekin sarjalle ominainen, kaikkien sarjojen kausita- soittaminen yhdenlaisella suotimella ei liene realistista. Yleissuotimella voidaan toki saada estimoitua karkeasti kausitasoitetun aikasarjan (ja trendin) kehitys. Tällöin on kuitenkin vaa- rana rikkoa aikasarjan yksilöllinen autokorre- laatiorakenne. Näin ollen yleissuodatetun sar- jan (tai trendin) mallintamista on syytä välttää esim. pyrittäessä ennustamaan havaintosarjan kuvaamaa ilmiötä. Tällaisessa tilanteessa on pyrittävä käyttämään välineitä, joissa aikasar- jan itsenäinen autokorrelaatiorakenne mallin- netaan komponentteihin ortogonaalisesti.

Tässä kirjoituksessa esittelimme ARIMA- mallipohjaisen dekomponoinnin ja kausitasoi- tuksen periaatteet TRAMO/SEATS-menetel- mällä ratkaisuna em. ongelmaan. ARIMA-mal- lipohjaisessa lähestymistavassa (esipuhdiste- tun) havaintosarjan autokorrelaatiorakenne mallinnetaan ensin ARIMA-mallin avulla. Saa- tua mallia ja sen autokorrelaatiorakennetta käytetään hyväksi, kun aikasarjan vaihtelu jae- taan taajuusaluetarkastelun avulla trendiin, kausikomponenttiin ja epäsäännöllisen vaihte- lun komponenttiin. Komponentteihin jako teh-

dään siten, että systemaattisen vaihtelun kom- ponentit kuvaavat kukin juuri ao. komponen- tille ominaista osaa koko aikasarjan autokorre- laatiorakenteesta. Komponentit ovat esitettä- vissä ARIMA-malleina.

Historian kuvauksen ja analysoinnin lisäk- si alkuperäisen sarjan ja sen komponenttien ennustaminen samanaikaisesti on tämän jäl- keen mahdollista. Tämä voidaan tehdä käyttä- en mallien lisäksi hyväksi kullekin komponen- tille konstruoituja luottamusvälejä sekä mah- dollisia esipuhdistusvaiheen työ/kauppapäivä- vaikutusten ennusteita.

Aikasarja-analyysin teoria ja sen käytännön sovellukset etenevät koko ajan. Tulevaisuuden haasteina ja mahdollisuuksina lienevät mm. ai- kasarjan aikajakson eri osien mallintaminen eri ARIMA-malleilla (seka-ARIMA-mallit) ja mah- dollisesti näihin perustuva aikasarjan dekom- ponointi sekä epälineaariseen aikasarjan mal- lintamiseen pohjautuva dekomponointi. ⵧ

Kirjallisuus

Bell, W.R. (1984): ”Signal extraction for nonstation- ary time series”, The Annals of Statistics, vol. 12, s. 646–664.

Bell, W.R. ja S.C. Hillmer (1983): ”Modeling time series with calendar variation”, Journal of the American Statistical Association, vol. 78, s. 526–

534.

Box, G., Hillmer, S. ja G. Tiao (1978): ”Analysis and modeling of seasonal time series”, teokses- sa Zellner, A. (toim.), Seasonal Analysis of Eco- nomic Time Series, s. 309–334, U.S. Department of Commerce, Bureau of the Census, Washing- ton D.C.

Box, G.E.P. ja G.M. Jenkins (1976): Time Series Analysis: Forecasting and Control, rev. ed. San Francisco: Holden-Day.

(15)

Burman, J.P. (1980): ”Seasonal Adjustment by Sig- nal Extraction”, Journal of the Royal Statistical Society, A 143, s. 321–327.

Chen, C. ja L.M. Liu (1993): ”Joint estimation of model parameters and outlier effects in time se- ries”, Journal of the American Statistical Associa- tion, vol. 88, s. 284–297.

Gomez, V. ja A. Maravall (1994): ”Estimation, pre- diction and interpolation for nonstationary time series with the Kalman filter”, Journal of the American Statistical Association, vol. 89, s. 611–

624.

Gomez, V. ja A. Maravall (1996): Programs TRAMO and SEATS. Instructions for the User, (with some updates). Working Paper 9628, Servicio de Es- tudios, Banco de España.

Gomez, V. ja A. Maravall (2001): ”Seasonal Adjust- ment and Signal Extraction in Economic Time Series”, Ch. 8 teoksessa Peña D., Tiao G.C. ja R.S. Tsay (toim.), A Course in Time Series Anal- ysis, NewYork: Wiley.

Hillmer, S.C ja G.C. Tiao (1982): ”An ARIMA- Model Based Approach to Seasonal Adjust- ment”, Journal of the American Statistical Asso- ciation, 77, s. 63–70.

Kaiser, R. ja A. Maravall (2000): Notes on Time Series Analysis, ARIMA Models and Signal Ex- traction, http://www.bde.es/servicio/software/

papers.htm, 25.10.2005.

Leskinen, E. (2004): Aikasarja-analyysin jatkokurs- sin luennot. Signaalihajotelmia, ARIMA-pohjais- ta dekomponointia ja TRAMO/SEATS:a koske- vat osat. Jyväskylän yliopisto, Matematiikan ja tilastotieteen laitos.

Manna, M. ja R. Peronaci (toim.) (2003): Seasonal Adjustment, European Central Bank, November 2003.

Maravall, A. (1987): ”On Minimum Mean Squared Error Estimation of the Noise in Unobserved

Component Models”, Journal of Business and Economic Statistics 5, s. 115–120.

Maravall, A. (2004): Notes on Programmes Tramo and Seats, Part III Signal Extraction in ARIMA Time Series, luentomoniste; saatavissa pyydet- täessä tekijältä sähköpostitse maravall@bde.es Maravall, A. (1995): ”Unobserved Components in

Economic Time Series”, teoksessa Pesaran, H.

ja M. Wickens (toim.), The Handbook of Applied Econometrics, vol. 1, Oxford: Basil Blackwell.

Maravall, A. ja D.A. Pierce (1987): ”A prototypical seasonal adjustment model”, Journal of Time Se- ries Analysis, vol. 8, s. 177–193.

Maravall, A. ja C. Planas (1999): ”Estimation Error and the Specification of Unobserved Compo- nent Models”, Journal of Econometrics, 92, s. 325 –353.

Planas, C. (1997): Applied Time Series Analysis:

Modelling, Forecasting, Unobserved Compo- nents Analysis and the Wiener-Kolmogorov Fil- ter, http://forum.europa.eu.int/Public/irc/dsis/

eurosam/library, ---> Documents of methodo- logical studies, 25.10.2005.

Rahiala, M. (1994): ”Käytetyimmät kausitasoitusme- netelmät”, teoksessa Suhdannekäänne ja talou- delliset aikasarjat, s. 105–128, Tilastokeskus. Tut- kimuksia 210, Helsinki.

Takala, K. (1994): ”Kahden kausipuhdistusmenetel- män vertailua; X11 ja STAMP”, teoksessa Suh- dannekäänne ja taloudelliset aikasarjat, s. 67–

103, Tilastokeskus. Tutkimuksia 210, Helsinki.

White, P. (1963): Prediction and Regulation by the Linear Least Squares Method, English Universi- ty Press, Lontoo.

Öller, L.E. ja J. Nyblom (2002): Tilastokeskuksen kausitasoitusmenetelmät. Pyydetty lausunto Ti- lastokeskuksen kausitasoitusmenetelmistä 9.10.

2002.

Viittaukset

LIITTYVÄT TIEDOSTOT

(White 2000: 388–389.) Vaihtelua syntyy esimerkiksi siitä, millaisessa suhteessa otsikko on aloitusvirkkeeseen, mitä ensimmäisen virkkeen teemaosassa on ja millainen

Vuoden 2010 testin tulokset eivät vastanneet tilastollisesti merkitsevästi sadon varastointikokeen tuloksia, sillä tuloksissa esiintyi runsasta vaihtelua, mikä

GIS-menetelmissä voidaan ensinnäkin mallintaa kunkin yksittäisen muuttujan vaihtelua tilan sisällä yleistämällä lohkoille sijoitettujen näytepisteiden

Rantalaitumilla vasikoiden kasvuissa oli paljon vaihtelua niin tilojen sisällä ja kuin välilläkin (Kuva 1). Parhaimmillaan päiväkasvut olivat verrattavissa nurmilaitumilla

Havaitsemaansa vaihtelua Haakana ja Kurhila perustelevat esimerkiksi sillä, että osallistujien läheisiä suhteita voidaan heijastaa tekemällä toisen korjauk sia il-

On kuitenkin muistettava, että motivaatio on kognitiivis-lingvistisestä perspektii- vistä aina synkroninen prosessi ja riippuvainen aikalaiskielenkäyttäjän käsitteellisestä

LA-sa rjassa olisi ollut hyvaksi, jos kie- len kay ttajittainen ja tilanteitta inen vaih- telu olisi erotettu paremmin toisistaa n. kurss issa on p aapaino kay tta-

Puiden ja metsien kasvun aleneminen 1990-luvun alussa 1980-luvun puolivälin tasoon verrattuna on kasvun luontaista lyhytjaksoista vaih- telua.. Valtakunnan metsien