Laskennallisen tekniikan koulutusohjelma Kandidaatinty¨o
Joona Paronen
S¨ahk¨onkulutuksen ennustaminen
Ohjaaja: Tutkijatohtori, TkT Matylda Jablonska-Sabuka
Lappeenrannan-Lahden teknillinen yliopisto School of Engineering Science
Laskennallisen tekniikan koulutusohjelma Joona Paronen
S¨ahk¨onkulutuksen ennustaminen
Kandidaatinty¨o 2019
31 sivua, 23 kuvaa, 5 taulukkoa
Ohjaaja: Tutkijatohtori, TkT Matylda Jablonska-Sabuka
Avainsanat: S¨ahk¨onkulutus, vastaava hetki, ARMAX, l¨amp¨otilan vaihtelevuuden kerroin
Kandidaatinty¨on tavoitteena oli ennustaa er¨a¨an paikkakunnan tunnittaista s¨ahk¨onkulutusta k¨aytt¨aen ennusteen pohjana s¨ahk¨onkulutus-, l¨amp¨otila- ja p¨aiv¨anvalodataa kolmelta aiemmalta vuodelta.
S¨ahk¨onkulutusta ennustettiin k¨aytt¨aen kahta eri mallia; ARMAX-mallia ja l¨amp¨otilan vaihtele- vuuden kerrointa. ARMAX-ennusteessa k¨aytettiin selitt¨avin¨a muuttujina l¨amp¨otilaa ja p¨aiv¨an pituutta.
Molemmissa ennusteissa k¨aytettiin l¨aht¨okohtana ”vastaavia hetki¨a” eli ennustettaessa kulu- tusta tietylle tunnille, k¨aytettiin ennustemallin m¨a¨aritt¨amisess¨a niit¨a hetki¨a historiassa, joilla oli sama viikonp¨aiv¨a, kellonaika ja p¨aiv¨an tyyppi.
Ennusteet tehtiin numeerisesti k¨aytt¨aen Matlab-ohjelmaa ja ennusteiden virheit¨a sek¨a nii- den jakautumisia vertailtiin eri p¨aivien ja kellonaikojen kesken. Tulokset osoittivat, ett¨a l¨amp¨otilan vaihtelevuuden kertoimella saadaan tarkempi ennuste kuin ARMAX-ennusteella, kun mallien tarkkuutta arvioitiin k¨aytt¨aenR2-, RMSE-, MDA- ja MAPE-arvoja, joilla l¨amp¨otilan vaihtele- vuusennuste tuotti jokaisella parempia arvoja.
Symboli- ja lyhenneluettelo 4
1 JOHDANTO 5
1.1 Taustaa . . . 5
1.2 Tavoitteet . . . 5
1.3 Ty¨on rakenne . . . 5
2 KIRJALLISUUSKATSAUS 6 3 AINEISTO 7 4 MALLIEN TEORIAA 10 4.1 Yleist¨a aikasarjoista . . . 10
4.2 Aikasarjahajotelma . . . 10
4.3 Stationaarisuus . . . 11
4.4 Er¨ait¨a malleja . . . 12
4.4.1 Autoregressive (AR) . . . 12
4.4.2 Moving average (MA) . . . 12
4.4.3 ARMAX . . . 12
4.5 L¨amp¨otilan vaihtelevuuden kerroin . . . 13
4.6 Tilastolliset tunnusluvut . . . 14
5 TULOKSET JA ANALYSOINTI 15 5.1 Ohjelmisto . . . 15
5.2 ARMAX . . . 15
5.3 L¨amp¨otilan vaihtelevuuden kerroin . . . 21
5.4 Vertailu . . . 27
6 YHTEENVETO JA JOHTOP ¨A ¨AT ¨OKSET 29
L ¨AHTEET 31
Taulukot 32
Kuvat 33
AR Autoregressive
MA Moving average
ARMA Autoregressive moving average
ARMAX Autoregressive moving average with exogenous variable ARIMA Autoregressive integrated moving average
AIC Akaike information criterion ρ Korrelaatiokerroin
Yt Riippuva muuttuja
Xt Riippumattomat muuttujat p AR-termien m¨a¨ar¨a
q MA-termien m¨a¨ar¨a
b Riippuvaan muuttujaan vaikuttavan riippumattoman muuttujan termien m¨a¨ar¨a τ Riippumattoman muuttujan viivetermien m¨a¨ar¨a
Virhe/h¨airi¨o
σ Keskihajonta
φ AR-parametrit
θ MA-parametrit
ω Riippumattoman muuttujan parametrit B Siirto-operaattori
k L¨amp¨otilan vaihtelevuuskerroin R2 Selitysaste
RMSE Root mean squared error MDA Mean directional accuracy MAPE Mean absolute percentage error
1 JOHDANTO
Ty¨on tarkoituksena on tutkia er¨a¨an paikkakunnan s¨ahk¨onkulutusta sek¨a siihen liittyvien te- kij¨oiden vaikutusta ja pyrki¨a luomaan l¨ahihistorian perusteella ennuste tulevasta kulutukses- ta. P¨aivitt¨aiseen ja tunnittaiseen s¨ahk¨on tarpeeseen vaikuttaa oleellisesti l¨amp¨otila, p¨aivitt¨aisen luonnonvalon m¨a¨ar¨a ja p¨aiv¨an luonne (pyh¨a vai arki).
1.1 Taustaa
S¨ahk¨onkulutuksen valvonta ja tarkastelu on yhteiskunnallisesti merkitt¨av¨a¨a. Jokaisen valtion toiminnot vaativat p¨aivitt¨ain s¨ahk¨o¨a moneen eri tarkoitukseen kuten liikenteeseen, infrastruk- tuuriin, tietoverkkojen toimintaan sek¨a kuluttajien yksityisk¨aytt¨o¨on.
S¨ahk¨o¨a tuotetaan monella eri tavalla ja usein on taloudellisesti kannattavaa tiet¨a¨a paljonko s¨ahk¨o¨a milloinkin tarvitaan eri paikoissa. Liian alhainen tuotanto voi johtaa s¨ahk¨okatkoihin ja ylituotanto kuluttaa resursseja tarpeettomasti. Molemmista tapauksista koituu ylim¨a¨ar¨aisi¨a kus- tannuksia, mink¨a vuoksi jokap¨aiv¨aiset kulutusennusteet ovat tarpeellisia.
1.2 Tavoitteet
Ty¨on pohjatietoina on s¨ahk¨onkulutus-, l¨amp¨otila- ja p¨aiv¨anvalodataa tunnin v¨alein vuoden 2014 alusta vuoden 2018 kes¨a¨an asti. T¨ass¨a ty¨oss¨a tarkoituksena on ennustaa s¨ahk¨onkulutusta vuodel- le 2017 k¨aytt¨aen edellist¨a kolmea vuotta mallintamisessa. Tavoitteena on luoda kaksi eri mallia, joilla pyrit¨a¨an ennustamaan s¨ahk¨onkulutus mahdollisimman tarkasti. Lopuksi vertaillaan en- nusteita sek¨a niiden virheit¨a ja arvioidaan kummalla saadaan parempia tuloksia. Ennusteiden hyvyytt¨a arvioidaan k¨aytt¨aenR2-, RMSE-, MDA- ja MAPE-arvoja.
1.3 Ty¨on rakenne
T¨am¨a kandidaatinty¨o esittelee ensin toisessa kappaleessa aiheeseen liittyvi¨a julkaisuja, mink¨a j¨alkeen kolmannessa kappeleessa esitell¨a¨an t¨am¨an ty¨on aineisto eli k¨aytetty data. Nelj¨anness¨a kappaleessa k¨ayd¨a¨an l¨api teoriaa ja ty¨oss¨a k¨aytettyj¨a malleja. Viides kappale on laajin ja se k¨asittelee tuloksia ja niiden analysointia. Tuloksista ja mahdollisista mallien parantelukeinoista keskustellaan kuudennessa kappaleessa.
2 KIRJALLISUUSKATSAUS
S¨ahk¨onkulutusta on ennustettu monilla eri menetelmill¨a k¨aytt¨okohteesta riippuen. Fazil Kay- tez et al. ennustivat Turkin s¨ahk¨onkulutusta k¨aytt¨aen LS-SVM eli least squares support vector machine-mallia [1]. Ennusteessa k¨aytettiin selitt¨avin¨a riippumattomina muuttujina muun muas- sa tuotetun s¨ahk¨on bruttom¨a¨ar¨a¨a ja asiakkaiden sek¨a v¨akiluvun m¨a¨ar¨a¨a. Sen lis¨aksi rinnalla teh- tiin ennuste k¨aytt¨aen regressiivist¨a mallia ja ANN-mallia (artificial neural network). Tuloksista k¨avi ilmi, ett¨a LS-SVM tuotti parhaimman tuloksen.
My¨os Turkin valtiollisen instituution omaa MAED-mallia (model of analysis of the energy demand) verrattiin GPRM-malliin (grey prediction with rolling mechanism) ja GPRM:n todet- tiin antavan tarkempia tuloksia [2].
GPRM-mallia k¨aytettiin my¨os Holt-Winters-metodin ohella Romanian vuotuisen kulutuk- sen ennustamisessa [8]. Ennusteissa ei k¨aytetty ylim¨a¨ar¨aisi¨a selitt¨avi¨a riippumattomia muut- tujia vaan ennusteet tehtiin perustuen pelk¨ast¨a¨an aiempiin kulutustietoihin. Ennusteita vertail- tiin k¨aytt¨aen tunnuslukuina suhteellista virhett¨a (RE), MAPE (mean absolute percentage error), MAD (mean absolute deviation) ja MSE. Molempien mallien todettiin antavan k¨aytt¨okelpoisia, l¨ahes yht¨a hyvi¨a tuloksia noin 5 %:n suhteellisella virheell¨a.
Mohamed & Bodger [3] tutkivat Uuden-Seelannin s¨ahk¨onkulutusta kuudella eri tavalla, joita olivat muun muassa Box-Jenkinsin kehittelem¨a ARIMA-malli, Harveyn logistinen malli ja regressiivinen malli, jossa k¨aytettiin selitt¨avin¨a riippumattomina muuttujina s¨ahk¨on hintaa, bruttokansantuotetta ja v¨akilukua. Harveyn logistisen mallin todettiin antavan parhaan tuloksen.
Pidemm¨an aikav¨alin ennusteessa ECSTSP (error-correction state space model) ja tavalli- nen STSP antavat paremman ennusteen kuin SARIMA (seasonal ARIMA) [4]. Niit¨a vertailtiin kuudella eripituisella ennustejaksolla ja tuloksissa havaittiin, ett¨a STSP-mallit olivat tarkempia ennustejakson pidentyess¨a. Lyhyill¨a ajanjaksoilla kaikki mallit antoivat yht¨a tarkkoja tuloksia.
Er¨as tulosten tunnusluvuista oli MAPE, jonka pienimm¨at arvot saatiin ECSTSP-mallia k¨aytt¨aen.
S¨ahk¨onkulutusta on ennustettu my¨os taloudellisia tekij¨oit¨a k¨aytt¨aen [5]. Malleina olivat ARDL (autoregressive distributed lag model) ja PAM (partial adjustment model), joissa riip- pumattomina muuttujina k¨aytettiin nettotuloja/asukas, teollisuuden tehokkuutta ($/GWh), teol- lisuuden osuutta bruttokansantuotteesta (%) ja kaupungistumisastetta. Molemmissa malleissa todettiin, ett¨a pitk¨all¨a aikav¨alill¨a tulot ja kaupungistumisaste m¨a¨aritteliv¨at suurimmaksi osaksi kulutuksen kehittymisen. Lyhyell¨a aikav¨alill¨a molempien ennusteiden hallitsevin muuttuja oli tulot ja sen j¨alkeen eniten vaikuttivat kaupungistuminen ja teollisuuden tehokkuus.
Brasiliassa on tutkittu s¨ahk¨onkulutusta hajautetusti k¨aytt¨aen sumeaa logiikkaa ja vertailu- malleina Holt Two-parameter-metodia ja paikallisen Energy Research Companyn (EPE) tuot- tamia malleja [9]. Kulutusta ennustettiin erikseen kuluttajien, teollisuuden ja muiden sektorien kesken. MAPE-arvoja k¨aytt¨aen havaittiin sumean logiikan tuottavan parempia tuloksia, mutta ennustettaessa muiden sektorien kulutusta niin Holt-menetelm¨a antoi paremman tuloksen.
Edell¨a mainituista julkaisuista poiketen t¨ass¨a ty¨oss¨a ennusteiden l¨aht¨okohtana on ”vastaa- vien” hetkien k¨aytt¨o. Ennustettavan kulutustunnin vastaava hetki tarkoittaa aikaisempaa ajan- hetke¨a, jolla on sama kellonaika, viikonp¨aiv¨a ja p¨aiv¨an tyyppi. Vastaavien hetkien k¨aytt¨o perus- tuu oletukseen, ett¨a esimerkiksi pyh¨ap¨aivin¨a s¨ahk¨onkulutus on pienemp¨a¨a kuin arkena, koska t¨all¨oin kuluttajat ovat todenn¨ak¨oisemmin kotona ja teollisuuden s¨ahk¨on k¨aytt¨o on v¨ah¨aisemp¨a¨a.
T¨am¨an vuoksi ennustettaessa esimerkiksi tiistain kulutusta, on sopivaa k¨aytt¨a¨a ennusteen mal- lissa edellisten tiistai arkip¨aivien kulutuslukemia. Tuntitasolla kulutus vaihtelee vuorokaude- naikojen mukaan, mink¨a vuoksi vastaavissa hetkiss¨a otetaan huomioon my¨os kellonaika. Poik- keusp¨aivin¨a eli pyh¨an¨a, joka ei osu sunnuntaille, edelliseksi vastaavaksi hetkeksi valitaan sun- nuntai.
3 AINEISTO
Ty¨oss¨a k¨aytett¨av¨a¨an aineistoon kuuluu er¨a¨an paikkakunnan s¨ahk¨onkulutus, l¨amp¨otila ja p¨aiv¨an pituus. Jokaisessa muuttujassa on havaittavissa selke¨a jaksollisuus, joka on yhden vuoden mit- tainen. L¨amp¨otila ja p¨aiv¨anvalon m¨a¨ar¨a vaikuttavat s¨ahk¨onkulutukseen k¨a¨anteisesti; niiden ol- lessa pienimmill¨a¨an s¨ahk¨onkulutus on suurimmillaan. Kuvassa 1 esitet¨a¨an kaikki ty¨oss¨a k¨aytett¨av¨a data.
1/2014 1/2015 1/2016 1/2017
100 200
Sähkönkulutus
Sähkönkulutus 1.1.2014-31.12.2017
1/2014 1/2015 1/2016 1/2017
-20 0 20
Lämpötila
Lämpötila
1/2014 1/2015 1/2016 1/2017
6 8 10 12 1416 18
Päivän pituus
Päivänvalon määrä tunteina
Kuva 1.S¨ahk¨onkulutus, l¨amp¨otila ja p¨aiv¨anvalon m¨a¨ar¨a 1.1.2014 - 31.12.2017
Vuositason jaksollisuuden lis¨aksi kulutuksessa esiintyy my¨os p¨aiv¨akohtaista jaksollisuutta. Y¨oll¨a kulutus on yleens¨a pienemp¨a¨a kuin p¨aiv¨all¨a ja p¨aiv¨asaikaan kulutuksessa on my¨os havaittavissa piikkej¨a. Er¨a¨an viikon s¨ahk¨onkulutus on esitettyn¨a kuvassa 2.
0 24 48 72 96 120 144 168
Aika tunteina viikon alusta 35
40 45 50 55 60 65 70
Sähkönkulutus
Sähkönkulutuksen jaksollisuus viikkotasolla
Kuva 2.S¨ahk¨onkulutus ajanjaksolla ma 2.6.2014 - su 8.6.2014
Kuvasta 2 on havaittavissa, ett¨a viikonloppuna kulutus on hieman v¨ah¨aisemp¨a¨a, koska useat teollisuuslaitokset ovat silloin poissa toiminnasta. Viikonloppuiltoina yleens¨a l¨ammitet¨a¨an sau- noja, joka voi selitt¨a¨a lauantai- ja sunnuntai-iltojen kulutuspiikkej¨a.
L¨amp¨otilan ja p¨aiv¨anvalon m¨a¨ar¨an k¨a¨anteinen vaikutus s¨ahk¨onkulutukseen on esitetty ku- vissa 3 ja 4. Silm¨am¨a¨ar¨aisesti ja muuttujien v¨alisten Pearsonin korrelaatiokertoimien avulla voi- daan huomata, ett¨a s¨ahk¨onkulutuksen ja l¨amp¨otilan sek¨a s¨ahk¨onkulutuksen ja p¨aiv¨an pituuden v¨alill¨a on olemassa kohtalaista lineaarista riippuvuutta. Riippuvuus on suurempaa kulutuksen ja l¨amp¨otilan v¨alill¨a, koska l¨ammitys vie paljon s¨ahk¨o¨a ja kylm¨all¨a s¨a¨all¨a se on p¨a¨all¨a riippumatta kuinka valoisaa on.
-30 -20 -10 0 10 20 30 Lämpötila
40 60 80 100 120 140 160 180 200 220
Sähkönkulutus
Sähkönkulutuksen ja lämpötilan sirontakuvaaja = -0.83215
Kuva 3.Kulutuksen ja l¨amp¨otilan sirontakuvaajasta n¨ahd¨a¨an kulutuksen pienenev¨an l¨amp¨otilan noustessa.
6 8 10 12 14 16 18
Päivän pituus 40
60 80 100 120 140 160 180 200 220
Sähkönkulutus
Sähkönkulutuksen ja päivän pituuden sirontakuvaaja = -0.73848
Kuva 4.Kulutuksen ja p¨aiv¨an pituuden sirontakuvaajasta n¨ahd¨a¨an kulutuksen pienenev¨an p¨aiv¨an valon m¨a¨ar¨an noustessa.
4 MALLIEN TEORIAA
4.1 Yleist¨a aikasarjoista
Aikasarja on joukko dataa, jota havainnoidaan tietyin aikav¨alein. Niit¨a k¨aytet¨a¨an paljon esimer- kiksi teollisuudessa, jossa mitataan jotain prosessiin liittyv¨a¨a suuretta ottamalla n¨ayte tietyin aikav¨alein. My¨os p¨orssikursseja kuvataan aikasarjoina, joissa mitataan esimerkiksi osakkeen arvoa p¨aivitt¨ain. Usein aikasarja esitet¨a¨an visuaalisesti piirt¨am¨all¨a datapisteet koordinaatistoon, jossa vaaka-akselilla on tietty¨a arvoa vastaava ajanhetki.
Aikasarjojen analysointi on t¨arke¨a¨a niiden taustalla olevien prosessien ymm¨art¨amisen, hal- linnan ja tulevien arvojen ennustamisen kannalta.
4.2 Aikasarjahajotelma
Aikasarjojen analyysiin on useita l¨ahestymistapoja, joista yksi on sarjan hajottaminen eri kom- ponentteihin, joita voidaan k¨asitell¨a eri tavoin. Mitattavaan muuttujaan voi liitty¨a erikseen ylei- nen muoto, jota datan keskiarvo mukailee tai kausittaista vaihtelua. Yleinen additiivinen hajo- telma [6] on:
Yt =Tt+St+Ct+It, jossa:
Yt = havaittu signaali hetkell¨at
Tt = trendi eli yleinen muoto, jonka mukaan muuttujanY keskiarvo muuttuu. (trend) St = kausittainen vaihtelu (seasonal)
Ct = syklinen vaihtelu, jota voi esiinty¨a kausivaihtelun lis¨aksi (cyclic) It = ep¨as¨a¨ann¨ollinen h¨airi¨o (irregular)
Kuvassa 5 esitet¨a¨an esimerkki additiivisest¨a hajotelmasta.
20 25 Yt
Havaittu signaali
19 20 21 Tt
Trendi
-2 0 2 St
Kausittainen vaihtelu
-2 0 2 It 4
Epäsäännöllinen häiriö
Kuva 5.Esimerkki additiivisesta aikasarjahajotelmasta
Kun tiedet¨a¨an trendin ja jaksollisuuden k¨aytt¨aytymisen tarkastelualueella olevan pysyv¨a¨a, voi- daan rajoittaa analyysi h¨airi¨o¨on. Sen tulevien arvojen ennustamiseen liittyy kuitenkin rajoituk- sia.
4.3 Stationaarisuus
Stationaarisuus tarkoittaa etteiv¨at muuttujan tilastolliset arvot muutu ajan kuluessa. Se on en- nusteen kannalta v¨altt¨am¨at¨ont¨a, koska mallinnukseen k¨aytett¨av¨an datan on pysytt¨av¨a stabiilina.
Keskiarvon ja varianssin on siis pysytt¨av¨a samoina ja t¨all¨oin ennustetta tehdess¨a voidaan olettaa muuttujan ominaisuuksien olevan samat kuin aiemmin.
Ei-stationaarisen aikasarjan muuttamiseen stationaariseksi on olemassa keinoja kuten loga- ritmimuunnos tai differenssin ottaminen datasta. 1. differenssin ottaminen luo aikasarjan, jossa termit ovat erotuksia alkuper¨aisen sarjan termien v¨alill¨a.
∆Yt=Yt−Yt−1
4.4 Er¨ait¨a malleja
Seuraavia malleja kutsutaan usein my¨os Box-Jenkins-malleiksi niiden kehitt¨ajien mukaan [7].
4.4.1 Autoregressive (AR)
AR(p) eli autoregressive -prosessi on lineaarinen prosessi, jota kuvaa differenssiyht¨al¨o
Yt=t+φ1Yt−1+...+φpYt−p (1) Yht¨al¨oss¨aton h¨airi¨otermi jaφiovat kertoimia. Parametripm¨a¨ar¨a¨a kuinka monta edelt¨av¨a¨a ter- mi¨a otetaan huomioon. Mallia sanotaan autoregressiiviseksi, koskaYt riippuu edellisist¨a omista arvoistaan. Yht¨al¨o voidaan my¨os kirjoittaa siirto-operaattorinBavulla, jolloin yht¨al¨o saadaan kirjoitettua polynomimuotoon ja pon kerroinpolynominφ(B)aste.
Yt−φ1Yt−1−...−φpYt−p=t (1−φ1B−...−φpBp)Yt=t
φ(B)Yt=t (2)
4.4.2 Moving average (MA)
MA(q) eli moving-average -prosessi on lineaarinen prosessi, jossa riippuva muuttuja Yt on h¨airi¨otermien yhdistelm¨a.
Yt=t+θ1t−1+...+θqt−q (3)
Ja siirto-operaattorin avulla lausuttuna:
Yt = (1+θ1B+...+θqBq)t
Yt =θ(B)t (4)
4.4.3 ARMAX
ARMA(p,q)-prosessi on kahden edellisen yhdistelm¨a
Yt+φ1Yt−1+...+φpYt−p=t+θ1t−1+...+θqt−q (5) φ(B)Yt=θ(B)t (6)
Ja ARMAX(p,q,b) on malli, jossa muuttujaanYt liittyy lis¨aksi yksi tai useampi ylim¨a¨ar¨ainen
riippumaton muuttujaXt. Parametribm¨a¨ar¨a¨a montako termi¨a vaikuttaa riippuvaan muuttujaan Yt jaωiovat riippumattoman muuttujan kertoimia.
Yt+φ1Yt−1+...+φpYt−p=ω1Xt−τ+...+ωbXt−τ−b+1+t+θ1t−1+...+θqt−q (7) φ(B)Yt =ω(B)Xt−τ+θ(B)t (8) Aiemmin todettiin kulutuksella olevan riippuvuutta l¨amp¨otilan ja p¨aiv¨an pituuden kanssa joten k¨aytet¨a¨an s¨ahk¨onkulutusta ennustettaessa riippumattomina muuttujina l¨amp¨otilaaX1,tja p¨aiv¨an pituuttaX2,t. Muuttujaτ on viivetermien m¨a¨ar¨a ennenkuin riippumaton muuttuja alkaa vaikut- tamaan ennustettavaan muuttujaanYt.
Sovitetaan siis s¨ahk¨onkulutusdataan malli ARMAX(p,q,b1,b2,τ1,τ2).
φ(B)Yt=ω1(B)X1,t−τ1+ω2(B)X2,t−τ2+θ(B)t (9)
4.5 L¨amp¨otilan vaihtelevuuden kerroin
K¨aytet¨a¨an ennusteen teossa poikkeavaa tapaa, joka ei hajota datajoukkoa eri tekij¨oihin tai mal- linna sit¨a. Sen sijaan tehd¨a¨an ennuste k¨aytt¨aen niin kutsuttua l¨amp¨otilan vaihtelevuuden ker- rointa, miss¨a l¨aht¨okohtana on vastaavien hetkien k¨aytt¨o. M¨a¨aritet¨a¨an kerroin laskemalla jokais- ta s¨ahk¨onkulutustuntiaYivastaava kerroinKi, joka kuvaa kulutus- ja l¨amp¨otilaeron suhdetta.
Ki= Yi−Yi˜
X1,i−X1,i˜ (10)
Yi = s¨ahk¨onkulutus tunnillai
Y˜i = s¨ahk¨onkulutus edellisell¨a vastaavalla hetkell¨a X1,i = l¨amp¨otila hetkell¨ai
X1,i˜ = l¨amp¨otila edellisell¨a vastaavalla hetkell¨a
Otetaan keskiarvo kaikistaK-arvoistak= N1∑Nj=1Kj, josta saadaan kerroink. N on kertoimien Ki m¨a¨ar¨a. Approksimoidaan seuraavan ajanhetkent kulutusta kertomalla nykyisen l¨amp¨otilan ja edellisen vastaavan l¨amp¨otilan erotusta kertoimellak.
Yt =Yt˜+ (X1,t−X1,˜t)k (11)
4.6 Tilastolliset tunnusluvut
Mallien sopivuutta voidaan arvioida selitysasteen avulla. Sen laskemiseksi tarvitaan pienimpi¨a neli¨osummia.
SST =
n i=1
∑
(yi−y)¯ 2 SSE=
n
∑
i=1
2i
SST:n (total sum of squares) ja SSE:n (error sum of squares) avulla saadaan selitysaste:
R2=1−SSE SST
Selitysaste kuvaa suhteellisesti kuinka paljon paremmin malli sopii dataan kuin siin¨a tapaukses- sa, jossa mallina k¨aytett¨aisiin pelkk¨a¨a datan keskiarvoa. Er¨as toinen mittari mallin hyvyydelle on RMSE (root mean squared error).
RMSE=√
MSE= s
∑ni=12i n
Suhteellisen virheen keskim¨a¨ar¨aist¨a arvoa kuvaa MAPE (mean absolute percentage error).
MAPE= 1 n
n
∑
i=1
yi−yˆi yi
Usein on hy¨odyllist¨a tiet¨a¨a antaako ennuste todellista arvoa suuremman vai pienemm¨an tulok- sen. MDA (mean directional accuracy) on tunnusluku, joka kuvaa todenn¨ak¨oisyytt¨a sille, ett¨a ennustettu arvo on samaan suuntaan kuin todellinen arvo. Eli jos seuraava ennustettu ja toteutu- nut arvo ovat molemmat kasvaneet edelliseen n¨ahden niin voidaan sanoa ennusteen osoittavan samaan suuntaan.
MDA= 1 n
n i=1
∑
lsgn(yi−yi−1)==sgn(yˆi−yi−1)
Yht¨al¨oiss¨ayon todellinen arvo, ˆyon ennustettu arvo,sgnon signum-funktio jalon indikaatto- rifunktio, mitk¨a m¨a¨aritell¨a¨an:
la=
1, a=1 0, a=0
sgn(a) =
1, a>0 0, a=0
−1, a<0
5 TULOKSET JA ANALYSOINTI
5.1 Ohjelmisto
Aikasarjojen analysointi ja ennusteet tehtiin numeerisesti k¨aytt¨aen MATLAB ®-ohjelmaa ja erityisesti senSystem IdentificationjaEconometrics-osien sis¨alt¨ami¨a ty¨okaluja.
5.2 ARMAX
S¨ahk¨onkulutusdataan sovitettiin yht¨al¨on (9) mukainen malli. Ennuste tehtiin siten, ett¨a koko da- tasta poimittiin ennustettavaa hetke¨a vastaavat aiemmat hetket, joille tehtiin ARMAX-sovitus ja laskettiin ennusteen arvo yhden ajanjakson eteenp¨ain kyseiselle aikasarjalle. Vastaavat het- ket oli m¨a¨aritelty viikon v¨alein (poislukien erikoistapaukset) eli ennustettiin jokaisella kerralla viikko eteenp¨ain. Yhteens¨a toimenpide toistettiin siis vuoden tuntien verran eli 8760 kertaa.
Kuvassa 6 on esitetty ensimm¨aiset 36 ennustuspistett¨a.
0 2 4 6 8 10 12 14 16 18 22 0 2 4 6 8 10 12 kellonaika
85 90 95 100 105 110 115 120 125 130
sähkönkulutus
Vuoden 2017 36 ensimmäistä tuntia
Ennuste
Todellinen kulutus
Kuva 6.ARMAX(5,2,[4,4],[3,4]) Toteuma ja ennuste ajanjaksolle sunnuntai 1.1.2017 klo 0.00 - maanantai 2.1.2017 klo 12
Termien lukum¨a¨ar¨an optimaalinen haku kuvan 6 ennustetta varten suoritettiin AIC-menetelm¨a¨a [6] k¨aytt¨aen. Termien lukum¨a¨ar¨a haettiin ensimm¨aisen ennustettavan tunnin vastaavien hetkien
aikasarjalle ja n¨ait¨a parametrien lukum¨a¨ari¨a p,q,b1,b2,τ1,τ2 k¨aytettiin ensimm¨aiselle 36:lle tunnille. Pian t¨am¨an j¨alkeen ennuste alkoi poikkeamaan todellisista arvoista huomattavasti, mink¨a vuoksi p¨a¨adyttiin tekem¨a¨an overfit-ratkaisu, jossa asetettiin termien lukum¨a¨ar¨at samoik- si ja tutkittiin, mill¨a arvoilla saadaan paras lopputulos. Kuvassa 7 on ennuste, jossa kaikkien termien lukum¨a¨ar¨aksi on asetettu nelj¨a. Silm¨am¨a¨ar¨aisesti ennuste pysyy toteuman vuositason muotoa mukailevana.
1/17 2/17 3/17 4/17 5/17 6/17 7/17 8/17 9/17 10/17 11/17 12/17
Aika 20
40 60 80 100 120 140 160 180
Sähkönkulutus
ARMAX-kulutusennuste
Ennuste Oikea kulutus
Kuva 7.Vuoden 2017 ARMAX(4,4,4,4,4,4)- ennuste ja todellinen kulutus
Ennustevirhe laskettiin v¨ahent¨am¨all¨a todellisesta kulutuksesta ennustettu arvo ( ˆYt) t=Yt−Yˆt
Eli positiivinen virheen arvo tarkoittaa ennusteen antavan liian alhaisen arvon. Kuvassa 8 on esitetty ennusteen virhe.
1/17 2/17 3/17 4/17 5/17 6/17 7/17 8/17 9/17 10/17 11/17 12/17
Aika -40
-20 0 20 40 60
Ennustevirhe
ARMAX-ennusteen virhe
Kuva 8.ARMAX(4,4,4,4,4,4)-virhe vuodelle 2017.
Ennusteen tilastollisia arvoja on esitetty taulukossa 1. R2-arvon perusteella ennuste sopii to- teumaan kohtalaisen hyvin ja ennusteen arvot ovat muuttuneet oikeaan suuntaan (toteumaan n¨ahden) 62 %:n todenn¨ak¨oisyydell¨a. Ennuste tuottaa keskim¨a¨arin pienemm¨an arvon kuin mit¨a todellinen kulutus on.
Taulukko 1.ARMAX-ennusteen tilastollisia arvoja
Ennuste R2 RMSE MDA MAPE ¯ σ
ARMAX 0.8122 12.0092 0.62 0.0975 0.4766 12.0005
Kuvaamalla virhett¨a histogrammilla saadaan parempi visuaalinen esitys virheest¨a ja n¨ahd¨a¨an suhteellisesti kuinka paljon mink¨akin suuruisia virheit¨a on. Histogrammin keskikohdan tulisi mukailla virheen keskiarvoa (¯). Kuvassa 9 on esitetty virheen histogrammi ja normaalijakau- man tiheysfunktioN(¯,σ), jonka parametrit ovat taulukosta 1.
Kuva 9.ARMAX-virheen histogrammi ja siihen sovitettu normaalijakauman tiheysfunktio.
Tiheysfunktio ja histogrammi eiv¨at osu kohdakkain eli virhe ei ole normaalisti jakautunut.
Virhe jaoteltiin viikonp¨aivien kesken ja histogrammit piirrettiin eri v¨areill¨a, jotta n¨ahd¨a¨an p¨aiv¨akohtaiset eroavaisuudet. N¨ain saadut jakaumat on esitetty kuvassa 10.
-40 -30 -20 -10 0 10 20 30 40 50 60 70
Virheen suuruus 0
0.01 0.02 0.03 0.04 0.05
Virheen normalisoitu arvo
Päiväkohtainen ARMAX-virheen jakauma
Ma Ti Ke To Pe La Su
Kuva 10.ARMAX-virheen p¨aiv¨akohtaiset empiiriset tiheysfunktiot.
Kuvasta 10 on havaittavissa, ett¨a sunnuntaisin virheen hajonta on pienemp¨a¨a kuin muina p¨aivin¨a, koska sen kuvaajan huippu on korkeammalla kuin muiden p¨aivien. Sama voidaan huomata tau- lukosta 2.
Taulukko 2.ARMAX-virheen p¨aiv¨akohtaiset keskiarvot ja keskihajonnat
Viikonp¨aiv¨a Keskiarvo Keskihajonta
Ma -0.3678 9.8609
Ti 1.8531 13.1614
Ke 0.6175 12.6220
To -0.2488 13.3217
Pe 2.0230 13.3017
La 0.4922 12.4637
Su -1.0043 7.9386
Tutkittiin seuraavaksi onko vuorokaudenajalla merkityst¨a ennustevirheen suuruuteen ja jaotel- tiin virheet nelj¨a¨an eri ajankohtaan. Kuvassa 11 on esitetty jaottelu nelj¨an eri vuorokaudenajan kesken.
-40 -20 0 20 40 60
Virheen suuruus 0
0.005 0.01 0.015 0.02 0.025 0.03 0.035 0.04 0.045
Virheen normitettu arvo
Tunnittainen ARMAX-virheen jakauma
Aamu klo 05-10 Päivä klo 11-15 Ilta klo 16-22 Yö klo 23-04
Kuva 11.ARMAX-virheen empiiriset tiheysfunktiot vuorokaudenaikojen kesken. Merkitt¨av¨a¨a eroa ei ole havaittavissa eri ajankohtien v¨alill¨a.
Tutkittiin lis¨aksi olisiko suurimpien virheiden kohdalla jonkinlaista s¨a¨ann¨onmukaisuutta ja ero- teltiin virheest¨a yli 10 yksik¨on absoluuttiset virheet ja jaoteltiin ne viikonp¨aivien ja kellonaiko- jen kesken. Tulokset on esitetty kuvassa 12.
Yli 10 yksikön virheen jakautuminen viikonpäiville
Ma Ti Ke To Pe La Su
Viikonpäivä 0
50 100 150 200 250 300 350 400 450 500
Kappalemäärä
(a) Viikonp¨aivien virhejakauma (b) Kellonaikojen virhejakauma
Kuva 12.Yli 10 yksik¨on ARMAX-virheiden jakautuminen
Virhe ei painotu erityisen suuresti mink¨a¨an viikonp¨aiv¨an kohdalle, mutta klo 5:n ja 18 kohdalla on kuvan 12b perusteella havaittavissa eroa muihin verrattuna. N¨ait¨a ennuste ei kykene ennakoi- maan, mutta aamupiikki saattaa johtua teollisuuden ja liikenteen (liikennevalot, s¨ahk¨oiset kyltit) toiminnan alkamisesta aamuvarhain ja illalla taas kotitalouksissa noihin aikoihin s¨ahk¨onkulutus saattaa kiihty¨a perheiden saavuttua t¨oist¨a kotiin.
5.3 L¨amp¨otilan vaihtelevuuden kerroin
Ennustetta varten otettiin vastaavia hetki¨a m¨a¨aritett¨aess¨a huomioon vain ne hetket, joilla l¨amp¨otilaero ennustehetkeen verrattuna oli korkeintaan 2°C, koska pyrittiin v¨altt¨am¨a¨an suuret lukemat tai nollalla jakamiset yht¨al¨oss¨a (10). T¨am¨an lis¨aksi laskettiin kerroinkerikseen arkip¨aiville ja vii- konlopuille. Yht¨al¨on (11) avulla saatiin kuvan 13 mukainen ennuste.
1/17 2/17 3/17 4/17 5/17 6/17 7/17 8/17 9/17 10/17 11/17 12/17
Aika 40
60 80 100 120 140 160 180
Sähkönkulutus
Lämpötilan vaihtelevuuden kerroin ja sähkönkulutus
Ennuste Oikea kulutus
Kuva 13.L¨amp¨otilan vaihtelevuus-ennuste ja todellinen s¨ahk¨onkulutus vuonna 2017. Vastaavissa hetkiss¨a ei rajoitettuna l¨amp¨otilaa ylh¨a¨alt¨ap¨ain.
Silm¨am¨a¨ar¨aisesti ennuste sopii toteumaan hyvin. Tehtiin toinen ennuste huomioiden l¨amp¨otilaero eli valittiin vastaaviksi hetkiksi sellaiset hetket, joilla on saman viikonp¨aiv¨an, kellonajan ja p¨aiv¨an tyypin lis¨aksi l¨amp¨otilaeroa nykyhetkeen t verrattuna korkeintaan 5°C. Eli yht¨al¨oss¨a (11)|(X1,t−X1,˜t)| ≤5. T¨all¨a pyrittiin siihen ettei ennustettava kulutus eroaisi suuresti edelli- sest¨a vastaavasta arvosta. Molempien ennusteiden virheet on esitetty kuvissa 14a ja 14b.
1/17 2/17 3/17 4/17 5/17 6/17 7/17 8/17 9/17 10/17 11/17 12/17
Aika -60
-40 -20 0 20 40 60
Virhe
Ennusteen virhe huomioimatta vastaavien hetkien lämpötilaeroa
(a) Vastaavissa hetkiss¨a sama viikonp¨aiv¨a, kellonaika ja p¨aiv¨an tyyppi
1/17 2/17 3/17 4/17 5/17 6/17 7/17 8/17 9/17 10/17 11/17 12/17
Aika -60
-40 -20 0 20 40 60
Virhe
Ennusteen virhe huomioiden vastaavien hetkien lämpötilaero
(b) Edellisten lis¨aksi l¨amp¨otilaerot rajoitettu 5 asteeseen ylh¨a¨alt¨ap¨ain.
Kuva 14.L¨amp¨otilan vaihtelevuuden kertoimella tehtyjen ennusteiden virheet. Molemmat ovat l¨ahell¨a nollaa.
Kuvassa 15 on esitetty vastaavat histogrammit virheille ja sovitetut normaalijakauman tiheys- funktiot, joiden parametrit ovat vastaavan virheen keskiarvo ja keskihajonta taulukosta 3.
Kuva 15.Molempien ennusteiden virheiden histogrammit ja vastaavat tiheysfunktiot. Tiheysfunktiot eiv¨at osu kohdakkain histogrammin kanssa kuten ei my¨osk¨a¨an ARMAX-virheen tapauksessa.
Virheet jaoteltiin my¨os viikonp¨aivien kesken ja piirrettiin empiiriset tiheysfunktiot, jotka on esitetty kuvassa 16.
-30 -20 -10 0 10 20 30 40 50
Virheen suuruus 0
0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08
Virheen normalisoitu arvo
Päiväkohtainen LVK-virheen jakauma (lämpötilaeroja ei huomioitu)
Ma Ti Ke To Pe La Su
-30 -20 -10 0 10 20 30 40
Virheen suuruus 0
0.01 0.02 0.03 0.04 0.05 0.06 0.07
Virheen normalisoitu arvo
Päiväkohtainen LVK-virheen jakauma (lämpötilaerot huomioitu)
Ma Ti Ke To Pe La Su
Kuva 16.L¨amp¨otilan vaihtelevuuden kerroin-ennusteen empiiriset tiheysfunktiot. Eri v¨areill¨a on eritelty eri viikonp¨aiv¨at. Ensimm¨aisess¨a kuvassa korkeimpina ovat maanantai, tiistai ja sunnuntai,
joiden keskihajonnat ovat pienimm¨at (taulukko 4a).
Kuvan 16 perusteella voidaan sanoa, ett¨a virheet jakautuvat tasaisesti kaikkien viikonp¨aivien kesken l¨amp¨otilarajoitetussa ennusteessa, koska kaikki kuvaajat asettuvat l¨ahes p¨a¨allekk¨ain.
Kuvassa 17 esitet¨a¨an vuorokaudenaikojen mukaan jaotellut virheet.
-30 -20 -10 0 10 20 30 40 50 Virheen suuruus
0 0.01 0.02 0.03 0.04 0.05 0.06 0.07
Virheen normitettu arvo
Tunnittainen LVK-virheen jakauma (lämpötiloja ei rajoitettu)
Aamu klo 05-10 Päivä klo 11-15 Ilta klo 16-22 Yö klo 23-04
-30 -20 -10 0 10 20 30 40
Virheen suuruus 0
0.01 0.02 0.03 0.04 0.05 0.06 0.07
Virheen normitettu arvo
Tunnittainen LVK-virheen jakauma (lämpötilaerot rajoitettu)
Aamu klo 05-10 Päivä klo 11-15 Ilta klo 16-22 Yö klo 23-04
Kuva 17.LVK-virheiden empiiriset tiheysfunktiot vuorokaudenaikojen mukaan. Merkitt¨av¨a¨a eroa ei ole havaittavissa eri vuorokaudenaikojen ennustevirheiss¨a.
Ennusteita tehdess¨a otettiin talteen nykyhetken ja vastaavan hetken l¨amp¨otilaerotX1,i−X1,i˜ja ne on esitetty kuvassa 18. J¨alkimm¨aisen kuvan alussa piikki alasp¨ain johtuu siit¨a ettei datasta l¨oytynyt ehdot t¨aytt¨av¨a¨a vastaavaa hetke¨a, jolloin k¨aytettiin kulutusarvoa, jolla l¨amp¨otilaehto ei t¨ayttynyt.
1000 2000 3000 4000 5000 6000 7000 8000 Indeksi: vuoden 2017 tunnit (8760kpl) -25
-20 -15 -10 -5 0 5 10 15 20 25
Lämpötilaero
Lämpötilaero ei rajoitettu
1000 2000 3000 4000 5000 6000 7000 8000 Indeksi: vuoden 2017 tunnit (8760kpl) -20
-15 -10 -5 0 5 10 15 20
Lämpötilaero
Lämpötilaero rajoitettu 5 asteeseen
Kuva 18.Ennustehetken ja vastaavan hetken v¨alinen l¨amp¨otilaero
Laskettiin ennusteen ja todellisen kulutuksenR2-arvo, virheen RMSE, MDA, MAPE sek¨a kes- kiarvot ja -hajonnat, jotka on esitetty taulukossa 3.
Taulukko 3.L¨amp¨otilan vaihtelevuuden kertoimella toteutetun ennusteen tilastolliset arvot
Tunnusluku Ennuste: l¨amp¨otilaeroja ei rajoitettu Ennuste: l¨amp¨otilaerot rajoitettu
karkip¨aiville -1.7756 -2.1090
kviikonlopuille -1.7489 -2.2115
R2 0.9311 0.9387
RMSE 7.2723 6.8628
MDA 0.6932 0.6904
MAPE 0.0618 0.0612
¯
-0.0989 -0.3538
σ 7.2721 6.8541
Taulukosta 3 huomataan ettei arkip¨aivien ja viikonloppujenk-arvoissa ollut suurta eroa. Kaikki kertoimetkovat negatiivisia, mik¨a oli oletettavaa, koska l¨amp¨otilan laskiessa eli l¨amp¨otilaeron ollessa negatiivinen kulutus suurenee ja vastaavasti toisinp¨ain. Molempien virheiden keskiar- vot ovat l¨ahes nolla jaR2, MDA sek¨a MAPE ovat l¨ahes yht¨a suuret. Taulukossa 4 on esitetty p¨aiv¨akohtaiset virheen keskiarvot ja keskihajonnat.
Taulukko 4.L¨amp¨otilan vaihtelevuuden kertoimella toteutetun ennustevirheen p¨aiv¨akohtaiset tulokset
(a) Vastaavien hetkien l¨amp¨otiloja ei rajoitettu
Viikonp¨aiv¨a keskiarvo keskihajonta Maanantai -0.2697 5.2779
Tiistai -0.0808 7.2383
Keskiviikko -0.1482 8.0012
Torstai -0.2700 7.8596
Perjantai 0.4095 7.4179 Lauantai -0.1936 8.3215 Sunnuntai -0.1386 6.3276
(b) L¨amp¨otilaerot rajoitettu
Viikonp¨aiv¨a keskiarvo keskihajonta Maanantai -0.7030 5.8875
Tiistai -0.2087 7.4591
Keskiviikko -0.3143 7.1928
Torstai -0.5380 6.8910
Perjantai -0.1735 6.2214 Lauantai -0.2351 7.6187 Sunnuntai -0.3049 6.5312
Taulukoiden 3 ja 4 perusteella voidaan sanoa, ett¨a l¨amp¨otilaerot huomioimalla ennuste ei pa- rantunut merkitt¨av¨asti. Rajoittamalla l¨amp¨otilaerot malli antaa keskim¨a¨arin suuremman arvon kuin mit¨a todellinen kulutus on (kaikkien viikonp¨aivien ja koko ennusteen virheen keskiarvo on negatiivisempi) ja sen hajonta on pienempi.
Tutkittiin vastaavasti kuin ARMAX-ennusteessa onko suurimpien virheiden kohdalla jon-
kinlaista s¨a¨ann¨onmukaisuutta. Ennustevirheest¨a eroteltiin ne indeksit, joilla virheen absoluutti- nen suuruus oli suurempaa kuin 10 ja ker¨attiin histogrammeihin tieto mille p¨aiville ja tunneille kyseiset indeksit osuivat. Tulokset on esitetty kuvissa 19 ja 20.
Yli 10 yksikön virheen jakautuminen viikonpäiville
Ma Ti Ke To Pe La Su
Viikonpäivä 0
50 100 150 200 250
Kappalemäärä
(a) Viikonp¨aivien virhejakauma (b) Kellonaikojen virhejakauma
Kuva 19.Yli 10 yksik¨on ennustusvirheiden jakautuminen, kun l¨amp¨otilaeroja ei rajoiteta
Yli 10 yksikön virheen jakautuminen viikonpäiville
Ma Ti Ke To Pe La Su
Viikonpäivä 0
20 40 60 80 100 120 140 160 180 200
Kappalemäärä
(a) Viikonp¨aivien virhejakauma (b) Kellonaikojen virhejakauma
Kuva 20.Yli 10 yksik¨on ennustusvirheiden jakautuminen, kun l¨amp¨otilaerot rajoitettu
Kuvassa 20b on havaittavissa samankaltainen aamupiikki kuin l¨amp¨otilan vaihtelevuuden ker- toimella toteutetussa ennusteessa, mik¨a voisi johtua esimerkiksi tehtaiden aamuisesta toiminnan alkamisesta.
5.4 Vertailu
Taulukossa 5 esitet¨a¨an ARMAX- ja l¨amp¨otilarajoitetun kerroinennusteen tunnusluvut, jois- ta n¨ahd¨a¨an LVK-ennusteen olevan t¨ass¨a tarkastelussa n¨aill¨a arviointitavoilla tarkempi malli s¨ahk¨onkulutuksen ennustamiseen.
Taulukko 5.Ennusteiden tilastollisten tunnuslukujen vertailu
Tunnusluku ARMAX L¨amp¨otilan vaihtelevuuden kerroin
R2 0.8122 0.9387
RMSE 12.0092 6.8628
MDA 0.62 0.6904
MAPE 0.0975 0.0612
Kuvassa 21 on esitetty ARMAX-ennusteen ja l¨amp¨otilarajoitetun ( 5 °C, kuva 14b) kerroinen- nusteen virheet ja kuvassa 22 histogrammit.
1/17 2/17 3/17 4/17 5/17 6/17 7/17 8/17 9/17 10/17 11/17 12/17
Aika -40
-20 0 20 40 60
Ennustevirhe
Ennusteiden virheet
ARMAX LVK
Kuva 21.ARMAX- ja l¨amp¨otilan vaihtelevuuden kerroin-ennusteiden virheet
Kuva 22.ARMAX- ja l¨amp¨otilarajoitetun kerroinennusteen virheiden histogrammit. LVK-ennusteen vaihtelevuus on pienemp¨a¨a ja n¨ain ollen sen histogrammi on korkeampi ja kapeampi.
MDA kertoi todenn¨ak¨oisyyden, jolla ennuste muuttui todellisen kulutuksen suhteen samaan suuntaan, mutta laskettiin lis¨aksi se todenn¨ak¨oisyys, ett¨a ennusteet muuttuivat kesken¨a¨an sa- maan suuntaan. ARMAX- ja l¨amp¨otilarajoitettu LVK-virhe olivat samanmerkkiset 55.43 %:n todenn¨ak¨oisyydell¨a eli on 55.43 %:n todenn¨ak¨oisyys, ett¨a molemmilla malleilla saadaan sa- maan aikaan liian pieni tai suuri arvo toteumaan n¨ahden.
Molempien virheiden autokorrelaatiofunktiot on esitetty kuvassa 23. Autokorrelaatiofunk- tiot laskeutuvat hitaasti, mist¨a voidaan p¨a¨atell¨a etteiv¨at virheet ole stationaarisia. L¨amp¨otilan vaihtelevuuskerroin-virheen kuvaajasta n¨ahd¨a¨an, ett¨a lagien 24, 48 ja 72 kohdalla on havaitta- vissa hyvin pienet nousut, mik¨a tarkoittaa ett¨a ennustettavan tunnin virheeseen on pieni - ha- vaittavissa oleva vaikutus sit¨a kolme vuorokautta edelt¨avien samojen kellonaikojen virheill¨a.
0 0.5 1
Sample Autocorrelation
ARMAX-virheen autokorrelaatio
0 10 20 30 40 50 60 70 80
Lag
0 0.5 1
Sample Autocorrelation
LVK-virheen autokorrelaatio
0 10 20 30 40 50 60 70 80
Lag
Kuva 23.Virheiden autokorrelaatiofunktiot
6 YHTEENVETO JA JOHTOP ¨ A ¨ AT ¨ OKSET
T¨ass¨a ty¨oss¨a tutkittiin s¨ahk¨onkulutuksen ennustamista kahden eri mallin avulla ja n¨aist¨a mal- leista parempi ennuste saatiin l¨amp¨otilan vaihtelevuuden kertoimen avulla tehdyll¨a mallilla.
T¨ah¨an saattoi vaikuttaa se, ett¨a yht¨al¨oll¨a (11) laskettavaan uuteen arvoon liittyi ensimm¨ainen sit¨a edelt¨av¨a viikontakainen vastaava hetki, jonka kulutus on todenn¨ak¨oisesti l¨ahell¨a ennustet- tavan hetken todellista kulutusta. ARMAX-ennusteessa jokaiselle ennustettavalle tunnille mal- lin (9) sovitus tehtiin erilaiselle aikasarjalle, mutta samoilla parametrien lukum¨a¨arill¨a, mik¨a toi malliin paljon ep¨avarmuutta. L¨amp¨otilarajoitetun LVK-ennusteenR2-arvo oli 0.94 ja ARMAX- ennusteen 0.81 ja vastaavat MDA- ja MAPE-arvot olivat 0.69, 0.62 ja 6.12 %, 9.75 %.
Ennusteiden virheet eiv¨at noudattaneet normaalijakaumaa t¨aydellisesti joten ennusteeseen liittyy viel¨a jotain mit¨a k¨aytetyt mallit eiv¨at selit¨a eik¨a virhett¨a () voida pit¨a¨a pelkk¨an¨a valkoi- sena kohinana.
LVK-ennustetta voitaisiin kenties parannella valitsemalla edellinen vastaava hetki siten, ett¨a ennustettaessa esimerkiksi keskiviikon kulutusta, valittaisiinkin edellinen p¨aiv¨a eli tiistai.
T¨all¨oin l¨amp¨otilaero voisi olla pienempi, koska aikaeroa on vain 24 tuntia ja tavallisten ar- kip¨aivien v¨alill¨a kulutuksen vaihtelu on pient¨a. Yht¨al¨o¨on (11) voitaisiin lis¨at¨a my¨os p¨aiv¨anvalo- erosta johtuva termi ja laskea vastaavasti p¨aiv¨an pituuden vaihtelevuuskerroin. P¨aiv¨anvalon
v¨ahentyess¨a kyseinen termi kasvattaisi kulutusta kuten l¨amp¨otilaeron termikin mik¨ali vaihte- levuuskertoimelle saadaan negatiivinen arvo.
ARMAX-ennustetta varten voitaisiin etsi¨a optimaalinen termien lukum¨a¨ar¨a vuorokauden v¨alein (tai laskentatehon salliessa useammin) ja ennustaa n¨aill¨a termien lukum¨a¨arill¨a seuraavat 24 tuntia ja sitten sama uudestaan. Molemmissa ennusteissa muuttujien vaikutus oli lineaaris- ta (todettiin korrelaatiokertoimienkin avulla). ARMAX-mallissa voitaisiin esimerkiksi k¨aytt¨a¨a riippumattomalle muuttujalle muotoaXt2. L¨amp¨otilamuuttujan tapauksessa se suurentaisi iso- jen l¨amp¨otilaerojen kohdalla ennustetta huomattavasti. ARMAX-virheess¨a (kuva 8) on paljon yli 30 yksik¨on piikkej¨a koko vuoden ajalla, mutta erityisen suuria piikkej¨a on talviaikaan al- kuvuodesta, jolloin l¨amp¨otilaero viikkojen v¨alill¨a voi olla suurta. Toisen asteen termi saattaisi korjata t¨all¨aisia ennustearvoja.
squares support vector machines”, International Journal Of Electrical Power & Energy Systems 67, pages 431-438.
[2] Diyar Akay & Mehmet Atak, 2007. ”Grey prediction with rolling mechanism for elect- ricity demand forecasting of Turkey”, Energy, Elsevier, vol. 32(9), pages 1670-1675.
[3] Zaid Mohamed & Pat Bodger, 2004. ”Forecasting electricity consumption a comparison of models for New Zealand”, https://www.researchgate.net/publication/29487453
[4] Hsiao-Tien Pao, 2009. ”Forecasting of electricity consumption and economic growth in Taiwan by state space modeling”, Energy, Elsevier, vol. 34(11), pages 1779-1791.
[5] Philip Kofi Adom & William Bekoe, 2012. ”Conditional dynamic forecast of elctrical ener- gy consumption requirements in Ghana by 2020: A comparison of ARDL and PAM”, Energy, Elsevier, vol. 44(1), pages 367-380.
[6] Henrik Madsen,Time Series Analysis(Chapman & Hall/CRC, Boca Raton, 2008)
[7] George E.P. Box, Gwilym M. Jenkins,Time series analysis: forecasting and control(Holden- Day, San Francisco, 1976)
[8] Vincenzo Bianco, Oronzio Manca, Sergio Nardini & Alina A. Minea, 2010. ”Analysis and forecasting of nonresidential electricity consumption in Romania”, Energy, Elsevier, vol.
87(11), pages 3584-3590.
[9] Fabiano Castro Torrini, Reinaldo Castro Souza, Fernando Luiz Cyrino Oliveira & Jose Francisco Moreira Pessanha, 2016. ”Long term electricity consumption forecast in Brazil: A fuzzy logic approach”, Energy, Elsevier, vol. 54, pages 18-27.
1 ARMAX-ennusteen tilastollisia arvoja . . . 17 2 ARMAX-virheen p¨aiv¨akohtaiset keskiarvot ja keskihajonnat . . . 19 3 L¨amp¨otilan vaihtelevuuden kertoimella toteutetun ennusteen tilastolliset arvot . 25 4 L¨amp¨otilan vaihtelevuuden kertoimella toteutetun ennustevirheen p¨aiv¨akohtaiset
tulokset . . . 25 5 Ennusteiden tilastollisten tunnuslukujen vertailu . . . 27
1 S¨ahk¨onkulutus, l¨amp¨otila ja p¨aiv¨anvalon m¨a¨ar¨a 1.1.2014 - 31.12.2017 . . . 7 2 S¨ahk¨onkulutus ajanjaksolla ma 2.6.2014 - su 8.6.2014 . . . 8 3 Kulutuksen ja l¨amp¨otilan sirontakuvaajasta n¨ahd¨a¨an kulutuksen pienenev¨an l¨amp¨otilan
noustessa. . . 9 4 Kulutuksen ja p¨aiv¨an pituuden sirontakuvaajasta n¨ahd¨a¨an kulutuksen piene-
nev¨an p¨aiv¨an valon m¨a¨ar¨an noustessa. . . 9 5 Esimerkki additiivisesta aikasarjahajotelmasta . . . 11 6 ARMAX(5,2,[4,4],[3,4]) Toteuma ja ennuste ajanjaksolle sunnuntai 1.1.2017
klo 0.00 - maanantai 2.1.2017 klo 12 . . . 15 7 Vuoden 2017 ARMAX(4,4,4,4,4,4)- ennuste ja todellinen kulutus . . . 16 8 ARMAX(4,4,4,4,4,4)-virhe vuodelle 2017. . . 17 9 ARMAX-virheen histogrammi ja siihen sovitettu normaalijakauman tiheysfunk-
tio. Tiheysfunktio ja histogrammi eiv¨at osu kohdakkain eli virhe ei ole normaa- listi jakautunut. . . 18 10 ARMAX-virheen p¨aiv¨akohtaiset empiiriset tiheysfunktiot. . . 18 11 ARMAX-virheen empiiriset tiheysfunktiot vuorokaudenaikojen kesken. Mer-
kitt¨av¨a¨a eroa ei ole havaittavissa eri ajankohtien v¨alill¨a. . . 19 12 Yli 10 yksik¨on ARMAX-virheiden jakautuminen . . . 20 13 L¨amp¨otilan vaihtelevuus-ennuste ja todellinen s¨ahk¨onkulutus vuonna 2017. Vas-
taavissa hetkiss¨a ei rajoitettuna l¨amp¨otilaa ylh¨a¨alt¨ap¨ain. . . 21 14 L¨amp¨otilan vaihtelevuuden kertoimella tehtyjen ennusteiden virheet. Molem-
mat ovat l¨ahell¨a nollaa. . . 22 15 Molempien ennusteiden virheiden histogrammit ja vastaavat tiheysfunktiot. Ti-
heysfunktiot eiv¨at osu kohdakkain histogrammin kanssa kuten ei my¨osk¨a¨an ARMAX-virheen tapauksessa. . . 23 16 L¨amp¨otilan vaihtelevuuden kerroin-ennusteen empiiriset tiheysfunktiot. Eri v¨areill¨a
on eritelty eri viikonp¨aiv¨at. Ensimm¨aisess¨a kuvassa korkeimpina ovat maanan- tai, tiistai ja sunnuntai, joiden keskihajonnat ovat pienimm¨at (taulukko 4a). . . . 23 17 LVK-virheiden empiiriset tiheysfunktiot vuorokaudenaikojen mukaan. Merkitt¨av¨a¨a
eroa ei ole havaittavissa eri vuorokaudenaikojen ennustevirheiss¨a. . . 24 18 Ennustehetken ja vastaavan hetken v¨alinen l¨amp¨otilaero . . . 24 19 Yli 10 yksik¨on ennustusvirheiden jakautuminen, kun l¨amp¨otilaeroja ei rajoiteta 26 20 Yli 10 yksik¨on ennustusvirheiden jakautuminen, kun l¨amp¨otilaerot rajoitettu . . 26 21 ARMAX- ja l¨amp¨otilan vaihtelevuuden kerroin-ennusteiden virheet . . . 27
keampi ja kapeampi. . . 28 23 Virheiden autokorrelaatiofunktiot . . . 29