• Ei tuloksia

Sähkönkulutuksen ennustaminen

N/A
N/A
Info
Lataa
Protected

Academic year: 2022

Jaa "Sähkönkulutuksen ennustaminen"

Copied!
34
0
0

Kokoteksti

(1)

Laskennallisen tekniikan koulutusohjelma Kandidaatinty¨o

Joona Paronen

S¨ahk¨onkulutuksen ennustaminen

Ohjaaja: Tutkijatohtori, TkT Matylda Jablonska-Sabuka

(2)

Lappeenrannan-Lahden teknillinen yliopisto School of Engineering Science

Laskennallisen tekniikan koulutusohjelma Joona Paronen

S¨ahk¨onkulutuksen ennustaminen

Kandidaatinty¨o 2019

31 sivua, 23 kuvaa, 5 taulukkoa

Ohjaaja: Tutkijatohtori, TkT Matylda Jablonska-Sabuka

Avainsanat: S¨ahk¨onkulutus, vastaava hetki, ARMAX, l¨amp¨otilan vaihtelevuuden kerroin

Kandidaatinty¨on tavoitteena oli ennustaa er¨a¨an paikkakunnan tunnittaista s¨ahk¨onkulutusta k¨aytt¨aen ennusteen pohjana s¨ahk¨onkulutus-, l¨amp¨otila- ja p¨aiv¨anvalodataa kolmelta aiemmalta vuodelta.

S¨ahk¨onkulutusta ennustettiin k¨aytt¨aen kahta eri mallia; ARMAX-mallia ja l¨amp¨otilan vaihtele- vuuden kerrointa. ARMAX-ennusteessa k¨aytettiin selitt¨avin¨a muuttujina l¨amp¨otilaa ja p¨aiv¨an pituutta.

Molemmissa ennusteissa k¨aytettiin l¨aht¨okohtana ”vastaavia hetki¨a” eli ennustettaessa kulu- tusta tietylle tunnille, k¨aytettiin ennustemallin m¨a¨aritt¨amisess¨a niit¨a hetki¨a historiassa, joilla oli sama viikonp¨aiv¨a, kellonaika ja p¨aiv¨an tyyppi.

Ennusteet tehtiin numeerisesti k¨aytt¨aen Matlab-ohjelmaa ja ennusteiden virheit¨a sek¨a nii- den jakautumisia vertailtiin eri p¨aivien ja kellonaikojen kesken. Tulokset osoittivat, ett¨a l¨amp¨otilan vaihtelevuuden kertoimella saadaan tarkempi ennuste kuin ARMAX-ennusteella, kun mallien tarkkuutta arvioitiin k¨aytt¨aenR2-, RMSE-, MDA- ja MAPE-arvoja, joilla l¨amp¨otilan vaihtele- vuusennuste tuotti jokaisella parempia arvoja.

(3)

Symboli- ja lyhenneluettelo 4

1 JOHDANTO 5

1.1 Taustaa . . . 5

1.2 Tavoitteet . . . 5

1.3 Ty¨on rakenne . . . 5

2 KIRJALLISUUSKATSAUS 6 3 AINEISTO 7 4 MALLIEN TEORIAA 10 4.1 Yleist¨a aikasarjoista . . . 10

4.2 Aikasarjahajotelma . . . 10

4.3 Stationaarisuus . . . 11

4.4 Er¨ait¨a malleja . . . 12

4.4.1 Autoregressive (AR) . . . 12

4.4.2 Moving average (MA) . . . 12

4.4.3 ARMAX . . . 12

4.5 L¨amp¨otilan vaihtelevuuden kerroin . . . 13

4.6 Tilastolliset tunnusluvut . . . 14

5 TULOKSET JA ANALYSOINTI 15 5.1 Ohjelmisto . . . 15

5.2 ARMAX . . . 15

5.3 L¨amp¨otilan vaihtelevuuden kerroin . . . 21

5.4 Vertailu . . . 27

6 YHTEENVETO JA JOHTOP ¨A ¨AT ¨OKSET 29

L ¨AHTEET 31

Taulukot 32

Kuvat 33

(4)

AR Autoregressive

MA Moving average

ARMA Autoregressive moving average

ARMAX Autoregressive moving average with exogenous variable ARIMA Autoregressive integrated moving average

AIC Akaike information criterion ρ Korrelaatiokerroin

Yt Riippuva muuttuja

Xt Riippumattomat muuttujat p AR-termien m¨a¨ar¨a

q MA-termien m¨a¨ar¨a

b Riippuvaan muuttujaan vaikuttavan riippumattoman muuttujan termien m¨a¨ar¨a τ Riippumattoman muuttujan viivetermien m¨a¨ar¨a

Virhe/h¨airi¨o

σ Keskihajonta

φ AR-parametrit

θ MA-parametrit

ω Riippumattoman muuttujan parametrit B Siirto-operaattori

k L¨amp¨otilan vaihtelevuuskerroin R2 Selitysaste

RMSE Root mean squared error MDA Mean directional accuracy MAPE Mean absolute percentage error

(5)

1 JOHDANTO

Ty¨on tarkoituksena on tutkia er¨a¨an paikkakunnan s¨ahk¨onkulutusta sek¨a siihen liittyvien te- kij¨oiden vaikutusta ja pyrki¨a luomaan l¨ahihistorian perusteella ennuste tulevasta kulutukses- ta. P¨aivitt¨aiseen ja tunnittaiseen s¨ahk¨on tarpeeseen vaikuttaa oleellisesti l¨amp¨otila, p¨aivitt¨aisen luonnonvalon m¨a¨ar¨a ja p¨aiv¨an luonne (pyh¨a vai arki).

1.1 Taustaa

S¨ahk¨onkulutuksen valvonta ja tarkastelu on yhteiskunnallisesti merkitt¨av¨a¨a. Jokaisen valtion toiminnot vaativat p¨aivitt¨ain s¨ahk¨o¨a moneen eri tarkoitukseen kuten liikenteeseen, infrastruk- tuuriin, tietoverkkojen toimintaan sek¨a kuluttajien yksityisk¨aytt¨o¨on.

S¨ahk¨o¨a tuotetaan monella eri tavalla ja usein on taloudellisesti kannattavaa tiet¨a¨a paljonko s¨ahk¨o¨a milloinkin tarvitaan eri paikoissa. Liian alhainen tuotanto voi johtaa s¨ahk¨okatkoihin ja ylituotanto kuluttaa resursseja tarpeettomasti. Molemmista tapauksista koituu ylim¨a¨ar¨aisi¨a kus- tannuksia, mink¨a vuoksi jokap¨aiv¨aiset kulutusennusteet ovat tarpeellisia.

1.2 Tavoitteet

Ty¨on pohjatietoina on s¨ahk¨onkulutus-, l¨amp¨otila- ja p¨aiv¨anvalodataa tunnin v¨alein vuoden 2014 alusta vuoden 2018 kes¨a¨an asti. T¨ass¨a ty¨oss¨a tarkoituksena on ennustaa s¨ahk¨onkulutusta vuodel- le 2017 k¨aytt¨aen edellist¨a kolmea vuotta mallintamisessa. Tavoitteena on luoda kaksi eri mallia, joilla pyrit¨a¨an ennustamaan s¨ahk¨onkulutus mahdollisimman tarkasti. Lopuksi vertaillaan en- nusteita sek¨a niiden virheit¨a ja arvioidaan kummalla saadaan parempia tuloksia. Ennusteiden hyvyytt¨a arvioidaan k¨aytt¨aenR2-, RMSE-, MDA- ja MAPE-arvoja.

1.3 Ty¨on rakenne

T¨am¨a kandidaatinty¨o esittelee ensin toisessa kappaleessa aiheeseen liittyvi¨a julkaisuja, mink¨a j¨alkeen kolmannessa kappeleessa esitell¨a¨an t¨am¨an ty¨on aineisto eli k¨aytetty data. Nelj¨anness¨a kappaleessa k¨ayd¨a¨an l¨api teoriaa ja ty¨oss¨a k¨aytettyj¨a malleja. Viides kappale on laajin ja se k¨asittelee tuloksia ja niiden analysointia. Tuloksista ja mahdollisista mallien parantelukeinoista keskustellaan kuudennessa kappaleessa.

(6)

2 KIRJALLISUUSKATSAUS

S¨ahk¨onkulutusta on ennustettu monilla eri menetelmill¨a k¨aytt¨okohteesta riippuen. Fazil Kay- tez et al. ennustivat Turkin s¨ahk¨onkulutusta k¨aytt¨aen LS-SVM eli least squares support vector machine-mallia [1]. Ennusteessa k¨aytettiin selitt¨avin¨a riippumattomina muuttujina muun muas- sa tuotetun s¨ahk¨on bruttom¨a¨ar¨a¨a ja asiakkaiden sek¨a v¨akiluvun m¨a¨ar¨a¨a. Sen lis¨aksi rinnalla teh- tiin ennuste k¨aytt¨aen regressiivist¨a mallia ja ANN-mallia (artificial neural network). Tuloksista k¨avi ilmi, ett¨a LS-SVM tuotti parhaimman tuloksen.

My¨os Turkin valtiollisen instituution omaa MAED-mallia (model of analysis of the energy demand) verrattiin GPRM-malliin (grey prediction with rolling mechanism) ja GPRM:n todet- tiin antavan tarkempia tuloksia [2].

GPRM-mallia k¨aytettiin my¨os Holt-Winters-metodin ohella Romanian vuotuisen kulutuk- sen ennustamisessa [8]. Ennusteissa ei k¨aytetty ylim¨a¨ar¨aisi¨a selitt¨avi¨a riippumattomia muut- tujia vaan ennusteet tehtiin perustuen pelk¨ast¨a¨an aiempiin kulutustietoihin. Ennusteita vertail- tiin k¨aytt¨aen tunnuslukuina suhteellista virhett¨a (RE), MAPE (mean absolute percentage error), MAD (mean absolute deviation) ja MSE. Molempien mallien todettiin antavan k¨aytt¨okelpoisia, l¨ahes yht¨a hyvi¨a tuloksia noin 5 %:n suhteellisella virheell¨a.

Mohamed & Bodger [3] tutkivat Uuden-Seelannin s¨ahk¨onkulutusta kuudella eri tavalla, joita olivat muun muassa Box-Jenkinsin kehittelem¨a ARIMA-malli, Harveyn logistinen malli ja regressiivinen malli, jossa k¨aytettiin selitt¨avin¨a riippumattomina muuttujina s¨ahk¨on hintaa, bruttokansantuotetta ja v¨akilukua. Harveyn logistisen mallin todettiin antavan parhaan tuloksen.

Pidemm¨an aikav¨alin ennusteessa ECSTSP (error-correction state space model) ja tavalli- nen STSP antavat paremman ennusteen kuin SARIMA (seasonal ARIMA) [4]. Niit¨a vertailtiin kuudella eripituisella ennustejaksolla ja tuloksissa havaittiin, ett¨a STSP-mallit olivat tarkempia ennustejakson pidentyess¨a. Lyhyill¨a ajanjaksoilla kaikki mallit antoivat yht¨a tarkkoja tuloksia.

Er¨as tulosten tunnusluvuista oli MAPE, jonka pienimm¨at arvot saatiin ECSTSP-mallia k¨aytt¨aen.

S¨ahk¨onkulutusta on ennustettu my¨os taloudellisia tekij¨oit¨a k¨aytt¨aen [5]. Malleina olivat ARDL (autoregressive distributed lag model) ja PAM (partial adjustment model), joissa riip- pumattomina muuttujina k¨aytettiin nettotuloja/asukas, teollisuuden tehokkuutta ($/GWh), teol- lisuuden osuutta bruttokansantuotteesta (%) ja kaupungistumisastetta. Molemmissa malleissa todettiin, ett¨a pitk¨all¨a aikav¨alill¨a tulot ja kaupungistumisaste m¨a¨aritteliv¨at suurimmaksi osaksi kulutuksen kehittymisen. Lyhyell¨a aikav¨alill¨a molempien ennusteiden hallitsevin muuttuja oli tulot ja sen j¨alkeen eniten vaikuttivat kaupungistuminen ja teollisuuden tehokkuus.

Brasiliassa on tutkittu s¨ahk¨onkulutusta hajautetusti k¨aytt¨aen sumeaa logiikkaa ja vertailu- malleina Holt Two-parameter-metodia ja paikallisen Energy Research Companyn (EPE) tuot- tamia malleja [9]. Kulutusta ennustettiin erikseen kuluttajien, teollisuuden ja muiden sektorien kesken. MAPE-arvoja k¨aytt¨aen havaittiin sumean logiikan tuottavan parempia tuloksia, mutta ennustettaessa muiden sektorien kulutusta niin Holt-menetelm¨a antoi paremman tuloksen.

(7)

Edell¨a mainituista julkaisuista poiketen t¨ass¨a ty¨oss¨a ennusteiden l¨aht¨okohtana on ”vastaa- vien” hetkien k¨aytt¨o. Ennustettavan kulutustunnin vastaava hetki tarkoittaa aikaisempaa ajan- hetke¨a, jolla on sama kellonaika, viikonp¨aiv¨a ja p¨aiv¨an tyyppi. Vastaavien hetkien k¨aytt¨o perus- tuu oletukseen, ett¨a esimerkiksi pyh¨ap¨aivin¨a s¨ahk¨onkulutus on pienemp¨a¨a kuin arkena, koska t¨all¨oin kuluttajat ovat todenn¨ak¨oisemmin kotona ja teollisuuden s¨ahk¨on k¨aytt¨o on v¨ah¨aisemp¨a¨a.

T¨am¨an vuoksi ennustettaessa esimerkiksi tiistain kulutusta, on sopivaa k¨aytt¨a¨a ennusteen mal- lissa edellisten tiistai arkip¨aivien kulutuslukemia. Tuntitasolla kulutus vaihtelee vuorokaude- naikojen mukaan, mink¨a vuoksi vastaavissa hetkiss¨a otetaan huomioon my¨os kellonaika. Poik- keusp¨aivin¨a eli pyh¨an¨a, joka ei osu sunnuntaille, edelliseksi vastaavaksi hetkeksi valitaan sun- nuntai.

3 AINEISTO

Ty¨oss¨a k¨aytett¨av¨a¨an aineistoon kuuluu er¨a¨an paikkakunnan s¨ahk¨onkulutus, l¨amp¨otila ja p¨aiv¨an pituus. Jokaisessa muuttujassa on havaittavissa selke¨a jaksollisuus, joka on yhden vuoden mit- tainen. L¨amp¨otila ja p¨aiv¨anvalon m¨a¨ar¨a vaikuttavat s¨ahk¨onkulutukseen k¨a¨anteisesti; niiden ol- lessa pienimmill¨a¨an s¨ahk¨onkulutus on suurimmillaan. Kuvassa 1 esitet¨a¨an kaikki ty¨oss¨a k¨aytett¨av¨a data.

1/2014 1/2015 1/2016 1/2017

100 200

Sähkönkulutus

Sähkönkulutus 1.1.2014-31.12.2017

1/2014 1/2015 1/2016 1/2017

-20 0 20

Lämpötila

Lämpötila

1/2014 1/2015 1/2016 1/2017

6 8 10 12 1416 18

Päivän pituus

Päivänvalon määrä tunteina

Kuva 1.S¨ahk¨onkulutus, l¨amp¨otila ja p¨aiv¨anvalon m¨a¨ar¨a 1.1.2014 - 31.12.2017

(8)

Vuositason jaksollisuuden lis¨aksi kulutuksessa esiintyy my¨os p¨aiv¨akohtaista jaksollisuutta. Y¨oll¨a kulutus on yleens¨a pienemp¨a¨a kuin p¨aiv¨all¨a ja p¨aiv¨asaikaan kulutuksessa on my¨os havaittavissa piikkej¨a. Er¨a¨an viikon s¨ahk¨onkulutus on esitettyn¨a kuvassa 2.

0 24 48 72 96 120 144 168

Aika tunteina viikon alusta 35

40 45 50 55 60 65 70

Sähkönkulutus

Sähkönkulutuksen jaksollisuus viikkotasolla

Kuva 2.S¨ahk¨onkulutus ajanjaksolla ma 2.6.2014 - su 8.6.2014

Kuvasta 2 on havaittavissa, ett¨a viikonloppuna kulutus on hieman v¨ah¨aisemp¨a¨a, koska useat teollisuuslaitokset ovat silloin poissa toiminnasta. Viikonloppuiltoina yleens¨a l¨ammitet¨a¨an sau- noja, joka voi selitt¨a¨a lauantai- ja sunnuntai-iltojen kulutuspiikkej¨a.

L¨amp¨otilan ja p¨aiv¨anvalon m¨a¨ar¨an k¨a¨anteinen vaikutus s¨ahk¨onkulutukseen on esitetty ku- vissa 3 ja 4. Silm¨am¨a¨ar¨aisesti ja muuttujien v¨alisten Pearsonin korrelaatiokertoimien avulla voi- daan huomata, ett¨a s¨ahk¨onkulutuksen ja l¨amp¨otilan sek¨a s¨ahk¨onkulutuksen ja p¨aiv¨an pituuden v¨alill¨a on olemassa kohtalaista lineaarista riippuvuutta. Riippuvuus on suurempaa kulutuksen ja l¨amp¨otilan v¨alill¨a, koska l¨ammitys vie paljon s¨ahk¨o¨a ja kylm¨all¨a s¨a¨all¨a se on p¨a¨all¨a riippumatta kuinka valoisaa on.

(9)

-30 -20 -10 0 10 20 30 Lämpötila

40 60 80 100 120 140 160 180 200 220

Sähkönkulutus

Sähkönkulutuksen ja lämpötilan sirontakuvaaja = -0.83215

Kuva 3.Kulutuksen ja l¨amp¨otilan sirontakuvaajasta n¨ahd¨a¨an kulutuksen pienenev¨an l¨amp¨otilan noustessa.

6 8 10 12 14 16 18

Päivän pituus 40

60 80 100 120 140 160 180 200 220

Sähkönkulutus

Sähkönkulutuksen ja päivän pituuden sirontakuvaaja = -0.73848

Kuva 4.Kulutuksen ja p¨aiv¨an pituuden sirontakuvaajasta n¨ahd¨a¨an kulutuksen pienenev¨an p¨aiv¨an valon m¨a¨ar¨an noustessa.

(10)

4 MALLIEN TEORIAA

4.1 Yleist¨a aikasarjoista

Aikasarja on joukko dataa, jota havainnoidaan tietyin aikav¨alein. Niit¨a k¨aytet¨a¨an paljon esimer- kiksi teollisuudessa, jossa mitataan jotain prosessiin liittyv¨a¨a suuretta ottamalla n¨ayte tietyin aikav¨alein. My¨os p¨orssikursseja kuvataan aikasarjoina, joissa mitataan esimerkiksi osakkeen arvoa p¨aivitt¨ain. Usein aikasarja esitet¨a¨an visuaalisesti piirt¨am¨all¨a datapisteet koordinaatistoon, jossa vaaka-akselilla on tietty¨a arvoa vastaava ajanhetki.

Aikasarjojen analysointi on t¨arke¨a¨a niiden taustalla olevien prosessien ymm¨art¨amisen, hal- linnan ja tulevien arvojen ennustamisen kannalta.

4.2 Aikasarjahajotelma

Aikasarjojen analyysiin on useita l¨ahestymistapoja, joista yksi on sarjan hajottaminen eri kom- ponentteihin, joita voidaan k¨asitell¨a eri tavoin. Mitattavaan muuttujaan voi liitty¨a erikseen ylei- nen muoto, jota datan keskiarvo mukailee tai kausittaista vaihtelua. Yleinen additiivinen hajo- telma [6] on:

Yt =Tt+St+Ct+It, jossa:

Yt = havaittu signaali hetkell¨at

Tt = trendi eli yleinen muoto, jonka mukaan muuttujanY keskiarvo muuttuu. (trend) St = kausittainen vaihtelu (seasonal)

Ct = syklinen vaihtelu, jota voi esiinty¨a kausivaihtelun lis¨aksi (cyclic) It = ep¨as¨a¨ann¨ollinen h¨airi¨o (irregular)

Kuvassa 5 esitet¨a¨an esimerkki additiivisest¨a hajotelmasta.

(11)

20 25 Yt

Havaittu signaali

19 20 21 Tt

Trendi

-2 0 2 St

Kausittainen vaihtelu

-2 0 2 It 4

Epäsäännöllinen häiriö

Kuva 5.Esimerkki additiivisesta aikasarjahajotelmasta

Kun tiedet¨a¨an trendin ja jaksollisuuden k¨aytt¨aytymisen tarkastelualueella olevan pysyv¨a¨a, voi- daan rajoittaa analyysi h¨airi¨o¨on. Sen tulevien arvojen ennustamiseen liittyy kuitenkin rajoituk- sia.

4.3 Stationaarisuus

Stationaarisuus tarkoittaa etteiv¨at muuttujan tilastolliset arvot muutu ajan kuluessa. Se on en- nusteen kannalta v¨altt¨am¨at¨ont¨a, koska mallinnukseen k¨aytett¨av¨an datan on pysytt¨av¨a stabiilina.

Keskiarvon ja varianssin on siis pysytt¨av¨a samoina ja t¨all¨oin ennustetta tehdess¨a voidaan olettaa muuttujan ominaisuuksien olevan samat kuin aiemmin.

Ei-stationaarisen aikasarjan muuttamiseen stationaariseksi on olemassa keinoja kuten loga- ritmimuunnos tai differenssin ottaminen datasta. 1. differenssin ottaminen luo aikasarjan, jossa termit ovat erotuksia alkuper¨aisen sarjan termien v¨alill¨a.

∆Yt=Yt−Yt−1

(12)

4.4 Er¨ait¨a malleja

Seuraavia malleja kutsutaan usein my¨os Box-Jenkins-malleiksi niiden kehitt¨ajien mukaan [7].

4.4.1 Autoregressive (AR)

AR(p) eli autoregressive -prosessi on lineaarinen prosessi, jota kuvaa differenssiyht¨al¨o

Yt=t1Yt−1+...+φpYt−p (1) Yht¨al¨oss¨aton h¨airi¨otermi jaφiovat kertoimia. Parametripm¨a¨ar¨a¨a kuinka monta edelt¨av¨a¨a ter- mi¨a otetaan huomioon. Mallia sanotaan autoregressiiviseksi, koskaYt riippuu edellisist¨a omista arvoistaan. Yht¨al¨o voidaan my¨os kirjoittaa siirto-operaattorinBavulla, jolloin yht¨al¨o saadaan kirjoitettua polynomimuotoon ja pon kerroinpolynominφ(B)aste.

Yt−φ1Yt−1−...−φpYt−p=t (1−φ1B−...−φpBp)Yt=t

φ(B)Yt=t (2)

4.4.2 Moving average (MA)

MA(q) eli moving-average -prosessi on lineaarinen prosessi, jossa riippuva muuttuja Yt on h¨airi¨otermien yhdistelm¨a.

Yt=t1t−1+...+θqt−q (3)

Ja siirto-operaattorin avulla lausuttuna:

Yt = (1+θ1B+...+θqBq)t

Yt =θ(B)t (4)

4.4.3 ARMAX

ARMA(p,q)-prosessi on kahden edellisen yhdistelm¨a

Yt1Yt−1+...+φpYt−p=t1t−1+...+θqt−q (5) φ(B)Yt=θ(B)t (6)

Ja ARMAX(p,q,b) on malli, jossa muuttujaanYt liittyy lis¨aksi yksi tai useampi ylim¨a¨ar¨ainen

(13)

riippumaton muuttujaXt. Parametribm¨a¨ar¨a¨a montako termi¨a vaikuttaa riippuvaan muuttujaan Yt jaωiovat riippumattoman muuttujan kertoimia.

Yt1Yt−1+...+φpYt−p1Xt−τ+...+ωbXt−τ−b+1+t1t−1+...+θqt−q (7) φ(B)Yt =ω(B)Xt−τ+θ(B)t (8) Aiemmin todettiin kulutuksella olevan riippuvuutta l¨amp¨otilan ja p¨aiv¨an pituuden kanssa joten k¨aytet¨a¨an s¨ahk¨onkulutusta ennustettaessa riippumattomina muuttujina l¨amp¨otilaaX1,tja p¨aiv¨an pituuttaX2,t. Muuttujaτ on viivetermien m¨a¨ar¨a ennenkuin riippumaton muuttuja alkaa vaikut- tamaan ennustettavaan muuttujaanYt.

Sovitetaan siis s¨ahk¨onkulutusdataan malli ARMAX(p,q,b1,b212).

φ(B)Yt1(B)X1,t−τ12(B)X2,t−τ2+θ(B)t (9)

4.5 L¨amp¨otilan vaihtelevuuden kerroin

K¨aytet¨a¨an ennusteen teossa poikkeavaa tapaa, joka ei hajota datajoukkoa eri tekij¨oihin tai mal- linna sit¨a. Sen sijaan tehd¨a¨an ennuste k¨aytt¨aen niin kutsuttua l¨amp¨otilan vaihtelevuuden ker- rointa, miss¨a l¨aht¨okohtana on vastaavien hetkien k¨aytt¨o. M¨a¨aritet¨a¨an kerroin laskemalla jokais- ta s¨ahk¨onkulutustuntiaYivastaava kerroinKi, joka kuvaa kulutus- ja l¨amp¨otilaeron suhdetta.

Ki= Yi−Yi˜

X1,i−X1,i˜ (10)

Yi = s¨ahk¨onkulutus tunnillai

Y˜i = s¨ahk¨onkulutus edellisell¨a vastaavalla hetkell¨a X1,i = l¨amp¨otila hetkell¨ai

X1,i˜ = l¨amp¨otila edellisell¨a vastaavalla hetkell¨a

Otetaan keskiarvo kaikistaK-arvoistak= N1Nj=1Kj, josta saadaan kerroink. N on kertoimien Ki m¨a¨ar¨a. Approksimoidaan seuraavan ajanhetkent kulutusta kertomalla nykyisen l¨amp¨otilan ja edellisen vastaavan l¨amp¨otilan erotusta kertoimellak.

Yt =Yt˜+ (X1,t−X1,˜t)k (11)

(14)

4.6 Tilastolliset tunnusluvut

Mallien sopivuutta voidaan arvioida selitysasteen avulla. Sen laskemiseksi tarvitaan pienimpi¨a neli¨osummia.

SST =

n i=1

(yi−y)¯ 2 SSE=

n

i=1

2i

SST:n (total sum of squares) ja SSE:n (error sum of squares) avulla saadaan selitysaste:

R2=1−SSE SST

Selitysaste kuvaa suhteellisesti kuinka paljon paremmin malli sopii dataan kuin siin¨a tapaukses- sa, jossa mallina k¨aytett¨aisiin pelkk¨a¨a datan keskiarvoa. Er¨as toinen mittari mallin hyvyydelle on RMSE (root mean squared error).

RMSE=√

MSE= s

ni=12i n

Suhteellisen virheen keskim¨a¨ar¨aist¨a arvoa kuvaa MAPE (mean absolute percentage error).

MAPE= 1 n

n

i=1

yi−yˆi yi

Usein on hy¨odyllist¨a tiet¨a¨a antaako ennuste todellista arvoa suuremman vai pienemm¨an tulok- sen. MDA (mean directional accuracy) on tunnusluku, joka kuvaa todenn¨ak¨oisyytt¨a sille, ett¨a ennustettu arvo on samaan suuntaan kuin todellinen arvo. Eli jos seuraava ennustettu ja toteutu- nut arvo ovat molemmat kasvaneet edelliseen n¨ahden niin voidaan sanoa ennusteen osoittavan samaan suuntaan.

MDA= 1 n

n i=1

lsgn(yi−yi−1)==sgn(yˆi−yi−1)

Yht¨al¨oiss¨ayon todellinen arvo, ˆyon ennustettu arvo,sgnon signum-funktio jalon indikaatto- rifunktio, mitk¨a m¨a¨aritell¨a¨an:

la=





1, a=1 0, a=0

sgn(a) =













1, a>0 0, a=0

−1, a<0

(15)

5 TULOKSET JA ANALYSOINTI

5.1 Ohjelmisto

Aikasarjojen analysointi ja ennusteet tehtiin numeerisesti k¨aytt¨aen MATLAB ®-ohjelmaa ja erityisesti senSystem IdentificationjaEconometrics-osien sis¨alt¨ami¨a ty¨okaluja.

5.2 ARMAX

S¨ahk¨onkulutusdataan sovitettiin yht¨al¨on (9) mukainen malli. Ennuste tehtiin siten, ett¨a koko da- tasta poimittiin ennustettavaa hetke¨a vastaavat aiemmat hetket, joille tehtiin ARMAX-sovitus ja laskettiin ennusteen arvo yhden ajanjakson eteenp¨ain kyseiselle aikasarjalle. Vastaavat het- ket oli m¨a¨aritelty viikon v¨alein (poislukien erikoistapaukset) eli ennustettiin jokaisella kerralla viikko eteenp¨ain. Yhteens¨a toimenpide toistettiin siis vuoden tuntien verran eli 8760 kertaa.

Kuvassa 6 on esitetty ensimm¨aiset 36 ennustuspistett¨a.

0 2 4 6 8 10 12 14 16 18 22 0 2 4 6 8 10 12 kellonaika

85 90 95 100 105 110 115 120 125 130

sähkönkulutus

Vuoden 2017 36 ensimmäistä tuntia

Ennuste

Todellinen kulutus

Kuva 6.ARMAX(5,2,[4,4],[3,4]) Toteuma ja ennuste ajanjaksolle sunnuntai 1.1.2017 klo 0.00 - maanantai 2.1.2017 klo 12

Termien lukum¨a¨ar¨an optimaalinen haku kuvan 6 ennustetta varten suoritettiin AIC-menetelm¨a¨a [6] k¨aytt¨aen. Termien lukum¨a¨ar¨a haettiin ensimm¨aisen ennustettavan tunnin vastaavien hetkien

(16)

aikasarjalle ja n¨ait¨a parametrien lukum¨a¨ari¨a p,q,b1,b212 k¨aytettiin ensimm¨aiselle 36:lle tunnille. Pian t¨am¨an j¨alkeen ennuste alkoi poikkeamaan todellisista arvoista huomattavasti, mink¨a vuoksi p¨a¨adyttiin tekem¨a¨an overfit-ratkaisu, jossa asetettiin termien lukum¨a¨ar¨at samoik- si ja tutkittiin, mill¨a arvoilla saadaan paras lopputulos. Kuvassa 7 on ennuste, jossa kaikkien termien lukum¨a¨ar¨aksi on asetettu nelj¨a. Silm¨am¨a¨ar¨aisesti ennuste pysyy toteuman vuositason muotoa mukailevana.

1/17 2/17 3/17 4/17 5/17 6/17 7/17 8/17 9/17 10/17 11/17 12/17

Aika 20

40 60 80 100 120 140 160 180

Sähkönkulutus

ARMAX-kulutusennuste

Ennuste Oikea kulutus

Kuva 7.Vuoden 2017 ARMAX(4,4,4,4,4,4)- ennuste ja todellinen kulutus

Ennustevirhe laskettiin v¨ahent¨am¨all¨a todellisesta kulutuksesta ennustettu arvo ( ˆYt) t=Yt−Yˆt

Eli positiivinen virheen arvo tarkoittaa ennusteen antavan liian alhaisen arvon. Kuvassa 8 on esitetty ennusteen virhe.

(17)

1/17 2/17 3/17 4/17 5/17 6/17 7/17 8/17 9/17 10/17 11/17 12/17

Aika -40

-20 0 20 40 60

Ennustevirhe

ARMAX-ennusteen virhe

Kuva 8.ARMAX(4,4,4,4,4,4)-virhe vuodelle 2017.

Ennusteen tilastollisia arvoja on esitetty taulukossa 1. R2-arvon perusteella ennuste sopii to- teumaan kohtalaisen hyvin ja ennusteen arvot ovat muuttuneet oikeaan suuntaan (toteumaan n¨ahden) 62 %:n todenn¨ak¨oisyydell¨a. Ennuste tuottaa keskim¨a¨arin pienemm¨an arvon kuin mit¨a todellinen kulutus on.

Taulukko 1.ARMAX-ennusteen tilastollisia arvoja

Ennuste R2 RMSE MDA MAPE ¯ σ

ARMAX 0.8122 12.0092 0.62 0.0975 0.4766 12.0005

Kuvaamalla virhett¨a histogrammilla saadaan parempi visuaalinen esitys virheest¨a ja n¨ahd¨a¨an suhteellisesti kuinka paljon mink¨akin suuruisia virheit¨a on. Histogrammin keskikohdan tulisi mukailla virheen keskiarvoa (¯). Kuvassa 9 on esitetty virheen histogrammi ja normaalijakau- man tiheysfunktioN(¯,σ), jonka parametrit ovat taulukosta 1.

(18)

Kuva 9.ARMAX-virheen histogrammi ja siihen sovitettu normaalijakauman tiheysfunktio.

Tiheysfunktio ja histogrammi eiv¨at osu kohdakkain eli virhe ei ole normaalisti jakautunut.

Virhe jaoteltiin viikonp¨aivien kesken ja histogrammit piirrettiin eri v¨areill¨a, jotta n¨ahd¨a¨an p¨aiv¨akohtaiset eroavaisuudet. N¨ain saadut jakaumat on esitetty kuvassa 10.

-40 -30 -20 -10 0 10 20 30 40 50 60 70

Virheen suuruus 0

0.01 0.02 0.03 0.04 0.05

Virheen normalisoitu arvo

Päiväkohtainen ARMAX-virheen jakauma

Ma Ti Ke To Pe La Su

Kuva 10.ARMAX-virheen p¨aiv¨akohtaiset empiiriset tiheysfunktiot.

(19)

Kuvasta 10 on havaittavissa, ett¨a sunnuntaisin virheen hajonta on pienemp¨a¨a kuin muina p¨aivin¨a, koska sen kuvaajan huippu on korkeammalla kuin muiden p¨aivien. Sama voidaan huomata tau- lukosta 2.

Taulukko 2.ARMAX-virheen p¨aiv¨akohtaiset keskiarvot ja keskihajonnat

Viikonp¨aiv¨a Keskiarvo Keskihajonta

Ma -0.3678 9.8609

Ti 1.8531 13.1614

Ke 0.6175 12.6220

To -0.2488 13.3217

Pe 2.0230 13.3017

La 0.4922 12.4637

Su -1.0043 7.9386

Tutkittiin seuraavaksi onko vuorokaudenajalla merkityst¨a ennustevirheen suuruuteen ja jaotel- tiin virheet nelj¨a¨an eri ajankohtaan. Kuvassa 11 on esitetty jaottelu nelj¨an eri vuorokaudenajan kesken.

-40 -20 0 20 40 60

Virheen suuruus 0

0.005 0.01 0.015 0.02 0.025 0.03 0.035 0.04 0.045

Virheen normitettu arvo

Tunnittainen ARMAX-virheen jakauma

Aamu klo 05-10 Päivä klo 11-15 Ilta klo 16-22 Yö klo 23-04

Kuva 11.ARMAX-virheen empiiriset tiheysfunktiot vuorokaudenaikojen kesken. Merkitt¨av¨a¨a eroa ei ole havaittavissa eri ajankohtien v¨alill¨a.

(20)

Tutkittiin lis¨aksi olisiko suurimpien virheiden kohdalla jonkinlaista s¨a¨ann¨onmukaisuutta ja ero- teltiin virheest¨a yli 10 yksik¨on absoluuttiset virheet ja jaoteltiin ne viikonp¨aivien ja kellonaiko- jen kesken. Tulokset on esitetty kuvassa 12.

Yli 10 yksikön virheen jakautuminen viikonpäiville

Ma Ti Ke To Pe La Su

Viikonpäivä 0

50 100 150 200 250 300 350 400 450 500

Kappalemäärä

(a) Viikonp¨aivien virhejakauma (b) Kellonaikojen virhejakauma

Kuva 12.Yli 10 yksik¨on ARMAX-virheiden jakautuminen

Virhe ei painotu erityisen suuresti mink¨a¨an viikonp¨aiv¨an kohdalle, mutta klo 5:n ja 18 kohdalla on kuvan 12b perusteella havaittavissa eroa muihin verrattuna. N¨ait¨a ennuste ei kykene ennakoi- maan, mutta aamupiikki saattaa johtua teollisuuden ja liikenteen (liikennevalot, s¨ahk¨oiset kyltit) toiminnan alkamisesta aamuvarhain ja illalla taas kotitalouksissa noihin aikoihin s¨ahk¨onkulutus saattaa kiihty¨a perheiden saavuttua t¨oist¨a kotiin.

(21)

5.3 L¨amp¨otilan vaihtelevuuden kerroin

Ennustetta varten otettiin vastaavia hetki¨a m¨a¨aritett¨aess¨a huomioon vain ne hetket, joilla l¨amp¨otilaero ennustehetkeen verrattuna oli korkeintaan 2°C, koska pyrittiin v¨altt¨am¨a¨an suuret lukemat tai nollalla jakamiset yht¨al¨oss¨a (10). T¨am¨an lis¨aksi laskettiin kerroinkerikseen arkip¨aiville ja vii- konlopuille. Yht¨al¨on (11) avulla saatiin kuvan 13 mukainen ennuste.

1/17 2/17 3/17 4/17 5/17 6/17 7/17 8/17 9/17 10/17 11/17 12/17

Aika 40

60 80 100 120 140 160 180

Sähkönkulutus

Lämpötilan vaihtelevuuden kerroin ja sähkönkulutus

Ennuste Oikea kulutus

Kuva 13.L¨amp¨otilan vaihtelevuus-ennuste ja todellinen s¨ahk¨onkulutus vuonna 2017. Vastaavissa hetkiss¨a ei rajoitettuna l¨amp¨otilaa ylh¨a¨alt¨ap¨ain.

Silm¨am¨a¨ar¨aisesti ennuste sopii toteumaan hyvin. Tehtiin toinen ennuste huomioiden l¨amp¨otilaero eli valittiin vastaaviksi hetkiksi sellaiset hetket, joilla on saman viikonp¨aiv¨an, kellonajan ja p¨aiv¨an tyypin lis¨aksi l¨amp¨otilaeroa nykyhetkeen t verrattuna korkeintaan 5°C. Eli yht¨al¨oss¨a (11)|(X1,t−X1,˜t)| ≤5. T¨all¨a pyrittiin siihen ettei ennustettava kulutus eroaisi suuresti edelli- sest¨a vastaavasta arvosta. Molempien ennusteiden virheet on esitetty kuvissa 14a ja 14b.

(22)

1/17 2/17 3/17 4/17 5/17 6/17 7/17 8/17 9/17 10/17 11/17 12/17

Aika -60

-40 -20 0 20 40 60

Virhe

Ennusteen virhe huomioimatta vastaavien hetkien lämpötilaeroa

(a) Vastaavissa hetkiss¨a sama viikonp¨aiv¨a, kellonaika ja p¨aiv¨an tyyppi

1/17 2/17 3/17 4/17 5/17 6/17 7/17 8/17 9/17 10/17 11/17 12/17

Aika -60

-40 -20 0 20 40 60

Virhe

Ennusteen virhe huomioiden vastaavien hetkien lämpötilaero

(b) Edellisten lis¨aksi l¨amp¨otilaerot rajoitettu 5 asteeseen ylh¨a¨alt¨ap¨ain.

Kuva 14.L¨amp¨otilan vaihtelevuuden kertoimella tehtyjen ennusteiden virheet. Molemmat ovat l¨ahell¨a nollaa.

Kuvassa 15 on esitetty vastaavat histogrammit virheille ja sovitetut normaalijakauman tiheys- funktiot, joiden parametrit ovat vastaavan virheen keskiarvo ja keskihajonta taulukosta 3.

(23)

Kuva 15.Molempien ennusteiden virheiden histogrammit ja vastaavat tiheysfunktiot. Tiheysfunktiot eiv¨at osu kohdakkain histogrammin kanssa kuten ei my¨osk¨a¨an ARMAX-virheen tapauksessa.

Virheet jaoteltiin my¨os viikonp¨aivien kesken ja piirrettiin empiiriset tiheysfunktiot, jotka on esitetty kuvassa 16.

-30 -20 -10 0 10 20 30 40 50

Virheen suuruus 0

0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08

Virheen normalisoitu arvo

Päiväkohtainen LVK-virheen jakauma (lämpötilaeroja ei huomioitu)

Ma Ti Ke To Pe La Su

-30 -20 -10 0 10 20 30 40

Virheen suuruus 0

0.01 0.02 0.03 0.04 0.05 0.06 0.07

Virheen normalisoitu arvo

Päiväkohtainen LVK-virheen jakauma (lämpötilaerot huomioitu)

Ma Ti Ke To Pe La Su

Kuva 16.L¨amp¨otilan vaihtelevuuden kerroin-ennusteen empiiriset tiheysfunktiot. Eri v¨areill¨a on eritelty eri viikonp¨aiv¨at. Ensimm¨aisess¨a kuvassa korkeimpina ovat maanantai, tiistai ja sunnuntai,

joiden keskihajonnat ovat pienimm¨at (taulukko 4a).

Kuvan 16 perusteella voidaan sanoa, ett¨a virheet jakautuvat tasaisesti kaikkien viikonp¨aivien kesken l¨amp¨otilarajoitetussa ennusteessa, koska kaikki kuvaajat asettuvat l¨ahes p¨a¨allekk¨ain.

Kuvassa 17 esitet¨a¨an vuorokaudenaikojen mukaan jaotellut virheet.

(24)

-30 -20 -10 0 10 20 30 40 50 Virheen suuruus

0 0.01 0.02 0.03 0.04 0.05 0.06 0.07

Virheen normitettu arvo

Tunnittainen LVK-virheen jakauma (lämpötiloja ei rajoitettu)

Aamu klo 05-10 Päivä klo 11-15 Ilta klo 16-22 Yö klo 23-04

-30 -20 -10 0 10 20 30 40

Virheen suuruus 0

0.01 0.02 0.03 0.04 0.05 0.06 0.07

Virheen normitettu arvo

Tunnittainen LVK-virheen jakauma (lämpötilaerot rajoitettu)

Aamu klo 05-10 Päivä klo 11-15 Ilta klo 16-22 Yö klo 23-04

Kuva 17.LVK-virheiden empiiriset tiheysfunktiot vuorokaudenaikojen mukaan. Merkitt¨av¨a¨a eroa ei ole havaittavissa eri vuorokaudenaikojen ennustevirheiss¨a.

Ennusteita tehdess¨a otettiin talteen nykyhetken ja vastaavan hetken l¨amp¨otilaerotX1,i−X1,i˜ja ne on esitetty kuvassa 18. J¨alkimm¨aisen kuvan alussa piikki alasp¨ain johtuu siit¨a ettei datasta l¨oytynyt ehdot t¨aytt¨av¨a¨a vastaavaa hetke¨a, jolloin k¨aytettiin kulutusarvoa, jolla l¨amp¨otilaehto ei t¨ayttynyt.

1000 2000 3000 4000 5000 6000 7000 8000 Indeksi: vuoden 2017 tunnit (8760kpl) -25

-20 -15 -10 -5 0 5 10 15 20 25

Lämpötilaero

Lämpötilaero ei rajoitettu

1000 2000 3000 4000 5000 6000 7000 8000 Indeksi: vuoden 2017 tunnit (8760kpl) -20

-15 -10 -5 0 5 10 15 20

Lämpötilaero

Lämpötilaero rajoitettu 5 asteeseen

Kuva 18.Ennustehetken ja vastaavan hetken v¨alinen l¨amp¨otilaero

Laskettiin ennusteen ja todellisen kulutuksenR2-arvo, virheen RMSE, MDA, MAPE sek¨a kes- kiarvot ja -hajonnat, jotka on esitetty taulukossa 3.

(25)

Taulukko 3.L¨amp¨otilan vaihtelevuuden kertoimella toteutetun ennusteen tilastolliset arvot

Tunnusluku Ennuste: l¨amp¨otilaeroja ei rajoitettu Ennuste: l¨amp¨otilaerot rajoitettu

karkip¨aiville -1.7756 -2.1090

kviikonlopuille -1.7489 -2.2115

R2 0.9311 0.9387

RMSE 7.2723 6.8628

MDA 0.6932 0.6904

MAPE 0.0618 0.0612

¯

-0.0989 -0.3538

σ 7.2721 6.8541

Taulukosta 3 huomataan ettei arkip¨aivien ja viikonloppujenk-arvoissa ollut suurta eroa. Kaikki kertoimetkovat negatiivisia, mik¨a oli oletettavaa, koska l¨amp¨otilan laskiessa eli l¨amp¨otilaeron ollessa negatiivinen kulutus suurenee ja vastaavasti toisinp¨ain. Molempien virheiden keskiar- vot ovat l¨ahes nolla jaR2, MDA sek¨a MAPE ovat l¨ahes yht¨a suuret. Taulukossa 4 on esitetty p¨aiv¨akohtaiset virheen keskiarvot ja keskihajonnat.

Taulukko 4.L¨amp¨otilan vaihtelevuuden kertoimella toteutetun ennustevirheen p¨aiv¨akohtaiset tulokset

(a) Vastaavien hetkien l¨amp¨otiloja ei rajoitettu

Viikonp¨aiv¨a keskiarvo keskihajonta Maanantai -0.2697 5.2779

Tiistai -0.0808 7.2383

Keskiviikko -0.1482 8.0012

Torstai -0.2700 7.8596

Perjantai 0.4095 7.4179 Lauantai -0.1936 8.3215 Sunnuntai -0.1386 6.3276

(b) L¨amp¨otilaerot rajoitettu

Viikonp¨aiv¨a keskiarvo keskihajonta Maanantai -0.7030 5.8875

Tiistai -0.2087 7.4591

Keskiviikko -0.3143 7.1928

Torstai -0.5380 6.8910

Perjantai -0.1735 6.2214 Lauantai -0.2351 7.6187 Sunnuntai -0.3049 6.5312

Taulukoiden 3 ja 4 perusteella voidaan sanoa, ett¨a l¨amp¨otilaerot huomioimalla ennuste ei pa- rantunut merkitt¨av¨asti. Rajoittamalla l¨amp¨otilaerot malli antaa keskim¨a¨arin suuremman arvon kuin mit¨a todellinen kulutus on (kaikkien viikonp¨aivien ja koko ennusteen virheen keskiarvo on negatiivisempi) ja sen hajonta on pienempi.

Tutkittiin vastaavasti kuin ARMAX-ennusteessa onko suurimpien virheiden kohdalla jon-

(26)

kinlaista s¨a¨ann¨onmukaisuutta. Ennustevirheest¨a eroteltiin ne indeksit, joilla virheen absoluutti- nen suuruus oli suurempaa kuin 10 ja ker¨attiin histogrammeihin tieto mille p¨aiville ja tunneille kyseiset indeksit osuivat. Tulokset on esitetty kuvissa 19 ja 20.

Yli 10 yksikön virheen jakautuminen viikonpäiville

Ma Ti Ke To Pe La Su

Viikonpäivä 0

50 100 150 200 250

Kappalemäärä

(a) Viikonp¨aivien virhejakauma (b) Kellonaikojen virhejakauma

Kuva 19.Yli 10 yksik¨on ennustusvirheiden jakautuminen, kun l¨amp¨otilaeroja ei rajoiteta

Yli 10 yksikön virheen jakautuminen viikonpäiville

Ma Ti Ke To Pe La Su

Viikonpäivä 0

20 40 60 80 100 120 140 160 180 200

Kappalemäärä

(a) Viikonp¨aivien virhejakauma (b) Kellonaikojen virhejakauma

Kuva 20.Yli 10 yksik¨on ennustusvirheiden jakautuminen, kun l¨amp¨otilaerot rajoitettu

Kuvassa 20b on havaittavissa samankaltainen aamupiikki kuin l¨amp¨otilan vaihtelevuuden ker- toimella toteutetussa ennusteessa, mik¨a voisi johtua esimerkiksi tehtaiden aamuisesta toiminnan alkamisesta.

(27)

5.4 Vertailu

Taulukossa 5 esitet¨a¨an ARMAX- ja l¨amp¨otilarajoitetun kerroinennusteen tunnusluvut, jois- ta n¨ahd¨a¨an LVK-ennusteen olevan t¨ass¨a tarkastelussa n¨aill¨a arviointitavoilla tarkempi malli s¨ahk¨onkulutuksen ennustamiseen.

Taulukko 5.Ennusteiden tilastollisten tunnuslukujen vertailu

Tunnusluku ARMAX L¨amp¨otilan vaihtelevuuden kerroin

R2 0.8122 0.9387

RMSE 12.0092 6.8628

MDA 0.62 0.6904

MAPE 0.0975 0.0612

Kuvassa 21 on esitetty ARMAX-ennusteen ja l¨amp¨otilarajoitetun ( 5 °C, kuva 14b) kerroinen- nusteen virheet ja kuvassa 22 histogrammit.

1/17 2/17 3/17 4/17 5/17 6/17 7/17 8/17 9/17 10/17 11/17 12/17

Aika -40

-20 0 20 40 60

Ennustevirhe

Ennusteiden virheet

ARMAX LVK

Kuva 21.ARMAX- ja l¨amp¨otilan vaihtelevuuden kerroin-ennusteiden virheet

(28)

Kuva 22.ARMAX- ja l¨amp¨otilarajoitetun kerroinennusteen virheiden histogrammit. LVK-ennusteen vaihtelevuus on pienemp¨a¨a ja n¨ain ollen sen histogrammi on korkeampi ja kapeampi.

MDA kertoi todenn¨ak¨oisyyden, jolla ennuste muuttui todellisen kulutuksen suhteen samaan suuntaan, mutta laskettiin lis¨aksi se todenn¨ak¨oisyys, ett¨a ennusteet muuttuivat kesken¨a¨an sa- maan suuntaan. ARMAX- ja l¨amp¨otilarajoitettu LVK-virhe olivat samanmerkkiset 55.43 %:n todenn¨ak¨oisyydell¨a eli on 55.43 %:n todenn¨ak¨oisyys, ett¨a molemmilla malleilla saadaan sa- maan aikaan liian pieni tai suuri arvo toteumaan n¨ahden.

Molempien virheiden autokorrelaatiofunktiot on esitetty kuvassa 23. Autokorrelaatiofunk- tiot laskeutuvat hitaasti, mist¨a voidaan p¨a¨atell¨a etteiv¨at virheet ole stationaarisia. L¨amp¨otilan vaihtelevuuskerroin-virheen kuvaajasta n¨ahd¨a¨an, ett¨a lagien 24, 48 ja 72 kohdalla on havaitta- vissa hyvin pienet nousut, mik¨a tarkoittaa ett¨a ennustettavan tunnin virheeseen on pieni - ha- vaittavissa oleva vaikutus sit¨a kolme vuorokautta edelt¨avien samojen kellonaikojen virheill¨a.

(29)

0 0.5 1

Sample Autocorrelation

ARMAX-virheen autokorrelaatio

0 10 20 30 40 50 60 70 80

Lag

0 0.5 1

Sample Autocorrelation

LVK-virheen autokorrelaatio

0 10 20 30 40 50 60 70 80

Lag

Kuva 23.Virheiden autokorrelaatiofunktiot

6 YHTEENVETO JA JOHTOP ¨ A ¨ AT ¨ OKSET

T¨ass¨a ty¨oss¨a tutkittiin s¨ahk¨onkulutuksen ennustamista kahden eri mallin avulla ja n¨aist¨a mal- leista parempi ennuste saatiin l¨amp¨otilan vaihtelevuuden kertoimen avulla tehdyll¨a mallilla.

T¨ah¨an saattoi vaikuttaa se, ett¨a yht¨al¨oll¨a (11) laskettavaan uuteen arvoon liittyi ensimm¨ainen sit¨a edelt¨av¨a viikontakainen vastaava hetki, jonka kulutus on todenn¨ak¨oisesti l¨ahell¨a ennustet- tavan hetken todellista kulutusta. ARMAX-ennusteessa jokaiselle ennustettavalle tunnille mal- lin (9) sovitus tehtiin erilaiselle aikasarjalle, mutta samoilla parametrien lukum¨a¨arill¨a, mik¨a toi malliin paljon ep¨avarmuutta. L¨amp¨otilarajoitetun LVK-ennusteenR2-arvo oli 0.94 ja ARMAX- ennusteen 0.81 ja vastaavat MDA- ja MAPE-arvot olivat 0.69, 0.62 ja 6.12 %, 9.75 %.

Ennusteiden virheet eiv¨at noudattaneet normaalijakaumaa t¨aydellisesti joten ennusteeseen liittyy viel¨a jotain mit¨a k¨aytetyt mallit eiv¨at selit¨a eik¨a virhett¨a () voida pit¨a¨a pelkk¨an¨a valkoi- sena kohinana.

LVK-ennustetta voitaisiin kenties parannella valitsemalla edellinen vastaava hetki siten, ett¨a ennustettaessa esimerkiksi keskiviikon kulutusta, valittaisiinkin edellinen p¨aiv¨a eli tiistai.

T¨all¨oin l¨amp¨otilaero voisi olla pienempi, koska aikaeroa on vain 24 tuntia ja tavallisten ar- kip¨aivien v¨alill¨a kulutuksen vaihtelu on pient¨a. Yht¨al¨o¨on (11) voitaisiin lis¨at¨a my¨os p¨aiv¨anvalo- erosta johtuva termi ja laskea vastaavasti p¨aiv¨an pituuden vaihtelevuuskerroin. P¨aiv¨anvalon

(30)

v¨ahentyess¨a kyseinen termi kasvattaisi kulutusta kuten l¨amp¨otilaeron termikin mik¨ali vaihte- levuuskertoimelle saadaan negatiivinen arvo.

ARMAX-ennustetta varten voitaisiin etsi¨a optimaalinen termien lukum¨a¨ar¨a vuorokauden v¨alein (tai laskentatehon salliessa useammin) ja ennustaa n¨aill¨a termien lukum¨a¨arill¨a seuraavat 24 tuntia ja sitten sama uudestaan. Molemmissa ennusteissa muuttujien vaikutus oli lineaaris- ta (todettiin korrelaatiokertoimienkin avulla). ARMAX-mallissa voitaisiin esimerkiksi k¨aytt¨a¨a riippumattomalle muuttujalle muotoaXt2. L¨amp¨otilamuuttujan tapauksessa se suurentaisi iso- jen l¨amp¨otilaerojen kohdalla ennustetta huomattavasti. ARMAX-virheess¨a (kuva 8) on paljon yli 30 yksik¨on piikkej¨a koko vuoden ajalla, mutta erityisen suuria piikkej¨a on talviaikaan al- kuvuodesta, jolloin l¨amp¨otilaero viikkojen v¨alill¨a voi olla suurta. Toisen asteen termi saattaisi korjata t¨all¨aisia ennustearvoja.

(31)

squares support vector machines”, International Journal Of Electrical Power & Energy Systems 67, pages 431-438.

[2] Diyar Akay & Mehmet Atak, 2007. ”Grey prediction with rolling mechanism for elect- ricity demand forecasting of Turkey”, Energy, Elsevier, vol. 32(9), pages 1670-1675.

[3] Zaid Mohamed & Pat Bodger, 2004. ”Forecasting electricity consumption a comparison of models for New Zealand”, https://www.researchgate.net/publication/29487453

[4] Hsiao-Tien Pao, 2009. ”Forecasting of electricity consumption and economic growth in Taiwan by state space modeling”, Energy, Elsevier, vol. 34(11), pages 1779-1791.

[5] Philip Kofi Adom & William Bekoe, 2012. ”Conditional dynamic forecast of elctrical ener- gy consumption requirements in Ghana by 2020: A comparison of ARDL and PAM”, Energy, Elsevier, vol. 44(1), pages 367-380.

[6] Henrik Madsen,Time Series Analysis(Chapman & Hall/CRC, Boca Raton, 2008)

[7] George E.P. Box, Gwilym M. Jenkins,Time series analysis: forecasting and control(Holden- Day, San Francisco, 1976)

[8] Vincenzo Bianco, Oronzio Manca, Sergio Nardini & Alina A. Minea, 2010. ”Analysis and forecasting of nonresidential electricity consumption in Romania”, Energy, Elsevier, vol.

87(11), pages 3584-3590.

[9] Fabiano Castro Torrini, Reinaldo Castro Souza, Fernando Luiz Cyrino Oliveira & Jose Francisco Moreira Pessanha, 2016. ”Long term electricity consumption forecast in Brazil: A fuzzy logic approach”, Energy, Elsevier, vol. 54, pages 18-27.

(32)

1 ARMAX-ennusteen tilastollisia arvoja . . . 17 2 ARMAX-virheen p¨aiv¨akohtaiset keskiarvot ja keskihajonnat . . . 19 3 L¨amp¨otilan vaihtelevuuden kertoimella toteutetun ennusteen tilastolliset arvot . 25 4 L¨amp¨otilan vaihtelevuuden kertoimella toteutetun ennustevirheen p¨aiv¨akohtaiset

tulokset . . . 25 5 Ennusteiden tilastollisten tunnuslukujen vertailu . . . 27

(33)

1 S¨ahk¨onkulutus, l¨amp¨otila ja p¨aiv¨anvalon m¨a¨ar¨a 1.1.2014 - 31.12.2017 . . . 7 2 S¨ahk¨onkulutus ajanjaksolla ma 2.6.2014 - su 8.6.2014 . . . 8 3 Kulutuksen ja l¨amp¨otilan sirontakuvaajasta n¨ahd¨a¨an kulutuksen pienenev¨an l¨amp¨otilan

noustessa. . . 9 4 Kulutuksen ja p¨aiv¨an pituuden sirontakuvaajasta n¨ahd¨a¨an kulutuksen piene-

nev¨an p¨aiv¨an valon m¨a¨ar¨an noustessa. . . 9 5 Esimerkki additiivisesta aikasarjahajotelmasta . . . 11 6 ARMAX(5,2,[4,4],[3,4]) Toteuma ja ennuste ajanjaksolle sunnuntai 1.1.2017

klo 0.00 - maanantai 2.1.2017 klo 12 . . . 15 7 Vuoden 2017 ARMAX(4,4,4,4,4,4)- ennuste ja todellinen kulutus . . . 16 8 ARMAX(4,4,4,4,4,4)-virhe vuodelle 2017. . . 17 9 ARMAX-virheen histogrammi ja siihen sovitettu normaalijakauman tiheysfunk-

tio. Tiheysfunktio ja histogrammi eiv¨at osu kohdakkain eli virhe ei ole normaa- listi jakautunut. . . 18 10 ARMAX-virheen p¨aiv¨akohtaiset empiiriset tiheysfunktiot. . . 18 11 ARMAX-virheen empiiriset tiheysfunktiot vuorokaudenaikojen kesken. Mer-

kitt¨av¨a¨a eroa ei ole havaittavissa eri ajankohtien v¨alill¨a. . . 19 12 Yli 10 yksik¨on ARMAX-virheiden jakautuminen . . . 20 13 L¨amp¨otilan vaihtelevuus-ennuste ja todellinen s¨ahk¨onkulutus vuonna 2017. Vas-

taavissa hetkiss¨a ei rajoitettuna l¨amp¨otilaa ylh¨a¨alt¨ap¨ain. . . 21 14 L¨amp¨otilan vaihtelevuuden kertoimella tehtyjen ennusteiden virheet. Molem-

mat ovat l¨ahell¨a nollaa. . . 22 15 Molempien ennusteiden virheiden histogrammit ja vastaavat tiheysfunktiot. Ti-

heysfunktiot eiv¨at osu kohdakkain histogrammin kanssa kuten ei my¨osk¨a¨an ARMAX-virheen tapauksessa. . . 23 16 L¨amp¨otilan vaihtelevuuden kerroin-ennusteen empiiriset tiheysfunktiot. Eri v¨areill¨a

on eritelty eri viikonp¨aiv¨at. Ensimm¨aisess¨a kuvassa korkeimpina ovat maanan- tai, tiistai ja sunnuntai, joiden keskihajonnat ovat pienimm¨at (taulukko 4a). . . . 23 17 LVK-virheiden empiiriset tiheysfunktiot vuorokaudenaikojen mukaan. Merkitt¨av¨a¨a

eroa ei ole havaittavissa eri vuorokaudenaikojen ennustevirheiss¨a. . . 24 18 Ennustehetken ja vastaavan hetken v¨alinen l¨amp¨otilaero . . . 24 19 Yli 10 yksik¨on ennustusvirheiden jakautuminen, kun l¨amp¨otilaeroja ei rajoiteta 26 20 Yli 10 yksik¨on ennustusvirheiden jakautuminen, kun l¨amp¨otilaerot rajoitettu . . 26 21 ARMAX- ja l¨amp¨otilan vaihtelevuuden kerroin-ennusteiden virheet . . . 27

(34)

keampi ja kapeampi. . . 28 23 Virheiden autokorrelaatiofunktiot . . . 29

Viittaukset

LIITTYVÄT TIEDOSTOT

Ajatus on, ett¨a kuka hyv¨ans¨a voi k¨aytt¨a¨a l¨ahdekoodia ohjelman uuden version tai koko- naan uuden ohjelmiston rakennusosana, kunhan my¨os uusi ohjelmisto

[r]

[r]

Onko funktiolla varsinaista raja- arvoa origossa?. Onko funktiolla varsinaista

Pidet¨a¨an tunnettuna, ett¨a jokainen suljettu jana on nollamittainen (t¨am¨a todistet- tiin luentoesimerkiss¨a 8.2.4 yksikk¨ojanalle ja todistus on yleisesti olennaisesti

(Voit k¨aytt¨a¨a tietoa, ett¨a yksi–, ja yleisemmin, ¨a¨arellisulotteisessa normiavaruudessa jokainen rajoitettu joukko on

Teht¨ av¨ at 1-3 ovat verryttely¨ a, teht¨ av¨ at 4-5 puolestaan liittyv¨ at luennolla k¨ aytyyn asiaan.. Venn-diagrammeja apuna k¨ aytt¨ aen totea seuraavien joukko-opin

b) K¨ aytt¨ aen vuoden 2004 kokonaisvienti¨ a kantalukuna saadaan viennin prosentuaa- linen jakauma toimialoittain viimeiseen