• Ei tuloksia

Aineiston analyysi aloitettiin laskemalla korrelaatiot toimialojen itsensä ja OMX Helsingin välille, mitkä laskettiin Excel-ohjelmalla kuukausittaisten indeksituottojen pohjalta. Excel laskee CORREL-kaavalla Pearsonin korrelaatiokertoimen (Excelfunctions 2016). Pearsonin korrelaatiokerrointa varten on erilaisia tulkintoja, mutta yli 0,5 kerrointa voidaan pitää

Vuosi Toimiala HEX PTEOL KULTA KULPA RAHOI TERVH TEOPA ÖLJKA TEKNO TIETO YLPAL Vuoden

2006 1,94 % 2,55 % 1,95 % 2,16 % 2,75 % 2,15 % 3,37 % 0,44 % 0,86 % 3,12 % 2,61 % 2,17 %

vahvana keskinäisenä korrelaationa. (Statstutor 2016; Laerd statistics 2013) Tähän tutkielmaan sovelletaan Taylorin (1990) antamia viitearvoja Pearsonin korrelaatiokertoimen tulkinnasta, jonka mukaan Pearsonin korrelaatiokertoimen vahvuus voidaan luokitella seuraavasti:

Riippuvuuden r vahvuus:

Merkityksetön 0.0 – 0.2

Heikko 0.21 – 0.36

Keskinkertainen 0.36 – 0.67

Vahva 0.67 – 0.9

Todella vahva 0.9 – 1.0

Alla olevaan korrelaatiomatriisiin on laskettu korrelaatiot toimialojen välille tarkastelujakson ajalta.

Taulukko 4. Toimialojen ja OMXH-indeksin välinen korrelaatiomatriisi.

Korrelaatiomatriisin pohjalta toimialoja klusteroitiin ryhmiin, jotta regressioanalyysistä saataisiin ajankäytön ja työn laajuuden kannalta järkevästi toteutettava. Tavoitteena oli klusteroida toimialat kolmesta kuuteen ryhmään. Toimialojen klusteroinnissa päädyttiin kuuteen ryhmään, joista kolme on yksittäisiä toimialoja ja kolme kahden tai kolmen toimialan ryhmiä, mitkä jakautuvat seuraavasti:

Ryhmät 1 – 3: Tietoliikennepalvelut, Teknologia ja Terveydenhuolto

Ryhmät 4 & 5: Kulutuspalvelut ja Rahoitus (KULRAH) ja Yleishyödylliset palvelut ja Öljy ja Kaasu (YLPÖLK)

Ryhmä 6: Perusteollisuus, Teollisuuspalvelut ja -tavarat ja Kulutustavarat (PERKUT) HEX PTEOL KULTA KULPA RAHOI TERVH TEOPA ÖLJKA TEKNO TIETO YLPAL

HEX 1

PTEOL 0,8420 1,0000

KULTA 0,7443 0,6532 1,0000

KULPA 0,7950 0,7406 0,6460 1,0000

RAHOI 0,8081 0,7048 0,5936 0,6458 1,0000

TERVH 0,4298 0,3255 0,4378 0,4039 0,3597 1,0000

TEOPA 0,8314 0,7792 0,8008 0,7425 0,6981 0,4478 1,0000

ÖLJKA 0,6348 0,5864 0,4921 0,6071 0,4580 0,3039 0,5643 1,0000

TEKNO 0,7039 0,4371 0,3602 0,4395 0,4374 0,2097 0,3601 0,3349 1,0000

TIETO 0,5694 0,4405 0,3815 0,3852 0,5650 0,3660 0,4584 0,2838 0,3516 1,0000

YLPAL 0,6701 0,5424 0,5488 0,5000 0,5068 0,3438 0,5583 0,4577 0,3701 0,3814 1,0000

Ryhmien jako perustui toimialojen keskinäisiin korrelaatioihin. Korrelaatiomatriisissa on korostettu ryhmien keskinäisiä korrelaatiota, mistä voimme nähdä, että muun muassa ryhmän 4, Kulutuspalvelut ja Rahoitus, positiivinen korrelaatiokerroin on 0,646. Ryhmän 4 toimialojen välillä on siis 64,6 prosentin positiivinen korrelaatio. Matalin korrelaatio muodostetuissa ryhmissä on ryhmän 5, Yleishyödylliset palvelut ja Öljy ja Kaasu, toimialojen välillä, sen ollessa 45,8 prosenttia. Kyseiseen toimialajaotteluun päädyttiin halutun toimialaryhmämäärän vuoksi. Lajittelu tehtiin sillä perusteella, että ensimmäiseksi valittiin eniten korreloivat toimialat yhdeksi ryhmäksi, ryhmä 6, ja tämän jälkeiset ryhmät seuraavaksi vahvimman korrelaation mukaan. Ryhmän 6 toimialoilla on Taylorin (1990) luokittelun mukaan vahva korrelaatio, eikä ryhmä 4 jää tästä raja-arvosta paljoa. Ryhmä 5 on ainoa toimialaryhmä, jonka keskinäinen korrelaatio on selvästi keskinkertaista Taylorin (1990) luokittelun mukaan.

Toimialojen normaalijakautuneisuutta testattiin Kolmogorov-Smirnov testillä, ja testi suoritettiin SAS Enterprise Guide-ohjelmistolla. Kolmogorov-Smirnov testin nollahypoteesina on, että tarkastellut toimialat noudattavat normaalijakaumaa, ja nollahypoteesi hylätään, jos testin tuloksen p-arvo on pienempi kuin riskitaso.

Kulutuspalvelut, Terveydenhuolto, Öljy ja Kaasu ja Teknologia-toimialat noudattivat normaalijakaumaa, mutta muut toimialat ja OMXH-indeksi eivät. Testin yhteydessä huomattiin lievää vinokkuutta toimialaryhmissä ja sillä voi olla lievästi heikentävä vaikutus lineaarisen regressioanalyysin tuloksiin.

Tältä pohjalta toimialojen ja OMXH-indeksin keskiarvojen merkitsevyyden mittaukseen valikoitui T-testi. Sen avulla tarkasteltiin, onko tuottoerot toimialojen kesken ja toimialojen ja OMXH-indeksin välillä tilastollisesti merkittäviä. T-testi soveltui tuottoerojen merkitsevyyden mittaukseen, koska vaikka aineisto ei ollut normaalijakautunutta, oli havaintoja yli 30 (121).

Toimialojen keskinäisessä vertailussa tyydyttiin vertaamaan Teollisuuspalveluita ja -tavaroita ja Terveydenhuoltoa muihin toimialoihin ajankäytöllisistä syistä. Nämä toimialat valittiin vertailukohteiksi, koska ne korreloivat eniten ja vähiten muiden toimialojen kanssa.

Ennen T-testejä suoritettiin F-testit, jotta T-testiä varten voitiin valita joko yhtäsuurten tai erisuurten varianssien testi. F-testi tarkastelee, onko populaatioiden varianssi yhtäsuurta vai erisuurta. F-testin nollahypoteesina oli ”H0: Populaatioiden varianssi on yhtäsuurta.” F-testin nollahypoteesi hylätään, jos F arvo on suurempi kuin F Critical one-tail arvo.

T-testillä testattiin toimialojen ja OMXH-indeksin keskiarvojen välisen tilastollisen eron merkitsevyyttä. Mitä pienempi on T-testin antama p-arvo, sitä merkitsevämpi on keskiarvojen välinen ero. P-arvon ollessa alle 0,050, voidaan sen vakiintuneen tavan mukaan sanoa olevan merkitsevä perusjoukossa. (Minitab 2016) T-testit suoritettiin viiden prosentin riskitasolla ja niiden nollahypoteeseina olivat ”H0: Toimialan keskiarvo poikkeaa OMXH-indeksin keskiarvosta” ja ”H0: Toimialan keskiarvo poikkeaa Terveydenhuollon/Teollisuuspalveluiden ja -tavaroiden keskiarvosta.” Testin nollahypoteesi hylätään, jos -t Critical two-tail < t Stat tai t Stat > t Critical two-tail.

F- ja T-testien jälkeen toimialaryhmiä käytettiin lineaarisessa regressioanalyysissä selittävinä tekijöinä, ja selitettävänä tekijänä toimi OMXH-indeksi. Lineaarinen regressioanalyysi suoritettiin SAS Enterprise-Guide- ohjelmistolla. Regressioanalyysiä voidaan pitää tilastollisena menetelmänä, jonka avulla etsitään parasta mahdollista selittävien muuttujien yhdistelmää, kun ennustetaan yhtä selitettävää muuttujaa.

Lineaarisessa regressioanalyysissä käytetään pienimmän neliösumman regressiosuoraa kuvaamaan muuttujien välistä yhteyttä. (Heikkilä 2008, 236–237) Lineaarisella regressioanalyysillä tutkittiin, voiko toimialojen kehityksellä selittää OMX Helsingin kehityksen tarkasteluajanjaksolla, ja analyysin muuttujina toimivat OMXH-indeksi sekä aiemmin luodut toimialaryhmät. Tässä tutkielmassa käytettiin poistavaa ja etenevää valintaa, mutta hieman sovelletulla tavalla. Poistavan valinnan vastakohta on etenevä valinta, jossa muuttujia lisätään analyysiin samalla perusteella. (Yhteiskuntatieteellinen tietoarkisto 2010) Poistavassa valinnassa poistetaan muuttuja sen mukaan, mikä kasvattaa mallin selitysastetta parhaiten. Tässä tutkielmassa poistavasta valinnasta poistettiin ensin muuttujat, jotka tekivät mallin multikollineaarisuudesta huonon, ja tämän jälkeen poistettiin heikoimmin selittävä muuttuja. Etenevä valinta perustui ensimmäisen regressiomallin sekä poistavan valinnan tuloksiin.

Lineaarisessa regressioanalyysissä havaintoja tulisi olla 5-10 kertaa niin paljon kuin selittäviä muuttujia, ettei mallista tulisi huonosti yleistettävää. Tutkimuksen aineisto täytti nämä vaatimukset (6 selittävää tekijää, 120 havaintoa). Aluksi tutkimuksessa analysoitiin selitettävää muuttujaa, OMXH-indeksi, käyttämällä kaikkia toimialaryhmiä (1-6) selittävinä tekijöinä. Tämän jälkeen tehtiin kolme muuta analyysiä ensimmäiseen analyysiin perustuen, eli tavoitteena oli luoda mahdollisimman hyvä regressiomalli käyttämällä poistavaa valintaa.

Tämän jälkeen pyrittiin etenevällä valinnalla luomaan toinen malli, ja lopuksi vertailemaan poistavan- ja etenevän valinnan malleja keskenään. Etenevä valinta perustui poistavan

valinnan malliin, jotta eri muuttujien vaikutuksen vertailukelpoisuutta saataisiin parannettua.

Eri mallien selityskertoimet ovat täysin vertailukelpoisia, jos muuttujat ovat samat, eli työssä pystyttiin vertailemaan eri analyysien tuloksia keskenään. Yksittäisten regressiomallien tarkastelua jouduttiin pelkistämään työn laajuuden vuoksi.