• Ei tuloksia

5.4 Aineiston yhteenveto

Kun tutkitaan tuki- ja liikuntaelinsairauksista aiheutuneita sairaanhoitokuluja, on HTA-palvelua käytetty noin 10 prosentissa tapauksista. Iällä on merkitystä etäpalvelun käyt-töön ja eniten palvelua on käytetty ikäluokassa 20-39-vuotiaat. HTA-palvelua käyttänei-den iän keskiarvo on myös noin vuokäyttänei-den korkeampi kontrolliryhmään verrattuna. HTA-palvelun kautta edenneissä vahinkotapauksissa kumppanuusverkoston palveluja on pys-tytty hyödyntämään selvästi enemmän kuin muissa tapauksissa. Tämä havainto tukee myös työhypoteesia. Myös alueella on vaikutusta palvelun käyttöön. Käyttöaste oli sel-västi suurinta Pohjois-Suomen alueella, mutta hieman yllättäen keskivertoa pienempää Lapissa, jossa välimatkat vastaanotolle ovat keskimäärin pisimpiä Suomessa. Makse-tuista korvauksista erittäin suuri osa painottuu 0-1000 euron väliin ja muutamat ulottuvat yli 10 000 euroon saakka. Tämä on hyvin tyypillistä terveydenhuoltokuluille. Kuten ole-tettua, ikäluokalla on hyvin suuri merkitys maksettujen korvausten määrään. Myös kump-panuusluokka määrittää korvausmenojen suuruutta. Suorassa keskiarvovertailussa HTA-palvelu vaikuttaa nostavan korvausmenon määrää. Tämä voi johtua HTA-HTA-palvelussa ko-tihoito-ohjeilla hoidetuista tapauksista, jolloin vahinkotapahtumaa ei muodostu ollenkaan ja halvimmat vahinkotapahtumat jäävät pois. Kun vertaillaan HTA-palvelun käyttöä yli kumppanuusluokkien, havaitaan, että avainkumppanilla hoidetuissa tapauksissa HTA-palvelun kautta edenneiden tapauksien korvausmeno on hieman alhaisempi, mutta ei kui-tenkaan tilastollisesti merkitsevä. Suora keskiarvovertailu ei tue työhypoteesia, mutta koska HTA-palvelun käyttö riippuu selvästi iästä ja avi-alueesta, voi palvelun käyttäjä-joukko voi olla valikoitunutta. Valikoituminen on syytä huomioida tulevissa malleissa, koska sillä voi olla hyvinkin suuri vaikutus. Toisin sanoen palvelun piiriin voi hakeutua esimerkiksi käyttäjiä, joiden terveyskulut ovat suurempia kuin muilla, jolloin tämä selit-täisi HTA-palvelun suurempaa korvausmenoa.

5.5 Menetelmät

Regressioanalyysi on tilastollinen menetelmä, jolla voidaan mallintaa ja tutkia muuttujien välisiä yhteyksiä. Erilaisia regressiomenetelmiä on useita ja regressioanalyysi saattaa olla eniten käytetty tilastollinen tekniikka. (Montgomery, Peck & Vining 2012, 1.) Yksinker-taisin kahden muuttujan lineaarinen regressiomalli kuvaa muuttujan X yhteyttä muuttu-jaan Y. Muuttujien välistä suhdetta kuvaavan regressiosuoran kulmakerroin saadaan, kun

tutkitaan, mikä vaikutus X muuttujan yhden yksikön muutoksella on muuttujaan Y. Kah-den muuttujan lineaarinen regressiomalli voidaan kirjoittaa seuraavasti

Yi = β0 + β1X1 + ui,

jossa Yi on selitettävä muuttuja, X1 on selittävä muuttuja, β0 on vakio, β1 on regressiosuo-ran kulmakerroin eli vaikutusestimaatti ja ui on mallin virhetermi, jonka empiirinen vas-tike on residuaali. (Stock & Watson 2017, 111–115.)

Regressioanalyysissä havaintoja pitää olla kohtuullinen määrä suhteessa muuttujien mää-rään. Muuttujien liian suuri määrä nostaa mallin selitysastetta keinotekoisesti. Intuitiivi-sesti tämä ilmiö johtuu siitä, että kaikille havainnoille löytyy oma ennustemuuttuja ja otosaineisto ylimallittuu. Yksi esimerkki riittävästi otoskoosta on sääntö k/n < 0,20 eli jokaista selittäjämuuttujaa kohden mallissa on 20 havaintoa. Näin ollen 5 muuttujan mal-lissa havaintoja tulisi olla vähintään 100 kappaletta. Perinteisesti regressiomalmal-lissa selit-tävien muuttujien tulisi korreloida kohtalaisesti selitettävän muuttujan kanssa, mutta ei liian voimakkaasti toistensa kanssa. (Metsämuuronen 2011, 712-713.)

Tässä työssä lineaariset regressiomallit on estimoitu käyttäen pienimmän neliösumman (eng. Ordinary Least Squares, OLS) menetelmää, joka on selvästi yleisin estimointitapa lineaarisissa malleissa. Pienimmän neliösumman (PNS-) estimaattorit saadaan minimoi-malla residuaalien neliösumma kerroinestimaattien β0 ja β1 eli regressiokertoimien suh-teen. OLS on harhaton ja tehokas estimointimenetelmä, kun sen perusoletukset toteutu-vat. (Stock & Watson 2017, 117-123.)

Pienimmän neliösumman menetelmällä on neljä eri oletusta monimuuttujaregressiossa.

1) Kaikkien mallin virhetermien odotusarvon tulee olla nolla. Tämä on avainoletus sille, että OLS-estimaattorit ovat harhattomia. 2) Aineisto on riippumattomasti jakautunut 3) Selittäjien välillä ei ole multikollineaarisuutta. 4) Suuret poikkeushavainnot (eng. outlier) ovat epätodennäköisiä. (Stock & Watson 2017, 203-204.)

Probit-malli on epälineaarinen regressiomalli, joka on suunniteltu binäärisille muuttujille, kuten tämän työn HTA-palvelun käyttöä koskeva malli. Regressiomalli binäärisellä seli-tettävällä muuttujalla Y estimoi todennäköisyyden, että Y = 1. Tämän vuoksi on järkevää muodostaa epälineaarinen malli, joka pakottaa arvojen 0 ja 1 otostodennäköisyyden väliin (0,1). Probit-malli useammalla selittävällä muuttujalla voidaan kirjoittaa seuraavassa muodossa

Pr(Y = 1|X1, X2,… Xk) = Φ(β0 + β1X1 + β2X2 + … + βkXk),

jossa Y = on binäärinen selitettävä muuttuja, Φ on normaalijakauman kertymäfunktio ja X1, X2 … Xk ovat selittäviä muuttujia. Probit-mallien kerroinestimaatteja ei voida tulkita suoraan vaikutussuureina, vaan niistä tulee laskea esimerkiksi, mikä on selittävän muut-tujan muutoksen marginaalinen todennäköisyysvaikutus. (Stock & Watson 2017, 389-392.)

Probit-mallin estimointi hyödyntää suurimman uskottavuuden (SU-) menetelmää. SU-es-timaattorit määritellään maksimoimalla otoksen uskottavuusfunktio sen parametrien suh-teen. SU-estimaattori valitsee sellaiset parametrien arvot, joilla on suurin todennäköisyys edustaa tutkittavaa aineistoa. (Stock & Watson 2017, 398.) SU-menetelmä on yleensä kaikista tehokkain estimointimenetelmä niiden estimaattoreiden luokassa, jotka hyödyn-tävät endogeenisten muuttujien jakaumaa. SU-estimaattorin heikkoutena voidaan pitää sen epävakautta (eng. non-robustness) tilanteissa, joissa aineistojakauma on määritelty virheellisesti. SU:n vahvuus on siinä, että sillä voidaan estimoida monia erilaisia malleja, kunhan aineiston jakauma on määritelty oikein. (Woolridge 2002, 385-386.)

Kun mielenkiinnon kohteena olevat muuttujat eivät täytä pienimmän neliösumman ole-tuksia esimerkiksi eksogeenisuuden kohdalta tai aineisto ei ole satunnaisesti valikoitu-nutta joudutaan OLS-menetelmää modifioimaan parempien estimaattien saamiseksi. Inst-rumenttimuuttujaregressio (IV-regressio) on yleinen estimaattori, jota käytetään, kun se-littävä muuttuja X on korreloitunut virhetermin kanssa. Instrumenttimuuttujan avulla voi-daan myös mallintaa valikoitumista interventioryhmään (Cameron & Trivedi 2005, 883-884). Stock & Watson havainnollistavat IV-regression toimintaa esimerkin kautta. Aja-tellaan, että selittävän muuttujan X variaatiolla on kaksi osaa: ensimmäinen osa, joka on

korreloitunut residuaalin kanssa (tämä osa aiheuttaa mallille ongelmia) ja toinen osa, joka ei ole korreloitunut residuaalin kanssa. Mikäli saataisiin tietoa, kuinka eristää ei-korreloi-tunut osa, korjaantuisivat estimointiongelmat. IV-regressio pyrkii tekemään juuri tämän.

Muuttujia, joilla ei-korreloitunut osio pyritään eristämään, kutsutaan instrumenttimuuttu-jiksi tai instrumenteiksi. (Stock & Watson 2017, 421.)

Tämän työn päämalli on 2-osainen rakennevalintamalli, jossa päämielenkiinnon kohteena on sairauskulujen logaritminen selitysmalli. Rakennemallin valintayhtälönä toimii probit-malli eli binäärinen vasteprobit-malli (Binary Response Model). Probit-yhtälöllä pyritään mal-lintamaan HTA-palvelun valintaan vaikuttavia tekijöitä. Mallin yhtälöt estimoidaan sa-manaikaisesti käyttäen SU-menetelmää. Malli toteutetaan Stata-ohjelmiston Extended Regression Model -mallilla (ERM), joka tarjoaa useita mahdollisuuksia mallintaa lineaa-risia tai ei-lineaalineaa-risia malleja eksogeenisilla ja endogeenisilla muuttujilla. Mallilla pysty-tään myös mallintamaan endogeenistä 0/1-valikoitumista tehokkaasti probit-mallin kautta sekä laskemaan tämän keskimääräiset seuraamusvaikutukset (eng. Average Treatment Effects, ATE), jotka kuvataan alempana. Mallin perusoletuksena on residuaalien normaa-lijakauma ja sen yhtälöt estimoidaan käyttäen SU-menetelmää. SU-menetelmän estimaa-tit ovat parempia kuin kaksivaiheisen pienimmän neliösumman menetelmän (eng. two-stage least squares, 2SLS) estimaatit, mikäli normaalisuusoletus (eli Probit-oletus) on ai-neiston kohdalla perusteltu. Mikäli normaalisuusoletus on väärä, tuottaa malli edelleen johdonmukaisia estimaatteja, mutta sen hyödyt suhteessa esimerkiksi 2SLS-menetelmään vähenevät. (Deb, Norton & Manning 2017, 209.)

Terveystaloustieteellisessä kirjallisuudessa on käyty paljon keskustelua valintamallien ja kaksiosaisten mallien (two-part model, 2PM) hyvyydestä terveydenhuollon kysynnän mallinnuksessa. Esimerkiksi Duan ym. (1983) ovat kaksiosaisen mallin paremmuuden kannalla ja toteavat valintamallien vaativan rajoittavia jakaumaoletuksia, jotka eivät ole testattavissa. Lisäksi he nostavat esiin valintamallin heikot numeeriset ja tilastolliset ominaisuudet, jotka johtuvat sen todennäköisyysfunktion useista paikallisista opti-meista. Hay ja Olsen (1984) taas kritisoivat kaksiosaista mallia väittäen myös sen sisäl-tävän oletuksia, joita ei voi testata. He kyseenalaistavat sellaisen (kaksiosaisen mallin yhtälöiden) virhetermien jakauman olemassaolon, joka tuottaa täydellisen

normaalija-kauman. Tukeakseen väitettään he osoittavat, että virhetermit eivät ole toisistaan riippu-mattomia. Valintamallin numeeristen ominaisuuksien puolesta he esittävät algoritmin globaalin maksimin löytämiseksi. (Jones 2000, 286-287.)

Mallin valinnassa tuleekin huomioida käytettävä aineisto ja selitettävän muuttujan tyyppi. Mikäli selitettävää muuttujaa ei voida havaita sen molemmissa tiloissa, pitää Jones (2000) valintamallia parhaana vaihtoehtona. Tässä työssä HTA-palvelun käyttöä kuvaavasta dummy-muuttujasta voidaan havainnoida ainoastaan tulema HTA-palvelu = 1, mikä puoltaa valintamallin käyttöä. (Jones 2000, 285.)

Endogeenista binäärivalintamallia ovat hyödyntäneet esimerkiksi Valtonen ym. (2014).

He tutkivat komplementaarisen sairausvakuutuksen vaikutusta terveydenhuollon palve-lujen käytön frekvenssiin (moraalikato) sekä palveluntarjoajan valintaan (julkinen vai yksityinen). Mallissa vapaaehtoisen sairausvakuutuksen ostopäätöstä (valinta) käsiteltiin endogeenisena binäärimuuttujana, johon vaikuttavat tietyt yksilöön liittyvät ominaisuu-det. Valtonen ym. (2014) toteavat aikuisten vapaaehtoisen sairausvakuutuksen jossain määrin siirtävän terveydenhuollon palvelujen käyttöä julkiselta sektorilta yksityisille palveluntarjoajille. Sama näkyy myös käyntien frekvenssissä vapaaehtoisen sairausva-kuutuksen laskiessa julkisen terveydenhuollon käyntimääriä, kun taas yksityisten palve-luntarjoajien käyntimäärät kasvavat. (Valtonen ym. 2014, 18-29.) Endogeenista binääri-valintamallia ovat hyödyntäneet myös Hamilton ym. (1997) tutkimuksessaan työttö-myyden vaikutuksesta mielenterveyteen. Mallissa työttömyys on mallinnettava endo-geeninen binäärimuuttuja, jonka estimaatti selittää mielenterveyttä kuvaavaa indeksi muuttujaa. (Jones 2000, 302.)

Valinnan tai intervention keskiarvoiset seuraamusvaikutukset (ATE) tarkoittavat binääri-muuttujan vaikutuksia sairauskulukorvausten kohdalla, kun valinnassa tapahtuu 0 -> 1 siirtymä, eli kun valitaan HTA-palvelu. ATE:ssa on siis kyse kulukorvausten kokonaise-rotuksesta valintaluokissa 1 ja 0.

ATE tuli alun perin tunnetuksi terveydenhuollon hoitojen tai jonkin tukiohjelman vaiku-tuksia tutkittaessa, mutta menetelmä on sovellettavissa mihin tahansa tapaukseen, jossa mielenkiinnon kohteena oleva selittävä muuttuja on binäärinen. (Woolridge 2002,

603-604.) Whitney Newey (2007) kuvaa intervention vaikutuksia esimerkin kautta. Oletetaan että i indeksoi yksilöitä ja Di tarkoittaa interventiota ja saa arvon 1, kun yksilö on inter-vention kohteena ja muutoin arvon 0. Esimerkiksi tämän työn mallissa Di = 1 tarkoittaa HTA-palvelua käyttänyttä henkilöä. Yi0 tarkoittaa mahdollista tulemaa, kun henkilö ei ole intervention kohteena (Di = 0) ja Yi1 tilannetta, kun henkilö on intervention kohteena (Di

= 1). Näitä molempia tiloja ei voida havaita (esimerkiksi tässä työssä tapahtuma on eden-nyt HTA-palvelun kautta tai ei), joten toinen tiloista on vaihtoehtoinen (eng. counterfac-tual) tulos. Täten havaittu lopputulema on seuraavanlainen

Yi = DiYi1 + (1 - Di)Yi0,

josta intervention vaikutukset yksilölle saadaan laskemalla

βi = Yi1 - Yi0.

Keskimääräinen intervention seuraamusvaikutus (ATE) kuvaa intervention odotusarvo- eli keskiarvovaikutusta yli koko populaation ja saadaan seuraavasti

ATE ≡ E[βi].

Lineaarisessa regressiomallissa ATE on Di :n kerroinestimaatti. Kulmakerroin βi voi vaih-della yksilöiden välillä, mutta ATE kuvaa kulmakertoimen keskiarvoa koko populaation yli. (Newey 2007, 1-2.)

6 MALLIT JA MALLITULOKSET 6.1 Mallit

Työssä rakennettiin vapaaehtoisen sairausvakuutuksen korvausmenolle (tuki- ja liikunta-elinsairauksien sairaanhoitokulut) ja HTA-palvelun valinnalle niin sanottu rakennevalin-tamalli, jossa HTA-palvelun malli toimii myös selittävänä muuttujana korvausmenolle.

Aluksi kuitenkin estimoitiin sekä korvausmenolle ja HTA-palvelulle omat erilliset mallit, jotka lopuksi yhdistettiin samanaikaisessa rakennemallin estimoinnissa. Mallien rakenta-misen pohjana käytettiin kappaleen 5 keskeisiä havaintoja. Yhtenä rajoittavana tekijänä muuttujien valinnalle toimi myös käytössä ollut aineisto. Korvausmenojen malli rakentui seuraavien vaiheiden kautta.

Malli 1a, missä selittävinä muuttujina toimivat HTA-palvelun käyttö sekä kumppanuus-luokka, joille muodostetaan interaktiotermit. Malli 1a voidaan kirjoittaa seuraavaan pe-rusmuotoon:

korvausmeno = β0 + β1*HTA-palvelu_1/0 + β2*kumppanuusluokka + ε1

jossa ε1 kuvastaa mallin jäännöstermiä.

Seuraavassa mallissa, Malli 1b, kumppanuusluokka vaihdetaan ikäluokkaan, jolloin HTA-palvelun käytön ja ikäluokan välille muodostetaan interaktiotermit. Tällöin perus-malli voidaan kirjoittaa seuraavasti:

korvausmeno = β0 + β1*HTA-palvelu_1/0 + β2*ikäluokka + ε2

Kolmantena vaiheena on Malli 1c, missä on HTA-palvelun lisäksi mukana kumppanuus-luokka, ikäluokka ja asuinalue (AVI:n toimialueiden mukaan), mutta ei interaktiotermejä.

Näin ollen malli voidaan kirjoittaa seuraavasti:

korvausmeno = β0 + β1*HTA-palvelu_1/0 + β2*ikäluokka + β3*kumppanuusluokka + β4*avi_alue + ε3

Koska terveydenhuoltokulujen jakauma on hyvin vino oikealle, muodostetaan myös kaksi mallia, joissa selitettävänä muuttujana on korvausmenojen logaritmi (vertaa kuviot 8 ja 9) logKORVAUKSET. Malli 1d voidaan kirjoittaa seuraavasti:

logKORVAUKSET = β0 + β1*HTA-palvelu_1/0 + β2*ikäluokka + β3*kumppanuusluokka + β4*avi_alue + ε4

Malli 1e:ssä selittävät muuttujat ovat samoja, kuin 1d:ssä, mutta HTA-palvelusta ja ikä-luokista muodostetaan interaktiotermi.

logKORVAUKSET = β0 + β*i.HTA-palvelu_1/0#i.ikäluokka + β2*kumppanuusluokka + β3*avi_alue + ε4

HTA-palvelun valintaa ennustetaan probit-mallin avulla, toisin sanoen kuinka edellä mai-nitut muuttujat ennustavat HTA-palvelun käytön todennäköisyyttä. Täten tehdään seu-raava probit estimointi eli Malli 2:

Prob[HTA = 1| X] = c0 + c1*kumppanuusluokka + c2*ikäluokka c3*avi_alue + u1

Tämän jälkeen siirrytään rakennemallin estimointiin, joka huomioi HTA-palvelun valin-nan endogeenisuuden korvausmenojen mallissa, eli HTA-muuttuja on instrumentoitu korvausmallissa selittäjällä, joka ei esiinny korvausmallissa. Malli 3 on siis 2-osainen rakennevalintamalli. Mallien 1a-e ja 2 tuloksiin perustuen päädytään lopullisessa mallissa käyttämään selitettävänä muuttujana korvausten logaritmia. Logaritmointi normalisoi ai-neistoa ja selitysasteet ovat huomattavasti parempia. Selittäviksi muuttujiksi valitaan ikä jatkuvana muuttujana, kumppanuusluokka sekä sukupuoli. Lisäksi selittävänä muuttujana on HTA-palvelun probit-estimaatti eli valikoitumismallin tulos, jossa ennustajina ovat kumppanuusluokka ja AVI-alue –muuttuja.

6.2 Mallitulokset

Malleissa 1a-1c selitettävä muuttuja on korvausmeno ja mallissa 1d korvausmenon loga-ritmi. Mallien 1a-1c selitysasteet (Liite 1, Liite 2 ja Taulukko 15) olivat melko alhaisia

asettuen noin 2 – 4,5 % väliin. Malli 1d:n selitysaste oli jonkin verran parempi ollen hie-man alle 12 %. Selitysaste tarkoittaa, kuinka monta prosenttia malli selittää selitettävän muuttujan variaatiosta.

Malli 1a:n (Liite 1) tuloksista voidaan todeta, millaisia muutoksia malli ennustaa kor-vausmenoon siirryttäessä vakioidusta pohjaluokasta 0#Avainkumppani muihin luokkiin.

Kontrolliryhmän (0#) sisällä korvausmenon ennustetaan laskevan ei kumppaneilla (β

= - 49,99) sekä julkisessa sairaalassa (β = -135,29). HTA-palvelun (1#) mikään luokka ei tuota tilastollisesti merkitsevää tulosta. Julkinen sairaala ja Ei kumppani -luokat ovat melko lähellä p-arvon 0,05 rajaa. Molemmat näistä ennustavat korvausmenon kasvavan suhteessa pohjaluokkaan. Avainkumppaneilla hoidetuissa tapauksissa HTA-palvelun korvausmenon ennuste on hieman alhaisempi (β = - 11,35), mutta ei kuitenkaan tilastol-lisesti merkitsevä.

Malli 1b:ssä (Liite 2) nähdään hyvin oletettu ikäluokan vaikutus korvausmenoon. Malli 1b ennustaa korvauksen määrän kasvavan vanhempiin ikäluokkiin mentäessä ja ikäluok-kien väliset erot kontrolliryhmän sisällä ovat tilastollisesti merkitseviä. Ikäluokassa 0 – 9 -vuotiaat mallin ennuste ei ole tilastollisesti merkitsevä kontrolliryhmän ja HTA-palvelun välillä. Katsottaessa HTA-palvelua käyttäneitä yli 80 – vuotiaita ei korvauksen määrän ennusteta kasvavan yhtä paljon, kuin kontrolliryhmässä, mutta todennäköisesti vähäisen havaintomäärän vuoksi, ero ei ole tilastollisesti merkitsevä vakioituun pohjaluokkaan nähden.

Malli 1c (Taulukko 15) ennustaa korvausmenon laskevan avainkumppaneilta ei kumppa-neille sekä julkiseen sairaalaan siirryttäessä. Ikäluokissa ennuste on samankaltainen kuin aikaisemmin, mitä vanhempi, sitä suurempi korvausmeno. AVIn toimialueiden mukai-sissa asuinalueissa pohjatasona on Etelä-Suomi. Malli ennustaa korvausten hienoista kas-vua Pohjois-Suomen alueella (β = 26,35, p = 0,003) ja pientä laskua (β = -21,88, p <

0,001) Länsi- ja Sisä-Suomen alueella.