Ominaisuusvakiointi valikoitumisharhan hallinnassa - Kohteena ei kokeelliseen asetelmaan perustuva terveystaloudellinen arviointitutkimus

(1)

OMINAISUUSVAKIOINTI VALIKOITUMISHARHAN HALLINNASSA – Kohteena ei-kokeelliseen asetelmaan

perustuva terveystaloudellinen arviointitutkimus

Erkki Soini

Pro gradu -tutkielma Terveystaloustiede Kuopion yliopisto

Terveyshallinnon ja -talouden laitos Toukokuu 2008

(2)

KUOPION YLIOPISTO, yhteiskuntatieteellinen tiedekunta Terveyshallinnon ja talouden laitos, Terveystaloustieteen pääaine

SOINI, ERKKI JAAKKO OLAVI: Ominaisuusvakiointi valikoitumisharhan hallinnassa – Kohteena ei-kokeelliseen asetelmaan perustuva terveystaloudellinen arviointitutkimus

Pro gradu -tutkielma 100 s., 3 liitettä (12 s.) Tutkielman ohjaajat: PhD Hannu Valtonen

FT Janne Martikainen Toukokuu 2008

Avainsanat: terveystaloustiede, taloudellinen arviointi, kustannus-vaikuttavuusanalyysi, metodologia, virheanalyysi, elämänlaatu, vaihtoehtoiskustannus, verisuonitaudit

Tutkimuksen teoreettisena tavoitteena oli tarkastella ominaisuusestimointia (PSE) metodolo- giana sekä PSE:n avulla suoritettua ominaisuusvakiointia lähinnä kustannus-vaikuttavuusana- lyyseihin (CEA) ja vaihtoehtoiskustannusanalyyseihin (OCA) liittyvän valikoitumisharhan hallinnassa. Teoreettisena tehtävänä oli tutkia PSE:iin liittyvää keskustelua CEA:sta ja OCA:

sta. Empiirisenä tavoitteena oli selvittää PSE:n käyttökelpoisuutta taloudellisessa arviointitutkimuksessa tarkastelemalla, mikä on paras PSE-menetelmä. Lisäksi tutkittiin sepelvaltimotaudin (CHD) hoidon kustannuksissa, vaikuttavuudessa ja kustannusutiliteetissa ja vaihtoeh- toiskustannuksissa (OC) esiintyviä eroja, kun valikoitumisilmiötä ei huomioitu sekä valikoi- tumisilmiön huomioinnin ja poissulun kera parasta analyysitapaa hyödyntäen.

Tutkimuksen teoreettinen aineisto muodostui PSE:hen liittyvästä kirjallisuudesta. Empiirinen analyysi tehtiin terveyspalvelujen tuottajan näkökulmasta. Empiirinen aineisto muodostui aikavälillä 1.9.2004–25.11.2004 Kuopion yliopistollisessa sairaalassa akuutin CHD-epäilyn vuoksi hoidossa olleista potilaista (N 171), joilla oli sydämen sepelvaltimoiden varjoaineku- vauksessa todettu vähintään yhden sepelvaltimon ahtauma. Heistä kerättiin mm. elämänlaatu- (15D), mikrokustannus- ja hoitotiedot. Erilaisten logit-mallien sekä Bayes-mallin sopivuutta PSE:ssa vertailtiin. Aineisto vakioitiin erilaisilla ominaisuusvakiointimenetelmillä (kovariaattivakiointi sekä lisäävä ja vähentävä parinmuodostus) ja menetelmiä vertailtiin. Tulokset esi- tettiin deterministisen tavan ohella myös stokastisesti bootstrapping-otantaa hyödyntäen.

Tutkimuksen mukaan pelkän inkrementaalisen kustannus-vaikuttavuussuhteen (ICER) tarkas- telua ei voida pitää teoreettisesti ja/tai päätöksentekijän kannalta käyttökelpoisena. Jos pää- töksenteko perustuu maksuhalukkuuteen, tulee päätösongelma esittää kustannus-vaikuttavuuden hyväksyttävyyskäyrinä (CEAC). CEAC:en ohella on syytä tarkastella OC:ia, koska ne ovat teoreettisesti ICER:tta oleellisempia, käyttökelpoisempia ja voivat tuottaa eri tuloksen.

Tutkimuksessa valikoitumisilmiö aiheutti huomattavan harhan tuloksiin, joita pystyttiin kor- jaamaan osittain perinteisen kovariaattivakioinnin avulla. Parhaaksi PSE:ksi osoittautui kuitenkin logit-malli ja parhaaksi ominaisuusvakiointimenetelmäksi lisäävä parinmuodostus.

Tulosten mukaan pallolaajennus ei ollut kustannusvaikuttava, eikä OCA:n näkökulmasta edes hyväksyttävä vaihtoehto. Ohitusleikkaus oli OCA:en näkökulmasta hyväksyttävä vaihtoehto.

Esitetyt PSE:t, ominaisuusvakiointimenetelmät, ominaisuusvakiointiprosessit, OC-estimaatit, monimuuttujamenetelmät ja probabilistiset lähestymistavat tarjoavat tehokkaan ja oleellisen tavan havainnollistaa päätösepävarmuutta ja parantaa tulosten tarkkuutta seurantatutkimuksis- sa. Kehittämistä tarvitaan PSE-prosessien ja -mittareiden standardoinnissa sekä ominaisuus- vakiointimenetelmissä, joilla voidaan parantaa mallien käyttökelpoisuutta ja tarkkuutta.

(3)

UNIVERSITY OF KUOPIO, Faculty of Social Sciences

Department of Health Policy and Management, Health economics

SOINI, ERKKI JAAKKO OLAVI: Propensity score adjustment for selection bias control – The problematic subject of non-experimental setting in health economic evaluations

Master’s thesis 100 p., 3 appendices (12 p.)

Advisors: PhD Hannu Valtonen

PhD Janne Martikainen May 2008

Keywords: health economics, economic evaluation, cost-effectiveness analysis, methodology, bias analysis, quality of life, opportunity cost, circulatory diseases

The theoretical objective of this study was to appraise propensity score estimation (PSE) and propensity score adjustment methodologies, when e.g. cost-effectiveness analysis (CEA) and/or opportunity cost analysis (OCA) is subject to selection bias. As a theoretical task, a survey to the literature of CEA and OCA methods related to PSE was done. The empirical objective of the study was to explore the best PSE adjustment method and to assess the feasibility of PSE adjustment in an economic evaluation. This was done through the assessment of differences in costs, effectiveness, and cost-utility as well as opportunity costs without any consideration for selection bias and by using the best adjustment method for selection bias.

The theoretical data was obtained or derived from the literature related to PSE. The empirical analysis was done from health care provider’s perspective. Patients, who were admitted to the Kuopio University Hospital during 1.9.2004-25.11.2004 due to the suspicion of coronary heart disease (CHD, N 171) and who had at least one atresia in their coronary artery based on a coronary angiography, established the empirical data. Information concerning e.g. quality of life (15D), micro costs and treatment group (by-pass, angioplasty or medication) were col- lected. The feasibility of different logit models and a Bayes model for PSE was explored. The data was adjusted using different types of adjustment methods (covariate adjustment and matching with or without replacement) and comparison between the methods was done. The results were presented also in a stochastic form using bootstrapping procedure.

Generally, incremental cost-effectiveness ratio (ICER) is not feasible from the view point of theoretical discussion or from decision maker’s perspective. If the decisions are based on the level of willingness to pay, the decision problem should be presented as the cost-effectiveness acceptability curve (CEAC). In addition to CEAC, the assessment of opportunity costs (OC) is theoretically relevant and feasible. OCs may give different results than ICER or CEAC.

In this study, selection phenomenon resulted to an ample level of selection bias, which was partly resolved with a covariate adjustment. However, in this study, the best adjustment method was logit-based matching with replacement. According to the matched results, angioplasty is neither cost-effective nor feasible treatment from the perspective of OCs. According to OCA, by-pass operation can be regarded as a feasible treatment for CHD.

The presented PSEs, OCAs, multivariate analyses and probabilistic approaches offer an effi- cient and mathematically solid way to depict decision uncertainty and to improve the preci- sion of results in non-experimental or quasi-experimental settings. However, there is still room for development in the standardization of PSE-processes and in methods, which would improve both the real decision making and the feasibility of models to the decision makers.

(4)

SISÄLTÖ

1 JOHDANTO... 3

1.1 Tutkimuksen tavoitteet... 5

1.2 Tutkimustehtävät... 6

1.3 Tutkimusprosessi ja sen rajaukset ... 7

2 TALOUDELLISEN ARVIOINNIN TEORIA... 9

2.1 Aikaisemman teorian kritiikki ja kritiikin ratkaiseminen ... 9

2.1.1 Keskimääräinen ja inkrementaalinen kustannusvaikuttavuus... 9

2.1.2 Inkrementaalinen kustannusvaikuttavuus ja vaihtoehtoiskustannukset ... 11

2.1.3 Satunnaiset ja kontrolloidut asetelmat... 14

2.1.4 Epävarmuus ja valikoitumisongelma ... 15

2.2 Taloudellisen arvioinnin mittarit... 17

2.2.1 Terveyteen liittyvä elämänlaatu ... 19

2.2.2 Laatupainotetut elinvuodet... 21

2.2.3 Kustannukset ... 24

3 MENETELMÄT JA TEOREETTISET TULOKSET... 26

3.1 Stokastinen lähestymistapa ... 26

3.2 Vakiointimenetelmät ... 28

3.2.1 Valikoitumisharhan hallinta ... 28

3.2.2 Multinomiaalinen logistinen regressio ... 34

3.2.3 Stereotypisoiva logistinen regressio... 36

3.2.4 Naiivi Bayes ... 36

3.3 Kustannusten ja vaikuttavuuden mallintaminen ... 37

3.4 Herkkyysanalyysit... 40

3.5 Nettohyöty ja kustannusvaikuttavuuden hyväksyttävyyskäyrät ... 41

3.6 Aineisto ... 43

4 EMPIIRISET TULOKSET ... 46

4.1 Aineiston ominaisuudet... 46

4.2 Ominaisuusestimointi... 48

4.3 Kustannukset ... 48

4.4 Terveysprofiilit... 52

4.5 Vaikuttavuus... 54

4.6 Kustannusvaikuttavuus... 59

4.7 Yksinkertaiset tehokkuusparannukset ... 65

5 POHDINTA ... 69

6 JOHTOPÄÄTÖKSET... 80

LÄHTEET... 81

LIITE 1. 15Ds-kyselylomake... 101

LIITE 2. Multinomiaalinen Propensity Score Logit -malli... 110

LIITE 3. Stereotypisoiva Propensity Score Logit -malli... 112

(5)

TAULUKOT

TAULUKKO 1. Tutkimuksen näkökulma ja kustannuslaskenta…... 24

TAULUKKO 2. Muuttujat, joiden mukaan ryhmät olivat valikoituneet... 46

TAULUKKO 3. Kustannusten OLS-malli... 49

TAULUKKO 4. Kustannusten logaritmivoitu (ln) OLS-malli... 50

TAULUKKO 5. Kustannusten GLM... 51

TAULUKKO 6. Lisäävän ja vähentävän parinmuodostuksen kustannukset... 52

TAULUKKO 7. 15D-muutokset... 55

TAULUKKO 8. 15Ds-muutokset... 56

TAULUKKO 9. Deterministinen inkrementaalinen kustannusvaikuttavuus………... 59

TAULUKKO 10. Stokastinen inkrementaalinen kustannusvaikuttavuus ja vakioimattomuuden aiheuttama harha...60

TAULUKKO 11. Deterministiset tehokkuusparannukset per potilas... 65

TAULUKKO 12. Stokastiset tehokkuusparannukset ja vaihtoehtoiskustannukset per potilas sekä vaikuttavuutena että euromääräisesti... 66

KUVIOT KUVIO 1. Tutkimusprosessi ja sen tärkeimmät osat……….. 7

KUVIO 2. Terveystaloudellisen arviointitutkimuksen vaiheet ja valinnat……….. 8

KUVIO 3. Valikoitumisharhan hallinnan menetelmiä... 29

KUVIO 4. Vakioimattomasta aineistosta muodostetut terveysprofiilit... 53

KUVIO 5. Lisäävällä parinmuodostuksella vakioidusta aineistosta muodostetut terveysprofiilit... 53

KUVIO 6. Vähentävällä parinmuodostuksella vakioidusta aineistosta muodostetut terveysprofiilit... 54

KUVIO 7. Muutokset 15D-pistelukemassa... 58

KUVIO 8. Muutokset 15Ds-pistelukemassa... 59

KUVIO 9. Stokastinen kustannus-vaikuttavuustaso (vakioimaton tulos)... 62

KUVIO 10. Stokastinen kustannus-vaikuttavuustaso (lisäävä parinmuodostus)... 62

KUVIO 11. Multinomiaaliset kustannusvaikuttavuuden hyväksyttävyyskäyrät (mCEAC) sekä PSE-vakioiduille että vakioimattomille kustannusvaikuttavuuden todennäköisyyksille, kun analyysissä on mukana kaikki kolme vaihtoehtoa... 63

KUVIO 12. Kustannusvaikuttavuuden hyväksyttävyyskäyrät (CEAC) sekä PSE-vakioiduille että vakioimattomille kustannusvaikuttavuuden todennäköisyyksille, kun analyysissä on mukana CABG ja PTCA... 64

KUVIO 13. Vakioimattomat vaihtoehtoiskustannukset... 67

KUVIO 14. Vakioidut vaihtoehtoiskustannukset (lisäävä parinmuodostus)... 68

(6)

1 JOHDANTO

Suomessa on kiinnitetty ansiokkaasti huomiota terveydenhuollon prosessien analysoin- tiin ja prosessien kehittämiseen erityisesti tuottavuuden näkökulmasta (Lillrank, Kujala

& Parvinen 2004), mutta hoitomenetelmien vaikuttavuuden, kustannusvaikuttavuuden ja taloustieteellisesti relevanttien todellisten vaihtoehtoiskustannusten (engl. opportunity costs, OC) mittaamiseen on kiinnitetty todella vähän huomiota. Tutkimuksissa ongelmia on ilmennyt myös ei-satunnaistetun ja kontrolloimattoman asetelman (ns. luonnollinen asetelma) käsittelyssä: potilaat valikoituvat interventioryhmiin mm. tarpeensa, halujen- sa, sosioekonomisten taustatekijöidensä ja hoidon tarjonnan alueellisen jakauman suhteen. Tällainen valikoitumisilmiö estää tai ainakin rajoittaa vertailututkimuksesta tehtä- viä päätelmiä sekä aiheuttaa ns. valikoitumisharhaa (engl. selection bias). Erityisesti päätöksenteko-orientoituneelle marginaalitaloustieteelle asia on ongelma teoreettisesti ja menetelmällisesti: päätöksiä tukevien inkrementaalisten suhteiden rajat hämärtyvät.

Tässä tutkimuksessa etsitään tiettävästi ensimmäistä kertaa Suomessa ratkaisua valikoi- tumisongelmaan stokastisessa kustannus-vaikuttavuusanalyysissä (engl. cost-effectiveness analysis, CEA). Bioanalyyttinen kirjallisuus kertoo Propensity Score -estimaatio- menetelmästä (PSE) eli ns. ominaisuusestimoinnista. PSE:n avulla voidaan valikoitu- misilmiön aiheuttamaa sekoittuneisuutta ainakin osittain tilastollisten menetelmien ja tunnettujen tekijöiden rajoissa hallita eli suorittaa ns. ominaisuusvakiointi. PSE voidaan suorittaa useammilla tavoilla ja myös sen käyttötapa vakioinnissa vaihtelee monimuut- tujamenetelmällä tapahtuvasta parametrivakioinnista ominaisuusparien muodostami- seen. Useimmat näistä käydään tässä tutkimuksessa soveltaen läpi.

Tässä tutkimuksessa kiinnitetään ensimmäisen kerran Suomessa huomiota vaikuttavuuden arviointiin nettohyötyä (engl. net monetary benefit, NMB) PSE-menetelmiä käyttä- en. Terveystaloustieteen mikrotaloustieteellinen perustyökalu eli taloudellinen arviointitutkimus perustuu OC-käsitteelle ja nykyaikaisen kokonaisvaltaisen analysoinnin pe- rusmittarina pidetään inkrementaalista kustannus-vaikuttavuussuhdetta (engl. incremental cost-effectiveness ratio, ICER). ICER mittaa terveysteknologioiden välistä kustan- nuseroa ja suhteuttaa sen teknologioiden vaikuttavuuseroon.

(7)

Alkuperäisen tarkoituksensa eli teknisen tehokkuuden tavoittelun (Drummond 1980) lisäksi ICER:tta on myöhemmin alettu pitää päätöksentekijän maksimimaksuhalukkuu- tena (engl. willingness to pay, WTP) lisäterveyshyöty-yksikköä kohden (O’Hagan, Stevens & Montmartin 2001), vaikka ICER:een läheisesti liittyvän WTP:n per lisä- hyöty-yksikkö voidaan osoittaa muuttuvan (Sendi, Gafni & Birch 2002) edellisen hy- väksytyn intervention ICER:een funktiona. WTP on ja tulee todennäköisesti siis pysy- mään dynaamisena, abstraktina ja empiirisesti hankalasti mitattavana käsitteenä. Mene- telmällisesti WTP:n suurin anti tällä hetkellä on ICER:een muuttaminen muotoon, jossa sitä voidaan käsitellä euromääräisesti nettohyötynä ja muodostaa tässäkin tutkimuksessa esitettyjä kustannus-vaikuttavuuden hyväksyttävyyskäyriä.

Lisäksi tässä tutkimuksessa esitellään OC:en ehdot täyttävä yksinkertaisten tehokkuusparannusten lähestymistapa, joka on yksi vaihtoehtoiskustannusanalyysin (engl. opportunity cost analysis, OCA) muoto. Tapaa sovelletaan ICER- ja WTP-lähestymistapojen ohessa niitä tukevana. On huomattava, että aikaisemmasta tutkimuksesta poiketen yksinkertaisten tehokkuusparannusten lähestymistapa ei edellytä WTP:n tuntemista, eikä ICER:een liittyviä oletuksia vakioskaalatuloista tai täydellisestä jaettavuudesta. Tapa edellyttää, että ehdotetun intervention lisäterveyshyötyjä verrataan muiden tunnettujen interventioiden tai muiden interventioiden yhdistelmän samoilla resursseilla tuottamaan terveyshyötyyn. Vain jos uuden intervention lisäterveyshyödyt ylittävät muualta mene- tetyt hyödyt (ts. OC:n sairausryhmän sisällä), on tehokkuus todellisuudessa parantunut.

Toisaalta sepelvaltimotauti (engl. coronary heart disease, CHD) aiheuttaa merkittäviä kansantaloudellisia ja inhimillisiä menetyksiä vuosittain ollen merkittävin kansantauti Suomessa. Vaikka CHD:n merkitys kansantautina on tunnettu jo kauan, ei sen hoitoon ja reaalivaikuttavuuteen ole juuri erilaisten lääkehoitojen lisäksi kiinnitetty kansallisesti suurtakaan huomiota. Kuopion yliopistollisessa sairaalassa toteutetussa Mallisairaala- projektissa (esim. Soini ym. 2007) on keskeisellä sijalla ollut terveydenhuollon asiak- kaan subjektiivinen näkökulma eli potilasnäkökulma (engl. patient reported outcomes, PRO). Itä-Suomen alueella toteutettava Terve Kuopio -hanke ja aluekehitysohjelma on myös nostanut CHD-potilaan saumattoman hoitoketjun pilottihankkeekseen.

Tässä tutkimuksessa panostetaan monimutkaisen aineiston teoreettiseen ja empiiriseen hallintaan eri menetelmiä hyödyntäen ja niiden antamia tuloksia verraten. Tutkimukses-

(8)

sa on saatu huomiota herättäviä tuloksia erityisesti hoitomuotojen kustannusten, vaikuttavuuden ja kustannusvaikuttavuuden sekä OC:en estimoinnin ja vertailun osa-alueilta.

Nämä asiat ovat tärkeitä ja liittyvät läheisesti terveystaloustieteen suureen tehtävään – vältettävissä olevien sairauksien, kuolemien ja verojen välttämiseen (Soini 2005), mihin tässä pyritään PSE-, CEA- ja OCA-lähestymistapojen synteesin avulla.

Toisin kuin useimmissa CHD-tutkimuksissa, vertailu on tässä tutkimuksessa kattava.

Empiirisessä osiossa vertailtavat ryhmät ovat: operatiivinen ohitusleikkaus- (engl. coronary artery bypass grafting, CABG), pallolaajennus- (engl. percutaneous transluminal coronary artery angioplasty, PTCA; myös engl. percutaneous coronary intervention, PCI) ja konservatiivinen lääkehoitoryhmä. Tutkimuksen empiirinen aineisto on kerätty luonnollisesta, todellisesta potilasvirrasta ja intervention suorittamiseen ei ole puututtu.

Tällaisen tutkimuksen voidaan olettaa nostaa näyttöön perustuvan terveystaloustieteen tasoa Suomessa luoden tilaa niin sanotulle näyttöön perustuvalle terveystalousanalyysil- le sekä päätöksentekomallintamiselle. Seuraavaksi käsiteltävien tutkimustavoitteiden ja -tehtävien avulla on lähestytty vaikeita asioita pioneerityyppisesti suomalaisessa kon- tekstissa antaen aihetta myös jatkotutkimuksille sekä luoden uutta teoriaa.

1.1 Tutkimuksen tavoitteet

Tutkimuksen teoreettisena tavoitteena on tarkastella ominaisuusestimointia (PSE) me- todologiana sekä PSE:n avulla suoritettua ominaisuusvakiointia ja sen käyttökelpoisuut- ta erityisesti mikrotaloudelliseen arviointitutkimukseen eli lähinnä CEA:in ja OCA:in liittyvän valikoitumisharhan hallinnassa. Yleisesti tutkimuksen teoreettisena tavoitteena on vastata menetelmällisesti rutiininomaisen vaikuttavuustutkimuksen ongelmiin.

Tutkimuksen empiirisenä tavoitteena on selvittää PSE:n mahdollisuuksia taloudellisessa arviointitutkimuksessa tarkastelemalla, miten sepelvaltimotaudin (CHD) hoidon kustannukset, vaikuttavuus ja kustannusutiliteetti sekä vaihtoehtoiskustannukset (OC) muuttu- vat, kun valikoitumisilmiö huomioidaan ja poissuljetaan parasta analyysitapaa hyödyn- täen. Tavoitteena on kuvata CHD-potilaiden hoitoon vaikuttavia tekijöitä sekä hoidon

(9)

tuloksia niiden reaalivaikuttavuuden ja todellisten OC:n, ei laboratorioluonteisen nimel- lisen tehon tai pelkästään WTP:n osalta.

1.2 Tutkimustehtävät

Tämän tutkimuksen tehtävät jakautuvat teoreettisiin ja empiirisiin. Teoreettisena tehtä- vänä on tutkia PSE:iin liittyvää keskustelua erityisesti kustannus-vaikuttavuusanalyy- seistä (CEA) ja OC:en tarkastelusta. Lisäksi teoriaosassa käydään läpi keskustelua CEA:stä PSE:oon liittyen ja tuloksena ehdotetaan näiden pohjalta eräs todellisten OC- tarkastelumenetelmä.

Empiirisen osion PSE:ssa käytetyt menetelmät ovat

o Joko suurimman uskottavuuden (engl. maximum likelihood, ML) multinomiaalinen logistinen regressio (mlogit) tai samanpesäinen (engl. nested) logit mlogit-oletusten täyttymisestä riippuen, stereotypisoiva logit (slogit) ja

o Ahne naiivi Bayes (engl. greedy naive Bayes, GNB).

PSE:n vaikutuksia testataan kolmea eri analyysitapaa käyttäen hyödyntäen edellisistä menetelmistä parhaan estimaatteja:

o Regressioestimointi (ns. kovariaattivakiointi) o Poistava parinmuodostus

o Lisäävä parinmuodostus.

Lisäksi PSE-tuloksia verrataan tavanomaisiin regressiovakioituihin tuloksiin (pienem- män neliösumman regressio, pienimmän neliösumman regressio ln-muutoksella ja yleis- tetty lineaarimalli (GLM)) ilman PSE:ta sekä vakioimattomiin tuloksiin. Itse analyysi tehdään tutkimuksen sisäisenä (engl. with-in trial) analyysinä sekä deterministisesti että probabilistisesti stokastista aineistoa hyödyntäen.

Tutkimuksen empiirisenä tehtävänä on selvittää, mitkä ovat CHD:n hoidon reaaliset kustannukset, vaikuttavuus ja kustannusvaikuttavuus sekä OC:t ilman valikoitumisilmi- ön huomiointia sekä valikoitumisilmiön huomioinnin ja poissulun kera parasta analyysitapaa hyödyntäen (ts. muuttuvatko tulokset eli onko vakioinnilla merkitystä?).

(10)

1.3 Tutkimusprosessi ja sen rajaus

Kuviossa 1 on esitetty tutkimusprosessi. Tutkimus alkoi kirjallisuuden tarkastelulla ai- heesta ”valikoitumisharhan hallinta” (Kappale 2), josta deduktiivisen päättelyn avulla johdettiin potentiaalisia valikoitumisharhan hallinnan menetelmiä (Kappale 3). Tutki- muksen aiheeksi muodostui ”Ominaisuusvakiointi valikoitumisharhan hallinnassa”.

Ominaisuus- vakiointi valikoitumisharhan

hallinnassa Tutkimuksen

aihe

Tiedon- keruu

Parinmuodostus (lisäävä)

Vaihtoehtois- kustannukset Kustannus-

vaikuttavuuden hyväksyttä- vyyskäyrät

Onnistunut ominaisuusvakiointi sekä toimivat esitys- ja lähestymistavat Kirjallisuus

Sepelvaltimo- tautiaineisto Aineiston

keruu ja menetelmien testaaminen

Tulokset

Johtopäätös

Deduktio

PSE- menetelmät

Induktio

Teoreettinen perustelu

Teoreettinen perustelu Teoreettinen

perustelu

Teoreettinen toimivuus, robustisuus ja käyttökelpoisuus Tulosten

esitystavat

KUVIO 1. Tutkimusprosessi ja sen tärkeimmät osat

Seuraavaksi potentiaalisia menetelmiä testattiin empiirisessä aineistossa (Kappale 4) ja tämän jälkeen tuloksia pohdittiin (Kappale 5) sekä rakennettiin johtopäätökset (Kappale 6). Suurin osa tarkemmista tuloksista on esitetty runkotekstissä (ks. Kappaleet 2-4), koska hankalasti hallittavasta ja vähän tutkitusta asiasta saatiin paljon uusia tuloksia.

Tutkimuksen teossa on huomioitu myös terveystaloudellisen arviointitutkimuksen teon yleinen prosessi (Kuvio 2), jota on syvennetty ominaisuusvakioinnin vaiheilla. Empiiri- sessä osassa tämän tutkimuksen tekijä

• hyödyntää kirjallisuutta, seurantatutkimusta ja tietokantaa aineiston lähteinä,

• käyttää sairauden kulkua (hoidot), vaikuttavuutta ja kustannuksia aineistonaan,

• muodostaa ominaisuusestimaatit erilaisten PSE-mallien avulla ja vertaa niiden tuloksia,

(11)

• muodostaa parhaaseen PSE-malliin perustuen aineistosta erilaisten vakiointikäytän- töjen (tavanomainen kovariaattivakiointi, PSE-kovariaattivakiointi, lisäävä parinmuodostus ja vähentävä parinmuodostus) avulla mallin muuttujien arvot epävar- muuksineen,

• rakentaa mallin,

• suorittaa deterministisen ja stokastisen mallintamisen,

• tuottaa vaikuttavuus-, kustannus- ja OC-arvioiden todennäköisyysjakaumat,

• mallintaa päätökseen liittyvää epävarmuutta probabilistisen herkkyysanalyysin avulla sekä

• tuottaa päätöksentekoa tukevan tuloksen.

KUVIO 2. Terveystaloudellisen arviointitutkimuksen vaiheet ja valinnat (Lähde: Martikainen, Hallinen & Soini 2006)

Tutkimuksessa käsitellään mikrotaloudellisen arviointitutkimuksen oleellisia menetel- miä asetelmien, mittareiden ja CEA- sekä OCA-lähestymistapojen osalta, koska viime- aikaistakin kirjallisuutta tutkittaessa huomattiin tutkimuksissa monia puutteita. Ominai- suusvakiointi käydään läpi tasolla, joka mahdollistaa eri menetelmien avulla kriittisten analyysien teon – tutkimus on kuitenkin terveystaloudellinen ja siinä mielessä sen suurimmat teoreettisen kiinnostuksen kohteet ovat CEA:in ja OCA:in liittyvät teoriat.

(12)

2 TALOUDELLISEN ARVIOINNIN TEORIA

Williamsin (1983) mukaan taloudellisen arvioinnin tulee varmistaa se, että arvo joka saavutetaan toiminnasta ylittää toiminnan vuoksi menetetyn arvon – vaihtoehtoiskus- tannuksen (engl. opportunity cost, OC). Kustannus-vaikuttavuusanalyysi (engl. cost- effectiveness analysis, CEA) sinänsä on menetelmä, jonka avulla päätöksentekijät voivat allokoida resurssit siten, että ne maksimoivat saavutetut terveyshyödyt (Weinstein, Stason 1977). Kuitenkin päätöksentekijä tarvitsee tietoa OC:sta parantaakseen tehokkuutta ja ilman tietoa OC:sta tehokkuusparannusta ei voida oikeasti saavuttaa (Cookson, McDaid & Maynard 2001). Siksi tässä tutkimuksessa hyödynnetään Birchin ja Gafnin (1992) esittämän ajattelutavan eli yksiselitteisten tehokkuusparannusten lähestymista- van pohjalta muokattua tapaa varsinaisen perinteeksi muodostuneen inkrementaalisen maksuhalukkuuslähestymistavan (engl. willingness to pay, WTP) ohella.

2.1 Aikaisemman teorian kritiikki ja kritiikin ratkaiseminen

Tutkimuksen aikana kirjallisuudesta herännyt peruskysymys onkin, voidaanko hyväk- syttävissä oleva inkremetaalisen kustannusvaikuttavuuden taso määrätä ennakkoon tiet- tynä WTP-tasona, kun oletukset vakioskaalatuloista ja täydellisestä jaettavuudesta eivät todennäköisesti täyty. Joutuuko päätöksentekijä, kuten Williams (2004) on asian esittä- nyt, tekemään sisäsyntyisen arvion ns. laatupainotetun elinvuoden (engl. quality- adjusted life year, QALY) arvosta ja sovittamaan budjetin siihen. Tällöin budjetti muo- dostetaan tutkimuksissa tavalla, jossa OC:sta ei todellisuudessa arvioida ollenkaan ja päätöksentekijä kohtaa eri ongelman kuin minkä tutkija on tutkimuksessaan esittänyt.

2.1.1 Keskimääräinen ja inkrementaalinen kustannusvaikuttavuus

Teoreettisten haasteiden lisäksi länsimaiset terveydenhuoltojärjestelmät kohtaavat ene- nevässä määrin haasteita palvelujärjestelmiensä rahoittamisessa. Tämän vuoksi tarve CEA:en käyttöön terveydenhuollossa tehtävien rahoitus- ja käyttöönottopäätösten tuke- na on lisääntynyt huomattavasti (Hjelmgren, Berggren & Andersson 2001, Martikainen, Hallinen & Soini 2006). Kustannuksista keskusteltaessa tulisi puhua nimenomaan kus- tannusvaikuttavuudesta ja erityisesti OC:sta, sillä alhaisista yksikköhinnoista huolimatta

(13)

tehoton ja/tai OC:lta kohtuuton hoito on lopulta aina kallis. Kustannuksia tarkasteltaessa tulisi miettiä, onko kyseessä kustannus vai investointi, jonka avulla säästetään muualla terveydenhuollossa (Martikainen, Hallinen & Soini 2006).

Mikäli keskimääräiset kustannus-vaikuttavuussuhteet (engl. cost-effectiveness ratio, CER; myös ACER) lasketaan keskimääräisenä kustannuksena keskimääräistä vaikutusta kohden ilman sopivien budjettirajoitteiden ja dominanssin (Laska, Meisner & Siegel 1997b) sekä teknisen tehokkuusehdon toteutumisen käsittelyä, ovat ne korkeintaan ku- vailevia. CER:n tulisi yleensä johtaakin kustannus-seuraamusanalyysiin (engl. cost- consequences analysis, CCA), eikä CEA:iin. CER vertaa hoidon kustannuksia ja vaikutuksia siihen, että ei tehtäisi mitään (Briggs, Fenn 1997, Drummond, Sculpher 2005).

Harvoin on sellainen tilanne, jossa relevanttia vaihtoehtoa ei ole. Esimerkiksi syöpien kohdalla esiintyvien täysin uusien hoitomuotojen relevantti vertailukohde on paras tu- keva hoito. (Soini 2006b) CER:tta ei voidakaan sellaisenaan käyttää päätöksenteossa, koska ne johtavat kustannusten minimointiin hyöty-yksikköä kohden eli pienimmän CER:in omaavaa vaihtoehtoa pidetään lähestymistavassa optimaalisena.

CER-kritiikki johti inkrementaalisen kustannus-vaikuttavuussuhteen eli ICER:een (engl.

incremental cost-effectiveness ratio) käyttöön päätöksenteon apuvälineenä. Inkremen- taalisessa analyysissä innovatiivisempaa ja usein vaikuttavampaa hoitomuotoa verrataan sopivaan verrokkiin, kuten suositeltuun tapaan toimia eli niin sanottuun Käypään Hoi- toon (ks. Käypä Hoito 2008), yleisimpään toimintatapaan, halvimpaan ja/tai toiseksi vaikuttavimpaan tapaan toimia.

Terveystaloudellinen kirjallisuus paljastaakin pitkän keskustelun keskimääräisen ja inkrementaalisen vertailun toteutettavuudesta (Drummond 1980, Williams 1985, Briggs, Fenn 1997, Laska, Meisner & Siegel 1997a, 1997b, Cantor, Ganiats 1999, O'Connor, Provenzale & Brazer 2000, Hershey ym. 2003, Drummond, Sculpher 2005). 2000- luvulla myös alaryhmäanalyysi (Willan, Briggs & Hoch 2004), RCT:een eri tutkimus- keskusten tulosten yleistettävyys monitasomallien (Manca ym. 2005) ja bayesilaisen lähestymistavan (Nixon, Thompson 2005) avulla sekä eri yksiköiden vertailut ovat nos- taneet merkitystään, vaikkakin vain harva analyysi on verrannut sekä niiden kustannuksia että vaikutuksia (Raikou ym. 2000).

(14)

2.1.2 Inkrementaalinen kustannusvaikuttavuus ja vaihtoehtoiskustannukset

Nykyaikaisen CEA:n perustyökalu on ICER. Tätä lähestymistapaa käytettäessä on huomattava, että kustannus-vaikuttavuussuhdelukujen erotus ei vastaa keskiarvojen suhde- lukua (Stinnett, Paltiel 1997) eli

[1] ₁ ₀

0 0 1

1 0

1 CER CER

QALY K QALY

K QALY

QALY K K V

ICER K ≠ − = −

−

= − Δ

= Δ ,

joissa K kuvaa kustannuksia ja V vaikuttavuutta. Koska myös ICER on harhainen esti- maatti, eikä se suhdelukuna noudata mitään parametrista jakaumaa (ns. Cauchyn ja- kauma), tulisi sen käsittely suorittaa perinteisen deterministisen piste-estimaattikäsitte- lyn sijaan probabilistisesti (Briggs, Wonderling & Mooney 1997).

Terveysteknologia, joka tyypillisesti tuottaa lisähyötyjä ja -kustannuksia on kustannusvaikuttava, kun sen ICER alittaa WTP-arvon (λ) eli kynnys- tai kattoarvon (esim. Eich- ler ym. 2004, Fenwick ym. 2006a, 2006b, Willan, Briggs 2006):

[2] ≤λ

−

= − Δ

= Δ

0 1

QALY QALY

K K V

ICER K .

Toisaalta ICER voitaisiin esittää myös muodossa (Willan, Briggs 2006):

[4] NNT K

V

ICER K ≈ Δ Δ

= Δ * ,

jossa NNT (number needed to treat) viittaa siihen, montako potilasta pitää hoitaa vaih- toehdolla 1, jotta yksi potilas enemmän hyötyisi vaihtoehtoon 0 verrattuna. Kaavan [4]

mukaiseen lähestymistapaan liittyy paljon oletuksia ja ongelmia, joten sitä tulisi käyttää varauksella. Tässä tutkimuksessa NNT:n käyttö ohitetaan.

Teoreettista ja empiiristä keskustelua WTP:sta on esitetty runsaasti (Pauly 1995, O'Bri- en, Gafni 1996, Johnson ym. 1998, Hanley, Ryan & Wright 2003). ¹ Hyvinvointiteo- reettisesti λ on yksinkertaisimmillaan yhteiskunnallisen päätöksentekijän WTP per lisä- hyöty-yksikkö. Ylihyvinvointiteoreettisesti (ns. extrawelfarismi, engl. extra welfarism)

1 Maksuhalukkuus ja hyväksymishalukkuus (willingness to accept, WTA) tulee erottaa toisistaan: on esimerkiksi esitetty, että terveydenhuollon piirissä suhde WTP:WTA olisi 1:2 (O’Brien ym. 2002) eli yksinkertaisesti yhden euron maksuhalukkuutta vastaava hyväksymishalukkuus vähemmän vaikuttavalle ja myös vähemmän kustannuksia aiheuttavalle hoitovaihtoehdolle on 2 euroa – toisin sanoen halukkuus investoida vähemmän vaikuttavaan vaihtoehtoon on suhteellisesti pienempi kuin halukkuus investoida enemmän vaikuttavaan vaihtoehtoon. Asian syistä on monta kilpailevaa teoriaa (Kahneman, Tversky 1979, Hanemann 1991, Morrison 1998), joille yhteistä on se, että vältettävissä olevaa disutiliteettia ja/tai riskiä pyritään kaihtamaan.

(15)

λ:n oletetaan taas kuvaavan päätöksentekijän varjobudjettia eli päätöksentekijän maksi- mivarakkuutta lisähyöty-yksikön suhteen (Weinstein, Zeckhauser 1973, Johannesson, Weinstein 1993, Karlsson, Johannesson 1996).

Täydellisen jaettavuuden ja vakioskaalatuottojen ollessa voimassa ICER johtaa tehok- kuuteen (Weinstein, Stason 1977, Birch, Gafni 1992). Näiden oletusten ollessa voimassa WTP on budjettirajoitteen varjohinta tai resurssien marginaalinen OC (Birch, Gafni 1993). Jälkimmäisen vaihtoehdon näkökulmasta WTP vastaa viimeisimmän hyväksytyn intervention ICER:tta, kun interventiot hyväksytään ICER:nsa mukaan ja alempia ICER:ta preferoidaan (Drummond 1980).

Taloustieteellisesti ajatellen perinteisten CEA:en tuottama informaatio auttaakin päätök- sentekijää valitsemaan ne terveysteknologiat, jotka tuottavat suurimmat hyödyt käytet- tyä euroa kohden (Weinstein, Zeckhauser 1973, Birch, Gafni 1992, Buxton 2005, Drummond, Barbieri & Wong 2005). Päätöksentekijälle relevantit perinteisen taloudellisen analyysin vaateet ovat seuraavat:

• Päätöskysymys tulee olla selkeästi määritelty ja päätösongelman tulee olla johdon- mukainen

• Käytetyn ajanjakson tulee olla riittävä erottelemaan kustannus- ja vaikuttavuuserot eri toimenpiteiden välillä

• Tutkimusnäytön tulee olla kattava

• Arvioinnin tulee tunnistaa optimaalinen vaihtoehto CEA:n päätöskriteerit huomioi- den

• Arvioinnin tulee kvantifioida päätökseen liittyvä epävarmuus sekä mahdollistaa ana- lyysiin liittyvän epävarmuuden tarkastelu

• Analyysin tulosten tulisi toimia pohjana tulevien tutkimusten priorisoinnissa.

(Drummond, Barbieri & Wong 2005, Sculpher, Claxton & Akehurst 2005).

Ongelmana on, että WTP:tta ei voida kuitenkaan määrittää, koska interventioihin liitty- vät ICER-informaation on epätäydellistä (Devlin 2002, Gafni, Birch 2003). ² WTP:n tuntemattomuus ei ole kuitenkaan estänyt tutkijoita väittämästä, että on olemassa hy- väksyttäviä päätöksentekijän WTP-arvoja (esim. Buxton 2005). Tämä kuitenkin viittaisi

2 Vertaa oletus yleisten rahoitusmarkkinoiden täydellisyydestä.

(16)

siihen, että päätöksentekijällä on rajaton määrä lisäresursseja, kun ICER alittaa WTP:n.

Tämä on ristiriidassa OC-käsitteen kanssa, johon taloudellinen arviointitutkimus perustuu (Williams 1983, Birch, Gafni 1992, Birch, Gafni 1993, Sendi, Briggs 2001, Sendi, Gafni & Birch 2002). Toisaalta, vaikka informaatiota kaikista interventioista olisi saata- villa (ts. ICER-informaatio olisi täydellistä), uuden ja alhaisemman ICER:n omaavan intervention korvatessa nykyisen ja korkeamman ICER:n omaavan intervention muut- tuu myös WTP (Sendi, Gafni & Birch 2002). Tällöin WTP:n täytyisi olla dynaaminen, jotta tehokkuuskriteeri eli tavoite suurimmista mahdollisista terveyshyödyistä annetuilla resursseilla täyttyisi.

Tässä tutkimuksessa perinteisen lähestymistavan ohella (maksimi-WTP lisäterveys- hyöty-yksikköä kohden) käytetty muokattu yksinkertaisten tehokkuusparannusten lähes- tymistapa eli vaihtoehtoiskustannusanalyysi (engl. opportunity cost analysis, OCA) ei oleta täydellistä jaettavuutta tai vakioisia skaalatuloja. Kirjallisuudessa aikaisemmin tyypillisesti esitetyt lähestymistavat eivät kata OCA:n tuottamaa tulosta. Lisäksi päätös- tä voidaan yksinkertaisten tehokkuusparannusten lähestymistavassa lähestyä keskimää- räisten terveyshyötyjen avulla, joka on huomattu hyödylliseksi myös ns. perinteisen WTP-ajattelun piirissä (Briggs ym. 2002). Virheellinen deterministisen WTP:n dilemma

3 voidaan tällä tavalla ohittaa ja WTP otetaan tässä tutkimuksessa suoraan minimi- (pie- nin keskimääräinen hoitokustannus per potilas) ja maksimibudjettina (suurin keskimää- räinen hoitokustannus per potilas). Tapa noudattaa myös Schulpherin ja kumppaneiden (2004) esittämiä ajatuksia OC:en pragmaattisesta huomioinnista.

Toisin kuin ICER tai NMB, muokattu yksinkertaisten tehokkuusparannusten lähesty- mistapa ei siis edellytä WTP:n tuntemista. Toisaalta informaatiota tarvitaan kuitenkin ainakin mahdollisesta keskeytettävästä tai uudesta interventiosta, intervention keskeyt- tämisen ja lisäyksen aiheuttamista kustannuksista ja terveyshyödyistä sekä korvaavan tai korvattavan intervention kustannuksista ja terveyshyödyistä. Jos kaikkea tietoa ei löydy hyödynnetystä tutkimuksesta, voidaan se kerätä esimerkiksi kirjallisuudesta tai asiantuntija-arvioiden avulla.

3 Tässä deterministisyydellä tarkoitetaan sitä, että WTP:lla voisi olla joitakin ennakkoon määrättyjä tasoja (esim. hyväksyttävyystaso 50 000€ laatupainotettua elinvuotta kohden). Todellisuudessa WTP:n täytyy olle dynaaminen, jotta tehokkuus säilyisi ja pysyttäisiin annetun budjetin sisäpuolella.

(17)

2.1.3 Satunnaiset ja kontrolloidut asetelmat

Satunnaistettuja ja kontrolloituja tutkimuksia (engl. randomized controlled trial, RCT) on pidetty parhaina asetelmina julkisia ohjelmia arvioitaessa (Coalition for Evidence- Based Policy, Sackett ym. 1996, Orr 1998). Luonnollisia asetelmia on varsinkin aiem- min kritisoitu (Anderson 1994, Office of Technology Assessment 1994), koska ne eivät sellaisenaan huomioi hoitomuodon valinnan ja hoitotuloksen kanssa korreloivia tekijöi- tä. Tällaiset korreloivat tekijät voivat aiheuttaa ainakin kahdenlaista tilastollista harhaa:

hoidon vaikuttavuus sekä kustannukset voivat olla määrältään (ns. kliininen merkitse- vyys) harhaisia ja hoidon vaikuttavuus sekä kustannukset voivat olla tilastolliselta mer- kitsevyydeltään harhaisia. Pahimmillaan päädytään väärän todennäköisyyden, hypoteesin ja/tai johtopäätelmän tukemiseen.

RCT-asetelmat eivät kuitenkaan tuota kaikkea tarvittavaa tutkimusnäyttöä, jota tarvitaan tehtäessä terveydenhuollon taloudellisia päätöksiä. Tutkimuskirjallisuudessa on esitetty myös päätösanalyysin laaja-alaisempaa käyttöönottoa validin ja päätöksentekoa tukevan taloudellisen tutkimusnäytön tuottamiseksi (Buxton 1997, Buxton ym. 1997, Drum- mond 1998, Claxton 1999, Claxton, Sculpher & Drummond 2002, Coyle, Buxton &

O'Brien 2003, Drummond, Barbieri & Wong 2005, Sculpher, Claxton & Akehurst 2005, Martikainen 2007, 2008). Päätösanalyysin juuret ovat odotetun hyödyn teoriassa, jossa päätös tehdään eri terveysteknologioiden odotettujen kustannusten ja vaikuttavuuden perusteella. Aivan viimeaikoina on lisäksi alettu puhua kustannus-vaikuttavuusaineiston tilastollisesta hallinnasta, jossa tämän tutkimuksen tavoin hyödynnetään erilaisia tilas- tomenetelmiä aineistossa olevan heterogeenisyyden hallintaan ja epävarmuuden kuvaa- miseen (Willan, Briggs 2006). Tähän kustannus-vaikuttavuusaineiston tilastollisen hallinnan lähestymistapaan lisätään tässä tutkimuksessa vielä PSE ja OCA.

RCT:ssa verrataan tyypillisesti eri ryhmien taustatekijöiden välille saavutettua tasapainoa. Tavanomaisia hypoteesin testauksen menetelmiä käytettään yleensä saavutetun tasapainon tilastolliseen testaamiseen (Rothman 1979, Altman 1985, Senn 1989, Alt- man, Dore 1990, Begg 1990, Senn 1991, 1994). RCT:ssa ei kuitenkaan saavuteta tasapainoa niiden tekijöiden mukaan, joiden mukaan potilaita ei ole satunnaistettu (Senn 1994, Crown ym. 1998). Beggin (1990) mukaan RCT-tutkimuksissa tehdäänkin sellais-

(18)

ten tekijöiden tilastollinen testaaminen, joiden tiedetään jo etukäteen olevan satunnai- sesti jakautuneet eri ryhmien välille.

Tyypillisesti tekijöitä, joiden mukaan potilaat on satunnaistettu ryhmiin, on RCT:ssa ongelmallisen vähän. Tämän seurauksena alaryhmien (esim. miehet ja naiset, sairauden eri vaikeusasteet, tupakoivat ja tupakoimattomat) osalta tasapainoa ei ryhmien välille välttämättä saavuteta ja toisaalta valikoidusta tutkimuspopulaatiosta saadut tulokset ovat harvoin yleistettävissä mihinkään suurempaan populaatioon. Näin ollen tilastollisen merkitsevyyden testaamisen menetelmät eivät välttämättä suoraviivaisesti sovellettuina RCT:ien tasapainoa tarkastellessa toimi (Berger 2004). ⁴ Karkeasti yksinkertaistaen RCT:en sisäinen validiteetti on korkea, mutta ulkoinen validiteetti matala – tällöin tutkimuksen tulokset ovat myös populaationäkökulmasta harhaisia ja sekä hoitotuloksesta että sen hyödyistä liian positiivisen kuvan antavia.

2.1.4 Epävarmuus ja valikoitumisongelma

RCT:en tiukat sisäänottokriteerit, satunnaistaminen ja mahdollinen sokkouttaminen johtavat tyypillisesti korkeaan sisäiseen validiteettiin. Kuitenkin esimerkiksi RCT:lle tyy- pilliset epäsopiva seuranta-aika, tiukka hoitostrategia, optimipotilaat, optimilääkärit ja usein myös lumeverrokki aiheuttavat ongelmia, jotka tulisi huomioida CEA:ssä. Päätök- sentekijät tarvitsevat päätöksiensä tueksi korkean sisäisen ja ulkoisen validiteetin omaavaa informaatiota (Revicki, Frank 1995, Buxton 1997, Fayers, Hand 1997, Drummond 1998, Blackhouse 2002, Claxton, Sculpher & Drummond 2002, Drummond, Barbieri &

Wong 2005, Drummond, Sculpher 2005, Sculpher, Claxton & Akehurst 2005).

Päätöksentekoanalyysin ohella sisäisen ja ulkoisen validiteetin tavoittelussa voidaan käyttää ns. luonnollista asetelmaa, jossa potilaiden annetaan valikoitua hoitoryhmiinsä reaalimaailman olosuhteissa. Tämä on kuitenkin erityisesti päätöksenteko- orientoituneelle marginaalitaloustieteelle ongelma: päätöksiä tukevien inkrementaalisten suhteiden rajat hämärtyvät, kun vertailtavien ryhmien keskiarvopotilas on tyypillisesti erilainen. Sekä luonnollisiin asetelmiin että RCT:iin perustuvissa analyyseissä esiintyy- kin tyypillisesti esimerkiksi seuraavista lähteistä kumpuavaa epävarmuutta:

4 Raabin ja Butcherin (2001) esittämän klusteroinnin avulla tätä voidaan kuitenkin tarkastella.

(19)

• 1. Aste: Luonnolliseen vaihteluun liittyvä epävarmuus – esimerkiksi luonnollisen asetelman aiheuttama epävarmuus, samankaltaisilla potilailla samassa tutkimuksessa (with-in trial) esiintyvä selittämätön vaihtelu

• 2. Aste: Muuttujista ja otoksesta aiheutuva epävarmuus (Briggs 2000, Fenwick ym.

2000, Claxton ym. 2001, Briggs ym. 2002, Spiegelhalter, Best 2003) – todellisia muuttuja-arvoja ja tutkimusten välisiä arvoja (between trials) ei tiedetä

• 3. Aste: Menetelmiin liittyvä epävarmuus (Briggs 2000, Briggs, Sculpher & Claxton 2006) – mallin rakenteisiin liittyvä epävarmuus (Briggs 2000, Spiegelhalter, Best 2003, Briggs, Sculpher & Claxton 2006) eli ns. ignoranssi, joka on tietämättömyyttä siitä, mitä muuttujia ja rakenteita malliin oikeasti kuuluisi tai tunnetaanko kaikki oleellinen. Myös menetelmän sopivuus voi vaikuttaa tulokseen, eikä välttämättä tunneta oikeaa menetelmää, jolloin eri menetelmiä kokeilemalla sekä mallia testaa- malla voidaan tätä epävarmuuden osa-aluetta hahmottaa

• 4. Aste: Päätöksentekoon liittyvä epävarmuus – 1.-3. asteen aiheuttama yhteisepä- varmuus, jota voidaan osittain tarkastella esimerkiksi 1. ja 2. asteen osalta simulaa- tion tuottamien kustannus-vaikuttavuustasojen sekä esimerkiksi kustannusvaikuttavuuden hyväksyttävyyskäyrien (CEAC) avulla, ja 3. asteen osalta eri mene- telmiä kokeilemalla. Tämä tutkimus hahmottaa kaikkia neljää epävarmuuden astetta.

Käytännössä analyyseistä saavutetut keskimääräiset arviot ovat epävarmoja, koska ne ovat epävarmojen eli keskivirheellisten muuttujien tuloksia. Tämä epävarmuus eroaa yksilötason lopputulosten vaihtelusta (keskipoikkeama) ja asetelmasta johtuvasta hete- rogeenisyydestä ja harhasta, joista erityisesti jälkimmäisiä voidaan PSE:n avulla hallita.

Varsinaisen valikoitumisongelman synty perustuu siihen, että ns. luonnollisessa asetel- massa potilaat yksinkertaisesti valikoituvat hoitoryhmiinsä. Tällaisten ryhmien vertailu ilman valikoitumisen hallintaa johtaa helposti tilanteeseen, jossa kliiniset surrogaatit eli välimuotomittarit (esim. verenpaine), vaikuttavuusmittarit (esim. elinaika tai laatupaino- tettu elinaika) ja taloudelliset mittarit (esim. resurssien käyttö, kustannukset, ICER) tuottavat harhaisia tuloksia ja jopa vääriä johtopäätöksiä. Lisäksi vaikuttavuus- ja taloudelliset mittarit ovat usein riippuvaisia toisistaan, jolloin niiden yhdistäminen esimerkiksi ICER:ksi tuottaa jopa potentiaalisesti yksittäistä mittaria enemmän harhaa.

(20)

2.2 Taloudellisen arvioinnin mittarit

Pitkän aikaa terveydenhuollon tuloksellisuudessa otettiin huomioon ainoastaan kliiniset osa-alueet. Terveydenhuollon tulokset ovat kuitenkin moniulotteisia sisältäen ainakin taloudelliset, humanistiset ja kliiniset osa-alueet. Pelkästään elämän pituuden tai sairas- tavuuden käyttö terveydenhuollon vaikuttavuuden mittareina ei kuitenkaan huomioi potilaiden elämänlaadussa tapahtuvia muutoksia tai heidän subjektiivisia kokemuksiaan (Rissanen, Sintonen & Pekurinen 1995). On alettu ymmärtää hoitojen vaikutukset potilaan koko elämään (Addington-Hall, Kalra 2001). Siksi elämänlaadun (engl. quality of life, QoL) mittaamista varten on kehitetty elämänlaatumittareita, joita pyritään käyttä- mään apuvälineinä kliinisessä ja taloudellisessa päätöksenteossa. Esimerkiksi Helsingin yliopistollisessa keskussairaalassa innovoidulla ja suoritetulla rutiininomaisella aineis- tonkeräämisellä on pyritty päätöksenteon tukemiseen. Tässä tutkimuksessa esitettyjen vakioinnin ja probabilistisen tarkastelun mahdollistavien menetelmien avulla rutiinin- omaisista mittauksista saadaan potentiaalisesti vertailukelpoista. (Soini 2006b)

Länsimaissa sepelvaltimotauti (CHD) ⁵ on edelleen merkittävä pitkäaikaissairaus, kansantauti ja kuolinsyy (Bosworth ym. 2000). Suomalaisten sairastuvuus (insidenssi) sy- dän- ja verisuonisairauksiin on kansainvälisesti tarkastellen korkea, ja CHD:iin sairas- tuu noin 50000 suomalaista vuosittain (Salomaa ym. 1996). CHD on työikäisen suoma- laismiehen yleisin ja suomalaisnaisen kolmanneksi yleisin kuolinsyy. Lähes joka kol- mas 70 vuotta täyttänyt suomalainen kuoli CHD:in vuonna 2005.

CHD-kuolleisuus on kasvanut vuosittain noin prosentin. Vuonna 2005 iskeemisiin sy- dänsairauksiin kuoli noin 1500 alle 65-vuotiasta suomalaista. Koko väestössä CHD aiheutti noin 11700 kuolemaa. (Tilastokeskus) Miesten CHD-kuolleisuuden vähentyessä kehittyneistä hoidoista ja elämäntapamuutoksista johtuen, on naisten suotuisa kehitys pysähtynyt 1990-luvulla. Sydänterveyden edistäminen onkin suomalaisten kansallisten terveysohjelmien yksi painopistealue.

5 Yleensä CHD-potilaalla esiintyy vaihtelevissa määrin sydämen lihaksiston hapenpuutteesta johtuvaa puristavaa rintakipua (angina pectoris, AP). Tyypillisesti CHD:a hoidetaan toimenpiteellä, mikäli toimen- pideindikaatiot täyttyvät eli potilaalla on esimerkiksi yksi vaikea, 2–3 lievempää sepelvaltimotukosta tai vasemman päähaaran (left main, LM) eli ns. leskentekijän tukos.

(21)

Ensisijainen CHD:n hoitovaihtoehto on lääkitys tai pallolaajennus eli PTCA (engl. percutaneous transluminal coronary angioplasty) ja mahdollinen stentin asennus. Toissijai- sena vaihtoehtona pidetään ohitusleikkausta eli CABG:sta (engl. coronary artery bypass grafting). Erityisesti CABG:n seurauksena tulevien haittatapahtumien määrä on laskenut ja leikkauksen jälkeinen selviytyminen parantunut viimeisen 20 vuoden aikana (Esta- fanous ym. 1998, Falcoz ym. 2003, Kattainen, Meriläinen & Jokela 2004, Kattainen ym.

2005, Falcoz ym. 2006, Loponen ym. 2007). CHD:n vaikeampiin muotoihin liittyvien operaatioiden lisäksi taudin lievempiä muotoja voidaan hoitaa elämäntapamuutoksilla ja lääkityksellä, kuten esimerkiksi antiangiina-, asetyylisalisyylihappo- ja kolesterolitasoa alentavilla valmisteilla (Peura ym. 2007).

Talousteoreettisesti on huomattavissa, että CHD-potilaiden hoidon intresseistä päättää (Cavuto ym. 2006) ja todennäköisesti kamppailee kaksi asiantuntijaryhmää: kardiologit ja kirurgit. Kardiologit suorittavat pääosin PTCA:t ja kirurgit CABG:t. PTCA:n leikka- usvalmistelut ja itse operaatio on helpompi suorittaa sekä operaatiosta ainakin lyhyellä aikavälillä aiheutuvat kustannukset tyypillisesti alhaisemmat kuin CABG:sta aiheutuvat.

Näin ollen voidaan olettaa olevan intressejä siihen suuntaan, että mahdollisimman moni CHD-potilas hoidettaisiin joko PTCA:lla tai lääkkeillä, koska tavanomaisten CHD:ssa käytetyiden lääkkeiden hetkelliset kustannukset ovat leikkaustoimenpiteitä alhaisemmat. Tämä herättääkin kysymyksen sekä toiminnan teknisestä tehokkuudesta eli siitä, tehdäänkö operaatiot optimaalisesti oikeille henkilöille että allokatiivisesta tehokkuudesta eli siitä, onko toiminta kokonaisuutena järkevää ollessaan teknisesti tehokasta.

Tässä tutkimuksessa yhdistetään taloudellisen arvioinnin teorian mukainen CEA tutkimuksen sisäiseen päätösanalyyttiseen malliin, jossa käytetyt muuttuja-arvot ovat näyt- töön perustuvia ja ne on vakioitu erilaisten ominaisuusestimointitapojen avulla. Tutki- muksessa käytetään käytännönläheistä päätöksentekijän (ns. ylihyvinvointiteoreettista) ja yksinkertaisten tehokkuusparannusten näkökulmaa. Näkökulmien on tarkoitus olla päätöksentekijälle hyödyllisiä, eikä niiden tarvitse välttämättä johtaa tulokseen sosiaali- sen valinnan kautta – näin suoritettujen taloudellisten arviointitutkimusten tavoite on tuottaa päätöksentekijälle tukea, ei niinkään hyvinvointiteoreettisesti maksimoida soke- asti utiliteettia tai sanoa normatiivisessa muodossa mitä tulisi päättää. Omaksutun näkö- kulman tavoitteena on terveyden maksimointi tietyn budjetin sisässä tai tietyn vaikuttavuuden saavuttamisen kustannusten minimointi (vrt. Brouwer, Koopmanschap 2000).

(22)

2.2.1 Terveyteen liittyvä elämänlaatu

QoL:uun ryhdyttiin kiinnittämään huomiota, kun lääketieteelliset hoidot alkoivat mer- kittävästi pidentää elinikää (Klarman, Francis & Rosenthal 1968, Weinstein, Stason 1976, Williams 1985). Huomattiin, että ihmiset haluavat elää tyydyttävää elämää, eivät vain selviytyä hengissä (McDowell, Newell 1996). QoL:n mittaaminen hoitojen arvioinneissa kasvanut räjähdysmäisesti, erityisesti hoitojen taloudellisen arvioinnin osana (Hawthorne, Richardson & Day 2001). QoL-mittareita käytetään enenevässä määrin rinnakkain kliinisten mittareiden kanssa, jotta pystytään arvioimaan hoidon laatua ja tehokkuutta sekä terveydenhuollon tarvetta. Vaikka QoL-mittarit eivät korvaa kliinisiä mittareita, ovat ne niille hyvä lisä. (Higginson, Carr 2001)

Varsinainen QoL:n tutkiminen on kapea osa hyvinvointitutkimusta, mikä on saanut vai- kutteita sosiologiasta ja psykologiasta (Kainulainen 1998). QoL liittyy läheisesti hyvinvoinnin käsitteeseen (engl. well-fare), koska QoL on osa ihmisen yleistä hyvinvointia (Karisto 1984). Hyvinvointikäsitettä käytetään runsaasti ja varsin löysästi – sen sisällös- tä ei ole yksimielisyyttä (Kainulainen 1998, Kainulainen, Rintala & Heikkilä 2000).

Myös QoL on käsitteenä ja menetelmällisesti vaikea käsitellä, koska se on käsitteenä ainakin useista osista rakentuva, dynaaminen, subjektiivinen ja kulttuurisidonnainen.

QoL selvitetään yleensä joko tarpeiden tyydyttymisen tuomana hyvinvointina tai sub- jektiivisen QoL:n määrittämisenä (Kainulainen 1998) tai molempien näkökulmasta.

Toisaalta terveys on ollut tärkeä arviointikohde QoL:n määrittämisessä ja terveyden mittaamisen perusteena on terveyden määrittäminen. Terveyteen liittyvä elämänlaatu (engl. health-related quality of life, HRQoL) käsittää QoL:n yksilön kokeman subjektii- visen terveyden näkökulmasta (Herlitz ym. 1999, Hawthorne, Richardson 2001, Hawt- horne, Richardson & Day 2001), mikä perustuu esimerkiksi perinteiseen käsitykseen psyykkisestä, fyysisestä ja sosiaalisesta toimintakyvystä eli Maailman terveysjärjestön (WHO) terveyskäsitykseen tai tarvelähtöiseen näkökulmaan. HRQoL voi siis olla ihmisen subjektiivinen kokemus omasta terveydentilastaan ja siihen liittyvästä psyykkisestä ja sosiaalisesta hyvinvoinnista (Aro, Mähönen 1993) tai tarvelähtöisesti se voi olla yksi- lön tämänhetkiseen toimintojen ja tyydytyksen tila verrattuna siihen, mitä hän pitää ide-

(23)

aalisena tilana (Berzon, Shumaker 1994). Carrin ja kumppaneiden (Carr, Gibson & Ro- binson 2001) mukaan ihminen määrittelee oman HRQoL:nsa vertaamalla odotuksiaan aikaisempiin kokemuksiinsa.

WHO:n määritelmä on utopistisuudessaan vaikeasti mitattavissa oleva, mutta se kuitenkin erotti terveyden käsitteen sairauden käsitteen ulkopuolelle (Hadorn, Hays 1991).

HRQoL on QoL:a spesifimpi, helpommin mitattavissa oleva käsite, joka soveltuu pa- remmin tutkimus- ja hoitokäyttöön (Velikova, Stark & Selby 1999). Eri tutkijoilla on kuitenkin hyvin erilaisia käsityksiä siitä, mistä ulottuvuuksista HRQoL muodostuu – ainoastaan sen hyvin moniulotteisesta luonteesta ollaan samaa mieltä. HRQoL:lle ei ole olemassa yhteistä hyväksyttyä määritelmää, eikä ole olemassa yhtä parasta mittaria sen mittaamiseen. Samoilla kokemuksilla voi olla eri ihmisille erilaisia HRQoL:uun liittyviä merkityksiä ja ajan myötä ihmisen kokemukset samasta tilanteesta voivat myös muuttua (Carr, Gibson & Robinson 2001).

Yleisesti ottaen HRQoL:n osalta kyse on suurelta osin elämänhallinnan tunteesta eli fyysinen ja sosiaalinen toimintakyky painottuvat monissa HRQoL-mittauksissa. Vakava sairastuminen merkitsee monenlaisiin stressitekijöihin sopeutumista ja selviytymistä.

Kansalaisten elämässä hyvinvoinnin lisääminen terveysnäkökulmasta tarkoittaa sairauden ennaltaehkäisyä, hoitoa ja kuntoutusta (Suchman 2001). Vaikka sairauden oireita pystytään hoidoilla vähentämään, sairaus on kuitenkin olemassa. CHD:n CABG- ja PTCA-hoito voidaan ymmärtää HRQoL:a kohottavana tapahtumana (Währborg 1999), vaikka se aluksi aiheuttaakin stressiä ja pelkoja (Heikkilä 1998, Koivula 2002).

Käyttämällä 15D-mittaria (myöhemmin 15D; Sintonen 2001, Saarni ym. 2006) on huomattu, että Suomen populaatiossa nuorten HRQoL on keskimäärin parempi kuin vanhempien ikäryhmien. Vanhemmissa ikäryhmissä ei enää ole sukupuolten välisiä eroja, mutta nuoremmissa ikäryhmissä naisten HRQoL oli samanikäisen miespopulaati- on HRQoL:a parempi. (Arinen 1998, Sintonen 2001, Saarni ym. 2006) 15D-mittarin väitetään perustuvan WHO:n kokonaisvaltaiseen käsitykseen hyvinvoinnista ja tervey- destä (Sintonen 2001). Kuitenkaan 15D ei suoranaisesti mittaa sosiaalista hyvinvointia.

(24)

CABG- ja PTCA-potilaiden keskeisin terveyteen liittyvä tarve on ennusteen parantami- sen ohella rintakipujen ja oireiden poistuminen (Jaarsma, Kastermans 1997, Echteld, van Elderen & van der Kamp 2001, Bruce ym. 2003, Falcoz ym. 2003, Zhang ym.

2003) ja näin QoL:n kohoaminen (Chocron ym. 1996, Sjöland ym. 1997, Hunt, Hendra- ta & Myles 2000, Järvinen ym. 2003, Kattainen, Meriläinen & Jokela 2004, Kattainen ym. 2005, Loponen ym. 2007). CHD:a sairastavien HRQoL on huonompaa kuin vastaa- van ikäisellä väestöllä Suomessa (Lukkarinen 1999, Saarni ym. 2006, Loponen ym.

2007, Saarni ym. 2007) ja myös muissa maissa (Langeluddecke ym. 1989, Währborg 1999). CABG:n ja/tai PTCA:n on todettu myös kohottavan potilaiden HRQoL:a pa- remmaksi (Kurlansky ym. 2002) tai samantasoiseksi (Lukkarinen 1999, Währborg 1999, Loponen ym. 2007).

Naisten CHD:n insidenssi on lisääntynyt länsimaissa (Moore, Dolansky 2001), mutta naisten HRQoL:sta CHD:n osalta on paljon vähemmän tietoa kuin miesten kokemuk- sesta (Jickling, Graydon 1997). Tutkimusten mukaan naiset hyötyvät vähemmän (Bal- dassarre ym. 2002, Bute ym. 2003, Keresztes ym. 2003, Lindquist ym. 2003, Vaccarino ym. 2003, Falcoz ym. 2006) tai suurin piirtein saman verran (Währborg 1999, King, Rowe & Zerwic 2000, Kurlansky ym. 2002, Huang ym. 2004, Loponen ym. 2007) QoL:sti CABG:sta kuin miehet. Naisten on raportoitu potentiaalisesti myös hyötyvän leikkauksesta jopa miehiä enemmän (Loponen ym. 2007) – löytö, joka on todennäköi- sesti yhteydessä siihen, että kyseisessä tutkimuksessa naiset olivat myös miehiä van- hempia, sairastivat useampia liitännäissairauksia ja heidän lähtötilanteensa HRQoL oli huonompi kuin miehillä. Lisäksi kyseisessä tutkimuksessa ei käytetty minkäänlaisia vakiointi- tai heterogeenisyyden hallintamenetelmiä.

CHD-potilaiden HRQoL:n on suomalaisissa tutkimuksissa huomattu pysyvän hyvin vakiona ainakin ajanjaksolla 3-18 kuukautta toimenpiteen jälkeen (vrt. Kattainen ym.

2005, Loponen ym. 2007).

2.2.2 Laatupainotetut elinvuodet

HRQoL-mittarit on otettu käyttöön kliinisissä tutkimuksissa, mutta varsinaisissa hoitoti- lanteissa niitä käytetään vain harvoin. Rutiininomaisen käytön esteenä ovat kustannuk-

(25)

set sekä toteutettavuuden ja tarkoituksenmukaisuuden kyseenalaistaminen. Rutiinin- omaisessa toiminnassa mittarin tulisi myös olla yksinkertainen sekä helppo ja nopea täyttää (Higginson, Carr 2001). Useimmat mittareista on kuitenkin kehitetty tutkimus- käyttöön, jolloin aika ja/tai raha ei ole yhtä suurena esteenä kuin hoitotilanteessa.

Kustannukset suhteutetaan tyypillisesti saavutettuun hyötyyn taloudellista arviointitut- kimusta tehtäessä. Hyvin suunnitellun QoL-mittarin avulla voidaan laskea hoidolla saa- vutettujen ja Klarmanin sekä kumppaneiden (1968) esittelemien ns. laatupainotettujen elinvuosien (engl. quality-adjusted life year, QALY; ks. myös Weinstein, Stason 1976, Williams 1985) määrä. Näin QoL:n mittaaminen mahdollistaa rajallisten resurssien kohdentamisen sinne, missä niistä on eniten hyötyä. Usein käytetään kustannus- utiliteettianalyysiä (KUA), jonka avulla rahalliset kustannukset suhteutetaan saavutet- tuihin QALY:iin. Tällöin huomioidaan elämän pituuden lisäksi myös sen laatu.

Keskimääräisiä kustannus-vaikuttavuussuhteita eli CER:ta (engl. cost-effectiveness ratio) ja kliinisiä mittareita kohtaan osoitettu kritiikki johti myös geneeristen QoL-mittareiden kehittämiseen, jossa aluksi tähdättiin keskimääräisen kustannus-QALY -suhteen laskemiseen (Williams 1985, Nord 1999). On huomioitava, että CER:t tarjoavat kuitenkin heikon ja todella paljon oletuksia sisältävän ohjeiston liittyen mm. sekä QALY:n sosiaaliseen arvoon ja elämän pituuteen (Dolan ym. 2005) että valintaan hoitojen välillä.

Yleisesti ottaen valinnat marginaalissa ovat erilaisia kuin keskimääräiset valinnat (Soini 2006b). CER:t eivät tarjoa välinettä inkrementaaliseen taloustieteeseen – ne ovat alttiita tarjoamaan subkonjuktiivisia valintatilanteita (“tehdäkö vai eikö tehdä?”). Toisaalta ICER tarjoaa oikean päätösmallin, jossa on relevantti vaihtoehto.

Geneeriset mittarit yrittävät tuottaa arvion utiliteetista, joka olisi vertailukelpoinen eri sairausryhmien välillä (Williams 1985). Koska eri mittareiden (esim. EQ-5D, SF-6D ja 15D) tuottamat QALY-määrät vaihtelevat, esiintyy myös tutkimustuloksissa vaihtelua (Hawthorne, Richardson & Day 2001, Nord 2001). CER onkin hyvin riippuvainen käy- tetystä vaikuttavuuden mittarista, paikallisista hoitokäytänteistä, yksikkökustannuksista, resurssienkäytöstä ja asetelmaan liittyvästä harhasta. CER:t liioittelevat tulosta helposti, koska ne eivät sisällä mitään vertailukohdetta (Briggs, Fenn 1997). ICER taas tuottaa suhteellisen arvion siitä, montako lisäeuroa pitää käyttää yhtä lisävaikuttavuusyksikköä kohden. Näin ICER myös ohittaa osittain vaikeuden, joka liittyy erilaisen herkkyyden

(26)

omaaviin HRQoL-mittareihin. Eri mittarit tuottavat nimittäin erilaisen HRQoL- muutoksen ja näin myös eri määrän saavutettuja lisä-QALY:ja. ⁶

Hyötyjen vertailuun tarvitaan kuitenkin jokin vertailukelpoinen käsite, tyypillisesti käy- tetty yhteismitallisuuteen pyrkivä käsite on QALY. ⁷ QALY:n pääasiallinen käyttötar- koitus on eri hoitomuotojen vertailu, ei niinkään yksittäisten potilaiden terveydentilan määrittäminen (Williams 1985, McDowell, Newell 1996, Nord 1999). QALY:n perus- tana on ajatus, jonka mukaan jokainen täydessä HRQoL:ssa vietetty vuosi on yhden QALY:n mittainen. QALY:n avulla voidaan painottaa elinvuosia niiden laadulla, eli yhdistää elinaika sekä sairauden aiheuttama HRQoL:n vajaus (Klarman, Francis & Ro- senthal 1968, Weinstein, Stason 1976, Williams 1985).

QALY:t eivät kuitenkaan ole QoL:n mittoja, vaan yksikköjä joiden avulla voidaan verrata terveydenhuollon toimenpiteitä muutoinkin kuin vain eloonjäämislukujen perusteella. Koska on tarkoitus vaikuttaa resurssien allokoimiseen, eivät QoL:n muutokset sinän- sä ole tärkeitä, vaan huomio on kiinnitettävä kustannuksiin laatupainotettua elinvuotta kohti (Drummond 2001). Parannuksia potilaiden QoL:uun ei siis olla valmiita tekemään mihin hintaan tahansa. Ongelmana on se, että lisä-QALY:lle ei ole annettu ehdotonta maksimihintaa, vaan QALY:n hyväksyttyyn hintaan vaikuttanee esimerkiksi oikeuden- mukaisuuskysymykset, OC:t, budjetti ja WTP:n dynaamisuus.

QALY:n lähtökohtana on se, että HRQoL voidaan mitata riittävän yksiselitteisesti ja täsmällisesti. ⁸ Lisäksi HRQoL:n on oltava kuvattavissa yhdellä kokoavalla indeksilu- vulla (Aro, Mähönen 1993, Nord 1999). QALY-ajattelu on utilitaristista, koska yhteistä hyvää pyritään saavuttamaan mahdollisimman suuri määrä annetuilla resursseilla (Nord 1999). Toisaalta terveydenhuolto yleensä keskittyy auttamaan suurimmassa tarpeessa olevia riippumatta heidän hoitonsa aiheuttamasta hyödyn määrästä. Käytännön hoito- työssä ja myös taloudellisessa päätöksenteossa on yleistä, että huonokuntoisten potilaiden hoito priorisoidaan korkeammalle arvovalintoihin perustuen kuin hieman parem-

6 Päätöksenteon kannalta olisi myös mielenkiintoista kysyä, onko absoluuttinen muutos 0.5:stä 0.6:een HRQoL:ssa yhtä arvokas kuin muutos 0.8:sta 0.9.ään – eli saman kustannuksen arvoinen?

7 Myös muita mittareita on kehitetty (Gold, Stevenson & Fruback 2002, Robberstad 2005, Sassi 2006).

8 Ongelmia: Eri tutkimuksissa terveydentilat on voitu määritellä eri tavoin, terveydentilojen arvottamiseen on voitu käyttää erilaisia arvottamismenetelmiä tai tutkimuksessa on voitu käyttää sairausspesifejä tai geneerisiä indeksimittareita ja arvottamisessa on voitu käyttää potilaiden, väestön tai jonkun muun prefe- renssejä. Periaatteessa vertailtavien hoitojen tuottamien QALY:ien tulisi olla keskenään vertailukelpoisia.

(27)

massa kunnossa olevien hoito (Nord 1999, 2001). Ajatus pelkästään niiden potilaiden hoitamisesta, joille hoito aiheuttaa eniten hyötyä, aiheuttaa ongelmia. Helposti parem- massa lähtötilanteessa olevat ihmiset eivät tämän seurauksena saisi hoitoa, sillä heidän hoitonsa ei tuota niin paljon potentiaalista hyötyä kuin huonompi kuntoisten ihmisten hoitaminen. Tällöin lievemmistä oireista kärsivät ja huonokuntoiset ihmiset olisivat etu- sijalla ja tulisivat hoidetuiksi vaikeista oireista kärsivien, mutta hyväkuntoisten ihmisten kustannuksella.

Onko oikein verrata ihmisen hyvinvointia rahaan? Voidaanko jonkin terveydentilan saavuttamiselle, QoL:lle tai ihmiselämälle määrittää rahallinen arvo? Luonnollisesti valintoja on kuitenkin tehtävä, jotta resurssit saadaan käytettyä viisaasti. Kappaleessa 2.1.2 esitelty yksinkertaisten tehokkuusparannusten lähestymistapa ei vaadi ihmisen hyvinvoinnin vertaamista rahaan, eikä täysin yksiselitteistä QoL:n arvon määrittelyä.

2.2.3 Kustannukset

Interventioiden aiheuttaminen kustannusten ja vaikuttavuuden arvioinnin pääperiaattee- na voidaan pitää sen arviointia, aiheutuisiko kustannuksia ja vaikuttavuutta ilman inter- ventiota tietyllä ajanjaksolla. Yleisesti arvioinneissa huomioidaan suorat terveydenhuollon eli palveluiden tuottajan (usein sairaala) tai yhteiskunnan kustannukset eli ne kustannukset, jotka ovat suorassa yhteydessä tiettyyn resurssienkäyttöön. Tässä tutkimuksessa kustannukset on määritelty palvelujen tuottajan näkökulmasta, jolloin mukaan on otettu terveydenhuollon kustannukset (vrt. Taulukko 1) sisältäen toimenpide-, hoitopäi- vä-, laboratorio- ja kuvantamiskustannukset.

TAULUKKO 1. Tutkimuksen näkökulma ja kustannuslaskenta

Kustannusryhmä Tutkimuksen

näkökulma Terveydenhuolto Muut suorat

(esim. matkat) Sairastavuus

(töistä poissaolo) Kuolleisuus Aika Tulon- siirrot Yhteiskunta Kaikki Kaikki Kaikki Kaikki Kaikki Ei

Tuottaja Kaikki Ei Ei Tuottajan osalta Ei Ei

Potilas Hoitopäivämaksut Omavastuu Tulonmenetys Tulonmenetys Kaikki Kaikki Omaiset Hoitopäivämaksut Omavastuu Tulonmenetys Tulonmenetys Kaikki Kaikki Työnantaja Vakuutusmaksut Ei Kitkakustannus Kitkakustannus Kaikki Ei Muokattu ja edelleen kehitetty lähteestä: Martikainen, Hallinen & Soini 2006.

(28)

Käytännössä kustannuslaskenta voidaan suorittaa keskimääräisten kustannusten, mikro- kustannusten tai edellisten yhdistelmämenetelmää hyödyntäen (Swindle ym. 1999, Hal- linen ym. 2006, Keränen ym. 2007, Soini ym. 2007a, 2007b). Tässä tapauksessa tutkimuksen sisäiset kustannustiedot kerättiin mikrokustannuslaskentaa hyväksi käyttäen, koska ne saatiin suoraan KYS:n toimintolaskentaan perustuvasta tietokannasta. ⁹

Tämän tutkimuksen empiirisiä analyysejä ei tehty yhteiskunnan näkökulmasta, koska tavoitteena oli ensijaisesti arvioida terveyspalveluita tuottavan organisaation (tässä KYS) teknistä tehokkuutta eli sitä, ovatko annetut resurssit tehokkaassa käytössä. Tois- sijaisesti arvioitiin resurssien kohdentamisen eli allokaation tehokkuutta OC:en avulla.

9 Tätä toimintalaskentatapaa voidaan pitää tavanomaista Nord-DRG -luokitusta tarkempana.

(29)

3 MENETELMÄT JA TEOREETTISET TULOKSET

Luonnollisissa asetelmissa perinteiset vaikuttavuuden arviointimenetelmät voivat johtaa harhaisiin arvioihin ja virheellisiin päätelmiin erityisesti vakioinnin puuttuessa (Cochran 1968, Rubin 1979, Rosenbaum, Rubin 1983, 1984, Korn, Graubard 1988, Rubin, Tho- mas 1996, Rubin 1997, D’Agostino 1998, Melfi 2001, Rosenbaum 2002, Sabia 2006).

Tässä tutkimuksessa käytetyillä menetelmillä kyetään hallitsemaan valikoitumisharhaa tehokkaasti.

3.1 Stokastinen lähestymistapa

Tutkimuksessa sovellettiin tavanomaisen deterministisen eli piste-estimaatit olettavan ajattelutavan ohella myös epävarmuuden hahmottamisessa tehokkaampaa stokastista eli potilastason (satunnaisjakaumat) olettavaa taloudellisen arviointitutkimuksen kehikkoa (O'Brien ym. 1994, Martikainen, Hallinen & Soini 2006). Stokastisen lähestymistavan avulla on mahdollista arvioida nollaa lähestyviä ICER:ita – nollaa lähestyvät vaikuttavuuserot vääntävät ICER:een varianssia voimakkaasti (O'Brien ym. 1994).

Sovellusajanjakso oli tutkimuksen sisäinen (engl. within-trial; Shadish 2000) eli noin neljän kuukauden ajanjakso, koska tämän ajanjakson tarkastelu riittää tässä todistamaan valikoitumisharhan empiiriset vaikutukset ¹⁰ ja on riittävän pitkä huomioimaan toimen- piteistä palautumisen. CEA voidaan lyhyelläkin aikavälillä tehdä kahdella tapaa, joihin molempiin liittyy erilaisia ja eritasoisia oletuksia:

1. Tapa. Kerätään teho- ja turvallisuustieto kliinisestä tutkimuksesta ja yhdistetään se toisesta lähteestä tulevaan kustannustietoon. Näistä rakennetaan usein ns. päätösana- lyyttinen malli (O’Brien 1996). Tähän tapaan liittyvä epävarmuus, yleistettävyyden vaikeus ja oletukset ovat suuret (Briggs, Sculpher & Buxton 1994).

2. Tapa. Kerätään teho-, turvallisuus- ja kustannustiedot potilaskohtaisesti (O’Brien 1996). Tämä tapa mahdollistaa tavanomaisempien tilastomenetelmien käytön, hel- pomman yleistettävyyden kaiken tiedon tullessa tietystä potilaspopulaatiosta ja pie- nemmät oletukset kuin tapa 1. Siksi tässä tutkimuksessa käytetään tapaa 2, joka itse

10 Toki on huomioitava se, että kirjallisuuden mukaan PTCA uusitaan CABG:sta todennäköisemmin (Griffin ym. 2007b), jolloin lyhyen ajanjakson mallintaminen on lääkityksen ja erityisesti CABG:n näkö- kulmasta konservatiivinen.