• Ei tuloksia

Markovin ketju Monte Carlo -simulointi ja Peskunin järjestys

N/A
N/A
Info
Lataa
Protected

Academic year: 2022

Jaa "Markovin ketju Monte Carlo -simulointi ja Peskunin järjestys"

Copied!
64
0
0

Kokoteksti

(1)

Markovin ketju Monte Carlo -simulointi ja Peskunin j¨ arjestys

Santeri Parkkinen

Matematiikan pro gradu -tutkielma Jyv¨ askyl¨ an yliopisto

Matematiikan ja tilastotieteen laitos

Kev¨ at 2019

(2)

Tiivistelm¨ a

Jyv¨askyl¨an yliopisto

Matematiikan ja tilastotieteen laitos Matematiikan pro gradu -tutkielma

Markovin ketju Monte Carlo -simulointi ja Peskunin j¨arjestys, 42 s., liitteit¨a 19 s.

Santeri Parkkinen Toukokuu 2019

T¨am¨an tutkielman tavoitteena on esitell¨a Markovin ketju Monte Carlo -simulointi ¨a¨arellisess¨a tila-avaruudessa ja k¨asitell¨a simulointialgoritmien vertailuun liittyv¨a¨a ongelmaa. Markovin ket- ju Monte Carlo -simuloinnissa funktion odotusarvolle lasketaan approksimaatioita simuloitua Markovin ketjua apuna k¨aytt¨aen. Usein simulointi voidaan tehd¨a useammalla kuin yhdell¨a algo- ritmilla ja halutaan selvitt¨a¨a, mik¨a algoritmi soveltuu teht¨av¨a¨an parhaiten.

Kun simulaatioaskelten m¨a¨ar¨a l¨ahestyy ¨a¨aret¨ont¨a, Markovin ketju Monte Carlo -estimaatti sup- penee melkein varmasti kohti odotusarvon oikeaa arvoa k¨aytetyst¨a simulointialgoritmista riippu- matta. K¨ayt¨ann¨oss¨a Markovin ketju Monte Carlo -simulointi tuottaa kuitenkin vain odotusar- von approksimaation, koska mik¨a¨an todellinen simulointi ei voi jatkua ¨a¨arett¨om¨an pitk¨a¨an. Vain

¨a¨arellisen monen simulaatioaskeleen k¨aytt¨o aiheuttaa virheen, joka on luonteeltaan satunnainen:

virhe kuuluu tietylle v¨alille jollakin todenn¨ak¨oisyydell¨a. On luonnollista kysy¨a, miten approksi- maation tarkkuus riippuu simulointialgoritmista. Kaikki algoritmit antavat odotusarvolle arvion halutulla tarkkuudella, jos simulointia jatketaan riitt¨av¨an kauan. Jotkut algoritmit tuottavat kuitenkin tarkkoja approksimaatioita nopeammin kuin toiset, mik¨a on motivaatio algoritmien vertailulle. Ei kuitenkaan ole aivan selv¨a¨a, miten vertailu pit¨aisi k¨ayt¨ann¨oss¨a tehd¨a. Halutun tarkkuuden saavuttamiseksi vaadittavaa aikaa on vaikea arvioida, eiv¨atk¨a pelk¨at arviot edes ole riitt¨av¨a perusta algoritmien vertailulle. Voi esimerkiksi k¨ayd¨a niin, ett¨a arvioitu alaraja algo- ritminP vaatimalle ajalle on pienempi kuin alaraja algoritminQvaatimalle ajalle, mutta silti algoritmi Qp¨a¨asee haluttuun tarkkuuteen nopeammin kuin algoritmi P. Pelk¨at alarajat eiv¨at siis kerro tarpeeksi vaadittavien aikojen todellisista arvoista. Arvioiden sijaan tarvitaan jokin eksakti riippuvuus simulointivirheen ja algoritmin v¨alille.

Kriteeri, jonka suhteen algoritmien vertailu tehd¨a¨an, johdetaan Markovin ketjujen keskeist¨a raja- arvolausetta k¨aytt¨aen. Keskeinen raja-arvolause mahdollistaa simulointivirheiden todenn¨ak¨oi- syyksien raja-arvon eksaktin laskemisen tietyss¨a erikoistapauksessa. Tarkastelu osoittaa, ett¨a algoritmien vertailemiseksi kannattaa tutkia niiden asymptoottisia variansseja: kahdesta algo- ritmista se, jonka asymptoottinen varianssi annetulle funktiolle on pienempi, soveltuu parem- min kyseisen funktion odotusarvon simulointiin. Kriteerin ongelmana on, ett¨a sen soveltaminen ei ole ihan suoraviivaista. K¨ayt¨ann¨oss¨a algoritmeista tiedet¨a¨an vain niiden siirtym¨atodenn¨ak¨oi- syysmatriisit, joten algoritmien vertailemiseksi t¨aytyy selvitt¨a¨a, miten asymptoottinen varians- si riippuu siirtym¨atodenn¨ak¨oisyysmatriisista. T¨ass¨a tutkielmassa tarkastelu rajataan k¨a¨antyviin Markovin ketjuihin, jolloin kyseinen riippuvuus voidaan selvitt¨a¨a funktionaalianalyysin tuloksia hy¨odynt¨aen. T¨am¨an j¨alkeen vertailu onnistuu tietyss¨a erikoistapauksessa Peskunin j¨arjestyst¨a k¨aytt¨am¨all¨a. Peskunin j¨arjestyksen sovelluksena osoitetaan, ett¨a Metropolis–Hastings -algoritmi on parempi kuin Barkerin algoritmi.

(3)

Sis¨ alt¨ o

1 Markovin ketju ¨a¨arellisess¨a tila-avaruudessa 4

2 Invariantti jakauma ja tasainen ergodisuus 6

3 Markovin ketju Monte Carlo -simulointi 13

4 Siirtym¨atodenn¨ak¨oisyysmatriisin ominaisvektorit

ja -arvot 25

5 Peskunin j¨arjestys ja asymptoottisten varianssien vertailu 30

Liite A Markovin ketjujen perustuloksia 42

Liite B Funktionaalianalyysin tuloksia 50

Liite C Kroneckerin lemma 59

Viitteet 61

(4)

Johdanto

Stokastiikassa ja sen sovelluksissa usein vastaan tuleva ongelma on satunnaismuuttujan odo- tusarvon laskeminen. Aina odotusarvoa ei k¨ayt¨ann¨oss¨a ole mahdollista laskea suoraan satunnais- muuttujan jakaumaa k¨aytt¨aen edes tapauksessa, jossa satunnaismuuttujan tila-avaruus tiedet¨a¨an

¨a¨arelliseksi. Ongelmia ilmenee, jos tila-avaruus on hyvin suuri tai jos jakauman normitusvakio- ta ei tunneta. T¨allaisissa tilanteissa on kuitenkin usein mahdollista approksimoida odotusarvoa Markovin ketju Monte Carlo -simuloinniksi kutsuttua menetelm¨a¨a k¨aytt¨aen viel¨ap¨a niin, ett¨a simulointialgoritmi voidaan valita useasta eri vaihtoehdosta. T¨am¨an tutkielman tavoitteena on esitell¨a Markovin ketju Monte Carlo -simulointi ¨a¨arellisess¨a tila-avaruudessa sek¨a k¨asitell¨a algo- ritmien vertailuun liittyv¨a¨a ongelmaa.

Kun simulaatioaskelten m¨a¨ar¨a l¨ahestyy ¨a¨aret¨ont¨a, Markovin ketju Monte Carlo -estimaatti sup- penee melkein varmasti kohti odotusarvon oikeaa arvoa k¨aytetyst¨a simulointialgoritmista riippu- matta. K¨ayt¨ann¨oss¨a Markovin ketju Monte Carlo -simulointi tuottaa kuitenkin vain odotusar- von approksimaation, koska mik¨a¨an todellinen simulointi ei voi jatkua ¨a¨arett¨om¨an pitk¨a¨an. Vain

¨a¨arellisen monen simulaatioaskeleen k¨aytt¨o aiheuttaa virheen, joka on luonteeltaan satunnainen:

virhe kuuluu tietylle v¨alille jollakin todenn¨ak¨oisyydell¨a. On luonnollista kysy¨a, miten approksi- maation tarkkuus riippuu simulointialgoritmista. Kaikki algoritmit antavat odotusarvolle arvion halutulla tarkkuudella, jos simulointia jatketaan riitt¨av¨an kauan. Jotkut algoritmit tuottavat kuitenkin tarkkoja approksimaatioita nopeammin kuin toiset, mik¨a on motivaatio algoritmien vertailulle. Ei kuitenkaan ole aivan selv¨a¨a, miten vertailu pit¨aisi k¨ayt¨ann¨oss¨a tehd¨a. Halutun tarkkuuden saavuttamiseksi vaadittavaa aikaa on vaikea arvioida, eiv¨atk¨a pelk¨at arviot edes ole riitt¨av¨a perusta algoritmien vertailulle. Voi esimerkiksi k¨ayd¨a niin, ett¨a arvioitu alaraja algo- ritminP vaatimalle ajalle on pienempi kuin alaraja algoritminQvaatimalle ajalle, mutta silti algoritmi Qp¨a¨asee haluttuun tarkkuuteen nopeammin kuin algoritmi P. Pelk¨at alarajat eiv¨at siis kerro tarpeeksi vaadittavien aikojen todellisista arvoista. Arvioiden sijaan tarvitaan jokin eksakti riippuvuus simulointivirheen ja algoritmin v¨alille.

Osoittautuu, ett¨a tietyss¨a erikoistapauksessa Markovin ketjujen keskeinen raja-arvolause mah- dollistaa simulointivirheiden todenn¨ak¨oisyyksien raja-arvon eksaktin m¨a¨aritt¨amisen. Tarkaste- lun seurauksena n¨ahd¨a¨an, ett¨a algoritmien vertailemiseksi kannattaa tutkia niiden asymptoot- tisia variansseja: jos algoritmin P asymptoottinen varianssi funktiolle f on pienempi tai yht¨a suuri kuin algoritmin Q asymptoottinen varianssi funktiolle f, niin algoritmi P on parempi funktionf odotusarvon simulointiin kuin algoritmiQ. T¨allaisen vertailun tekeminen ei kuiten- kaan ole aivan ongelmatonta. L¨aht¨okohtaisesti simulointialgoritmeista tiedet¨a¨an nimitt¨ain vain niiden siirtym¨atodenn¨ak¨oisyysmatriisit, joten t¨aytyy selvitt¨a¨a, miten algoritmin asymptoottinen varianssi funktiolle f riippuu siirtym¨atodenn¨ak¨oisyysmatriisista. T¨ass¨a tutkielmassa tarkastelu rajataan k¨a¨antyviin Markovin ketjuihin, jolloin kyseinen riippuvuus voidaan selvitt¨a¨a funktio- naalianalyysin ty¨okaluja apuna k¨aytt¨aen. P¨a¨adyt¨a¨an lauseeseen, joka on sik¨ali ongelmallinen, ett¨a tyypillisess¨a Markovin ketju Monte Carlo -simuloinnin sovelluksessa k¨ayt¨oss¨a olevat tie- dot eiv¨at riit¨a algoritmien vertailuun. Ongelman ratkaisi Peter Peskun, joka keksi, miten kahden algoritmin asymptoottisten varianssien suuruusj¨arjestys voidaan erikoistapauksessa p¨a¨atell¨a suo- raan siirtym¨atodenn¨ak¨oisyysmatriisien alkioita tutkimalla. Oletetaan, ett¨a algoritmeja P ja Q vastaavat siirtym¨atodenn¨ak¨oisyysmatriisit ovat k¨a¨antyvi¨a saman invariantin jakauman suhteen.

Peskun osoitti, ett¨a jos algoritmia P vastaavan matriisin kaikki alkiot – diagonaalialkioita lu- kuun ottamatta – ovat suurempia tai yht¨a suuria kuin algoritmia Qvastaavan matriisin alkiot, niin algoritmin P asymptoottinen varianssi funktiolle f on pienempi tai yht¨a suuri kuin algo- ritminQ asymptoottinen varianssi funktiolle f. Johtop¨a¨at¨os on sama kaikille funktioille, joten t¨ast¨a seuraa, ett¨a algoritmiP on parempi kuin algoritmiQmink¨a tahansa funktion odotusarvon

(5)

approksimointiin. Nykyisin matriisin alkioita koskevaa ehtoa kutsutaan Peskunin j¨arjestykseksi.

Lauseensa sovelluksena Peskun osoitti, ett¨a Metropolis–Hastings -algoritmi on parempi kuin Bar- kerin algoritmi.

Tutkielman esitietoina lukijalta edellytet¨a¨an todenn¨ak¨oisyysteorian, lineaarialgebran ja funktio- naalianalyysin perusteiden tunteminen. Markovin ketjujen tunteminen sen sijaan ei ole aivan v¨altt¨am¨at¨ont¨a, sill¨a tarvittava m¨a¨ar¨a teoriaa sis¨altyy tutkielmaan. Kannattaa kuitenkin huoma- ta, ett¨a Markovin ketjujen perusominaisuuksia k¨asitell¨a¨an vain liitteess¨a A, ja varsinainen teksti keskittyy niihin tuloksiin, jotka tarvitaan Markovin ketju Monte Carlo -simuloinnin esitt¨amiseen.

My¨os funktionaalianalyysist¨a on melko kattava liite.

Rakenteeltaan tutkielma on seuraavanlainen: Luvussa 1 m¨a¨aritell¨a¨an siirtym¨atodenn¨ak¨oisyys- matriisi ja Markovin ketju ¨a¨arellisess¨a tila-avaruudessa. Luvussa 2 k¨ayd¨a¨an l¨api Markovin ketju Monte Carlo -simuloinnin esitt¨amiseen tarvittavia pohjatietoja. Keskeisi¨a k¨asitteit¨a ovat inva- riantti jakauma ja tasainen ergodisuus. Luvussa 3 perustellaan, miksi Markovin ketju Monte Carlo -simulointi toimii. Lis¨aksi m¨a¨aritell¨a¨an Metropolis–Hastings -algoritmi ja Barkerin algorit- mi ja osoitetaan, ett¨a ne ovat k¨a¨antyvi¨a invariantin jakaumansa suhteen. Lopuksi pohjustetaan algoritmien vertailuun liittyv¨a¨a ongelmaa. Luku 4 k¨asittelee siirtym¨atodenn¨ak¨oisyysmatriisien ominaisvektoreita ja -arvoja. T¨am¨a tarkastelu on tarpeen, jotta luvussa 5 voidaan hy¨odynt¨a¨a funktionaalianalyysin tuloksia asymptoottisen varianssin tutkimiseen. Luvussa 5 teht¨avien tar- kastelujen tuloksena saadaan lause, joka kertoo, miten asymptoottinen varianssi riippuu simu- lointialgoritmista. Luvussa 5 esitell¨a¨an my¨os Peskunin j¨arjestys ja selvitet¨a¨an, miten se liittyy asymptoottisten varianssien ja algoritmien vertailuun. Lopuksi Peskunin j¨arjestyksen sovellukse- na osoitetaan, ett¨a Metropolis–Hastings -algoritmi on parempi kuin Barkerin algoritmi.

(6)

Merkint¨ oj¨ a

• N0={0,1,2, . . .}

• N={1,2,3, . . .}

• Z={. . . ,−2,−1,0,1,2, . . .}

• Olkoon P = [pi,j]i,j=1,2,...,n neli¨omatriisi sek¨a k∈N. Potenssimatriisin Pk alkio paikassa (i, j) onp(k)i,j.

• OlkoonP = [pi,j] matriisi.

– Jospi,j≥0 kaikillaijaj, merkit¨a¨anP ≥0.

– Jospi,j>0 kaikillaijaj, merkit¨a¨anP >0.

• Olkoonx= (x1, x2, . . . , xn)∈Rn vektori.

– Josxi≥0 kaikillai= 1,2, . . . , n, merkit¨a¨an x≥0.

– Josxi>0 kaikillai= 1,2, . . . , n, merkit¨a¨an x >0.

• Avaruuden Rn luonnollisia kantavektoreita merkit¨a¨an tunnuksilla ei,i= 1,2, . . . , n. Vek- torinei j.komponentti on siis

ei,j=

(1, josj=i 0, josj6=i .

• Avaruuden Rn nollavektorille k¨aytet¨a¨an merkint¨a¨a ¯0.

• OlkoonS joukko. JoukonS osajoukkojen kokoelmaa merkit¨a¨an P(S) ={A|A⊂S}.

• Josx∈R, niin

⌊x⌋= max{n∈Z:n≤x}.

(7)

1 Markovin ketju ¨ a¨ arellisess¨ a tila-avaruudessa

T¨ass¨a luvussa m¨a¨aritell¨a¨an siirtym¨atodenn¨ak¨oisyysmatriisi ja Markovin ketju ¨a¨arellisess¨a tila- avaruudessa. Karkeasti ottaen Markovin ketju on jono satunnaismuuttujiaXk : Ω→S, jolla on se ominaisuus, ett¨a jokaisella ajanhetkell¨ak ∈N0 todenn¨ak¨oisyys siirty¨a tilasta Xk =x tilaan Xk+1=yriippuu vain ketjun nykytilastaXk =x, mutta ei siit¨a, miten nykytilaan on p¨a¨adytty.

SatunnaismuuttujatX0, X1, . . . , Xk−1eiv¨at siis vaikuta siirtym¨an Xk=x→Xk+1=y

todenn¨ak¨oisyyteen. Siirtym¨atodenn¨ak¨oisyysmatriisi puolestaan kirjaa kyseisten siirtymien to- denn¨ak¨oisyydet matriisin muotoon. T¨am¨a on mahdollista, kun ketjun tila-avaruus S on ¨a¨arel- linen, ja eritt¨ain hy¨odyllist¨a, koska siirtym¨atodenn¨ak¨oisyysmatriisin avulla Markovin ketjujen tutkiminen palautuu pitk¨alti matriisien tutkimiseen. Seuraavat m¨a¨aritelm¨at ovat l¨ahteest¨a [1].

M¨a¨aritelm¨a 1.1. Neli¨omatriisiP = [pi,j]i,j=1,2,...,n on siirtym¨atodenn¨ak¨oisyysmatriisi, jos (i) P ≥0

(ii) Pn

j=1pi,j= 1kaikillai= 1,2, . . . , n.

Jos P = [pi,j]i,j=1,2,...,n on siirtym¨atodenn¨ak¨oisyysmatriisi, niin induktiolla on helppo todeta, ett¨a kaikilla k∈Nmy¨os potenssimatriisi Pk =h

p(k)i,ji

i,j=1,2,...,n on siirtym¨atodenn¨ak¨oisyysmat- riisi.

M¨a¨aritelm¨a 1.2. Olkoon(Ω,F,P) todenn¨ak¨oisyysavaruus,S={s1, s2, . . . , sn} ⊂Rja P = [pi,j]i,j=1,2,...,n siirtym¨atodenn¨ak¨oisyysmatriisi. Jono(Xk)k=0 satunnaismuuttujia

Xk: Ω→S

on Markovin ketju, jonka siirtym¨atodenn¨ak¨oisyysmatriisi onP, jos

(i) P(Xk+1=xk+1|Xk =xk, Xk1=xk1, . . . , X0=x0) = P(Xk+1=xk+1|Xk=xk) kaikil- la k∈N0 ja kaikilla x0, x1, . . . , xk+1∈S, joille

P(X0=x0, X1=x1, . . . , Xk =xk)>0

(ii) P(Xk+1=sj|Xk =si) =pi,j kaikillai, j= 1,2, . . . , nja k∈N0, joilleP(Xk=si)>0.

SatunnaismuuttujanX0jakaumaa kutsutaan Markovin ketjun(Xk)k=0alkujakaumaksi ja joukkoa S kutsutaan ketjun tila-avaruudeksi.

Jatkossa oletetaan, ett¨a Markovin ketjun tila-avaruus on reaalilukujen osajoukko, jossa on aina v¨ahint¨a¨an kaksi alkiota. Erityisesti siirtym¨atodenn¨ak¨oisyysmatriisi on aina v¨ahint¨a¨an kokoa 2×2.

Olkoon (Xk)k=0 Markovin ketju tila-avaruudella S = {s1, s2, . . . , sn} ja olkoon ketjun siir- tym¨atodenn¨ak¨oisyysmatriisiP = [pi,j]i,j=1,2,...,n. Samaistetaan satunnaismuuttujanXkjakauma

µk :S→[0,1], µk(x) =P(Xk =x), vektorin

µ(k)=

µ(k)1 , µ(k)2 , . . . , µ(k)n

∈Rn

(8)

kanssa, miss¨a

µ(k)ik(si) =P(Xk=si) kaikillai= 1,2, . . . , n.

OlkoonJ niiden indeksienj= 1,2, . . . , njoukko, joille p¨atee, ett¨a P(Xk =sj)>0.

T¨all¨oin kaikillal= 1,2, . . . , n

µ(k+1)l =P(Xk+1=sl) =P

{Xk+1=sl} ∩

 [n j=1

{Xk=sj}

=P

 [n j=1

({Xk+1=sl} ∩ {Xk=sj})

= Xn j=1

P(Xk+1=sl, Xk=sj)

=X

jJ

P(Xk+1=sl, Xk =sj) =X

jJ

P(Xk=sj)P(Xk+1=sl|Xk=sj)

=X

jJ

P(Xk =sj)pj,l= Xn j=1

P(Xk=sj)pj,l= Xn j=1

µ(k)j pj,l=h µ(k)Pi

l. (1)

N¨ain ollen vektorimuodossa p¨atee, ett¨a

µ(k+1)kP. (2)

Yht¨al¨ost¨a (2) seuraa helposti induktiolla, ett¨a

µ(k)(0)Pk (3)

kaikillak∈N.

(9)

2 Invariantti jakauma ja tasainen ergodisuus

T¨ass¨a luvussa k¨ayd¨a¨an l¨api Markovin ketju Monte Carlo -simuloinnin esitt¨amiseen tarvittavia lauseita. Luvun p¨a¨atuloksia ovat Lause 2.1 ja Lause 2.2. Tulosten motivoimiseksi tarkastellaan lyhyesti seuraavaa ongelmaa l¨ahteen [1] esityst¨a mukaillen: Olkoon (Xk)k=0 Markovin ketju ja µ(k)satunnaismuuttujanXk jakauma. Halutaan selvitt¨a¨a, mill¨a ehdoilla on olemassa jakaumaπ siten, ett¨a

µ(k)→π, kunk→ ∞.

Ongelman ratkaiseminen l¨ahtee liikkeelle rajajakaumakandidaatin etsimisest¨a. T¨am¨a onnistuu helposti: yht¨al¨on (2) mukaan

µ(k+1)(k)P

kaikillak∈N0, miss¨aP on ketjun siirtym¨atodenn¨ak¨oisyysmatriisi. N¨ain ollen n¨ahd¨a¨an, ett¨a jos rajajakaumaπ= limk→∞µ(k) on olemassa, se toteuttaa yht¨al¨on

π= lim

k→∞µ(k+1)= lim

k→∞

µ(k)P

=

k→∞lim µ(k)

P =πP.

T¨am¨a johtaa invariantin jakauman k¨asitteeseen:

M¨a¨aritelm¨a 2.1. Jakauma π ∈ Rn on siirtym¨atodenn¨ak¨oisyysmatriisin P = [pi,j]i,j=1,2,...,n

invariantti jakauma, jos

π=πP.

Seuraavaksi osoitetaan, ett¨a jos Markovin ketjun siirtym¨atodenn¨ak¨oisyysmatriisilleP p¨atee, ett¨a Pm >0 jollakin m∈ N, niin yksik¨asitteinen invariantti jakauma π on olemassa ja sille p¨atee, ett¨aπ >0. Erotetaan osa todistuksesta lemmaksi my¨ohemp¨a¨a k¨aytt¨o¨a varten. Lemman 2.1 tulos on l¨ahteest¨a [2] ja todistus mukailee l¨ahteen todistusta.

Lemma 2.1. Olkoon P = [pi,j]i,j=1,2,...,n siirtym¨atodenn¨ak¨oisyysmatriisi siten, ett¨aP >0. Jos x∈Rn siten, ett¨a xP =x, niin x≥0 taix≤0.

Todistus. Jos v¨aite on v¨a¨ar¨a, on olemassa indeksiti, j∈ {1,2, . . . , n}siten, ett¨axi<0 jaxj >0.

Kaikillak= 1,2. . . , n xk ≤ |xk|jaxi<0<|xi|, joten kaikilla l= 1,2, . . . , np¨atee, ett¨a Xn

k=1

xkpk,l=X

k6=i

xkpk,l+xipi,l<X

k6=i

|xk|pk,l+|xi|pi,l= Xn k=1

|xk|pk,l. Vastaavastixk≥ − |xk|kaikilla k= 1,2, . . . , nja xj>0>− |xj|, joten

Xn k=1

xkpk,l>− Xn k=1

|xk|pk,l kaikillal= 1,2, . . . , n.

N¨ain ollen saadaan, ett¨a

Xn k=1

xkpk,l

<

Xn k=1

|xk|pk,l kaikillal= 1,2, . . . , n.

Toisaalta oletuksenxP =xnojalla xl= [xP]l=Pn

k=1xkpk,lkaikilla l= 1,2, . . . , n, joten Xn

l=1

|xl|= Xn l=1

Xn k=1

xkpk,l

<

Xn l=1

Xn k=1

|xk|pk,l= Xn k=1

Xn l=1

|xk|pk,l= Xn k=1

|xk| Xn

l=1

pk,l= Xn k=1

|xk|,

(10)

Lause 2.1. OlkoonP = [pi,j]i,j=1,2,...,n siirtym¨atodenn¨ak¨oisyysmatriisi siten, ett¨a Pm >0 jol- lakinm∈N. T¨all¨oin matriisillaP on yksik¨asitteinen invariantti jakaumaπ∈Rn. Lis¨aksi p¨atee, ett¨a π >0.

Todistus. Olkoony= (y1, y2, . . . , yn)∈Rn siten, ett¨ayk= 1 kaikillak= 1,2, . . . , n. T¨all¨oin [P y]i=

Xn k=1

pi,kyk = Xn k=1

pi,k = 1 =yi kaikilla i= 1,2, . . . , n,

joten P y =y. Erityisesti luku 1 on matriisin P oikeanpuoleinen ominaisarvo. Koska matriisin vasemmanpuoleiset ja oikeanpuoleiset ominaisarvot ovat samat, on 1 my¨os matriisin P vasem- manpuoleinen ominaisarvo. On siis olemassa vektorix∈Rn\{¯0}siten, ett¨axP =x. T¨ast¨a seuraa induktiolla, ett¨axPk =xkaikilla k ∈N. ErityisestixPm =x, joten soveltamalla Lemmaa 2.1 siirtym¨atodenn¨ak¨oisyysmatriisiinPm>0 saadaan, ett¨ax≤0 taix≥0. Korvaamalla vektorix tarvittaessa vektorilla−xvoidaan olettaa, ett¨a x≥0. Koskaxei ole nollavektori, on olemassa indeksii∈ {1,2, . . . , n}siten, ett¨axi>0. T¨ast¨a seuraa, ett¨axj>0 kaikillaj = 1,2, . . . , n, sill¨a

xj= [xPm]j= Xn k=1

xkp(m)k,j ≥xip(m)i,j >0.

Olkoon

π= x

Pn j=1xj, jolloin siisπ= (π1, π2, . . . , πn)∈Rn siten, ett¨a

πi = xi Pn

j=1xj

kaikilla i= 1,2, . . . , n.

T¨all¨oin (i) πP =

Pnx

j=1xj

P = Pn1

j=1xj (xP) = Pnx

j=1xj =π, (ii) Pn

i=1πi=Pn i=1Pnxi

j=1xj =Pn1 j=1xj

Pn

i=1xi= 1 ja (iii) πi= Pnxi

j=1xj >0 kaikillai= 1,2, . . . , n, koskaxi>0 kaikillai= 1,2, . . . , n, jotenπ∈Rn on etsitty jakauma.

Osoitetaan viel¨a invariantin jakauman yksik¨asitteisyys. Oletetaan vastoin v¨aitett¨a, ett¨a on ole- massa invariantti jakaumaµ∈Rn siten, ett¨aµ6=π. T¨all¨oin

(π−µ)Pm=πPm−µPm=π−µ,

joten Lemman 2.1 nojallaπ−µ≥ 0 taiπ−µ≤ 0. Oletetaan, ett¨a π−µ ≥0. Koska µ 6=π, on olemassa indeksi j ∈ {1,2, . . . , n} siten, ett¨a µj 6= πj. T¨all¨oin ehdon π−µ ≥0 nojalla on µj< πj, joten saadaan, ett¨a

1 = Xn i=1

µi<

Xn i=1

πi= 1, mik¨a on ristiriita. Tapausπ−µ≤0 k¨asitell¨a¨an vastaavasti.

(11)

Lause 2.1 ratkaisee invariantin jakauman olemassaoloa koskevan kysymyksen. Voidaan my¨os osoittaa, ett¨a

k→∞lim µ(k)=π,

jos Pm > 0 jollakinm ∈ N. Tulos ei kuitenkaan ole t¨am¨an tutkielman kannalta kovin oleelli- nen; ongelmaa tarkasteltiin l¨ahinn¨a invariantin jakauman k¨asitteen motivoimiseksi. Lis¨aksi nyt yht¨al¨on (3) perusteella on luonnollista kysy¨a, mit¨a tapahtuu matriiseille Pk, miss¨ak∈N, kun k→ ∞. Osoittautuu, ett¨a kaikilla i, j= 1,2, . . . , n

p(k)i,j →πj, kunk→ ∞,

viel¨ap¨a niin, ett¨a

p(k)i,j −πj ≤Cβk

kaikilla k∈N, miss¨a C≥0 ja 0≤β <1. Huomaa, ett¨a yl¨araja ei riipu indekseist¨ai jaj, mik¨a on oleellista seuraavassa luvussa. Tulosta kutsutaan tasaiseksi ergodisuudeksi ja se todistetaan Lauseessa 2.2. Tarvitaan kuitenkin useita lemmoja, jotta luvun

p(k)i,j −πj

yl¨araja voidaan kirjoittaa haluttuun muotoon. Lemma 2.2 todistuksineen on l¨ahteest¨a [3]. My¨os joissain luvun loppuosan tuloksissa on ep¨asuorasti hy¨odynnetty l¨ahdett¨a [3]

Lemma 2.2. OlkoonP = [pi,j]i,j=1,2,...,n siirtym¨atodenn¨ak¨oisyysmatriisi. T¨all¨oin kaikilla x∈Rn

maxi [P x]i−min

i [P x]i

1−2 min

i,j pi,j max

i xi−min

i xi

.

Todistus. Olkoon x ∈ Rn ja j0 ∈ {1,2, . . . , n} siten, ett¨a xj0 = minjxj. T¨all¨oin kaikilla i = 1,2, . . . , n

[P x]i= Xn j=1

pi,jxj =pi,j0xj0+X

j6=j0

pi,jxj≤pi,j0xj0+ max

j xj

X

j6=j0

pi,j

=pi,j0min

j xj+ max

j xj(1−pi,j0) = max

j xj−pi,j0

maxj xj−min

j xj

≤max

j xj−min

i,j pi,j

maxj xj−min

j xj

.

Erityisesti

maxi [P x]i≤max

j xj−min

i,j pi,j

maxj xj−min

j xj

. (4)

Vastaavasti arvioimalla n¨ahd¨a¨an, ett¨a kaikillai= 1,2, . . . , n mini [P x]i≥min

j xj+ min

i,j pi,j

maxj xj−min

j xj

. (5)

(12)

V¨aite n¨ahd¨a¨an todeksi yhdist¨am¨all¨a arviot (4) ja (5):

maxi [P x]i−min

i [P x]i

maxj xj−min

i,j pi,j

maxj xj−min

j xj

minj xj+ min

i,j pi,j

maxj xj−min

j xj

=

maxj xj−min

j xj

−2 min

i,j

maxj xj−min

j xj

=

1−2 min

i,j pi,j max

j xj−min

j xj

.

Seuraus 2.1. OlkoonP = [pi,j]i,j=1,2,...,n siirtym¨atodenn¨ak¨oisyysmatriisi. T¨all¨oin kaikilla x∈Rn ja k∈N

maxi

Pkx

i−min

i

Pkx

i

1−2 min

i,j pi,j k

maxi xi−min

i xi .

Todistus. Lemman 2.2 nojalla v¨aite p¨atee, kunk= 1. Oletetaan induktio-oletuksena, ett¨a maxi

Pkx

i−min

i

Pkx

i

1−2 min

i,j pi,j

k

maxi xi−min

i xi

jollakink∈N. Lemman 2.2 ja induktio-oletuksen nojalla saadaan, ett¨a maxi

Pk+1x

i−min

i

Pk+1x

i= max

i

P(Pkx)

i−min

i

P(Pkx)

i

1−2 min

i,j pi,j max

i

Pkx

i−min

i

Pkx

i

1−2 min

i,j pi,j 1−2 min

i,j pi,j k

maxi xi−min

i xi

1−2 min

i,j pi,j

k+1

maxi xi−min

i xi

.

Lemma 2.3. Olkoon P = [pi,j]i,j=1,2,...,n siirtym¨atodenn¨ak¨oisyysmatriisi siten, ett¨a Pm > 0 jollakinm∈N. Merkit¨a¨an

α= 1−2 min

i,j p(m)i,j . T¨all¨oin

(i) α∈[0,1[ja

(ii) on olemassa luvut C≥0 ja0≤β <1 siten, ett¨a α⌊mk⌋ ≤Cβk kaikillak∈N.

Todistus. KoskaPm>0, niin selv¨asti α <1. V¨aiteα≥0 seuraa osoittamalla, ett¨a mini,j p(m)i,j ≤1

2.

(13)

Tehd¨a¨an antiteesi: mini,jp(m)i,j > 12. Olkooti0, j0∈ {1,2, . . . , n} siten, ett¨a p(m)i0,j0 = min

i,j p(m)i,j . T¨all¨oin

1 = Xn k=1

p(m)i

0,k≥min

k p(m)i

0,k+ max

k p(m)i

0,k≥2 min

k p(m)i

0,k≥2 min

i,j p(m)i,j >1, mik¨a on ristiriita. Siisp¨aα∈[0,1[.

Kaikillak∈N

k= k

m

m+

k− k

m

m

| {z }

≤m−1

≤ k

m

m+ (m−1),

joten

k m ≤

k m

+m−1 m kaikillak∈N. Edelleen, koskaα∈[0,1[, niin kaikilla k∈N

αm1k

mk ≥α⌊mk+mm−1 =α⌊mk⌋αmm1, mist¨a

α⌊mk⌋ ≤ 1 αmm1

αm1k

kaikillak∈N. Voidaan siis valitaC= 1

αmm−1 jaβ=αm1.

Lemma 2.4. Olkoon P = [pi,j]i,j=1,2,...,n siirtym¨atodenn¨ak¨oisyysmatriisi siten, ett¨a Pm > 0 jollakinm∈N. T¨all¨oin on olemassa luvutC≥0 ja0≤β <1siten, ett¨a

maxi p(k)i,j −min

i p(k)i,j ≤Cβk kaikillaj= 1,2, . . . , n ja kaikillak∈N.

Todistus. Merkit¨a¨an

α= 1−2 min

i,j p(m)i,j .

Lemman 2.3 nojalla on olemassa luvutC≥0 ja 0≤β <1 siten, ett¨a α⌊mk⌋ ≤Cβk

kaikillak∈N. Kiinnitet¨a¨anj∈ {1,2, . . . , n}jak∈N. Koska kaikillai= 1,2, . . . , n Pkej

i= Xn l=1

p(k)i,lej,l=p(k)i,j, niin

minp(k)= min Pke

ja maxp(k)= max Pke

.

(14)

Siisp¨a Lausetta A.3 k¨aytt¨am¨all¨a saadaan, ett¨a maxi p(k)i,j −min

i p(k)i,j = max

i

Pkej

i−min

i

Pkej

i

= max

i

h

P⌊mkm+(k−mkm)ej

i

i−min

i

h

P⌊mkm+(k−mkm)ej

i

i

= max

i

h

P⌊mkmPk−mkmeji

i−min

i

h

P⌊mkmPk−mkmeji

i

= max

i

h(Pm)⌊mk

Pkmkmej

i

i−min

i

h(Pm)⌊mk

Pkmkmej

i

i

1−2 min

i,j p(m)i,jmk

maxi

hPkmkmeji

i−min

i

hPkmkmeji

i

=

1−2 min

i,j p(m)i,j

mk

maxi p(kmkm)

i,j −min

i p(kmkm)

i,j

| {z }

1

1−2 min

i,j p(m)i,jmk

=α⌊mk

≤Cβk.

Lause 2.2. OlkoonP = [pi,j]i,j=1,2,...,n siirtym¨atodenn¨ak¨oisyysmatriisi siten, ett¨aPm>0jolla- kinm∈N, ja olkoon π∈Rn matriisin P invariantti jakauma. T¨all¨oin on olemassa luvutC≥0 ja 0≤β <1 siten, ett¨a

p(k)i,j −πj ≤Cβk kaikillai, j= 1,2, . . . , n jak∈N.

Todistus. Koskaπon siirtym¨atodenn¨ak¨oisyysmatriisinP invariantti jakauma, niin π=πP.

T¨ast¨a seuraa induktiolla, ett¨a

π=πPk

kaikillak∈N. N¨ain ollen kaikillaj= 1,2, . . . , njak∈Np¨atee, ett¨a πj=

πPk

j= Xn i=1

πip(k)i,j ≤max

i p(k)i,j Xn i=1

πi= max

i p(k)i,j ja

πj= πPk

j = Xn i=1

πip(k)i,j ≥min

i p(k)i,j Xn

i=1

πi= min

i p(k)i,j. Lemman 2.4 nojalla on olemassa luvutC≥0 ja 0≤β <1 siten, ett¨a

maxi p(k)i,j −min

i p(k)i,j ≤Cβk

(15)

kaikillaj = 1,2, . . . , njak∈N. Olkooti, j= 1,2, . . . , njak∈Nmit¨a tahansa. Koska mini p(k)i,j ≤πj≤max

i p(k)i,j ≤min

i p(k)i,j +Cβk ja

mini p(k)i,j ≤p(k)i,j ≤max

i p(k)i,j ≤min

i p(k)i,j +Cβk, niinπj, p(k)i,j ∈h

minip(k)i,j,minip(k)i,j +Cβki . Siisp¨a

p(k)i,j −πj

≤Cβk.

(16)

3 Markovin ketju Monte Carlo -simulointi

Olkoon π ∈ Rn jakauma joukolla S = {s1, s2, . . . , sn}, f : S → R funktio ja X : Ω → S satunnaismuuttuja, joka noudattaa jakaumaaπ. Halutaan selvitt¨a¨a odotusarvo

Eπf :=Eπf(X) = Xn i=1

f(sii, miss¨af(X) on kuvaustenf :S→RjaX: Ω→S yhdistetty kuvaus

f(X) : Ω→R, f(X)(ω) =f(X(ω)).

Jos tieto jakaumasta π on puutteellista tain on hyvin suuri, niin odotusarvoa ei voi selvitt¨a¨a suoraan laskemalla. T¨all¨oin on kuitenkin usein mahdollista konstruoida Markovin ketju (Xk)k=0, jonka siirtym¨atodenn¨ak¨oisyysmatriisinP invariantti jakauma onπ. JosPm>0 jollakinm∈N, voi odotusarvoaEπf approksimoida satunnaisluvulla

1 k

Xk i=1

f(Xi),

kunk∈Non riitt¨av¨an suuri. T¨at¨a kutsutaan Markovin ketju Monte Carlo -simuloinniksi ja sen k¨aytt¨o perustellaan Lauseessa 3.1.

Otetaan k¨aytt¨o¨on seuraavat merkinn¨at: Olkoon (Xk)k=0Markovin ketju ¨a¨arellisell¨a tila-avaruu- dellaS ={s1, s2, . . . , sn} ja olkoon ketjun taustalla oleva todenn¨ak¨oisyysavaruus (Ω,F,P). Jos i∈ {1,2, . . . , n}siten, ett¨aP(X0=si)>0 jaA∈ F, merkit¨a¨an

Pi(A) =P(A|X0=si). Lis¨aksi, josg: Ω→Ron funktio, merkit¨a¨an

Eig=E[g|X0=si].

Lemma 3.1. Olkoon(Xk)k=0 Markovin ketju tila-avaruudellaS={s1, s2, . . . , sn} jaf :S→R funktio. Oletetaan, ett¨a ketjun siirtym¨atodenn¨ak¨oisyysmatriisilleP = [pi,j]i,j=1,2,...,n p¨ateePm>

0jollakinm∈Nja ett¨aπ∈Rnon matriisinP invariantti jakauma. T¨all¨oin, josP(X0=si)>0, niin

klim→∞

1 k2

Xk j=1

Ei(f(Xj)−Eπf)2= 0.

Todistus. Kaikillaj∈N Ei(f(Xj)−Eπf)2=

Xn l=1

(f(sl)−Eπf)2Pi(Xj =sl)

≤ max

m=1,2,...,n(f(sm)−Eπf)2 Xn l=1

Pi(Xj =sl) = max

m=1,2,...,n(f(sm)−Eπf)2,

(17)

joten

0≤ 1 k2

Xk j=1

Ei(f(Xj)−Eπf)2≤ 1 k2

Xk j=1

m=1,2,...,nmax (f(sm)−Eπf)2

= 1

k2k· max

m=1,2,...,n(f(sm)−Eπf)2= 1

k· max

m=1,2,...,n(f(sm)−Eπf)2→0, kunk→ ∞.

Lemma 3.2. Olkoon(Xk)k=0 Markovin ketju tila-avaruudellaS={s1, s2, . . . , sn} jaf :S→R funktio. Oletetaan, ett¨a ketjun siirtym¨atodenn¨ak¨oisyysmatriisilleP = [pi,j]i,j=1,2,...,n p¨ateePm>

0jollakinm∈Nja ett¨aπ∈Rnon matriisinP invariantti jakauma. T¨all¨oin, josP(X0=si)>0, niin

klim→∞

2 k2

Xk j=1

j−1

X

l=1

Ei(f(Xj)−Eπf) (f(Xl)−Eπf) = 0.

Todistus. Merkit¨a¨an

f¯=f−Eπf, jolloin v¨aitteen¨a on

klim→∞

2 k2

Xk j=1

j−1

X

l=1

Eif¯(Xj) ¯f(Xl) = 0.

Huomataan, ett¨a kaikillal∈Njai= 1,2, . . . , n Xn

v=1

Xn u=1

f¯(sv) ¯f(suvp(l)i,u= Xn v=1

f¯(svv

Xn u=1

f¯(su)p(l)i,u

= Xn v=1

(f(sv)−Eπf)πv

Xn u=1

f(s¯ u)p(l)i,u

= Xn v=1

f(svv−Eπf Xn v=1

πv

! n X

u=1

f¯(su)p(l)i,u

= (Eπf−Eπf) Xn u=1

f¯(su)p(l)i,u

= 0.

Olkooni∈ {1,2, . . . , n} mik¨a tahansa siten, ett¨aP(X0=si)>0. Olkoot edelleenj, l ∈Nmit¨a tahansa siten, ett¨al < j. Lemman A.1 nojalla

P(Xj =sv, Xl=su|X0=si) =P(Xj=sv|Xl=su, X0=si)P(Xl=su|X0=si), kunP(Xl=su, X0=si)>0. Lauseen A.2 nojalla puolestaan

P(Xj =sv|Xl=su, X0=si) =P(Xj=sv|Xl=su),

(18)

kun P(Xl=su, X0=si) > 0. Kun viel¨a huomataan, ett¨a ehdosta P(Xl=su|X0=si) > 0 seuraa, ett¨aP(Xl=su, X0=si) =P(Xl=su|X0=si)P(X0=si)>0, saadaan, ett¨a

Ei f¯(Xj) ¯f(Xl)

= Xn v=1

Xn u=1

f¯(sv) ¯f(su)Pi(Xj =sv, Xl=su)

= Xn v=1

Xn u=1

f¯(sv) ¯f(su)P(Xj=sv, Xl=su|X0=si)

= Xn v=1

X

u:P(Xl=su|X0=si)>0

f¯(sv) ¯f(su)P(Xj=sv, Xl=su|X0=si)

= Xn v=1

X

u:P(Xl=su|X0=si)>0

f¯(sv) ¯f(su)P(Xj=sv|Xl=su, X0=si)P(Xl=su|X0=si)

= Xn v=1

X

u:P(Xl=su|X0=si)>0

f¯(sv) ¯f(su)P(Xj=sv|Xl=su)P(Xl=su|X0=si)

()

= Xn v=1

X

u:P(Xl=su|X0=si)>0

f¯(sv) ¯f(su)p(j−l)u,v P(Xl=su|X0=si)

= Xn v=1

Xn u=1

f¯(sv) ¯f(su)p(ju,vl)P(Xl=su|X0=si)

(∗∗)

= Xn v=1

Xn u=1

f¯(sv) ¯f(su)p(j−l)u,v p(l)i,u

= Xn v=1

Xn u=1

f¯(sv) ¯f(su)p(ju,vl)p(l)i,u− Xn v=1

Xn u=1

f¯(sv) ¯f(suvp(l)i,u

| {z }

=0

= Xn v=1

Xn u=1

f¯(sv) ¯f(su)

p(ju,vl)−πv

p(l)i,u. (6)

Kohdissa (∗) ja (∗∗) k¨aytettiin Lausetta A.1. Huomaa kohdassa (∗), ett¨a P(Xl=su)≥P(Xl=su, X0=si)>0,

joten Lauseen A.1 k¨aytt¨o on mahdollista. Lauseen 2.2 nojalla on olemassa luvut C ≥ 0 ja 0≤β <1 siten, ett¨a

p(k)i,j −πj

≤Cβk

kaikillai, j= 1,2, . . . , njak∈N, joten yht¨al¨ost¨a (6) seuraa, ett¨a Eif¯(Xj) ¯f(Xl)

≤ Xn v=1

Xn u=1

f¯(sv)

f¯(su)

p(j−l)u,v −πv

p(l)i,u

≤ Xn v=1

f¯(sv)

! n X

u=1

f¯(su)

! C

| {z }

=:M

βj−l

=M βj−l.

(19)

N¨ain ollen

−2 k2

Xk j=1

j−1

X

l=1

M βjl≤ 2 k2

Xk j=1

j−1

X

l=1

Ei f¯(Xj) ¯f(Xl)

≤ 2 k2

Xk j=1

j−1

X

l=1

M βjl,

joten riitt¨a¨a osoittaa, ett¨a

k→∞lim 2 k2

Xk j=1

j1

X

l=1

M βj−l= 0.

Koska 0≤β <1, niin

X l=1

βl<∞. Kaikillak∈N

0≤ 2 k2

Xk j=1

j−1

X

l=1

M βj−l= 2M k2

Xk j=1

j−1

X

l=1

βl

= 2M k2

k1

X

l=1

(k−l)βl≤ 2M k2

k1

X

l=1

l≤ 2M k

X l=1

βl→0, kunk→ ∞.

Seuraava lause kertoo, ett¨a Markovin ketju Monte Carlo -simulointi toimii. Lauseen muotoiluun on otettu mallia l¨ahteest¨a [1], mutta todistus ei seuraa lainkaan l¨ahteen todistusta. Itse asiassa l¨ahteess¨a [1] todistetaan vahvempi tulos: Lauseen 3.1 tilanteessa

Pi

lim

k→∞

1 k

Xk j=1

f(Xj) =Eπf

= 1.

Lause 3.1. Olkoon (Xk)k=0 Markovin ketju tila-avaruudella S ={s1, s2, . . . , sn} ja olkoon f : S → R funktio. Jos ketjun siirtym¨atodenn¨ak¨oisyysmatriisille P = [pi,j]i,j=1,2,...,n p¨atee, ett¨a Pm > 0 jollakin m ∈ N, niin kaikilla ε > 0 ja kaikilla i = 1,2, . . . , n, joille P(X0=si) > 0, p¨atee, ett¨a

klim→∞

Pi

 1 k

Xk j=1

f(Xj)−Eπf

> ε

= 0, miss¨aπon matriisinP invariantti jakauma.

(20)

Todistus. Olkoonε >0 mik¨a tahansa. Merkit¨a¨an ¯f =f−Eπf ja huomataan, ett¨a kaikillak∈N

1 k

Xk j=1

f(Xj)−Eπf

2

=

1 k

Xk j=1

(f(Xj)−Eπf)

2

= 1 k2

 Xk j=1

f¯(Xj)

2

= 1 k2

Xk j=1

f(X¯ j) Xk

l=1

f¯(Xl) = 1 k2

Xk j=1

Xk l=1

f¯(Xj) ¯f(Xl)

= 1 k2

Xk j=1

j1

X

l=1

f¯(Xj) ¯f(Xl) + ¯f(Xj)2+ Xk l=j+1

f¯(Xj) ¯f(Xl)

= 1 k2

Xk j=1

f(X¯ j)2+ 1 k2

Xk j=1

j1

X

l=1

f¯(Xj) ¯f(Xl) + 1 k2

Xk j=1

Xk l=j+1

f¯(Xj) ¯f(Xl)

= 1 k2

Xk j=1

f(X¯ j)2+ 2 k2

Xk j=1

j1

X

l=1

f¯(Xj) ¯f(Xl).

N¨ain ollen lemmojen 3.1 ja 3.2 ja Markovin ep¨ayht¨al¨on1nojalla

Pi

 1 k

Xk j=1

f(Xj)−Eπf

> ε

=Pi

 1 k

Xk j=1

f(Xj)−Eπf

2

> ε2



≤ Ei

1k

Pk

j=1f(Xj)−Eπf

2

ε2

= Ei

1 k2

Pk

j=1f¯(Xj)2+k22

Pk j=1

Pj1

l=1f¯(Xj) ¯f(Xl) ε2

= 1

k2ε2 Xk j=1

Eif¯(Xj)2+ 2 k2ε2

Xk j=1

j1

X

l=1

Ei f¯(Xj) ¯f(Xl)

→0, kunk→ ∞.

Jotta Lause 3.1 olisi hy¨odyllinen, t¨aytyy annetulle jakaumalle π ∈ Rn osata konstruoida siir- tym¨atodenn¨ak¨oisyysmatriisiP = [pi,j]i,j=1,2,...,n, jolle p¨atee, ett¨a

(i) πP =πja

(ii) Pm>0 jollakinm∈N.

1Markovin ep¨ayht¨al¨o: JosX on ei-negatiivinen satunnaismuuttuja jaλ >0, niinP(Xλ) E(λX).

(21)

Ehto (i) saadaan voimaan, kun vaaditaan, ett¨a matriisiP on k¨a¨antyv¨a jakaumanπsuhteen.

M¨a¨aritelm¨a 3.1. Siirtym¨atodenn¨ak¨oisyysmatriisi P = [pi,j]i,j=1,2,...,n on k¨a¨antyv¨a jakauman π∈Rn suhteen, jos

πipi,jjpj,i kaikillai, j= 1,2, . . . , n. (7) Markovin ketju(Xk)k=0on k¨a¨antyv¨a jakaumanπsuhteen, jos sen siirtym¨atodenn¨ak¨oisyysmatriisi on k¨a¨antyv¨a jakaumanπ suhteen.

Lause 3.2. OlkoonP = [pi,j]i,j=1,2,...,n siirtym¨atodenn¨ak¨oisyysmatriisi, joka on k¨a¨antyv¨a jakau- man π∈Rn suhteen. T¨all¨oin πon matriisinP invariantti jakauma.

Todistus. Kaikillaj= 1,2, . . . , n [πP]j=

Xn i=1

πipi,j= Xn i=1

πjpj,ij Xn i=1

pj,ij, jotenπP =π.

Yht¨al¨o (7) ei kiinnit¨a matriisin P alkioita, vaan ne t¨aytyy m¨a¨ar¨at¨a muilla keinoilla. Ajatel- laan Markovin ketjun siirtym¨a tilasta toiseen kaksivaiheisena tapahtumana: Jos ollaan tilassa si, ehdotetaan uutta tilaa sj 6= si todenn¨ak¨oisyydell¨a gi,j. Ehdotettu tila sj hyv¨aksyt¨a¨an to- denn¨ak¨oisyydell¨aai,j. Jos uuden tilan ehdottaminen ja hyv¨aksyminen ovat toisistaan riippumat- tomia, niin todenn¨ak¨oisyys siirty¨a tilastasi tilaansj on

pi,j=ai,jgi,j. Todenn¨ak¨oisyys pysy¨a tilassasi on

1−X

j6=i

pi,j= 1−X

j6=i

ai,jgi,j.

Oletetaan, ett¨a ehdokastilojen jakaumat gi = (gi,1, gi,2, . . . , gi,n) ∈ Rn, i = 1,2, . . . , n, on jo valittu siten, ett¨agi>0 kaikillai= 1,2, . . . , n. Teht¨av¨aksi j¨a¨a valita tilojen hyv¨aksymistodenn¨a- k¨oisyydetai,j,i, j= 1,2, . . . , n, niin, ett¨a k¨a¨antyvyysehto (7) toteutuu. Jakaumastaπoletetaan, ett¨aπ >0.

M¨a¨aritelm¨a 3.2. Valitsemalla

ai,j=aMHi,j = min

1,πjgj,i

πigi,j

kaikillai, j= 1,2, . . . , n, joillei6=j, saadaan Metropolis–Hastings -algoritmi, jonka siirtym¨ato- denn¨ak¨oisyysmatriisi onPMH=

pMHi,j

i,j=1,2,...,n, miss¨a pMHi,j =aMHi,j gi,j, kun i6=j, ja

pMHi,i = 1−X

j6=i

pMHi,j .

Viittaukset

LIITTYVÄT TIEDOSTOT

[r]

Matematiikan perusmetodit I/Sov.. Harjoitus 9,

[r]

[r]

Todista

Matematiikan perusmetodit I/soveltajat Harjoitus 3, syksy

Kolmion korkeusjanan CD piste P on va- littu niin, ett¨ a kun AP leikkaa BC :n pisteess¨ a E ja BP AC :n pisteess¨ a F , niin kolmion ABP sis¨ aympyr¨ an s¨ ade on sama kuin

Kolmion korkeusjanan CD piste P on va- littu niin, ett¨ a kun AP leikkaa BC :n pisteess¨ a E ja BP AC :n pisteess¨ a F , niin kolmion ABP sis¨ aympyr¨ an s¨ ade on sama kuin