Markovin ketju Monte Carlo -simulointi ja Peskunin järjestys

(1)

Markovin ketju Monte Carlo -simulointi ja Peskunin j¨ arjestys

Santeri Parkkinen

Matematiikan pro gradu -tutkielma Jyv¨ askyl¨ an yliopisto

Matematiikan ja tilastotieteen laitos

Kev¨ at 2019

(2)

Tiivistelm¨ a

Jyv¨askyl¨an yliopisto

Matematiikan ja tilastotieteen laitos Matematiikan pro gradu -tutkielma

Markovin ketju Monte Carlo -simulointi ja Peskunin j¨arjestys, 42 s., liitteit¨a 19 s.

Santeri Parkkinen Toukokuu 2019

Tämän tutkielman tavoitteena on esitellä Markovin ketju Monte Carlo -simulointi äärellisessä tila-avaruudessa ja käsitellä simulointialgoritmien vertailuun liittyvää ongelmaa. Markovin ketju Monte Carlo -simuloinnissa funktion odotusarvolle lasketaan approksimaatioita simuloitua Markovin ketjua apuna käyttäen. Usein simulointi voidaan tehdä useammalla kuin yhdellä algo- ritmilla ja halutaan selvittää, mikä algoritmi soveltuu tehtävään parhaiten.

Kun simulaatioaskelten määrä lähestyy ääretöntä, Markovin ketju Monte Carlo -estimaatti sup- penee melkein varmasti kohti odotusarvon oikeaa arvoa käytetystä simulointialgoritmista riippu- matta. Käytännössä Markovin ketju Monte Carlo -simulointi tuottaa kuitenkin vain odotusarvon approksimaation, koska mikään todellinen simulointi ei voi jatkua äärettömän pitkään. Vain

äärellisen monen simulaatioaskeleen käyttö aiheuttaa virheen, joka on luonteeltaan satunnainen:

virhe kuuluu tietylle välille jollakin todennäköisyydellä. On luonnollista kysyä, miten approksimaation tarkkuus riippuu simulointialgoritmista. Kaikki algoritmit antavat odotusarvolle arvion halutulla tarkkuudella, jos simulointia jatketaan riittävän kauan. Jotkut algoritmit tuottavat kuitenkin tarkkoja approksimaatioita nopeammin kuin toiset, mikä on motivaatio algoritmien vertailulle. Ei kuitenkaan ole aivan selvää, miten vertailu pitäisi käytännössä tehdä. Halutun tarkkuuden saavuttamiseksi vaadittavaa aikaa on vaikea arvioida, eivätkä pelkät arviot edes ole riittävä perusta algoritmien vertailulle. Voi esimerkiksi käydä niin, että arvioitu alaraja algo- ritminP vaatimalle ajalle on pienempi kuin alaraja algoritminQvaatimalle ajalle, mutta silti algoritmi Qpääsee haluttuun tarkkuuteen nopeammin kuin algoritmi P. Pelkät alarajat eivät siis kerro tarpeeksi vaadittavien aikojen todellisista arvoista. Arvioiden sijaan tarvitaan jokin eksakti riippuvuus simulointivirheen ja algoritmin välille.

Kriteeri, jonka suhteen algoritmien vertailu tehdään, johdetaan Markovin ketjujen keskeistä raja- arvolausetta käyttäen. Keskeinen raja-arvolause mahdollistaa simulointivirheiden todennäköi- syyksien raja-arvon eksaktin laskemisen tietyssä erikoistapauksessa. Tarkastelu osoittaa, että algoritmien vertailemiseksi kannattaa tutkia niiden asymptoottisia variansseja: kahdesta algo- ritmista se, jonka asymptoottinen varianssi annetulle funktiolle on pienempi, soveltuu parem- min kyseisen funktion odotusarvon simulointiin. Kriteerin ongelmana on, että sen soveltaminen ei ole ihan suoraviivaista. Käytännössä algoritmeista tiedetään vain niiden siirtymätodennäköi- syysmatriisit, joten algoritmien vertailemiseksi täytyy selvittää, miten asymptoottinen varianssi riippuu siirtymätodennäköisyysmatriisista. Tässä tutkielmassa tarkastelu rajataan kääntyviin Markovin ketjuihin, jolloin kyseinen riippuvuus voidaan selvittää funktionaalianalyysin tuloksia hyödyntäen. Tämän jälkeen vertailu onnistuu tietyssä erikoistapauksessa Peskunin järjestystä käyttämällä. Peskunin järjestyksen sovelluksena osoitetaan, että Metropolis–Hastings -algoritmi on parempi kuin Barkerin algoritmi.

(3)

Sis¨ alt¨ o

1 Markovin ketju äärellisessä tila-avaruudessa 4

2 Invariantti jakauma ja tasainen ergodisuus 6

3 Markovin ketju Monte Carlo -simulointi 13

4 Siirtymätodennäköisyysmatriisin ominaisvektorit

ja -arvot 25

5 Peskunin j¨arjestys ja asymptoottisten varianssien vertailu 30

Liite A Markovin ketjujen perustuloksia 42

Liite B Funktionaalianalyysin tuloksia 50

Liite C Kroneckerin lemma 59

Viitteet 61

(4)

Johdanto

Stokastiikassa ja sen sovelluksissa usein vastaan tuleva ongelma on satunnaismuuttujan odotusarvon laskeminen. Aina odotusarvoa ei käytännössä ole mahdollista laskea suoraan satunnaismuuttujan jakaumaa käyttäen edes tapauksessa, jossa satunnaismuuttujan tila-avaruus tiedetään

äärelliseksi. Ongelmia ilmenee, jos tila-avaruus on hyvin suuri tai jos jakauman normitusvakio- ta ei tunneta. Tällaisissa tilanteissa on kuitenkin usein mahdollista approksimoida odotusarvoa Markovin ketju Monte Carlo -simuloinniksi kutsuttua menetelmää käyttäen vieläpä niin, että simulointialgoritmi voidaan valita useasta eri vaihtoehdosta. Tämän tutkielman tavoitteena on esitellä Markovin ketju Monte Carlo -simulointi äärellisessä tila-avaruudessa sekä käsitellä algoritmien vertailuun liittyvää ongelmaa.

Kun simulaatioaskelten määrä lähestyy ääretöntä, Markovin ketju Monte Carlo -estimaatti sup- penee melkein varmasti kohti odotusarvon oikeaa arvoa käytetystä simulointialgoritmista riippu- matta. Käytännössä Markovin ketju Monte Carlo -simulointi tuottaa kuitenkin vain odotusarvon approksimaation, koska mikään todellinen simulointi ei voi jatkua äärettömän pitkään. Vain

äärellisen monen simulaatioaskeleen käyttö aiheuttaa virheen, joka on luonteeltaan satunnainen:

virhe kuuluu tietylle välille jollakin todennäköisyydellä. On luonnollista kysyä, miten approksimaation tarkkuus riippuu simulointialgoritmista. Kaikki algoritmit antavat odotusarvolle arvion halutulla tarkkuudella, jos simulointia jatketaan riittävän kauan. Jotkut algoritmit tuottavat kuitenkin tarkkoja approksimaatioita nopeammin kuin toiset, mikä on motivaatio algoritmien vertailulle. Ei kuitenkaan ole aivan selvää, miten vertailu pitäisi käytännössä tehdä. Halutun tarkkuuden saavuttamiseksi vaadittavaa aikaa on vaikea arvioida, eivätkä pelkät arviot edes ole riittävä perusta algoritmien vertailulle. Voi esimerkiksi käydä niin, että arvioitu alaraja algo- ritminP vaatimalle ajalle on pienempi kuin alaraja algoritminQvaatimalle ajalle, mutta silti algoritmi Qpääsee haluttuun tarkkuuteen nopeammin kuin algoritmi P. Pelkät alarajat eivät siis kerro tarpeeksi vaadittavien aikojen todellisista arvoista. Arvioiden sijaan tarvitaan jokin eksakti riippuvuus simulointivirheen ja algoritmin välille.

Osoittautuu, että tietyssä erikoistapauksessa Markovin ketjujen keskeinen raja-arvolause mahdollistaa simulointivirheiden todennäköisyyksien raja-arvon eksaktin määrittämisen. Tarkaste- lun seurauksena nähdään, että algoritmien vertailemiseksi kannattaa tutkia niiden asymptoottisia variansseja: jos algoritmin P asymptoottinen varianssi funktiolle f on pienempi tai yhtä suuri kuin algoritmin Q asymptoottinen varianssi funktiolle f, niin algoritmi P on parempi funktionf odotusarvon simulointiin kuin algoritmiQ. Tällaisen vertailun tekeminen ei kuitenkaan ole aivan ongelmatonta. Lähtökohtaisesti simulointialgoritmeista tiedetään nimittäin vain niiden siirtymätodennäköisyysmatriisit, joten täytyy selvittää, miten algoritmin asymptoottinen varianssi funktiolle f riippuu siirtymätodennäköisyysmatriisista. Tässä tutkielmassa tarkastelu rajataan kääntyviin Markovin ketjuihin, jolloin kyseinen riippuvuus voidaan selvittää funktionaalianalyysin työkaluja apuna käyttäen. Päädytään lauseeseen, joka on sikäli ongelmallinen, että tyypillisessä Markovin ketju Monte Carlo -simuloinnin sovelluksessa käytössä olevat tie- dot eivät riitä algoritmien vertailuun. Ongelman ratkaisi Peter Peskun, joka keksi, miten kahden algoritmin asymptoottisten varianssien suuruusjärjestys voidaan erikoistapauksessa päätellä suoraan siirtymätodennäköisyysmatriisien alkioita tutkimalla. Oletetaan, että algoritmeja P ja Q vastaavat siirtymätodennäköisyysmatriisit ovat kääntyviä saman invariantin jakauman suhteen.

Peskun osoitti, että jos algoritmia P vastaavan matriisin kaikki alkiot – diagonaalialkioita lu- kuun ottamatta – ovat suurempia tai yhtä suuria kuin algoritmia Qvastaavan matriisin alkiot, niin algoritmin P asymptoottinen varianssi funktiolle f on pienempi tai yhtä suuri kuin algo- ritminQ asymptoottinen varianssi funktiolle f. Johtopäätös on sama kaikille funktioille, joten tästä seuraa, että algoritmiP on parempi kuin algoritmiQminkä tahansa funktion odotusarvon

(5)

approksimointiin. Nykyisin matriisin alkioita koskevaa ehtoa kutsutaan Peskunin j¨arjestykseksi.

Lauseensa sovelluksena Peskun osoitti, ett¨a Metropolis–Hastings -algoritmi on parempi kuin Bar- kerin algoritmi.

Tutkielman esitietoina lukijalta edellytetään todennäköisyysteorian, lineaarialgebran ja funktionaalianalyysin perusteiden tunteminen. Markovin ketjujen tunteminen sen sijaan ei ole aivan välttämätöntä, sillä tarvittava määrä teoriaa sisältyy tutkielmaan. Kannattaa kuitenkin huoma- ta, että Markovin ketjujen perusominaisuuksia käsitellään vain liitteessä A, ja varsinainen teksti keskittyy niihin tuloksiin, jotka tarvitaan Markovin ketju Monte Carlo -simuloinnin esittämiseen.

My¨os funktionaalianalyysist¨a on melko kattava liite.

Rakenteeltaan tutkielma on seuraavanlainen: Luvussa 1 määritellään siirtymätodennäköisyys- matriisi ja Markovin ketju äärellisessä tila-avaruudessa. Luvussa 2 käydään läpi Markovin ketju Monte Carlo -simuloinnin esittämiseen tarvittavia pohjatietoja. Keskeisiä käsitteitä ovat invariantti jakauma ja tasainen ergodisuus. Luvussa 3 perustellaan, miksi Markovin ketju Monte Carlo -simulointi toimii. Lisäksi määritellään Metropolis–Hastings -algoritmi ja Barkerin algoritmi ja osoitetaan, että ne ovat kääntyviä invariantin jakaumansa suhteen. Lopuksi pohjustetaan algoritmien vertailuun liittyvää ongelmaa. Luku 4 käsittelee siirtymätodennäköisyysmatriisien ominaisvektoreita ja -arvoja. Tämä tarkastelu on tarpeen, jotta luvussa 5 voidaan hyödyntää funktionaalianalyysin tuloksia asymptoottisen varianssin tutkimiseen. Luvussa 5 tehtävien tar- kastelujen tuloksena saadaan lause, joka kertoo, miten asymptoottinen varianssi riippuu simulointialgoritmista. Luvussa 5 esitellään myös Peskunin järjestys ja selvitetään, miten se liittyy asymptoottisten varianssien ja algoritmien vertailuun. Lopuksi Peskunin järjestyksen sovelluksena osoitetaan, että Metropolis–Hastings -algoritmi on parempi kuin Barkerin algoritmi.

(6)

Merkint¨ oj¨ a

• N₀={0,1,2, . . .}

• N={1,2,3, . . .}

• Z={. . . ,−2,−1,0,1,2, . . .}

• Olkoon P = [pi,j]i,j=1,2,...,n neli¨omatriisi sek¨a k∈N. Potenssimatriisin P^k alkio paikassa (i, j) onp^(k)_i,j.

• OlkoonP = [pi,j] matriisi.

– Josp_i,j≥0 kaikillaijaj, merkit¨a¨anP ≥0.

– Josp_i,j>0 kaikillaijaj, merkit¨a¨anP >0.

• Olkoonx= (x1, x2, . . . , x_n)∈Rⁿ vektori.

– Josxi≥0 kaikillai= 1,2, . . . , n, merkit¨a¨an x≥0.

– Josxi>0 kaikillai= 1,2, . . . , n, merkit¨a¨an x >0.

• Avaruuden Rⁿ luonnollisia kantavektoreita merkit¨a¨an tunnuksilla ei,i= 1,2, . . . , n. Vek- torinei j.komponentti on siis

e_i,j=

(1, josj=i 0, josj6=i .

• Avaruuden Rⁿ nollavektorille käytetään merkintää ¯0.

• OlkoonS joukko. JoukonS osajoukkojen kokoelmaa merkit¨a¨an P(S) ={A|A⊂S}.

• Josx∈R, niin

⌊x⌋= max{n∈Z:n≤x}.

(7)

1 Markovin ketju ¨ a¨ arellisess¨ a tila-avaruudessa

Tässä luvussa määritellään siirtymätodennäköisyysmatriisi ja Markovin ketju äärellisessä tila- avaruudessa. Karkeasti ottaen Markovin ketju on jono satunnaismuuttujiaXk : Ω→S, jolla on se ominaisuus, että jokaisella ajanhetkelläk ∈N₀ todennäköisyys siirtyä tilasta Xk =x tilaan X_k+1=yriippuu vain ketjun nykytilastaX_k =x, mutta ei siitä, miten nykytilaan on päädytty.

SatunnaismuuttujatX0, X1, . . . , X_k−1eiv¨at siis vaikuta siirtym¨an X_k=x→Xk+1=y

todennäköisyyteen. Siirtymätodennäköisyysmatriisi puolestaan kirjaa kyseisten siirtymien to- dennäköisyydet matriisin muotoon. Tämä on mahdollista, kun ketjun tila-avaruus S on äärel- linen, ja erittäin hyödyllistä, koska siirtymätodennäköisyysmatriisin avulla Markovin ketjujen tutkiminen palautuu pitkälti matriisien tutkimiseen. Seuraavat määritelmät ovat lähteestä [1].

Määritelmä 1.1. NeliömatriisiP = [pi,j]i,j=1,2,...,n on siirtymätodennäköisyysmatriisi, jos (i) P ≥0

(ii) Pn

j=1p_i,j= 1kaikillai= 1,2, . . . , n.

Jos P = [pi,j]i,j=1,2,...,n on siirtymätodennäköisyysmatriisi, niin induktiolla on helppo todeta, että kaikilla k∈Nmyös potenssimatriisi P^k =h

p^(k)_i,ji

i,j=1,2,...,n on siirtymätodennäköisyysmat- riisi.

Määritelmä 1.2. Olkoon(Ω,F,P) todennäköisyysavaruus,S={s1, s2, . . . , sn} ⊂Rja P = [pi,j]i,j=1,2,...,n siirtymätodennäköisyysmatriisi. Jono(Xk)^∞_k=0 satunnaismuuttujia

Xk: Ω→S

on Markovin ketju, jonka siirtymätodennäköisyysmatriisi onP, jos

(i) P(Xk+1=xk+1|Xk =xk, Xk−1=xk−1, . . . , X0=x0) = P(Xk+1=xk+1|Xk=xk) kaikil- la k∈N₀ ja kaikilla x₀, x₁, . . . , x_k+1∈S, joille

P(X0=x0, X1=x1, . . . , X_k =x_k)>0

(ii) P(Xk+1=s_j|X_k =s_i) =p_i,j kaikillai, j= 1,2, . . . , nja k∈N₀, joilleP(Xk=s_i)>0.

SatunnaismuuttujanX0jakaumaa kutsutaan Markovin ketjun(Xk)^∞_k=0alkujakaumaksi ja joukkoa S kutsutaan ketjun tila-avaruudeksi.

Jatkossa oletetaan, että Markovin ketjun tila-avaruus on reaalilukujen osajoukko, jossa on aina vähintään kaksi alkiota. Erityisesti siirtymätodennäköisyysmatriisi on aina vähintään kokoa 2×2.

Olkoon (Xk)^∞_k=0 Markovin ketju tila-avaruudella S = {s1, s2, . . . , sn} ja olkoon ketjun siir- tymätodennäköisyysmatriisiP = [pi,j]i,j=1,2,...,n. Samaistetaan satunnaismuuttujanXkjakauma

µ_k :S→[0,1], µk(x) =P(Xk =x), vektorin

µ^(k)=

µ^(k)₁ , µ^(k)₂ , . . . , µ^(k)_n

∈Rⁿ

(8)

kanssa, miss¨a

µ^(k)_i =µk(si) =P(Xk=si) kaikillai= 1,2, . . . , n.

OlkoonJ niiden indeksienj= 1,2, . . . , njoukko, joille p¨atee, ett¨a P(Xk =sj)>0.

T¨all¨oin kaikillal= 1,2, . . . , n

µ^(k+1)_l =P(Xk+1=sl) =P



{Xk+1=sl} ∩



 [n j=1

{Xk=sj}









=P



 [n j=1

({Xk+1=s_l} ∩ {X_k=s_j})



= Xn j=1

P(Xk+1=s_l, X_k=s_j)

=X

j∈J

P(Xk+1=s_l, X_k =s_j) =X

j∈J

P(Xk=s_j)P(Xk+1=s_l|X_k=s_j)

=X

j∈J

P(Xk =s_j)p_j,l= Xn j=1

P(Xk=s_j)p_j,l= Xn j=1

µ^(k)_j p_j,l=h µ^(k)Pi

l. (1)

Näin ollen vektorimuodossa pätee, että

µ^(k+1)=µ^kP. (2)

Yhtälöstä (2) seuraa helposti induktiolla, että

µ^(k)=µ⁽⁰⁾P^k (3)

kaikillak∈N.

(9)

2 Invariantti jakauma ja tasainen ergodisuus

Tässä luvussa käydään läpi Markovin ketju Monte Carlo -simuloinnin esittämiseen tarvittavia lauseita. Luvun päätuloksia ovat Lause 2.1 ja Lause 2.2. Tulosten motivoimiseksi tarkastellaan lyhyesti seuraavaa ongelmaa lähteen [1] esitystä mukaillen: Olkoon (Xk)^∞_k=0 Markovin ketju ja µ^(k)satunnaismuuttujanX_k jakauma. Halutaan selvittää, millä ehdoilla on olemassa jakaumaπ siten, että

µ^(k)→π, kunk→ ∞.

Ongelman ratkaiseminen lähtee liikkeelle rajajakaumakandidaatin etsimisestä. Tämä onnistuu helposti: yhtälön (2) mukaan

µ^(k+1)=µ^(k)P

kaikillak∈N₀, missäP on ketjun siirtymätodennäköisyysmatriisi. Näin ollen nähdään, että jos rajajakaumaπ= lim_k→∞µ^(k) on olemassa, se toteuttaa yhtälön

π= lim

k→∞µ^(k+1)= lim

k→∞

µ^(k)P

=

k→∞lim µ^(k)

P =πP.

Tämä johtaa invariantin jakauman käsitteeseen:

Määritelmä 2.1. Jakauma π ∈ Rⁿ on siirtymätodennäköisyysmatriisin P = [pi,j]i,j=1,2,...,n

invariantti jakauma, jos

π=πP.

Seuraavaksi osoitetaan, että jos Markovin ketjun siirtymätodennäköisyysmatriisilleP pätee, että P^m >0 jollakin m∈ N, niin yksikäsitteinen invariantti jakauma π on olemassa ja sille pätee, ettäπ >0. Erotetaan osa todistuksesta lemmaksi myöhempää käyttöä varten. Lemman 2.1 tulos on lähteestä [2] ja todistus mukailee lähteen todistusta.

Lemma 2.1. Olkoon P = [pi,j]i,j=1,2,...,n siirtymätodennäköisyysmatriisi siten, ettäP >0. Jos x∈Rⁿ siten, että xP =x, niin x≥0 taix≤0.

Todistus. Jos väite on väärä, on olemassa indeksiti, j∈ {1,2, . . . , n}siten, ettäxi<0 jaxj >0.

Kaikillak= 1,2. . . , n xk ≤ |xk|jaxi<0<|xi|, joten kaikilla l= 1,2, . . . , np¨atee, ett¨a Xn

k=1

x_kp_k,l=X

k6=i

x_kp_k,l+x_ip_i,l<X

k6=i

|x_k|p_k,l+|x_i|p_i,l= Xn k=1

|x_k|p_k,l. Vastaavastixk≥ − |xk|kaikilla k= 1,2, . . . , nja xj>0>− |xj|, joten

Xn k=1

xkpk,l>− Xn k=1

|xk|pk,l kaikillal= 1,2, . . . , n.

N¨ain ollen saadaan, ett¨a

Xn k=1

xkpk,l

<

Xn k=1

|xk|pk,l kaikillal= 1,2, . . . , n.

Toisaalta oletuksenxP =xnojalla x_l= [xP]_l=Pn

k=1x_kp_k,lkaikilla l= 1,2, . . . , n, joten Xn

l=1

|x_l|= Xn l=1

Xn k=1

x_kp_k,l

<

Xn l=1

Xn k=1

|x_k|p_k,l= Xn k=1

Xn l=1

|x_k|p_k,l= Xn k=1

|x_k| Xn

l=1

p_k,l= Xn k=1

|x_k|,

(10)

Lause 2.1. OlkoonP = [pi,j]i,j=1,2,...,n siirtymätodennäköisyysmatriisi siten, että P^m >0 jol- lakinm∈N. Tällöin matriisillaP on yksikäsitteinen invariantti jakaumaπ∈Rⁿ. Lisäksi pätee, että π >0.

Todistus. Olkoony= (y1, y2, . . . , yn)∈Rⁿ siten, ettäyk= 1 kaikillak= 1,2, . . . , n. Tällöin [P y]_i=

Xn k=1

pi,kyk = Xn k=1

pi,k = 1 =yi kaikilla i= 1,2, . . . , n,

joten P y =y. Erityisesti luku 1 on matriisin P oikeanpuoleinen ominaisarvo. Koska matriisin vasemmanpuoleiset ja oikeanpuoleiset ominaisarvot ovat samat, on 1 myös matriisin P vasem- manpuoleinen ominaisarvo. On siis olemassa vektorix∈Rⁿ\{¯0}siten, ettäxP =x. Tästä seuraa induktiolla, ettäxP^k =xkaikilla k ∈N. ErityisestixP^m =x, joten soveltamalla Lemmaa 2.1 siirtymätodennäköisyysmatriisiinP^m>0 saadaan, ettäx≤0 taix≥0. Korvaamalla vektorix tarvittaessa vektorilla−xvoidaan olettaa, että x≥0. Koskaxei ole nollavektori, on olemassa indeksii∈ {1,2, . . . , n}siten, ettäx_i>0. Tästä seuraa, ettäx_j>0 kaikillaj = 1,2, . . . , n, sillä

xj= [xP^m]_j= Xn k=1

xkp^(m)_k,j ≥xip^(m)_i,j >0.

Olkoon

π= x

Pn j=1x_j, jolloin siisπ= (π1, π2, . . . , πn)∈Rⁿ siten, ett¨a

π_i = x_i Pn

j=1xj

kaikilla i= 1,2, . . . , n.

T¨all¨oin (i) πP =

Pnx

j=1xj

P = ^Pn¹

j=1xj (xP) = ^Pn^x

j=1xj =π, (ii) Pn

i=1πi=Pn i=1Pnxi

j=1xj =^Pn¹ j=1xj

Pn

i=1xi= 1 ja (iii) πi= ^Pn^xⁱ

j=1xj >0 kaikillai= 1,2, . . . , n, koskaxi>0 kaikillai= 1,2, . . . , n, jotenπ∈Rⁿ on etsitty jakauma.

Osoitetaan vielä invariantin jakauman yksikäsitteisyys. Oletetaan vastoin väitettä, että on olemassa invariantti jakaumaµ∈Rⁿ siten, ettäµ6=π. Tällöin

(π−µ)P^m=πP^m−µP^m=π−µ,

joten Lemman 2.1 nojallaπ−µ≥ 0 taiπ−µ≤ 0. Oletetaan, että π−µ ≥0. Koska µ 6=π, on olemassa indeksi j ∈ {1,2, . . . , n} siten, että µj 6= πj. Tällöin ehdon π−µ ≥0 nojalla on µj< πj, joten saadaan, että

1 = Xn i=1

µ_i<

Xn i=1

π_i= 1, mikä on ristiriita. Tapausπ−µ≤0 käsitellään vastaavasti.

(11)

Lause 2.1 ratkaisee invariantin jakauman olemassaoloa koskevan kysymyksen. Voidaan my¨os osoittaa, ett¨a

k→∞lim µ^(k)=π,

jos P^m > 0 jollakinm ∈ N. Tulos ei kuitenkaan ole tämän tutkielman kannalta kovin oleelli- nen; ongelmaa tarkasteltiin lähinnä invariantin jakauman käsitteen motivoimiseksi. Lisäksi nyt yhtälön (3) perusteella on luonnollista kysyä, mitä tapahtuu matriiseille P^k, missäk∈N, kun k→ ∞. Osoittautuu, että kaikilla i, j= 1,2, . . . , n

p^(k)_i,j →πj, kunk→ ∞,

vieläpä niin, että

p^(k)_i,j −π_j ≤Cβ^k

kaikilla k∈N, missä C≥0 ja 0≤β <1. Huomaa, että yläraja ei riipu indekseistäi jaj, mikä on oleellista seuraavassa luvussa. Tulosta kutsutaan tasaiseksi ergodisuudeksi ja se todistetaan Lauseessa 2.2. Tarvitaan kuitenkin useita lemmoja, jotta luvun

p^(k)_i,j −π_j

yläraja voidaan kirjoittaa haluttuun muotoon. Lemma 2.2 todistuksineen on lähteestä [3]. Myös joissain luvun loppuosan tuloksissa on epäsuorasti hyödynnetty lähdettä [3]

Lemma 2.2. OlkoonP = [pi,j]i,j=1,2,...,n siirtymätodennäköisyysmatriisi. Tällöin kaikilla x∈Rⁿ

maxi [P x]_i−min

i [P x]_i≤

1−2 min

i,j pi,j max

i xi−min

i xi

.

Todistus. Olkoon x ∈ Rⁿ ja j0 ∈ {1,2, . . . , n} siten, että xj0 = minjxj. Tällöin kaikilla i = 1,2, . . . , n

[P x]_i= Xn j=1

pi,jxj =pi,j0xj0+X

j6=j0

pi,jxj≤pi,j0xj0+ max

j xj

X

j6=j0

pi,j

=pi,j0min

j xj+ max

j xj(1−pi,j0) = max

j xj−pi,j0

maxj xj−min

j xj

≤max

j xj−min

i,j pi,j

maxj xj−min

j xj

.

Erityisesti

maxi [P x]_i≤max

j xj−min

i,j pi,j

maxj xj−min

j xj

. (4)

Vastaavasti arvioimalla nähdään, että kaikillai= 1,2, . . . , n mini [P x]_i≥min

j xj+ min

i,j pi,j

maxj xj−min

j xj

. (5)

(12)

Väite nähdään todeksi yhdistämällä arviot (4) ja (5):

maxi [P x]_i−min

i [P x]_i≤

maxj xj−min

i,j pi,j

maxj xj−min

j xj

−

minj x_j+ min

i,j p_i,j

maxj x_j−min

j x_j

=

maxj x_j−min

j x_j

−2 min

i,j

maxj x_j−min

j x_j

=

1−2 min

i,j p_i,j max

j x_j−min

j x_j

.

Seuraus 2.1. OlkoonP = [pi,j]i,j=1,2,...,n siirtymätodennäköisyysmatriisi. Tällöin kaikilla x∈Rⁿ ja k∈N

maxi

P^kx

i−min

i

P^kx

i ≤

1−2 min

i,j p_i,j k

maxi x_i−min

i x_i .

Todistus. Lemman 2.2 nojalla väite pätee, kunk= 1. Oletetaan induktio-oletuksena, että maxi

P^kx

i−min

i

P^kx

i≤

1−2 min

i,j pi,j

k

maxi xi−min

i xi

jollakink∈N. Lemman 2.2 ja induktio-oletuksen nojalla saadaan, ett¨a maxi

P^k+1x

i−min

i

P^k+1x

i= max

i

P(P^kx)

i−min

i

P(P^kx)

i

≤

1−2 min

i,j pi,j max

i

P^kx

i−min

i

P^kx

i

≤

1−2 min

i,j p_i,j 1−2 min

i,j p_i,j k

maxi x_i−min

i x_i

≤

1−2 min

i,j pi,j

k+1

maxi xi−min

i xi

.

Lemma 2.3. Olkoon P = [pi,j]i,j=1,2,...,n siirtymätodennäköisyysmatriisi siten, että P^m > 0 jollakinm∈N. Merkitään

α= 1−2 min

i,j p^(m)_i,j . T¨all¨oin

(i) α∈[0,1[ja

(ii) on olemassa luvut C≥0 ja0≤β <1 siten, ett¨a α⌊m^k⌋ ≤Cβ^k kaikillak∈N.

Todistus. KoskaP^m>0, niin selvästi α <1. Väiteα≥0 seuraa osoittamalla, että mini,j p^(m)_i,j ≤1

2.

(13)

Tehdään antiteesi: mini,jp^(m)_i,j > ¹₂. Olkooti0, j0∈ {1,2, . . . , n} siten, että p^(m)_i₀_,j₀ = min

i,j p^(m)_i,j . T¨all¨oin

1 = Xn k=1

p^(m)_i

0,k≥min

k p^(m)_i

0,k+ max

k p^(m)_i

0,k≥2 min

k p^(m)_i

0,k≥2 min

i,j p^(m)_i,j >1, mik¨a on ristiriita. Siisp¨aα∈[0,1[.

Kaikillak∈N

k= k

m

m+

k− k

m

| {z }

≤m−1

≤ k

m

m+ (m−1),

joten

k m ≤

k m

+m−1 m kaikillak∈N. Edelleen, koskaα∈[0,1[, niin kaikilla k∈N

α^m¹k

=α^m^k ≥α⌊m^k⌋⁺^mm⁻¹ =α⌊m^k⌋α^m^m⁻¹, mist¨a

α⌊m^k⌋ ≤ 1 α^m^m⁻¹

α^m¹k

kaikillak∈N. Voidaan siis valitaC= ¹

α^m^m⁻¹ jaβ=α^m¹.

Lemma 2.4. Olkoon P = [pi,j]i,j=1,2,...,n siirtymätodennäköisyysmatriisi siten, että P^m > 0 jollakinm∈N. Tällöin on olemassa luvutC≥0 ja0≤β <1siten, että

maxi p^(k)_i,j −min

i p^(k)_i,j ≤Cβ^k kaikillaj= 1,2, . . . , n ja kaikillak∈N.

Todistus. Merkit¨a¨an

α= 1−2 min

i,j p^(m)_i,j .

Lemman 2.3 nojalla on olemassa luvutC≥0 ja 0≤β <1 siten, ett¨a α⌊^m^k⌋ ≤Cβ^k

kaikillak∈N. Kiinnitet¨a¨anj∈ {1,2, . . . , n}jak∈N. Koska kaikillai= 1,2, . . . , n P^kej

i= Xn l=1

p^(k)_i,lej,l=p^(k)_i,j, niin

minp^(k)= min P^ke

ja maxp^(k)= max P^ke

.

(14)

Siispä Lausetta A.3 käyttämällä saadaan, että maxi p^(k)_i,j −min

i p^(k)_i,j = max

i

P^kej

i−min

i

P^kej

i

= max

i

h

P⌊m^k⌋^m+(k−⌊m^k⌋^m)ej

i

i−min

i

h

P⌊m^k⌋^m+(k−⌊m^k⌋^m)ej

i

= max

i

h

P⌊m^k⌋^mP^k−⌊m^k⌋^me_ji

i−min

i

h

P⌊m^k⌋^mP^k−⌊m^k⌋^me_ji

i

= max

i

h(P^m)⌊^m^k⌋

P^k⁻⌊^m^k⌋^mej

i

i−min

i

h(P^m)⌊^m^k⌋

P^k⁻⌊^m^k⌋^mej

i

≤

1−2 min

i,j p^(m)_i,j ⌊m^k⌋

maxi

hP^k⁻⌊^m^k⌋^me_ji

i−min

i

hP^k⁻⌊^m^k⌋^me_ji

i

=

1−2 min

i,j p^(m)_i,j

⌊m^k⌋

maxi p(^k−⌊m^k⌋^m)

i,j −min

i p(^k−⌊m^k⌋^m)

i,j

| {z }

≤1

≤

1−2 min

i,j p^(m)_i,j ⌊m^k⌋

=α⌊m^k⌋

≤Cβ^k.

Lause 2.2. OlkoonP = [pi,j]i,j=1,2,...,n siirtymätodennäköisyysmatriisi siten, ettäP^m>0jolla- kinm∈N, ja olkoon π∈Rⁿ matriisin P invariantti jakauma. Tällöin on olemassa luvutC≥0 ja 0≤β <1 siten, että

p^(k)_i,j −π_j ≤Cβ^k kaikillai, j= 1,2, . . . , n jak∈N.

Todistus. Koskaπon siirtymätodennäköisyysmatriisinP invariantti jakauma, niin π=πP.

Tästä seuraa induktiolla, että

π=πP^k

kaikillak∈N. Näin ollen kaikillaj= 1,2, . . . , njak∈Npätee, että π_j=

πP^k

j= Xn i=1

π_ip^(k)_i,j ≤max

i p^(k)_i,j Xn i=1

π_i= max

i p^(k)_i,j ja

πj= πP^k

j = Xn i=1

πip^(k)_i,j ≥min

i p^(k)_i,j Xn

i=1

πi= min

i p^(k)_i,j. Lemman 2.4 nojalla on olemassa luvutC≥0 ja 0≤β <1 siten, ett¨a

maxi p^(k)_i,j −min

i p^(k)_i,j ≤Cβ^k

(15)

kaikillaj = 1,2, . . . , njak∈N. Olkooti, j= 1,2, . . . , njak∈Nmit¨a tahansa. Koska mini p^(k)_i,j ≤πj≤max

i p^(k)_i,j ≤min

i p^(k)_i,j +Cβ^k ja

mini p^(k)_i,j ≤p^(k)_i,j ≤max

i p^(k)_i,j ≤min

i p^(k)_i,j +Cβ^k, niinπj, p^(k)_i,j ∈h

minip^(k)_i,j,minip^(k)_i,j +Cβ^ki . Siisp¨a

p^(k)_i,j −π_j

≤Cβ^k.

(16)

3 Markovin ketju Monte Carlo -simulointi

Olkoon π ∈ Rⁿ jakauma joukolla S = {s1, s2, . . . , sn}, f : S → R funktio ja X : Ω → S satunnaismuuttuja, joka noudattaa jakaumaaπ. Halutaan selvitt¨a¨a odotusarvo

E_πf :=E_πf(X) = Xn i=1

f(si)πi, miss¨af(X) on kuvaustenf :S→RjaX: Ω→S yhdistetty kuvaus

f(X) : Ω→R, f(X)(ω) =f(X(ω)).

Jos tieto jakaumasta π on puutteellista tain on hyvin suuri, niin odotusarvoa ei voi selvittää suoraan laskemalla. Tällöin on kuitenkin usein mahdollista konstruoida Markovin ketju (X_k)^∞_k=0, jonka siirtymätodennäköisyysmatriisinP invariantti jakauma onπ. JosP^m>0 jollakinm∈N, voi odotusarvoaE_πf approksimoida satunnaisluvulla

1 k

Xk i=1

f(Xi),

kunk∈Non riittävän suuri. Tätä kutsutaan Markovin ketju Monte Carlo -simuloinniksi ja sen käyttö perustellaan Lauseessa 3.1.

Otetaan käyttöön seuraavat merkinnät: Olkoon (X_k)^∞_k=0Markovin ketju äärellisellä tila-avaruu- dellaS ={s1, s2, . . . , s_n} ja olkoon ketjun taustalla oleva todennäköisyysavaruus (Ω,F,P). Jos i∈ {1,2, . . . , n}siten, ettäP(X0=s_i)>0 jaA∈ F, merkitään

P_i(A) =P(A|X0=s_i). Lisäksi, josg: Ω→Ron funktio, merkitään

E_ig=E[g|X0=si].

Lemma 3.1. Olkoon(Xk)^∞_k=0 Markovin ketju tila-avaruudellaS={s1, s2, . . . , sn} jaf :S→R funktio. Oletetaan, että ketjun siirtymätodennäköisyysmatriisilleP = [pi,j]i,j=1,2,...,n päteeP^m>

0jollakinm∈Nja ettäπ∈Rⁿon matriisinP invariantti jakauma. Tällöin, josP(X0=si)>0, niin

klim→∞

1 k²

Xk j=1

E_i(f(Xj)−E_πf)²= 0.

Todistus. Kaikillaj∈N E_i(f(Xj)−E_πf)²=

Xn l=1

(f(sl)−E_πf)²P_i(Xj =s_l)

≤ max

m=1,2,...,n(f(sm)−E_πf)² Xn l=1

Pi(Xj =sl) = max

m=1,2,...,n(f(sm)−E_πf)²,

(17)

joten

0≤ 1 k²

Xk j=1

E_i(f(Xj)−E_πf)²≤ 1 k²

Xk j=1

m=1,2,...,nmax (f(sm)−E_πf)²

= 1

k²k· max

m=1,2,...,n(f(sm)−E_πf)²= 1

k· max

m=1,2,...,n(f(sm)−E_πf)²→0, kunk→ ∞.

Lemma 3.2. Olkoon(Xk)^∞_k=0 Markovin ketju tila-avaruudellaS={s1, s2, . . . , s_n} jaf :S→R funktio. Oletetaan, että ketjun siirtymätodennäköisyysmatriisilleP = [pi,j]i,j=1,2,...,n päteeP^m>

0jollakinm∈Nja ettäπ∈Rⁿon matriisinP invariantti jakauma. Tällöin, josP(X0=si)>0, niin

klim→∞

2 k²

Xk j=1

j−1

X

l=1

E_i(f(Xj)−E_πf) (f(Xl)−E_πf) = 0.

Todistus. Merkit¨a¨an

f¯=f−E_πf, jolloin v¨aitteen¨a on

klim→∞

2 k²

Xk j=1

j−1

X

l=1

E_if¯(Xj) ¯f(Xl) = 0.

Huomataan, ett¨a kaikillal∈Njai= 1,2, . . . , n Xn

v=1

Xn u=1

f¯(sv) ¯f(su)πvp^(l)_i,u= Xn v=1

f¯(sv)πv

Xn u=1

f¯(su)p^(l)_i,u

= Xn v=1

(f(sv)−E_πf)πv

Xn u=1

f(s¯ u)p^(l)_i,u

= Xn v=1

f(sv)πv−E_πf Xn v=1

πv

! _n X

u=1

f¯(su)p^(l)_i,u

= (E_πf−E_πf) Xn u=1

f¯(su)p^(l)_i,u

= 0.

Olkooni∈ {1,2, . . . , n} mikä tahansa siten, ettäP(X0=si)>0. Olkoot edelleenj, l ∈Nmitä tahansa siten, ettäl < j. Lemman A.1 nojalla

P(Xj =s_v, X_l=s_u|X₀=s_i) =P(Xj=s_v|X_l=s_u, X₀=s_i)P(Xl=s_u|X₀=s_i), kunP(Xl=s_u, X0=s_i)>0. Lauseen A.2 nojalla puolestaan

P(Xj =s_v|X_l=s_u, X0=s_i) =P(Xj=s_v|X_l=s_u),

(18)

kun P(Xl=su, X0=si) > 0. Kun vielä huomataan, että ehdosta P(Xl=su|X0=si) > 0 seuraa, ettäP(Xl=su, X0=si) =P(Xl=su|X0=si)P(X0=si)>0, saadaan, että

E_i f¯(Xj) ¯f(Xl)

= Xn v=1

Xn u=1

f¯(sv) ¯f(su)P_i(Xj =s_v, X_l=s_u)

= Xn v=1

Xn u=1

f¯(sv) ¯f(su)P(Xj=sv, Xl=su|X0=si)

= Xn v=1

X

u:P(Xl=su|X0=si)>0

f¯(sv) ¯f(su)P(Xj=sv, Xl=su|X0=si)

= Xn v=1

X

u:P(X_l=su|X0=si)>0

f¯(sv) ¯f(su)P(Xj=sv|Xl=su, X0=si)P(Xl=su|X0=si)

= Xn v=1

X

u:P(Xl=su|X0=si)>0

f¯(sv) ¯f(su)P(Xj=s_v|X_l=s_u)P(Xl=s_u|X0=s_i)

(∗)

= Xn v=1

X

u:P(Xl=su|X0=si)>0

f¯(sv) ¯f(su)p^(j−l)_u,v P(Xl=su|X0=si)

= Xn v=1

Xn u=1

f¯(sv) ¯f(su)p^(j_u,v⁻^l)P(Xl=su|X0=si)

(∗∗)

= Xn v=1

Xn u=1

f¯(sv) ¯f(su)p^(j−l)_u,v p^(l)_i,u

= Xn v=1

Xn u=1

f¯(sv) ¯f(su)p^(j_u,v⁻^l)p^(l)_i,u− Xn v=1

Xn u=1

f¯(sv) ¯f(su)πvp^(l)_i,u

| {z }

=0

= Xn v=1

Xn u=1

f¯(sv) ¯f(su)

p^(j_u,v⁻^l)−πv

p^(l)_i,u. (6)

Kohdissa (∗) ja (∗∗) k¨aytettiin Lausetta A.1. Huomaa kohdassa (∗), ett¨a P(Xl=su)≥P(Xl=su, X0=si)>0,

joten Lauseen A.1 käyttö on mahdollista. Lauseen 2.2 nojalla on olemassa luvut C ≥ 0 ja 0≤β <1 siten, että

p^(k)_i,j −πj

≤Cβ^k

kaikillai, j= 1,2, . . . , njak∈N, joten yhtälöstä (6) seuraa, että E_if¯(Xj) ¯f(Xl)

≤ Xn v=1

Xn u=1

f¯(sv)

f¯(su)

p^(j−l)_u,v −πv

p^(l)_i,u

≤ Xn v=1

f¯(sv)

! _n X

u=1

f¯(su)

! C

| {z }

=:M

β^j−l

=M β^j−l.

(19)

N¨ain ollen

−2 k²

Xk j=1

j−1

X

l=1

M β^j⁻^l≤ 2 k²

Xk j=1

j−1

X

l=1

E_i f¯(Xj) ¯f(Xl)

≤ 2 k²

Xk j=1

j−1

X

l=1

M β^j⁻^l,

joten riittää osoittaa, että

k→∞lim 2 k²

Xk j=1

j−1

X

l=1

M β^j−l= 0.

Koska 0≤β <1, niin

X∞ l=1

β^l<∞. Kaikillak∈N

0≤ 2 k²

Xk j=1

j−1

X

l=1

M β^j−l= 2M k²

Xk j=1

j−1

X

l=1

β^l

= 2M k²

k−1

X

l=1

(k−l)β^l≤ 2M k²

k−1

X

l=1

kβ^l≤ 2M k

X∞ l=1

β^l→0, kunk→ ∞.

Seuraava lause kertoo, että Markovin ketju Monte Carlo -simulointi toimii. Lauseen muotoiluun on otettu mallia lähteestä [1], mutta todistus ei seuraa lainkaan lähteen todistusta. Itse asiassa lähteessä [1] todistetaan vahvempi tulos: Lauseen 3.1 tilanteessa

P_i



lim

k→∞

1 k

Xk j=1

f(Xj) =E_πf



= 1.

Lause 3.1. Olkoon (Xk)^∞_k=0 Markovin ketju tila-avaruudella S ={s1, s2, . . . , sn} ja olkoon f : S → R funktio. Jos ketjun siirtymätodennäköisyysmatriisille P = [pi,j]i,j=1,2,...,n pätee, että P^m > 0 jollakin m ∈ N, niin kaikilla ε > 0 ja kaikilla i = 1,2, . . . , n, joille P(X0=si) > 0, pätee, että

klim→∞

P_i



 1 k

Xk j=1

f(Xj)−E_πf

> ε



= 0, miss¨aπon matriisinP invariantti jakauma.

(20)

Todistus. Olkoonε >0 mikä tahansa. Merkitään ¯f =f−E_πf ja huomataan, että kaikillak∈N

1 k

Xk j=1

f(Xj)−E_πf

2

=



1 k

Xk j=1

(f(Xj)−E_πf)





2

= 1 k²



 Xk j=1

f¯(Xj)





2

= 1 k²

Xk j=1

f(X¯ j) Xk

l=1

f¯(Xl) = 1 k²

Xk j=1

Xk l=1

f¯(Xj) ¯f(Xl)

= 1 k²

Xk j=1





j−1

X

l=1

f¯(Xj) ¯f(Xl) + ¯f(Xj)²+ Xk l=j+1

f¯(Xj) ¯f(Xl)





= 1 k²

Xk j=1

f(X¯ j)²+ 1 k²

Xk j=1

j−1

X

l=1

f¯(Xj) ¯f(Xl) + 1 k²

Xk j=1

Xk l=j+1

f¯(Xj) ¯f(Xl)

= 1 k²

Xk j=1

f(X¯ j)²+ 2 k²

Xk j=1

j−1

X

l=1

f¯(Xj) ¯f(Xl).

Näin ollen lemmojen 3.1 ja 3.2 ja Markovin epäyhtälön¹nojalla

P_i



 1 k

Xk j=1

f(Xj)−E_πf

> ε



=P_i



 1 k

Xk j=1

f(Xj)−E_πf

2

> ε²





≤ E_i

¹k

Pk

j=1f(Xj)−E_πf

2

ε²

= E_i

1 k²

Pk

j=1f¯(Xj)²+_k²2

Pk j=1

Pj−1

l=1f¯(Xj) ¯f(Xl) ε²

= 1

k²ε² Xk j=1

E_if¯(Xj)²+ 2 k²ε²

Xk j=1

j−1

X

l=1

E_i f¯(Xj) ¯f(Xl)

→0, kunk→ ∞.

Jotta Lause 3.1 olisi hyödyllinen, täytyy annetulle jakaumalle π ∈ Rⁿ osata konstruoida siir- tymätodennäköisyysmatriisiP = [pi,j]i,j=1,2,...,n, jolle pätee, että

(i) πP =πja

(ii) P^m>0 jollakinm∈N.

1Markovin epäyhtälö: JosX on ei-negatiivinen satunnaismuuttuja jaλ >0, niinP(X≥λ)≤ Ê(_λ^X⁾.

(21)

Ehto (i) saadaan voimaan, kun vaaditaan, että matriisiP on kääntyvä jakaumanπsuhteen.

Määritelmä 3.1. Siirtymätodennäköisyysmatriisi P = [pi,j]i,j=1,2,...,n on kääntyvä jakauman π∈Rⁿ suhteen, jos

πipi,j=πjpj,i kaikillai, j= 1,2, . . . , n. (7) Markovin ketju(Xk)^∞_k=0on kääntyvä jakaumanπsuhteen, jos sen siirtymätodennäköisyysmatriisi on kääntyvä jakaumanπ suhteen.

Lause 3.2. OlkoonP = [pi,j]i,j=1,2,...,n siirtymätodennäköisyysmatriisi, joka on kääntyvä jakau- man π∈Rⁿ suhteen. Tällöin πon matriisinP invariantti jakauma.

Todistus. Kaikillaj= 1,2, . . . , n [πP]j=

Xn i=1

π_ip_i,j= Xn i=1

π_jp_j,i=π_j Xn i=1

p_j,i=π_j, jotenπP =π.

Yhtälö (7) ei kiinnitä matriisin P alkioita, vaan ne täytyy määrätä muilla keinoilla. Ajatel- laan Markovin ketjun siirtymä tilasta toiseen kaksivaiheisena tapahtumana: Jos ollaan tilassa si, ehdotetaan uutta tilaa sj 6= si todennäköisyydellä gi,j. Ehdotettu tila sj hyväksytään to- dennäköisyydelläai,j. Jos uuden tilan ehdottaminen ja hyväksyminen ovat toisistaan riippumat- tomia, niin todennäköisyys siirtyä tilastasi tilaansj on

p_i,j=a_i,jg_i,j. Todennäköisyys pysyä tilassas_i on

1−X

j6=i

p_i,j= 1−X

j6=i

a_i,jg_i,j.

Oletetaan, että ehdokastilojen jakaumat g_i = (gi,1, g_i,2, . . . , g_i,n) ∈ Rⁿ, i = 1,2, . . . , n, on jo valittu siten, ettäg_i>0 kaikillai= 1,2, . . . , n. Tehtäväksi jää valita tilojen hyväksymistodennä- köisyydeta_i,j,i, j= 1,2, . . . , n, niin, että kääntyvyysehto (7) toteutuu. Jakaumastaπoletetaan, ettäπ >0.

Määritelmä 3.2. Valitsemalla

a_i,j=a^MH_i,j = min

1,πjgj,i

π_ig_i,j

kaikillai, j= 1,2, . . . , n, joillei6=j, saadaan Metropolis–Hastings -algoritmi, jonka siirtymäto- dennäköisyysmatriisi onP_MH=

p^MH_i,j

i,j=1,2,...,n, miss¨a p^MH_i,j =a^MH_i,j gi,j, kun i6=j, ja

p^MH_i,i = 1−X

j6=i

p^MH_i,j .