1 Johdanto 1
1.1 Todennäköisyys ja tilastotiede . . . 1
1.2 Havaitut frekvenssit ja empiirisetjakaumat . . . 1
1.3 Todennäköisyysmallit . . . 3
1.3.1 Satunnaiskoe . . . 3
1.3.2 Otosavaruudet, tapahtumat ja joukko-operaatiot. . . . 4
1.3.3 Todennäköisyys . . . 8
1.3.4 Äärettömät otosavaruudet . . . 11
1.3.5 Todennäköisyyden tulkinnat . . . 12
1.4 Ehdollinen todennäköisyys . . . 14
1.4.1 Ehdollisentodennäköisyyden frekvenssitulkinta . . . . 15
1.4.2 Kertolaskusääntö . . . 15
1.4.3 Riippumattomuus . . . 15
1.5 Odotetut frekvenssit . . . 15
Yhteenveto . . . 16
Harjoituksia . . . 17
2 Todennäköisyys, satunnaismuuttuja ja perustuloksia 21 2.1 Todennäköisyyden ominaisuuksia . . . 21
2.2 Symmetriaan perustuva todennäköisyys . . . 24
2.3 Aksiomaattinen lähestymistapa . . . 25
2.3.1 Äärellinenadditiivisuus. . . 25
2.3.2 Todennäköisyyden yleiset aksioomat . . . 25
2.4 Kombinatoriikkaa . . . 27
2.4.1 Summa-ja tuloperiaate. . . 27
2.4.2 Valintajärjestyksessä . . . 27
2.4.3 Osajoukonvalinta. . . 28
2.4.4 Otanta palauttaen, kunjärjestystä ei oteta huomioon . 30 2.4.5 Kombinatoriikanmerkintöjä ja identiteettejä . . . 31
2.4.6 Binomilause,hypergeometrinen identiteetti ja multinomilause . . . 32
2.5 Satunnaismuuttuja . . . 33
2.6 Satunnaismuuttujan jakauma . . . 35
2.6.1 Kertymäfunktio . . . 37
2.6.2 Satunnaismuuttujan tiheysfunktio . . . 40
2.7 Otanta palauttamatta . . . 44
2.7.1 Hypergeometrinen jakauma . . . 45
2.7.2 Tarkistusotantateollisuudessa . . . 46
2.8 Otanta palauttaen . . . 46
2.9 Binomijakauma . . . 48
2.9.1 Binomijakauma hypergeometrisen jakauman likiarvona 49 Yhteenveto . . . 50
Harjoituksia . . . 52
3 Ehdollinen todennäköisyys ja riippumattomuus 57 3.1 Ehdollinen todennäköisyys . . . 57
3.1.1 Tulosääntö, kokonaistodennäköisyys ja Bayesin kaava . . . 58
3.1.2 Riippumattomuus . . . 60
3.1.3 Joukko-oppi ja todennäköisyys. . . 64
3.2 Ehdollisetjakaumat. . . 64
3.3 Yleinen tulokaavaja Bayesin lause. . . 65
3.3.1 Yleinen tulokaava . . . 65
3.3.2 Bayesin lause . . . 68
3.3.3 Peräkkäisotanta . . . 71
3.3.4 Useiden tapahtumien unionintodennäköisyys . . . 72
Yhteenveto . . . 74
Harjoituksia . . . 75
4 Satunnaismuuttujien tunnusluvut ja riippumattomuus 77 4.1 Odotusarvo,varianssija kovarianssi . . . 77
4.1.1 Odotusarvo . . . 77
4.1.2 Ehdollinen odotusarvo . . . 84
4.1.3 Varianssi. . . 85
4.1.4 Kovarianssija korrelaatio. . . 87
4.2 Satunnaismuuttujan funktio . . . 88
4.3 Satunnaismuuttujien identtisyys . . . 89
4.4 Satunnaismuuttujien riippumattomuus . . . 90
4.4.1 Kaksisatunnaismuuttujaa . . . 91
4.4.2 Useita satunnaismuuttujia . . . 93
4.5 Suurten lukujenlaki . . . 93
4.6 Generoivatfunktiotja momentit. . . 96
4.6.1 Momentit . . . 96
4.6.2 Momenttifunktio . . . 96
4.6.3 Todennäköisyydet generoiva funktio(tgf) . . . 99
4.7 Kokeiden yhdistäminen ja tulomallit . . . 100
Yhteenveto . . . 102
Harjoituksia . . . 104
Johdanto
1.1 Todennäköisyys ja tilastotiede
Tämäkurssi käsitteleesekätodennäköisyyslaskentaaettätilastotiedettä.Uh-
kapelurienongelmatinspiroivattodennäköisyyslaskennanuranuurtajienajat-
telua,muttanykyisintodennäköisyyslaskennansovellusalueonerittäinmoni-
puolinenja jatkuvastilaajeneva.Tilastotieteessä laaditaansatunnaisilmiöil-
le todennäköisyysmalleja ja tutkitaan sitten havaintojen perusteella, miten
hyvin mallitkuvaavattodellisuutta.
1.2 Havaitut frekvenssit
ja empiiriset jakaumat
Jatkossa käytämmetermiäkoe taisatunnaiskoe, kunpuhummemenettelystä
tai prosessista, joka tuottaa (generoi) havaintoja. Esimerkkejä satunnaisko-
keista ovat lantinheittotai kännykkään tulevien viestien lukumääräseuraa-
van tunnin aikana. Heitetään lanttia esimerkiksi
100
kertaa ja saadaan 56klaavaa (
L
). Tapahtuman 'klaava' frekvenssi100
:n heiton sarjassa on tässätapauksessa
56
ja suhteellinen frekvenssi56/100 = 0.56
. Merkitään tapah-tuman
A
lukumäärääelifrekvenssiän
:nkokeen sarjassaN n (A)
.Useimmissasovelluksissa näyttääkäyvän niin, että suhteellinenfrekvenssi
(1.2.1)
N n (A)
n
läheneelukuaP (A),
kun toistojen lukumäärä
n
kasvaa. On helppo todeta, että0 ≤ P (A) ≤ 1
.Tätä lukua
P (A)
kutsummetapahtumanA
todennäköisyydeksi.Vaikka emme olekaan vielä määritelleet todennäköisyyttä, voimme to-
deta, että suhteellinen frekvenssi on ominaisuuksiltaan todennäköisyyden
kaltainen ja antaa siksi hyvän intuitiivisen käsityksen todennäköisyydestä.
Suhteellisenfrekvenssinavullavoidaanmyös arvioidatodennäköisyyksiä nu-
meerisesti.Näintehdäänesimerkiksisimulointikokeissa.Huomattakoon,että
suhteellinen frekvenssi ei ole todennäköisyyden määritelmä vaan todennä-
köisyyden eräs tulkinta.Todennäköisyys määritelläänaksiomaattisesti. Kun
todennäköisyys on määritelty, seuraa tulos (1.2.1) näistä aksioomeista. Itse
asiassa (1.2.1) voidaan perustella vahvan suurten lukujen lain avulla.Se on
tilastotieteenkannaltayksi todennäköisyyslaskennan tärkeimpiä lauseita.
Olkoon
x 1 , x 2 , . . . , x njokinlukujono.Tavallisestinämäluvutx 1 , x 2 , . . . , x n
ovatjonkin suureen,kuten esimerkiksipituuden taipainon,mittalukuja.Jos
esimerkiksi
n
tilastoyksikköä on mitattu, niin silloinx i on i
. tilastoyksikön
mittaluku ja luvut x 1, x 2, ..., x n muodostavat havaintoaineiston. Lukujen
x 2, ..., x n muodostavat havaintoaineiston. Lukujen
x 1, x 2, ..., x n (havaintoaineiston) empiirinen kertymäfunktio (ekf)reaalilu-
kuakselilla ( −∞ , ∞ )
on
x n (havaintoaineiston) empiirinen kertymäfunktio (ekf)reaalilu-
kuakselilla ( −∞ , ∞ )
on
F n (a) = 1
n |{ i : 1 ≤ i ≤ n, x i ≤ a }| ,
missä
−∞ < a < ∞
ja| . |
onjoukonalkioiden lukumäärä.Lukujen
x 1,x 2,...,x nempiirinenjakaumafunktiotailyhyestiempiirinen
jakauma (ej) on
x nempiirinenjakaumafunktiotailyhyestiempiirinen jakauma (ej) on
P n (a, b) = F n (b) − F n (a).
P n (a, b)
on siis puoliavoimelle välille(a, b]
kuuluvien lukujen suhteellinen osuus lukujoukossa{ x 1 , x 2 , . . . , x n }
:P n (a, b) = 1
n |{ i : 1 ≤ i ≤ n, a < x i ≤ b }| .
Esimerkki 1.1 Olkoon hatussa
n
arpalippua jai
. lippuun on kirjoitettu lukux i.Valitaanhatustasatunnaisestiyksiarpa.Sillointodennäköisyys,että
arvan numero sattuu välille (a, b]
on P n (a, b)
. Tässä tilanteessa empiiriselle
jakaumalle voidaan siis antaa todennäköisyystulkinta.
Empiirisenjakaumankuvaajanakäytetääntavallisestihistogrammia.His-
togrammin piirtäminen aloitetaan valitsemalla ensin jakopisteet
b 1 < b 2 <
· · · < b m siten, että kaikki luvut x i sisältyvät avoimelle välille (b 1 , b m )
ja
(b 1 , b m )
jamikään jakopiste ei olemittaluku. Jakopisteet määrittelevät
m − 1
osaväliä(b j , b j+1 )
,1 ≤ j ≤ m − 1
. Histogrammi piirretään asettamalla vierekkäinm − 1
pylvästä (suorakaidetta)siten, ettäj
. pylvään kannan(luokan)leveyson
b j+1 − b j ja pylvään korkeus on
P n (b j , b j+1 ) b j+1 − b j
= |{ i : 1 ≤ i ≤ n, b j < x i < b j+1 }|
n(b j+1 − b j ) .
Korkeus on siis
j
. osaväliin kuuluvien havaintojen suhteellinen osuus pi- tuusyksikköä kohti. Pylvään korkeutta kutsutaan havaintotiheydeksi tai ly-hyesti tiheydeksi.Vastaavasti
j
.pylvään pinta-ala onP n (b j , b j+1 )
jakaikkienpylväiden yhteenlaskettu pinta-alaon
1
.Käytännön sovelluksissa mittaustarkkuus on aina äärellinen, sanokaam-
me
∆x
.Jokainenmittalukuonsilloinmuotoakokonaisluku· ∆x
.Kahdenmit-taluvunpieninmahdollinenerotuson
∆x
.Jakopisteetvalitaansiten, ettäne ovatmuotoakokonaisluku
· ∆x + ∆x 2 .
Silloin jakopiste ei voi olla mittaluku. Jakopisteet muodostavat aineistoon
luokituksen ja puhumme silloinluokitellusta aineistosta. Jakopisteet
b j, b j+1
ovat silloin
j
. luokan ns. todelliset luokkarajat ja pisteetb j + ∆x 2 , b j+1 − ∆x 2
ovatns. pyöristetyt luokkarajat.
Esimerkki 1.2 Kurssin 1.välikokeen pistemäärät
x i , 1 ≤ i ≤ 20
olivat18, 12,14,11, 24,14,24,22, 24,10,8, 19,21,22,24, 24,24,6, 24,21.
Kokeeseen osallistuisiis20 opiskelijaa.Valitaantodellisiksiluokkarajoiksi
5.5, 10.5, 13.5, 16.5, 18.5, 20.5, 22.5, 24.5.
Nyt siis
b 1 = 5.5
jab 8 = 24.5
.Luokkarajatmäärittelevät7 luokkaa.5 10 15 20 25
0 0.05 0.10 0.15
Pistemäärä
Tiheys
Kuvio1.1. Koepistemääränhistogrammi (
n = 20
).Esimerkiksi
P 20 (20.5, 22.5) = 20 4 = 0.2
jahavaintotiheysluokassa(20.5, 22.5)
on
P 20 (20.5, 22.5) 22.5 − 20.5 = 0.2
2 = 0.1.
1.3 Todennäköisyysmallit
1.3.1 Satunnaiskoe
Todennäköisyyslaskenta on satunnaisilmiöiden matemaattista teoriaa. Kun
tarkastelemme satunnaisilmiöitä, puhumme satunnaiskokeista, vaikka kyse
on tavallisesti vain ajatelluista satunnaiskokeista. Se on siis matemaattinen
abstraktio.Satunnaiskokeessaon oletuksena,että kokeen alkutilaeimääritä
tulostadeterministisesti, vaan väliintulevatekijä, sattuma,vaikuttaakokeen
tulokseen. Satunnaiskokeen mahdolliset tulosvaihtoehdot tiedetään, mutta
yksittäisen kokeen tulostaei voida varmuudella ennustaa. Ainoa tapa saada
tietoa satunnaisilmiöistä on tehdä satunnaiskokeita (eli havainnoida satun-
naisilmiöitä).
Oletetaan nyt, ettäkoe (ilmiö)onsellainen,että sen tulosei olevarmuu-
dellaennustettavissa,muttakaikkimahdollisettulosvaihtoehdotovattiedos-
sa. Jos tällainen koe voidaan toistaa samoissa olosuhteissa, sitä kutsutaan
satunnaiskokeeksi. Satunnaiskokeen kaikkien mahdollisten tulosten joukkoa
kutsutaan otosavaruudeksi ja merkitään
Ω
:lla. Satunnaiskokeen yksittäistä mahdollistatulosta kutsutaanalkeistapaukseksi
(satunnaiskokeeseen liitty- vän otosavaruudenΩ
yksi piste).Jos otosavaruus onäärellinen, merkitäänΩ = { ω 1 , ω 2 , . . . , ω n } ,
missä alkeistapaukset ovat
ω 1,ω 2, ..., ω n ja Ω
:nalkeistapaustenlukumäärä
ω n ja Ω
:nalkeistapaustenlukumäärä
| Ω | = n
.Otosavaruus voi ollamyösääretön.Tapahtuma on otosavaruuden
Ω
osajoukko. Otosavaruuden osajoukkoja merkitäänisoillakirjaimillaA
,B
,C
,... Sanomme,ettätapahtumaA
sattuu,jos kokeen tulos
ω
kuuluu joukkoonA
eliω ∈ A
.Ω
onns. varmatapahtuma,koska jokinmahdollisista vaihtoehdoistasattuu varmasti.
Esimerkki 1.3 Heitetäänlanttia.Tulosvaihtoehdotovatkruuna(
R
)jaklaa-va (
L
),joten otosavaruusΩ = { L, R }
ja| Ω | = 2
.Heitetään lanttia, kunnes saadaanensimmäinen kruunu. Silloinotosava-
ruus
Ω = { R, LR, LLR, LLLR, . . . }
ja
| Ω | = ∞
. JostapahtumaA
on'enintään kaksiklaavaaennen 1.kruunaa',niin
A = { R, LR, LLR }
.Esimerkki 1.4 Tarkastellaan laitteen kestoa. Jokainen positiivinen reaali-
luku voidaan tulkita kestoajaksi. Silloin
Ω = { ω ∈ R | ω > 0 } .
Esimerkiksi tapahtuma'kestoikäainakin
100
tuntia'on[100, ∞ )
ja 'kestoikäyli
150
, mutta korkeintaan200
tuntia'on(150, 200]
.1.3.2 Otosavaruudet, tapahtumat ja joukko-operaatiot
Oletetaan,että satunnaiskokeen
E
otosavaruusΩ
onannettu.Kaikki tarkas-telun kohteena olevattapahtumat esitetään
Ω
:nosajoukkoina. OlkoonA
ta-pahtuma.Jos
A
sattuu,setarkoittaa,ettäkokeenE
tulosω
kuuluujoukkoonA
eliω ∈ A
. Tulkitse Vennin diagrammi siten, että valitset suorakaiteestaTaulukko 1.1.Joukko-opillisen jatodennäköisyyslaskennantermino-
logian vastaavuus.
Tapahtumat Joukot Joukkojen
merkintä
Vennindiagrammi
otosavaruus perusjoukko
Ω
tapahtuma
Ω
:nosajoukkoA
,B
,C
jne.mahdoton
tapahtuma
tyhjäjoukko
∅
ei
A
,A
eisatuA
:n komplementtiA c A
joko
A
taiB
taimolemmat
A
:n jaB
:nyhdisteA ∪ B A B
sekä
A
ettäB A
:n jaB
:nleikkausAB
,A ∩ B A B
A
jaB
toisensapoissulkevat
A
jaB
pistevieraatA ∩ B = ∅ A B
jos
A
niinB A
onB
:n osajoukkoA ⊂ B A B
(
Ω
:sta) satunnaisesti pisteen. Jokainen suorakaiteen piste on alkeistapaus.Jokainen suorakaiteen osa-alueon tapahtuma.
Taulukossa 1.1 on esitetty joukko-opilliset operaatiot komplementti, yh-
diste jaleikkaus.Nämäoperaatiottoteuttavatmoniakäyttökelpoisiaominai-
suuksia, kuten esimerkiksi
(A c ) c = A, A ∪ A c = Ω, A ∩ A c = ∅ .
Yksinkertaista,muttatodennäköisyyslaskennassahyödyllistärelaatiota
(A c ) c = A
kutsutaankaksinkertaisenkomplementinsäännöksi.Keskeisiäjoukko-opin laskusääntöjä ovatvaihdantalaitA ∪ B = B ∪ A, A ∩ B = B ∩ A
liitäntälait
A ∪ (B ∪ C) = (A ∪ B ) ∪ C, A ∩ (B ∩ C) = A ∩ (B ∩ C)
osittelulait
A ∪ (B ∩ C) = (A ∪ B) ∩ (A ∪ C), A ∩ (B ∪ C) = (A ∩ B) ∪ (A ∩ C)
jaDe Morganin lait
(A ∪ B) c = A c ∩ B c , (A ∩ B) c = A c ∪ B c .
A B
(A ∪ B ) c
A B
A c ∩ B c
A B
(A ∩ B ) c
A B
A c ∪ B c
Kuvio 1.2. DeMorganinlait.
Huomaa, että
A ∩ (B ∪ C) 6 = (A ∩ B) ∪ C,
paitsierikoistapauksissa.Lauseke
A ∩ B ∪ C
eiolesiishyvinmääritelty,vaan tarvitaan sulut osoittamaan,kummastatapahtumastaon kyse.Joukkojen
A
jaB
erotukseenA \ B
kuuluvatneA
:n pisteet, jotka eivätkuulu joukkoon
B
:A \ B = A ∩ B c = { ω | ω ∈ A
jaω / ∈ B } .
Jos
B ⊂ A
,käytämmemerkinnänA \ B
sijastamyösmerkintääA − B
. Tätämerkintää käyttäen
A \ B = A − (A ∩ B )
ja
A c = Ω − A.
A \ B B A − B B
Kuvio1.3. Joukkojen erotus.
Sanomme, että tapahtumat
A 1, A 2, ..., A m muodostavat tapahtuman
A m muodostavat tapahtuman
A
osituksen (tai jaon), josA = A 1 ∪ A 2 ∪ · · · ∪ A m ja tapahtumat A 1, A 2,
A 2,
...,
A m ovat toisensa poissulkevat (A i ∩ A j = ∅
, kun i 6 = j
). Esimerkiksi A
,
A c muodostaa otosavaruuden Ω
osituksen ja A \ B
, A ∩ B
muodostaa A
:n
Ω
osituksen jaA \ B
,A ∩ B
muodostaaA
:nosituksen. Jos joukot
A
jaB
ovat pistevieraat (A ∩ B = ∅
), niin voimmeA A 1
A 2 A 3
A A 1
A 2
A 3 A 4 A 5
A 6
Kuvio 1.4.Joukon
A
osituksia.merkinnän
A ∪ B
sijastakäyttää merkintääA + B
.Silloin esimerkiksiΩ = A + A c .
Jos
A 1, A 2, A 3 onA
:n jako,niin
A 3 onA
:n jako,niin
A = A 1 + A 2 + A 3 .
Jos
A 1 , A 2 , . . . , A n on jonotapahtumia, niiden unionion
[ n
i=1
A i = A 1 ∪ A 2 · · · ∪ A n
ja leikkaus
\ n
i=1
A i = A 1 ∩ A 2 · · · ∩ A n .
Kun tapahtumienjono
{ A n } , n ≥ 1
onääretön, jonontapahtumienunionija leikkaus voidaan määritellääärellisten unionienja leikkausten raja-arvona:[ ∞
n=1
A n = lim
m→∞
[ m
n=1
A n ,
\ ∞
n=1
A n = lim
m→∞
\ m
n=1
A n .
Kun tapahtumienjonoon
{ A n } , n = 1, 2, . . .
onäärellinentaiääretön, voim-memerkitä myös
[
n
A n = { ω | ω ∈ A n ainakinyhdellä n
:narvolla} ,
\
n
A n = { ω | ω ∈ A n kaikillan
:narvoilla} .
Huomaa, että
S m n=1
A n ei vähene ja
T m n=1
A n ei kasva, kun m
kasvaa. Jono
{ S m
n=1
A n } , m = 1, 2, . . .
paisuu kohti joukkoaS ∞
n=1
A n ja jono { T m
n=1
A n } , m = 1, 2, . . .
kutistuu kohti joukkoaT ∞ n=1
A n. Ne ovat monotonisia jonoja. Jonoa
{ B n } , n = 1, 2, . . .
sanotaan monotoniseksi, josB 1 ⊂ B 2 ⊂ . . .
(kasvava)taiB 1 ⊃ B 2 ⊃ . . .
(vähenevä). Monotonisille jonoille voidaan määritellä raja- arvo seuraavasti:n→∞ lim B n = [ ∞
n=1
B n ,
kun{ B n } , n ≥ 1
kasvava,ja
n→∞ lim B n =
\ ∞
n=1
B n ,
kun{ B n } , n ≥ 1
vähenevä.OsittelulaitjaDeMorganinlaitvoidaanyleistääilmeisellätavallakoskemaan
äärellisiäja äärettömiä joukkojen jonoja. Esimerkiksi
B ∩ ( [
n
A n ) = [
n
(B ∩ A n ), ( \
n
A n ) c = [
n
A c n .
1.3.3 Todennäköisyys
Oletetaan, että satunnaiskoe ja siihen liittyvä otosavaruus onannettu. Tar-
kastellaannyttodennäköisyydenmääritelemistä.Oletammealuksi,ettäotos-
avaruusonäärellinen.Sillointodennäköisyysvoidaanmääritelläalkeistapah-
tumien avulla.
Määritelmä 1.1 Olkoon
E
satunnaiskoe jaΩ
sen äärellinen otosavaruus.Todennäköisyys onotosavaruudessa
Ω
määritelty reaaliarvoinen kuvausP : Ω → [0, 1],
jolla onseuraavatominaisuudet:
1.
P ( { ω } ) ≥ 0
kaikilla{ ω } ∈ Ω
, ja2.
P
{ω}∈Ω
P ( { ω } ) = 1
.Sanomme, että
P ( { ω } )
onalkeistapahtuman{ ω }
todennäköisyys. Tapah- tumanA
eliΩ
:nosajoukon todennäköisyys määritellään lukuna(1.3.1)
P (A) = X
ω∈A
P ( { ω } ).
Näinfunktio
P
voidaan laajentaajoukkofunktioksi, jokaliittääjokaiseenta- pahtumaanA ⊂ Ω
luvun0 ≤ P (A) ≤ 1
. Ominaisuuksiensa nojalla toden- näköisyyttä kutsutaan yleisessä teoriassa todennäköisyysmitaksi. JosΩ = { ω 1 , ω 2 , . . . , ω n }
,niinX
ω i ∈Ω
P ( { ω i } ) = X n
i=1
P ( { ω i } ) = 1.
Esimerkiksitapahtuman
A = { ω 1 , ω 3 , ω 5 }
todennäköisyysP (A) = P ( { ω 1 } )+
P ( { ω 3 } ) + P ( { ω 5 } )
. Lisäksi määrittelemmemahdottoman tapahtuman, jota merkitääntyhjälläjoukolla∅
,todennäköisyydenP ( ∅ )
nollaksi.Satunnaisko- keen todennäköisyysmalli määritellään antamalla kokeen otosavaruusΩ
jasiihenliittyväfunktio
P
,jokatoteuttaaMääritelmän1.1ehdot.Todennäköi- syysmalli onsiispari(Ω, P )
.Määritelmän mukaan
P ( ∅ ) = 0
. Mahdoton tapahtuma∅
on varman ta-pahtuman
Ω
komplementtieliΩ c = ∅
.TapahtumanA
komplementtionjouk- ko, johon kuuluvatkaikki ne alkeistapaukset, jotka eivät kuulu joukkoonA
.Koska jokainen alkeistapaus
ω
kuuluu joukkoonA
tai sen komplementtiin, mutta ei molempiinsamanaikaisesti,niinX
ω∈A
P ( { ω } ) + X
ω∈A c
P ( { ω } ) = X
ω∈Ω
P ( { ω } ) = 1.
Tästä seuraa,että
P (A) + P (A c ) = 1
, jotenP (A c ) = 1 − P (A).
Määritelmän1.1oletuksettoteuttavafunktiomääritteleetodennäköisyys-
jakauman
Ω
:ssa. JosΩ = { ω 1 , ω 2 , . . . , ω n }
, niin voimme esittää todennäköi- syysjakaumanmuodossaω 1 ω 2 . . . ω n
p 1 p 2 . . . p n ,
missä
p i = P ( { ω i } )
jaP n
i=1 p i = 1. Mikä tahansa Määritelmän 1.1 ehdot
toteuttava reaalilukujoukko { p i | p i = P ( { ω i } ), 1 ≤ i ≤ n }
määrittelee
todennäköisyysjakauman Ω
:ssa.
Esimerkki 1.5 Heitetäänharhatontanoppaa. Silloinsilmälukujenmuodos-
tama otosavaruus on
Ω = { 1, 2, 3, 4, 5, 6 }
. Jos jokainen silmäluku on yhtämahdollinen,niinmääritellään todennäköisyys
P
siten, ettäP (i) = 1
6 , i = 1, . . . , 6.
Tapahtuman'silmäluku pariton'todennäköisyys on
P ( { 1, 3, 5 } ) = P ( { 1 } ) + P ( { 3 } ) + P ( { 5 } ) = 1 6 + 1
6 + 1 6 = 3
6 = 1 2 .
Olemme nyt määritelleet todennäköisyysmallin
(Ω, P )
äärellisessä otos- avaruudessa siten, että jokaisen tapahtuman todennäköisyys voitiin määri-tellä.Olemmekiinnostuneita
Ω
:ntapahtumientodennäkäisyyksistä. Tapah- tumista johdetaanuusia tapahtumia joukko-opin operaatioilla.Määritelmä 1.2 Otosavaruuden
Ω
osajoukkojen kokoelmaA
on algebra,jos seuraavatkolme ehtoa toteutuvat:
a 1 . Ω ∈ A
.a 2 .
JosA ∈ Ω
, niinA c ∈ Ω
.a 3 .
JosA, B ∈ Ω
, niinA ∪ B ∈ Ω
.Todennäköisyyslaskennassatarkasteltavatjoukkokokoelmat(tapahtumienko-
koelmat) muodostavataina algebran. Esimerkkejä joukkoalgebroista ovat:
(a) Suppeinmadollinenalgebra
{ Ω, ∅}
,johon kuuluvatvainotosavaruusΩ
ja tyhjä joukko
∅
.(b) Tapahtuman
A
generoima algebra{ A, A c , Ω, ∅}
.() Otosavaruuden
Ω
kaikkien osajoukkojen kokoelma{ A | A ⊂ Ω }
, jokasisältää myös tyhjän joukon
∅
.Todettakoon, että kaikki mainitutjoukkoalgebrat liittyvätjohonkin oto-
savaruuden
Ω
ositukseen. OlkoonD = { D 1 , . . . , D n }
otosavaruuden ositus. Silloin
D 1 + · · · + D n = Ω
. Jos esimerkiksiΩ =
{ ω 1 , ω 2 , ω 3 }
,niin{{ ω 1 } , { ω 2 } , { ω 3 }}
onΩ
:n ositus,koskaΩ = { ω 1 } + { ω 2 } +
{ ω 3 }
.Tämänosituksenavullavoidaanmääritellä5
eriositusta:D 1 = { ω 1 , ω 2 , ω 3 }
,D 2 = {{ ω 1 , ω 2 } , { ω 3 }}
,D 3 = {{ ω 1 , ω 3 } , { ω 2 }}
,D 4 = {{ ω 2 , ω 3 } , { ω 1 }} D 5 = {{ ω 1 } , { ω 2 } , { ω 3 }}
.Jos muodostetaan osituksenD
joukkojen kaikkiunionit,niinsaadaanjoukkokokoelma, jokaonalgebra.Mukaan otetaanmyös
∅
,jokaaina voidaan ajatella olevan osituksessa. Syntyvää joukkokokoelmaa sano-
taan osituksen
D
indusoimaksi joukkokokoelmaksiα( D )
. Myös käänteinentulos pitää paikkansa. Jos
A
on äärellisen otosavaruudenΩ
osajoukkojen muodostama algebra, niin on olemassa sellainen yksikäsitteinenΩ
:n ositusD
, ettäA
on osituksenD
indusoima algebraeliA = α( D )
.Esimerkki 1.6
(a)
Tarkastellaan otosavaruudenΩ = { ω 1 , ω 2 , ω 3 }
ositustaD 2 = {{ ω 1 , ω 2 } , { ω 3 }}
.MerkitäänA = { ω 1 , ω 2 }
,jotenA c = { ω 3 }
.Silloinosi-tuksen
D 2 indusoima algebraon itse asiassa joukon A
indusoima algebra.
(b)
OlkoonotosavaruusΩ = { ω 1 , ω 2 , ω 3 , ω 3 }
jasenositusD = {{ ω 1 , ω 2 } , { ω 3 } , { ω 4 }}
.OsituksenD 2indusoimaalgebraon{ Ω, ∅ , { ω 1 , ω 2 } , { ω 3 } , { ω 4 } , { ω 1 , ω 2 , ω 3 } , { ω 1 , ω 2 , ω 4 } , { ω 3 , ω 4 }}
.JosmerkitäänD 1 = { ω 1 , ω 2 } , D 2 = { ω 3 }
jaD 3 = { ω 4 }
, niin osituksen D = { D 1 , D 2 , D 3 }
indusoima algebra saadaan muo-
dostamalla joukkojen
D 1 , D 2 ja D 3 kaikki mahdolliset unionit. Esimerkiksi
D 1 ∪ D 3 = { ω 1 , ω 2 , , ω 4 }
jaD 2 ∪ D 3 = { ω 3 , ω 4 }
.Kunsatunnaiskokeellemääritellääntodennäköisyysmalli,kiinnitetäänen-
sin otosavaruus
Ω = { ω 1 , . . . , ω n }
. Sen jälkeen valitaan jokin sellainen os-ajoukkojen kokoelma
A
,jokamuodostaaalgebran.KokoelmanA
alkiotovattapahtumia. Kun
Ω
on äärellinen, valitaan joukkoalgebraksiA
tavallises- tiΩ
:n kaikkien osajoukkojen kokoelma. Sitten jokaiseen alkeistapaukseenω i ∈ Ω, 1 ≤ i ≤ n
liitetään Määritelmän 1.1 mukaisesti epänegatiivinen paino.TapahtumanA ∈ A
todennäköisyysP (A)
määritelläänkaavan(1.3.1) mukaisesti lukunaP (A) = X
ω i ∈A
P ( { ω i } ).
Sanomme, että kolmikko
(Ω, A , P )
määrittelee todennäköisyysmallin, tai todennäköisyysavaruuden. Jos äärelli-
sen otosavaruuden yhteydessä ei erikseen mainita joukkoalgebraa
A
, tarkoi-tetaan
Ω
:n kaikkien osajoukkojen muodostamaa algebraa.1.3.4 Äärettömät otosavaruudet
Edellä on käsitelty vain äärellisiä otosavaruuksia. Esimerkissä 1.3 esitettiin
myösäärettömiä otosavaruuksia,jotka ovatsovelluksissa tavallisia.Jos
Ω
onnumeroituvastiääretön, niin
Ω = { ω 1 , ω 2 , ω 3 , . . . } .
Sillointodennäköisyysfunktiofunktio voidaanmääritelläsamallatavallakuin
äärellisenotosavaruuden tapauksessa. Määritelmä1.1siissoveltuu myösnu-
meroituvastiäärettömiinotosavaruuksiin.SilloinMääritelmän1.1
2.
ehdossaäärellinensumma korvataan äärettömälläsummalla
X ∞
i=1
p i = p 1 + p 2 + p 3 + · · · = 1,
missä
P ( { ω i } ) = p i. Tapahtuman A ∈ Ω
todennäköisyys on
(1.3.2)
P (A) = X
ω i ∈A
P ( { ω i } ),
mutta nyt nyt summa voi olla ääretön. Jos
Ω
ei ole numeroituva(eli onyli- numeroituva),niinMääritelmä1.1eisovellutapahtumientodennäköisyydenmäärittelemiseen, vaan tarvitaan uusia käsitteitä.Niihin palataanmyöhem-
min.
Esimerkki 1.7 Esimerkissä 1.3 tarkasteltiin satunnaiskoetta, jossa heitet-
tään lanttia, kunnes saadaan ensimmäinenklaava.Silloinotosavaruus
Ω = { L, LR, LLR, LLLR, . . . } ,
missä alkeistapaus
ω i = LL . . . L
| {z }
i − 1
R.
Joskruunantodennäköisyys
P ( { R } ) = p
jaklaavantodennäköisyysP ( { L } ) = q
(p + q = 1
),niinP ( { ω i } ) = q i−1 p.
SilloinX ∞
i=1
P ( { ω i } ) = X ∞
i=1
q i−1 p = p
1 − q = 1.
1.3.5 Todennäköisyyden tulkinnat
Todennäköisyyslaskenta ei ole riippuvainen todennäköisyyksien eli lukujen
p
tulkinnoista eikä siitä, miten näitä lukuja mitataan tai arvioidaan. To- dennäköisyyslaskenta on aksiomaattinen matemaattinen teoria. Esimerkiksidiskreetti todennäköisyyslaskenta perustuu Määritelmän 1.1 esittämiin to-
dennäköisyydenominaisuuksiin.Sovelluksissatulkitsemmetodennäköisyydet
usein suureiksi, joitavoidaan estimoidasuhteellisilla frekvensseillä.
Tapahtuman
A
mahdollisuus (odds) määritelläänsuhteena(1.3.3)
odds(A) = P (A)
P (A c ) = P (A) 1 − P (A) .
Tapahtuman
A
mahdollisuus kertoo, kuinka monta kertaa todennäköisem- pää on, ettäA
sattuu, verrattuna siihen, ettäA
ei satu. Jos tapahtumanA
mahdollisuus
odds(A)
onannettu, niinA
:ntodennäköisyys onP (A) = odds(A)
1 + odds(A) .
Esimerkki 1.8 Jos
1000
henkilönpopulaatiossaon600
naistaja400
miestä,niinnaisten suhteellinen osuus on
600
600 + 400 = 0.6.
Jostästäpopulaatistavalitaansatunnaisestiyksihenkilö,niinnaisenvalitse-
misen todennäköisyys on
0.6
. Naisen mahdollisuus (odds
) tulla valituksion6
vastaan4
. Mahdollisuus, että nainen ei tule valituksi on4
vastaan6
. JosA = {
nainen}
jaB = {
mies}
, niinnaisen mahdollisuustulla valituksionodds(A) = P (A)
1 − P (A) = 0.6 0.4 = 3
2 .
Uhkapeluritovatkiinnostuneitahiemanerityyppisestämahdollisuudesta,
nimittäinvoiton mahdollisuudesta (payo odds).Pelikasinotjavedonlyönnin
välittäjät tarjoavat näitä mahdollisuuksia. Jos tapahtuman
A
mahdollisuus on1
vastaan10
jalyöteuronvetoatapahtumanpuolesta,niinA
:nsattuessavoitat
10
euroa.JosA
eisatu,häviätsenyhden euron.Kasinossa maksatpe-limaksunayhdeneuron.Jos
A
sattuu,saat takaisin11
euroa,jokaonvoittosiplus euronpalautus.Jos
A
eisatu, kasinopitää maksamasieuron.Panoksesion
1
euro, kasinon panos10
euroa ja kokonaispanos11
euroa.Voiton mahdollisuuden ja tapahtumanmahdollisuuden välilläon yhteys,
joka on ymmärretty uhkapelin yhteydessä paljon ennen varsinaisen toden-
näköisyyslaskennan syntyä. Puhutaan esimerkiksi ns. reilun pelin säännös-
tä, jokatoteutuu silloin,kuntapahtumaa
A
koskevassa vedolyönnissävoiton mahdollisuus onsama kuinA
:nmahdollisuus elipanos
kasinonpanos
= odds(A).
Reilunpelinsäännönmukaanpanoksensuhteellisenosuudenkokonasipanok-
sesta tulee olla
P (A)
.Eivätainoastaan tapahtumien mahdollisuudetvaan myös mahdollisuuk-
sien suhteet ovat keskeisiä pelitilanteiden analysoinnissa. Ne ovat tärkeitä
käsiteitä myös esimerkiksi frekvenssiaineistojen analyysissa ja logistisessa
regressiossa.Olkoon
A
:nmahdollisuusodds(A)
jaB
:nmahdollisuusodds(B)
.Silloin mahdollisuuksien suhde (odds ratio)
θ(A, B)
on(1.3.4)
θ(A, B) = odds(A)
odds(B) = P (A)/[1 − P (A)]
P (B)/[1 − P (B)] .
Vedonlyöntiterminologian mukaan
θ
on vedonlyöntisuhde. Todennäköisyyk- sienarviointivedonlyönnissäperustuupitkältihenkilökohtaisiinuskomuksiinjakokemuksiin.Myösesimerkiksiliiketoiminnanpäätöksenteossahenkilökoh-
taiset todennäköisyyden tulkinnatvoivat ollakäyttökelpoisia.
1.4 Ehdollinen todennäköisyys
Ehdollistaminenon varsin tehokas ja hyödyllinen tekniikka todennäköisyys-
laskennassaja tilastotieteessä.Käsittelemmetässä luvussa ensimmäisenker-
ran lyhyesti ehdollista todennäköisyyttä, joka tulee olemaan tärkeä käsite
läpikoko kurssin.
Esimerkki 1.9 Heitetäänharhatontanoppaakuten Esimerkissä1.5. Meille
kerrotaan, että on saatu pariton silmäluku, mutta emme tiedä, mikä niistä.
Mikä on silmäluvun
5
todennäköisyys? OlkoonB
'silmäluku pariton' jaA
'silmäluku
5
'. Tiedämme siis, että silmäluku on1
,3
tai5
. Nämä alkeista-paukset ovat yhtätodennäköisiä, jotensilmäluvun
5
todennäköisyys on1/3
.Sanomme, että tapahtuman
A
ehdollinen todennäköisyys ehdollaB
on1/3
.Tätä ehdollista todennäköisyyttä merkitään
P (A | B)
. Huomaamme, ettäainakin tässä esimerkissä
P (A | B) 6 = P (A) = 1/6
.Kun tarkastellaantapahtuman
A
ehdollistatodennäköisyyttäP (A | B)
,rajoitutaantarkastelemaantapahtuman
B
alkeistapauksia.Sittenkatsotaan, kuinka useinB
:ssä sattuu myösA
. Tämä on tapahtuma 'sekäA
ettäB
sattuvat', jotamerkitään
A ∩ B
.Edellisessäesimerkissälaskimmeitseasiassa ehdollisen todennäköisyydenP (A | B)
kaavalla(1.4.1)
P (A | B ) = P (A ∩ B) P (B) .
Todennäköisyys
P (A | B)
onmääritelty,kunP (B ) > 0
.Esimerkki 1.10 Eloonjäämistaulukoissa esitetään eri ikäisenä elossa ole-
vien odotettu lukumäärä
100000
elävänä syntynyttä kohti. Esimerkiksi seu- raavassataulukossaonannettu20
-,45
-ja65
-vuotiaanaelossaoleviennaistenlukumääräteräässä väestössä
100000
elävänä syntynyttä tyttölasta kohti.Ikä 20 45 65
Elossa 98040 95662 84483
Tässä voidaan ajatella, että alkuperäinen otosavaruus
Ω
on100000
tyt-tölasta. Mikä on todennäköisyys, että 20-vuotias elää 45-vuotiaaksi (tar-
koittaa itse asiassa, että elää ainakin 45-vuotiaaksi)? Olkoon
A =
'elää45-vuotiaaksi' ja
B =
'elää 20-vuotiaaksi'. Koska 20-vuotiaaksi on elänyt98040
naista ja näistä 45-vuotiaaksi95662
, niin kysytty todennäköisyys on95662/98040 = 0.97574
. Laskettaessa ehdollista todennäköisyyttä valitaan perusjoukoksiB
ja katsotaan kuinkamoni näistä selviää 45-vuotiaaksi.Nyt tapahtuma
A ∩ B
on'elää45
-vuotiaaksi',koska45
-vuotiaksieläneetovateläneetmyös
20
-vuotiaksi.Koska20
-vuotiaaksielää98040
,niinP (B) = 98040/100000 = 0.98040
.VastaavastiP (A ∩ B) = 95662/100000 = 0.95662
.Ehdollinen todennäköisyys
P (A | B) = P (A ∩ B)
P (B) = 0.95662
0.98040 = 0.97574.
1.4.1 Ehdollisen todennäköisyyden frekvenssitulkinta
Olkoot
A
jaB
jotkut satunnaiskokeenE
otosavaruuteenΩ
liittyvät tapah-tumatja
N n (A ∩ B)
ontapahtumanA ∩ B
frekvenssi jaN n (B)
tapahtumanB
frekvenssi, kunsatunnaiskoeE
toistetaann
kertaa. Voimmeajatella,että(1.4.2)
P (A | B) ≈ N n (A ∩ B)
N n (B) = N n (A ∩ B)/n
N n (B )/n ≈ P (A ∩ B) P (B) ,
kun toistojenlukumäärä
n
onsuuri.1.4.2 Kertolaskusääntö
Koskaehdollisen todennäköisyyden kaavassa(1.4.1)
P (B) > 0
,saadaansiitäkertolaskusääntö
(1.4.3)
P (A ∩ B) = P (B) P (A | B)
tapahtuman
A ∩ B
todennäköisyyden laskemiseksi.1.4.3 Riippumattomuus
Sanomme, että tapahtumat
A
jaB
ovatriippumattomat, jos (1.4.4)P (A ∩ B) = P (A) P (B).
Huomaa,ettäehdollinentodennäköisyys(1.4.1)eiolemääritelty,jos
P (B) = 0
, mutta riippumattomuudenmääritelmä (1.4.4)on silloinkin voimassa. JosP (B) 6 = 0
ja (1.4.4) pitääpaikkansa, niinP (A | B ) = P (A ∩ B)
P (B ) = P (A).
Jos
A
jaB
ovatriippumattomat, niintietoB
:nsattumisesta ei vaikutaA
:ntodennäköisyyteen. Jos
P (A) > 0
, niinmyösP (B | A) = P (A ∩ B)/P (A) = P (B)
,kunA
jaB
ovatriippumattomat.1.5 Odotetut frekvenssit
Kokeen
E
todennäköisyysmalli(Ω, P )
onteoreettinenkonstruktio.Mallinhy- vyys käytännön sovelluksissa on tutkittava empiirisesti. Tämä tehdään ver-tailemalla kokeen (empiirisen ilmiön) havaittuja tuloksia mallin perusteella
odotettavissa oleviin tuloksiin. Oletetaan, että koe toistetaan
n
kertaa. Jostapahtuman
A
todennäköisyys on mallinmukaanp
, niinsilloinA
:n odotettufrekvenssi eli teoreettinen frekvenssi on
np
. JosA
sattui suoritetussa tois- tokokeessan A kertaa, niin tätä havaittua frekvenssiä verrataan odotettuun
frekvenssiin. Josn A poikkeaa liianpaljon odotetusta frekvenssistä np
, niin
np
, niinmalli(teoria)joutuu kyseenalaiseksi.Havainnot eivätsillointue teoriaa.Sii-
hen, mikäonliiansuuri poikkeama, pyrimmevastaamaantodennäköisyys-
laskennan ja tilastotieteenavulla.
Johdanto: Yhteenveto
•
Empiirinen kertymäfunktio. Lukujenx 1, x 2, ..., x n empiirinen kertymä-
x n empiirinen kertymä-
funktio on
F n (a) = 1
n |{ i : 1 ≤ i ≤ n, x i ≤ a }| ,
missä
−∞ < a < ∞
ja| . |
onjoukon alkioiden lukumäärä.•
Empiirinen jakaumafunktio tailyhyesti empiirinen jakauma onP n (a, b) = F n (b) − F n (a).
•
OtosavaruusΩ
onsatunnaiskokeen (taisatunnaisilmiön)mahdollisten tu- losten (alkeistapaustenω
) joukko. Satunnaiskokeessa voi sattua yksi ja vainyksi alkeistapaus.•
Tapahtumaon otosavaruudenΩ
osajoukko.A
jaB
tapahtumiaA ⊂ Ω
jaB ⊂ Ω
Ω
varma tapahtuma∅
mahdotontapahtumaA ⊂ B
josA
sattuu,niinB
sattuuA c A
eisatuA ∪ B A
taiB
sattuu (taimolemmat)A ∩ B
,AB
sekäA
ettäB
sattuvatA \ B = A ∩ B c A
sattuu,mutta eiB
A ∩ B = ∅ A
jaB
pistevieraat (toisensapoissulkevat)A
:n ositusA = A 1 ∪ A 2 ∪ · · · ∪ A m ja A i ∩ A j = ∅
, i 6 = j
•
De Morganinlait(A ∪ B) c = A c ∩ B c , (A ∩ B) c = A c ∪ B c .
•
TodennäköisyysP
onotosavaruudessaΩ
(numeroituva)määriteltyfunktioP : Ω → [0, 1]
, jollaon seuraavat ominaisuudet:1.
P (ω) ≥ 0
kaikillaω ∈ Ω
, ja2.
P
ω∈Ω
P (ω) = 1
.•
TapahtumanA
todennäköisyysP (A) = P
ω∈A
P (ω)
.•
TapahtumanA
mahdollisuusodds(A) = P (A)
P (A c ) = P (A)
1 − P (A) .
•
Vedonlyöntisuhdeθ(A, B) = odds(A) odds(B) .
• A
:ntodennäköisyys ehdollaB
P (A | B) = P (A ∩ B )
P (B) , P (B) > 0.
•
KertolaskusääntöP (A ∩ B) = P (B) P (A | B)
.•
Riippumattomuus:A
jaB
ovatriippumattomat,josP (A ∩ B) = P (A) P (B )
.•
Todennäköisyysmalli: KokeenE
todennäköisyysmalli on otosavaruudenΩ
ja todennäköisyyden
P
muodostamakaksikko(Ω, P )
.Harjoituksia
1. Aineistossakaivos_onn.dat onaikajärjestyksessä pahojen(yli
10
kuol-lutta)peräkkäistenkaivosonnettomuuksienväliajat(päivinä)ajanjaksol-
ta6.12.187529.5.1951.Piirräväliaikojenfrekvenssihistogrammakoko
aineistosta ja erilliset histogrammat
56
:sta ensimmäisestä ja53
:sta vii-meisestähavainnosta. Kommentoieroja ja yhtäläisyyksiä.
2. Oletetaan, että histogrammassa kahden vierekkäisen suorakaiteen kan-
nan leveydet ovat
k 1 ja k 2 sekä korkeudet h 1 ja h 2. Yhdistetään suo-
rakaiteet yhdeksi suorakaiteeksi. Esitä uuden suorakaiteen korkeuden h
h 1 ja h 2. Yhdistetään suo-
rakaiteet yhdeksi suorakaiteeksi. Esitä uuden suorakaiteen korkeuden h
h
lauseke ja osoita, että
h
onkorkeuksienh 1 ja h 2 välissä.
3. Heitä harhatonta noppaa (R-ohjelma) 60, 120, 240, 480, 960 ja 2000
kertaa ja laske erisilmälukujen suhteelliset frekvenssit eri heittosarjois-
sa.Piirrämyössuhteellistenfrekvenssienhistogrammat.Mitenheittojen
lkm:n
n
kasvattaminen vaikuttaasuhteellisiin frekvensseihin?4. HenkilöilleX,Y,ZjaWonkullekinosoitettukirje.Jokaisellekirjeelleon
varattu osoitteellavarustettu kirjekuori. Kirjeet pannaan satunnaisesti
kirjekuoriin.
(a) Mikäontämän kokeen 24alkeistapahtumanotosavaruus.
(b) Luettele seuraaviin tapahtumiin liittyvätalkaistapahtumat.
A
: X:n kirje meneeoikeaan kuoreen;B
: Mikään kirje ei mene oikeaan kuoreen;C
: Täsmälleen kaksi kirjettämenee oikeaan kuoreen;D
: Täsmälleen kolme kirjettä menee oikeaan kuoreen;() Laske edellisessä kohdassa mainittujen tapahtumien todennäköi-
syydet, jos oletetaan, että kaikki alkeistapaukset ovat yhtä toden-
näköisiä. Määritätapahtumien
A
,C
jaD
mahdollisuudettapahtu- maaB
vastaan.5. Kaksijoukkuetta pelaa parasseitsemästäsarjaa. Se joukkuevoittaa,jo-
ka on ensiksi voittanut neljä peliä. Mikä on kokeen otosavaruus? Jos
joukkueet ovat tasavahvoja (ja pelien tulokset toisistaan riippumatto-
mia),niinmitkäovaterialkeistapahtumientodennäköisyydet? Mikäon
todennäköisyys, että voittoontarvitaan
7
peliä?6. Tarkastellaansellaista noppaa, että
p 1 = p 2 = p 3 = p 4 = p
jap 5 = p 6 = q
. Kirjoitetaantnp
muodossap = 1 6 + θ
.(a) Lausu
q θ
:n avulla.(b) Heitetään noppaa
n
kertaa ja saadaansilmälukujen 1, 2,3, 4,5, 6 lukumääriksin 1, n 2,n 3, n 4, n 5,n 6. Miten estimoisitθ
:narvon?
n 3, n 4, n 5,n 6. Miten estimoisitθ
:narvon?
n 5,n 6. Miten estimoisitθ
:narvon?
θ
:narvon?() Heitettiin noppaa 30, 120, 600 ja 1200. Silmälukujen frekvenssit
olivat.
Silmäluvut
n 1 2 3 4 5 6
30 6 10 6 5 0 3
120 29 17 35 25 9 5
600 126 119 141 124 50 40
1200 255 278 231 254 90 92
Laske
θ
:n,p
:n jaq
:n estimaatit.7. (a) Mikäontn-malli,kunheitetäänsamanaikaisestikolmeaharhatonta
lanttia.
(b) Määritä tn saada
x
kruunua.() Heitettiin kolmea lanttia
80
kertaa ja saatiin seuraavat kruunujenlukumäärät.
1 1 1 1 2 1 1 2 2 1 1 2 2 3 2 1 1 2 1 2 0 1 1 0 2 1 0
1 1 3 0 3 0 1 2 1 2 1 2 2 1 3 1 2 2 0 1 1 1 3 2 0 3 2
0 2 0 1 0 1 1 3 2 2 1 1 2 1 2 1 1 1 2 3 3 2 0 2 1 3
Määritä kruunujen lukumäärän odotetut ja havaitut frekvenssit.
Ovatkohavainnot sopusoinnussa mallin kanssa (Heitot tiedostossa
H1.8_heitot.dat)?
8. (a) Heitetäänsamanaikaisesti kahtanoppaaja olkoontulossilmäluku-
jen summa. Olkoot kaikki 36alkeistapausta ovat yhtä todennäköi-
siä. Osoita,että tuloksen tn-jakauma on:
Tulos 2 3 4 5 6 7 8 9 10 11 12
36 ×
tn 1 2 3 4 5 6 5 4 3 2 1(b) Heitä kahta noppaa
100
kertaa. Vertaa tuloksen havaittuja fre-kvenssejä odotettuihinfrekvensseihin.
9. Vuoden 2003 jääkiekonpudotuspelijoukkueet olivatHPK(
1/3
),Jokerit(
1/2
), Kärpät (1/3
), Espoon BLUES (1/6
),Tappara (1/3
), JYP (1/7
),HIFK(
1/6
)ja TPS (1/9
). Eräällä työpaikallajärjestettiin ennen pudo- tuspelien alkua vuoden mestaria koskeva vedonlyönti käyttäen suluissailmoitettujavoiton mahdollisuuksia. Josveikkasitesimerkiksi Tapparaa
mestariksi,niinvoititpanoksesi kolminkertaisena.
(a) Laskeannettujenvoitonmahdollisuuksien(payoodds)avullajouk-
kueiden voiton todennäköisyydet kaavalla (1.3.2). Laske todennä-
köisyyksien summa
S
.(b) Skaalaaedellisessäkohdassalasketuttodennäköisyydet jakamalla
ne summalla
S
.Miksi skaalaus ontarpeellinen?() Oleta, että skaalatut todennäköisyydet ovat oikeita. Laske odo-
tettu voittosi, jos veikkasit Tapparaa[voitto
× P (A) +
panoksesi× (1 − P (A))
℄. Toteuttaako veikkaus reilun pelinsäännön?10. Eräässäkyselyssä tutkittiin suhtautumista lailliseen aborttiinja saatiin
oheisessa taulukossa esitetyt tulokset.
Asenne
Sukupuoli Myönteinen Kielteinen Yhteensä
Nainen 309 191 500
Mies 319 281 600
Yhteensä 628 472 1100
Käytä todennäköisyyksien estimaatteinasuhteellisiafrekvenssejä.
(a) Lasketodennäköisyys, että(i)nainen(ii)miessuhtautuuaborttiin
positiivisesti (tarkasteltavassa otosavaruudessa).
(b) Laske mahdollisuudet (odds), että (i) nainen (ii) mies suhtautuu
aborttiin positiivisesti.
() Laskemahdollisuuksien suhde(odds ratio, vedonlyöntisuhde).
11. Esimerkissä 1.2(luennot) on annettu erään kurssin 1. välikokeen piste-
määrät.
(a) Laskeempiirisen kertymäfunktion (ekf) arvo pisteessä
15.3
.(b) Lausu empiirisen jakaumanarvo
P 20 (18.5, 20.5)
ekf:n avulla.() Laske histogrammissa luokkaa
[18.5, 20.5]
kuvaavan pylvään kor-keus.
Todennäköisyys ja
satunnaismuuttuja
Tässä luvussa käsitellään lähinnä vain äärellisiä ja numeroituvasti äärettö-
miäotosavaruuksia
Ω
.Lopuksiesitetään todennäköisyydenaksioomat,jotka soveltuvat myös silloin,kunΩ
ei olenumeroituva.2.1 Todennäköisyyden ominaisuuksia
Seuraavassa lauseessa on esitetty todennäköisyyden keskeiset ominaisuudet.
Erityisesti numeroituvien otosavaruuksien tapauksessa lauseen tulokset on
helppo todistaa.
Lause 2.1 Oletetaan, että
Ω
on numeroituva otosavaruus jaP
onΩ
:ssamääriteltytodennäköisyys.Todennäköisyydellä
P
onseuraavatominaisuudet:1.
P (A) ≥ 0
kaikillaA ⊂ Ω
.2.
P (Ω) = 1
.3. Jos
A ⊂ B ⊂ Ω
, niinP (A) ≤ P (B)
.4. Jos
A
jaB
ovat erilliset(A ∩ B = ∅ )
, niinP (A ∪ B) = P (A) + P (B )
.5.
P (A c ) = 1 − P (A)
kaikillaA ⊂ Ω
.Todistus. Jokaisen tapahtuman
A ⊂ Ω
todennäköisyys onMääritelmän1.1 mukaanP (A) = X
ω∈A
P (ω).
Koska
P (ω) ≥ 0
kaikillaω ∈ Ω
, niinP (A) ≥ 0
. Näinon 1.kohtatodistettu.Toinenkohta pitää paikkansa, koska Määritelmän 1.1
P (Ω) = X
ω∈Ω
P (ω) = 1.
Ominaisuuksien 35 todistaminen jätetäänharjoitustehtäväksi.
Todennäköisyyden additiivisuus (Ominaisuus 4) voidaan suoraviivaisesti
yleistää useammalle kuinkahdelle erillisellejoukolle.
Lause 2.2 Olkoot
A 1, A 2, ..., A n parittainpistevieraat (erilliset) Ω
:n osa-
A n parittainpistevieraat (erilliset) Ω
:n osa-
joukot eli tapahtumat (ts.
A i ∩ A j = ∅
, kuni 6 = j
). SilloinP (A 1 ∪ A 2 ∪ · · · ∪ A n ) = P (A 1 ) + P (A 2 ) + · · · + P (A n ).
Itse asiassa additiivisuusyleistyy myösärettömän monelle parittaineril-
liselle tapahtumalle
A 1, A 2, A 3, ... Silloin
A 3, ... Silloin
P (A 1 ∪ A 2 ∪ A 3 ∪ · · · ) = P (A 1 ) + P (A 2 ) + P (A 3 ) + · · · .
Jos
A 1, A 2, ..., A n ovat parittain erilliset (ts. A i ∩ A j = ∅
, kun i 6 = j
) ja
Ω = A 1 ∪ A 2 ∪ · · · ∪ A n,niin joukkokokoelma A 1 , A 2 , . . . , A n onotosavaruu-
den Ω
ositus.
A n ovat parittain erilliset (ts. A i ∩ A j = ∅
, kun i 6 = j
) ja
Ω = A 1 ∪ A 2 ∪ · · · ∪ A n,niin joukkokokoelma A 1 , A 2 , . . . , A n onotosavaruu-
den Ω
ositus.
A 1 , A 2 , . . . , A n onotosavaruu-
den Ω
ositus.
Lause 2.3 Olkoon kokoelma
A 1 , A 2 , . . . , A n otosavaruuden Ω
ositus ja E ⊂ Ω
on jokin tapahtuma. Silloin
P (E) = X n
i=1
P (E ∩ A i ).
Seuraus 2.1 Mille tahansa kahdelle tapahtumalle
A
jaB
pitää paikkansa,että
P (A) = P (A ∩ B) + P (A ∩ B c ).
Lauseen 2.1 kohta 4 voidaan yleistää myös joukoille, jotka eivät ole eril-
lisiä.Tällöinsaadaan seuraavayhteenlaskulause.
Lause 2.4 Jos
A ⊂ Ω
jaB ⊂ Ω
, niin(2.1.1)
P (A ∪ B ) = P (A) + P (B) − P (A ∩ B ).
Todistus. KutenKuvio 2.1osoittaa,joukot
A ∩ B c,A ∩ B
,A c ∩ B
muodos-
A ∩ B c A ∩ B A c ∩ B
A c ∩ B c
Kuvio 2.1. Tapahtuman
A ∪ B
ositus.tavat tapahtuman
A ∪ B
osituksen. Siksi(2.1.2)
P (A ∪ B) = P (A ∩ B c ) + P (A ∩ B) + P (A c ∩ B).
Seurauslauseen 2.1mukaan vastaavasti
P (A) = P (A ∩ B c ) + P (A ∩ B ) P (B) = P (A c ∩ B) + P (A ∩ B ),
joten
(2.1.3)
P (A) + P (B) = P (A ∩ B c ) + P (A c ∩ B ) + 2 P (A ∩ B ).
Kunidentiteetistä(2.1.3)vähennetäänpuolittain
P (A ∩ B ),
saadaanlausekeP (A) + P (B) − P (A ∩ B ) = P (A ∩ B c ) + P (A c ∩ B) + P (A ∩ B),
jonka oikea puoli on (2.1.2):n mukaan
P (A ∪ B)
. Näin yhteenlaskulause ontodistettu.
Tämätodennäköisyyksienyhteenlaskulausevoidaanedelleenyleistäämie-
livaltaisenmonelletapahtumalle.Esitämmealuksiyleistyksen, kuntapahtu-
miaonkolme. Yleinentapaus saadaansamalla periaatteella,muttase esite-
tään vasta myöhemmin.
Lause 2.5 Jos
A 1, A 2 ja A 3 ovat Ω
:n osajoukkoja (tapahtumia), niin
(2.1.4) P (A 1 ∪ A 2 ∪ A 3 ) = P (A 1 ) + P (A 2 ) + P (A 3 ) − P (A 1 ∩ A 2 )
A 3 ovat Ω
:n osajoukkoja (tapahtumia), niin
(2.1.4) P (A 1 ∪ A 2 ∪ A 3 ) = P (A 1 ) + P (A 2 ) + P (A 3 ) − P (A 1 ∩ A 2 )
− P (A 1 ∩ A 3 ) − P (A 2 ∩ A 3 ) + P (A 1 ∩ A 2 ∩ A 3 ).
Bonferronin epäyhtälö. Koska
P (A ∪ B) ≤ 1
, seuraa Lauseesta 2.4epäyhtälö
(2.1.5)
P (A ∩ B) ≥ P (A) + P (B) − 1.
Epäyhtälöä 2.1.5 sanotaan Bonferronin epäyhtälöksi.
Esimerkki 2.1 Bonferronin epäyhtälö saattaa olla käyttökelpoinen silloin,
kuneipystytä laskemaantodennäköisyyttä
P (A ∩ B)
tarkasti,muttatunne-taan todennäköisyydet
P (A)
jaP (B)
. Olkoon esimerkiksiP (A) = P (B) = 0.95
. SilloinP (A ∩ B) ≥ 0.95 + 0.95 − 1 = 0.90.
Jos
P (A) + P (B) < 1
, niin alaraja (2.1.5):ssa on negatiivinen ja epäyhtälöpitää triviaalistipaikkansa.
2.2 Symmetriaan perustuva todennäköisyys
Jos äärellisen otosavaruuden
Ω = { ω 1 , ω 2 , . . . , ω n }
jokainen alkeistapaus on yhtä mahdollinen,niinjakaumafunktioonp i = P ( { ω i } ) = 1
n , 1 ≤ i ≤ n
missä
n
on alkeistapausten lukumäärä. Silloin jokaisen tapahtuman toden- näköisyys on yksinkertaisesti(2.2.1)
P (A) = X
ω i ∈A
p i = X
ω i ∈A
1
n = | A | n ,
missä
| A |
onA
:n alkioiden lukumäärä. TapahtumanA
todennäköisyys saa- daan siis jakamallaA
:n alkeistapausten lukumäärä kaikkien alkeistapahtu- mien lukumäärällän
. Tätä 'suotuisat per kaikki' -sääntöä kutsutaan myösklassiseksi todennäköisyyden määritelmäksi.
Esimerkki 2.2 Heitetään harhatonta noppaa. Silloin eri silmälukuja voi-
daan pitää yhtä mahdollisina ja jakaumafunktio on perusteltua määritellä
p i = 1 6,i = 1, . . . , 6
otosavaruudessaΩ = { 1, 2, 3, 4, 5, 6 }
.Josheitetäänkahta
noppaa, voidaan symmetrisiksialkeistapauksiksivalitajärjestetyt parit
(1, 1), (1, 2), (1, 3), . . . , (6, 6).
Siinätuloksetonannettumuodossa
(
1.nopansilmäluku,2.nopansilmäluku)
.Tämänsatunnaiskokeen otosavaruus on siis
Ω = { (i, j) | i, j ∈ { 1, 2, 3, 4, 5, 6 } } .
Koska
| Ω | = 36
,niinP { (i, j) }
= 36 1 kaikillai, j ∈ { 1, 2, 3, 4, 5, 6 }
.
Väitetään,että ranskalainenaatelismiesjauhkapeluri Chevalier de Méré
havaitsi kokeellisestiseuraavantuloksen:
(i) Heitettäessänoppaa
4
kertaakannattaalyödävetoa siitä,ettäsaadaanainakin yksi kuutonen.
(ii) Heitettäessä kahta noppaa
24
kertaa ei kannata lyödävetoa siitä, ettäsaadaanainakin yksi kuutospari.
De Méré huomasi jäävänsä pitkässä pelisarjassa häviölle lyödessään ve-
toa kuutosparin puolesta. Hän ei kuitenkaan pystynyt teoreettisesti selittä-
mään havaintoaan (de Mérén ongelma) ja niinpä hän kääntyi ranskalaisen
loson ja matemaatikon Pasalin puoleen (n. 1650). De Mérén ongelman
uskotaan antaneen alkusysäyksen kuuluisaan Pasalin ja Fermatin väliseen
kirjeenvaihtoon, joka johti todennäköisyyslaskennan syntyyn.
Klassisen määritelmän mukaan tapahtuman
A
todennäköisyys saadaan jakamalla joukonA
alkioiden lukumäärä kaikkien alkeistapausten lukumää- rällä. Vaikka tehtävä on periaatteessa helppo, se voi käytännössä osoittau-tua yllättävän hankalaksi. Lukumäärien laskemisen helpottamiseksi esitäm-
meseuraavassa joitainkombinatoriikanperiaatteita ja tuloksia.
2.3 Aksiomaattinen lähestymistapa
Todennäköisyys luonnehditaan otosavaruuden
Ω
tietyssä osajoukkojen ko-koelmassamääriteltynäfunktiona.Tässä alaluvussakäsitelemmehiemanto-
dennäköisyyden aksiomatiikkaa. Esitämme todennäköisyyden määritelmän,
jostasenominaisuudetvoidaanjohtaa.EsimerkiksiLauseessa 2.1esitetytto-
dennäköisyyttä koskevat tulokset seuraavat suoraan Määritelmässä 2.1 esi-
tetyistäaksioomeista.Määritelmään2.1perustuvissa todistuksissaeitarvita
oletusta,että
Ω
onnumeroituva (äärellinen tainumeroituvastiääretön).2.3.1 Äärellinen additiivisuus
Kunotosavaruus onäärellinen,voidaantodennäköisyyksiä tarkastellaotosa-
varuuden
Ω
osajoukkojen muodostamassa algebrassa. Määritelmän 2.1 toi- sessa kohdassa esitetty todennäköisyyden yksinkertainen äärellinen additii-visuus riittäääärellisissäotosavaruuksissa(ominaisuuksien
1
ja3
lisäksi)to-dennäköisyyden määrittelemiseen.
Määritelmä 2.1 Olkoon
A
otosavaruudenΩ
osajoukkojenmuodostamaal- gebra. Todennäköisyys on kuvausP : A → [0, 1]
, joka toteuttaa seuraavatkolme aksioomaa:
1.
P (A) ≥ 0
kaikillaA ∈ A
.2. Jos
A, B ∈ A
jaA ∩ B = ∅
, niinP (A ∪ B ) = P (A) + P (B)
.3.
P (Ω) = 1.
Jos
Ω = { ω 1 , ω 2 , ω 3 , . . . }
on numeroituvasti ääretön, alkeistapahtuman{ ω i }
todennäköisyysP ( { ω i } ) = p i ≥ 0, i ≥ 1
jajaP (Ω) = P ∞
i=1 p i = 1, niin
Määritelmän 2.1 aksiomeistaseuraa, että
Ω
:n kaikkien osajoukkojenA ⊂ Ω
todennäköisyys saadaan kaavalla (1.3.2) eli
P (A) = P
ω i ∈A P ( { ω i } ). Silloin
kokoelma
A
onΩ
:nkaikkien osajoukkojen muodostamaalgebra.Huomatta- koon, ettäkaikkienalkeistapahtumientodennäköisyyseivoiollasama,josΩ
onääretön. Yleisessätapauksessa tarvitaanvahvempiaoletuksiatodennäköi-
syyden määrittelemiseksi,muttanumeroituvan
Ω
:n tapauksessa Määritelmä 2.1 on riittävä.2.3.2 Todennäköisyyden yleiset aksioomat
Numeroituvien otosavaruuksientapauksessa onkaikkiintapahtumiinhelppo
liittää todennäköisyydet alkeistapahtumien todennäköisyyksien avulla. To-
dennäköisyyden keskeiset ominaisuudet (Lause 2.1) seuraavat sitten aksioo-
meista 2.1. Jos tapahtumat