• Ei tuloksia

1 Väliestimointi:Mitä opimme? –3/3 Väliestimointi:Esitiedot Väliestimointi:Mitä opimme? –1/3 Väliestimointi:Mitä opimme? –2/3 Väliestimointi Väliestimointi

N/A
N/A
Info
Lataa
Protected

Academic year: 2022

Jaa "1 Väliestimointi:Mitä opimme? –3/3 Väliestimointi:Esitiedot Väliestimointi:Mitä opimme? –1/3 Väliestimointi:Mitä opimme? –2/3 Väliestimointi Väliestimointi"

Copied!
19
0
0

Kokoteksti

(1)

TKK (c) Ilkka Mellin (2004) 1

Johdatus tilastotieteeseen

Väliestimointi

TKK (c) Ilkka Mellin (2004) 2

Todennäköisyysjakaumien parametrien estimointi Luottamusväli

Normaalijakauman odotusarvon luottamusväli Normaalijakauman varianssin luottamusväli Bernoulli-jakauman odotusarvon luottamusväli

Väliestimointi

TKK (c) Ilkka Mellin (2004) 3

Väliestimointi:

Mitä opimme? – 1/3

Tilastollisen tutkimuksentavoitteena on tehdä johtopäätöksiä prosesseistatai mekanismeista, jotka generoivatreaalimaailman ilmiöitä koskevia havaintoja.

Tavoitteeseen pyritään rakentamalla havainnot generoineille prosesseille tai mekanismeille tilastollisia malleja.

Koska tilastollisten tutkimusasetelmien havaintoihin liittyy aina satunnaisuuttatai epävarmuutta, tilastollisina malleina käytetään todennäköisyysmalleja.

Tilastollinen malli havainnot generoineelle prosessille tai mekanismille on täysin määrätty, jos havaintojen todennäköisyys- jakaumatunnetaan.

TKK (c) Ilkka Mellin (2004) 4

Väliestimointi:

Mitä opimme? – 2/3

Tilastollisena mallina käytettävän todennäköisyysjakauman parametrejaeisovellustilanteessa yleensä tunneta.

Jakauman parametreille on löydettävä estimaatiteli arviot, jotta jakaumaa voisi hyödyntää mallina.

Tilastollisen tutkimuksentärkeimpiä osatehtäviä on estimoidaeli arvioidamallina käytettävän todennäköisyysjakauman tuntemattomat parametrit ilmiötä koskevista havainnoista.

Havaintojen funktiota, joka tuottaa ilmiötä koskeviin havaintoihin sovellettuna estimaattejaeli arvioitatodennäköisyysjakauman tuntemattomalle parametrille, kutsutaan parametrin estimaattoriksi.

TKK (c) Ilkka Mellin (2004) 5

Väliestimointi:

Mitä opimme? – 3/3

Tilastotieteentärkeimpiä osatehtäviä on johtaaestimaattoreita todennäköisyysjakauman parametreille.

Estimaattoreiden johtamiseen käytetään tavallisesti joko suurimman uskottavuuden menetelmäätai momenttimenetelmää.

Ks. lukua Estimointimenetelmät.

Todennäköisyysjakauman tuntemattomien parametrien arvojen määräämistä kutsutaan usein piste-estimoinniksierotukseksi väli- estimoinnista, jossa parametreihin liitetään luottamusväleiksi kutsutut välit, joka sisältävät parametrien todelliset arvot soveltajan valittavissa olevilla todennäköisyyksillä.

TKK (c) Ilkka Mellin (2004) 6

Väliestimointi:

Esitiedot

Esitiedot: ks. seuraavia lukuja:

Tilastollisten aineistojen kerääminen ja mittaaminen Tilastollisten aineistojen kuvaaminen

Otos ja otosjakaumat Estimointi Estimointimenetelmät

Satunnaismuuttujat ja todennäköisyysjakaumat Jakaumien tunnusluvut

Diskreettejä jakaumia Jatkuvia jakaumia

(2)

TKK (c) Ilkka Mellin (2004) 7

Väliestimointi:

Lisätiedot

Todennäköisyysjakaumien parametreja koskevien tilastollisten hypoteesien testaamistakäsitellään luvussa

Tilastolliset testit

Jakaumaoletuksien testaamistakäsitellään luvussa

Yhteensopivuuden, homogeenisuuden ja riippumattomuuden testaaminen

TKK (c) Ilkka Mellin (2004) 8

>> Todennäköisyysjakaumien parametrien estimointi Luottamusväli

Normaalijakauman odotusarvon luottamusväli Normaalijakauman varianssin luottamusväli Bernoulli-jakauman odotusarvon luottamusväli

Väliestimointi

TKK (c) Ilkka Mellin (2004) 9

Avainsanat Estimaatti Estimaattori Estimointi Havainto Havaintoarvo Parametri Otos Otosjakauma Parametri Piste-estimointi Tilastollinen aineisto Tilastollinen malli Todennäköisyysjakauma Väliestimointi

Parametrien estimointi

TKK (c) Ilkka Mellin (2004) 10

Todennäköisyysjakaumien parametrien estimointi

Todennäköisyysjakaumat tilastollisten aineistojen kuvaajina

Tilastollinen aineistokoostuu tutkimuksen kohteita kuvaavien muuttujien havaituista arvoista.

• Tilastollisissa tutkimusasetelmissa havaintoihin liittyy aina epävarmuuttaja satunnaisuutta.

• Tilastollisissa tutkimusasetelmissa tutkimuksen kohteita kuvaavat muuttujat tulkitaan satunnaismuuttujiksi, jotka generoivatmuuttujien havaitut arvot.

Tilastollisella mallillatarkoitetaan havaintoarvot generoineiden satunnaismuuttujien todennäköisyys- jakaumaa.

TKK (c) Ilkka Mellin (2004) 11

Todennäköisyysjakaumien parametrien estimointi

Todennäköisyysjakaumien parametrit 1/2

• Tarkastellaan jotakin tutkimuksen kaikkien mahdollisten kohteiden muodostaman perusjoukon Salkioiden ominaisuutta kuvaavaa satunnaismuuttujaa X.

• Oletetaan, että satunnaismuuttuja Xnoudattaa toden- näköisyysjakaumaa, jonka pistetodennäköisyys- tai tiheysfunktio

f(x; θ)

riippuu parametristaθ.

• Merkintä:

~ ( ; ) X f x θ

TKK (c) Ilkka Mellin (2004) 12

Todennäköisyysjakaumien parametrien estimointi

Todennäköisyysjakaumien parametrit 2/2

• Satunnaismuuttujan Xpistetodennäköisyys- tai tiheysfunktio

f(x; θ)

kuvaa satunnaismuuttujanX todennäköisyysjakaumaa ja parametri θkuvaa jotakin jakauman karakteristista ominaisuutta.

• Koska parametrin θarvoa eisovellustilanteessayleensä tunneta, tilastollisen tutkimuksen tärkeimpiä osatehtäviä on estimoidaeli arvioidatuntemattomalle parametrille θ sopiva arvo jakaumasta f(x; θ) poimitun otoksen perusteella.

(3)

TKK (c) Ilkka Mellin (2004) 13

Todennäköisyysjakaumien parametrien estimointi

Yksinkertainen satunnaisotos

• Olkoon

X1, X2, … , Xn

yksinkertainen satunnaisotosjakaumasta, jonka pistetodennäköisyys- tai tiheysfunktio f(x; θ) riippuu parametrista θ.

• Tällöin havainnot X1, X2, … , Xnovat riippumattomia, identtisesti jakautuneita satunnaismuuttujia, joilla on sama pistetodennäköisyys-tai tiheysfunktio f(x; θ):

1, 2, ,

~ ( ; ) , 1, 2, ,

n i

X X X

X f x θ i n

=

TKK (c) Ilkka Mellin (2004) 14

Todennäköisyysjakaumien parametrien estimointi

Havainnot ja havaintoarvot

• Oletetaan, että satunnaismuuttujat (havainnot) X1, X2, … , Xn

saavat poimitussa otoksessahavaituiksi arvoikseenluvut x1, x2, … , xn

Havaintoarvot x1, x2, … , xn

vaihtelevat satunnaisesti otoksesta toiseenjakaumasta f(x; θ)

saatavin todennäköisyyksin.

TKK (c) Ilkka Mellin (2004) 15

Todennäköisyysjakaumien parametrien estimointi

Estimaattorit ja estimaatit 1/2

• Oletetaan, että todennäköisyysjakauman f(x; θ)

parametrinθestimoimiseenkäytetään satunnaismuuttujien X1, X2, … , Xnfunktiota eli tunnuslukua

T= g(X1, X2, … , Xn)

• Tällöin funktiota T= g(X1, X2, … , Xn) kutsutaan parametrin θestimaattoriksija havaintoarvoista

x1, x2, … , xn

laskettua funktion garvoa t= g(x1, x2, … , xn)

kutsutaan parametrin θestimaatiksi.

TKK (c) Ilkka Mellin (2004) 16

Todennäköisyysjakaumien parametrien estimointi

Estimaattorit ja estimaatit 2/2

• Olkoon

T= g(X1, X2, … , Xn)

jakauman f(x; θ) parametrin θestimaattori.

• Tällöin estimaattorinThavaintoarvoista x1, x2, … , xn

laskettu arvo eli estimaatti t= g(x1, x2, … , xn)

on satunnaismuuttujan T arvon realisaatio otoksessa.

TKK (c) Ilkka Mellin (2004) 17

Todennäköisyysjakaumien parametrien estimointi

Estimaattoreiden johtaminen

Hyvien estimaattoreiden johtaminentodennäköisyys- jakaumien tuntemattomille parametreille on teoreettisen tilastotieteen keskeisiä ongelmia.

• Tärkeimmät estimaattoreiden johtamiseen käytettävät menetelmät:

Momenttimenetelmä

Suurimman uskottavuuden menetelmä Ks. lukua Estimointimenetelmät.

TKK (c) Ilkka Mellin (2004) 18

Todennäköisyysjakaumien parametrien estimointi

Piste-estimointi ja väliestimointi

• Todennäköisyysjakauman parametrin arvon estimointia kutsutaan usein piste-estimoinniksi.

• Parametrin estimaattiin on aina syytä liittää luottamus- väliksikutsuttu väli, joka sisältää estimoidun parametrin todellisen, mutta tuntemattoman arvon tietyllä, soveltajan valittavissa olevalla todennäköisyydellä.

• Luottamusvälin määräämistä kutsutaan väliestimoinniksi.

(4)

TKK (c) Ilkka Mellin (2004) 19

Todennäköisyysjakaumien parametrien estimointi

>> Luottamusväli

Normaalijakauman odotusarvon luottamusväli Normaalijakauman varianssin luottamusväli Bernoulli-jakauman odotusarvon luottamusväli

Väliestimointi

TKK (c) Ilkka Mellin (2004) 20

Avainsanat Frekvenssitulkinta Luottamuskerroin Luottamustaso Luottamusväli

Luottamusväli

TKK (c) Ilkka Mellin (2004) 21

Luottamusväli

Luottamusväli ja luottamustaso

Väliestimoinnissatodennäköisyysjakauman f(x; θ) tuntemattomalle parametrille θpyritään määräämään havainnoista riippuva väli, joka tietyllä, tutkijan valittavissa olevalla todennäköisyydellä, peittää parametrin todellisen arvon.

• Konstruoitua väliä kutsutaan luottamusväliksija valittua todennäköisyyttä kutsutaan luottamustasoksi.

• Huomautus:

Luottamustasollevoidaan antaa tulkinta todennäköisyyden frekvenssitulkinnanavulla.

TKK (c) Ilkka Mellin (2004) 22

Luottamusväli

Luottamusvälin määrääminen 1/3

• Oletukset:

(i) Olkoon f(x; θ) satunnaismuuttujan Xtodennäköi- syysjakauma, jonka määrää tuntematon parametri θ. (ii) Olkoon X1, X2, … , Xnyksinkertainen satunnaisotos

jakaumasta f(x; θ).

(iii) Olkoon

parametrin θestimaattori.

1 2

ˆ ˆ( , , , )X X Xn

θ θ= …

TKK (c) Ilkka Mellin (2004) 23

Luottamusväli

Luottamusvälin määrääminen 2/3

• Valitaan luottamustaso 1 −α

ja määrätään sen jälkeen satunnaismuuttujat

siten, että

• Huomautus:

Satunnaismuuttujat Lja Uriippuvat sekä havainnoista X1, X2, … , Xnettä luottamustasosta (1 −α).

Pr(ˆ ) / 2

Pr(ˆ ) / 2

L U

θ θ α

θ θ α

− ≤ =

+ ≥ =

1 2

1 2

( , , , )

( , , , )

n n

L L X X X

U U X X X

=

=

TKK (c) Ilkka Mellin (2004) 24

Luottamusväli

Luottamusvälin määrääminen 3/3

• Tällöin väli

on parametrin θluottamusväli luottamustasolla (1 −α).

• Luottamusvälin konstruktiosta seuraa, että väli peittää tuntemattoman parametrinθtodellisen arvon todennäköisyydellä(1 −α):

ˆ ˆ

(θ−L,θ+U)

ˆ ˆ

Pr(θ− ≤ ≤ +L θ θ U) 1= −α

ˆ ˆ

(θ−L,θ+U)

(5)

TKK (c) Ilkka Mellin (2004) 25

Luottamusväli

Luottamusvälin määrääminen:

Erikoistapaus

• Jos estimaattorin jakauma on symmetrinen, parametrin θ luottamusväli luottamustasolla (1 −α)on muotoa jossa satunnaismuuttuja

valitaan siten, että

• Huomautus:

Satunnaismuuttuja Ariippuu sekä havainnoista X1, X2, … , Xn että luottamustasosta (1 −α).

θˆ ˆ A θ±

ˆ ˆ

Pr(θ− ≤ ≤ +A θ θ A) 1= −α

1 2

( , , , n) A A X X= …X

TKK (c) Ilkka Mellin (2004) 26

Luottamusväli

Luottamustason ja -välin frekvenssitulkinta

• Oletetaan, että luottamustasoksi on valittu (1 −α).

• Luottamustasolle ja siihen liittyvälle luottamusvälille voidaan antaa seuraava frekvenssitulkinta:

(i) Jos otantaa jakaumasta f(x; θ) toistetaan, keskimäärin 100×(1 −α) %

otoksista konstruoiduista luottamusväleistä peittää parametrin θtodellisen arvon.

(ii) Jos otantaa jakaumasta f(x; θ) toistetaan, keskimäärin 100×α%

otoksista konstruoiduista luottamusväleistä ei peitä parametrin θtodellista arvoa.

TKK (c) Ilkka Mellin (2004) 27

Luottamusväli

Johtopäätökset luottamisväleistä

• Oletetaan, että teemmejohtopäätöksen, että konstruoitu luottamusväli peittää parametrin θtuntemattoman todellisen arvon:

(i) Luottamusvälin konstruktiosta seuraa, että tehty johtopäätös on oikea100×(1 −α) %:ssa tapauksia.

(ii) Luottamusvälin konstruktiosta seuraa, että tehty johtopäätös on väärä100×α%:ssa tapauksia.

• Huomautus:

Virheellisen johtopäätöksen mahdollisuuttaei saada häviämään, ellei luottamusväliä tehdääärettömän leveäksi, jolloin väliei enää sisällä informaatiotaparametrinθoikeasta arvosta.

TKK (c) Ilkka Mellin (2004) 28

Luottamusväli

Luottamusvälit:

Esimerkkejä

• Olkoon

X1, X2, … , Xn

yksinkertainen satunnaisotosjakaumasta f(x; θ).

• Tarkastellaan seuraavien jakaumien parametrien luottamusvälejä:

Normaalijakauman odotusarvon luottamusväli Normaalijakauman varianssin luottamusväli Bernoulli-jakauman odotusarvoparametrin

luottamusväli

TKK (c) Ilkka Mellin (2004) 29

Todennäköisyysjakaumien parametrien estimointi Luottamusväli

>> Normaalijakauman odotusarvon luottamusväli Normaalijakauman varianssin luottamusväli Bernoulli-jakauman odotusarvon luottamusväli

Väliestimointi

TKK (c) Ilkka Mellin (2004) 30

Avainsanat Frekvenssitulkinta Luottamuskerroin Luottamustaso Luottamusväli Normaalijakauma

Normaalijakauman odotusarvon luottamusväli

(6)

TKK (c) Ilkka Mellin (2004) 31

Normaalijakauman odotusarvon luottamusväli

Esimerkki – 1/4

• Kone tekee ruuveja, joiden pituudet vaihtelevat satunnaisesti noudattaen normaalijakaumaa;

ks. esimerkkiä luvussa Tilastollisten aineistojen kuvaaminen.

• Ruuvien joukosta poimitaan yksinkertainen satunnaisotos, jonka koko n= 30 ja otokseen poimittujen ruuvien pituudet mitataan.

• Taulukko oikealla esittää pituuksien luokiteltua frekvenssi- jakaumaa.

Luokkavälit Luokkafrekvenssit

(9.85,9.90] 1

(9.90,9.95] 2

(9.95,10.00] 6

(10.00,10.05] 3

(10.05,10.10] 5

(10.10,10.15] 4

(10.15,10.20] 5

(10.20,10.25] 3

(10.25,10.30] 1

TKK (c) Ilkka Mellin (2004) 32

Normaalijakauman odotusarvon luottamusväli

Esimerkki – 2/4

• Kuva oikealla esittää otokseen poimittujen ruuvien pituuksien luokiteltua frekvenssijakaumaa vastaavaa histogrammia.

Luokkavälitmääräävät histogrammin suorakaiteiden kannat.

• Suorakaiteiden korkeudeton valittu niin, että suorakaiteiden pinta-alatsuhtautuvat toisiinsa kuten vastaavat luokka- frekvenssit.

Ruuvien pituuksien luokiteltu frekvenssijakauma

0 1 2 3 4 5 6 7

9.8 9.9 10.0 10.1 10.2 10.3 10.4

Pituus (cm)

Frekvenssi

TKK (c) Ilkka Mellin (2004) 33

Normaalijakauman odotusarvon luottamusväli

Esimerkki – 3/4

• Yhteenveto otostiedoista:

Pituuksien aritmeettinen keskiarvo:

Pituuksien keskihajonta:

s= 0.1038 cm

• Huomautus:

Jos otantaa toistetaan, kaikki otosta koskevat tiedot (sekä havainnot että niistä lasketut otossuureet) vaihtelevat satunnaisestiotoksesta toiseen.

10.09 cm X=

Ruuvien pituuksien luokiteltu frekvenssijakauma

0 1 2 3 4 5 6 7

9.8 9.9 10.0 10.1 10.2 10.3 10.4

Pituus (cm)

Frekvenssi

TKK (c) Ilkka Mellin (2004) 34

Normaalijakauman odotusarvon luottamusväli

Esimerkki – 4/4

• Ongelma:

Mitä koneen tekemien ruuvien todellisesta keskipituudesta voidaan tietääyhdestä otoksestasaatujen tietojen perusteella?

• Ratkaisu:

Konstruoidaan väli, joka valitulla todennäköisyydellä sisältää ruuvien todellisen keskipituuden.

Ruuvien pituuksien luokiteltu frekvenssijakauma

0 1 2 3 4 5 6 7

9.8 9.9 10.0 10.1 10.2 10.3 10.4

Pituus (cm)

Frekvenssi

TKK (c) Ilkka Mellin (2004) 35

Normaalijakauman odotusarvon luottamusväli

Normaalijakauma ja sen parametrointi

• Satunnaismuuttuja Xnoudattaa normaalijakaumaa N(µ, σ2), jos sen tiheysfunktioon

• Normaalijakauman parametreinaovat jakauman odotusarvo

ja varianssi

2

2 1 1

( ; , ) exp

2 2

, 0

f xµ σ x µ

σ π σ

µ σ

  −  

= −   

 

 

−∞ < < +∞ >

E( )X =µ Var( )X2

TKK (c) Ilkka Mellin (2004) 36

Normaalijakauman odotusarvon luottamusväli

Otos normaalijakaumasta

• Olkoon

X1, X2, … , Xn

yksinkertainen satunnaisotosnormaalijakaumasta N(µ, σ2)

• Tällöin satunnaismuuttujat X1, X2, … , Xnovat riippumattomiaja noudattavat samaa normaalijakaumaa

N(µ, σ2)

(7)

TKK (c) Ilkka Mellin (2004) 37

Normaalijakauman odotusarvon luottamusväli

Normaalijakauman parametrien estimointi

Estimoidaannormaalijakauman N(µ, σ2) parametrit µja σ2niiden harhattomilla estimaattoreilla:

(i) Odotusarvoparametrinµharhaton estimaattori:

(ii) Varianssiparametrinσ2harhaton estimaattori:

1

1 n

i i

X X

n =

=

2 2

1

1 ( )

1

n i i

s X X

n =

= −

TKK (c) Ilkka Mellin (2004) 38

Normaalijakauman odotusarvon luottamusväli

Luottamustaso

• Määrätään luottamusväli normaalijakauman odotus- arvoparametrille µ.

• Valitaan luottamustasoksi 1 −α

• Luottamustaso kiinnittää todennäköisyyden, jolla konstruoitava luottamusväli peittää normaalijakauman odotusarvon µtodellisen arvon.

TKK (c) Ilkka Mellin (2004) 39

Normaalijakauman odotusarvon luottamusväli

Luottamuskertoimet

• Olkoon valittu luottamustaso (1 −α).

• Määrätään luottamuskertoimet–tα/2ja +tα/2siten, että

jossa satunnaismuuttuja tnoudattaa Studentin t-jakaumaa vapausastein (n– 1):

• Luottamuskertoimet –tα/2ja +tα/2toteuttavat ehdon

/ 2

/ 2

Pr( )

2

Pr( )

2 t t t t

α

α

α α

≤ − =

≥ + =

( 1) t t n∼ −

/ 2 / 2

Pr(−tα ≤ ≤ +t tα ) 1= −α

TKK (c) Ilkka Mellin (2004) 40

Normaalijakauman odotusarvon luottamusväli

Luottamuskertoimien määrääminen:

Havainnollistus

• Luottamuskertoimet –tα/2ja +tα/2jakavat t-jakauman tiheys- funktion kuvaajan alle jäävän todennäköisyysmassan (= 1) kolmeenosaan:

(1) Pisteen –tα/2vasemmalle puolelle jääα/2 % massasta.

(2) Pisteen +tα/2oikealle puolelle jääα/2 % massasta.

(3) Pisteiden –tα/2ja +tα/2 väliinjää (1 −α) % massasta.

• Huomaa, että

α/2 + α/2 + (1 −α) = 1

–tα/2 1−α

+tα/2

α/2 α/2

0 t-jakauman tiheysfunktio

TKK (c) Ilkka Mellin (2004) 41

Normaalijakauman odotusarvon luottamusväli

Luottamusväli normaalijakauman odotusarvolle

• Normaalijakauman odotusarvoparametrin µluottamus- väli luottamustasolla (1 −α)on muotoa

jossa

= havaintojen aritmeettinen keskiarvo s2 = havaintojen harhaton otosvarianssi n = havaintojen lukumäärä

−tα/2, +tα/2

= luottamustasoon (1 −α) liittyvät luottamus- kertoimet t-jakaumasta vapausastein(n– 1)

/ 2 s , / 2 s

X t X t

n n

α α

 − + 

 

 

X

TKK (c) Ilkka Mellin (2004) 42

Normaalijakauman odotusarvon luottamusväli

Luottamusväli ja sen pituus 1/2

• Normaalijakauman odotusarvon µluottamusväli luottamustasolla (1 −α) esitetään usein muodossa

koska väli on symmetrinen keskipisteensä suhteen.

• Normaalijakauman odotusarvon µluottamusvälin pituus on

/ 2

X t s

α n

±

X

2 t/ 2 s

α n

×

(8)

TKK (c) Ilkka Mellin (2004) 43

Normaalijakauman odotusarvon luottamusväli

Luottamusväli ja sen pituus 2/2

• Normaalijakauman odotusarvon µluottamusväli luottamustasolla (1 −α):

/ 2

t s

α n

X

/ 2

t s

α n

TKK (c) Ilkka Mellin (2004) 44

Normaalijakauman odotusarvon luottamusväli

Luottamusvälin johto 1/7

Olkoon X1, X2, … , Xn

yksinkertainen satunnaisotosnormaalijakaumasta N(µ, σ2)

Olkoon

havaintojen X1, X2, … , Xnaritmeettinen keskiarvoja

havaintojen X1, X2, … , Xn(harhaton) otosvarianssi.

1

1 n

i i

X X

n=

=

2 2

1

1 ( )

1

n i i

s X X

n =

=

TKK (c) Ilkka Mellin (2004) 45

Normaalijakauman odotusarvon luottamusväli

Luottamusvälin johto 2/7

Määritellään satunnaismuuttuja

Satunnaismuuttuja tvoidaan kirjoittaa muotoon

Määrätään satunnaismuuttujan tjakauma tarkastelemalla erikseen satunnaismuuttujan tosoittajaa ja nimittäjää.

t X s n

µ

=

2 ( 1)2 2

1 X

X X n

t s n n s n s

n µ

µ µ σ σ

σ σ

= = =

TKK (c) Ilkka Mellin (2004) 46

Normaalijakauman odotusarvon luottamusväli

Luottamusvälin johto 3/7

Satunnaismuuttujan tosoittaja määrittelee satunnaismuuttujan

Satunnaismuuttuja Znoudattaa normaalijakautuneen otoksen aritmeettisen keskiarvon otosjakaumaa koskevan tuloksen perusteella standardoitua normaalijakaumaaN(0,1):

Satunnaismuuttuja tnimittäjä määrittelee satunnaismuuttujan

Satunnaismuuttuja Vnoudattaa normaalijakautuneen otoksen varianssin otosjakaumaa koskevan tuloksen perusteellaχ2-jakaumaa vapausastein(n– 1):

Z X n µ σ

=

N(0,1) Z

2

( 1)s2

V n

= σ

2( 1)

Vχ n

TKK (c) Ilkka Mellin (2004) 47

Normaalijakauman odotusarvon luottamusväli

Luottamusvälin johto 4/7

Edellä on todettu, että

Lisäksi voidaan osoittaa, että satunnaismuuttujat Zja Vovat riippumattomia(todistus sivuutetaan).

Siten satunnaismuuttuja

noudattaa Studentin t-jakaumaavapausastein (n– 1) suoraan jakauman määritelmän mukaan:

1

X Z

t s n V

n

µ

= =

( 1) t t n

2

N(0,1) ( 1) Z V χ n

TKK (c) Ilkka Mellin (2004) 48

Normaalijakauman odotusarvon luottamusväli

Luottamusvälin johto 5/7

Määrätään t-jakaumasta vapausastein (n– 1) piste +tα/2siten, että jolloin (t-jakauman symmetrian perusteella)

ja edelleen Pr( / 2)

t≥ +tα =α2

Pr( / 2) t tα 2

≤ − =α

/ 2 / 2

Pr(tα ≤ ≤ +t tα ) 1= −α

(9)

TKK (c) Ilkka Mellin (2004) 49

Normaalijakauman odotusarvon luottamusväli

Luottamusvälin johto 6/7

Tarkastellaan epäyhtälöketjua

Sijoittamalla tähän epäyhtälöketjuun satunnaismuuttujan tlauseke, saadaan epäyhtälöketju

Tästä epäyhtälöketjusta saadaan sen kanssa yhtäpitäväepäyhtälöketju

/ 2 / 2

t X t

s n

α µ α

≤ +

/ 2 / 2

s s

X t X t

n n

α µ α

≤ ≤ +

/ 2 / 2

tα t tα

≤ ≤ +

TKK (c) Ilkka Mellin (2004) 50

Normaalijakauman odotusarvon luottamusväli

Luottamusvälin johto 7/7

Yhdistämällä saatu epäyhtälö siihen, että saadaan vihdoin

/ 2 / 2

Pr s s 1

X t X t

n n

α µ α α

≤ ≤ + = −

/ 2 / 2

Pr(tα ≤ ≤ +t tα ) 1= −α

TKK (c) Ilkka Mellin (2004) 51

Normaalijakauman odotusarvon luottamusväli

Luottamusvälin frekvenssitulkinta 1/2

• Normaalijakauman odotusarvon µluottamusvälin

konstruktiosta seuraa, että

• Siten konstruoitu luottamusväli peittääparametrin µ todellisen arvon todennäköisyydellä (1 −α) ja se ei peitä parametrin µtodellista arvoa todennäköisyydelläα.

/ 2 s , / 2 s

X t X t

n n

α α

 − + 

 

 

/ 2 / 2

Pr X t s X t s 1

n n

α µ α α

 − ≤ ≤ + = −

 

 

TKK (c) Ilkka Mellin (2004) 52

Normaalijakauman odotusarvon luottamusväli

Luottamusvälin frekvenssitulkinta 2/2

• Normaalijakauman odotusarvon µluottamusvälille voidaan antaa seuraava frekvenssitulkinta:

(i) Jos otantaa jakaumasta N(µ, σ2) toistetaan, keskimäärin

100×(1 −α) %

otoksista konstruoiduista luottamusväleistä peittää parametrin µtodellisen arvon.

(ii) Jos otantaa jakaumasta N(µ, σ2) toistetaan, keskimäärin

100×α%

otoksista konstruoiduista luottamusväleistä ei peitä parametrin µtodellista arvoa.

TKK (c) Ilkka Mellin (2004) 53

Normaalijakauman odotusarvon luottamusväli

Luottamusvälin ominaisuudet 1/3

• Normaalijakauman odotusarvon µluottamusvälin keskipiste vaihtelee otoksesta toiseen.

• Luottamusvälin pituus

vaihtelee otoksesta toiseen.

• Luottamusvälin pituusriippuu valitusta luottamustasosta (1 −α), havaintojen lukumäärästänja otosvarianssista s2.

X

2 t / 2 s

α n

×

TKK (c) Ilkka Mellin (2004) 54

Normaalijakauman odotusarvon luottamusväli

Luottamusvälin ominaisuudet 2/3

• Luottamusväli lyhenee(pitenee), jos luottamustasoa (1 −α) pienennetään(kasvatetaan).

• Luottamusväli lyhenee(pitenee), jos havaintojen lukumäärää n kasvatetaan(pienennetään).

• Luottamusväli lyhenee(pitenee), jos otosvarianssi s2 pienenee(kasvaa).

(10)

TKK (c) Ilkka Mellin (2004) 55

Normaalijakauman odotusarvon luottamusväli

Luottamusvälin ominaisuudet 3/3

• Olisi toivottavaa pystyä konstruoimaan odotusarvolle µmahdollisimman lyhytluottamusväli, johon liittyvä luottamustaso olisi mahdollisimman korkea.

• Vaatimusten samanaikainen täyttäminen ei olekuitenkaan mahdollista, jos otoskoko pidetään kiinteänä:

(i) Luottamustason kasvattaminen pidentää luottamus- väliä, jolloin tieto parametrin µtodellisen arvon sijainnista tulee epätarkemmaksi.

(ii) Luottamusvälin lyhentäminen pienentää luottamus- tasoa, jolloin tieto parametrin µtodellisen arvon sijainnista tulee epävarmemmaksi.

TKK (c) Ilkka Mellin (2004) 56

Normaalijakauman odotusarvon luottamusväli

Johtopäätökset luottamusvälistä

• Oletetaan, että teemmejohtopäätöksen, että konstruoitu luottamusväli peittää odotusarvoparametrin µtodellisen arvon:

(i) Luottamusvälin konstruktiosta seuraa, että tehty johtopäätös on oikea100×(1 −α) %:ssa tapauksia.

(ii) Luottamusvälin konstruktiosta seuraa, että tehty johtopäätös on väärä100×α%:ssa tapauksia.

• Huomautus:

Virheellisen johtopäätöksen mahdollisuuttaei saada häviämään, ellei luottamusväliä tehdääärettömän leveäksi, jolloin väliei enää sisällä informaatiotaodotusarvoparametrinµtodellisesta arvosta.

TKK (c) Ilkka Mellin (2004) 57

Normaalijakauman odotusarvon luottamusväli

Esimerkki (jatkuu) – 1/4

Erään koneen tekemien ruuvien joukosta poimittiin yksinkertainen satunnaisotosja ruuvien pituudet mitattiin.

Otoskoko: n= 30

Pituuksien aritmeettinen keskiarvo:

Pituuksien otoskeskihajonta: s= 0.1038 cm

Konstruoidaan ruuvien todelliselle keskipituudelleµluottamusväli luottamustasolla0.95.

Valitaan luottamuskertoimet–t0.025ja +t0.025siten, että jossa satunnaismuuttuja tnoudattaa Studentin t-jakaumaa vapausastein n– 1 = 29.

Luottamuskertoimet –t0.025ja +t0.025toteuttavat ehdon 10.09 cm X=

0.025 0.025

Pr(t≤ −t ) Pr(= t≥ +t ) 0.025=

0.025 0.025

Pr(t ≤ ≤ +t t ) 0.95=

TKK (c) Ilkka Mellin (2004) 58

0 0.1 0.2 0.3 0.4 0.5 Normaalijakauman odotusarvon luottamusväli

Esimerkki (jatkuu) – 2/4

t-jakauman taulukoistanähdään, että

Pr(t+2.045) = 0.025 Pr(t–2.045) = 0.025 kun vapausasteiden lukumäärä

n– 1 = 29

• Siten luottamuskertoimet ovat:

+t0.025= +2.045 –t0.025= –2.045

• Kuvio oikealla havainnollistaa luottamuskertoimien valintaa.

−2.045 0.95

+2.045

0.025 0.025

t(29)-jakauman tiheysfunktio

0

TKK (c) Ilkka Mellin (2004) 59

Normaalijakauman odotusarvon luottamusväli

Esimerkki (jatkuu) – 3/4

Luottamusväliksisaadaan:

Siten tiedämme, ettäruuvien todellinen keskipituus on todennäköisyydellä0.95 välillä

(10.05, 10.13)

/ 2

0.1038 10.09 2.045

30 10.09 0.04 (10.05,10.13) X t s

α n

± = ± ×

= ±

=

TKK (c) Ilkka Mellin (2004) 60

Normaalijakauman odotusarvon luottamusväli

Esimerkki (jatkuu) – 4/4

Luottamustason0.95 tulkinta:

Oletetaan, että poimimme koneen tekemien ruuvien joukosta toistuvastiyksinkertaisia satunnaisotoksia, joiden koko on 30 ja konstruoimme jokaisestaotoksesta 95 %:n luottamusvälin edellä esitetyllä menetelmällä.

Tällöin:

(i) Konstruoidusta väleistä keskimäärin95 % peittää ruuvien todellisen, mutta tuntemattoman keskipituuden.

(ii) Konstruoidusta väleistä keskimäärin5 % ei peitä ruuvien todellista, mutta tuntematonta keskipituutta.

(11)

TKK (c) Ilkka Mellin (2004) 61

Normaalijakauman odotusarvon luottamusväli

Otoskoon määrääminen 1/4

• Monissa tutkimustilanteissa toivotaan, että parametrille voitaisiin muodostaa mahdollisimman lyhytluottamusväli.

• Normaalijakauman odotusarvon µluottamusvälin pituus riippuu otoskoosta siten, ettäväli lyhenee, jos havaintojen lukumäärää n kasvatetaan.

• Tämä normaalijakauman odotusarvon µluottamus- välin ominaisuus mahdollistaa tietyin ehdoin otoskoon valitsemisen sellaisella tavalla, ettäluottamusväliksi saadaan(suunnilleen) halutun mittainen väli.

• Oletetaan siis, että normaalijakauman odotusarvo- parametrille µhalutaan konstruoida luottamusväli, jonka toivottu pituuson 2A.

TKK (c) Ilkka Mellin (2004) 62

Normaalijakauman odotusarvon luottamusväli

Otoskoon määrääminen 2/4

Jos normaalijakauman varianssiσ2tunnetaan, normaali- jakauman odotusarvoparametrin µluottamusväliksi luottamustasolla (1 −α)saadaan

jossa

= havaintojen aritmeettinen keskiarvo σ2= havaintojen oletettu varianssi n =otoskoko

−zα/2, +zα/2

= luottamustasoon (1 −α) liittyvät luottamus- kertoimet normaalijakaumasta N(0,1) X z/ 2

α σn

±

X

TKK (c) Ilkka Mellin (2004) 63

Normaalijakauman odotusarvon luottamusväli

Otoskoon määrääminen 3/4

• Jos siis käytettävissä on ennakkotietoa perusjoukon varianssistaσ2, voidaan otoskoko nratkaista yhtälöstä:

jossa

zα/2= luottamustasoon (1 −α) liittyvä luottamus- kerroinnormaalijakaumasta N(0,1) σ2= havaintojen oletettu varianssi n =otoskoko

2A=toivottu pituusluottamusvälille z/ 2 A

α σn=

TKK (c) Ilkka Mellin (2004) 64

Normaalijakauman odotusarvon luottamusväli

Otoskoon määrääminen 4/4

• Siten tarvittava otoskokoon

• Huomautus:

Tarvittavan otoskoon kaavasta nähdään, että mitä lyhyempää luottamusväliä toivotaan, sitä suurempi otos on poimittava:

Esimerkiksi, jos luottamusvälin pituus halutaan puolittaa, pitää havaintoja kerätä 4 kertaa enemmän.

2

z / 2

n A

α σ

 

=  

TKK (c) Ilkka Mellin (2004) 65

Todennäköisyysjakaumien parametrien estimointi Luottamusväli

Normaalijakauman odotusarvon luottamusväli

>> Normaalijakauman varianssin luottamusväli Bernoulli-jakauman odotusarvon luottamusväli

Väliestimointi

TKK (c) Ilkka Mellin (2004) 66

Avainsanat Frekvenssitulkinta Luottamuskerroin Luottamustaso Luottamusväli Normaalijakauma

Normaalijakauman varianssin luottamusväli

(12)

TKK (c) Ilkka Mellin (2004) 67

Normaalijakauman varianssin luottamusväli

Normaalijakauma ja sen parametrointi

• Satunnaismuuttuja Xnoudattaa normaalijakaumaa N(µ, σ2), jos sen tiheysfunktioon

• Normaalijakauman parametreinaovat jakauman odotusarvo

ja varianssi E( )X =µ Var( )X2

2

2 1 1

( ; , ) exp

2 2

, 0

f xµ σ x µ

σ π σ

µ σ

  −  

= −   

 

 

−∞ < < +∞ >

TKK (c) Ilkka Mellin (2004) 68

Normaalijakauman varianssin luottamusväli

Otos normaalijakaumasta

• Olkoon

X1, X2, … , Xn

yksinkertainen satunnaisotosnormaalijakaumasta N(µ, σ2)

• Tällöin satunnaismuuttujat X1, X2, … , Xnovat riippumattomiaja noudattavat samaa normaalijakaumaa

N(µ, σ2)

TKK (c) Ilkka Mellin (2004) 69

Normaalijakauman varianssin luottamusväli

Normaalijakauman parametrien estimointi

Estimoidaannormaalijakauman N(µ, σ2) parametrit µja σ2niiden harhattomilla estimaattoreilla:

(i) Odotusarvoparametrinµharhaton estimaattori:

(ii) Varianssiparametrinσ2harhaton estimaattori:

1

1 n

i i

X X

n =

=

2 2

1

1 ( )

1

n i i

s X X

n =

= −

TKK (c) Ilkka Mellin (2004) 70

Normaalijakauman varianssin luottamusväli

Luottamustaso

• Määrätään luottamusväli normaalijakauman varianssiparametrille σ2.

• Valitaan luottamustasoksi 1 −α

• Luottamustaso kiinnittää todennäköisyyden, jolla konstruoitava luottamusväli peittää normaalijakauman varianssin σ2todellisen arvon.

TKK (c) Ilkka Mellin (2004) 71

Normaalijakauman varianssin luottamusväli

Luottamuskertoimet

• Olkoon valittu luottamustaso (1 −α).

• Määrätään luottamuskertoimet ja siten, että

jossa satunnaismuuttuja χ2noudattaa χ2-jakaumaa vapausastein (n– 1):

• Luottamuskertoimet ja toteuttavat ehdon

2 2

1 / 2

2 2

/ 2

Pr( )

2

Pr( )

2

α α

χ χ α χ χ α

=

≥ =

2 1α/ 2

χ 2 α/ 2

χ

2 2(n 1)

χ ∼χ −

2 α/ 2

χ

2 1α/ 2

χ

2 2 2

1 / 2 / 2

Pr(χα ≤χ ≤χα ) 1= −α

TKK (c) Ilkka Mellin (2004) 72

Normaalijakauman varianssin luottamusväli

Luottamuskertoimien määrääminen:

Havainnollistus

• Luottamuskertoimet ja jakavat χ2-jakauman tiheysfunktion kuvaajan alle jäävän todennäköisyysmassan (= 1) kolmeenosaan:

(1) Pisteen vasemmalle puolelle jääα/2 % massasta.

(2) Pisteen oikealle puolelle jääα/2 % massasta.

(3) Pisteiden ja väliinjää (1 −α) % massasta.

• Huomaa, että

α/2 + α/2 + (1 −α) = 1

2 1α/ 2

χ

2 α/ 2

χ

2 1α/ 2

χ

2 α/ 2

χ

2 1α/ 2

χ χα2/ 2

χ2-jakauman tiheysfunktio

2 α/ 2

χ

2 1α/ 2

χ

1 −α α/2

α/2

(13)

TKK (c) Ilkka Mellin (2004) 73

Normaalijakauman varianssin luottamusväli

Luottamusväli normaalijakauman varianssille

• Normaalijakauman varianssiparametrin σ2luottamus- väli luottamustasolla (1 −α)on muotoa

jossa

s2 = havaintojen harhaton otosvarianssi n = havaintojen lukumäärä

= luottamustasoon (1 −α) liittyvät luottamus- kertoimet χ2-jakaumasta vapausastein (n– 1)

2 2

2 2

/ 2 1 / 2

(n 1)s ,(n 1)s

α α

χ χ

 − − 

 

 

2 2

1α/ 2, α/ 2

χ χ

TKK (c) Ilkka Mellin (2004) 74

Normaalijakauman varianssin luottamusväli

Luottamusväli ja sen pituus

• Normaalijakauman varianssin σ2luottamusvälin pituus on

2

2 2

1 / 2 / 2

1 1

(n 1)s

α α

χ χ

 

−  − 

TKK (c) Ilkka Mellin (2004) 75

Normaalijakauman varianssin luottamusväli

Luottamusvälin johto 1/5

Olkoon

X1, X2, … , Xn

yksinkertainen satunnaisotosnormaalijakaumasta N(µ, σ2)

Olkoon

havaintojen X1, X2, … , Xnaritmeettinen keskiarvoja

havaintojen X1, X2, … , Xn(harhaton) otosvarianssi.

1

1n

i i

X X

n=

=

2 2

1

1 ( )

1

n i i

s X X

n =

=

TKK (c) Ilkka Mellin (2004) 76

Normaalijakauman varianssin luottamusväli

Luottamusvälin johto 2/5

Määritellään satunnaismuuttuja

Satunnaismuuttuja χ2noudattaa normaalijakautuneen otoksen varianssin otosjakaumaa koskevan tuloksen perusteellaχ2-jakaumaa vapausastein (n– 1):

2 2

2

(n 1)s

χ σ

=

2 2(n 1)

χ χ

TKK (c) Ilkka Mellin (2004) 77

Normaalijakauman varianssin luottamusväli

Luottamusvälin johto 3/5

Määrätään χ2-jakaumasta vapausastein (n– 1) piste siten, että ja piste siten, että

jolloin

2 2

1 / 2

Pr( )

α α2

χ χ =

2 1α/ 2

χ

2 2 2

1 / 2 / 2

Pr(χα χ χα ) 1= −α

2 2

Pr( / 2)

α 2 χ χ =α

2 α/ 2

χ

TKK (c) Ilkka Mellin (2004) 78

Normaalijakauman varianssin luottamusväli

Luottamusvälin johto 4/5

Tarkastellaan epäyhtälöketjua

Sijoittamalla tähän epäyhtälöketjuun satunnaismuuttujan χ2lauseke, saadaan epäyhtälöketju

Tästä epäyhtälöketjusta saadaan sen kanssa yhtäpitäväepäyhtälöketju

2 2

2

2 2

/ 2 1 / 2

(n 1)s (n 1)s

α α

χ σ χ

2

2 2

1 / 2 2 / 2

(n 1)s

α α

χ χ

σ

2 2 2

1α/ 2 α/ 2

χ χ χ

Viittaukset

LIITTYVÄT TIEDOSTOT

• Oletetaan, että haluamme selittää jonkin selitettävän tekijän tai muuttujan havaittujen arvojen vaihtelun joidenkin selittävien tekijöiden tai muuttujien havaittujen

Ensimmäisen lajin virhe Havainnot Hylkäysalue Hylkäysvirhe Hypoteesi Hyväksymisalue Hyväksymisvirhe Maailman tila Nollahypoteesi Parametri Testi Testin tulos Testisuure Toisen

Tarkoitamme satunnaismuuttujien riippumattomuudella sitä, että yhdenkään satunnaismuuttujan saamat arvot eivät riipu siitä, mitä arvoja muut satunnaismuuttujat saavat;

Tarkoitamme satunnaismuuttujien riippumattomuudella sitä, että yhdenkään satunnaismuuttujan saamat arvot eivät riipu siitä, mitä arvoja muut satunnaismuuttujat saavat;

• Tämä johtuu siitä, että sama määritelmä kertymäfunktiolle sopii kaikille satunnaismuuttujille olivatpa ne diskreettejä, jatkuvia tai jotakin muuta tyyppiä ja

Tytin tiukka itseluottamus on elämänkokemusta, jota hän on saanut opiskeltuaan Dallasissa kaksi talvea täydellä

Opimme, että istuntojen sisällöt saattavat vain osittain kiinnostaa meitä, mutta toisaalta myös eksoottisten maiden kokemuksista on paljon opittavaa.. Kaikkien maiden

Koska painettujen kokoelmien käyttö muuttuu ja vähenee, meidän on syytä miettiä miten tuomme kirjastointeriöörin tarpeelliseksi tutkijoille, mitä kaikkea voisimme tehdä