• Ei tuloksia

1 Estimointi:Mitä opimme? –3/4 Estimointi:Mitä opimme? –4/4 Estimointi:Mitä opimme? –1/4 Estimointi:Mitä opimme? –2/4 Estimointi Estimointi

N/A
N/A
Info
Lataa
Protected

Academic year: 2022

Jaa "1 Estimointi:Mitä opimme? –3/4 Estimointi:Mitä opimme? –4/4 Estimointi:Mitä opimme? –1/4 Estimointi:Mitä opimme? –2/4 Estimointi Estimointi"

Copied!
5
0
0

Kokoteksti

(1)

TKK (c) Ilkka Mellin (2004) 1

Johdatus tilastotieteeseen

Estimointi

TKK (c) Ilkka Mellin (2004) 2

Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin ominaisuudet

Estimointi

TKK (c) Ilkka Mellin (2004) 3

Estimointi:

Mitä opimme? – 1/4

Tilastollisen tutkimuksentavoitteena on tehdä johtopäätöksiä prosesseista, jotka generoivatreaalimaailman ilmiöitä koskevia havaintoja.

Tavoitteeseen pyritään rakentamalla tutkimuksen kohteena olevaa ilmiötä koskevat havainnot generoineelle prosessille tilastollinen malli.

Koska tilastollisissa tutkimusasetelmissa tutkimuksen kohteena olevia reaalimaailman ilmiöitä koskeviin havaintoihin liittyy aina satunnaisuuttatai epävarmuutta, tilastolliset mallit ovat luonteeltaan todennäköisyysmalleja.

Tilastollinen malli havainnot generoineelle prosessille on täysin määrätty, jos havaintojentodennäköisyysjakaumatunnetaan.

TKK (c) Ilkka Mellin (2004) 4

Estimointi:

Mitä opimme? – 2/4

Havaintojen todennäköisyysjakaumanmääräävät jakauman karakteristisia ominaisuuksia kuvaavat parametrit, joiden arvoja ei sovellustilanteessa yleensä tunneta.

Jos jakauman tuntemattomille parametreille ei löydetä hyviä estimaattejaeli arvioita, jakaumaa ei voida käyttää mallina tutkimuksen kohteena olevaa ilmiötä koskevat havainnot generoineelle prosessille.

Tilastollisen tutkimuksen tärkeimpiä osatehtäviä on estimoida eli arvioida tutkimuksen kohteena olevaa ilmiötä koskevat havainnot generoineen prosessin mallina käytettävän todennäköisyysjakauman tuntemattomat parametrit ilmiötä koskevien havaintojen perusteella.

Estimointi:

Mitä opimme? – 3/4

Havaintojen funktiota, joka tuottaa estimaattejaeli arvioita todennäköisyysjakauman tuntemattoman parametrin todelliselle arvolle, kutsutaan parametrin estimaattoriksi.

Tilastotieteen tärkeimpiä osatehtäviä on hyvien estimaattoreiden johtaminentodennäköisyysjakauman parametreille.

Ks. lukua Estimointimenetelmät.

Koska todennäköisyysjakauman parametreille voidaan muodostaa erilaisia estimaattoreita, estimaattoreille on esitetty erilaisia hyvyys- kriteereitä, joita käytetään apuna estimaattorin valinnassa.

Tavalliset vaatimukset hyvälle estimaattorille:

Hyvän estimaattorin on oltava harhaton, tehokas, tyhjentäväja tarkentuva.

Estimointi:

Mitä opimme? – 4/4

Todennäköisyysjakauman tuntemattomien parametrien arvojen määräämistäkutsutaan tavallisesti piste-estimoinniksi.

Jokaiseen todennäköisyysjakauman parametrin estimaattiin on aina syytä liittää luottamusväliksikutsuttu väli, joka sisältää parametrin todellisen arvon, tietyllä, soveltajan valittavissa olevalla todennäköisyydellä.

Ks. lukua Väliestimointi.

(2)

TKK (c) Ilkka Mellin (2004) 7

Estimointi:

Esitiedot

Esitiedot: ks. seuraavia lukuja:

Tilastollisten aineistojen kerääminen ja mittaaminen Tilastollisten aineistojen kuvaaminen

Otos ja otosjakaumat

Satunnaismuuttujat ja todennäköisyysjakaumat Jakaumien tunnusluvut

TKK (c) Ilkka Mellin (2004) 8

Estimointi:

Lisätiedot

Todennäköisyysjakaumien parametrien estimaattoreiden johtamista käsitellään luvussa

Estimointimenetelmät

Luottamusvälin määräämistätodennäköisyysjakaumien parametreille käsitellään luvussa

Väliestimointi

Todennäköisyysjakaumien parametreja koskevien tilastollisten hypoteesien testaamistakäsitellään luvussa

Tilastolliset testit

Jakaumaoletuksien testaamistakäsitellään luvussa

Yhteensopivuuden, homogeenisuuden ja riippumattomuuden testaaminen

TKK (c) Ilkka Mellin (2004) 9

>> Todennäköisyysjakaumien parametrit ja niiden estimointi Hyvän estimaattorin ominaisuudet

Estimointi

TKK (c) Ilkka Mellin (2004) 10

Avainsanat Estimaatti Estimaattori Estimointi Havainto Havaintoarvo Otosjakauma Parametri Piste-estimointi Tilastollinen aineisto Tilastollinen malli Todennäköisyysjakauma Yksinkertainen satunnaisotos Luottamusväli

Todennäköisyysjakaumien parametrit ja niiden estimointi

TKK (c) Ilkka Mellin (2004) 11

Todennäköisyysjakaumien parametrit ja niiden estimointi

Todennäköisyysjakaumat tilastollisten aineistojen kuvaajina

Tilastollinen aineistokoostuu tutkimuksen kohteita kuvaavien muuttujien havaituista arvoista.

• Tilastollisissa tutkimusasetelmissa havaintoarvoihin liittyy aina epävarmuuttaja satunnaisuutta.

• Tilastollisissa tutkimusasetelmissa tutkimuksen kohteita kuvaavat muuttujat tulkitaan satunnaismuuttujiksi, jotka generoivatmuuttujien havaitut arvot.

Tilastollinen mallitarkoittaa havaintoarvot generoineiden satunnaismuuttujien todennäköisyysjakaumaa.

TKK (c) Ilkka Mellin (2004) 12

Todennäköisyysjakaumien parametrit ja niiden estimointi

Todennäköisyysjakaumien parametrit 1/2

• Tarkastellaan jotakin tutkimuksen kaikkien mahdollisten kohteiden muodostaman perusjoukon Salkioiden ominaisuutta kuvaavaa satunnaismuuttujaa X.

• Oletetaan, että satunnaismuuttuja Xnoudattaa toden- näköisyysjakaumaa, jonka pistetodennäköisyys- tai tiheysfunktio

f(x; θ)

riippuu parametristaθ.

• Merkintä:

~ ( ; ) X f x θ

(3)

TKK (c) Ilkka Mellin (2004) 13

Todennäköisyysjakaumien parametrit ja niiden estimointi

Todennäköisyysjakaumien parametrit 2/2

• Satunnaismuuttujan Xpistetodennäköisyys- tai tiheysfunktio

f(x; θ)

kuvaa satunnaismuuttujanX todennäköisyysjakaumaa ja parametri θkuvaa jotakin jakauman karakteristista ominaisuutta.

• Koska parametrin θarvoa ei yleensä tunneta, tilastollisen tutkimuksen tärkeimpiä osatehtäviä on estimoidaeli arvioidaparametrin θtuntematon arvo jakaumasta f(x; θ) poimitun otoksen perusteella.

TKK (c) Ilkka Mellin (2004) 14

Todennäköisyysjakaumien parametrit ja niiden estimointi

Yksinkertainen satunnaisotos

• Olkoon

X1, X2, … , Xn

yksinkertainen satunnaisotosjakaumasta, jonka pistetodennäköisyys- tai tiheysfunktio f(x; θ) riippuu parametrista θ.

• Tällöin havainnot X1, X2, … , Xnovat riippumattomia, identtisesti jakautuneita satunnaismuuttujia, joilla on sama pistetodennäköisyys-tai tiheysfunktio f(x; θ):

1, 2, ,

~ ( ; ) , 1, 2, ,

n i

X X X

X f x θ i n

=

TKK (c) Ilkka Mellin (2004) 15

Todennäköisyysjakaumien parametrit ja niiden estimointi

Havainnot ja havaintoarvot

• Oletetaan, että satunnaismuuttujat (havainnot) X1, X2, … , Xn

saavat poimitussa otoksessahavaituiksi arvoikseenluvut x1, x2, … , xn

Havaintoarvot x1, x2, … , xn

vaihtelevat satunnaisesti otoksesta toiseenjakaumasta f(x; θ)

saatavin todennäköisyyksin.

TKK (c) Ilkka Mellin (2004) 16

Todennäköisyysjakaumien parametrit ja niiden estimointi

Estimaattorit ja estimaatit 1/2

• Oletetaan, että todennäköisyysjakauman f(x; θ) parametrin θestimoimiseenkäytetään satunnais- muuttujien X1, X2, … , Xnfunktiota eli tunnuslukua

T= g(X1, X2, … , Xn)

• Tällöin funktiota T= g(X1, X2, … , Xn) kutsutaan parametrin θestimaattoriksija funktion g havaintoarvoista

x1, x2, … , xn

laskettua arvoa t= g(x1, x2, … , xn)

kutsutaan parametrin θestimaatiksi.

Todennäköisyysjakaumien parametrit ja niiden estimointi

Estimaattorit ja estimaatit 2/2

• Olkoon

T= g(X1, X2, … , Xn)

jakauman f(x; θ) parametrin θestimaattori.

• Tällöin estimaattorinThavaintoarvoista x1, x2, … , xn

laskettu arvo eli estimaatti t= g(x1, x2, … , xn)

on satunnaismuuttujan T arvon realisaatio otoksessa.

Todennäköisyysjakaumien parametrit ja niiden estimointi

Estimaattorit ja estimaatit:

Kommentti

• Todennäköisyysjakauman f(x; θ) parametrin θ estimaattorilla

T= g(X1, X2, … , Xn)

tarkoitetaan siis sellaista jakaumaa f(x; θ) noudattavien satunnaismuuttujien

X1, X2, … , Xn

funktiota, joka generoimuuttujien X1, X2, … , Xn havaittuihin arvoihin x1, x2, … , xnsovellettuna estimaattejaeli arvioita

t= g(x1, x2, … , xn) parametrille θ.

(4)

TKK (c) Ilkka Mellin (2004) 19

Todennäköisyysjakaumien parametrit ja niiden estimointi

Estimaattorin otosjakauma

• Estimaattorin

T= g(X1, X2, … , Xn) havaintoarvoista

x1, x2, … , xn

lasketut arvot eli estimaatit t= g(x1, x2, … , xn)

vaihtelevat satunnaisesti otoksesta toiseen.

• EstimaattorinTarvojen satunnaista vaihtelua otoksesta toiseen voidaan kuvata estimaattorin Totosjakaumalla.

TKK (c) Ilkka Mellin (2004) 20

Todennäköisyysjakaumien parametrit ja niiden estimointi

Estimaattoreiden johtaminen

Hyvien estimaattoreiden johtaminentodennäköisyys- jakaumien tuntemattomille parametreille on teoreettisen tilastotieteen keskeisiä ongelmia.

• Tärkeimmät estimaattoreiden johtamiseen käytettävät menetelmät:

Suurimman uskottavuuden menetelmä Momenttimenetelmä

Ks. lukua Estimointimenetelmät.

TKK (c) Ilkka Mellin (2004) 21

Todennäköisyysjakaumien parametrit ja niiden estimointi

Piste-estimointi ja väliestimointi

• Todennäköisyysjakauman parametrin arvon estimointia kutsutaan usein piste-estimoinniksi.

• Parametrin estimaattiin on aina syytä liittää luottamus- väliksikutsuttu väli, joka sisältää estimoidun parametrin todellisen, mutta tuntemattoman arvon tietyllä, soveltajan valittavissa olevalla todennäköisyydellä.

• Luottamusvälin määräämistä kutsutaan väliestimoinniksi.

Ks. lukua Väliestimointi.

TKK (c) Ilkka Mellin (2004) 22

Todennäköisyysjakaumien parametrit ja niiden estimointi

>> Hyvän estimaattorin ominaisuudet

Estimointi

TKK (c) Ilkka Mellin (2004) 23

Avainsanat Estimaattori Harha Harhattomuus Hyvyyskriteeri Keskineliövirhe Parametri Tarkentuvuus Tehokkuus Tyhjentävyys

Hyvän estimaattorin ominaisuudet

TKK (c) Ilkka Mellin (2004) 24

Hyvän estimaattorin ominaisuudet

Hyvä estimaattori

• Todennäköisyysjakauman parametreille on tavallisesti tarjolla useita vaihtoehtoisia estimaattoreita.

• Estimaattorin valintaa ohjaavat hyvyyskriteerit, joilla pyritään takamaan se, että valittu estimaattori tuottaa järkeviä arvoja estimoitavalle parametrille.

• Estimaattoreiden hyvyyskriteereitä:

Harhattomuus Tyhjentävyys Tehokkuus Tarkentuvuus

(5)

TKK (c) Ilkka Mellin (2004) 25

Hyvän estimaattorin ominaisuudet

Harhattomuus ja tyhjentävyys

Harhattomuus:

EstimaattoriTon parametrin θharhaton estimaattori, jos sen odotusarvo yhtyy parametrin θarvoon:

E(T) = θ

Tyhjentävyys:

EstimaattoriTon tyhjentäväparametrille θ, jos se käyttää parametrin arvon estimoimiseen kaiken otoksessa olevan informaation.

TKK (c) Ilkka Mellin (2004) 26

Hyvän estimaattorin ominaisuudet

Tehokkuus ja tarkentuvuus

Tehokkuus:

EstimaattoriTon parametrin θtehokas estimaattori, jos sen varianssi on pienempi kuin minkä tahansa muun estimaattorin.

Tarkentuvuus:

EstimaattoriTon parametrin θtarkentuva estimaattori, jos se konvergoimelkein varmasti kohti parametrin oikeata arvoa, kun otoskoon nannetaan kasvaa rajatta:

Pr(Tn→θ) = 1, kun n→+ ∞ Ks. lukua Konvergenssikäsitteet ja raja-arvolauseet.

TKK (c) Ilkka Mellin (2004) 27

Hyvän estimaattorin ominaisuudet

Estimaattorin harha

• Parametrin θestimaattorin harhaon

• Jos on parametrin θharhatonestimaattori eli

niin

θˆ

ˆ ˆ

Bias( )θ = −θ E( )θ

Bias( ) 0θˆ = θˆ

E( )θˆ =θ

TKK (c) Ilkka Mellin (2004) 28

Hyvän estimaattorin ominaisuudet

Estimaattorin keskineliövirhe

• Parametrin θestimaattorin keskineliövirheon

• Jos on parametrin θharhatonestimaattori eli

niin

• Estimaattoria sanotaan tarkaksi, jos se on harhatonja sen varianssion pieni.

θˆ

2 2

ˆ ˆ

MSE( ) E ( )

ˆ ˆ

Var( ) Bias( )

θ θ θ

θ θ

 

=  − 

 

= +  

ˆ ˆ

MSE( ) Var( )θ = θ θˆ

ˆ ˆ

Bias( )θ = −θ E( ) 0θ =

Viittaukset

LIITTYVÄT TIEDOSTOT

• Tilastollisen tutkimuksen tärkeimpiä osatehtäviä on estimoida eli arvioida tutkimuksen kohteena olevaa ilmiötä koskevat havainnot generoineen prosessin mallina

Tilastollinen riippuvuus, korrelaatio ja regressio Kahden muuttujan havaintoaineiston kuvaaminen Pearsonin korrelaatiokertoimen estimointi ja testaus

Ensimmäisen lajin virhe Havainnot Hylkäysalue Hylkäysvirhe Hypoteesi Hyväksymisalue Hyväksymisvirhe Maailman tila Nollahypoteesi Parametri Testi Testin tulos Testisuure Toisen

Opimme, että istuntojen sisällöt saattavat vain osittain kiinnostaa meitä, mutta toisaalta myös eksoottisten maiden kokemuksista on paljon opittavaa.. Kaikkien maiden

Koska painettujen kokoelmien käyttö muuttuu ja vähenee, meidän on syytä miettiä miten tuomme kirjastointeriöörin tarpeelliseksi tutkijoille, mitä kaikkea voisimme tehdä

Explain the reflection and transmission of traveling waves in the points of discontinuity in power systems2. Generation of high voltages for overvoltage testing

Caiculate the positive sequence reactance / km of a three phase power line having conductors in the same horizontal plane.. The conductor diameter is 7 mm and

Explain the meaning of a data quality element (also called as quality factor), a data quality sub-element (sub-factor) and a quality measure.. Give three examples