7.2.2019/1
MTTTA1 Tilastomenetelmien perusteet Luento 7.2.2019
4.1 Yksi selittävä muuttuja (täydennystä) Regressiomalli
= + + , = 1, 2, … , (1)
7.2.2019/2
Regressiomallissa (1) oletetaan, että
i ~ N(0, 2) ja
i:t ovat riippumattomia
Näiden oletusten voimassaoloa tutkitaan residuaalien
avulla. Koska satunnaisvirheistä i ei ole havaintoja, niin estimoidaan niitä estimoidun mallin avulla lasketuilla
residuaaleilla = =
Tutkitaan normaalisuus-, vakiovarianssisuus- ja
riippumattomuusoletuksia näiden residuaalien avulla.
Voidaan käyttää graafisia esityksiä, esimerkiksi seuraavia:
7.2.2019/3
Normaalisuusoletuksen tutkiminen esim.
histogrammin avulla
7.2.2019/4
Vakiovarianssisuuden ja riippumattomuuden tutkiminen pisteparvien avulla
7.2.2019/5
Ei voida olettaa, että Var( i) = 2, i = 1, …, n (heteroskedastisuus).
7.2.2019/6
Mallin riittävyyden tutkiminen
Esimerkki riittämättömästä mallista
Pisteparvissa voidaan käyttää x-akselilla myös selittäjää.
7.2.2019/7
Esim. Autojen ominaisuuksia Y = Huippunopeus, x = Teho
7.2.2019/8
Jäännöstarkastelut
Väärä mallin valinta
7.2.2019/9
Y = Kiihtyvyys, x = Teho
7.2.2019/10
Jäännöstarkastelut
Väärä mallin valinta
7.2.2019/11
Y = Kulutus 120km/h, x = Kulutus 90 km/h
7.2.2019/12
Jäännöstarkastelut
7.2.2019/13
Esim. Aineisto Rasvaprosentti sivulla
https://coursepages.uta.fi/mtttp1/esimerkkiaineistoja/
y = rasvaprosentti
x = vyötärön ympärys
Ks.
http://www.sis.uta.fi/tilasto/mttta1/
kevat2015/RA_rasvaprosentti.pdf
7.2.2019/14
Jäännöstarkastelut
7.2.2019/15
4.2 Useampi selittävä muuttuja Kaksi selittäjää (2-RA)
= + + + , = 1, 2, … , (2)
Malliin liittyvät oletukset
i ~ N(0, 2) ja
i:t ovat riippumattomia Estimointi
= + + ,
7.2.2019/16
Testaukset
H0: 1 = 0 H1: 1 0
= ~ ,
H0: 2 = 0 H1: 2 0
= ~ ,
7.2.2019/17
H0: 0 = 0 H1: 0 0
= ~ ,
H0: 1 = 2 =0
H1: molemmat eivät nollia
= = 2
3
~ 2, 3 ,
7.2.2019/18
Neliösummat
SST = SSR + SSE
MSR = SSR/2, MSE = SSE/(n-3) = Selityskerroin
R2 = SSR/SST
7.2.2019/19
Esim. Aineisto Rasvaprosentti sivulla
https://coursepages.uta.fi/mtttp1/esimerkkiaineistoja/
y = rasva%
x1 = vyötärön ympärys x2 = ikä
Regressioanalyysin tulokset
http://www.sis.uta.fi/tilasto/mttta1/kevat2015 /RA_rasvaprosentti.pdf
7.2.2019/20
Regressiomallissa
= + + , = 1, 2, … , hypoteesin
H0: 1 = 0
testaaminen voidaan tehdä joko t-testillä tai F-testillä, testisuureiden välinen yhteys
= = =
7.2.2019/21
Esim. Jalkapalloilijat y = paino x = pituus
t2 = F