• Ei tuloksia

Yhden selittäjän lineaarinen regressiomalli ja sitä koskevat oletukset Oletetaan, että selitettävän muuttujan y havaittujen arvojen vaihtelu halutaan selittää selittävän

Esimerkki 1: Betonin lujuuden riippuvuus kuivumisajasta

15. Yhden selittäjän lineaarinen regressiomalli

15.1. Yhden selittäjän lineaarinen regressiomalli ja sitä koskevat oletukset Oletetaan, että selitettävän muuttujan y havaittujen arvojen vaihtelu halutaan selittää selittävän

muuttujan eliselittäjänx havaittujen arvojen vaihtelun avulla.

Tehdään muuttujistay jax seuraavatperusoletukset:

(i) Selitettävä muuttujay onsuhdeasteikollinen satunnaismuuttuja.

(ii) Selittävä muuttujax onkiinteä eliei-satunnainen muuttuja.

Huomautus:

• Satunnaisen selittävän muuttujan tapausta käsitellään myöhemmin erikseen.

Havainnot Olkoot

y1,y2, … ,yn

selitettävän muuttujany ja x1,x2, … ,xn

selittävän muuttujanxhavaittuja arvoja. Oletetaan lisäksi, että havaintoarvot xi jayi liittyvät samaan havaintoyksikköön kaikillei = 1, 2, … ,n. Havaintoarvotxi jayi muodostavat pisteitä kaksiulotteisessa avaruudessa:

( ,x yi i)∈ 2 ,i=1, 2,K,n

Yhden selittäjän lineaarinen regressiomalli

Tavanomaisenyhden selittäjän lineaarinen regressiomallin yleinen muoto on

0 1 , 1, 2, ,

i i i

y =β +β xi= K n jossa

yi = selitettävän muuttujany satunnainen jahavaittu arvo havaintoyksikössäi xi = selittäjän (selittävän muuttujan)x ei-satunnainen jahavaittu arvo

havaintoyksikössäi

εi = jäännös- elivirheterminεsatunnainen jaei-havaittu arvo havaintoyksikössäi

β0 = ei-satunnainen jatuntematon vakio (vakioselittäjänregressiokerroin) β1 = selittäjänx ei-satunnainen ja tuntematonregressiokerroin

Huomautus:

• Regressiokertoimet β0 jaβ1 on oletettusamoiksi kaikille havaintoyksiköillei.

Huomautus:

• Kerrointaβ0 kutsutaan vakioselittäjän regressiokertoimeksi, koska sitä vastaa keinotekoinen selittäjä, joka saa vakioarvon = 1 jokaiselle havaintoyksiölle i.

Jäännöstermiä koskevat stokastiset oletukset

Mallin jäännöstermistäε tehdään seuraavat stokastiset oletukset:

(i) E( )ε =i 0 ,i=1, 2,K,n (ii) Var( )εi2,i=1, 2,K,n (iii) Cor( ,ε εi j)=0 ,ij

Oletuksen (ii) mukaan kaikilla jäännöstermeilläεion sama varianssi. Jos oletus (ii)pätee, sanomme, että jäännöstermit ovathomoskedastisia. Kutsumme tällöin jäännöstermien yhteistä varianssiaσ2 mallinjäännösvarianssiksi. Jos oletus (ii)ei päde, jäännöstermeillä εiei ole samaa varianssia.

Sanomme tällöin, että jäännöstermit ovatheteroskedastisia.

Oletuksen (iii) mukaan jäännöstermitεi ovatkorreloimattomia. Jos oletus (iii)ei päde, jäännös-termitεi ovat korreloituneita. Oletuksen (iii) sijasta tehdään usein seuraava, sitä voimakkaampi oletus:

(iii∗) Jäännöstermitεi ,i = 1, 2, … , n ovatriippumattomia:

1, 2, , n ε ε K ε ⊥ Oletus (iii) seuraa oletuksesta (iii∗).

Lisäksi jäännöstermeistäεi tehdään useinnormaalisuusoletus:

(iv) εi N(0,σ2) ,i=1, 2,K,n Oletus (iv) sisältää oletukset (i) ja (ii).

Jos yhden selittäjän lineaarinen regressiomalli

0 1 , 1, 2, ,

i i i

y =β +β xi= K n

ja sen osat toteuttavat em. oletukset (i)-(iv), sanomme, ettämalli toteuttaa ns.tavanomaiset eli standardioletukset. Mallista tehtyjen oletuksien tarkistaminen muodostaa keskeisen osan regressioanalyysia; ks. lukuaRegressiodiagnostiikka.

Selitettävän muuttujan ominaisuudet

Oletetaan, että yhden selittäjän lineaaristen regressiomallin

0 1 , 1, 2, ,

i i i

y =β +β xi= K n

jäännös- eli virhetermiäεi koskevat standardioletukset (i)-(iii) pätevät. Tällöin (i)´ E( )yi01x ii , =1, 2,K,n

(ii)´ Var( )yi2 ,i=1, 2,K,n (iii)´ Cor( ,y yi j)=0 ,ij

Jos lisäksi jäännös- eli virhetermiäεi koskeva normaalisuusoletus (iv) pätee, niin (iv)´ yi N(β β σ0+ 1xi, 2) ,i=1, 2,K,n

Kohdat (i)´ – (iv)´ seuraavat suoraan standardioletuksista (i) – (iv) sekä odotusarvon, varianssin, korrelaation ja normaalijakauman yleisistä ominaisuuksista sekä siitä, että regressiokertoimienβ0 jaβ1 lisäksi myös selittävän muuttujanx havaitut arvot on oletettu ei-satunnaisiksi vakioiksi.

(i)´ E( )yi =E(β01xii)=β01xi+E( )εi01x i, =1, 2,K,n (ii)´ Var( )yi =E[(yi−E( )) ]yi 2 =E(εi2)=Var( )εi2,i=1, 2,K,n

(iii)´ Cor( ,y yi j)=E[(yi−E( ))(yi yi −E( ))]yi =E(ε εi j)=Cor( ,ε εi j)=0 ,ij (iv)´ Koska

0 1 , 1, 2, ,

i i i

y =β +β xi= K n ja

N(0, 2) , 1, 2, ,

i i n

ε σ = K

niinyi onlineaarimuunnos normaalijakautuneesta satunnaismuuttujastaεi . Siten normaalijakauman yleisistä ominaisuuksista seuraa, että

2

0 1

N( , ) , 1, 2, ,

i i

y β β σ+ x i= K n

Mallin parametrit

Yhden selittäjän lineaaristen regressiomallin

0 1 , 1, 2, ,

i i i

y =β +β xi= K n

parametreja ovatregressiokertoimetβ0 jaβ1 jajäännösvarianssiσ2. Koska parametrit ovat tavallisestituntemattomia, ne onestimoitava muuttujieny jax havaituista arvoista.

Mallin systemaattinen osa ja satunnainen osa Oletetaan, että yhden selittäjän lineaaristen regressiomallin

0 1 , 1, 2, ,

i i i

y =β +β xi= K n jäännös- eli virhetermiäεi koskeva standardioletus

(i) E( )ε =i 0 ,i=1, 2,K,n

pätee. Tällöin voimme esittää selitettävän muuttujany havaitut arvot yi kahden osatekijän summana muodossa

E( ) , 1, 2, ,

i i i

y = yi= K n jossa

0 1

E( )yi =β +β x ii , =1, 2,K,n

Sanomme, että selitettävän muuttujany havaittujen arvojenyi odotusarvot

0 1

E( )yi =β +β x ii , =1, 2,K,n

muodostavat mallinsystemaattisen osan ja jäännöstermi.

0 1

E( ) , 1, 2, ,

i yi yi yi x ii n

ε = − = −β β− = K

muodostaa mallinsatunnaisen osan. Mallin systemaattinen osa E(yi)riippuu selittäjänx saamista arvoista, kun taas mallin satunnainen osaεiei riipu selittäjänx saamista arvoista.

Regressiosuora

Tavanomaisen yhden selittäjän lineaarisen regressiomallin

0 1 , 1, 2, ,

i i i

y =β +β xi= K n systemaattinen osa

0 1

E( )yi =β +β x ii , =1, 2,K,n määrittelee regressiosuoran

0 1

y=β +β x jossa

β0 = regressiosuoranvakiotermi β1 = regressiosuorankulmakerroin

Mallin jäännös- eli virhetermienεi varianssiσ2 kuvaa havaintopisteiden ( ,x yi i) ,i=1, 2,K,n

vaihtelua regressiosuoran

0 1

y=β +β x ympärillä.

Regressiosuoran kulmakertoimen tulkinta

Tavanomaisen yhden selittäjän lineaarisen regressiomallin sovelluksissa on tärkeätä tuntea mallin systemaattisen osan määrittelemän regressiosuoran

0 1

y=β +β x

kulmakertoimenβ1tulkinta. Oletetaan, että selittäjänx arvokasvaa yhdellä yksiköllä:

1 xx+

Regressiokerroinβ1 kertoopaljonko selitettävän muuttujan y odotettavissa oleva arvo

0 1

E( )y =β +β x muuttuu:

0 1 0 1 0 1 1 1

E( )y =β +βx → β β+ (x+ =1) β +β x+β =E( )y15.2. Regressiokertoimien estimointi

Koska tavanomaisen yhden selittäjän lineaarisen regressiomallin , 1,2, ,

y =β +β xi= K n

regressiokertoimetβ0 jaβ1 ovat tavallisestituntemattomia, ne onestimoitava muuttujieny jax havaituista arvoistaxi jayi . Estimoinnissa regressiokertoimilleβ0 jaβ1 pyritään löytämään sellaiset arvot, että niiden määräämä regressiosuoraselittäisi mahdollisimman hyvin selitettävän muuttujan y havaittujen arvojen vaihtelun.

Regressiokertoimien PNS-estimointi

Regressiokertoimienβ0 jaβ1 estimointiin on tarjolla useita erilaisia menetelmiä. Menetelmistä käytettään yleisimminpienimmän neliösumman menetelmää. Regressiokertoimienβ0 jaβ1

pienimmän neliösumman (PNS-)estimaattorit saadaanminimoimalla neliösumma

2 2

0 1 0 1

1 1

( , ) ( )

n n

j j j

i i

S β β ε y β β x

= =

=

=

− −

regressiokertoimienβ0 jaβ1 suhteen.Regressiokertoimienβ0 jaβ1PNS-estimaattoreiksi saadaan

0 1

1 2

y xy

xy

x x

b y b x

s s

b r

s s

= −

= =

jossa

1 1

1 n 1 n

i i

i i

x x y y

n = n =

=

=

ovatx-havaintojen jay-havaintojenaritmeettiset keskiarvot,

2 2 2 2

1 1

1 1

( ) ( )

1 1

n n

x i y i

i i

s x x s y y

n = n =

= − = −

ovatx-havaintojen jay-havaintojenotosvarianssit,

1

1 ( )( )

1

n

xy i i

i

s x x y y

n =

= − −

on x-havaintojen jay-havaintojenotoskovarianssi ja lisäksi

xy xy

x y

r s

=s s

onx-havaintojen jay-havaintojenotoskorrelaatiokerroin.

Perustelu:

Yhden selittäjän lineaarisen regressiomallin

0 1 , 1,2, ,

i i i

y =β +β xi= K n

regressiokertoimetβ0 jaβ1 estimoidaan PNS-menetelmälläminimoimalla jäännöstermienεi

neliösumma

2 2

0 1 0 1

1 1

( , ) ( )

n n

i i i

i i

S β β ε y β βx

= =

=

=

− −

kertoimienβ0 jaβ1 suhteen. Tämä tapahtuu tavanomaiseen tapaanderivoimalla funktio

0 1

( , )

S β β kertoimienβ0 jaβ1 suhteen jamerkitsemällä derivaatat nolliksi:

(1) 0 1 0 1

0 1

( , )

2 ( ) 0

n

i i

i

S β β y β βx

β =

∂ = − − − =

(2) 0 1 0 1

1 1

( , )

2 ( ) 0

n

i i i

i

S β β y β βx x

β =

∂ = − − − =

Regressiokertoimienβ0 jaβ1PNS-estimaattorit saadaannormaaliyhtälöiden (1) ja (2) ratkaisuina.

Kirjoitetaan normaaliyhtälöt (1) ja (2) muotoihin

(1)´ 0 1

1 1

0

n n

i i

i i

y nβ β x

= − − = =

∑ ∑

(2)´ 0 1 2

1 1 1

0

n n n

i i i i

i i i

y x β x β x

=== =

∑ ∑ ∑

Ratkaistaanβ0 yhtälöstä (1)´:

(3) 0 1 1

1 1

1 n 1 n

i i

i i

y x y x

n n

β β β

= =

=

= −

ja sijoitetaan ratkaisu yhtälöön (2)´:

(4) 1 2 1 2

1 1

0

n n

i i i

i i

y x n y x n xβ β x

= − + − = =

∑ ∑

Parametrinβ1PNS-estimaattoriksi saadaan yhtälöstä (4):

(5) 1 1 2

2 2

1 n

i i

xy y

i n xy

x x

i i

y x n y x

s s

b r

s s

x n x

=

=

= = =

Sijoittamallab1 yhtälöön (3) saadaan parametrinβ0PNS-estimaattoriksi (6) b0 = −y b x1

Saatu ratkaisu on todellakin funktion S(β β0, 1) minimi, mikä nähdään siitä, että funktion

0 1

( , )

S β β 2.kertaluvun osittaisderivaattojen muodostama matriisi

2 2

0 1 0 1

2

0 0 1 1

2 2

0 1 0 1 2

2

1 1

0 1 1

( , ) ( , )

2 2

( , ) ( , )

2 2

n i i

n n

i i

i i

S S

n x

S S

x x

β β β β

β β β

β β β β

β β β

=

= =

∂ ∂   

 ∂ ∂ ∂   

 

= =  

∂ ∂

   

 ∂ ∂ ∂   

 

S

∑ ∑

onpositiivisesti definiitti. Tämä seuraa esimerkiksi siitä, että

[ ]

S 11=2n>0

ja

2 2

1 1

det( ) 2 0

n n

i i

i i

n x x

= =

   

= 

−

 >

S

Jälkimmäinen epäyhtälö seuraa siitä, että

2

2 2 2

1 1 1

( 1) ( 1) ( ) ( 1) 1 0

n n n

x i i i

i i i

n s n x x n x x

= = n =

   

− = −

− = − 

− 

 >

Huomaa, että selittäjänx regressiokertoimenβ1 estimaattorinb1 lauseke voidaan edellä esitetyn mukaan kirjoittaa seuraaviin muotoihin:

1

1 2

2 1

( )( )

( )

n

i i

y xy i

xy n

x x

i i

x x y y

s s

b r

s s

x x

=

=

− −

= = =

Estimoitu regressiosuora

Tavanomaisen yhden selittäjän lineaarisen regressiomallin

0 1 , 1, 2, ,

i i i

y =β +β xi= K n

regressiokertoimienβ0 jaβ1PNS-estimaattorit b0 jab1 ja määrittelevät suoran

0 1

y= +b b x jossa

b0 = estimoidun regressiosuoranvakiotermi b1 = estimoidun regressiosuorankulmakerroin Sijoittamalla regressiokertoimienβ0 jaβ1 estimaattoreiden lausekkeet

0 1

1

y xy

x

b y b x b r s

s

= −

=

suoran y= +b0 b x1 yhtälöön, voidaan yhtälö kirjoittaa seuraavaan muotoon:

( )

y xy

x

y y r s x x

= + s

Tästä muodosta nähdään, että estimoitu regressiosuura kulkee aina havaintopisteiden ( ,x yi i) ,i=1, 2,K,n painopisteen ( , )x y kautta.

Estimoidulla regressiosuoralla on seuraavat ominaisuudet:

(i) Jos rxy >0, suora onnouseva.

(ii) Jos rxy <0, suora onlaskeva.

(iii) Jos rxy =0, suora onvaakasuorassa.

(iv) Suora tuleejyrkemmäksi (tuleeloivemmaksi), jos

• korrelaation itseisarvo |rxy| kasvaa (pienenee)

• keskihajonta sykasvaa (pienenee)

• keskihajonta s pienenee (kasvaa)x

Regressiokertoimien PNS-estimaattoreiden ominainaisuudet Tavanomaisen yhden selittäjän lineaarisen regressiomallin

0 1 , 1, 2, ,

i i i

y =β +β xi= K n

regressiokertoimienβ0 jaβ1PNS-estimaattorit b0 jab1 ovatharhattomia parametreilleβ0 jaβ1 : (i) E( )b00

(ii) E( )b11 Perustelu:

Todistetaan ensin kohta (ii).

(ii) Todetaan ensin, että regressiokertoimenβ1PNS-estimaattorin b1 kaava voidaan kirjoittaa muotoon

1 1

2 1

( )( )

( )

n

i i

i n

i i

x x y y

b

x x

=

=

− −

=

Toiseksi

1

1

0 1

1

0 1

1

0 1

E( ) E 1

1 E( )

1 E( )

1 ( )

n i i n

i i

n

i i

i n

i i

y y

n n y n x n x

x

β β ε

β β β β

=

=

=

=

 

=  

=

= + +

= +

= +

koska mallia koskevien oletusten mukaan regressiokertoimet β0 jaβ1 sekä selittävän muuttujanx havaitut arvotxi ovatei-satunnaisia vakioita ja jäännöstermiäεi koskevan oletuksen (i) mukaan

E( )ε =i 0 ,i=1, 2,K,n

Siten

2

0 1 0 1

1 1

1 1 1

2 2

1 1

( )( ) ( )

E( )

( ) ( )

n n

i i i

i i

n n

i i

i i

x x x x x x

b

x x x x

β β β β

β β

= =

= =

− + − − −

= = =

− −

∑ ∑

∑ ∑

Todistetaan kohta (i).

(i) Koska

0 1

b = −y b x

kohdan (ii) todistuksesta seuraa, että

0 0 1 1 0

E( )b =β β+ x−β x

Regressiokertoimienβ0 jaβ1PNS-estimaatoreidenb0 jab1varianssit ovat (i)

2 2

0 2

1

Var( ) 1

( )

n i i

b x

n x x

σ

=

 

 

= +

 − 

(ii) 1 2

2 1

Var( ) 1

( )

n i i

b

x x σ

=

=

Lisäksi regressiokertoimienβ0 jaβ1PNS-estimaatoreidenb0 jab1kovarianssi on (iii)

2

0 1 2

1

Cov( , )

( )

n i i

b b x

x x

σ

=

= −

Perustelu:

Todistetaan ensin kohta (ii).

(ii) Todetaan ensin, että regressiokertoimenβ1PNS-estimaattori b1 voidaan esittää selitettävän muuttujany havaittujen arvojen

, 1, 2, , yi i= K n

lineaarikombinaationa, jossa painokertoimet

2 1

( )

, 1, 2, ,

( )

i

i n

i i

x x

v i n

x x

=

= − =

K

ovatei-satunnaisia vakioita:

1 1

1

2 2 1

1 1

( )( ) ( )

( ) ( )

n n

i i i i n

i i

i i

n n

i

i i

i i

x x y y x x y

b v y

x x x x

= =

=

= =

− − −

= = =

− −

∑ ∑

∑ ∑ ∑

Regressiokerrointab1 koskevaa esitystä johdettaessa on käytetty hyväksi sitä, että

1 1 1

1 1

1

1

( )( ) ( ) ( )

( ) ( )

( ) 0

( )

n n n

i i i i i

i i i

n n

i i i

i i

n

i i

i n

i i

i

x x y y x x y x x y

x x y y x x

x x y y

x x y

= = =

= =

=

=

− − = − − −

= − − −

= − − ×

= −

∑ ∑ ∑

∑ ∑

koska

1 1 1 1

( ) 0

n n n n

i i i

i i i i

x x x x x nx

= − = == = = − =

∑ ∑ ∑ ∑

Käyttäen hyväksi regressiokertoimenb1 esitysmuotoa satunnaismuuttujienyi lineaari-kombinaationa ja odotusarvo-operaattorin E(⋅) lineaarisuutta nähdään, että

1

1 1

E( ) E( )

n n

i i i i

i i

b v y vµ

= =

=

=

jossa

0 1

E( ) , 1, 2, ,

i yi x ii n

µ = =β +β = K Siten

2

1 1 1

2

1 1

2

1

1 1

1 1

Var( ) E ( E( )) E

E ( )

E ( )( )

E ( )( )

E ( E( ))( E( ))

n n

i i i i

i i

n

i i i

i

n n

i j i i j j

i j

n n

i j i i j j

i j

i j i i j j

j

b b b

v y v

v y

v v y y

v v y y

v v y y y y

µ

µ

µ µ

µ µ

= =

=

= =

= =

 

=  − 

  

=  −  

  

=  −  

 

=  − − 

 

 

 

=  − − 

 

=  − − 

∑ ∑

∑∑

∑∑

1 1

1 1

Cov( , )

n n

i

n n

i j i j

i j

v v y y

= =

= =

=

∑∑

∑∑

Koska edellä on todettu, että

2

Cov( , ) 0 ,

i j ,

i j

y y σ i j

 ≠

=  =

1

1 1

2 1

2 2

1

2 2

2

1 2

1 2

2 1

Var( ) Cov( , )

Var( )

( )

( )

( )

n n

i j i j

i j

n

i i

i n

i i

n

i i n

i i

n i i

b v v y y

v y

v

x x x x

x x

σ σ

σ

= =

=

=

=

=

=

=

=

=

= −

 − 

 

 

=

∑∑

∑ ∑

Todistetaan seuraavaksi kohta (iii).

(iii) Todetaan ensin, että selitettävän muuttujany havaittujen arvojen yi , i = 1, 2, … ,n

aritmeettinen keskiarvo y voidaan esittää havaittujen arvojenlineaarikombinaationa

1 1 1

1 n n 1 n

i i i i

i i i

y y y u y

n = = n =

=

∑ ∑

= =

jossapainokertoimet 1, 1, 2, ,

ui i n

=n = K

ovat ei-satunnaisia vakioita.

Kohdan (ii) todistuksessa todettiin, että myös regressiokertoimenβ1 PNS-estimaattori b1 voidaan esittää selitettävän muuttujany havaittujen arvojen

yi , i = 1, 2, … ,n lineaarikombinaationa:

1 1

1

2 2 1

1 1

( )( ) ( )

( ) ( )

n n

i i i i n

i i

i i

n n

i

i i

i i

x x y y x x y

b v y

x x x x

= =

=

= =

− − −

= = =

− −

∑ ∑

∑ ∑ ∑

jossapainokertoimet

2 1

( )

, 1, 2, ,

( )

i

i n

i i

x x

v i n

x x

=

= − =

K

ovat ei-satunnaisia vakioita.

Käyttäen hyväksi satunnaismuuttujien y jab1 esitysmuotoja selitettävän muuttujany havaittujen arvojen lineaarikombinaatioina ja odotusarvo-operaattorin E(⋅) lineaarisuutta nähdään, että

1 1

E( ) E( )

n n

i i i i

i i

y u y uµ

= =

=

=

ja

1

1 1

E( ) E( )

n n

i i i i

i i

b v y vµ

= =

=

=

jossa

0 1

E( ) , 1, 2, ,

i yi x ii n

µ = =β +β = K Siten

[ ]

1 1 1

1 1 1 1

1 1

1 1

Cov( , ) E ( E( ))( E( )) E

E ( ) ( )

E ( )( )

E ( )( )

n n n n

i i i i i i i i

i i i i

n n

i i i i i i

i i

n n

i j i i j j

i j

i j i i j j

y b y y b b

u y u v y v

u y v y

u v y y

u v y y

µ µ

µ µ

µ µ

µ µ

= = = =

= =

= =

= − −

  

=  −  − 

  

=  −  − 

 

=  − − 

 

 

=  − −

∑ ∑ ∑ ∑

∑ ∑

∑∑

1 1

1 1

1 1

E ( E( ))( E( ))

Cov( , )

n n

i j

n n

i j i i j j

i j

n n

i j i j

i j

u v y y y y

u v y y

= =

= =

= =

 

 

=  − − 

=

∑∑

∑∑

∑∑

Koska

2

Cov( , ) 0 ,

i j ,

i j

y y σ i j

 ≠

=  = ja

1 1 1 1

( ) 0

n n n n

i i i

i i i i

x x x x x nx

= = = =

− = − = − =

∑ ∑ ∑ ∑

niin näemme, että selitettävän muuttujany havaittujen arvojen aritmeettisen keskiarvon y ja regressiokertoimenβ1 PNS-estimaattorinb1kovarianssi = 0:

1

1 1

1 2

1 2

1 2 1 2

2 1

1 2

2 1

Cov( , ) Cov( , )

Var( )

1

( )

( )

( )

0 0

( )

n n

i j i j

i j

n

i i i

i n

i i i

n

i n i

i i

n n i

i i

i

n i i

y b u v y y

u v y

u v

x x

n x x

x x

n x x

n x x

σ σ

σ

σ

= =

=

=

=

=

=

=

=

=

=

=

= × −

= −

= × =

∑∑

∑ ∑

∑ ∑

Siten selitettävän muuttujany havaittujen arvojen aritmeettinen keskiarvo y ja regressiokertoimenβ1 PNS-estimaattorib1 ovatkorreloimattomia.

Edellä esitetystä, kohdasta (ii) ja siitä, että

0 1

b = −y b x seuraa, että

0 1 1 1

1 1 1

1 2

2 1

Cov( , ) Cov( , )

Cov( , ) Cov( , ) 0 Var( )

( )

n i i

b b y b x b

y b b x b

x b

x x x

σ

=

= −

= −

= −

= −