Esimerkki 1: Betonin lujuuden riippuvuus kuivumisajasta
15. Yhden selittäjän lineaarinen regressiomalli
15.1. Yhden selittäjän lineaarinen regressiomalli ja sitä koskevat oletukset Oletetaan, että selitettävän muuttujan y havaittujen arvojen vaihtelu halutaan selittää selittävän
muuttujan eliselittäjänx havaittujen arvojen vaihtelun avulla.
Tehdään muuttujistay jax seuraavatperusoletukset:
(i) Selitettävä muuttujay onsuhdeasteikollinen satunnaismuuttuja.
(ii) Selittävä muuttujax onkiinteä eliei-satunnainen muuttuja.
Huomautus:
• Satunnaisen selittävän muuttujan tapausta käsitellään myöhemmin erikseen.
Havainnot Olkoot
y1,y2, … ,yn
selitettävän muuttujany ja x1,x2, … ,xn
selittävän muuttujanxhavaittuja arvoja. Oletetaan lisäksi, että havaintoarvot xi jayi liittyvät samaan havaintoyksikköön kaikillei = 1, 2, … ,n. Havaintoarvotxi jayi muodostavat pisteitä kaksiulotteisessa avaruudessa:
( ,x yi i)∈ 2 ,i=1, 2,K,n
Yhden selittäjän lineaarinen regressiomalli
Tavanomaisenyhden selittäjän lineaarinen regressiomallin yleinen muoto on
0 1 , 1, 2, ,
i i i
y =β +β x +ε i= K n jossa
yi = selitettävän muuttujany satunnainen jahavaittu arvo havaintoyksikössäi xi = selittäjän (selittävän muuttujan)x ei-satunnainen jahavaittu arvo
havaintoyksikössäi
εi = jäännös- elivirheterminεsatunnainen jaei-havaittu arvo havaintoyksikössäi
β0 = ei-satunnainen jatuntematon vakio (vakioselittäjänregressiokerroin) β1 = selittäjänx ei-satunnainen ja tuntematonregressiokerroin
Huomautus:
• Regressiokertoimet β0 jaβ1 on oletettusamoiksi kaikille havaintoyksiköillei.
Huomautus:
• Kerrointaβ0 kutsutaan vakioselittäjän regressiokertoimeksi, koska sitä vastaa keinotekoinen selittäjä, joka saa vakioarvon = 1 jokaiselle havaintoyksiölle i.
Jäännöstermiä koskevat stokastiset oletukset
Mallin jäännöstermistäε tehdään seuraavat stokastiset oletukset:
(i) E( )ε =i 0 ,i=1, 2,K,n (ii) Var( )εi =σ2,i=1, 2,K,n (iii) Cor( ,ε εi j)=0 ,i≠ j
Oletuksen (ii) mukaan kaikilla jäännöstermeilläεion sama varianssi. Jos oletus (ii)pätee, sanomme, että jäännöstermit ovathomoskedastisia. Kutsumme tällöin jäännöstermien yhteistä varianssiaσ2 mallinjäännösvarianssiksi. Jos oletus (ii)ei päde, jäännöstermeillä εiei ole samaa varianssia.
Sanomme tällöin, että jäännöstermit ovatheteroskedastisia.
Oletuksen (iii) mukaan jäännöstermitεi ovatkorreloimattomia. Jos oletus (iii)ei päde, jäännös-termitεi ovat korreloituneita. Oletuksen (iii) sijasta tehdään usein seuraava, sitä voimakkaampi oletus:
(iii∗) Jäännöstermitεi ,i = 1, 2, … , n ovatriippumattomia:
1, 2, , n ε ε K ε ⊥ Oletus (iii) seuraa oletuksesta (iii∗).
Lisäksi jäännöstermeistäεi tehdään useinnormaalisuusoletus:
(iv) εi N(0,σ2) ,i=1, 2,K,n Oletus (iv) sisältää oletukset (i) ja (ii).
Jos yhden selittäjän lineaarinen regressiomalli
0 1 , 1, 2, ,
i i i
y =β +β x +ε i= K n
ja sen osat toteuttavat em. oletukset (i)-(iv), sanomme, ettämalli toteuttaa ns.tavanomaiset eli standardioletukset. Mallista tehtyjen oletuksien tarkistaminen muodostaa keskeisen osan regressioanalyysia; ks. lukuaRegressiodiagnostiikka.
Selitettävän muuttujan ominaisuudet
Oletetaan, että yhden selittäjän lineaaristen regressiomallin
0 1 , 1, 2, ,
i i i
y =β +β x +ε i= K n
jäännös- eli virhetermiäεi koskevat standardioletukset (i)-(iii) pätevät. Tällöin (i)´ E( )yi =β0+β1x ii , =1, 2,K,n
(ii)´ Var( )yi =σ2 ,i=1, 2,K,n (iii)´ Cor( ,y yi j)=0 ,i≠ j
Jos lisäksi jäännös- eli virhetermiäεi koskeva normaalisuusoletus (iv) pätee, niin (iv)´ yi N(β β σ0+ 1xi, 2) ,i=1, 2,K,n
Kohdat (i)´ – (iv)´ seuraavat suoraan standardioletuksista (i) – (iv) sekä odotusarvon, varianssin, korrelaation ja normaalijakauman yleisistä ominaisuuksista sekä siitä, että regressiokertoimienβ0 jaβ1 lisäksi myös selittävän muuttujanx havaitut arvot on oletettu ei-satunnaisiksi vakioiksi.
(i)´ E( )yi =E(β0+β1xi+εi)=β0 +β1xi+E( )εi =β0+β1x i, =1, 2,K,n (ii)´ Var( )yi =E[(yi−E( )) ]yi 2 =E(εi2)=Var( )εi =σ2,i=1, 2,K,n
(iii)´ Cor( ,y yi j)=E[(yi−E( ))(yi yi −E( ))]yi =E(ε εi j)=Cor( ,ε εi j)=0 ,i≠ j (iv)´ Koska
0 1 , 1, 2, ,
i i i
y =β +β x +ε i= K n ja
N(0, 2) , 1, 2, ,
i i n
ε σ = K
niinyi onlineaarimuunnos normaalijakautuneesta satunnaismuuttujastaεi . Siten normaalijakauman yleisistä ominaisuuksista seuraa, että
2
0 1
N( , ) , 1, 2, ,
i i
y β β σ+ x i= K n
Mallin parametrit
Yhden selittäjän lineaaristen regressiomallin
0 1 , 1, 2, ,
i i i
y =β +β x +ε i= K n
parametreja ovatregressiokertoimetβ0 jaβ1 jajäännösvarianssiσ2. Koska parametrit ovat tavallisestituntemattomia, ne onestimoitava muuttujieny jax havaituista arvoista.
Mallin systemaattinen osa ja satunnainen osa Oletetaan, että yhden selittäjän lineaaristen regressiomallin
0 1 , 1, 2, ,
i i i
y =β +β x +ε i= K n jäännös- eli virhetermiäεi koskeva standardioletus
(i) E( )ε =i 0 ,i=1, 2,K,n
pätee. Tällöin voimme esittää selitettävän muuttujany havaitut arvot yi kahden osatekijän summana muodossa
E( ) , 1, 2, ,
i i i
y = y +ε i= K n jossa
0 1
E( )yi =β +β x ii , =1, 2,K,n
Sanomme, että selitettävän muuttujany havaittujen arvojenyi odotusarvot
0 1
E( )yi =β +β x ii , =1, 2,K,n
muodostavat mallinsystemaattisen osan ja jäännöstermi.
0 1
E( ) , 1, 2, ,
i yi yi yi x ii n
ε = − = −β β− = K
muodostaa mallinsatunnaisen osan. Mallin systemaattinen osa E(yi)riippuu selittäjänx saamista arvoista, kun taas mallin satunnainen osaεiei riipu selittäjänx saamista arvoista.
Regressiosuora
Tavanomaisen yhden selittäjän lineaarisen regressiomallin
0 1 , 1, 2, ,
i i i
y =β +β x +ε i= K n systemaattinen osa
0 1
E( )yi =β +β x ii , =1, 2,K,n määrittelee regressiosuoran
0 1
y=β +β x jossa
β0 = regressiosuoranvakiotermi β1 = regressiosuorankulmakerroin
Mallin jäännös- eli virhetermienεi varianssiσ2 kuvaa havaintopisteiden ( ,x yi i) ,i=1, 2,K,n
vaihtelua regressiosuoran
0 1
y=β +β x ympärillä.
Regressiosuoran kulmakertoimen tulkinta
Tavanomaisen yhden selittäjän lineaarisen regressiomallin sovelluksissa on tärkeätä tuntea mallin systemaattisen osan määrittelemän regressiosuoran
0 1
y=β +β x
kulmakertoimenβ1tulkinta. Oletetaan, että selittäjänx arvokasvaa yhdellä yksiköllä:
1 x → x+
Regressiokerroinβ1 kertoopaljonko selitettävän muuttujan y odotettavissa oleva arvo
0 1
E( )y =β +β x muuttuu:
0 1 0 1 0 1 1 1
E( )y =β +βx → β β+ (x+ =1) β +β x+β =E( )y +β 15.2. Regressiokertoimien estimointi
Koska tavanomaisen yhden selittäjän lineaarisen regressiomallin , 1,2, ,
y =β +β x +ε i= K n
regressiokertoimetβ0 jaβ1 ovat tavallisestituntemattomia, ne onestimoitava muuttujieny jax havaituista arvoistaxi jayi . Estimoinnissa regressiokertoimilleβ0 jaβ1 pyritään löytämään sellaiset arvot, että niiden määräämä regressiosuoraselittäisi mahdollisimman hyvin selitettävän muuttujan y havaittujen arvojen vaihtelun.
Regressiokertoimien PNS-estimointi
Regressiokertoimienβ0 jaβ1 estimointiin on tarjolla useita erilaisia menetelmiä. Menetelmistä käytettään yleisimminpienimmän neliösumman menetelmää. Regressiokertoimienβ0 jaβ1
pienimmän neliösumman (PNS-)estimaattorit saadaanminimoimalla neliösumma
2 2
0 1 0 1
1 1
( , ) ( )
n n
j j j
i i
S β β ε y β β x
= =
=
∑
=∑
− −regressiokertoimienβ0 jaβ1 suhteen.Regressiokertoimienβ0 jaβ1PNS-estimaattoreiksi saadaan
0 1
1 2
y xy
xy
x x
b y b x
s s
b r
s s
= −
= =
jossa
1 1
1 n 1 n
i i
i i
x x y y
n = n =
=
∑
=∑
ovatx-havaintojen jay-havaintojenaritmeettiset keskiarvot,
2 2 2 2
1 1
1 1
( ) ( )
1 1
n n
x i y i
i i
s x x s y y
n = n =
= − = −
−
∑
−∑
ovatx-havaintojen jay-havaintojenotosvarianssit,
1
1 ( )( )
1
n
xy i i
i
s x x y y
n =
= − −
−
∑
on x-havaintojen jay-havaintojenotoskovarianssi ja lisäksi
xy xy
x y
r s
=s s
onx-havaintojen jay-havaintojenotoskorrelaatiokerroin.
Perustelu:
Yhden selittäjän lineaarisen regressiomallin
0 1 , 1,2, ,
i i i
y =β +β x +ε i= K n
regressiokertoimetβ0 jaβ1 estimoidaan PNS-menetelmälläminimoimalla jäännöstermienεi
neliösumma
2 2
0 1 0 1
1 1
( , ) ( )
n n
i i i
i i
S β β ε y β βx
= =
=
∑
=∑
− −kertoimienβ0 jaβ1 suhteen. Tämä tapahtuu tavanomaiseen tapaanderivoimalla funktio
0 1
( , )
S β β kertoimienβ0 jaβ1 suhteen jamerkitsemällä derivaatat nolliksi:
(1) 0 1 0 1
0 1
( , )
2 ( ) 0
n
i i
i
S β β y β βx
β =
∂ = − − − =
∂
∑
(2) 0 1 0 1
1 1
( , )
2 ( ) 0
n
i i i
i
S β β y β βx x
β =
∂ = − − − =
∂
∑
Regressiokertoimienβ0 jaβ1PNS-estimaattorit saadaannormaaliyhtälöiden (1) ja (2) ratkaisuina.
Kirjoitetaan normaaliyhtälöt (1) ja (2) muotoihin
(1)´ 0 1
1 1
0
n n
i i
i i
y nβ β x
= − − = =
∑ ∑
(2)´ 0 1 2
1 1 1
0
n n n
i i i i
i i i
y x β x β x
= − = − = =
∑ ∑ ∑
Ratkaistaanβ0 yhtälöstä (1)´:
(3) 0 1 1
1 1
1 n 1 n
i i
i i
y x y x
n n
β β β
= =
=
∑
−∑
= −ja sijoitetaan ratkaisu yhtälöön (2)´:
(4) 1 2 1 2
1 1
0
n n
i i i
i i
y x n y x n xβ β x
= − + − = =
∑ ∑
Parametrinβ1PNS-estimaattoriksi saadaan yhtälöstä (4):
(5) 1 1 2
2 2
1 n
i i
xy y
i n xy
x x
i i
y x n y x
s s
b r
s s
x n x
=
=
−
= = =
−
∑
∑
Sijoittamallab1 yhtälöön (3) saadaan parametrinβ0PNS-estimaattoriksi (6) b0 = −y b x1
Saatu ratkaisu on todellakin funktion S(β β0, 1) minimi, mikä nähdään siitä, että funktion
0 1
( , )
S β β 2.kertaluvun osittaisderivaattojen muodostama matriisi
2 2
0 1 0 1
2
0 0 1 1
2 2
0 1 0 1 2
2
1 1
0 1 1
( , ) ( , )
2 2
( , ) ( , )
2 2
n i i
n n
i i
i i
S S
n x
S S
x x
β β β β
β β β
β β β β
β β β
=
= =
∂ ∂
∂ ∂ ∂
= =
∂ ∂
∂ ∂ ∂
∑
S
∑ ∑
onpositiivisesti definiitti. Tämä seuraa esimerkiksi siitä, että
[ ]
S 11=2n>0ja
2 2
1 1
det( ) 2 0
n n
i i
i i
n x x
= =
=
∑
−∑
>S
Jälkimmäinen epäyhtälö seuraa siitä, että
2
2 2 2
1 1 1
( 1) ( 1) ( ) ( 1) 1 0
n n n
x i i i
i i i
n s n x x n x x
= = n =
− = −
∑
− = − ∑
− ∑
>Huomaa, että selittäjänx regressiokertoimenβ1 estimaattorinb1 lauseke voidaan edellä esitetyn mukaan kirjoittaa seuraaviin muotoihin:
1
1 2
2 1
( )( )
( )
n
i i
y xy i
xy n
x x
i i
x x y y
s s
b r
s s
x x
=
=
− −
= = =
−
∑
∑
Estimoitu regressiosuora
Tavanomaisen yhden selittäjän lineaarisen regressiomallin
0 1 , 1, 2, ,
i i i
y =β +β x +ε i= K n
regressiokertoimienβ0 jaβ1PNS-estimaattorit b0 jab1 ja määrittelevät suoran
0 1
y= +b b x jossa
b0 = estimoidun regressiosuoranvakiotermi b1 = estimoidun regressiosuorankulmakerroin Sijoittamalla regressiokertoimienβ0 jaβ1 estimaattoreiden lausekkeet
0 1
1
y xy
x
b y b x b r s
s
= −
=
suoran y= +b0 b x1 yhtälöön, voidaan yhtälö kirjoittaa seuraavaan muotoon:
( )
y xy
x
y y r s x x
= + s −
Tästä muodosta nähdään, että estimoitu regressiosuura kulkee aina havaintopisteiden ( ,x yi i) ,i=1, 2,K,n painopisteen ( , )x y kautta.
Estimoidulla regressiosuoralla on seuraavat ominaisuudet:
(i) Jos rxy >0, suora onnouseva.
(ii) Jos rxy <0, suora onlaskeva.
(iii) Jos rxy =0, suora onvaakasuorassa.
(iv) Suora tuleejyrkemmäksi (tuleeloivemmaksi), jos
• korrelaation itseisarvo |rxy| kasvaa (pienenee)
• keskihajonta sykasvaa (pienenee)
• keskihajonta s pienenee (kasvaa)x
Regressiokertoimien PNS-estimaattoreiden ominainaisuudet Tavanomaisen yhden selittäjän lineaarisen regressiomallin
0 1 , 1, 2, ,
i i i
y =β +β x +ε i= K n
regressiokertoimienβ0 jaβ1PNS-estimaattorit b0 jab1 ovatharhattomia parametreilleβ0 jaβ1 : (i) E( )b0 =β0
(ii) E( )b1 =β1 Perustelu:
Todistetaan ensin kohta (ii).
(ii) Todetaan ensin, että regressiokertoimenβ1PNS-estimaattorin b1 kaava voidaan kirjoittaa muotoon
1 1
2 1
( )( )
( )
n
i i
i n
i i
x x y y
b
x x
=
=
− −
=
−
∑
∑
Toiseksi
1
1
0 1
1
0 1
1
0 1
E( ) E 1
1 E( )
1 E( )
1 ( )
n i i n
i i
n
i i
i n
i i
y y
n n y n x n x
x
β β ε
β β β β
=
=
=
=
=
=
= + +
= +
= +
∑
∑
∑
∑
koska mallia koskevien oletusten mukaan regressiokertoimet β0 jaβ1 sekä selittävän muuttujanx havaitut arvotxi ovatei-satunnaisia vakioita ja jäännöstermiäεi koskevan oletuksen (i) mukaan
E( )ε =i 0 ,i=1, 2,K,n
Siten
2
0 1 0 1
1 1
1 1 1
2 2
1 1
( )( ) ( )
E( )
( ) ( )
n n
i i i
i i
n n
i i
i i
x x x x x x
b
x x x x
β β β β
β β
= =
= =
− + − − −
= = =
− −
∑ ∑
∑ ∑
Todistetaan kohta (i).
(i) Koska
0 1
b = −y b x
kohdan (ii) todistuksesta seuraa, että
0 0 1 1 0
E( )b =β β+ x−β x =β
Regressiokertoimienβ0 jaβ1PNS-estimaatoreidenb0 jab1varianssit ovat (i)
2 2
0 2
1
Var( ) 1
( )
n i i
b x
n x x
σ
=
= +
−
∑
(ii) 1 2
2 1
Var( ) 1
( )
n i i
b
x x σ
=
=
∑
−Lisäksi regressiokertoimienβ0 jaβ1PNS-estimaatoreidenb0 jab1kovarianssi on (iii)
2
0 1 2
1
Cov( , )
( )
n i i
b b x
x x
σ
=
= −
∑
− Perustelu:Todistetaan ensin kohta (ii).
(ii) Todetaan ensin, että regressiokertoimenβ1PNS-estimaattori b1 voidaan esittää selitettävän muuttujany havaittujen arvojen
, 1, 2, , yi i= K n
lineaarikombinaationa, jossa painokertoimet
2 1
( )
, 1, 2, ,
( )
i
i n
i i
x x
v i n
x x
=
= − =
∑
− Kovatei-satunnaisia vakioita:
1 1
1
2 2 1
1 1
( )( ) ( )
( ) ( )
n n
i i i i n
i i
i i
n n
i
i i
i i
x x y y x x y
b v y
x x x x
= =
=
= =
− − −
= = =
− −
∑ ∑
∑ ∑ ∑
Regressiokerrointab1 koskevaa esitystä johdettaessa on käytetty hyväksi sitä, että
1 1 1
1 1
1
1
( )( ) ( ) ( )
( ) ( )
( ) 0
( )
n n n
i i i i i
i i i
n n
i i i
i i
n
i i
i n
i i
i
x x y y x x y x x y
x x y y x x
x x y y
x x y
= = =
= =
=
=
− − = − − −
= − − −
= − − ×
= −
∑ ∑ ∑
∑ ∑
∑
∑
koska
1 1 1 1
( ) 0
n n n n
i i i
i i i i
x x x x x nx
= − = = − = = = − =
∑ ∑ ∑ ∑
Käyttäen hyväksi regressiokertoimenb1 esitysmuotoa satunnaismuuttujienyi lineaari-kombinaationa ja odotusarvo-operaattorin E(⋅) lineaarisuutta nähdään, että
1
1 1
E( ) E( )
n n
i i i i
i i
b v y vµ
= =
=
∑
=∑
jossa
0 1
E( ) , 1, 2, ,
i yi x ii n
µ = =β +β = K Siten
2
1 1 1
2
1 1
2
1
1 1
1 1
Var( ) E ( E( )) E
E ( )
E ( )( )
E ( )( )
E ( E( ))( E( ))
n n
i i i i
i i
n
i i i
i
n n
i j i i j j
i j
n n
i j i i j j
i j
i j i i j j
j
b b b
v y v
v y
v v y y
v v y y
v v y y y y
µ
µ
µ µ
µ µ
= =
=
= =
= =
= −
= −
= −
= − −
= − −
= − −
∑ ∑
∑
∑∑
∑∑
1 1
1 1
Cov( , )
n n
i
n n
i j i j
i j
v v y y
= =
= =
=
∑∑
∑∑
Koska edellä on todettu, että
2
Cov( , ) 0 ,
i j ,
i j
y y σ i j
≠
= =
1
1 1
2 1
2 2
1
2 2
2
1 2
1 2
2 1
Var( ) Cov( , )
Var( )
( )
( )
( )
n n
i j i j
i j
n
i i
i n
i i
n
i i n
i i
n i i
b v v y y
v y
v
x x x x
x x
σ σ
σ
= =
=
=
=
=
=
=
=
=
= −
−
=
−
∑∑
∑
∑
∑ ∑
∑
Todistetaan seuraavaksi kohta (iii).
(iii) Todetaan ensin, että selitettävän muuttujany havaittujen arvojen yi , i = 1, 2, … ,n
aritmeettinen keskiarvo y voidaan esittää havaittujen arvojenlineaarikombinaationa
1 1 1
1 n n 1 n
i i i i
i i i
y y y u y
n = = n =
=
∑ ∑
= =∑
jossapainokertoimet 1, 1, 2, ,
ui i n
=n = K
ovat ei-satunnaisia vakioita.
Kohdan (ii) todistuksessa todettiin, että myös regressiokertoimenβ1 PNS-estimaattori b1 voidaan esittää selitettävän muuttujany havaittujen arvojen
yi , i = 1, 2, … ,n lineaarikombinaationa:
1 1
1
2 2 1
1 1
( )( ) ( )
( ) ( )
n n
i i i i n
i i
i i
n n
i
i i
i i
x x y y x x y
b v y
x x x x
= =
=
= =
− − −
= = =
− −
∑ ∑
∑ ∑ ∑
jossapainokertoimet
2 1
( )
, 1, 2, ,
( )
i
i n
i i
x x
v i n
x x
=
= − =
∑
− Kovat ei-satunnaisia vakioita.
Käyttäen hyväksi satunnaismuuttujien y jab1 esitysmuotoja selitettävän muuttujany havaittujen arvojen lineaarikombinaatioina ja odotusarvo-operaattorin E(⋅) lineaarisuutta nähdään, että
1 1
E( ) E( )
n n
i i i i
i i
y u y uµ
= =
=
∑
=∑
ja
1
1 1
E( ) E( )
n n
i i i i
i i
b v y vµ
= =
=
∑
=∑
jossa
0 1
E( ) , 1, 2, ,
i yi x ii n
µ = =β +β = K Siten
[ ]
1 1 1
1 1 1 1
1 1
1 1
Cov( , ) E ( E( ))( E( )) E
E ( ) ( )
E ( )( )
E ( )( )
n n n n
i i i i i i i i
i i i i
n n
i i i i i i
i i
n n
i j i i j j
i j
i j i i j j
y b y y b b
u y u v y v
u y v y
u v y y
u v y y
µ µ
µ µ
µ µ
µ µ
= = = =
= =
= =
= − −
= − −
= − −
= − −
= − −
∑ ∑ ∑ ∑
∑ ∑
∑∑
1 1
1 1
1 1
E ( E( ))( E( ))
Cov( , )
n n
i j
n n
i j i i j j
i j
n n
i j i j
i j
u v y y y y
u v y y
= =
= =
= =
= − −
=
∑∑
∑∑
∑∑
Koska
2
Cov( , ) 0 ,
i j ,
i j
y y σ i j
≠
= = ja
1 1 1 1
( ) 0
n n n n
i i i
i i i i
x x x x x nx
= = = =
− = − = − =
∑ ∑ ∑ ∑
niin näemme, että selitettävän muuttujany havaittujen arvojen aritmeettisen keskiarvon y ja regressiokertoimenβ1 PNS-estimaattorinb1kovarianssi = 0:
1
1 1
1 2
1 2
1 2 1 2
2 1
1 2
2 1
Cov( , ) Cov( , )
Var( )
1
( )
( )
( )
0 0
( )
n n
i j i j
i j
n
i i i
i n
i i i
n
i n i
i i
n n i
i i
i
n i i
y b u v y y
u v y
u v
x x
n x x
x x
n x x
n x x
σ σ
σ
σ
= =
=
=
=
=
=
=
=
=
=
=
= × −
−
= −
−
= × =
−
∑∑
∑
∑
∑ ∑
∑ ∑
∑
Siten selitettävän muuttujany havaittujen arvojen aritmeettinen keskiarvo y ja regressiokertoimenβ1 PNS-estimaattorib1 ovatkorreloimattomia.
Edellä esitetystä, kohdasta (ii) ja siitä, että
0 1
b = −y b x seuraa, että
0 1 1 1
1 1 1
1 2
2 1
Cov( , ) Cov( , )
Cov( , ) Cov( , ) 0 Var( )
( )
n i i
b b y b x b
y b b x b
x b
x x x
σ
=
= −
= −
= −
= −