DIGRESS10ANALYYSI
H e t e r o g e e n i s e n h a v a i n t o a i n e i s t o n s o v i t t a m i n e n
v a i h t o e h t o i s i i n r e g r e s s i o m a l l e i h i n Seppo Mustonen
No. 2 tammikuu 1976
DEPARTMENT OF STATISTICS UNIVERSITY OF HELSINKI SF 00100 HELSINK110 FINLAND
1 . J o h d a n t o
H e t e r o g e e n i s e n a i n e i s t o n i l m a a n t u m i n e n e m p i i r i s e e n t u t k i m u k s e e n , j o s s a t u t k i j a o d o t t a a saavansa y h t e i s j a k a u m a l t a a n k a u n i i n , y k s i - h u i p p u i s e n o t o k s e n , e i y l e e n s a o l e i l a h d u t t a v a i l m i b . Onhan h a v a i n t o a r v o i h i n v a i k u t t a n e e t t a l l b i n j o t k i n e n n a l t a o d o t t a m a t t o - mat j a s i t e n m i t t a a m a t t a j a f i n e e t t e k i j a t . J o s nuo h a i r i b t e k i j a t v o i d a a n j a i k i k & t e e n s e l v i t t a a j a a r v i o i d a n i i d e n v a i k u t u k s e t e r i h a v a i n t o i h i n , h e t e r o g e e n i s u u s v o i d a a n ehka p o i s t a a t a i a i n a k i n sen h a i t a l l i s i m p i a v a i k u t u k s i a saadaan v f i h e n n e t y k s i . J o s s e n - s i j a a n h a i r i b t e k i j b i t a e i p y s t y t a j a i k i k a t e e n r e k i s t e r b i m a a n h a v a i n t o k o h t a i s e s t i , h e t e r o g e e n i s u u s i s t u u j a p y s y y a i n e i s t o s s a . TassS. t u t k i m u k s e s s a h e t e r o g e e n i s u u d e n ongelmaa t u l l a a n p o h t i m a a n t a v a n o m a i s e e n l i n e a a r i s e e n t a i e p S l i n e a a r i s e e n r e g r e s s i o a n a l y y - s i i n k y t k e t t y n a . T a r k o i t u k s e n a on e s i t t a S menetelmfi, j o k a t e k e e m a h d o l l i s e k s i r e g r e s s i o m a l l i e n k S s i t t e l y n h e t e r o g e e n i s u u d e s t a h u o l i m a t t a .
E s i m e r k k i n a k u v i t e l k a e m m e a m b i v a l e n t t i a t i l a n n e t t a v a i k k a p a s e l - l a i s e s s a kahden m u u t t u j a n x,y a i n e i s t o n a n a l y s o i n n i s s a , j o s s a t u t k i j a h a l u a a s o v i t t a a a i n e i s t o n s a t a v a l l i s e e n l i n e a a r i s e e n m a l l i i n y=ax+|S+£ , m i s s a a j a (3 o v a t m a l l i n p a r a m e t r i t j a e v i r - h e t e r m i . T o d e l l i s u u d e s s a a i n e i s t o o n on p u j a h t a n u f c k i n mukaan j o u k k o p o i k k e u k s e l l i s i a h a v a i n t o j a , j o t k a n o u d a t t a v a t samaa m a l - l i a s a m a l l a a:n a r v o l l a m u t t a e r i |J:n a r v o l l a , o l k o o n se
N a i l l a h a v a i n n o i l l a on s i i s e r i l a i n e n " l a h t b t a s o " . Kuvassa 1.1 on e s i t e t t y t a l l a i n e n h e t e r o g e e n i n e n 100 h a v a i n n o n a i n e i s t o , j o s s a a = l , (3 =-0.6, l?=l j a £~N(0,0.25). Kumpaakin l a j i a on 50 h a v a i n t o a . ( L i i t t e e s s a on s e l i t e t t y t a s s a t u t k i m u k s e s s a k a y t e t - t y j e n a i n e i s t o j e n a l k u p e r a . A i n e i s t o t o v a t k a i k k i p s e u d o s a t u n - n a i s l u k u j e n a v u l l a g e n e r o i t u j a 3a ne on t u n n u s t e n s a seka l i i t - t e e s s a e s i t e t t y j e n t i e t o j e n a v u l l a h e l p p o l u o d a u u d e l l e e n m i l - l a t a h a n s a t i e t o j e n k a s i t t e l y l a i t t e i s t o l l a . )
oo o o o
o o o o O o o
o o O
o ' o o o
o o o
CM O <-«.
O CM u o
+
-
vo O
o <•»
<"» l-» I • f-t +
VO r-»
in o o cr» •«! H*l H II. II P * •*
0
o° ° o
o
o o
oo o o o
ooo o
o o o
° O o o o oto
°o o o
X
*oo o o
aj > H in «r> o o
CM O - m
O CM W O + -
vo• o ~—"
O «l
<"">»I + 1-1 H_ +
O O ><l HI
H I I .
* l H o o o
o O o o o o
o o
o o
o o o o
- 3 -
K u v i t t e l e m i n e n , e t t a a i n e i s t o o l i s i k i n homogeeninen, on k o h t a l o - k a s t a tarkean a-parametrin e s t i m o i n n i n k a n n a l t a . Jos a i n e i s t o
s o v i t e t a a n t a v a l l i s e l l a p n s - k e i n o l l a l i n e a a r i s e e n m a l l i i n y = a ' x + p ' , saadaan e s t i m a a t i t a'=0.736, b'=0.240.
Nyt t a r k a s t e l u n k o h t e e k s i t u l e v a menetelmfi, j o s t a kayt&n nimea"
d i g r e s s i o a n a l y y s i , antaa v a i l l a t i e t o a minkaan havainnon t o d e l - l i s e s t a a l k u p e r a s t a mutta varauduttaessa edella" m a i n i t t u a t y y p - p i a olevaan heterogeenisuuteen p a r a m e t r e i l l e e s t i m a a t i t a=0«98l, b=-0.632 j a c=0.968. ( E s t i m a a t t e ^ a mepki*a&n tassa aina vastaa- v i l l a t a v a l l i s i l l a k i r j a i m i l l a . ) Havainnot t u l e v a t samalla ana- l y y s i n yhteydessa j a e t u k s i kahteen ryhmSan, j o t k a tassS tapauk- sessa vastaavat v a r s i n tarkkaan h a v a i n t o j e n a l k u p e r a i s t S jakoa.
Kohdassa 9 t S t a k i n k o e t t a k u v a i l l a a n tarkemmin.
2. D i g r e s s i o a n a l y y s i n p e r i a a t e
D i g r e s s i o a n a l y y s i s s a y h d i s t y v a t r e g r e s s i o a n a l y y s i n j a r y h m i t t e l y - a n a l y y s i n t e h t a v & t j a ominaieuudet. A n a l y y s i n kohteena on muutta- li i e n y,x=(x1,x2»•••»xm) n havainnon a i n e i s t o
Cy< h = (y^ ,x1 ;. ,x2 ;.,... , xm ;j ) , j«l,2',... ,n,
j o s s a havainnot j a k a u t u v a t t u n t e m a t t o m a l l a t & v a l l a kahteen r y h - mfian G-^ j a G r2 ( r a j o i t t u m i n e n kahteen ryhmaan e i o l e o l e n n a i s t a ) s i t e n , e t t a ryhmassa G. , i = l , 2 havainnot n o u d a t t a v a t m a l l i a
y= fi( x , a( i )) + ei, E(£i>=0,D2(ei)=a^,
missa a ^ ' on m a l l i n p a r a m e t r i v e k t o r i . Tehtavana on e s t i m o i d a kummankin m a l l i n p a r a m e t r i t s a m a n a i k a i s e s t i i l m a n m i n k a a n l a i s t a a p r i o r i - t i e t o u t t a s i i t a , kumpaan ryhmaan ^9^2 m i k i n h a v a i n t o k u u l u u . Pyrkimyksena on s i i s l b y t a a j o k a i s e l l e h a v a i n n o l l e " o i - kea" ryhma j a saadun l u o k i t t e l u n p o h j a l t a e s t i m o i d a m a l l i e n pa- r a m e t r i t .
*digression=poikkeaminen t a i tassa d i ( r e ) g r e s s i o = k a k s o i s r e g r e s s i o
T a v a l l i s i n menettely tSmSntapaisissa t i l a n t e i s s a l i e n e e se, etta"
havainnot l u o k i t e l l a a n a l u k s i j o l l a i n k l u s t e r o i n t i m e n e t e l m a i l a "
j a p a r a m e t r i t eetimoidaan p i t t e n tavanomaiein r e g r e s s i o a n a l y y s i n k e i n o i n . T f t l l B i n n&m& o s a - a n a l y y a i t t o i m i v a t t o i s i s t a a n r i i p p u - matta eiva*tk& i l m e i s e s t i v o i k a y t t & a kaikkea i n f o r m a a t i o t a tehok- k a a s t i hyv&ksi.
Samanaikaista l u o k i t t e l u a j a e s t i m o i n t i a on e s i i n t y n y t a i n a k i n ekonometrisessa tutkimuksessa t a r k a s t e l t a e s s a tuntemattomaan ajankohtaan s i j o i t t u n e i t a epggatkuvia parametrimuutoksia a i k a - s a r j o i s s a . T i e t o o n i t u l l e i s s a tamantyyppisissa t u t k i m u k s i s s a
(Goldfeld,Quandt, 1972) on k u i t e n k i n h a v a i n t o j e n l u o k i t t e l u s s a a i n a k a y t e t t y l i s a i n f o r m a a t i o t a a i k a m u u t t u j a n t a i muun vastaavan- l a i s e n " t u k i m u u t t u j a n " muodossa, mikS h e l p o t t a a o l e n n a i s e s t i t e h - tavaa.
Ongelmalle on sukua myos m a l l i n v a l i n t a t e h t & v f i , j o s s a v a i n t o i n e n m a l l e i s t a on o i k e a e i k a mitaan h a v a i n t o k o h t a i s t a " d i g r e s s i o t a "
s a l l i t a ( k t s . esim. H i l l , H u n t e r , W i c h e r n , 1968). Samoin on t u t k i t - t u Mt o i s i i n s a l i i t t y v i e n p o p u l a a t i o i d e n e s t i m o i n t i a " (esim. Brad- l e y , Gart, 1962), mutta s i i n & taas tybta* keventaa" se, ett£ e r i
o s a p o p u l a a t i o i d e n havainnot on t u n n i s t e t t a v i s s a ennen a n a l y y s i a . D i g r e s s i o a n a l y y s i l l e on o m i n a i s t a , e t t S h a v a i n t o j e n l u o k i t t e l u j a p a r a m e t r i e n e s t i m o i n t i t a p a h t u v a t s a m a n a i k a i s e s t i v a i l l a min- k f i & n l a i s t a l i s a t i e t o a y k s i t t a i s t e n h a v a i n t o j e n l u o n t e e s t a .
D i g r e s s i o a n a l y y s i n p e r i a a t e l i e n e e s o v e l l e t t a v i s s a u s e i h i n e s t i - m o i n t i k e i n o i h i n . T a v a l l i s t a pienimmSn neliQsumman menetelmSa kay- t e t t f t e s s a p a r a m e t r i t m&arataan y l e i a t a m & l l a * p n s - k r i t e e r i
S(a)- 1 ( y . - f C x ^ ^ a ) )2 . m*n
" v a l i k o i v a a n " muotoon
(2.1) S ( a( l ), a (2> ) = I mi n [ ( y . - f1( x(J), aC l )) )2, ( y; i- f2( x(' '), a( 2 )) )2] 0 — l
min
=
a<U,a<
2> *
S i i s j o k a i n e n h a v a i n t o l i i t e t a a n e s t i m o i n n i n yhteydessS. "l&him- p&S.n" regressiokSLyraan j a kummankin o s a m a l l i n f^tf'2 Pa r a m e't ri "f c a r v i o i d a a n v a i n omien " l & h i p i s t e i d e n " a v u l l a . TSssS suhteessa on s i t e n kysymys eraan tunnetun l u o k i t t e l u s a a n n o n (nearest-mean c l a s s i f i c a t i o n r u l e , k t s . esim. Fukunaga, 1972, s.332) s o v e l t a - misesta y l e i s t e t y s s a muodossa. I t s e e s t i m o i n t i t a p a a v o i t a i s i i n kutsua v a l i k o i v a k s i p n s - k e i n o k s i .
Tuntunee a l u k s i o u d o l t a , etta" t a l l a i n e n v a l i k o i v a k r i t e e r i s a a t - taa t o i m i a kSytannftssa, v a i k k a o s a - a i n e i s t o t e i v & t o l e e r i l l a a n , vaan p e i t t a v & t o s i t t a i n t o i s e n s a . T a i l o i n h & n s y n t y y vakavia l u o - k i t t e l u v i r h e i t a , esim. 20% h a v a i n n o i s t a l u o k i t e l l a a n v a a r i n , mika v o i h a i r i t S parametrien e s t i m o i n t i a . On k u i t e n k i n pantava m e r k i l l e , ettS, v i r h e l u o k i t u k s e t t u l e v a t kohdistumaan etupaassa"
h a v a i n t o i h i n , j o t k a ovat o s a m a l l i e n " y h t e i s a l u e e l l a " j a ne ovat e s t i m o i n n i n k a n n a l t a u s e i n melko n e u t r a a l e j a . "Luokituksessa on tapahtunut v i r h e , mutta h a v a i n t o s o p i i h y v i n vSaraan m a l l i i n . "
S i i r t y m i n e n t a v a l l i s e s t a p n s - k e i n o s t a v a l i k o i v a a n pns-keinoon merkitsee l i n e a a r i s t e n k i n o s a m a l l i e n tapauksessa l a s k e n t a t y o n o l e n n a i s t a l i s a a n t y m i s t a , s i l l a v a l i k o i v a n p n s - k r i t e e r i n m i n i - m o i n t i on a i n a v a a t i v a e p a l i n e a a r i n e n o p t i m o i n t i t e h t a v a , jonka r a t k a i s e m i s e s s a on t u r v a u d u t t a v a i t e r a t i i v i s i i n k e i n o i h i n . Samoin d i g r e s s i o m a l l e j a l i e n e e k r i t e e r i n l u o n t e e s t a j o h t u e n sangen hankala t u t k i a t e o r e e t t i s e s t i . N i i n p a tSssS t u t k i m u k s e s - sa t y y d y t a a n s u u r e l t a o s a l t a e r a a n l a i s e e n p u o l i k o k e e l l i s e e n t a r k a s t e l u t a p a a n .
3 > M a l l i t y y p p e : i a
E d e l l a m a a r i t e l l y n d i g r e s s i o m a l l i n r a k e n n e k u v a t a a n m e r k i t s e m a l l a r f1( x , a(l)) + e1
y - [ f 2 ( x , a ( 2 ) ) + £ 2 .
T&w& a s e t e l m a j a v a s t a a v a v a l i k o i v a p n s - k r i t e e r i v o i d a a n l u o n n o l - l i s e s t i l a a j e n t a a k a h t a useampaa v a i h t o e h t o i s t a o s a m a l l i a k o s k e - v a k s i . K u t e n <jo j o h d a n t o e s i m e r k i s t a n a h t i i n , o s a m a l l i e n p a r a m e t r i t v o i v a t o l l a o s i t t a i n samoja. Useat s o v e l l u t u s k o h t e e t o v a t i l m e i - s e s t i j u u r i s e l l a i s i a , j o i s s a o s a m a l l i t o v a t m u o d o l t a a n melko s a - m a n l a i s e t j a e r o a v a t t o i s i s t a a n ehka v a i n yhden t a i muutaman p a r a - m e t r i n j a m u u t t u j a n s u h t e e n . E s i m e r k i k s i d i g r e s s i o m a l l i s s a
y =( alxl+ a2x2+- "+ am V P + £l W l+ a2x2+- "+ amxm+ l ? + e2
v a k i o t e r m i n a m b i v a l e n s s i m e r k i t s e e i t s e a s i a s s a t a v a n o m a i s e n dummy-muuttujan k a y t o n y l e i s t y s t a muotoon, j o s s a e t u k a t e e n e i t a r v i t s e t i e t a a , kumpi t u n t e m a t t o m i s t a a r v o i s t a k u u l u u m i l l e - k i n h a v a i n n o l l e . E r i k o i s t a p a u s
t a r k o i t t a a p e l k k a a y h d e n m u u t t u j a n y h e t e r o g e e n i s e n jakauman o s a j a k a u m i e n e r o t t a m i s t a . T a t a k u v a i l l a a n t a r k e m m i n n o r m a a l i -
jakauman o s a l t a k o h d a s s a 5.
M a l l i n
y
{
a l x l + a 2 x 2 + a 3 + £ la l x 2 + a 2 x l + a 3 + £2
v o i t u l k i t a e s i m . s i t e n , e t t a o s a s s a h a v a i n t o j a s e l i t t a v i e n muut- t u j i e n x-^ j a x 2 r o o l i t o v a t v a i h t u n e e t . M a l l i s i i s p y r k i i p a l j a s - tamaan t u o l l a i s e t " v i r h e e l l i s e t " h a v a i n n o t j a k a y t t a m a a n n i i t a k i n t e h o k k a a s t i h y v a k s i p a r a m e t r e j a e s t i m o i t a e s s a . T a s t a n a k y y , e t t a d i g r e s s i o m a l l e j a s a a t e t a a n ehka s o v e l t a a v i r h e h a v a i n t o j e n ( o u t - - l i e r s ) e t s i m i s e e n j a m i k a l i v i r h e e t o v a t e s i m . e d e l l a k u v a t u l l a t a v a l l a s y s t e m a a t t i s i a , p y s t y t a a n ehka t y l y n p o i s s u l k e m i s e n a s e - masta j o p a k a y t t a m a a n n i i t a h y v & k s i .
M a l l i
(
ax-,+p+£ a xa x f?+ ( 3 + £ + ( 3 + £kuvastaa t i l a n n e t t a , j o s s a s e l i t e t t a v a a n muuttujaan y v a i k u t t a a k u s s a k i n havainnossa v a i n y k s i kolmesta t o i s e n s a p o i s s u l k e v a s t a
Hi m p u l s s i s t a " x ^ ^ f X y On v a i n j a a n y t epS.selvaksi, mika i m p u l s - s e i s t a on o l l u t " a k t i i v i n e n " k u n k i n havainnon k o h d a l l a .
Tassa h a h m o t e l l u t esimerkinomaiset j a p e l k i s t e t y t m a l l i t y y p i t e i v a t saa j o h t a a harhaan s i i n a suhteessa, e t t a d i g r e s s i o a n a l y y s i o l i s i j o k i n y l e i s k e i n o h a n k a l i e n h e t e r o g e e n i s t e n a i n e i s t o j e n s e l - v i t t a m i s e e n . On a i v a n s e l v a a , e t t e i t a t a menetelmaa v o i d a k a y t t a a p e l k a s t a a n k o k e i l u l u o n t o i s e s t i v a i h d e l l e n s u n m i i t t a i s e s t i o s a m a l l i en r a k e n n e t t a , vaan m a l l i s s a e s i i n t y v i e n v a i h t o e h t o j e n t u l e e pe- r u s t u a vankkaan t e o r e e t t i s e e n j a kokemusperaiseen t i e t o o n havain- t o j e n m a h d o l l i s i s t a s y n t y t a v o i s t a . Ainoa, mutta samalla e r i t t a i n m e r k i t t a v a epaselvyys, j o k a s a l l i t a a n n o r m a a l i n h a v a i n t o v i r h e e n o h e l l a , on se, e t t e i e r i l a h t e i s t a t u l l e i t a h a v a i n t o j a p y s t y t a suoraan tunnistamaan.
4. Parametrien e s t i m o i n t i o n g e l m i a
E s t i m o i t a e s s a d i g r e s s i o m a l l i e n p a r a m e t r e j a on o d o t e t t a v i s s a e r a i - t a l i s a o n g e l m i a t a v a l l i s t e n r e g r e s s i o m a l l i e n k a s i t t e l y y n v e r r a t - tuna.
Tarkastelkaamme j a i l e e n aikaisempaa j o h d a t t e l e v a a e s i m e r k k i a . O l e t e t a a n , e t t a k a y t e t t a v i s s a o l e v a t i e t o r a j o i t t u u a i n e i s t o o n U1975(A) (kuva 1.1) j a pelkkaan e p a i l y y n s i i t a , e t t a " a i n e i s t o s a a t t a a o l l a h e t e r o g e e n i s t a j a noudattaa d i g r e s s i o m a l l i a
mutta on myos m a h d o l l i s t a , e t t a kysymyksessa on suuremman satun- n a i s v a i h t e l u n omaava a i n e i s t o , j o t a kuvaa t a v a l l i n e n r e g r e s s i o - m a l l i
(4.2) y=a'x+ p' 11
T a l l b i n on v a s t a s s a p a a t b s o n g e l m a , kumpaa h y p o t e e s i a k a y t b s s a o l e v a a i n e i s t o t u k e e pareramin. Ongelman v o i y r i t t a a r a t k a i s t a v e r t a i l e m a l l a m a l l i e n ( 4 . 0 j a ( 4 . 2 ) s e l i t y s k y k y S . D i g r e s s i o - m a l l i n ( 4 . 1 ) antama s e l i t y s k u v a t t u n a j a a n n b s n e l i b s u m m a l l a on l u o n n o l l i s e s t i a i n a p a r e m p i k u i n r e g r e s s i o m a l l i n ( 4 . 2 ) a i n e i s - t o s t a r i i p p u m a t t a . TSLss& t a p a u k s e s s a nSmS n e l i b s u m m a t o v a t m a l - l i l l a ( 4 . 1 ) S ^ = l 8 . 8 5 ( S J J on s i i s v a l i k o i v a n p n s - k r i t e e r i n m i n i - m i a r v o ) j a m a l l i l l a ( 4 . 2 ) 5;^=76.14. J o n k i n l a i a e n a t e s t i k r i t e e r i - na" v o i d a a n k a y t t a a " s u h d e t t a S - ^ / SR= 0 . 2 4 7 6 t a i j o t a i n s e n monoto- n i s t a muunnosta e s i m . F - t e s t i s u u r e e n t a p a i s e k s i . Onko s a a t u S p / SR- a r v o o s o i t u s d i g r e s s i o h y p o t e e s i n e r i n o m a i s u u d e s t a r e g r e s - s i o h y p o t e e s i i n v e r r a t t u n a e l i onko j a a n n b s n e l i b s u m m a n a r v o s i i s p u d o n n u t r i i t t a v a s t i ? K u n n o l l i n e n v a s t a u s e d e l l y t t a a t e s t i s u u - r e e n S-^/SR jakauman h a l l i t s e m i s t a . Tama e i o l e t i e d o s s a , m u t t a ehka s e u r a a v a t a r k a s t e l u a u t t a a a s i a s s a .
Otamme v e r t a i l u n v u o k s i k & y t t b b n t o i s e n 1 0 0 h a v a i n n o n a i n e i s t o n U 1 9 7 5 ( B ) , j o k a n o u d a t t a a r e g r e s s i o m a l l i a ( 4 . 2 ) p a r a m e t r e i n
a '= 0 . 7 , p*=0.2 j a £ ~ N ( 0 , 0 . 8 5 ) . S o v i t t a m a l l a t&ma a i n e i s t o m a l - l i i n ( 4 . 2 ) saadaan e s t i m a a t i t a '= 0 . 8 1 9 , b ' = 0 . 1 0 0 j a SR= 7 0 . 3 6 . A i n e i s t o n o m i n a i s u u d e t o v a t s i i s r e g r e s s i o m a l l i n k a n n a l t a
s u u n n i l l e e n samat k u i n h e t e r o g e e n i s e n a i n e i s t o n U 1 9 7 5 ( A ) . J o s n y t tama1 homogeeninen a i n e i s t o k S s i t e l i a a n d i g r e s s i o m a l l i l l a
( 4 . 1 )» saadaan e s t i m a a t i t a= 0 . 9 2 3 , b = - 0 . 4 8 7 , c= 0 . 8 3 2 j a
S p.s28.47. V a s t a a v a t a r v o t h e t e r o g e e n i s e l l a a i n e i s t o l l a o l i v a t a= 0 . 9 8 l , b = - 0 . 6 3 2 , c= 0 . 9 6 8 j a SD= l 8 . 8 5 . T i l a n n e n a y t t a a y l l a t - t & v f i n s a m a n l a i s e l t a . D i g r e s s i o m a l l i j a k a a h o m o g e e n i s e n k i n a i n e i s - t o n 111975(B) t a s a i s e s t i k a h d e l l e y h d e n s u u n t a i s e l l e s u o r a l l e , j o i d e n e t a i s y y s t o i s i s t a a n on n y t t o s i n hieman p i e n e m p i . M e r k i - t y k s e l l i s i n t a " on k u i t e n k i n s e , e t t a t u n n u s l u v u t S-^=28.4? 3a S j j / S^ = 0 . 4 0 4 6 o v a t s e l v & s t i suuremmat. Kohdassa 5 e s i t e t t a v a n t a r k a s t e l u n p e r u s t e e l l a on a r v i o i t a v i s s a , e t t a s u h t e e n S p/ SR a r v o on s u u r i l l a o t o s k o i l l a t y y p p i a U 1 9 7 5 ( B ) o l e v i l l a homogee- n i s i l l a a i n e i s t o i l l a n o i n 0 . 3 6 j a t y y p p i a1 U 1 9 7 5 ( A ) o l e v i l l a h e t e r o g e e n i s i l l a a i n e i s t o i l l a n o i n 0 . 2 4 . S u h t e e n h a j o n n a s t a on s a a t u k a s i t y s s i m u l o i n t i k o k e i d e n a v u l l a ; se on s u u r u u s l u o k k a a i»03 ( k t s . t a u l u k k o 9*1),
O o oo o o o O o O o o 0 o o o
°° o°00
o o o o o o
6 o 0
o ° o
O o 00 Kuva 1.1(a) U1975: Y=X(0.6,l)-0.6+e(0,0.25) (50), Y=X(0,l)+l+e(0,0.25) (50)i
o o o O ° o © oo o oo o o
o o . o o o
o o o o O % o o o 00
I I
o « o o oo Kuva 4.1 U1975(B) U1975: Y«O.7X(Ofl)*e(0,0.852) (100) o
Toinen e s t i m o i n t i a h a i t t a a v a p u l m a on se, e t t a e s t i m a a t i t s a a t t a - v a t o l l a v a h v a s t i h a r h a i s i a e t e n k i n , j o s heterogeenisuus on l i e - vaa\a o s a - a i n e i s t o t ovat p a h a s t i p a a l l e k k a i n . T a l l o i n t o s i n koko d i g r e s s i o - o n g e l i n a k i n katoaa. E s t i m a a t t i e n harhaisuus nakyy k a r - j i s t y n e e s t i a s k e i s e s t a e s i m e r k i s t a a i n e i s t o n U1975(B) k o h d a l l a , j o s s a p a r a m e t r i e n p j a 2 e s t i m a a t e i k s i a a a t i i n b=-0.487 j a
c=0.832, kun molemmilla t o d e l l i s t e n a r v o j e n t u l i s i o l l a 0.2.
E s t i m o i t a e s s a s a a t t a a syntya s i i s l i i o i t e l t u " d i g r e s s i o e f e k t i " , j o t a tass& sanotaan d i g r e s s i o h a r h a k s i . Tamari harhan suuruus r i i p p u u monista o s a t e k i j o i s t a , ennen muuta a i n e i s t o n heterogee- nisuuden a s t e e s t a (harha l i e v e n e e heterogeenisuuden kasvaessa) j a e s t i m o i t a v a n p a r a m e t r i n l u o n t e e s t a . Esim. d i g r e s s i o m a l l i s s a (4-1) a i n e i s t o n s i j a i n t i a y - a k s e l i n suunnassa kuvaavat paramet- r i t | i, j? s a a t t a v a t saada s e l v a s t i h a r h a i s e t e s t i m a a t i t , mutta t r e n d i p a r a m e t r i a on tassa euhteessa helpompi e s t i m o i t a v a .
5. Normaali jakaumien erottnminen
E d e l l a t o d e t u n m a h d o l l i s e n i i g r e s s i o h a r h a n l u o n n e t t a p y r i t a a n n y t kuvaamaan t y y t y m a l l a tarkastelemaan pelkSstaan yhden muuttu- j a n h e t e r o g e e n i s t a jakaumaa, j o k a o l e t e t a a n kahden n o r m a a l i j a k a u - man s e k o i t u k s e k s i . Olkoot taman sekoituksen s y n n y t t S v a t jakaumat
# { ^ L , < J J) j a N(|-t2,o2) painosuhteessa n]/n2»
^ = 1 , a1= l , X ^ l . 2 6 1
;! ' ' 1 1 % - ji '— . »~ — -—^
-2 - 1 0 1 2
- 11 -
T u t k i t t a v a n a on seuraava d i g r e s s i o t e h t a v a : On mSarattava v a k i o t X^ j a Xg ^X^X^) s i t e n , etta* m i t a n
(5.1) m i n ( ( x - X1)2, ( x - X2)2)
odotusarvo on p i e n i n raahdollinen. Tama" tehtSva" on t e o r e e t t i n e n v a s t i n e d i g r e s s i o m a l l i l l e
| X2+ £2.
2
Koska t u n n e t u s t i E(x-a) s a a v u t t a a miniminsa a:n suhteen, kun a on m u u t t u j a n x odotusarvo B(x) , l u k u p a r i (X-^,X2) voidaan t u l - k i t a e r a a n l a i s e k s i (heterogeenisen) jakauman k a k s o i s o d o t u s a r v o k s i V a s t a a v a s t i m i t a n (5.1) odotusarvon minimiarvoa sanottakoon k a k s o i s v a r i a n s s i k s i . P a r a m e t r i t X^jX^ s i j o i t t u v a t i l m e i s e s t i s i t a lahemmfclksi osajakumien odotusarvo j a jJL^, J U2, m i t f i heterogeenisem- masta jakaumasta on kysymys e l i mitSL suurempi on o d o t u s a r v o j e n ero suhteessa h a j o n t a a n . Jos s i i s jakauma on t a y s i n homogeeninen, p a r a m e t r i t X-^ j a Xg e i v a t suinkaan yhdy, vaan n i i h i n v a i k u t t a a
e r o t t a v a s t i e d e l i a k u v a i l t u d i g r e s s i o h a r h a .
J o t t a d i g r e s s i o h a r h a n suuruudesta s a a t a i s i i n k a s i t y s , y r i t e t & a n maarSta p a r a m e t r i t X-^Xg. Tama" t a p a h t u u m i n i m o i m a l l a f u n k t i o
oo
XS ( X
1, X
2) = J ( x - X
1)
2f ( x ) d x
+J ( x - X
2)
2f ( x ) d x ,
missa X=(X-^+X2)/2 j a f ( x ) on t a r k a s t e l t a v a n heterogeenisen j a k a u - man t i h e y s f u n k t i o
n l + n 2
nl / <x-ft.> \2 / ( x- ^ 2} \
'1 <" t w2
KSyttamalla normeeratun normaalijakauman t i h e y s - j a kertymafunk- t i o l l e m e r k i n t o j a ^ ( x ) , $ ( x ) saadaan f u n k t i o l l e S(X-, ,X2) e s i t y s
missa 6^=(X-^«i)/a^, i = l, 2 . On i l m e i s t a , e t t e i y l e i s e s s a tapauksessa f u n k t i o n S f X - ^ ^ ) minimikohtaa j a minimiarvoa v o i lausua s u l j e t u s s a muodossa jakauman p a r a m e t r i e n j a f u n k t i o i d e n f, $ a v u l l a , vaan on
t y y d y t t S v a numeeriseen r a t k a i s u u n .
N i i s s a t a p a u k s i s s a , j o i s s a l u v u t e i v a t r i i p u p a r a m e t r e i s t a X-^jXg, f u n k t i o S ( X1, X2) on y k s i n k e r t a i n e n t o i s e n asteen lauseke.
N&in t a p a h t u u symmetrisessa t i l a n t e e s s a a^=a2=a, n2^Til~^'f
t\t*
9^2==-^. T a l l o i n on mybs X^^-X^ (merkit&an X^=\ j a
S(Xl tX2)=S(X,-X)=a2-4vP(^/o)aX+(/A + X)2-4$(/^/a)juX.
Tama s a a v u t t a a miniminsS, kun X= ( 2 f( ^ / a ) - l) f * + 2 t( ^ / a ) a j a minimiarvo on k a k s o i s v a r i a n s s i
E r i t y i s e s t i tapkuksessa j4=0 e l i homogeenisessa normaalijakaumassa on X=\/2Ao* e l i kaksoisodotusarvo (-X,X) s i j o i t t u u keskipoikkeaman
2 2 paahan o d o t u s a r v o s t a 0. Huomattakoon mybs, e t t a X ^ M , a^a j a
2 2 l i m X/u=l, l i m 0 ^ = 0 .
P y r i t t a e s s a tarkastelemaan heterogeenisuuden v a i k u t u s t a samaan tapaan k u i n kohdassa 4 t a r v i t a a n jaannbsnelibsummaa vastaava v a r i a n s s i , j o k a on j u u r i t a r k a s t e l l u n heterogeenisen jakauman
v a r i a n s s i
4sv, L (tiT o?+n0al+± 1 ^ w2) R nn + n0 \ 1 2 2 n-, +n~ ' /
1 2 x d /
= a2+ p2, j o s a1= a2= a , n1= n2, /*2=-^ • 2 2
T a l l o i n s u h d e t t a S-^/S^ vastaa suhde O ^ / O R* E d e l l a m a a r i t e l l y t t u n - nusluvut on e s i t e t t y seuraavissa t a u l u k o i s s a e r i p a r a m e t r i y h d e l m i l l a .