Esimerkki 3

5. Faktorianalyysi

5.6 Transformaatioanalyysi

5.6.5 Esimerkki 3

Poikkeavaa transformoitumista on hankala tutkia tilastollisesti. Periaatteessa ongelmaa voi lähestyä konfirmatorisen faktorianalyysin suunnasta.

Tässä yhteydessä testaamme transformaatioanalyysin residuaaleja satun-naistamisperiaatteella, jolloin residuaalien jakaumat samanrakenteisten fakto-riratkaisujen vertailussa arvioidaan aineistokohtaisesti. Tätä varten on tehty kaksi sukroa, //TRAN-LSTRES TRAN-LSTRES ja //TRAN-SYMTRES TRAN-SYMTRES , jotka määräävät residuaali-matriisin alkioiden keskivirheet raa’alla Monte Carlo-menetelmällä, edellinen Ahmavaaran alkuperäisen mallin ja jälkimmäinen symmetrisen mallin yhtey-dessä. Ko. sukrojen toiminnasta saa lisätietoja aktivoimalla ne ilman paramet-reja.

Alustavat kokeet ovat osoittaneet, että kunkin yksittäisen residuaalin jakau-ma on likijakau-main norjakau-maalinen odotusarvolla 0, mutta niiden hajonnat vaihtele-vat ei ainoastaan otoksien koosta vaan myös faktorirakenteesta riippuen.

Tarkastelemme tässä esimerkkinä sukroa //TRAN-SYMTRES TRAN-SYMTRES . Oletamme, että A

₁

ja A

₂

ovat kaksi (ortogonaalista) faktoriratkaisua, joista edellinen on saatu N

₁

havainnon otoksen perusteella ja jälkimmäinen joko N

₂

havainnon otok-sen perusteella tai A

₂

on annettu hypoteettinen faktorimatriisi. Oletamme edelleen, että on tehty symmetrinen transformaatioanalyysi, joka on antanut residuaalimatriisin E=A

₁

L−A

₂

.

Residuaalien jakaumaa simuloidaan olettaen, että faktoriratkaisut A

₁

ja A

₂

ovat samat (rotaatiota vaille). Ensin luodaan matriisin A

₂

mukaista faktori-mallia noudattava N

₁

havainnon otos ja tästä riippumaton saman mallin mu-kainen N

₂

havainnon otos. Näille otoksille muodostetaan suurimman uskotta-vuuden faktoriratkaisut FFACTA ACTA -operaatiolla ja jälkimmäinen (valinnanvarai-sesti) rotatoidaan RROTATE OTATE -operaatioilla. Tuloksista lasketaan symmetrisen transformaatiomallin mukainen residuaalimatriisi. Jos A

₂

on hypoteettinen matriisi, jälkimmäistä otosta ei luoda, vaan käytetään matriisia A

₂

sellaise-naan.

Sukro toistaa tämän kokeen niin monta kertaa kuin halutaan ja tallettaa jo-kaisen kokeen tulokset (p×r residuaalia) valittuun Survon havaintotiedostoon yhtenä havaintovektorina. Kun sovittu määrä toistokokeita on tehty, sukro las-kee residuaalien keskivirheet ja kokoaa ne faktorimatriisin muotoiseksi mat-riisiksi.

Koska koetoistoja tarvitaan yleensä ainakin 100, menettely on melko ras-kas, sillä vaatiihan se yhtä monta multinormaalisten otosten generointia sekä niiden faktori- ja transformaatioratkaisut. Sukro ilmoittaakin jokaisen koetois-ton jälkeen arvion jäljellä olevasta laskenta-ajasta tunteina ja minuutteina.

Tutkija voi keskeyttää ajon koetoistojen välissä (napilla S), jolloin tulokset lasketaan siihen asti kertyneiden tietojen perusteella.

Menettelyn havainnollistamiseksi otamme lähtökohdaksi jälleen

12×3-faktori-matriisin AA : perusyh-tälön avulla tätä faktorimatriisia vastaavan korrelaatiomatriisin RR (rivit 21-27).

Tämän jälkeen luomme ko. korrelaatiorakennetta vastaavan 100 havainnon otoksen XXYZ100 YZ100 multinormaalijakaumasta, laskemme korrelaatiomatriisin ( CCORR.M ORR.M ) sekä teemme tämän pohjalta suurimman uskottavuuden faktoroinnin ja Varimax-rotaation (rivit 29-32):

22 1 SURVO 84C EDITOR Mon Apr 04 11:00:02 1994 D:\M\MEN\ 200 100 0 22 1 SURVO 84C EDITOR Mon Apr 04 11:00:02 1994 D:\M\MEN\ 200 100 0 19 * 19 *

20 *Lasketaan korrelaatiomatriisi R perusyhtälöstä R=A*A’+PSI : 20 *Lasketaan korrelaatiomatriisi R perusyhtälöstä R=A*A’+PSI : 21 *MAT DIM A /* rowA=12 colA=3

Kopioimme rotatoidun faktorimatriisin AAFACT.M FACT.M matriisiksi AATT ja vertaamme

tätä alkuperäiseen faktorimatriisiin symmetrisen transformaatioanalyysin

keinoin:

1 1 SURVO 84C EDITOR Mon Apr 04 11:19:35 1994 D:\M\MEN\ 200 100 0

54 *MMAT LOAD L.M,##.###,END+2 / Transformation matrixAT LOAD L.M,##.###,END+2 / Transformation matrix 55 *MAT LOAD E.M,##.###,END+2 / Residual matrix 82 *Simulated residuals in Survo data file ARES.SVO 82 *Simulated residuals in Survo data file ARES.SVO

83 *MAT LOAD ARES,##.###,END+2 / Standard errors of residuals 83 *MAT LOAD ARES,##.###,END+2 / Standard errors of residuals 84 *

Kun vertaamme residuaaleja (rivit 67-78) niiden arvioituihin keskivirheisiin (rivit 88-99), voimme todeta, ettei mitään poikkeavaa transformoitumista esiinny, kuten sopi odottaakin. Suurimmat residuaalin ja keskivirheen suhteet ovat suuruusluokkaa 2 ja niitäkin on vain muutamia.

Simulointi käynnistettiin rivillä 81 olevalla komennolla //TRAN-SYMTRES A,-,100,,ARES,100,1200001 TRAN-SYMTRES A,-,100,,ARES,100,1200001 , jonka parametrit tulkitaan seuraavasti:

AA Jakaumaa simuloidaan faktorimatriisin AA mukaisesti.

-- Rotaatiota ei tehdä (koska verrataan teoreettiseen matriisiin AA ).

1100 00 Otoskoko N

₁

on 100.

** Toinen otoskoko on "ääretön" (eli vertailu teoreettiseen AA ).

AARES RES Tulosmatriisin nimi

1100 00 Simulointikertojen lukumäärä on 100.

11200001 200001 Ensimmäinen simulointi tehdään generaattorilla rrand(1200001) and(1200001) . Verrattaessa kahta faktorimatriisia A

₁

ja A

₂

, jotka on laskettu otoskoilla N

₁

ja N

₂

, residuaalimatriisin E=A

₁

L−A

₂

simulointi tapahtuu muotoa

//TRAN-SYMTRES TRAN-SYMTRES A

₂

, << rotaatio >> , N

₁

, N

₂

, << tulostiedosto >> , N, << rand >>

olevalla komennolla. Tässä parametrilla << rotaatio >> ovat vain vaihtoehdot VVARIMAX ARIMAX ja -- .

Palataksemme vielä äskeiseen esimerkkiin, simuloidut residuaalit on talletettu muuttujina EE11 , EE22 ,..., EE36 36 (Huom. p×r=36 tässä tapauksessa) Survon havainto-tiedostoon AARES.SVO RES.SVO . Kunkin havainnon alussa on CCASE ASE -niminen muuttuja, jossa on käytetyn satunnaislukugeneraattorin indeksi. Siis tässä tapauksessa havainnot on nimetty 1200001, 1200002,...

Erillisten residuaalien ohella on syytä tarkastella muuttujakohtaisia resi-duaaleja (E:n vaakarivien neliösummat) ja kokonaisresiduaalia (kaikkien al-kioiden neliösumma). Kun simulointikertojen määrä on riittävä, on tulostie-dostosta (tässä AARES.SVO RES.SVO ) mahdollista määrätä likimain ko. neliösummien ylärajat valituilla kriittisillä tasoilla. Esimerkissämme voimme laskea neliö-summat ensin "havaitussa tilanteessa" eli matriisille EE.M .M matriisiketjulla MMATRUN ATRUN SSUM2 UM2 :

23 1 SURVO 84C EDITOR Mon Apr 04 17:47:59 1994 D:\M\MEN\ 200 100 0 23 1 SURVO 84C EDITOR Mon Apr 04 17:47:59 1994 D:\M\MEN\ 200 100 0 100 *100 *

101 *MATRUN SUM2,E.M,##.###

102 * 102 *

103 *MATRIX &G 103 *MATRIX &G

104 *"E.M_with_sums_of_squares_by_rows_and_columns"

105 */// F1 F2 F3 sumsqr 105 */// F1 F2 F3 sumsqr 106 *X1 -0.021 -0.083 -0.013 0.008 106 *X1 -0.021 -0.083 -0.013 0.008 107 *X2 0.010 -0.044 -0.052 0.005 107 *X2 0.010 -0.044 -0.052 0.005 108 *X3 0.021 0.083 -0.030 0.008 108 *X3 0.021 0.083 -0.030 0.008 109 *X4 -0.138 -0.053 0.063 0.026 109 *X4 -0.138 -0.053 0.063 0.026 110 *Y1 -0.134 -0.073 0.095 0.032 110 *Y1 -0.134 -0.073 0.095 0.032 111 *Y2 0.104 0.031 -0.141 0.032 111 *Y2 0.104 0.031 -0.141 0.032 112 *Y3 0.078 0.030 0.006 0.007 112 *Y3 0.078 0.030 0.006 0.007 113 *Y4 -0.086 -0.030 0.077 0.014 113 *Y4 -0.086 -0.030 0.077 0.014 114 *Z1 -0.177 -0.084 -0.123 0.053 114 *Z1 -0.177 -0.084 -0.123 0.053 115 *Z2 -0.002 0.116 0.256 0.079 115 *Z2 -0.002 0.116 0.256 0.079 116 *Z3 -0.039 0.062 -0.174 0.035 116 *Z3 -0.039 0.062 -0.174 0.035 117 *Z4 -0.033 -0.120 0.054 0.018 117 *Z4 -0.033 -0.120 0.054 0.018 118 *sumsqr 0.096 0.065 0.156 0.318 118 *sumsqr 0.096 0.065 0.156 0.318 119 *

119 *

Simulointituloksista lasketaan tarvittavat suureet esim. VVARSTAT ARSTAT - ja SSTAT TAT

-operaatioilla seuraavasti:

44 1 SURVO 84C EDITOR Mon Apr 04 17:51:20 1994 D:\M\MEN\ 200 100 0 44 1 SURVO 84C EDITOR Mon Apr 04 17:51:20 1994 D:\M\MEN\ 200 100 0 119 *119 *

120 *MASK=-AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA 120 *MASK=-AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA 121 *VARSTAT ARES,Summa2,SUM,2

121 *VARSTAT ARES,Summa2,SUM,2

122 *STAT ARES,CUR+1 / VARS=Summa2 FRACTILES=0.9,0.95 122 *STAT ARES,CUR+1 / VARS=Summa2 FRACTILES=0.9,0.95 123 *Basic statistics: ARES N=100

123 *Basic statistics: ARES N=100 124 *Variable: Summa2

124 *Variable: Summa2

125 *min=0.141451 in obs.#40 (1200040) 125 *min=0.141451 in obs.#40 (1200040) 126 *max=0.845863 in obs.#35 (1200035) 126 *max=0.845863 in obs.#35 (1200035)

127 *mean=0.303377 stddev=0.112814 skewness=1.751569 kurtosis=5.396984 127 *mean=0.303377 stddev=0.112814 skewness=1.751569 kurtosis=5.396984 128 *lower_Q=0.225 median=0.286765 upper_Q=0.369643

128 *lower_Q=0.225 median=0.286765 upper_Q=0.369643 129 *fractile(0.9)=0.429545

129 *fractile(0.9)=0.429545 130 *fractile(0.95)=0.5125 130 *fractile(0.95)=0.5125

131 *up.limit f % class width=0.05 131 *up.limit f % class width=0.05 132 * 0.15 1 1.0 *

132 * 0.15 1 1.0 *

133 * 0.2 12 12.0 ************

134 * 0.25 25 25.0 *************************

135 * 0.3 17 17.0 *****************

136 * 0.35 15 15.0 ***************

137 * 0.4 14 14.0 **************

138 * 0.45 11 11.0 ***********

139 * 0.5 0 0.0 139 * 0.5 0 0.0 140 * 0.55 2 2.0 **

140 * 0.55 2 2.0 **

141 * 0.6 1 1.0 * 141 * 0.6 1 1.0 * 142 * 0.65 0 0.0 142 * 0.65 0 0.0 143 * 0.7 0 0.0 143 * 0.7 0 0.0 144 * 0.75 1 1.0 * 144 * 0.75 1 1.0 * 145 * 0.8 0 0.0 145 * 0.8 0 0.0 146 * 0.85 1 1.0 * 146 * 0.85 1 1.0 * 147 *

147 *

Rivillä 121 olevalla VVARSTAT ARSTAT -komennolla lasketaan aktiivisten muuttujien neliösumma muuttujana SSumma2 umma2 . Aktiiviset muuttujat ( EE11 - EE36 36 ) on osoitettu edellisen rivin MMASK ASK -täsmennyksellä eli tuloksena saadaan transformaatio-analyysin kokonaisresiduaali kunkin simulointikokeen osalta.

Kokonaisresiduaalin jakaumasta syntyy käsitys rivin 122 SSTAT TAT -komennolla, jossa lasketaan FFRACTILES RACTILES -täsmennystä käyttäen myös prosenttipisteet ta-soilla 90% ja 95%.

Todetaan, että "havaittu" kokonaisresiduaali 0.318 (rivillä 118) on lähinnä

mediaanin luokkaa eli mitään poikkeavaa transformoitumista ei tässä

tapauk-sessa esiinny.

In document Tilastolliset monimuuttujamenetelmät (sivua 110-115)

5. Faktorianalyysi

5.6 Transformaatioanalyysi

5.6.5 Esimerkki 3

Poikkeavaa transformoitumista on hankala tutkia tilastollisesti. Periaatteessa ongelmaa voi lähestyä konfirmatorisen faktorianalyysin suunnasta.

Alustavat kokeet ovat osoittaneet, että kunkin yksittäisen residuaalin jakau-ma on likijakau-main norjakau-maalinen odotusarvolla 0, mutta niiden hajonnat vaihtele-vat ei ainoastaan otoksien koosta vaan myös faktorirakenteesta riippuen.

Tarkastelemme tässä esimerkkinä sukroa //TRAN-SYMTRES TRAN-SYMTRES . Oletamme, että A

ja A

ovat kaksi (ortogonaalista) faktoriratkaisua, joista edellinen on saatu N

havainnon otoksen perusteella ja jälkimmäinen joko N

havainnon otok-sen perusteella tai A

on annettu hypoteettinen faktorimatriisi. Oletamme edelleen, että on tehty symmetrinen transformaatioanalyysi, joka on antanut residuaalimatriisin E=A

L−A

.

Residuaalien jakaumaa simuloidaan olettaen, että faktoriratkaisut A

ja A

ovat samat (rotaatiota vaille). Ensin luodaan matriisin A

mukaista faktori-mallia noudattava N

havainnon otos ja tästä riippumaton saman mallin mu-kainen N

havainnon otos. Näille otoksille muodostetaan suurimman uskotta-vuuden faktoriratkaisut FFACTA ACTA -operaatiolla ja jälkimmäinen (valinnanvarai-sesti) rotatoidaan RROTATE OTATE -operaatioilla. Tuloksista lasketaan symmetrisen transformaatiomallin mukainen residuaalimatriisi. Jos A

on hypoteettinen matriisi, jälkimmäistä otosta ei luoda, vaan käytetään matriisia A

sellaise-naan.

Tutkija voi keskeyttää ajon koetoistojen välissä (napilla S), jolloin tulokset lasketaan siihen asti kertyneiden tietojen perusteella.

Menettelyn havainnollistamiseksi otamme lähtökohdaksi jälleen

12×3-faktori-matriisin AA : perusyh-tälön avulla tätä faktorimatriisia vastaavan korrelaatiomatriisin RR (rivit 21-27).

Tämän jälkeen luomme ko. korrelaatiorakennetta vastaavan 100 havainnon otoksen XXYZ100 YZ100 multinormaalijakaumasta, laskemme korrelaatiomatriisin ( CCORR.M ORR.M ) sekä teemme tämän pohjalta suurimman uskottavuuden faktoroinnin ja Varimax-rotaation (rivit 29-32):

Kopioimme rotatoidun faktorimatriisin AAFACT.M FACT.M matriisiksi AATT ja vertaamme

tätä alkuperäiseen faktorimatriisiin symmetrisen transformaatioanalyysin

keinoin:

Kun vertaamme residuaaleja (rivit 67-78) niiden arvioituihin keskivirheisiin (rivit 88-99), voimme todeta, ettei mitään poikkeavaa transformoitumista esiinny, kuten sopi odottaakin. Suurimmat residuaalin ja keskivirheen suhteet ovat suuruusluokkaa 2 ja niitäkin on vain muutamia.

Simulointi käynnistettiin rivillä 81 olevalla komennolla //TRAN-SYMTRES A,-,100,*,ARES,100,1200001 TRAN-SYMTRES A,-,100,*,ARES,100,1200001 , jonka parametrit tulkitaan seuraavasti:

AA Jakaumaa simuloidaan faktorimatriisin AA mukaisesti.

-- Rotaatiota ei tehdä (koska verrataan teoreettiseen matriisiin AA ).

1100 00 Otoskoko N

on 100.

** Toinen otoskoko on "ääretön" (eli vertailu teoreettiseen AA ).

AARES RES Tulosmatriisin nimi

1100 00 Simulointikertojen lukumäärä on 100.

11200001 200001 Ensimmäinen simulointi tehdään generaattorilla rrand(1200001) and(1200001) . Verrattaessa kahta faktorimatriisia A

ja A

, jotka on laskettu otoskoilla N

ja N

, residuaalimatriisin E=A

L−A

simulointi tapahtuu muotoa

//TRAN-SYMTRES TRAN-SYMTRES A

, << rotaatio >> , N

, N

, << tulostiedosto >> , N, << rand >>

olevalla komennolla. Tässä parametrilla << rotaatio >> ovat vain vaihtoehdot VVARIMAX ARIMAX ja -- .

Simulointituloksista lasketaan tarvittavat suureet esim. VVARSTAT ARSTAT - ja SSTAT TAT

-operaatioilla seuraavasti:

Kokonaisresiduaalin jakaumasta syntyy käsitys rivin 122 SSTAT TAT -komennolla, jossa lasketaan FFRACTILES RACTILES -täsmennystä käyttäen myös prosenttipisteet ta-soilla 90% ja 95%.

Todetaan, että "havaittu" kokonaisresiduaali 0.318 (rivillä 118) on lähinnä

mediaanin luokkaa eli mitään poikkeavaa transformoitumista ei tässä

tapauk-sessa esiinny.

Simulointi käynnistettiin rivillä 81 olevalla komennolla //TRAN-SYMTRES A,-,100,,ARES,100,1200001 TRAN-SYMTRES A,-,100,,ARES,100,1200001 , jonka parametrit tulkitaan seuraavasti: