5. Faktorianalyysi
5.6 Transformaatioanalyysi
5.6.5 Esimerkki 3
Poikkeavaa transformoitumista on hankala tutkia tilastollisesti. Periaatteessa ongelmaa voi lähestyä konfirmatorisen faktorianalyysin suunnasta.
Tässä yhteydessä testaamme transformaatioanalyysin residuaaleja satun-naistamisperiaatteella, jolloin residuaalien jakaumat samanrakenteisten fakto-riratkaisujen vertailussa arvioidaan aineistokohtaisesti. Tätä varten on tehty kaksi sukroa, //TRAN-LSTRES TRAN-LSTRES ja //TRAN-SYMTRES TRAN-SYMTRES , jotka määräävät residuaali-matriisin alkioiden keskivirheet raa’alla Monte Carlo-menetelmällä, edellinen Ahmavaaran alkuperäisen mallin ja jälkimmäinen symmetrisen mallin yhtey-dessä. Ko. sukrojen toiminnasta saa lisätietoja aktivoimalla ne ilman paramet-reja.
Alustavat kokeet ovat osoittaneet, että kunkin yksittäisen residuaalin jakau-ma on likijakau-main norjakau-maalinen odotusarvolla 0, mutta niiden hajonnat vaihtele-vat ei ainoastaan otoksien koosta vaan myös faktorirakenteesta riippuen.
Tarkastelemme tässä esimerkkinä sukroa //TRAN-SYMTRES TRAN-SYMTRES . Oletamme, että A
1ja A
2ovat kaksi (ortogonaalista) faktoriratkaisua, joista edellinen on saatu N
1havainnon otoksen perusteella ja jälkimmäinen joko N
2havainnon otok-sen perusteella tai A
2on annettu hypoteettinen faktorimatriisi. Oletamme edelleen, että on tehty symmetrinen transformaatioanalyysi, joka on antanut residuaalimatriisin E=A
1L−A
2.
Residuaalien jakaumaa simuloidaan olettaen, että faktoriratkaisut A
1ja A
2ovat samat (rotaatiota vaille). Ensin luodaan matriisin A
2mukaista faktori-mallia noudattava N
1havainnon otos ja tästä riippumaton saman mallin mu-kainen N
2havainnon otos. Näille otoksille muodostetaan suurimman uskotta-vuuden faktoriratkaisut FFACTA ACTA -operaatiolla ja jälkimmäinen (valinnanvarai-sesti) rotatoidaan RROTATE OTATE -operaatioilla. Tuloksista lasketaan symmetrisen transformaatiomallin mukainen residuaalimatriisi. Jos A
2on hypoteettinen matriisi, jälkimmäistä otosta ei luoda, vaan käytetään matriisia A
2sellaise-naan.
Sukro toistaa tämän kokeen niin monta kertaa kuin halutaan ja tallettaa jo-kaisen kokeen tulokset (p×r residuaalia) valittuun Survon havaintotiedostoon yhtenä havaintovektorina. Kun sovittu määrä toistokokeita on tehty, sukro las-kee residuaalien keskivirheet ja kokoaa ne faktorimatriisin muotoiseksi mat-riisiksi.
Koska koetoistoja tarvitaan yleensä ainakin 100, menettely on melko ras-kas, sillä vaatiihan se yhtä monta multinormaalisten otosten generointia sekä niiden faktori- ja transformaatioratkaisut. Sukro ilmoittaakin jokaisen koetois-ton jälkeen arvion jäljellä olevasta laskenta-ajasta tunteina ja minuutteina.
Tutkija voi keskeyttää ajon koetoistojen välissä (napilla S), jolloin tulokset lasketaan siihen asti kertyneiden tietojen perusteella.
Menettelyn havainnollistamiseksi otamme lähtökohdaksi jälleen
12×3-faktori-matriisin AA : perusyh-tälön avulla tätä faktorimatriisia vastaavan korrelaatiomatriisin RR (rivit 21-27).
Tämän jälkeen luomme ko. korrelaatiorakennetta vastaavan 100 havainnon otoksen XXYZ100 YZ100 multinormaalijakaumasta, laskemme korrelaatiomatriisin ( CCORR.M ORR.M ) sekä teemme tämän pohjalta suurimman uskottavuuden faktoroinnin ja Varimax-rotaation (rivit 29-32):
22 1 SURVO 84C EDITOR Mon Apr 04 11:00:02 1994 D:\M\MEN\ 200 100 0 22 1 SURVO 84C EDITOR Mon Apr 04 11:00:02 1994 D:\M\MEN\ 200 100 0 19 * 19 *
20 *Lasketaan korrelaatiomatriisi R perusyhtälöstä R=A*A’+PSI : 20 *Lasketaan korrelaatiomatriisi R perusyhtälöstä R=A*A’+PSI : 21 *MAT DIM A /* rowA=12 colA=3
Kopioimme rotatoidun faktorimatriisin AAFACT.M FACT.M matriisiksi AATT ja vertaamme
tätä alkuperäiseen faktorimatriisiin symmetrisen transformaatioanalyysin
keinoin:
1 1 SURVO 84C EDITOR Mon Apr 04 11:19:35 1994 D:\M\MEN\ 200 100 0
54 *MMAT LOAD L.M,##.###,END+2 / Transformation matrixAT LOAD L.M,##.###,END+2 / Transformation matrix 55 *MAT LOAD E.M,##.###,END+2 / Residual matrix 82 *Simulated residuals in Survo data file ARES.SVO 82 *Simulated residuals in Survo data file ARES.SVO
83 *MAT LOAD ARES,##.###,END+2 / Standard errors of residuals 83 *MAT LOAD ARES,##.###,END+2 / Standard errors of residuals 84 *
Kun vertaamme residuaaleja (rivit 67-78) niiden arvioituihin keskivirheisiin (rivit 88-99), voimme todeta, ettei mitään poikkeavaa transformoitumista esiinny, kuten sopi odottaakin. Suurimmat residuaalin ja keskivirheen suhteet ovat suuruusluokkaa 2 ja niitäkin on vain muutamia.
Simulointi käynnistettiin rivillä 81 olevalla komennolla //TRAN-SYMTRES A,-,100,*,ARES,100,1200001 TRAN-SYMTRES A,-,100,*,ARES,100,1200001 , jonka parametrit tulkitaan seuraavasti:
AA Jakaumaa simuloidaan faktorimatriisin AA mukaisesti.
-- Rotaatiota ei tehdä (koska verrataan teoreettiseen matriisiin AA ).
1100 00 Otoskoko N
1on 100.
** Toinen otoskoko on "ääretön" (eli vertailu teoreettiseen AA ).
AARES RES Tulosmatriisin nimi
1100 00 Simulointikertojen lukumäärä on 100.
11200001 200001 Ensimmäinen simulointi tehdään generaattorilla rrand(1200001) and(1200001) . Verrattaessa kahta faktorimatriisia A
1ja A
2, jotka on laskettu otoskoilla N
1ja N
2, residuaalimatriisin E=A
1L−A
2simulointi tapahtuu muotoa
//TRAN-SYMTRES TRAN-SYMTRES A
2, << rotaatio >> , N
1, N
2, << tulostiedosto >> , N, << rand >>
olevalla komennolla. Tässä parametrilla << rotaatio >> ovat vain vaihtoehdot VVARIMAX ARIMAX ja -- .
Palataksemme vielä äskeiseen esimerkkiin, simuloidut residuaalit on talletettu muuttujina EE11 , EE22 ,..., EE36 36 (Huom. p×r=36 tässä tapauksessa) Survon havainto-tiedostoon AARES.SVO RES.SVO . Kunkin havainnon alussa on CCASE ASE -niminen muuttuja, jossa on käytetyn satunnaislukugeneraattorin indeksi. Siis tässä tapauksessa havainnot on nimetty 1200001, 1200002,...
Erillisten residuaalien ohella on syytä tarkastella muuttujakohtaisia resi-duaaleja (E:n vaakarivien neliösummat) ja kokonaisresiduaalia (kaikkien al-kioiden neliösumma). Kun simulointikertojen määrä on riittävä, on tulostie-dostosta (tässä AARES.SVO RES.SVO ) mahdollista määrätä likimain ko. neliösummien ylärajat valituilla kriittisillä tasoilla. Esimerkissämme voimme laskea neliö-summat ensin "havaitussa tilanteessa" eli matriisille EE.M .M matriisiketjulla MMATRUN ATRUN SSUM2 UM2 :
23 1 SURVO 84C EDITOR Mon Apr 04 17:47:59 1994 D:\M\MEN\ 200 100 0 23 1 SURVO 84C EDITOR Mon Apr 04 17:47:59 1994 D:\M\MEN\ 200 100 0 100 *100 *
101 *MATRUN SUM2,E.M,##.###
101 *MATRUN SUM2,E.M,##.###
102 * 102 *
103 *MATRIX &G 103 *MATRIX &G
104 *"E.M_with_sums_of_squares_by_rows_and_columns"
104 *"E.M_with_sums_of_squares_by_rows_and_columns"
105 */// F1 F2 F3 sumsqr 105 */// F1 F2 F3 sumsqr 106 *X1 -0.021 -0.083 -0.013 0.008 106 *X1 -0.021 -0.083 -0.013 0.008 107 *X2 0.010 -0.044 -0.052 0.005 107 *X2 0.010 -0.044 -0.052 0.005 108 *X3 0.021 0.083 -0.030 0.008 108 *X3 0.021 0.083 -0.030 0.008 109 *X4 -0.138 -0.053 0.063 0.026 109 *X4 -0.138 -0.053 0.063 0.026 110 *Y1 -0.134 -0.073 0.095 0.032 110 *Y1 -0.134 -0.073 0.095 0.032 111 *Y2 0.104 0.031 -0.141 0.032 111 *Y2 0.104 0.031 -0.141 0.032 112 *Y3 0.078 0.030 0.006 0.007 112 *Y3 0.078 0.030 0.006 0.007 113 *Y4 -0.086 -0.030 0.077 0.014 113 *Y4 -0.086 -0.030 0.077 0.014 114 *Z1 -0.177 -0.084 -0.123 0.053 114 *Z1 -0.177 -0.084 -0.123 0.053 115 *Z2 -0.002 0.116 0.256 0.079 115 *Z2 -0.002 0.116 0.256 0.079 116 *Z3 -0.039 0.062 -0.174 0.035 116 *Z3 -0.039 0.062 -0.174 0.035 117 *Z4 -0.033 -0.120 0.054 0.018 117 *Z4 -0.033 -0.120 0.054 0.018 118 *sumsqr 0.096 0.065 0.156 0.318 118 *sumsqr 0.096 0.065 0.156 0.318 119 *
119 *
Simulointituloksista lasketaan tarvittavat suureet esim. VVARSTAT ARSTAT - ja SSTAT TAT
-operaatioilla seuraavasti:
44 1 SURVO 84C EDITOR Mon Apr 04 17:51:20 1994 D:\M\MEN\ 200 100 0 44 1 SURVO 84C EDITOR Mon Apr 04 17:51:20 1994 D:\M\MEN\ 200 100 0 119 *119 *
120 *MASK=-AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA 120 *MASK=-AAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA 121 *VARSTAT ARES,Summa2,SUM,2
121 *VARSTAT ARES,Summa2,SUM,2
122 *STAT ARES,CUR+1 / VARS=Summa2 FRACTILES=0.9,0.95 122 *STAT ARES,CUR+1 / VARS=Summa2 FRACTILES=0.9,0.95 123 *Basic statistics: ARES N=100
123 *Basic statistics: ARES N=100 124 *Variable: Summa2
124 *Variable: Summa2
125 *min=0.141451 in obs.#40 (1200040) 125 *min=0.141451 in obs.#40 (1200040) 126 *max=0.845863 in obs.#35 (1200035) 126 *max=0.845863 in obs.#35 (1200035)
127 *mean=0.303377 stddev=0.112814 skewness=1.751569 kurtosis=5.396984 127 *mean=0.303377 stddev=0.112814 skewness=1.751569 kurtosis=5.396984 128 *lower_Q=0.225 median=0.286765 upper_Q=0.369643
128 *lower_Q=0.225 median=0.286765 upper_Q=0.369643 129 *fractile(0.9)=0.429545
129 *fractile(0.9)=0.429545 130 *fractile(0.95)=0.5125 130 *fractile(0.95)=0.5125
131 *up.limit f % class width=0.05 131 *up.limit f % class width=0.05 132 * 0.15 1 1.0 *
132 * 0.15 1 1.0 *
133 * 0.2 12 12.0 ************
133 * 0.2 12 12.0 ************
134 * 0.25 25 25.0 *************************
134 * 0.25 25 25.0 *************************
135 * 0.3 17 17.0 *****************
135 * 0.3 17 17.0 *****************
136 * 0.35 15 15.0 ***************
136 * 0.35 15 15.0 ***************
137 * 0.4 14 14.0 **************
137 * 0.4 14 14.0 **************
138 * 0.45 11 11.0 ***********
138 * 0.45 11 11.0 ***********
139 * 0.5 0 0.0 139 * 0.5 0 0.0 140 * 0.55 2 2.0 **
140 * 0.55 2 2.0 **
141 * 0.6 1 1.0 * 141 * 0.6 1 1.0 * 142 * 0.65 0 0.0 142 * 0.65 0 0.0 143 * 0.7 0 0.0 143 * 0.7 0 0.0 144 * 0.75 1 1.0 * 144 * 0.75 1 1.0 * 145 * 0.8 0 0.0 145 * 0.8 0 0.0 146 * 0.85 1 1.0 * 146 * 0.85 1 1.0 * 147 *
147 *