• Ei tuloksia

Tilastollisista monimuuttujamenetelmistä

N/A
N/A
Info
Lataa
Protected

Academic year: 2022

Jaa "Tilastollisista monimuuttujamenetelmistä"

Copied!
7
0
0

Kokoteksti

(1)

1t

*:

ALKOHOLIPOLIITTISEN

TUTKIMUSLAITOKSEN TUTKIMUS SELOSTE

N:o

14 Tarnrnikuu 19 65

TIT ASTOLLISISTA

MONI MUU T T U JAMENET E L MIS T Ä

Seppo Mustonen

OY

ÅLKCHOLILIIKE

AB Älkoholipoliittinen tutkimuslaitos Pitkansillanranta 3

B

Helsinki s

å-*

.p"{

(2)

4,a,

1965

Seppo Mustonen!

TTIAS TOTLTS TS TA MONIMULMTUJAMENHIEIMTSTÄ

Tl1astollf.sen

monLrn:uttuJa-analJlysln

(Stattsttcal Multlvarlate

Araalysls)

teoria

on

kehittynyb

rLanan rmrlden

tllastol1lsten

tutkfumsmenetelmlen kanssa.

Uselnnnat

nykylsln

käytössä

olevista

montruuuttr&jameneteLmlstä

ovat

saaneet

alkrnsa

19J0-1uvtt11a 1?fl:i.nnä

R, A" Fishertn, Hotelllngtn

Ja Thurstor€o åD-

siosta. Kultenkln

rrasta

viime

vuosina ne ovat

tuLleet ylelsesti tururetulksl,

stlIä

etupäässä

laskutelqillllslstä

hankaluukslsta Johtuen

el ole

alkalsem- mln

ollut

mahdolJ.lsta soveltaa

nältä

menetelmlä alnakaan laaJotssa tutklnn:k- sissa.

1.

Multlnormaallj akautuma

Puheena olevan

teorlan

eräåtnä t?irkeåinä kulmaklvenä on multlnormaallJa-

kautuma.

Keskustelut nonfim:uttujamenetelmLen kelpolsuudesta

erllalsissa sovellutukslssa johtavatkln tavalllsestl

pohdlntaan nnrltlnonmaall.suuso].etta- rmksen

oLkeutuksesta.

Perlaatteessa

olisi tletenkin

mahdolltsta rakentaa

-

monlmuuttujamalleJa nmidenkLn

monlulotteisten

todenn?fl<ölsyysJakautumien poh-

Jalta tai

ylelsemmässä nuodossa, rmrtta

täLlalset yrltykset

näyttåivät olevarr yJ.en

harvlnalsla. Syltä vallitsevaan tllanteeseen

omhelppo

luetella.

1.1.

Sanalla

tavalla

lcutn normaallJakautumalla on keskelnen asema

Jat-

ktrvlen ykslulotte

lsten

todennZikölslrysJ akautumien J otrkossa todennälkö1si61s

-

laskennan keskeLsen raJa-arvolauseen

anslosta (ks.

esim.

Elfving //6//

s. 75,

Cramdr

//5// s. 2)1),

myös multlnormaallJakautumaa voldaan

pltiiä erl-

koJ.sasenassa

jatkrrvien montulotteisten

jakautumlen Joukossa (Cram6?

//5//

s. J16)"

Käyb?innön tutktnnrksissa on

usein

tthwä syy uskoatt,

että

Jakautuma on

alnakln llklpltäen

multinormaalinen.

1.2.

Mrrulla

lmtn

rthSnrällä

uskollatr

el- nn:ltLnonrnaallsuusolettarmsta

vol Juurl

käybtää, s111ä on

erlttäLn

valkea

osolttaa eslm., että

arr:rettu otos on

kotolsln

rmrltlnormaallsesta perusJoukosta. YhtelsJakautuman rnrltlnormaa-

llsuutta el nlmittälin

takaa ykslstäZin kunktn

e::lllLsen

rnruttuJan nonmaall-

suus.

Onpa Jopa

nlLn, ettel

edes kahden

normaallsestl

Jakautuneen nnruttuJan

ke sklnälnen koruelolmattomuus o1e

riittävä

ehto multlnormaallsuudelle (Anderson

//3// s. jT).

L.7.

TeoreettLslssa

tarkastelulssa hall-ltaan tllanteet

paremnin, Jos

rn:ltlnormaallsuusolettann:s on

tehty.

T?ih?tn on sSrynä

pattsl

rnultlnormaall-

(3)

'2-

Jakautuman

sllstl analffittnen

ralenne myös sen

atnntlaatulnen

ykslnker-

talsuus

mm, sil.nä mlelessä,

että rnrltlnormaallsestl

Jakautuneiden rnuuttu-

Jlen

kor"r"elolmattornrudesta selrraa aina

nllden

kesklnåilnen

tllastolLinen rllppunattonn:u$.

Tiim?ih?in p1tää yleisessä tapauksessa paikkansa

valn

päln- vastalsessa suunnassa

-

rlippumattonnrus

lmpltkol

korrelolmattomruden,

1,4.

MultlnormaaLlsuustapauksessa

tarkasteLut ovat llsäiksl

slk?iLl he1- pompla,

että

jakautuman mäiirltt?*nlsekst

rllttää,

Jos tunnetaan parametrelna rmruttujten keskl.a::vot Ja

kovarlansslmatrilsl (yhtäpltäv?istl

kesk!.arvot, kesklhajonnat Ja

korrelaatlot) " Tällöin

myös Jakautuman parametreJa

estt-

moltaessa

el tarvltse

laskea

tolsta

kertalukua korkeamp5.a mornentteJa.

1.5.

Pälnvastoln

kuln

eslm, normaal-lsuuteen pertrstuvat

tllastolllset testlt

useat monlnnruttuJamalllt

elvät llene

kovtnkaan he::kklä s111e,

että

käytåinnössä

esllnt ry srrurlakln

polkkeanruksta rmrltLnorrnaaL!.suudesta. TZimä

johtunee

liihtnnä slltä, että

nåirnä

maIllt

rnruttujayhdlstelyJen

kautta

yleen-

liihentävät tutklttavaa alnelstoa

rmltlnormaallJakautuman

suuntaan. Nltn-

pä eslm.

erotteluanalyysia

on

vottu

menestyksellä soveltaa

tllanteessa,

Jossa useLmmat

nnruttujat oltvat

melkelnpä

dtkotornlsla

(Mustone*

/fi//).

2.

lvlonfunruttuJamenetelmät

Oletetaan,

että tarkasteltavana on p

satunnalsnn:uttujaa

xLrxzr....rxn

r Jotka

yhtelsestl

noudattavat nmltinosnaalLJakautumaa

parametreln

U

r X

e,

(

U

on p x 1 vektonl,

Joka nnrodostuu nuuttuJten

kesklarvolsta Ja E p x

p

natrllsl,

Jor:ka

alklolna

ovat muuttuJlen varlanssf.t Ja

kovariansslt.)

TavallLsestl

Jakautuman parametrl.t Joko kokonaan

tat oslttaln

ovat

tun-

temattomla Ja ne joudutaan estlrnoinaan otoksen

avulIa,

mlkä merkitsee empl.l-

rLsten

kesktarvoJen, kesklhajontoJen Ja

korrelaatlolden

Laskemlsta.

MontrnruttuJamenetelmlen tunnusomaistmmaksi

pllnteeksl

voldaan lukea,

että tarkastelu

kohdLstuu

paltsl

lmnkin nnruttuJan omaan

vaihteluun

nryös rnruttu-

Jien

keskinäLseen vaLhteluun, Joka

rmlltlnormaalltllanteessa

krrvastuu tyhJen-

tyvästl

rnruttuJ

len vällslssä korrelaatioissa.

Montnnruttujamalllen

teorlaa

on hankala

esittää täysln

yhtenäisessä muo-

dossa

nitn, että kaikklen erL

menetelmlen omlnaisuudet

voltatsltn

ottaa

esllle

teorLan

erikolstapauksLna.

Alnaktn

yksl yrltys,

Iähinnä informaatio- teoriaarr noJautuen, on

tehty

(Kullbact<

//B//).

Tässä yhteydessä tyydyn ku1-

tenkln

käybt?imä?in

varsln alkeelllsta

kelnoJa menetelmlen kuvaaml.seksl,

Jol-

1oln ylelnen

selostus

vain Wvtn vajanalsestt valalsee

kunkln menetelmän taustaa Ja menetelmlen

vällsiä

yhteykslä.

(4)

-3o

TllasboJ-llset

monirnruttuJamenetelnät Jaetaan yleensä kahteen p?iiiryhrnä?in:

I

Yhden rnuuttuJan rnenetelmlen

yleistykset

If Varsinaiset

monlnnruttuJamalltt

f

ryhm?in menetelml-llä on

kullaktn

oma vastlneensa yhden ruuttuJan

teo- rLassa, Erlkoisesti

normaallJakautumaan perustrrvat

ttlastolllset testtt

ovat helposti ylelstettävlssä useita

muuttuJla

koskevlksl. Nilnpä

esim.

t-testi,

JoLl-a perusrnrodossaan testataan normaallsen rnruttuJan kesklarvoa

u

koskeva hypoteesl.

u = uo , ylelstyy

nn:ltlnormaallsuustllanteessa

Hotelllngln T--testlksl,

t Jossa

testattava

hypoteesl on

m.rodolllsestl

sama,

rnrtta

koskee

nyt

keskiarvovelcborla

p (testataan sl1s

?rypoteesl: kalkklen

ruuttuJlen keskiarvot ovat annettuja lukuja)

(Anderson

//3//,

chapter

!).

Myös

usellLa tunnetullLa

yhden satunnalsntruttu.fan

tllastomatemaattlsllla maIlelll-a,

lfitten varLanssl-

ja

regressloanallrysllJ-a, on omat vektorfun:uttu- J1a koskevat yletstyksensä (Anderson

//t//,

Chapter B).

If

rfrhm?in meneteLmät,

iotka ovat vallla vastlnetta

yhd.en muuttr:Jan

teo- rfassa,

voldaan

tul-klta

helpoimnin rnruttuJakr:vaukslksl, Jolssa kuvaus

vali-

taan sltenr että

rnlelenkllnnon kohteena

olevat

omlnalsuudet

tutklttavassa atneistossa

saadaan parhatten

esllLe.

MonlrruuttuJarnalLl on y!-eensä

vltval-

11nen,

JoLloin mal-ll

on nmotoa

Xl = "I1*l+ uti

Z

* ... *

ulp*n

,:= ^rt*t*

azd:a

* '.' * tro*o

:

Y*: tr1*l +

am2x2

* "' *

"*p*o

ell

matrllsfumrodossa

y : Ax .

Tässä

rmruttuJat *L"*zrr-.rx'

(nmuttuJavek-

torl x )

ovat

havalttavia

muuttuJla,

muuttuJat y1ty2,...ry;

(muuttuJavek-

torl y )

uusla

ns.

ItpltlormruttuJla"

ja ker.toimet ril (kernolnmatrilsi

A)

malll'n

parametrLt, rrlatauksettr, Jotka täsmentävät kr:vauksen havaLttavlLta rnruttuJ

llta

ptllomuuttuJ

LIle.

Joskrrs

(eslm.

faktorlanal-yysj.ssa) on parempl rmodostaa mal-Il

tolslnpäln,

slls

kuvauksena

plllonnruttuJllta havalttavllle nnruttuJllle,

JoJ.J.oin

tulee

malrdolLiseksl tkäiinkuln

IaJltella plllomuuttuJia

Jo

mallta

rakennettaessa (fatctorlanaLyyslssa

Jako:

common

factors -

unl.que

factors)

Mallla

rruodostettaessa on

luonnolllsestl t?irkelntä

iarvauksen A vaLLnta.

Ylelsestt

voldaan sanoa,

että vallnta

perustuu kahdeJ.le päävaatlmukselLe -o

I m jp,

20 y

rparempl

lmtnil x

.

(5)

r4-

Enslmmälnen vaatfums on J?irkevä Jo kuvauksen ekonomLan

kannalta. Lf- siiksl

on

ilmel.stä, että

m:n

ollessa

huomattavastL plenempl

kuln p

(esl.m.

p

=

5O, m =

J)

multlnormaal-Lsuusolettarir:s

plllomuuttuJlen

kohdalLa on olkeu- tetumpl

kuin

havaittuJen rnruttuJlen kohda1la.

Tolsen vaattrnrksen llmaLsemaa paremmuutta

vol

edustaa eslm.

a)

.1oftn tllastomatemaattlnen omtnalsuus

esl.m. pä?ikomponenttlanal-5rysissa kuvaus A

valltaan slten, että

uudet

rntruttuJat y

(pä?ikomponenttt)

kukln

rnrorollaan

sl.tovat

ltseensä mahdolltslmman suuren osan havalttuJen

muuttuJlen x

kokonalsvalh- teLusta

Ja ovat Lisiitrsl

korreloLmattomla.

b) tulktttarnrus

eslm' faktorlanallrysin

rotaatlovaiheessa pSrrklmlnen itslmple stnreturerf

-perlaatteella llmelkkätslln faktoreihln

(Thurstone

/ftL//),

On

kultenkln

huomattava,

että sillolnkln, krn

kuvauksen valLruran

ensl-

arvolsena pemsteena

ei ole

paremmuus tllastomatemaattlsessa mielessä,

pyrl-

tä?in paremm:uden

tavoLttelu

palauttamaan t?ihåin

(esim.

analtry-ttlset

rotaatlo-

rnenetelmät falrtonLanallrysissa), mikä viihentää tulklttarnrus-perlaatteeseen

helpostl J-llttyvää

subJekttlvtsuuden

vaaraa.

Vaatlrmrs 20 3ohtaakln yleensä s1Lhen,

että

kuvaus A Joudutaan mä?irä?imäiin matemaattlsen optl.molntltehtävän

kautta,

Joka yleensä on

Jokln kovarlansslmatrllselhln LitttWä

omlnal.sarvo- tehtävä

ja täten laskennaLllsestl

suurLtölnen.

].

EstmerkkeJä

PäåikomponenttLanallrysln

perlaate

on

selostettu edellä.

Tehtäv?inä on

slis

s1lntää

muuttuJlen x

kokonaLsvalhtelu volmaklruusJZirJestyksessä

uusll-

1e

nnruttuJl1le,

pääkomponentellle

y

(Anderson

//t//,

Chapten 11).

Faktorlanalyysl

on.

ltse

aslassa usean nonlnnruttuJamal.ltn yhdfstelmä, Sen

faktoroLntlvathe tulee låihelle

pääkomponenttlanal]rysla. Erona

kulten-

kln on, että faktorellle y ei sllruetä nnruttr4jlen x

kokonalsvalhtelua, vaan alnoastaan se osa

tästä

vaLhtelusta (kesktnäLnen

valhtelu),

Joka on

yhteistä

kahdelle

tat

useanmalle

x-muuttrr.jal.le.

Vol.daan sanoa,

että

pää-

komponentttanalyysl on menetelmiinä

varlanssLorl-entoltu,

lnrn

taas falctorl- analyysl

on

kovartansslortentoitu.

Rotaatlo

on

faktorolntlvalheen

pohJalle rakentuva montmuuttuJakrrvaus,

Jossa, kuten edelLä

todetttLn,

analyysln

tulokset pyrttään

saattamaan

tu1-

kinrran kannalta edulLlseen rnrotoon (Harman

/n//,

Tlmrstone

//n//).

FaktorLanalyyslln

läihelsesti lilttWLstä

rnoninnruttuJamenetelmistä ma1-

nl.ttakoon

vtelä falrbortanalyysitulosten

vertallumenetelnä, transf or,rnaatLo-

arralyysl

(Ahmavaara

/h//, //z//).

(6)

-5-

{qnonl.qeqsa anal}ryslssa tankastellaan y'htalkaa ka}rta mtruttuJaryhmää Ja pä?imä?ir?inä on

Iöytää

krmmastakln ryhmästä

sellalset yhdlstetyt

rnruttuJat,

että alna parelttaln

nälden

yhdlstettyjen

rmruttuJlen, kanonLsten muuttuJlen,

väIlset rllppunrudet ovat korrelaatlon

ml.elessä mal:dolllslmman suuret

rutta

muuten

nllden vältset korrelaatlokertolmet

ovat

nollla.

KanonLsessa alla-

lyyslssa yrltetä?in stls

l-öyt,ää rrparas yhteyst' kahden rmruttuJaryhm?in

våillLIä

(Anderson

/D//,

Chapter 12).

ErotteluanallEfslqsq, (atsicrtmtnaatloanaltrryslssa) on \ruorostaan

kaksl tat

useampia penrsJoukkoJa

(ryhnlä) vertalltavana

Ja pyT ltä?in Iöytämään

sellai- set yhdlstetyt,

rmruttuJat,

dlskr!.mtnaattorft,

Jotka parhaiten lnrvaavat

ryh-

mten

vällsiä eroja. Erotteluanallryslln lilttWät låihelsestl luoklllelu-

mengtelmät,

jotden

tehtävitnä on

osolttaa

krrLlekln

tutktttavalLe

ykslJ.ölle, eslm. alkalsemmin suonttetun

erotteluanalyystn pohJalla,

ryhmä, Johon

ykstlö

låihlnnä lcuuluu (nao

//tO//,

CooJ.ey-Lohnes

//4//,

Chapters

6, T).

(7)

- 6 r

rÄHonuleTrEro

//V/

.Ahmavaara,

Y.,

transformatLon

Analysls of Factortal Data,

Ann.

Acad.

Scl'

Fenn.

Ser. B.

Tom.

88, 2,

Lg54

//2//

Ahmavaara,

Y.,

On

the

Mathematlcal

theory of

Tbansformatlon

Analysls, AlkohollpoLllttlsen

tutklunrslaltoksen J ulkalsuJ a

nzo

l,

L)6J

//t//

Anderso4,

T. W.,

An

Introductlon to Multlvarlate Statlstlcal

AnaLysis, Wl1ey" 1958

//4//

Cooley-Lohnes,

Multivarlate

Frocedures

for the

Behavloral Scl.ences,

WtleY, 1962

//5//

Cnam6r,

H.,

Mathematical Methods

of Statlsttos, prlnceton,

Jg5g

//6// Elfvlng, G.,

Todenniilcöisyyslaskenta, Otava, 1p!6

//7//

Harrnan,

H. H,,

Modern Factor Anal.ysls,

Unlverslty of

Chleago

Press, l-960

//8// Kullbaek, S.,

Informatlon Theory and.

Stattstlcs, Wlley,

1959

//g//

Mustonen,

S., Multtple

DlscnlmLnant

Analysls ln Llngulstic

Problems, NordSAM

64,

1964

//LO//

Rao,

C.

R.e Advanced

Statistteal

Method.s Ln Blometrlc Research, WLley, 1952

//n//

Tt:urstone,

L. L,, Irtultlple-Factor Analysls, Unlversity of

ChLcago

Pness, 1947

Viittaukset

LIITTYVÄT TIEDOSTOT

Harjoitus 1, kevät

1. Hajota identiteetin vasemman puoleinen matriisi kahden matriisin tu- loksi ja käytä Binet-Cauchy

vektori n 6= 0, joka on kohti- suorassa jokaista tason

Matematiikan perusmetodit I/soveltajat Harjoitus 3, syksy

Vastauksia tehtäviin voi lähettää sähköpostilla osoitteeseen aleksis.koski@helsinki., tai postitse osoitteeseen Aleksis Koski, Helsinginkatu 19 A 36, 00500 Helsin- ki..

Konstruoi jatkuva kuvaus f siten, että suljetun joukon kuva kuvauksessa f ei ole suljettu.. Todista

Tätä varten laajennetaan reaalilukujen joukkoa R kahdella pisteellä : ∞, −∞.. Siis ∞, −∞ eivät ole

[r]