• Ei tuloksia

Matriisin singulaariarvohajotelma

N/A
N/A
Info
Lataa
Protected

Academic year: 2022

Jaa "Matriisin singulaariarvohajotelma"

Copied!
58
0
0

Kokoteksti

(1)

Matriisin singulaariarvohajotelma

Jaakko Kirsilä

Matematiikan pro gradu Jyväskylän yliopisto

Matematiikan ja tilastotieteen laitos kevät 2021

(2)

Tiivistelmä:Jaakko Kirsilä,Matriisin singulaariarvohajotelma(engl. Singular Value Decomposition), matematiikan pro gradu -tutkielma, 55 s., Jyväsky- län yliopisto, Matematiikan ja tilastotieteen laitos, syksy 2020.

Tämän tutkielman tarkoituksena on esitellä ja todistaa matriisin singu- laariarvohajotelma, jonka mukaan jokainenm×nmatriisiAvoidaan esittää muodosssaA=UΣVT, missä matriisitUjaVovat ortogonaalisia jaΣon dia- gonaalimatriisi. Tuloksen muotoa voidaan verrata matriisin diagonalisoi- tuvuuteen. Diagonalisoituvuudesta puhuttaessa matriisin täytyy kuitenkin olla neliömatriisi ja lisäksi kaikki neliömatriisit eivät ole diagonalisoituvia.

Singulaariarvohajotelma on olemassa kaikillem×nmatriiseille.

Tutkielmassa tarvittavia tuloksia esitellään tutkielman alussa lineaarial- gebran ja matriisiteorian kannalta merkittävien neljän aliavaruuden avulla.

Lisäksi tutustutaan näiden aliavaruuksien rooliin matriisinAtoiminnassa.

Singulaariarvohajotelmaan liittyy olennaisena osana matriisinAsingulaa- riarvot, jotka ovat matriisin ATA ominaisarvojen neliöjuuret. Ennen sin- gulaariarvohajotelman esittelyä tutkielmassa tutustutaankin matriisinATA ominaisuuksiin, joita tarvitaan myöhemmin singulaariarvohajotelman to- distuksessa.

Tarkoituksena on myös esitellä matriisin singulaariarvohajotelman so- velluksia. Ensimmäisenä sovelluksena on matriisin pseudoinverssi, jota voidaan pitää käänteismatriisin yleistyksenä. Pseudoinverssin avulla voi- daan ratkaista lineaarisia yhtälöryhmiä, jotka ovat muotoa Ax = b. Tällä yhtälöryhmällä ei kuitenkaan aina ole ratkaisua. Tällöin voidaan kuitenkin etsiä vektoria ˜x, joka minimoi lausekkeen kb−Ax˜k2. Tätä vektoria ˜x kut- sutaan pienimmän neliösumman ratkaisuksi. Osoittautuu, että pseudoin- verssin avulla löydetään myös pienimmän neliösumman ratkaisu. Singu- laariarvohajotelman sovelluksena on myös matriisin approksimointi alem- man asteen matriisilla. Tarkoituksena on esitellä tulos, jonka mukaan mat- riisin singulaariarvohajotelman avulla matriisille saadaan paras alemman asteen approksimaatio Frobenius normin suhteen. Tutkielman lopuksi so- velletaan matriisin alemman asteen approksimaatiota valokuvan häviölli- sessä pakkaamisessa.

(3)

Sisältö

Johdanto 1

1 Esitietoja 3

2 Neljä aliavaruutta 5

3 MatriisinATAominaisuuksia 12

4 Matriisin singulaariarvohajotelma 18

5 Pseudoinverssi 28

6 Pienimmän neliösumman ratkaisu 34

7 Matriisin approksimointi 44

8 Kuvan pakkaaminen 52

Viitteet 55

(4)

Johdanto

Tämä tutkielman päätarkoituksena on esitellä ja todistaa matriisin singu- laariarvohajotelma, jonka mukaan jokainenm×nmatriisiAvoidaan esit- tää muodosssa A = UΣVT, missä matriisit U ja V ovat ortogonaalisia ja Σon diagonaalimatriisi. Lisäksi esitellään matriisin singulaariarvohajotel- man sovelluksia. Tutkielman päälähteinä on käytetty Steven J. Leonin kir- jaa Linear Algerbra with Applications [2] ja Gilbert Strangin artikkelia The Fundamental Theorem of Linear Algebra[4]. Osaan tutkielmassa olevista to- distuksista on käytetty apuna lähteistä löytyviä todistuksia, jotka on mai- nittu kunkin todistuksen yhteydessä. Lähteiden todistuksia on muokattu tutkielmaan sopiviksi ja niihin on lisätty välivaiheita.

Tutkielman ensimmäisessä kappaleessa esitellään tutkielmassa myö- hemmin tarvittavia ja suurimmaksi osaksi lukijalle ennestään tunnettuksi oletettuja esitietoja. Toisen kappaleen aluksi esitellään ja todistetaan lineaa- rialgebran merkittäviä ja työssä myöhemmin tarvittavia tuloksia, kutendi- mensiolausejaastelause. Toisen kappaleen päätarkoituksena on kuitenkin tu- tustuttaa lukija lineaarialgebran ja singulaariarvohajotelman kannalta olen- naisiin neljään aliavaruuteen. Nämä neljä aliavaruutta ovat yleiseenm×n matriisiinAliittyvätriviavaruusRow (A),sarakeavaruusCol (A), sekäytimet N(A) jaN(AT).

Kolmannessa kappaleessa lähdetään edellisten kappaleiden tuloksien avulla johtamaan aputuloksia, joita tarvitsemme matriisin singulaariarvo- hajotelman ja sen sovelluksiin liittyvien tulosten todistamisessa. Mukana on kuitenkin sellaisenaankin mielenkiintoisia aputuloksia kuten lause, jonka mukaan matriisinasteei muutu, kun sitä kerrotaan kääntyvällä matriisilla.

Kappaleessa neljä esitellään ja todistetaan tutkielman päätulos eli mat- riisin singulaariarvohajotelma. Lisäksi perehdytään tarkemmin aiemmin mainittujen neljän aliavaruuden ja singulaariarvohajotelman yhteyteen.

Kappaleessa viisi käsitellään ensimmäistä tutkielmassa esiintyvää singu- laariarvohajotelman sovellusta. Tämä onpseudoinverssi, jota voidaan pitää käänteismatriisin yleistyksenä. Tähän liittyen kuudennessa kappaleessa kä- sitellään yhtälöryhmänAx=bratkaisemista. Riippuen matriisistaAja vek- toristabvoi kuitenkin käydä myös niin, että yhtälöryhmällä ei ole ratkaisua.

Tällöin etsitään vektoria, joka on lähimpänä. Eli vektoria ˜x, joka minimoi lausekkeen kb−Ax˜k2. Tätä vektoria ˜x kutsutaan pienimmän neliösumman ratkaisuksi. Osoittautuu, että matriisin pseudoinverssin avulla löydämme pienimmän neliösumman ratkaisun tai yhtälöryhmänAx = bvarsinaisen ratkaisun, mikäli se on olemassa.

Kappaleessa seitsemän käsitellään toista matriisin singulaariarvohajoel- man sovellusta eli matriisin approksimointia alemman asteen matriisilla.

Tässä yhteydessä määritellään matriiseihin liittyväFrobenius normi. Kappa- leen päätuloksen mukaan Frobenius normin mielessä matriisia parhaiten approksimoiva alemman asteen matriisi löydetään matriisin singulaariar-

(5)

vohajotelman avulla. Kappaleessa kahdeksan käytetään matriisin approk- simointia valokuvan häviölliseen pakkaamiseen. Tämä on yksi merkittä- vimpiä matriisin singulaariarvohajotelman sovelluksia. MATLAB ohjelmaa apuna käyttäen tehdään esimerkkikuvalle eri asteisia approksimaatioita.

(6)

1 Esitietoja

Esitellään aluksi tässä tutkielmassa käytettäviä merkintöjä ja määritelmiä, joista suurin osa oletetaan lukijalle jo ennestään tunnettuna.

Määritelmä 1.1. Määritellään avaruudenRneuklidinen sisätulo (· | ·) :Rn× Rn→Rasettamalla

x| y= Xn

i=1

xiyi

kaikillex=(x1, . . . ,xn)∈Rnjay=(y1, . . . ,yn)∈Rn.

Määritelmä 1.2. Olkoon S = {v1,v2, . . . ,vm}avaruuden Rn vektorijoukko.

Tällöin joukonSvektoreidenv1,v2, . . . ,vmvirittämäaliavaruus elilineaarinen verhoon

hSi=hv1,v2, . . . ,vmi={λ1v12v2+. . .+λmvmi∈R}.

Määritelmä 1.3. Olkoon V joukon Rn osajoukko ja (· | ·) avaruuden Rn sisätulo. Tällöin joukonV ortogonaalikomplementti Von

V ={x∈Rn|(x|v)=0 kaikille v∈V}.

V on siis joukko, jonka vektorit ovat kohtisuorassa jokaisen joukonV vektorin kanssa. Toistensa kanssa kohtisuorassa olevia vektoreita sanotaan ortogonaalisiksi. Lisäksi pätee (V) =V.

Määritelmä 1.4. OlkoonRneuklidinen avaruus ja (· | ·) sen sisätulo. Tällöin avaruudenRnvektorit{v1, . . . ,vn}ovatortogonaalisiamikäli

vi |vj

=





0, i, j ,0, i= j, jaortonormaalejamikäli

vi|vj

=





0, i, j 1, i= j. Määritelmä 1.5. OlkoonA m×nmatriisi

A=















a11 a12 · · · a1n a21 a22 · · · a2n

... ... ...

am1 am2 · · · amn













 .

(7)

Tällöin matriisinA transpoosi ATonn×mmatriisi

AT =















a11 a21 · · · am1

a12 a22 · · · am2

... ... ...

a1n a2n · · · amn













 .

Sanotaan, ettän×nmatriisiAonsymmetrinen, jos se ei muutu transponoi- taessa eliAT=A.

Määritelmä 1.6. n×n matriisia Q sanotaan ortogonaaliseksi, mikäli se on kääntyvä jaQ1=QT.

Ortogonaalisen matriisin sarakevektorit ovat ortonormaaleja. Lisäksi ortogonaalisella matriisilla on kaksi kuvauksen kannalta olennaista omi- naisuutta, sillä se säilyttää vektorien pituudet ja niiden väliset kulmat. To- distetaan näistä kahdesta ominaisuudesta vektorien pituuksien säilyvyys seuraavassa lauseessa.

Lause 1.7. Olkoon n×n matriisi Q ortogonaalinen. Lisäksi olkoon x ja y avaruuden Rnvektoreita. Tällöin

Qx|Qy= x| y

ja kQxk=kxk.

Todistus. Käyttäen sisätulon, transpoosin ja ortogonaalisen matriisin omi- naisuuksia saadaan

Qx|Qy=(Qx)TQy

=xTQTQy

=xTIy

=xTy

= x| y. Tällöin erityisesti

kQxk2=(Qx|Qx)

=(x|x)

=kxk2,

josta seuraa, ettäkQxk=kxk.

Koska ortogonaalinen matriisi säilyttää vektoreiden pituudet ja sisätu- lot, niin se kuvaa ortonormaalit kannat ortonormaaleiksi kannoiksi. Orto- gonaalinen matriisi on siis erikoistapaus kannanvaihtomatriisista.

(8)

2 Neljä aliavaruutta

Tämän kappaleen tarkoituksena on tutustua neljäänm×nmatriisiinAliit- tyvään aliavaruuteen. Kappaleen laatimisessa on käytetty apuna Gilbert Strangin artikkelia [4]. Esitellään aluksi muutama jatkossa käytettävä mer- kintä.

Määritelmä 2.1. OlkoonA m×nmatriisi. Tällöin matriisinA sarakeavaruus Col (A) on sen sarakevektoreiden virittämä avaruus

Col (A)={Ax|x∈Rn}.

MatriisinA riviavaruusRow (A) on sen rivivektoreiden virittämä avaruus Row (A)=Col (AT).

MatriisinA ydin N(A) on

N(A)={x∈Rn|Ax=0}.

MatriisinA asterank (A) on sen sarakeavaruudendimensiodim Col (A).

Avaruuden Col (A) dimensio vastaa matriisinAlineaarisesti riippumat- tomien sarakkeiden lukumäärää. Pidetään myös yleisesti tunnettuna, että n×nneliömatriisi on kääntyvä, jos ja vain jos sen aste onn. Tämän tuloksen todistuksen voi halutessaan lukea kirjan [1] sivulta 358.

Riviavaruus Row (A) ja matriisinAydin N(A) ovat avaruudenRn ali- avaruuksia. Sarakeavaruus Col (A) ja neljäs tarvittava aliavaruus, matriisin AT ydin N(AT) ovat puolestaan avaruuden Rm aliavaruuksia. Aloitetaan näiden aliavaruuksien esittely yhdellä lineaarialgebran tärkeimmistä tu- loksista eli aliavaruuksien Col (A) ja N(A) dimensioiden välille liittyvästä dimensiolauseesta. Lauseen mukaan aliavaruuksien Col (A) jaN(A) dimen- sioiden summa vastaa matriisinAsarakkeiden lukumäärää.

Lause 2.2. (Dimensiolause) Olkoon A m×n matriisi. Tällöin dim Col (A)+dimN(A)=n.

Todistus. Olkoon dimN(A)=kja{u1, . . . ,uk}avaruudenN(A) kanta. Koska N(A) on avaruuden Rn aliavaruus, niin voimme laajentaa tämän kannan avaruudenRnkannaksi{u1, . . . ,uk,v1, . . . ,vl}. Tällöinn=k+l=dimN(A)+l.

Riittää siis näyttää, että dim Col (A)=l.

Osoitetaan, että vektorit Av1, . . . ,Avl muodostavat avaruuden Col (A) kannan. Tästä seuraa, että dim Col (A) = l, sillä vektoreita on l kap- paletta. Näytetään aluksi, että vektorit Av1, . . . ,Avl virittävät avaruu- den Col (A). Matriisitulon lineaarisuuden nojalla lineaariselle verholle

(9)

hAu1, . . . ,Auk,Av1, . . . ,Avlipätee

hAu1, . . . ,Auk,Av1, . . . ,Avli

=Ahu1, . . . ,uk,v1, . . . ,vli

=A(Rn)

=Col (A).

Kuitenkin Au1 = . . . = Auk = 0, sillä u1, . . . ,uk ∈ N(A). Siispä vektorit Av1, . . . ,Avl virittävät avaruuden Col (A). Tämä ei kuitenkaan vielä riitä näyttämään, että dim Col (A)=l. Näiden virittäjävektoreiden joukossa voi nimittäin olla myös lineaarisesti riippuvia vektoreita, jolloin todellisuudes- sa voisi olla dim Col (A) <l. Osoitetaan siis, että vektoritAv1, . . . ,Avl ovat lineaarisesti riippumattomia ja siten muodostavat avaruuden Col (A) kan- nan. Olkoon siis

Xl

i=1

αiAvi =0,

joillekinα1, . . . , αl ∈R. Matriisitulon lineaarisuuden nojalla saadaan A





 Xl

i=1

αivi





=0. TällöinPl

i=1αivi ∈N(A). Eli on olemassa esitys Xl

i=1

αivi= Xk

i=1

βiui,

joillekinβ1, . . . , βk ∈R. Vektoritu1, . . . ,uk,v1, . . . ,vlovat lineaarisesti riippu- mattomia, jolloin yhtäsuurus on mahdollista vain, josα1 =. . . =αl1 = . . . = βk = 0. Erityisesti siisα1 = . . . = αl = 0, jolloin vektoritAv1, . . . ,Avl

ovat lineaarisesti riippumattomia.

Dimensiolauseen yhteydessä esille tulee usein myös seuraava lineaa- rialgebran merkittävä tulos, jonka mukaan matriisinAsarakeavaruudella ja riviavaruudella on sama dimensio. Vastaavasti jos tulos muotoillaan käyt- täen matriisin asteen määritelmää, niin matriisillaAja sen transpoosillaAT on sama aste.

Lause 2.3. (Astelause) Olkoon A m×n matriisi. Tällöin on dim Col (A)=dim Row (A).

Yhtäpitävästi matriisin asteen ja transpoosin määritelmien nojalla rank (A) = rank (AT).

(10)

Todistus. Olkoon matriisin Apaikallai j oleva alkioai j ja matriisinArivi- vektoritr1,r2, . . . ,rm. Olkoon lisäksi dim Row (A) =kja{u1,u2, . . . ,uk}ava- ruuden Row (A) kanta. Tällöin voimme kirjoittaa jokaisen matriisinArivin avaruuden Row (A) kantavektoreiden avulla lineaarikombinaatioina

(1)

















r111u112u2+· · ·+α1kuk r221u122u2+· · ·+α2kuk ...

rmm1u1m2u2+· · ·+αmkuk,

joillekin αi j ∈ R. Merkitään paikalla i olevaa kantavektoria ui = (ui1,ui2, . . . ,uin). Tällöin yhtälöt (1) voidaan kirjoittaa muotoon

















r111(u11,u12, . . . ,u1n)+α12(u21,u22, . . . ,u2n)+· · ·+α1k(uk1,uk2, . . . ,ukn) r221(u11,u12, . . . ,u1n)+α22(u21,u22, . . . ,u2n)+· · ·+α2k(uk1,uk2, . . . ,ukn) ...

rmm1(u11,u12, . . . ,u1n)+αm2(u21,u22, . . . ,u2n)+· · ·+αmk(uk1,uk2, . . . ,ukn). Nyt rivivektorin ri paikalla joleva komponentti on matriisin A alkio ai j. Jos poimimme ylempien yhtälöiden molemmilta puolilta paikalla jolevat komponentit, niin saadaan yhtälöt

















a1j11u1j12u2j+· · ·+α1kuk j a2j21u1j22u2j+· · ·+α2kuk j ...

am jm1u1jm2u2j+· · ·+αmkuk j. Nämä voidaan kirjoittaa muotoon













 a1j a2j ...

am j















=u1j













 α11

α21

...

αm1













 +u2j













 α12

α22

...

αm2















+· · ·+uk j













 α1k

α2k

...

αmk













 .

Merkitään vektoriaαi =













 α1i

α2i

α...mi















, jolloin ylempi yhtälö voidaan kirjoittaa muo- toon













 a1j a2j

...

am j















=u1jα1+u2jα2+· · ·+uk jαk.

(11)

Tästä huomataan, että yhtälön vasen puoli on matriisinApaikalla joleva sarake. Siispä jokainen matriisinAsarake voidaan kirjoittaa lineaarikom- binaationa vektoreiden α1, α2, . . . , αk avulla. Tällöin vektorit α1, α2, . . . , αk

virittävät avaruuden Col (A), jolloin

(2) dim Col (A)≤k=dim Row (A).

Toisaalta epäyhtälö (2) pätee mille tahansa matriisilleA, joten se pätee eri- tyisesti myös matriisilleAT. Siispä saadaan dim Col (AT) ≤ dim Row (AT).

Tästä seuraa, että

(3) dim Row (A)≤dim Col (A).

Tällöin epäyhtälöistä (2) ja (3) saadaan, että dim Row (A)=dim Col (A).

Seuraavan neljää aliavaruutta koskevan tuloksen mukaan ydinN(A) ja riviavaruus ovat toisiaan vasten kohtisuorassa. Lisäksi ydin N(AT) ja sa- rakeavaruus ovat toisiaan vasten kohtisuorassa. Tämä kohtisuoruus antaa osaltaan myös selityksen sille, miksi ydin N(AT) on juuri tarvitsevamme neljäs aliavaruus.

Lause 2.4. Olkoon A m×n matriisi. Tällöin N(A) = Row (A) ja N(AT) = Col (A).

Todistus. Näytetään aluksi, ettäN(A)=Row (A). Osoitetaan, ettäN(A) on kohtisuorassa avaruuden Row (A) kanssa. Täytyy siis näyttää, että jokainen avaruuden N(A) vektori on ortogonaalinen jokaisen avaruuden Row (A) vektorin kanssa. Olkoon siisx ∈N(A) ja y∈ Row (A). Tällöin vektoreillex jayon voimassa





 Ax=0

y=ATz,jollekinz∈Rm . Saadaan siis

x| y=xTy

=xTATz

=(Ax)Tz

=0Tz

=0.

Tästä seuraa, että N(A) ⊆ Row (A). Toisaalta jos vektori v ∈ Row (A), niinv on ortogonaalinen jokaisen matriisinAT sarakevektorin kanssa eli Av = 0. Siispä v ∈ N(A) ja siten Row (A) ⊆ N(A). Tällöin täytyy olla N(A)=Row (A). TulosN(AT)=Col (A)seuraa tästä, sillä

N(AT)=Row (AT) =Col (A).

(12)

Tiedämme nyt, että ydinN(A) ja riviavaruus ovat toistensa ortogonaa- likomplementteja. Vastaavasti ydinN(AT) ja sarakeavaruus ovat toistensa ortogonaalikomplementteja. Seuraava ortogonaalikomplementtien dimen- sioita ja niiden ortonormaaleja kantoja koskeva tulos luo lisää ymmärrystä näiden neljän aliavaruuden merkityksestä.

Lause 2.5. Olkoon V avaruudenRnaliavaruus. Tällöin dimV+dimV = n.

Lisäksi jos{v1, . . . ,vr}on aliavaruuden V ortonormaali kanta ja{vr+1, . . . ,vn}on aliavaruuden Vortonormaali kanta, niin{v1, . . . ,vr,vr+1, . . . ,vn}on avaruuden Rnortonormaali kanta.

Todistus. JosV={0}, niinV=Rn. Tällöin dimV+dimV=0+n=n. Jos V,{0}, niin olkoon{v1, . . . ,vr}avaruudenVkanta. OlkoonQ n×rmatriisi, jolle Q =

v1 v2 · · · vr

. Sarakevektorit v1, . . . ,vr ovat kantavektoreina lineaarisesti riippumattomia, jolloin dim Col (Q) =rja lisäksi Col (Q) =V.

Tällöin Lauseen 2.4 mukaanV = Col (Q) = N(QT). Nyt dimensiolause 2.2 sovellettunar×nmatriisilleQTantaa

dim Col (QT)+dimN(QT)=n.

Astelauseen 2.3 nojalla dim Col (QT) = dim Col (Q), jolloin dim Col (Q)+ dimN(QT)=n. KoskaV=Col (Q) jaV=N(QT), niin

dimV+dimV=n.

Näytetään vielä, että{v1, . . . ,vr,vr+1, . . . ,vn}on avaruudenRnortonormaali kanta. Osoitetaan aluksi, että vektoritv1, . . . ,vr,vr+1, . . . ,vnovat lineaarisesti riippumattomia. Olkoon

α1v1+. . .+αrvrr+1vr+1+. . .+αnvn=0,

joillekinα1, . . . , αr, αr+1, . . . , αn ∈ R. Merkitään x = α1v1+. . .+αrvrja y = αr+1vr+1+. . .+αnvn. Nyt siisx+y=0 elix=−y. Lisäksix∈Vjay∈V, joten x| y = 0. Tästä seuraa, että (x|x) = x| −y = − x| y= 0 ja vastaavasti y| y= y| −x=− y|x=0. Tämä on mahdollista vain, josx=0 jay=0.

Siispä saadaan





α1v1+. . .+αrvr=0

αr+1vr+1+. . .+αnvn=0 .

Nyt v1, . . . ,vr ovat avaruuden V kantavektoreina lineaarisesti riippumat- tomia. Vastaavasti vektorit vr+1, . . . ,vn ovat avaruuden V kantavektorei- na lineaarisesti riippumattomia, jolloin täytyy olla α1 = · · · = αr = 0 ja αr+1 = · · ·=αn =0. Tällöin vektoritv1, . . . ,vr,vr+1, . . . ,vnovat lineaarisesti riippumattomia ja niitä onnkappaletta, jolloin ne muodostavat avaruuden Rnkannan. Osoitetaan vielä, että tämä kanta on ortonormaali. Nyt vektorit

(13)

v1, . . . ,vr∈Vovat oletuksen nojalla ortonormaaleja ja vastaavasti myös vek- toritvr+1, . . . ,vn∈Vovat ortonormaaleja. Lisäksi avaruudetVjaVovat toisiaan vastaan kohtisuorassa. Tällöin kaikki vektoritv1, . . . ,vr,vr+1, . . . ,vn ovat keskenään ortonormaaleja ja muodostavat avaruudenRnortonormaa-

lin kannan.

Jos yhdistämme Lauseen 2.4 ja edellisen Lauseen 2.5 dimensioita koske- van tuloksen, niin saamme kaksi tärkeää näiden aliavaruuksien dimensioita koskevaa tulosta:

(4) dim Row (A)+dimN(A)=n ja dim Col (A)+dimN(AT)=m. Tämä dimensioita koskeva tulos on selityksenä sille, miksiN(AT) on neljäs tarvitsemamme aliavaruus. Lisäksi aliavaruuksien Row (A) ja N(A) orto- normaalien kantojen yhdiste muodostaa ortonormaalin kannan avaruudel- leRn. Vastaavasti aliavaruuksien Col (A) jaN(AT) ortonormaalien kantojen yhdiste muodostaa ortonormaalin kannan avaruudelleRm. Näiden neljän aliavaruuden ortonormaalit kannat ovat merkittävässä roolissa myöhem- min esiteltävässä matriisin singulaariarvohajotelmassa.

Ymmärtääksemme paremmin näiden neljän aliavaruuden yhteyttä mat- riisiinAtarkastellaan lineaarista yhtälöryhmääAx=bja sen ratkaisun löy- tämistä. YhtälöryhmänAx=bratkaiseminen vastaa kaikkien niiden kertoi- mienx1,x2, . . . ,xnlöytämistä, jotka yhdessä matriisinAsarakkeiden kanssa muodostavat vektorinbsarakeavaruudessa Col (A):

Ax=

· · ·

!

| {z }

matriisinAsarakkeet













 x1 x2

...

xn















=x1(1.sarake)+· · ·+xn(n.sarake)=b.

Ydin N(A) puolestaan sisältää kaikki ratkaisut homogeeniseen yhtälöön Ax = 0. Mikäli vektori b kuuluu sarakeavaruuteen Col (A), niin yhtälöllä Ax = b on olemassa ratkaisu. Yksittäinen ratkaisu xr on riviavaruudessa Row (A) ja homogeenisen yhtälön ratkaisu x0 on ytimessä N(A). Näistä muodostuu yleinen ratkaisux= xr+x0. Tilanteen hahmottamiseen auttaa Kuva 1. Kuva on lainattu samasta artikkelista [4], mutta sen merkintöjä on hieman muutettu vastaamaan tässä tutkielmassa käytettäviä merkintöjä.

Kuvasta 1 nähdään kuinka matriisiAvie vektorinxrsarakeavaruuteen ja ytimestäN(A) olevan vektorinx0 nollavektoriksi. Vektori xr on ortogo- naalinen vektorinx0kanssa. Tämä seuraa siitä, että aliavaruudet Row (A) ja N(A) ovat Lauseen 2.4 mukaan toistensa ortogoonalikomplementteja. Vas- taavasti aliavaruudet Col (A) ja N(AT) ovat toistensa ortogonaalikomple- mentteja. Tämä ilmenee myös kuvasta, sillä vastaavat aliavaruudet ovat kohtisuorassa keskenään.

(14)

Kuvasta 1 näkyy myös Lauseen 2.3 tulos, sillä riviavaruudella ja sara- keavaruudella on sama dimensior. Lisäksi ytimienN(A) jaN(AT) dimensiot on laskettu yhtälöiden (4) avulla ja merkitty kuvaan.

Kuva 1: YhtälöAx=bja siihen liittyvät neljä aliavaruutta.

(15)

3 Matriisin A

T

A ominaisuuksia

Tämän kappaleen tarkoituksena on edellisen kappaleen tuloksia apuna käyttäen edetä kohden seuraavassa kappaleessa esiteltävää matriisin singu- laariarvohajotelmaa. Erityisesti matriisiATAtulee olemaan singulaariarvo- hajotelman kannalta olennainen ja tarkoituksena on esitellä tähän matriisiin liittyviä myöhemmin tarvittavia tuloksia.

Määritelmä 3.1. OlkoonA n×nmatriisi. Jos vektorillev∈Rn\ {0}ja luvulle λ∈Rpätee

Av=λv,

niin lukuλon matriisinA ominaisarvoja vektorivsiihen liittyväominaisvek- tori.

Yhtäpitävästi matriisinAominaisarvot saadaan yhtälöstä det (A−λI)=0,

jossa det (A−λI) on niin sanottu matriisinA karakteristinen polynomi. Karak- teristisen polynomin juuren monikertaa sanotaan ominaisarvonalgebralli- seksi kertaluvuksi.

Esitellään seuraavaksi matriisin ominaisarvojen yhteydessä diagonaa- limatriisin ominaisarvoja koskeva aputulos, sekä similaaristen matriisien määritelmä ja siihen liittyvä aputulos, joita tarvitsemme myöhemmin kap- paleessa 7.

Lemma 3.2. Olkoon D n× n diagonaalimatriisi, jonka diagonaalialkiot ovat λ1, . . . , λn. Tällöin matriisin D diagonaalialkiot ovat sen ominaisarvot algebral- liset kertaluvut huomioiden.

Todistus. Nyt matriisinDkarakteristinen polynomi on

det (D−λI)=det









λ1−λ · · · 0

... ... ...

0 · · · λn−λ









=(λ1−λ)· · ·(λn−λ).

Tästä muodosta nähdään, että matriisinDdiagonaalialkiotλ1, . . . , λnovat karakteristisen polynomin juuret, jolloin ne ovat matriisinDominaisarvot

algebralliset kertaluvut huomioiden.

Määritelmä 3.3. OlkoonAjaB n×nmatriiseja. MatriisitAjaBovatsimi- laariset, jos on olemassa kääntyvän×nmatriisiCsiten, että

B=C1AC. Tällöin merkitäänA∼B.

(16)

Lemma 3.4. Olkoon A, B ja D n×n matriiseja. Lisäksi olkoon A ∼B ja A ∼D.

Tällöin (i) B∼D,

(ii) matriiseilla A ja B on samat karakteristiset polynomit,

(iii) matriiseilla A ja B on algebralliset kertaluvut huomioiden samat ominaisar- vot.

Todistus. Lauseen todistuksessa on käytetty apuna kirjan [1] kappaleen 6.3 Lauseen 1 todistusta.

(i) MatriisitAjaBovat similaariset, joten on olemassa kääntyvä matriisi C, jolleB =C1AC. LisäksiA ∼D, joten on olemassa kääntyvä matriisi P, jolleA=P1DP. Tällöin saadaan

B=C1AC

=C1(P1DP)C

=(PC)1D(PC) SiispäB∼D.

(ii) MatriisitAjaBovat similaariset, jolloin on olemassa kääntyvä mat- riisiC, jolleB=C1AC. Tällöin determinantin laskusääntöjä käyttäen mat- riisinBkarakteristiselle polynomille saadaan

det (B−λI)=det (C1AC−λI)

=det (C1AC−λC1IC)

=det (C1AC−C1(λI)C)

=det (C1(A−λI)C)

=det (C1) det (A−λI) det (C)

=det (C1) det (C) det (A−λI)

=det (C1C) det (A−λI)

=det (I) det (A−λI)

=det (A−λI).

Siispä matriiseillaAjaBon samat karakteristiset polynomit.

(iii) MatriisienAjaBkarakteristiset polynomit ovat kohdan (ii) nojalla samat, joten näiden karakterististen polynomien juuret ovat myös samat.

Nämä juuret ovat matriisien A ja B ominaisarvot ja niiden algebralliset

kertaluvut ovat samat.

(17)

Ennen matriisiinATAliittyvien tuloksien esittelyä tarvitsemmeortogo- naalisesti diagonalisoituvanmatriisin määritelmän ja kaksi apulausetta. Näis- tä ensimmäisen mukaan symmetrinen matriisi on ortogonaalisesti diago- nalisoituva ja toisen mukaan matriisin aste ei muutu mikäli sitä kerrotaan kääntyvällä matriisilla.

Määritelmä 3.5. n×nmatriisiAonortogonaalisesti diagonalisoituva, jos on olemassa ortogonaalinen matriisiQsiten että

QTAQ=D,

missä D on diagonaalimatriisi ja sen diagonaalialkiot λ1, λ2, . . . , λn ovat matriisinAominaisarvot algebralliset kertaluvut huomioiden.

Lemma 3.6. Olkoon A n×n symmetrinen matriisi. Tällöin A on ortogonaalisesti diagonalisoituva.

Todistus. Tämän lauseen todistus sivuutetaan tässä työssä. Todistuksen voi

halutessaan lukea teoksen [1] kappaleesta 6.4.

Lemma 3.7. Olkoon A m×n matriisi. Lisäksi olkoon B n×n kääntyvä matriisi ja C m×m kääntyvä matriisi. Tällöinrank (A)=rank (AB)=rank (CA).

Todistus. Lauseen todistus on tehty teoksessa [5] olevien Seurauksen 5.4.3 ja Lemman 5.4.3 todistuksien ideoita yhdistämällä. Näytetään aluksi, että Col (AB) = Col (A). Olkoon matriisi A muotoa A =

a1 a2 · · · an ja matriisiBmuotoaB =

b1 b2 · · · bn

. Merkitään matriisin Bpaikalla j olevaa sarakevektoriabj = (β1, β2, . . . , βn). Tällöin matriisin AB paikalla j oleva sarakevektori on muotoa

Abj1a12a2+. . .+βnan,

missäa1,a2, . . . ,an ∈ Col (A) ja β1, β2, . . . , βn ∈ R. Koska Col (A) on aliava- ruus, niin edelleenAbj ∈Col (A). Siispä tästä seuraa, että Col (AB)⊆Col (A).

Toisaalta Col (A) = Col (ABB1) = Col

(AB)B1

⊆ Col (AB) aiemman kohdan nojalla, sillä matriisi B1 on kääntyvä. Tällöin siis on Col (AB) = Col (A) ja siispä rank (AB)=rank (A).

Näytetään seuraavaksi, että Row (CA)=Row (A). Nyt pätee Row (CA)=Col ((CA)T)

=Col (ATCT)

⊆Col (AT)

=Row (A),

(18)

sillä matriisiCT on kääntyvä. Matriisin CT kääntyvyys seuraa matriisinC kääntyvyydestä, silläCT(C1)T =(C1C)T =IT =I. Toisaalta myös

Row (A)=Row (C1CA)

=Col

(C1CA)T

=Col

(CA)T(C1)T

⊆Col (CA)T

=Row (CA),

sillä matriisi (C1)T on matriisin CT käänteismatriisina kääntyvä ja mat- riisi (CA)T on n × m matriisi. Tällöin siis Row (CA) = Row (A), jolloin dim Row (CA) = dim Row (A). Tästä seuraa astelauseen 2.3 nojalla, että dim Col (CA)=dim Col (A) ja siispä rank (CA)=rank (A).

Esitellään seuraavaksi kaksi matriisiinATAliittyvää tulosta, joita tarvit- semme myöhemmin matriisin singulaariarvohajotelman todistuksessa.

Lause 3.8. Olkoon A m×n matriisi. Tällöin n×n matriisilla ATA on seuraavat ominaisuudet

(i) matriisi ATA on symmetrinen,

(ii) matriisin ATA ominaisarvot ovat ei-negatiivisia, (iii) matriisi ATA on ortogonaalisesti diagonalisoituva,

(iv) matriisin ATA aste vastaa sen positiivisten ominaisarvojen lukumäärää al- gebralliset kertaluvut huomioiden.

Todistus. (i) Symmetrisyyden näyttäminen onnistuu suoralla laskulla trans- poosin laskusääntöjä käyttäen

(ATA)T =AT(AT)T =ATA.

(ii) OlkoonλmatriisinATAominaisarvo javsitä vastaava ominaisvek- tori. Tällöin

kAvk2=(Av)T(Av)

=vTAT(Av)

=vT(ATA)v

=vT(λv)

=λvTv

=λkvk2.

(19)

Tästä saadaan

λ= kAvk2 kvk2

≥0.

Tällöin nähdään, että matriisinATAominaisarvoλon ei-negatiivinen.

(iii) Kohdan (i) mukaan matriisi ATA on symmetrinen, jolloin Lem- man 3.6 nojalla matriisiATAon ortogonaalisesti diagonalisoituva.

(iv) Kohdan (iii) nojalla matriisiATAon ortogonaalisesti diagonalisoitu- va, joten on olemassa ortogonaalinen matriisiQsiten että

(5) QT(ATA)Q=D,

missä D on diagonaalimatriisi ja sen diagonaalialkiot λ1, λ2, . . . , λn ovat matriisin ATA ominaisarvot. Nyt matriisi Q on ortogonaalinen eli se on kääntyvä ja Q1 = QT. Tällöin kun operoidaan yhtälöä (5) vasemmalta matriisillaQja oikealta matriisillaQT, niin saadaan

ATA=QDQT.

Tällöin rank (ATA) = rank (QDQT). Lisäksi Lauseen 3.7 nojalla rank (QDQT) =rank (D), sillä matriisitQjaQT ovat kääntyviä. Siispä saa- daan, että rank (ATA)=rank (D). DiagonaalimatriisiDon muotoa

D=















λ1 0 . . . 0

0 λ2 . . . 0

... ... ... ...

0 0 . . . λn













 ,

missä luvutλ1, λ2, . . . , λn ovat matriisinATAominaisarvot. Nyt matriisin Dmuodosta nähdään, että kaikki matriisinDsarakkeet, joilla on nollasta poikkeava ominaisarvo ovat lineaarisesti riippumattomia. Nämä nollasta poikkeavat ominaisarvot ovat kohdan (ii) nojalla positiivisia. Tällöin mat- riisinDaste vastaa matriisinATApositiivisten ominaisarvojen lukumäärää algebralliset kertaluvut huomioiden. Nyt kuitenkin rank (ATA)=rank (D),

joten väite on todistettu.

Seuraavan tuloksen mukaan matriiseillaAjaATAon sama aste. Lisäksi niillä on sama ydin.

Lause 3.9. Olkoon m×n matriisin A asterank (A)= r. Tällöin myös matriisin ATA aste onrank (ATA)=r. Lisäksi N(A)=N(ATA).

Todistus. Osoitetaan aluksi, että N(A) =N(ATA). Olkoonx ∈N(A). Tällöin Ax = 0, josta saadaan ATAx = 0. Tästä seuraa, että x ∈ N(ATA). Siispä N(A)⊆N(ATA).

(20)

Toisaalta olkoon x ∈ N(ATA), jolloin (ATA)x = 0. Tästä saadaan xT(ATA)x = 0, joka on transpoosin laskusääntöjen nojalla sama kuin (Ax)T(Ax) = kAxk2 = 0. Täytyy siis olla Ax = 0, joten x ∈ N(A). Näin ol- len N(ATA) ⊆ N(A). Siispä täytyy olla N(A) = N(ATA). Nyt A on m×n matriisi jaATAonn×nmatriisi, jolloin dimensiolauseen nojalla





rank (A)+dimN(A)=n

rank (ATA)+dimN(ATA)=n , joten

rank (A)+dimN(A)=rank (ATA)+dimN(ATA), ja tästä saadaan

rank (A)=rank (ATA).

(21)

4 Matriisin singulaariarvohajotelma

Tässä kappaleessa esitellään tämän työn päätulos, eli matriisin singulaariar- vohajotelma. Hajotelman avulla jokainenm×nmatriisiAvoidaan esittää muodossaA=UΣVT, missä matriisitUjaVovat ortogonaalisia jaΣon dia- gonaalimatriisi. Lisäksi todistetaan tämä tulos ja lasketaan esimerkki hajo- telma konkreettiselle matriisille. Kappaleen lopuksi tutustutaan hajotelman toimintaan.

Määritelmä 4.1. Olkoon A m × n matriisi. Matriisin A singulaariarvot σ1, . . . , σn ovat matriisin ATA ominaisarvojen λ1, . . . , λn neliöjuuret σi =

√λi ≥0.

Tässä on hyvä huomata, että Lemman 3.8 mukaan matriisinATAomi- naisarvot ovat ei-negatiivisia, jolloin niiden neliöjuuret eli matriisinAsin- gulaariarvot ovat hyvin määriteltyjä.

Lause 4.2. Jokainen m×n matriisi A voidaan esittää muodossa

A=UΣVT =

u1 u2 · · · um

























σ1 · · · 0 ... ... ...

0 · · · σr

0r×(nr)

0(mr)×r 0(mr)×(nr)





































 v1T

v2T ...

vnT













 ,

missä matriisin U sarakevektorit uiovat matriisin AATominaisvektoreita. Lisäksi m×n diagonaalimatriisinΣjärjestyksessäσ1≥. . .≥σr>0olevat diagonaalialkiot ovat matriisin A positiiviset singulaariarvot ja matriisi täydennetään tarvittaessa riittävän suurilla nollamatriiseilla. Matriisin V sarakevektorit vi ovat matriisin ATA ominaisvektoreita. Lisäksi matriisit U ja V ovat molemmat ortogonaalisia.

Todistus. Tämän lauseen todistuksessa on käytetty apuna teoksen [2]

Lauseen 6.5.1 todistusta. Lemman 3.8 nojalla kaikki matriisinATAominai- sarvot ovat reaalisia ja ei-negatiivisia. Lisäksi matriisilleATAon olemassa sen ortogonaalisesti diagonalisoiva matriisiV.

Nyt siis Lauseen 4.2 matriisit ATAja V ovat hyvin määriteltyjä. Näin ollen voidaan matriisinVsarakevektorit eli matriisinATAominaisvektorit järjestää niihin liittyvien ominaisarvojen

λ1≥λ2≥. . .≥λn≥0

määräämään järjestykseen. Koska nämä ominaisarvot ovat reaalisia ja ei- negatiivisia, niin matriisinAsingulaariarvot ovat

σj = q

λj j=1, . . . ,n.

(22)

Olkoon matriisinAaster. Tällöin Lemman 3.9 mukaan matriisinATAaste on myös r. Toisaalta Lauseen 3.8 kohdan (iv) nojalla matriisin ATA aste vastaa sen positiivisten ominaisarvojen lukumäärää algebralliset kertaluvut huomioiden eli ominaisarvoille pätee

λ1≥λ2≥. . .≥λr>0 ja λr+1r+2=. . .=λn=0. Vastaavasti singulaariarvoille pätee

σ1 ≥σ2≥. . .≥σr>0 ja σr+1r+2=. . .=σn=0. Esitetään matriisiV=

V1 V2

näihin ominaisarvoihin liittyvien ominais- vektorien avulla siten, että

V1=

v1 · · · vr

ja V2=

vr+1 · · · vn . Lisäksi olkoon

Σ1 =















σ1 0 . . . 0

0 σ2 . . . 0

... ... ... ...

0 0 . . . σr















r×r diagonaalimatriisi, jonka diagonaalialkiot ovat positiiviset singulaa- riarvotσ1, . . . , σr. Tällöin hajotelman varsinainenm×nmatriisiΣvoidaan muodostaa matriisistaΣ1täydentämällä se sopivan kokoisilla nollamatrii- seilla, jolloin

Σ = Σ1

0 0 0

! .

Nyt olemme muodostaneet singulaariarvohajotelman matriisitVjaΣ. Teh- tävänä on siis vielä muodostaa ortogonaalinen matriisiU =

u1 · · · um siten, että

A=UΣVT tai yhtä pitävästi

(6) AV=UΣ.

Tarkastelemalla muotoa (6) sarakkeeseenrasti huomataan, että Avjjuj, j=1, . . . ,r.

Määritellään tämän avulla

(7) uj = 1

σj

Avj, j=1, . . . ,r

(23)

ja

U1=

u1 · · · ur . Tällöin näillä merkinnöillä pätee

(8) AV1 =U1Σ1.

Osoitetaan seuraavaksi, että matriisin U1 sarakevektorit ovat keskenään ortonormaaleja. Nyt kaikille 1≤i≤rja 1≤ j≤rpätee

ui |uj

=uiTuj

=1 σi

Avi

T 1 σj

Avj

!

=1 σi

viTAT 1

σj

Avj

!

= 1 σiσj

viT(ATAvj)

= 1 σiσj

viTjvj) (vjon matriisinATAominaisvektori eli (ATA)vjjvj)

= 1 σiσj

viTj2vj)

= σj

σi

viTvj

=





0 i, j 1 i= j,

sillä ortogonaalisen matriisinV1sarakevektoritv1, . . . ,vrovat ortonormaa- leja. Siispä myös matriisinU1sarakevektoritu1, . . . ,urovat ortonormaaleja.

Lausekkeesta (7) nähdään sarakeavaruuden määritelmän mukaan, et- tä ortonormaalit vektoritu1, . . . ,urkuuluvat matriisinAsarakeavaruuteen Col (A). Tämän sarakeavaruuden dimensio onr, jolloin{u1, . . . ,ur}muodos- taa avaruuden Col (A) ortonormaalin kannan. Avaruuden Col (A) ortogo- naalikomplementin Col (A)dimensio on Lauseen 2.5 mukaanm−r. Olkoon

(24)

siis{ur+1, . . . ,um}avaruuden Col (A)ortonormaali kanta. Määritellään U2=

ur+1 · · · um

, ja

U=

U1 U2 .

Edelleen Lauseen 2.5 mukaan {u1, . . . ,ur,ur+1, . . . ,um} muodostaa avaruu- denRmortonormaalin kannan. Tällöin matriisiUon ortogonaalinen.

Meidän täytyy vielä näyttää, että todella A=UΣVT.

Tätä varten tarvitsemme aputuloksen, jonka mukaan A=AV1V1T.

Näytetään tämä seuraavaksi. Nyt matriisin V2 sarakevektorit vr+1, . . . ,vn

ovat ominaisarvoaλ=0 vastaavia ominaisvektoreita, jolloin ATAvj=0 j=r+1, . . . ,n.

Tästä nähdään, että vektoritvr+1, . . . ,vnkuuluvat ytimeenN(ATA). Toisaalta Lemman 3.9 nojallaN(ATA) =N(A), jolloin samat vektorit kuuluvat myös ytimeenN(A). Tällöin

AV2=0.

Lisäksi matriisiVon ortogonaalinen, joten

I=VVT =V1V1T+V2V2T. Tällöin saadaan haluamamme aputulos

A=AI (9)

=A(V1V1T+V2V2T)

=AV1V1T+AV2V2T

=AV1V1T+0V2T

=AV1V1T.

Tämän jälkeen yhdistämällä kohdat (8) ja (9) saadaan UΣVT =

U1 U2 Σ1

0 0 0

! V1T V2T

!

=U1Σ1V1T

=AV1V1T

=A.

(25)

Tällöin

A=UΣVT.

Näytetään vielä lopuksi, että matriisinUsarakevektorituiovat matriisin AAT ominaisvektoreita. Käyttämällä tietoa, että matriisiVon ortogonaali- nen eli VTV = I ja matriisille A todistamaamme hajotelmaa A = UΣVT saadaan

AAT =UΣVT

UΣVTT

(10)

=UΣVT

(VT)TΣTUT

=UΣVT(VΣTUT)

=UΣIΣTUT

=UΣΣTUT.

Tässä matriisiΣΣT on edelleen diagonaalimatriisi, jonka diagonaalialkiot ovatβ1, β2, . . . , βm. Tällöin matriisiUdiagonalisoi matriisinAATortogonaa- lisesti. Yllä oleva yhtälöAAT =UΣΣTUTvoidaan kirjoittaa myös muodossa

AATU=UΣΣT, josta saadaan

(AAT)uiiui i=1, . . . ,m.

Nyt nähdään, että matriisinΣΣT diagonaalialkiotβ1, β2, . . . , βmovat matrii- sinAAT ominaisarvoja ja vektorit ui ovat matriisin AAT ominaisvektorei-

ta.

Muodostetaan seuraavaksi esimerkkinä singulaariarvohajotelma sopi- van yksinkertaiselle matriisille, jotta hajotelman idea on helpompi hahmot- taa. Seuraava esimerkki on lainattu teoksen [3] sivulta 616.

Esimerkki 1. Muodosta singulaariarvohajotelma matriisilleA= 1 1 0 0 0 1

! . Tarvitsemme aluksi matriisinATAominaisarvot. Laskemalla saadaan mat- riisiksi

ATA=









1 1 0 1 1 0 0 0 1







 . MatriisinATAkarakteristinen polynomi on

det (ATA−λI)=−λ3+3λ2−2λ,

(26)

jolloin tämän polynomin juuret eli matriisinATAominaisarvot ovatλ1=2, λ2 =1 ja λ3 = 0. Näitä ominaisarvoja vastaavien ominaisvektorien selvit- täminen on melko mekaanista, mutta työlästä. Tämän vuoksi sivuutetaan näiden laskeminen tässä yhteydessä ja todetaan, että ominaisarvoja vastaa- vat ominaisvektorit ovat

w1 =







 1 1 0









, w2=







 0 0 1









ja w3 =









−1 1 0







 .

Näistä ominaisvektoreista huomataan, että (w1 |w2) = 0, (w1|w3) = 0 ja (w2|w3) = 0. Siispä ne ovat ortogonaalisia. Matriisin V muodostamista varten nämä ominaisvektorit täytyy vielä normeerata. Saadaan siis orto- normaalit vektorit

v1 =









1 12

2

0









, v2=







 0 0 1









ja v3=









1 12

2

0









 .

Matriisin Asingulaariarvot saadaan matriisinATAominaisarvojen neliö- juurinaσ1= √

2,σ2= √

1=1 jaσ3 = √

0=0. MatriisinΣmuodostamisessa on tärkeää huomata, että hajotelman mukaan vain positiiviset singulaa- riarvot otetaan mukaan. Siispä singulaariarvoa σ3 = 0 ei oteta mukaan matriisiinΣ. Nyt voimme muodostaa matriisitVjaΣ. Saadaan

V=









1

2 0 −1

1 2

2 0 1

2

0 1 0









ja Σ =

2 0 0

0 1 0

! .

Meidän täytyy vielä muodostaa matriisiU. Lasketaan matriisin Usarake- vektorit yhtälön (7) avulla. Saadaan

u1 = 1 σ1

Av1 = 1

√ 2

1 1 0 0 0 1

!









1 12

2

0









= 1 0

!

ja

u2 = 1 σ2

Av2 = 1 1

1 1 0 0 0 1

!







 0 0 1









= 0 1

! .

Tässä on hyvä huomata, että sarakevektoriau3ei voida laskea, silläσ3=0.

Tämä ei kuitenkaan ole tarpeenkaan, sillä vektoritu1jau2ovat valmiiksi or- tonormaaleja ja muodostavat avaruudenR2ortonormaalin kannan. Tällöin matriisiksiUsaadaan

U= 1 0 0 1

! .

(27)

MatriisinAsingulaariarvohajotelma on siis

A=UΣVT = 1 0 0 1

! √

2 0 0

0 1 0

!









1 2

1

2 0

0 0 1

1

2

1

2 0









 .

Halutessaan voi laskemalla varmistaa, että näin todella on.

Tarkastellaan vielä singulaariarvohajotelman muodostamista ja toimin- taa. Lauseessa 4.2 esiintyvät ortonormaalit kannat{v1, . . . ,vr},{vr+1, . . . ,vn}, {u1, . . . ,ur}ja{ur+1, . . . ,um}ovat merkittävässä roolissa singulaariarvohajo- telman muodostamisessa. Nämä neljä kantaa ovat aiemmin kappaleessa 2 mainittujen neljän aliavaruuden Row (A),N(A), Col (A) jaN(AT) ortonor- maaleja kantoja. Todistetaan tämä seuraavassa lauseessa.

Lause 4.3. Olkoon A m×n matriisi ja A=UΣVTmatriisin A singulaariarvoha- jotelma, missä matriisit

V=

v1 · · · vr vr+1 · · · vn ja

U=

u1 · · · ur ur+1 · · · um .

ovat ortogonaalisia. Lisäksi olkoonσ1, . . . , σrmatriisin A nollasta poikkeavat sin- gulaariarvot. Tällöin

(i) matriisin A aste on r,

(ii) {v1, . . . ,vr}on aliavaruudenRow (A)ortonormaali kanta, (iii) {vr+1, . . . ,vn}on aliavaruuden N(A)ortonormaali kanta, (iv) {u1, . . . ,ur}on aliavaruudenCol (A)ortonormaali kanta, (v) {ur+1, . . . ,um}on aliavaruuden N(AT)ortonormaali kanta.

Todistus. Lauseen todistuksessa on käytetty apuna kirjan [3] Lauseen 5.17 todistusta.

(i) Koska matriisit U ja VT ovat ortogonaalisina kääntyviä, niin Lem- man 3.7 nojalla

rank (A)=rank (UΣVT)

=rank (ΣVT)

=rank (Σ)

=r.

(28)

(iii) Todistetaan tämä kohta ensin, sillä kohta (ii) seuraa tästä. Tiedäm- me Lauseen 4.2 todistuksesta, että vektoritvr+1, . . . ,vnkuuluvat matriisinA ytimeenN(A). Nämä vektorit ovat ortogonaalisen matriisinVsarakevekto- reina ortonormaaleja ja niitä onn−rkappaletta. Lisäksi dimensiolauseen 2.2 nojalla dimN(A)=n−r, jolloin{vr+1, . . . ,vn}muodostaa aliavaruudenN(A) ortonormaalin kannan.

(ii) Tiedämme, että vektorit {v1, . . . ,vr,vr+1, . . . ,vn} muodostavat ava- ruudenRn ortonormaalin kannan. Tästä seuraa, että jokainen vektoreista v1, . . . ,vron kohtisuorassa jokaisen vektorinvr+1, . . . ,vn∈N(A) kanssa. Täl- löin sisätulon lineaarisuuden nojalla vektoritv1, . . . ,vr ovat kohtisuorassa kaikkien vektoreista vr+1, . . . ,vn muodostettujen lineaarikombinaatioiden kanssa. Nyt kuitenkin kohdan (iii) nojalla vektorit vr+1, . . . ,vn muodos- tavat aliavaruuden N(A) ortonormaalin kannan, jolloin vektorit v1, . . . ,vr

ovat kohtisuorassa kaikkien aliavaruudenN(A) vektoreiden kanssa. Lisäk- si Lauseen 2.4 nojallaN(A)=Row (A), joten vektoritv1, . . . ,vr∈ Row (A).

Tällöin Lauseen 2.5 mukaan

dim Row (A)=dimRn−dimN(A)

=n−(n−r)

=r.

Nyt vektoritv1, . . . ,vr ∈ Row (A) ovat ortonormaaleja eli ne ovat lineaari- sesti riippumattomia. Lisäksi niitä onrkappaletta, jolloin ne muodostavat avaruuden Row (A) ortonormaalin kannan.

(iv) Tämä kohta on todistettu Lauseen 4.2 todistuksen yhteydessä.

(v) Lauseen 4.2 todistuksessa määrittelimme, että {ur+1, . . . ,um} on ali- avaruuden Col (A) ortogonaalikomplementin ortonormaali kanta. Nyt kui- tenkin Lauseen 2.4 nojalla Col (A)=N(AT). Siispä{ur+1, . . . ,um}on aliava-

ruudenN(AT) ortonormaali kanta.

Artikkelista [4] lainatusta Kuvasta 2 nähdään kuinka riviavaruuden kantavektoreillev1, . . . ,vrja sarakeavaruuden kantavektoreilleu1, . . . ,uron voimassa yhtälöAviiui.

Viittaukset

LIITTYVÄT TIEDOSTOT

Luvussa my¨ os todetaan, ett¨ a jokainen matriisi todellakin voidaan esitt¨ a¨ a sek¨ a Hessenbergin yl¨ amuodossa ett¨ a alamuodossa.. Luvun lopuksi tutustutaan viel¨ a

Seuraavaksi tarkastellaan tason lineaarisia differentiaaliyht¨ al¨ oit¨ a, joissa A on 2×2- matriisi. Ratkaisuja on nyt ominaisarvojen merkeist¨ a riippuen eri tyyppej¨ a. Jos

f) ⇒ d): Oletetaan, että A ei ole riviekvivalentti minkään nollarivin sisältävän matriisin kanssa. Olkoon B redusoitu porrasmatriisi, joka on riviekvivalentti matriisin A kanssa.

Ratkaisun kehittäminen Tehtyjen valintojen perusteella ja etenemis- suunnitelman mukaisesti edetään ratkaisun luomiseen.

- Jäsenyyden tapauksessa saavat suomalaiset- kin mahdollisuuden olla mukana eurooppa- laisen kansalaisyhteisön (mm. European Ci- tizenship) kehityksessä. Kysymys on tällöin siis

Talvisodan ja jatkosodan alut olivwt tietyssä mielessä meille edul- lisia. Molemmissa tapauksissa oli aikaa käytettävissä. Liikekannalle- pano saattoi tapahtua

Osaamme muodostaa tulon A b, kun b on vektori, jonka pituus 3 on sama kuin matriisin rivin pituus (ts. sarak- keiden lukum¨a¨ar¨a).. Matriisin A rivin on oltava samanpituinen kuin

[r]