• Ei tuloksia

7 Matriisin approksimointi

In document Matriisin singulaariarvohajotelma (sivua 47-55)

Tämän kappaleen laatimisessa on käytetty apuna kirjan [2] kappaletta 6.5.1.

Matriisia voidaan approksimoida pienemmän asteen matriisilla. Ideana on löytää matriisin singulaariarvohajotelman avulla alemman asteen matriisi, joka on lähimpänä alkuperäistä matriisia. Ensin täytyy kuitenkin määritel-lä mitä tämä määritel-lähimpänä oleminen matriisien tapauksessa tarkoittaa. Mää-ritellään siis matriiseille käytettävä normi, jonka suhteen approksimointi tehdään. Matriisin approksimoinnissa käytetään niin sanottua Frobenius normia. Ennen Frobenius normin määrittelyä tarvitsemme kuitenkin mat-riiseille määritetyn sisätulon.

Määritelmä 7.1. OlkootA=[ai j] jaB=[bi j]m×nmatriiseja. Tällöin matriisi sisätuloa merkitäänh·,·ija

hA,Bi= Xm

i=1

Xn

j=1

ai jbi j.

Määritelmä 7.2. Olkoon A = [ai j] m×n matriisi ja h·,·i avaruudenRm×n matriisi sisätulo. Tällöin matriisinFrobenius normiamerkitäänk · kFja

kAkF=(hA,Ai)1/2 =







 Xm

i=1

Xn

j=1

ai j2







1/2

.

Frobenius normin määritelmästä huomataan, että kAkF = kATkF, sillä matriisinAtransponointi vaihtaa vain Frobenius normissa olevien alkioi-den summausjärjestystä.

Seuraavan lauseen mukaan alkuperäistä matriisiaApienemmän asteen matriisi X, joka minimoi normin kA−XkF, on aina olemassa. Lause on muotoiltu käyttäen apuna kirjan [2] kappaletta 6.5.

Lause 7.3. Olkoon A m×n matriisi, jonka aste on r ja0 <k<r. Lisäksi olkoon Mkaikkien niiden m×n matriisien joukko, joiden aste on korkeintaan k. Tällöin on olemassa matriisi X∈ M, jolle

kA−XkF≤ kA−SkF, kaikille S∈ M.

Todistus. Tämän lauseen todistus sivuutetaan tässä työssä.

Mikäli kuitenkin oletetaan, että tämä Lauseen 7.3 norminkA−XkF mi-nimoiva matriisiX on olemassa, niin tällöin kyseinen matriisiX voidaan löytää matriisin singulaariarvohajotelman avulla. Ennen tämän tuloksen esittelyä ja todistusta tarvitsemme kaksi Frobenius normiin liittyvää tulos-ta.

Lemma 7.4. Olkoon A m×n matriisi ja Q m×m ortogonaalinen matriisi. Tällöin kQAkF=kAkF.

Todistus. Tämän lemman todistukseen on käytetty apuna kirjan [2] Lauseen 6.5.2 todistusta. Olkoona1,a2, . . . ,anmatriisinAsarakevektorit. MatriisiQ on ortogonaalinen, jolloin Lauseen 1.7 mukaan saadaan

kQAk2

F= Xm

i=1

Xn

j=1

(Qaj)i2

= Xn

j=1

Xm

i=1

(Qaj)i

2

= Xn

j=1

kQajk2

= Xn

j=1

kajk2

= Xm

i=1

Xn

j=1

ai j2

=kAk2

F

Tällöin täytyy olla myöskQAkF=kAkF.

Lemman 7.4 avulla voimme muotoilla matriisin A Frobenius normin käyttäen matriisinAsingulaariarvoja.

Lause 7.5. Olkoon A m×n matriisi, jonka aste on r. Lisäksi olkoon UΣVTmatriisin A singulaariarvohajotelma jaσ1, σ2, . . . , σrsen positiiviset singulaariarvot. Tällöin

kAkF=(σ1222+· · ·+σr2)1/2.

Todistus. Käytämme apuna jo aiemmin Määritelmän 7.2 yhteydessä todet-tua tietoa, jonka mukaan yleisesti matriisinSja sen transpoosinST Frobe-nius normi on sama. Lisäksi matriisinAsingulaariarvohajotelmassa olevat matriisitUjaVT ovat ortogonaalisia, jolloin Lemman 7.4 nojalla

kAkF=kUΣVTkF

=kΣVTkF

=k(ΣVT)TkF

=kVΣTkF

=kΣTkF

=kΣkF

=(σ1222+· · ·+σr2)1/2.

Tarvitsemme vielä yhden apuloksen ennenkuin esittelemme tämän kap-paleen päätuloksen matriisin approksimoinnista. Seuraava aputulos liittyy matriisinAsingulaariarvohajotelmanUΣVTyleiseen muotoon ja siinä esiin-tyvään diagonaalimatriisiinΣ.

Lemma 7.6. Olkoon A m×n matriisi, jolla on esitykset A = UΣVT ja A = SΛYT, joissa matriisit U, V, S ja Y ovat ortogonaalisia, ja matriisitΣjaΛ ovat diagonaalimatriiseja. Tällöin matriisien Σ ja Λ diagonaalialkioiden neliöt ovat järjestystä lukuunottamatta samat.

Todistus. Nyt Lauseen 4.2 todistuksessa olevan yhtälön (10) mukaan esityk-sestäA=UΣVTsaadaan

AAT =U(ΣΣT)UT ja vastaavasti esityksestäA=SΛYT saadaan

AAT =S(ΛΛT)ST.

MatriisiU on ortogonaalisena kääntyvä, joten matriisitAAT ja ΣΣT ovat similaariset. Vastaavasti matriisiSon kääntyvä, joten matriisitAAT jaΛΛT ovat similaariset. Tällöin Lemman 3.4 kohdan (i) nojalla diagonaalimatriisit ΣΣT jaΛΛT ovat similaariset.

Nyt Lemman 3.4 kohdan (iii) nojalla diagonaalimatriiseillaΣΣTjaΛΛT on algebralliset kertaluvut huomioiden samat ominaisarvot. Lemman 3.2 nojalla nämä ominaisarvot ovat diagonaalimatriiseille ΣΣT jaΛΛT niiden diagonaalialkiot. Siispä matriiseillaΣΣT jaΛΛT on järjestystä lukuunotta-matta samat diagonaalialkiot. Lisäksi nämä diagonaalialkiot ovat matriisien ΛjaΣdiagonaalialkioiden neliöt. Siispä matriisienΣjaΛ diagonaalialkioi-den neliöt ovat järjestystä lukuunottamatta samat.

Nyt voimme esitellä ja todistaa tuloksen, jonka mukaan Lauseen 7.3 norminkA−XkFminimoiva matriisi Xvoidaan löytää matriisinA singu-laariarvohajotelman avulla.

Lause 7.7. Olkooon A m×n matriisi, jonka aste on r ja singulaariarvohajotelma UΣVT. Olkoon lisäksiMjoukko, joka sisältää kaikki korkeintaan astetta k olevat m×n matriisit, missä0<k<r. Olkoon A0 =UΣ0VT, missä

ja luvutσ1 ≥ . . .≥ σk > 0ovat ensimmäiset k kappaletta matriisin A singulaa-riarvoja. Tällöin A0 ∈ Mja

kA−A0kF=(σk+12+· · ·+σr2)1/2≤ kA−SkF, kaikille S∈ M.

Todistus. Lauseen todistuksessa on käytetty apuna kirjan [2] Lauseen 6.5.3 todistusta. Näytetään aluksi, että

kA−A0kF=(σk+12+· · ·+σr2)1/2.

Nyt matriisitUjaVovat ortogonaalisia, jolloin Lemman 7.4 nojalla kA−A0kF=kUΣVT−UΣ0VTkF

(16)

=kU(Σ−Σ0)VTkF

=k(Σ−Σ0)VTkF

=k((Σ−Σ0)VT)TkF

=kV(Σ−Σ0)TkF

=k(Σ−Σ0)TkF

=k(Σ−Σ0)kF

=(σk+12+· · ·+σr2)1/2. Lauseen 7.3 mukaan on olemassa matriisiX∈ M, jolle

kA−XkF≤ kA−SkF,

kaikilleS∈ M. MatriisinΣ0diagonaalialkiot ovat matriisinAnollasta poik-keavia singulaariarvoja. Tällöin nähdään, että matriisillaΣ0onkkappaletta lineaarisesti riippumattomia sarakevektoreita, jolloin matriisinΣ0aste onk.

Lisäksi matriisitUjaVTovat ortogonaalisina kääntyviä, jolloin Lauseen 3.7 nojalla matriisinA0 =UΣ0VTaste onk. TällöinA0∈ Mja pätee

(17) kA−XkF≤ kA−A0kF=(σk+12+· · ·+σr2)1/2. Riittää siis näyttää, että

(18) kA−XkF≥(σk+12+· · ·+σr2)1/2.

Tällöin olisi kohtien (17) ja (18) nojallakA−A0kF=kA−XkF, jolloin kA−A0kF=kA−XkF≤ kA−SkF

kaikillaS∈ M, ja lause olisi todistettu.

OlkoonQΩPTmatriisinXsingulaariarvohajotelma, missä

Tässä matriisinXaste on korkeintaank, joten joillakinjvoi ollaωj =0. Mää-ritelläänB=QTAP, jolloinA=QBPT. MatriisitQjaPovat ortogonaalisia, joten vastaavasti kuin kohdassa (16) saadaan

kA−XkF=kQBPT−QΩPTkF

=kQ(B−Ω)PTkF

=kB−ΩkF.

Jaetaan matriisiBsamankokoisiin lohkoihin kuin matriisiΩ, jolloin

B=

MatriisienB11jaB12muodoista nähdään, että matriisilla B11 B12

0 0

!

on kor-keintaan k kappaletta lineaarisesti riippumattomia rivivektoreita. Tällöin Astelauseen 2.3 nojalla matriisin B11 B12

0 0

!

aste on korkeintaank. Lisäksi matriisitQjaPT ovat ortogonaalisina kääntyviä, jolloin Lauseen 3.7 nojalla matriisinY= Q B11 B12

0 0

!

PT aste on myös korkeintaank. Tällöin matriisi

Y∈ MjakB12k2

F>0, jolloin saadaan kA−Yk2

Tämä ei kuitenkaan ole mahdollista, sillä matriisilleXpätee (20) kA−XkF≤ kA−SkF,

kaikilla S ∈ M eli erityisesti myös matriisille Y ∈ M. Siispä täytyy olla B12=

0

.

MatriisienB11 jaB21 muodoista voidaan päätellä, että matriisilla B11

0

B21

0

!

on korkeintaankkappaletta lineaarisesti riippumattomia sarakevektoreita.

Siispä matriisin B11

0

B21

0

!

aste on korkeintaan k. Lisäksi matriisit Q ja PT ovat ortogonaalisina kääntyviä, jolloin Lauseen 3.7 nojalla matriisinC = Q B11

0

Vastaavalla perustelulla kuin kohdassa (20) saadaan, että täytyy ollaB21 =

0

. Nyt siisB12 =

0

jaB21=

0

, joten yhtälöstä (19) saadaan

Näytetään seuraavana, ettäB11= Ωk. Määritellään matriisi Z=Q B11

0

0 0

! PT.

Nyt matriisilla B11

0 0 0

!

on korkeintaankkappaletta lineaarisesti riippumat-tomia sarakevektoreita, joten vastaavasti kuin matriisilleCvoidaan päätel-lä, että matriisinZaste on korkeintaank. TällöinZ∈ Mja saadaan

kA−Zk2

Vastaavalla perustelulla kuin kohdassa (20) nähdään, että ei voi ollakA− Zk2

F < kA−Xk2

F. Siispä täytyy ollakA−Zk2

F = kA−Xk2

F, joten täytyy olla kB11−Ωkk2

Olkoon matriisin B22 singulaariarvohajotelma U1ΛV1T, jossa luvut λ1, . . . , λrk ovat matriisin Λ nollasta poikkeavat diagonaalialkiot. Olkoot lisäksi matriisit

TällöinΛ =UT1B22V1ja matriisit lohkoittain kertomalla saadaan U2T(QTAP)V2=U2TBV2

Nyt tässä matriisitQU2jaPV2ovat ortogonaalisia. Tällöin matriisillaAon Lemman 7.6 muotoa olevat esityksetA=UΣVTjaA=QU2k

0

0

Λ

!

(PV2)T, joten matriisienΣja Ωk

0

0

Λ

!

diagonaalialkioiden neliöt ovat järjestystä lu-kuunottamatta samat. Tällöin voimme arvioida matriisinΛ diagonaalial-kioiden neliöiden summaaλ12+· · ·+λrk2alaspäin matriisinΣpienimpien diagonaalialkioiden neliöiden summalla. Nämä matriisinΣpienimmät dia-gonaalialkiot ovat Lauseen 4.2 mukaanσk+1+· · ·+σr. Tällöin saadaan

kA−XkF=kB22kF

=kΛkF

=(λ12+· · ·+λrk2)1/2

≥(σk+12+· · ·+σr2)1/2.

In document Matriisin singulaariarvohajotelma (sivua 47-55)