Tämän kappaleen laatimisessa on käytetty apuna kirjan [2] kappaletta 6.5.1.
Matriisia voidaan approksimoida pienemmän asteen matriisilla. Ideana on löytää matriisin singulaariarvohajotelman avulla alemman asteen matriisi, joka on lähimpänä alkuperäistä matriisia. Ensin täytyy kuitenkin määritel-lä mitä tämä määritel-lähimpänä oleminen matriisien tapauksessa tarkoittaa. Mää-ritellään siis matriiseille käytettävä normi, jonka suhteen approksimointi tehdään. Matriisin approksimoinnissa käytetään niin sanottua Frobenius normia. Ennen Frobenius normin määrittelyä tarvitsemme kuitenkin mat-riiseille määritetyn sisätulon.
Määritelmä 7.1. OlkootA=[ai j] jaB=[bi j]m×nmatriiseja. Tällöin matriisi sisätuloa merkitäänh·,·ija
hA,Bi= Xm
i=1
Xn
j=1
ai jbi j.
Määritelmä 7.2. Olkoon A = [ai j] m×n matriisi ja h·,·i avaruudenRm×n matriisi sisätulo. Tällöin matriisinFrobenius normiamerkitäänk · kFja
kAkF=(hA,Ai)1/2 =
Xm
i=1
Xn
j=1
ai j2
1/2
.
Frobenius normin määritelmästä huomataan, että kAkF = kATkF, sillä matriisinAtransponointi vaihtaa vain Frobenius normissa olevien alkioi-den summausjärjestystä.
Seuraavan lauseen mukaan alkuperäistä matriisiaApienemmän asteen matriisi X, joka minimoi normin kA−XkF, on aina olemassa. Lause on muotoiltu käyttäen apuna kirjan [2] kappaletta 6.5.
Lause 7.3. Olkoon A m×n matriisi, jonka aste on r ja0 <k<r. Lisäksi olkoon Mkaikkien niiden m×n matriisien joukko, joiden aste on korkeintaan k. Tällöin on olemassa matriisi X∈ M, jolle
kA−XkF≤ kA−SkF, kaikille S∈ M.
Todistus. Tämän lauseen todistus sivuutetaan tässä työssä.
Mikäli kuitenkin oletetaan, että tämä Lauseen 7.3 norminkA−XkF mi-nimoiva matriisiX on olemassa, niin tällöin kyseinen matriisiX voidaan löytää matriisin singulaariarvohajotelman avulla. Ennen tämän tuloksen esittelyä ja todistusta tarvitsemme kaksi Frobenius normiin liittyvää tulos-ta.
Lemma 7.4. Olkoon A m×n matriisi ja Q m×m ortogonaalinen matriisi. Tällöin kQAkF=kAkF.
Todistus. Tämän lemman todistukseen on käytetty apuna kirjan [2] Lauseen 6.5.2 todistusta. Olkoona1,a2, . . . ,anmatriisinAsarakevektorit. MatriisiQ on ortogonaalinen, jolloin Lauseen 1.7 mukaan saadaan
kQAk2
F= Xm
i=1
Xn
j=1
(Qaj)i2
= Xn
j=1
Xm
i=1
(Qaj)i
2
= Xn
j=1
kQajk2
= Xn
j=1
kajk2
= Xm
i=1
Xn
j=1
ai j2
=kAk2
F
Tällöin täytyy olla myöskQAkF=kAkF.
Lemman 7.4 avulla voimme muotoilla matriisin A Frobenius normin käyttäen matriisinAsingulaariarvoja.
Lause 7.5. Olkoon A m×n matriisi, jonka aste on r. Lisäksi olkoon UΣVTmatriisin A singulaariarvohajotelma jaσ1, σ2, . . . , σrsen positiiviset singulaariarvot. Tällöin
kAkF=(σ12+σ22+· · ·+σr2)1/2.
Todistus. Käytämme apuna jo aiemmin Määritelmän 7.2 yhteydessä todet-tua tietoa, jonka mukaan yleisesti matriisinSja sen transpoosinST Frobe-nius normi on sama. Lisäksi matriisinAsingulaariarvohajotelmassa olevat matriisitUjaVT ovat ortogonaalisia, jolloin Lemman 7.4 nojalla
kAkF=kUΣVTkF
=kΣVTkF
=k(ΣVT)TkF
=kVΣTkF
=kΣTkF
=kΣkF
=(σ12+σ22+· · ·+σr2)1/2.
Tarvitsemme vielä yhden apuloksen ennenkuin esittelemme tämän kap-paleen päätuloksen matriisin approksimoinnista. Seuraava aputulos liittyy matriisinAsingulaariarvohajotelmanUΣVTyleiseen muotoon ja siinä esiin-tyvään diagonaalimatriisiinΣ.
Lemma 7.6. Olkoon A m×n matriisi, jolla on esitykset A = UΣVT ja A = SΛYT, joissa matriisit U, V, S ja Y ovat ortogonaalisia, ja matriisitΣjaΛ ovat diagonaalimatriiseja. Tällöin matriisien Σ ja Λ diagonaalialkioiden neliöt ovat järjestystä lukuunottamatta samat.
Todistus. Nyt Lauseen 4.2 todistuksessa olevan yhtälön (10) mukaan esityk-sestäA=UΣVTsaadaan
AAT =U(ΣΣT)UT ja vastaavasti esityksestäA=SΛYT saadaan
AAT =S(ΛΛT)ST.
MatriisiU on ortogonaalisena kääntyvä, joten matriisitAAT ja ΣΣT ovat similaariset. Vastaavasti matriisiSon kääntyvä, joten matriisitAAT jaΛΛT ovat similaariset. Tällöin Lemman 3.4 kohdan (i) nojalla diagonaalimatriisit ΣΣT jaΛΛT ovat similaariset.
Nyt Lemman 3.4 kohdan (iii) nojalla diagonaalimatriiseillaΣΣTjaΛΛT on algebralliset kertaluvut huomioiden samat ominaisarvot. Lemman 3.2 nojalla nämä ominaisarvot ovat diagonaalimatriiseille ΣΣT jaΛΛT niiden diagonaalialkiot. Siispä matriiseillaΣΣT jaΛΛT on järjestystä lukuunotta-matta samat diagonaalialkiot. Lisäksi nämä diagonaalialkiot ovat matriisien ΛjaΣdiagonaalialkioiden neliöt. Siispä matriisienΣjaΛ diagonaalialkioi-den neliöt ovat järjestystä lukuunottamatta samat.
Nyt voimme esitellä ja todistaa tuloksen, jonka mukaan Lauseen 7.3 norminkA−XkFminimoiva matriisi Xvoidaan löytää matriisinA singu-laariarvohajotelman avulla.
Lause 7.7. Olkooon A m×n matriisi, jonka aste on r ja singulaariarvohajotelma UΣVT. Olkoon lisäksiMjoukko, joka sisältää kaikki korkeintaan astetta k olevat m×n matriisit, missä0<k<r. Olkoon A0 =UΣ0VT, missä
ja luvutσ1 ≥ . . .≥ σk > 0ovat ensimmäiset k kappaletta matriisin A singulaa-riarvoja. Tällöin A0 ∈ Mja
kA−A0kF=(σk+12+· · ·+σr2)1/2≤ kA−SkF, kaikille S∈ M.
Todistus. Lauseen todistuksessa on käytetty apuna kirjan [2] Lauseen 6.5.3 todistusta. Näytetään aluksi, että
kA−A0kF=(σk+12+· · ·+σr2)1/2.
Nyt matriisitUjaVovat ortogonaalisia, jolloin Lemman 7.4 nojalla kA−A0kF=kUΣVT−UΣ0VTkF
(16)
=kU(Σ−Σ0)VTkF
=k(Σ−Σ0)VTkF
=k((Σ−Σ0)VT)TkF
=kV(Σ−Σ0)TkF
=k(Σ−Σ0)TkF
=k(Σ−Σ0)kF
=(σk+12+· · ·+σr2)1/2. Lauseen 7.3 mukaan on olemassa matriisiX∈ M, jolle
kA−XkF≤ kA−SkF,
kaikilleS∈ M. MatriisinΣ0diagonaalialkiot ovat matriisinAnollasta poik-keavia singulaariarvoja. Tällöin nähdään, että matriisillaΣ0onkkappaletta lineaarisesti riippumattomia sarakevektoreita, jolloin matriisinΣ0aste onk.
Lisäksi matriisitUjaVTovat ortogonaalisina kääntyviä, jolloin Lauseen 3.7 nojalla matriisinA0 =UΣ0VTaste onk. TällöinA0∈ Mja pätee
(17) kA−XkF≤ kA−A0kF=(σk+12+· · ·+σr2)1/2. Riittää siis näyttää, että
(18) kA−XkF≥(σk+12+· · ·+σr2)1/2.
Tällöin olisi kohtien (17) ja (18) nojallakA−A0kF=kA−XkF, jolloin kA−A0kF=kA−XkF≤ kA−SkF
kaikillaS∈ M, ja lause olisi todistettu.
OlkoonQΩPTmatriisinXsingulaariarvohajotelma, missä
Tässä matriisinXaste on korkeintaank, joten joillakinjvoi ollaωj =0. Mää-ritelläänB=QTAP, jolloinA=QBPT. MatriisitQjaPovat ortogonaalisia, joten vastaavasti kuin kohdassa (16) saadaan
kA−XkF=kQBPT−QΩPTkF
=kQ(B−Ω)PTkF
=kB−ΩkF.
Jaetaan matriisiBsamankokoisiin lohkoihin kuin matriisiΩ, jolloin
B=
MatriisienB11jaB12muodoista nähdään, että matriisilla B11 B12
0 0
!
on kor-keintaan k kappaletta lineaarisesti riippumattomia rivivektoreita. Tällöin Astelauseen 2.3 nojalla matriisin B11 B12
0 0
!
aste on korkeintaank. Lisäksi matriisitQjaPT ovat ortogonaalisina kääntyviä, jolloin Lauseen 3.7 nojalla matriisinY= Q B11 B12
0 0
!
PT aste on myös korkeintaank. Tällöin matriisi
Y∈ MjakB12k2
F>0, jolloin saadaan kA−Yk2
Tämä ei kuitenkaan ole mahdollista, sillä matriisilleXpätee (20) kA−XkF≤ kA−SkF,
kaikilla S ∈ M eli erityisesti myös matriisille Y ∈ M. Siispä täytyy olla B12=
0
.MatriisienB11 jaB21 muodoista voidaan päätellä, että matriisilla B11
0
B21
0
!
on korkeintaankkappaletta lineaarisesti riippumattomia sarakevektoreita.
Siispä matriisin B11
0
B21
0
!
aste on korkeintaan k. Lisäksi matriisit Q ja PT ovat ortogonaalisina kääntyviä, jolloin Lauseen 3.7 nojalla matriisinC = Q B11
0
Vastaavalla perustelulla kuin kohdassa (20) saadaan, että täytyy ollaB21 =
0
. Nyt siisB12 =0
jaB21=0
, joten yhtälöstä (19) saadaanNäytetään seuraavana, ettäB11= Ωk. Määritellään matriisi Z=Q B11
0
0 0
! PT.
Nyt matriisilla B11
0 0 0
!
on korkeintaankkappaletta lineaarisesti riippumat-tomia sarakevektoreita, joten vastaavasti kuin matriisilleCvoidaan päätel-lä, että matriisinZaste on korkeintaank. TällöinZ∈ Mja saadaan
kA−Zk2
Vastaavalla perustelulla kuin kohdassa (20) nähdään, että ei voi ollakA− Zk2
F < kA−Xk2
F. Siispä täytyy ollakA−Zk2
F = kA−Xk2
F, joten täytyy olla kB11−Ωkk2
Olkoon matriisin B22 singulaariarvohajotelma U1ΛV1T, jossa luvut λ1, . . . , λr−k ovat matriisin Λ nollasta poikkeavat diagonaalialkiot. Olkoot lisäksi matriisit
TällöinΛ =UT1B22V1ja matriisit lohkoittain kertomalla saadaan U2T(QTAP)V2=U2TBV2
Nyt tässä matriisitQU2jaPV2ovat ortogonaalisia. Tällöin matriisillaAon Lemman 7.6 muotoa olevat esityksetA=UΣVTjaA=QU2 Ωk
0
0
Λ!
(PV2)T, joten matriisienΣja Ωk
0
0
Λ!
diagonaalialkioiden neliöt ovat järjestystä lu-kuunottamatta samat. Tällöin voimme arvioida matriisinΛ diagonaalial-kioiden neliöiden summaaλ12+· · ·+λr−k2alaspäin matriisinΣpienimpien diagonaalialkioiden neliöiden summalla. Nämä matriisinΣpienimmät dia-gonaalialkiot ovat Lauseen 4.2 mukaanσk+1+· · ·+σr. Tällöin saadaan
kA−XkF=kB22kF
=kΛkF
=(λ12+· · ·+λr−k2)1/2
≥(σk+12+· · ·+σr2)1/2.