Matriisin eksponenttifunktio ja differentiaaliyhtälöryhmät

(1)

Matriisin eksponenttifunktio ja differentiaaliyhtälöryhmät

Petra Maaskola

Matematiikan pro gradu

Jyv¨askyl¨an yliopisto

Matematiikan ja tilastotieteen laitos Kev¨at 2013

(2)

Tiivistelmä:Petra Maaskola,Matriisin eksponenttifunktio ja differentiaaliyhtälöryh- mät (engl.The matrix exponential function and differential equations), matematiikan pro gradu -tutkielma, 45. s., Jyväskylän yliopisto, Matematiikan ja tilastotieteen laitos, kevät 2013.

Tämän tutkielman tarkoituksena on rakentaa tarvittavat tiedot lineaaristen va- kiokertoimisten differentiaaliyhtälöryhmien x⁰(t) = Ax(t) ratkaisemiseen matriisin eksponenttifunktion avulla. Lisäksi tarkastellaan miten matriisinAominaisuudet liit- tyvät differentiaaliyhtälön ratkaisujen ominaisuuksiin.

Matriisin eksponenttifunktio määritellään sarjakehitelmän avulla siten, ettäeÂ= P∞

n=0 1

n!Aⁿ kaikille neliömatriiseille A. Sarjan suppenemista varten tarvitaan matriisinormi, joka saadaan vektorinormin avulla. Koska sarja suppenee, niin määritelmä on hyvin asetettu. Vakiokertoimiseen differentiaaliyhtälöön x⁰(t) = Ax(t) liittyvä al- kuarvotehtävä saadaan, kun annetaan lisäehdoksi ratkaisun lähtöpiste x(t₀) = x₀. Alkuarvotehtävän ratkaisu on yksikäsitteinen ja muotoa x(t) = e^tAx₀. Eksponentti- funktione^tAlaskeminen riippuu matriisinAtyypistä. Jos matriisi on diagonalisoituva, laskeminen on suoraviivaista. Riittää ratkaista matriisin ominaisarvot ja -vektorit. Jos taas matriisiA ei ole diagonalisoituva, tarvitaan sen Jordanin matriisia J_A.

Matriisin A ominaisarvot ja -vektorit ratkaistaan sen karakteristisen polynomin p_A(λ) = det(λI−A) avulla. Jos matriisi A on diagonalisoituva, sen jokaisen ominaisarvon kertaluku yhtälön pA(λ) = 0 juurena on yhtä suuri kuin sitä vastaavien lineaarisesti riippumattomien ominaisvektoreiden lukumäärä. Tällöin matriisin A eksponenttifunktio lasketaan siten, että eÂ = V e^DV⁻¹, missä matriisin D diagonaalilla on matriisin A ominaisarvot ja matriisi V muodostuu matriisin A ominaisvektoreista. Jos matriisi Ataas ei ole diagonalisoituva, sillä ei ole tarpeeksi ominaisvektoreita.

Kun kasvatetaan lineaarisesti riippumattomien vektoreiden määrää sopivasti, saadaan matriisiV. Tällöin ominaisarvosta koostuvan matriisin ja nilpotentin matriisin sum- ma muodostaa Jordanin lohkon J(λ, r). NilpotenttiN on sellainen matriisi, jolle N^k on jostain luvusta k alkaen nolla. Jordanin matriisiJ_Ataas muodostuu Jordanin lohkoista. Nyt matriisiAon similaarinen sen Jordanin matriisin kanssa eliA=V J_AV⁻¹, jolloin matriisin A eksponenttifunktio ratkaistaan yhtälöstä eÂ=V e^JÂV⁻¹.

Differentiaaliyhtälöiden x⁰(t) = Ax(t) ratkaisujen ominaisuudet riippuvat matrii- sinAominaisarvoistaλi. Kun kirjoitetaan ratkaisu ominaisvektorikannassa{x1, . . . , xn}, sen termit ovat muotoa e^tλⁱxi, joten ratkaisukäyrän käyttäytyminen, kun t → ∞, nähdään suoraan ominaisarvojen reaaliosien merkeistä. Differentiaaliyhtälön x⁰(t) = f(x(t)) tasapainopisteeksi kutsutaan pistettä p, jos funktiox(t) =p kaikillat on ratkaisu. Näin on erityisesti silloin, kunf(p) = 0.Differentiaaliyhtälön tasapainopistettä kutsutaan stabiiliksi, jos ratkaisukäyrät ovat rajoitetulla etäisyydellä tasapainopis- teestä. Jos taas kaikki ratkaisut lähestyvät tasapainopistettä, se on asymptoottisesti stabiili. Myös stabiilisuutta voidaan siis tarkastella ominaisarvojen avulla.

Avainsanat: Matriisin eksponenttifunktio, diagonalisoituva, Jordanin matriisi, differentiaaliyht¨al¨o, stabiilisuus.

(3)

Sis¨ alt¨ o

Johdanto 1

Luku 1. Lineaarialgebraa 3

1.1. Vektorin ja matriisin normi 3

1.2. Ominaisarvoteoriaa 7

Luku 2. Matriisin eksponenttifunktio 14

Luku 3. Matriisin eksponenttifunktion laskeminen 18

3.1. Diagonalisoituvan matriisin eksponenttifunktio 18 3.2. Matriisin eksponenttifunktio Jordanin muodon avulla 21

Luku 4. Differentiaaliyhtälöryhmät 26

4.1. Perusk¨asitteit¨a 26

4.2. Lineaarinen vakiokertoiminen differentiaaliyhtälö 28 Luku 5. Differentiaaliyhtälöryhmien tasapainopisteiden stabiilisuus 40

Liite A. Merkint¨oj¨a 44

Kirjallisuutta 45

ii

(4)

Monia fysiikan, kemian, biologian ja muiden alojen ongelmia voidaan käsitellä ma- temaattisilla malleilla, jotka sisältävät lineaarisia vakiokertoimisia differentiaaliyhtä- löryhmiä

x⁰(t) = Ax(t).

Näitä yhtälöitä ratkaistaan matriisin eksponenttifunktion avulla. Tämän kirjoitelman tavoitteena onkin määritellä matriisin eksponenttifunktio ja differentiaaliyhtälöiden ratkaiseminen sen avulla. Lisäksi tarkastellaan miten matriisin A ominaisuudet liit- tyvät differentiaaliyhtälön ratkaisujen ominaisuuksiin.

Lukijan oletetaan tuntevan lineaarialgebran perusteet, kuten yleisimmät laskusään- nöt vektoreille ja matriiseille, sekä yleisen eksponenttifunktion määritelmän sarjake- hitelmän avulla. Lisäksi differentiaaliyhtälöiden perusteet oletetaan tunnetuiksi. Eri- tyisesti luvuissa 1 ja 4.1 tulee kuitenkin myös kertausta näistä asioista, jotta kirjoi- telmassa tarvittavat lähtötiedot muistuvat lukijan mieleen.

Matriisin eksponenttifunktio määritellään sarjakehitelmän avulla siten, että eÂ =

∞

X

n=0

1 n!Aⁿ

kaikille neliömatriiseille A. Sarjan suppenemista varten tarvitaan matriisinormi, joka saadaan vektorinormin avulla. Koska sarja suppenee, niin määritelmä on hyvin asetettu. Vakiokertoimiseen differentiaaliyhtälöönx⁰(t) =Ax(t) liittyvä alkuarvotehtävä saadaan, kun annetaan lisäehdoksi ratkaisun lähtöpistex(t₀) = x₀. Alkuarvotehtävän ratkaisu on yksikäsitteinen ja muotoa

x(t) =e^tAx₀.

Eksponenttifunktion e^tA laskeminen riippuu matriisin A tyypistä. Jos se on diagonalisoituva, laskeminen on suoraviivaista. Riittää ratkaista matriisin ominaisarvot ja -vektorit. Jos taas matriisiA ei ole diagonalisoituva, tarvitaan sen Jordanin matriisia J_A.

MatriisinA ominaisarvot ja -vektorit ratkaistaan sen karakteristisen polynomin pA(λ) = det(λI −A)

avulla. Jos matriisi Aon diagonalisoituva, sen jokaisen ominaisarvon kertaluku yhtä- lönp_A(λ) = 0 juurena on yhtä suuri kuin sitä vastaavien lineaarisesti riippumattomien

1

(5)

JOHDANTO 2

ominaisvektoreiden lukumäärä. Tällöin matriisin A eksponenttifunktio lasketaan siten, että

e^A=V e^DV⁻¹,

missä matriisin Ddiagonaalilla on matriisinAominaisarvot ja matriisi V muodostuu matriisin Aominaisvektoreista. Jos matriisi Ataas ei ole diagonalisoituva, sillä ei ole tarpeeksi ominaisvektoreita. Kun kasvatetaan lineaarisesti riippumattomien vektoreiden määrää sopivasti, saadaan matriisiV. Tällöin ominaisarvoista koostuvan matriisin ja nilpotentin matriisinN summasta voidaan muodostaa Jordanin lohkojaJ(λ, r).

Nilpotentti N on sellainen matriisi, jolle N^k on jostain luvustak alkaen nolla. Jorda- nin matriisi J_A taas muodostuu Jordanin lohkoista. Nyt matriisi A on similaarinen sen Jordanin matriisin kanssa eliA=V J_AV⁻¹,jolloin matriisinAeksponenttifunktio ratkaistaan seuraavasti:

e^A=V e^J^AV⁻¹.

Differentiaaliyhtälöiden x⁰(t) = Ax(t) ratkaisujen ominaisuudet riippuvat matrii- sinAominaisarvoistaλi. Kun kirjoitetaan ratkaisu ominaisvektorikannassa{x1, . . . , xn}, sen termit ovat muotoa e^tλⁱxi, joten ratkaisukäyrän käyttäytyminen, kun t → ∞, nähdään suoraan ominaisarvojen reaaliosien merkeistä. Differentiaaliyhtälön x⁰(t) = f(x(t)) tasapainopisteeksi kutsutaan pistettä p, jos funktio

x(t) =p

on ratkaisu kaikilla t. Näin on erityisesti silloin, kun f(p) = 0. Origo on aina diffe- rentiaaliyhtälönx⁰(t) =Ax(t) tasapainopiste. Differentiaaliyhtälön tasapainopistettä kutsutaan stabiiliksi, jos ratkaisukäyrät ovat rajoitetulla etäisyydellä tasapainopis- teestä. Jos taas kaikki ratkaisut lähestyvät tasapainopistettä, se on asymptoottisesti stabiili. Myös stabiilisuutta voidaan siis tarkastella ominaisarvojen avulla.

Kirjoitelman ensimmäisessä luvussa käsitellään välttämättömät lineaarialgebran tiedot, joihin kuuluvat matriisin normin käsite sekä ominaisarvoteoriaa. Toisessa luvussa annetaan matriisin eksponenttifunktion määritelmä ja näytetään, että se on hyvin asetettu. Luvussa 3 tarkastellaan miten eksponenttifunktio lasketaan diagonalisoituville ja ei-diagonalisoituville matriiseille. Luvussa 4 määritellään differentiaa- liyhtälöryhmät ja päästään ratkaisemaan niitä matriisin eksponenttifunktion avulla.

Viimeisessä luvussa 5 käsitellään vielä differentiaaliyhtälöiden tasapainopisteiden stabiilisuutta.

Työ perustuu pääosin lähteisiin [2], [3] ja [4]. Muita esityksiä aiheesta löytyy esimerkiksi lähteistä [8], [9] ja [10]. Kirjassa [1] ja luentomateriaalissa [5] on asiaa käsitelty pidemmälle. Lineaarialgebran perustiedot löytyvät lähteistä [6] ja [7].

(6)

Lineaarialgebraa

1.1. Vektorin ja matriisin normi

Vektoriavaruudessa on määritelty yhteenlasku ja skalaarilla kertominen sekä myös muita laskutoimituksia, kuten vektoreiden pituuksien laskeminen. Oletetaan yleisim- mät vektoriavaruuden laskutoimitukset tunnetuiksi. Normiavaruus on vektoriavaruus, jossa on määritelty jokin vektorin pituusfunktio eli normi. Sisätulolla varustettua vektoriavaruutta taas kutsutaan sisätuloavaruudeksi ja sisätulon avulla voidaan myös määritellä normi sekä lisäksi vektorien välisiä kulmia. Annetaan seuraavaksi tarkempi määritelmä normille.

Määritelmä 1.1. Olkoon V K-kertoiminen vektoriavaruus, missäKonRtai C. Kuvaus k · k :V 7→R on normi, jos se toteuttaa

(i) kv k ≥0 kaikilla v ∈V. (ii) kv k= 0 ⇒ v = 0.

(iii) kv +uk ≤ kv k+kuk kaikilla v, u∈V. (iv) kαv k=|α |kv k kaikilla α∈K, v ∈V.

Tunnetuin vektoriavaruuden normi esitellään seuraavassa esimerkissä.

Esimerkki 1.2. Euklidinen normi vektoriavaruudessaRⁿ on kxk₂=

n

X

i=1

|x_i |²

!¹₂

= (x|x)¹²,

missä (x | x) on vektorin x sisätulo itsensä kanssa. Vektorin x normi toteuttaa sel- västi normille määritelmässä 1.1 määritetyt ehdot (i), (ii) ja (iv). Myös ehto (iii) eli vektorinormin kolmioepäyhtälö toteutuu, sillä sisätulon ominaisuuksien ja Cauchyn- Schwarzin epäyhtälön|(x|y)| ≤ kxkky knojalla

kx+yk²= (x+y|x+y) = (x|x) + (x|y) + (y|x) + (y |y)

= kxk² +2|(x|y)|+ky k²

≤ kxk² +2kxkkyk+kyk²= (kxk+kyk)², joten

kx+yk ≤ kxk+ky k kaikilla x, y ∈V.

Yleisimpiin vektorinormeihin kuuluu my¨os esimerkiksi niin sanottu ykk¨osnormi ja

ääretön-normi eli

kxk₁=

n

X

i=1

|x₁ | ja kxk∞= max

1≤i≤n|x_i |.

3

(7)

1.1. VEKTORIN JA MATRIISIN NORMI 4

Normiavaruudessa voidaan siis mitata vektoreiden pituuksia. Normin avulla voidaan määrittää myös alkioiden välinen etäisyys, joka on

d(v, u) =kv−uk.

Siten voidaan määrittää vektorijonojen suppeneminen seuraavasti: Vektorijono (x_i)^∞_i=1 suppenee kohti vektoria x, jos

i→∞lim kx_i−xk= 0.

Nyt kun tunnetaan vektorijonojen ominaisuuksia, niin jatkossa pystytään niiden avulla määrittämään matriisijonojen ja -normien ominaisuuksia.

Määritetään seuraavaksi siis matriisinormi. Olkoon k · k jokin vektorinormi. Mi- tataan matriisin kokoa sillä, kuinka pitkiksi vektoreiksi yksikkövektorit kuvautuvat matriisilla kerrottaessa. Näin ollen matriisilleA ∈R^m×n asetetaan

(1.1) kAk= max

kxk=1kAxk

Kuva 1.1. Yksikk¨ovektorin kuvautuminen matriisilla kerrottaessa

Näytetään, että myös matriisinormi toteuttaa normille asetetut neljä ehtoa mää- ritelmän 1.1 antamien vektorinormin ominaisuuksien avulla:

(i) Selv¨asti

kAk= max

kxk=1kAxk ≥0 kaikilla A∈R^m×n.

(ii) JosA6= 0, niin sill¨a on olemassa elementti a_ij 6= 0. Valitaan x=e_j, jolloin

Ax=



 a_ij

... a_mj



6= 0 ja kA k ≥ kAx k>0.

Siten joskAk= 0,niin A = 0 kaikillaA∈R^m×n.

(8)

(iii) Matriisinormin määritelmän perusteella kA+B k= max

kxk=1k(A+B)xk= max

kxk=1kAx+Bxk

≤max

kxk=1(kAxk+kBxk)

≤max

kxk=1kAxk+ max

kxk=1kBxk=kAk+kB k, missä käytettiin vektorinormin kolmioepäyhtälöä.

(iv) Edelleen matriisinormin määritelmän ja määritelmän 1.1 kohdan (iv) perusteella

kαAk= max

kxk=1kαAxk= max

kxk=1|α|kAxk=|α|kAk.

Matriisinormi siis toteuttaa normille asetetut ehdot ja sillä on vastaavat ominaisuudet kuin vektorinormilla. Näytetään matriisinormille lemman muodossa vielä kaksi hyödyllistä ominaisuutta. Ensimmäinen kertoo, että vektori- ja matriisinormi ovat yhteensopivat.

Lemma 1.3. Matriisinormille p¨atee (i) kAx k ≤ kA kkxk

(ii) kAB k ≤ kAkkB k

kaikilla matriiseilla A ja B sek¨a vektoreilla x∈Rⁿ.

Todistus. (i) Olkoon y = _kxk^x , kun x 6= 0. T¨all¨oin k y k= _kxk¹ k x k= 1, joten

kAk ≥ kAyk= kAx k kxk , ja saadaan

kAxk ≤ kAkkxk. Kun x= 0, niin

kAxk= 0 =kAkkxk, joten v¨aite on selv¨a.

(ii) Käyttämällä kohtaa (i) ja matriisinormin määritelmää saadaan kABk= max

kxk=1k(AB)xk= max

kxk=1kA(Bx)k

≤max

kxk=1kAkkBxk=kAk max

kxk=1kBxk

= kAkkB k, joten v¨aite p¨atee.

Tarkastellaan seuraavaksi normia k A k=k (a_ij) k. Varustetaan siis reaalisten n×n -matriisien vektoriavaruus M_n my¨os normilla

(1.2) kAk=k(a_ij)k= max

1≤i,j≤n|a_ij |.

(9)

1.1. VEKTORIN JA MATRIISIN NORMI 6

Normit kAk= max_kxk=1 kAxk ja kA k= max_1≤i,j≤n |a_ij | eivät aina ole yhtä- suuria matriisille A, mutta ne ovat kuitenkin ekvivalentteja keskenään. Todistetaan se seuraavaksi.

Lause 1.4. Normit

kAk_a= max

kxk=1kAxk ja kA k_b= max

1≤i,j≤n|a_ij |

ovat ekvivalentteja eli on olemassa positiiviset reaaliluvut c₁ ja c₂ siten, ett¨a c₁ kAk_a≤ kAk_b≤c₂ kAk_a

kaikilla matriiseilla A∈R^m×n.

Todistus. Todistetaan ensin ensimmäinen epäyhtälö: Olkoon x mielivaltainen vektori, jolle k x k= 1. Tällöin vektorin Ax j:nnen alkion neliötä voidaan arvioida seuraavasti:

(Ax)²_j =

n

X

i=1

a_jix_i

!2

≤ max

1≤i,j≤n|a_ij |²

n

X

i=1

1·x_i

!2

≤ max





n

X

i=1

1²

!¹₂ _n X

i=1

x²_i

!¹₂



2

= max

n¹² ·1¹²2

=n max

1≤i,j≤n|a_ij |²,

missä käytettiin Cauchyn-Schwarzin epäyhtälöä. Nyt kun j = 1, . . . , n, niin edellisen nojalla

kAxk²=

n

X

j=1

(Ax)²_j ≤n² max

1≤i,j≤n|a_ij | ja väite seuraa tästä, kun valitaan c₁ = _n¹.

Todistetaan vielä jälkimmäinen epäyhtälö:

|a_ij |²¹₂

≤

n

X

j=1

|a_ij |²

!¹₂

=kAe_j k ≤ kAkke_j k=kAk. Tämä pätee mille tahansa matriisin A alkiolle, joten

1≤i,j≤nmax |a_ij | ≤ max

kxk=1kAxk

eli v¨aite p¨atee vakiolla c₂ = 1.

Annetaan nyt määritelmä matriisijonojen suppenemiselle.

(10)

Määritelmä 1.5. Matriisijono (A_i)^∞_i=1 suppenee kohti matriisia A, jos pätee:

i→∞lim kA_i−Ak= 0.

Näytetään seuraavaksi, että lauseen 1.4 ekvivalenteilla normeilla on samat suppe- nevat jonot eli kunAi →A, niin kAi−Ak →0.

Oletetaan ensin, ett¨a

kAk_a= max

kxk=1kAxk. T¨all¨oin A_ix→Ax ja

kA_ix−Axk= k(A_i−A)xk=kxk

(A_i−A) x kxk

≤ kxkkA_i−Ak →0.

Kun taas

kAkb= max

1≤i,j≤n|aij |, niin nyt lauseen 1.4 nojalla

ckAi−Akb≤ kAi−Aka→0,

ja sitenkA_i−Ak_b→0.Näin ollen jono suppenee molempien normien mielessä, joten voidaan tilanteen mukaan käyttää kumpaa tahansa normia.

Näytetään matriisinormille vielä seuraava ominaisuus, jota tullaan tarvitsemaan myöhemmin matriisin eksponenttifunktiota laskettaessa.

Lemma 1.6. Jos

i→∞lim kAi−Ak= 0, niin

i→∞lim kCAiC⁻¹−CAC⁻¹ k= 0.

Todistus. Koska matriiseille A ja B p¨atee k AB k ≤ k A kk B k, niin voidaan kirjoittaa

kCA_iC⁻¹−CAC⁻¹ k= kC(A_iC⁻¹−AC⁻¹)k=kC(A_i−A)C⁻¹ k

≤ kC kkA_i−AkkC⁻¹ k →0,

kun i→ ∞eli v¨aite p¨atee.

1.2. Ominaisarvoteoriaa

Tarkastellaan ominaisarvoja ja -vektoreita, joita tullaan myöhemmin tarvitsemaan matriisin diagonalisoinnissa sekä Jordanin muodon määrittämisessä.

Määritelmä 1.7. Olkoon V K-kertoiminen lineaariavaruus jaL sen lineaarikuvaus siten, että L : V → V, missä K on R tai C. Tällöin, jos on olemassa λ ∈K ja vektori v ∈V\{0} siten, että

(1.3) Lv =λv,

(11)

1.2. OMINAISARVOTEORIAA 8

niin λ on kuvauksen L ominaisarvo ja vektori v on sit¨a vastaava kuvauksen L ominaisvektori. Ominaisarvoonλ liittyv¨at ominaisvektorit taas muodostavat nollan kanssa ominaisavaruuden

E_L(λ) ={v ∈V |Lv =λv}.

Esimerkki 1.8. Olkoon matriisi A=

1 4 2 3

ja vektoriv = 1 1T

.Tällöin lineaarikuvaukselleL_A :R² →R² :L_Ax=Axvoidaan kirjoittaa yhtälö:

LAv = 1 4

2 3 1 1

= 5

5

= 5 1

1

= 5v,

joten vektori v on kuvauksen L_A ominaisvektori ja 5 sit¨a vastaava ominaisarvo.

Neliömatriisin A ∈ K^n×n ominaisarvoilla ja -vektoreilla tarkoitetaan kuvauksen, jossa kerrotaan matriisilla A eli L_A : Kⁿ → Kⁿ : L_Ax = Ax, ominaisarvoja ja - vektoreita. Täten lineaarikuvauksen L_A ominaisarvoyhtälö (1.3) voidaan kirjoittaa muodossa

Av =λv eli

(λI−A)v = 0.

Tällä on ratkaisuja v 6= 0 täsmälleen silloin, kun

(1.4) det(λI −A) = 0.

Näin ollen matriisinAominaisarvot saadaan ratkaistua yhtälön (1.4) avulla ja voidaan antaa seuraava määritelmä.

Määritelmä 1.9. Matriisin A ominaisarvot λ ovat karakteristisen polynomin p_A(λ) = det(λI −A)

nollakohtia.

Algebran peruslauseen nojalla n-asteisella polynomilla on kertaluvut mukaan lu- kien n kompleksista juurta, joten n×n-matriisilla on n ominaisarvoa, joista osa voi siis olla moninkertaisia. Sanotaan, että jos matriisin A ominaisarvo λ on matriisin A karakteristisen polynomin k-kertainen juuri, niin m_a(λ) = k on ominaisarvon λ algebrallinen kertaluku. Ominaisarvon λ geometrinen kertaluku m_g(λ) on ominaisar- voonλ liittyvien lineaarisesti riippumattomien ominaisvektoreiden lukumäärä eli sen ominaisavaruuden dimensio, joista lisää myöhemmin tässä luvussa.

1 3

−3 1

.

Määritetään karakteristisen polynomin p_A(λ) = det(λI −A) nollakohdat.

pA(λ) = det(λI −A) =

λ−1 −3 3 λ−1

= (λ−1)²−3·(−3)

=λ² −2λ+ 10 = 0,

(12)

joten

λ= 2±√

−36

2 = 1±3i.

Siis matriisin A ominaisarvot ovat λ₁ = 1−3i ja λ₂ = 1 + 3i. Määritetään vielä ominaisarvoja λ₁ ja λ₂ vastaavat ominaisvektorit.

λ₁ =1−3i:

A−λ₁I|0

=

3i 3 |0

−3 3i |0

−→

i 1 |0

−1 i |0

⇒v₁ =(1,−i) λ₂ =1 + 3i:

A−λ₂I|0

=

−3i 3 |0

−3 −3i |0

−→

i −1 |0 1 i |0

⇒v₂ =(1, i).

Huomataan, että reaalisen matriisin Akompleksiset ominaisarvot λ esiintyvät aina konjugaattipareina eli λ_1,2 =α±βija siten myös ominaisvektorit ovat konjugaat- tipareja.





−1 0 2

0 1 0

2 0 −1



.

Matriisilla A on siis kertaluvut huomioonottaen kolme ominaisarvoa, jotka voidaan selvitt¨a¨a seuraavasti:

p_A(λ) = det(λI−A) =

λ+ 1 0 −2

0 λ−1 0

−2 0 λ+ 1

= (λ−1)

λ+ 1 −2

−2 λ+ 1

=(λ−1)(λ²+ 2λ−3) = (λ−1)(λ−1)(λ+ 3) = 0,

kunλ =−3 taiλ= 1. MatriisillaAon siis ominaisarvoλ₁ =−3 ja kahden kertaluvun ominaisarvo λ₂ = 1. Ratkaistaan viel¨a vastaavat ominaisvektorit:

λ₁ =−3 :

A−λ₁I|0

=





2 0 2 |0 0 4 0 |0 2 0 2 |0



−→





1 0 1 |0 0 1 0 |0 1 0 1 |0





⇒v₁ =(1,0,−1) λ2 =1 :

A−λ₂I|0

=





−2 0 2 |0 0 0 0 |0 2 0 −2 |0



−→





−1 0 1 |0 0 0 0 |0 1 0 −1 |0





⇒v2,1 =(1,0,1), v2,2 = (0,1,0).

Tarkastellaan seuraavaksi muun muassa vektorien lineaarista riippumattomuut- ta, vektoriavaruuden kantoja ja matriisien similaarimuunnoksia, jotta myöhemmin voidaan määritellä diagonalisoituvat matriisit.

Määritelmä 1.12. Vektoriavaruuden V epätyhjä osajoukko S = {v₁, . . . , v_n} on lineaarisesti riippumaton, jos nollavektori voidaan voidaan esittää näiden lineaa- rikombinaationa vain siten, että kaikki kertoimet ovat nollia, eli jos ehdosta

(1.5) c₁v₁+c₂v₂+· · ·+c_nv_n= 0

(13)

seuraa, että c₁ = c₂ = · · · = c_n = 0. Muulloin, eli jos on muitakin ratkaisuja, jouk- koa S kutsutaan lineaarisesti riippuvaksi. Silloin joukon S vektorien välillä on siis keskinäistä riippuvuutta ja jokin vektori voidaan esittää muiden vektoreiden line- aarikombinaationa. Vektorin v lineaarikombinaation c_i-kertoimia kutsutaan vektorin koordinaateiksi.

Yht¨al¨o (1.5) voidaan kirjoittaa matriisimuotoon

(1.6) Ac= 0,

miss¨a A =

v1 v2 . . . vn

, eli vektorit v_k muodostavat matriisin A sarakkeet ja c = (c₁, . . . , c_n). Jokainen äärellinen lineaarikuvaus L : U → V voidaankin esittää matriisin avulla, kunhan avaruuksiinU jaV on kiinnitetty kannat. Lineaarikuvauksen L matriisiesitys riippuu siten valituista kannoista, jotka määritellään seuraavaksi.

Määritelmä1.13. VektoriavaruudenV äärellistä osajoukkoaB ={b₁, b₂, . . . , b_n} kutsutaan avaruuden V kannaksi, jos se on lineaarisesti riippumaton ja virittää koko vektoriavaruuden V.

Jokaisella vektoriavaruudella V on kanta ja jokaisella avaruuden V kannalla on sama määrä vektoreita. Vektoriavaruuden V dimensio dim(V) on avaruuden V kantavektoreiden lukumäärä. Tästä seuraa, että jos dim(V) = nja S ={v₁, . . . , v_n} ⊂V on lineaarisesti riippumaton joukko, niin S on avaruuden V kanta. Rⁿ:n luonnolli- seksi kannaksi kutsutaan vektorijoukkoa E_n = {e₁, e₂, . . . , e_n}, missä vektori e_i on sellainen, jossa i:nnes alkio on 1 ja muut nollia.

Esimerkki 1.14. Joukko {1, x, x², . . . , xⁿ} on polynomiavaruuden Pⁿ kanta, joten dim(Pⁿ) = n+ 1. Vastaavasti m×n-matriisien muodostaman vektoriavaruuden dimensio on dim(R^m×n) = mn, koska kannaksi käy joukko matriiseja, joista jokaisella on yksi, mutta eri alkio ykkönen ja loput nollia. Näin ollen kannan matriisien lukumääräksi tuleemn.

Määritellään seuraavaksi vektorin kannanvaihto. Halutaan vaihtaa vektorin v esitys kannasta B = {b₁, b₂, . . . , b_n} kantaan U = {u₁, u₂, . . . , u_n} ja selvitetään miten uudet koordinaatit voidaan lausua vanhojen avulla. Merkitään vektorinv koordinaatteja näissä kannoissa

[v]_B = (β₁, . . . , β_n) ja [v]_U = (η₁, . . . , η_n).

Oletetaan, ett¨a vanhat kantavektorit b_j voidaan lausua uusien kantavektoreiden u_i avulla seuraavasti:

b_j =

n

X

i=1

s_iju_i, j = 1, . . . , n.

T¨all¨oin saadaan v =

n

X

i=1

ηiui =

n

X

j=1

βjbj =

n

X

j=1

βj n

X

i=1

sijui =

n

X

i=1 n

X

j=1

sijβj

! ui, joten on oltava

(1.7) ηi =

n

X

j=1

sijβj, i= 1, . . . , n.

(14)

Merkit¨a¨an

S_(B,U) =





s₁₁ . . . s_1n ... ... s_n1 · · · s_nn



.

Tällöin koordinaattien välinen yhtälö (1.7) voidaan kirjoittaa muodossa

(1.8) [v]_U =S_(B,U₎[v]_B.

Siis uudet koordinaatit saadaan kertomalla vanhat matriisillaS_(B,U). MatriisiaS kutsutaan kannanvaihtomatriisiksi.

Esimerkki 1.15. Olkoon kannat B ={v₁, v₂} ja E = {e₁, e₂} ja merkitään vektorin x koordinaatteja näissä kannoissa

[x]_B = (α₁, α₂) ja [x]_E = (β₁, β₂).

Oletetaan, ett¨a vanhat kantavektorit x_j voidaan lausua uusien kantavektoreiden e_i avulla seuraavasti:

v_j =

2

X

i=1

s_ije_i, j = 1,2, joten

β_i =

2

X

j=1

s_ijα_j, i= 1,2.

T¨all¨oin vektorin x esitys voidaan kirjoittaa seuraavasti:

x=α1v1+α2v2 =α1(s11e1 +s21e2) +α2(s12e1+s22e2)

=(s₁₁α₁+s₁₂α₂)e₁+ (s₂₁α₁+s₂₂α₂)e₂, joten

[x]_E =

s₁₁ s₁₂ s₂₁ s₂₂

[x]_B. Merkit¨a¨an

S_(B,E) =

s₁₁ s₁₂ s₂₁ s₂₂

ja se on siis vektorin x kannanvaihtomatriisi kannasta B kantaan E.

Kuva 1.2. Vektorin x kannanvaihto

(15)

Nyt on määritelty kannanvaihto ja kannanvaihtomatriisi, niin voidaan muodostaa seuraava tärkeä tulos. Olkoon avaruuksillaU jaV kannatB_U jaB_V sekä uudet kannat Bˆ_U ja ˆB_V. Lisäksi, olkoonS jaRkannanvaihtomatriisit, joten kaikilleu∈U jav ∈V pätee

(1.9) [u]Bˆ_U =S[u]_B_U ja [v]Bˆ_V =R[v]_B_V.

Tällöin [u]_B_U =S⁻¹[u]BÛ ja [v]_B_V =S⁻¹[v]BˆV. Oletetaan vielä, että A= [T]_B_U_,B_V on lineaarikuvauksen T : U →V matriisi kantojen B_U ja B_V suhteen, joten vektorin u lineaarikuvaus T(u) kannassaB_V on vektoriu kannassa B_U kerrottuna matriisilla A eli

[T(u)]B_U =A[u]B_U kaikilla u∈U.

Kun käytetään yhtälöitä (1.9), niin saadaan

(1.10) [T(u)]BˆV =R[T(u)]_B_V =R(A[u]_B_U) = R(A(S⁻¹[u]BˆV)) = (RAS⁻¹)[u]BˆV. Siis lineaarikuvauksen T matriisi ˆA uusissa kannoissa voidaan kirjoittaa muodossa

Aˆ= [T]BˆU,BˆV =RAS⁻¹.

Erityisesti, jos U = V, B_U = B_V ja ˆB_U = ˆB_V, niin S = R ja lineaarikuvauksen T matriisi ˆA uudessas kannassa ˆB_U = ˆB_V voidaan kirjoittaa muodossa

Aˆ=SAS⁻¹.

Matriisia Â kutsutaan matriisin A similaarimuunnokseksi. Annetaan seuraava mää- ritelmä.

Määritelmä 1.16. Neliömatriisi A on similaarinen matriisin B kanssa, jos on olemassa säännöllinen matriisi S siten, että B = SAS⁻¹. Muotoa SAS⁻¹ olevaa matriisia kutsutaan matriisin A similaarimuunnokseksi.

Kesken¨a¨an similaarisilla matriiseilla on muun muassa seuraava ominaisuus.

Lause 1.17. Keskenään similaarisilla matriiseilla on sama karakteristinen poly- nomi ja siten myös samat ominaisarvot samoine algebrallisine kertalukuineen.

Todistus. Olkoon matriisitAjaBsimilaarisia keskenään eliB =SAS⁻¹ jollekin kääntyvälle matriisille S. Tällöin

λI−B =λSIS⁻¹−SAS⁻¹ =S(λI −A)S⁻¹, joten

det(λI −B) = det(S) det(λI −A) det(S⁻¹) = det(S) det(λI −A)(det(S))⁻¹

= det(λI −A),

eli matriisien A ja B karakteristiset polynomit pA(λ) = pB(λ) ovat samat ja niill¨a on siten samat polynominpA(λ) juuret eli samat ominaisarvot samoine algebrallisine

kertalukuineen.

(16)

Olkoon matriisilla A ∈ K^n×n ominaisarvot λ₁, . . . , λ_n ja näitä vastaavat ominaisvektorit x₁, . . . , x_n. Muodostetaan matriisi X = [x₁. . . x_n]. Tällöin saadaan

AX = [Ax₁. . . Ax_n] = [λ₁x₁. . . λ_nx_n] = [x₁. . . x_n]



 λ₁

. ..

λ_n



=XΛ, miss¨a

Λ =



 λ₁

. ..

λn



.

Jos nyt ominaisvektorit x₁, . . . , x_n ovat lineaarisesti riippumattomia, niin saadaan A=AXX⁻¹ =XΛX⁻¹.

Matriisi A on siis similaarinen diagonaalimatriisin Λ kanssa. Matriisia A kutsutaan siten diagonalisoituvaksi. Voidaan siis päätellä, että jos A = SDS⁻¹, missä D on diagonaalimatriisi, niin sen diagonaalilla on matriisin A ominaisarvot ja matriisin S sarakkeet ovat matriisin A ominaisvektoreita. Lisäksi nämä ominaisvektorit muodostavat kannan. Tilannetta, jossa matriisin A ominaisvektoreista ei voi muodostaa kantaa, käsitellään myöhemmin.

(17)

LUKU 2

Matriisin eksponenttifunktio

Neliömatriiseja A ∈ M_n voidaan korottaa potenssiin ja niitä voidaan laskea yh- teen. Näin neliömatriisille on mahdollista muodostaa sarjakehitelmä. Eksponentti- funktio on tunnetusti eräs sarjakehitelmä. Nyt voidaan siis määritellä neliömatriisin eksponenttifunktio.

Määritelmä 2.1. Matriisien eksponenttifunktio on exp :M_n →M_n, eÂ=

∞

X

k=0

1 k!A^k kaikille neli¨omatriiseilleA∈M_n.

Näytetään seuraavan lauseen avulla, että määritelmä 2.1 on hyvin asetettu.

Lause 2.2. Sarja P∞ k=0

A^k

k! suppenee kaikille neliömatriiseille A∈M_n. Todistus. Olkoon a^k_ij matriisin A^k -kerroin. Tällöin

|a²_ij |=|

n

X

k=1

a_ika_kj | ≤n(max|a_ij |)² =n kA k²

ja näytetään induktiolla, että | a^N_ij | ≤ n^N−1 k A k^N . Alkuaskel, jossa k = 1, pätee, sillä

|a¹_ij | ≤n⁰ max

1≤i,j≤n|a_ij |=n¹⁻¹ kAk¹ .

Oletetaan nyt, että väite pätee, kun k = N ja osoitetaan, että väite pätee, kun k =N + 1:

|a^N+1_ij |=|

n

X

k=1

a^N_ika_kj | ≤n^N kAk^N⁺¹=n^(N+1)−1 kAk^N+1 . Siis väite pätee induktion nojalla. Nyt voidaan muodostaa epäyhtälö:

|a^N_ij |

N! ≤ n^N−1 kAk^N

N! ≤ n^N kAk^N

N! = (nkAk)^N N! , ja koska sarja P∞

k=1

(nkAk)^N

N! suppenee reaalisena eksponenttifunktiona, niin Weier- strassin M-testin nojalla sarja P∞

k=0 A^k

k! suppenee alkioittain tasaisesti.

Matriisin eksponenttifunktion sarjakehitelmä on siis suppeneva. Eksponenttifunk- tioneÂlaskemista yleiselle neliömatriisilleAkäsitellään luvussa 3, mutta tarkastellaan ensin kuitenkin muutamaa erikoistapausta esimerkkien avulla.

14

(18)

Esimerkki 2.3. Olkoon D = diag(d₁, d₂, . . . , d_n) diagonaalimatriisi, jolloin sen potenssit ovat D^k= diag(d^k₁, d^k₂, . . . , d^k_n). Tällöin määritelmän 2.1 nojalla matriisin D eksponenttifunktio on

e^D =

∞

X

k=0

D^k

k! = diag

∞

X

k=0

d^k₁ k!, . . . ,

∞

X

k=0

d^k_n k!

!

= diag e^d¹, . . . , e^dⁿ

=



 e^d¹

. ..

e^dⁿ



. Esimerkki 2.4. Olkoon

A =

0 α

−α 0

. T¨all¨oin

A² =

0 α

−α 0

0 α

−α 0

=

−α² 0 0 −α²

=−α²I₂, A³ =

−α² 0 0 −α²

0 α

−α 0

=

0 −α³ α³ 0

=−α²A, A⁴ =

0 −α³ α³ 0

0 α

−α 0

=

α⁴ 0 0 α⁴

=α⁴I₂, A⁵ =

α⁴ 0 0 α⁴

0 α

−α 0

=

0 α⁵

−α⁵ 0

=α⁴A, A⁶ =−α⁶I₂,

A⁷ =−α⁶A, . . .

Induktion ja sini- ja kosinifunktioiden sarjakehitelmien nojalla saadaan nyt seu- raavaa:

e^A=

∞

X

i=0

Aⁱ i! =

−^α_2!² + ^α_4!⁴ − ^α_6!⁶ +. . . _1!^α −^α_3!³ +^α_5!⁵ −. . .

−^α_1!+ ^α_3!³ − ^α_5!⁵ +. . . −^α_2!² +^α_4!⁴ −^α_6!⁶ +. . .

=

" P∞ k=0

(−1)^kα^2k (2k)!

P∞ k=0

(−1)^kα^(2k+1) (2k+1)!

−P∞ k=0

(−1)^kα^(2k+1) (2k+1)!

P∞ k=0

(−1)^kα^2k (2k)!

#

=

cosα sinα

−sinα cosα

.

Seuraavaksi määritellään nilpotentti matriisi, sillä sitä tullaan käyttämään myö- hemmin käsiteltäessä matriisin Jordanin muotoa. MatriisiaN sanotaan nilpotentiksi, josN^l = 0, jollekinl ≥0. Selvästi tällöin myös kaikki korkeammat potenssit ovat nollia. Määritelmän 2.1 nojalla voidaan siis muodostaa nilpotentinN eksponenttifunktio seuraavasti:

e^N =

l−1

X

k=0

1

k!N^k=I+N +1

2N²+· · ·+ 1

(l−1)!N^l−1.

(19)

2. MATRIISIN EKSPONENTTIFUNKTIO 16

Esimerkki 2.5. Matriisi

N =





0 1 0 0 0 1 0 0 0





on nilpotentti, sill¨a

N² =





0 0 1 0 0 0 0 0 0



 ja N³ = 0.

Siten nilpotentinN eksponenttifunktio on

e^N =I+N + 1 2N² =





1 1 ¹₂ 0 1 1 0 0 1



. Matriisin eksponenttifunktiolla on seuraavat ominaisuudet:

Lause 2.6. Olkoot A, B ja P ∈M_n neliömatriiseja ja P kääntyvä. Tällöin (i) Jos C =P AP⁻¹, niin e^C =P eÂP⁻¹.

(ii) Jos AB =BA, niin eÂ+B=eÂe^B. (iii) e^−A= (eÂ)⁻¹.

Todistus. (i) Nyt

e^{P AP}⁻¹ =

∞

X

k=0

1

k!(P AP⁻¹)^k, jossa

(P AP⁻¹)^k= (P AP⁻¹)(P AP⁻¹)· · ·(P AP⁻¹) =P A^kP⁻¹,

sillä välissä olevat termit P⁻¹P supistuvat pois ja lemman 1.6 nojalla

k→∞lim(P A_kP⁻¹) = P( lim

k→∞A_k)P⁻¹. Siten

∞

X

k=0

1

k!(P AP⁻¹)^k =P

∞

X

k=0

1

k!A^kP⁻¹ =P e^AP⁻¹.

(ii) Koska AB = BA, eli matriisit A ja B kommutoivat, niin binomikaavan nojalla voidaan määrittää

(A+B)ⁿ=

n

X

k=0

n!

k!(n−k)!A^kB^n−k.

(20)

Edelleen matriiseille A ja B p¨atee e^A+B=

∞

X

n=0

1

n!(A+B)ⁿ=

∞

X

n=0 n

X

k=0

1 n!

n!

k!(n−k)!A^kB^n−k

!

=

∞

X

n=0 n

X

k=0

A^k k!

B^n−k (n−k)!

!

=

∞

X

k=0

A^k k!

! _∞ X

n=0

Bⁿ n!

!

=e^Ae^B,

jossa viimeiselle riville siirryttäessä on käytetty Cauchyn tuloa

∞

X

n=0 n

X

k=0

a_kbn−k =

∞

X

k=0

a_k

! _∞ X

n=0

b_n

! ,

joka pätee siis myös matriisisarjoille, sillä A ja B kommutoivat.

(iii) Kohdan (ii) nojalla

I =e⁰ =eÂ−A=eÂe^−A, joten e^−A= (eÂ)⁻¹.

(21)

LUKU 3

Matriisin eksponenttifunktion laskeminen

Tässä luvussa tarkastellaan miten eksponenttifunktio voidaan laskea eri matriiseille. Jos matriisi on diagonalisoituva, eksponenttifunktion laskeminen on suoraviivaista. Jos taas matriisi ei ole diagonalisoituva, niin tarvitaan Jordanin muotoa, jota käsitellään myöhemmin luvussa 3.2.

3.1. Diagonalisoituvan matriisin eksponenttifunktio

Jos matriisi A on diagonalisoituva, eli löytyy P siten, että A =PΛP⁻¹, jossa Λ on lävistäjämatriisi, niin lauseen 2.6 mukaan

(3.1) e^A=P e^ΛP⁻¹.

Nyt kun tiedetään, että matriisi Λ on diagonaalinen, niin sen eksponenttifunktio lasketaan kuten esimerkissä 2.3.

1 1 0 2

.

T¨all¨oin A voidaan kirjoittaa muodossa A=PΛP⁻¹, jossa P =

1 1 0 1

, Λ = 1 0

0 2

ja P⁻¹ =

1 −1 0 1

. Siten vakiolla t kerrotun matriisin A eksponenttifunktio on

e^tA=P e^tΛP⁻¹ = 1 1

0 1

e^t 0 0 e^2t

1 −1 0 1

=

e^t e^2t−e^t 0 e^2t

.

Lävistäjämatriisin eksponenttifunktio osataan siis ratkaista, joten matriisien eks- ponenttifunktioneÂlaskeminen kaikille diagonalisoituville matriiseilleAon ratkaistu.

Erityisesti kun matriisin A ominaisarvot ovat erisuuret, niin yhtälössä (3.1) matriisin P sarakkeet ovat siis matriisin A ominaisvektoreita ja matriisi Λ on diagonaalimatriisi, jonka lävistäjäalkiot ovat matriisin A ominaisarvoja kuten nähtiin luvussa 1.2.

Näytetään vielä tulevia esimerkkejä varten käänteismatriisin eräs ratkaisutapa 2×2-matriisille. Matriisin

P = a b

c d

18

(22)

k¨a¨anteismatriisi P⁻¹ voidaan ratkaista seuraavasti:

(3.2) P⁻¹ = 1

det(P)

d −b

−c a

.

Siis vaihdetaan päälävistäjän alkiot keskenään, muutetaan sivulävistäjän alkiot vas- taluvuikseen ja jaetaan matriisinP determinantilla det(P).

1 3

−3 1

kuten esimerkissä 1.10, jolloin ominaisarvot ovatλ₁ = 1−3ija λ₂ = 1 + 3i sekä niitä vastaavat ominaisvektorit

v₁ = 1

−i

ja v₂ = 1

i

. MatriisilleA on siis voimassa A =PΛP⁻¹, jossa

Λ =

1−3i 0 0 1 + 3i

ja P =

1 1

−i i

. Lasketaan ensin matriisin P determinantti:

det(P) =

1 1

−i i

=i−(−i) = 2i.

Nyt voidaan määrittää käänteismatriisi P⁻¹ seuraavasti:

P⁻¹ = 1 2i

i −1 i 1

= ₁

2 −_2i¹

1 2

1 2i

= ₁

2 i 1 2 2 −₂ⁱ

.

Tällöin lauseen 2.6 ja trigonometristen funktioiden määritelmien nojalla e^tA =

1 1

−i i

e^(1−3i)t 0 0 e^(1+3i)t

1 2

i 1 2 2 −₂ⁱ

=

e^(1−3i)t e^(1+3i)t

−ie^(1−3i)t e^i(1+3i)t

1 2

i 1 2 2 −₂ⁱ

= ₁

2e^(1−3i)t+ ¹₂e^(1+3i)t ₂ⁱe^(1−3i)t− ₂ⁱe^(1+3i)t

−₂ⁱe^(1−3i)t+ ₂ⁱe^(1+3i)t −ⁱ₂²e^(1−3i)t− ⁱ₂²e^(1+3i)t

= ₁

2e^t(e^3it+e^−3it) _2i¹e^t(e^3it−e^−3it)

−_2i¹e^t(e^3it−e^−3it) ¹₂e^t(e^3it+e^−3it)

=

e^tcos(3t) e^tsin(3t)

−e^tsin(3t) e^tcos(3t)

.

Vaikka reaalisen matriisin A ominaisarvot ja -vektorit olisivat siis kompleksisia, niin matriisin A eksponenttifunktio eÂ on reaalinen, sillä kaikki sarjakehitelmän potenssit A^k ovat reaalisia matriiseja. Myös kompleksisessa tapauksessa saadaan siis reaalinen ratkaisukanta.

Diagonalisoituvassa tapauksessa A=P



 λ₁

. ..

λ_n



P⁻¹

(23)

3.1. DIAGONALISOITUVAN MATRIISIN EKSPONENTTIFUNKTIO 20

matriisin A potenssit A^k lasketaan siten, ett¨a A^k=P



 λ^k₁

. ..

λ^k_n



P⁻¹,

kuten jo n¨ahtiin lauseen 2.6 todistuksen kohdassa (i) yleiselle neli¨omatriisille.

Esitetään vielä yksi esimerkki diagonalisoituvista matriiseista.





−1 0 2

0 1 0

2 0 −1





kuten esimerkiss¨a 1.11, jolloin sen ominaisarvot ovat λ₁ = −3 ja kaksinkertainen ominaisarvo λ₂ = 1. Vastaavat ominaisvektorit ovat v₁ = (1,0,−1), v_2,1 = (1,0,1) ja v_2,2 = (0,1,0). Nyt matriisi A on similaarinen ominaisarvoista koostuvan matriisin

Λ =





−3 0 0 0 1 0 0 0 1





kanssa. Tällöin on voimassa yhtälö A=VΛV⁻¹, jossa matriisi V =





1 1 0

0 0 1

−1 1 0





koostuu matriisin A ominaisvektoreista ja sen k¨a¨anteismatriisi V⁻¹ =





1

2 0 −¹₂

1

2 0 ¹₂

0 1 0





voidaan ratkaista käyttäen apuna esimerkiksi Gaussin-Jordanin eliminointimenetel- mää. Nyt matriisin A eksponenttifunktio on

e^A=V e^ΛV⁻¹

=





1 1 0

0 0 1

−1 1 0









e⁻³ 0 0 0 e¹ 0 0 0 e¹









1

2 0 −¹₂

1

2 0 ¹₂

0 1 0



=





e⁻³ e¹ 0 0 0 e¹

−e⁻³ e¹ 0









1

2 0 −¹₂

1

2 0 ¹₂

0 1 0





=





1

2(e⁻³+e) 0 ¹₂(−e⁻³+e)

0 e 0

1

2(−e⁻³+e) 0 ¹₂(e⁻³+e)



.

(24)

3.2. Matriisin eksponenttifunktio Jordanin muodon avulla

Jos matriisiAei kuitenkaan ole diagonalisoituva, niin se voidaan muuntaa Jorda- nin muotoonJ_A, joka muodostetaan niin sanottujen yleistettyjen ominaisvektoreiden avulla. Jokainen neliömatriisi A on similaarinen lohkolävistäjämatriisin

J = diag[J1, . . . , Jp] =





 J₁

J₂ . ..

J_p







kanssa, missä J_i, i = 1, . . . , p, on r_i ×r_i -matriisi. Matriisia J kutsutaan matriisin A Jordanin muodoksi ja matriiseja J_i kutsutaan Jordanin lohkoiksi. Matriisit A ja B ovat similaarisia keskenään täsmälleen silloin, kun niillä on sama Jordanin muoto.

Selvitetään seuraavaksi miten Jordanin matriisit löydetään.

Jos matriisinAominaisarvonλ geometrinen kertalukum_g(λ) ja algebrallinen kertaluku m_a(λ) ovat samat eli m_g(λ) = m_a(λ) = k, niin ominaisavaruudessa E_A(λ) = {v ∈Cⁿ: (A−λI)v = 0} on ominaisarvoon λ liittyvien ominaisvektoreiden muodos- tama kanta {x₁, . . . , x_k}, jolloin

A

x₁ . . . x_k

=

x₁ . . . x_k



 λ

. ..

λ



.

Olkoonλ₁, . . . , λ_qmatriisinAerisuuret ominaisarvot jak₁, . . . , k_qnäiden algebral- liset kertaluvut. Nyt jos ominaisarvon λ_j, missä j = 1, . . . , q, geometrinen kertaluku on pienempi kuin algebrallinen eli sen ominaisvektoreiden määrä on pienempi kuin ominaisarvon λj kertalukukj elimg(λj)< ma(λj) =kj, niin Jordanin muotoa varten tarvitaan lisää vektoreita. Lisäksi näiden vektorien tulee olla lineaarisesti riippumattomia, jotta niistä muodostuva matriisi olisi kääntyvä. Kasvatetaan siis ominaisava- ruutta E_A(λ_j).

Määritetään ominaisarvolle λ_j invariantti aliavaruus Eb_A(λ_j) = {v ∈Cⁿ: (A−λ_jI)^k^jv = 0}.

Siten EA(λj) ⊂ EbA(λj). Tarkastellaan nyt tilannetta, jossa matriisilla A on ominaisarvo λ siten, että EA(λ) 6= EbA(λ). Tällöin on olemassa κ ≥2 ja wκ ∈EbA(λ) siten, että (A−λI)^κwκ = 0, mutta (A−λI)^κ−1wκ 6= 0. Asetetaan

w_j = (A−λI)^κ−jw_κ. T¨all¨oin

(Aw₁ =λw₁ ja

Aw_j =λw_j+wj−1, j = 2, . . . , κ.

(25)

3.2. MATRIISIN EKSPONENTTIFUNKTIO JORDANIN MUODON AVULLA 22

Matriisimuodossa saadaan

A

w₁ w₂ . . . w_κ

=

w₁ w₂ . . . w_κ





 λ 1

λ . ..

. .. 1 λ





 .

Vektorijonoa (w1, . . . , wκ) kutsutaan ominaisarvoonλliittyväksi ja ominaisvektorista w1 lähteväksi Jordanin ketjuksi. Similaarimuunnoksen A = V J V⁻¹ muunnos- matriisiV saadaan siis selvitettyä käyttämällä seuraavia yhtälöitä:

((A−λI)w₂ =w₁

(A−λI)w_i =w_i−1, i= 2, . . . , r_i.

Siis täydennetään matriisinAsimilaarimuunnoksenA=V J V⁻¹matriisinV mah- dollisesti puuttuvat ominaisvektorit Jordanin ketjujen vektoreilla. Lisäksi saatiin sel- vitettyä miten Jordanin lohko J(λ, r) löydetään eli se voidaan kirjoittaa muodossa

J(λ, r) =





 λ 1

λ . ..

. .. 1 λ







∈C^r×r.

Jordanin matriisi on tällöin lohkodiagonaalinen yläkolmiomatriisi

J =





J(λ₁, r₁) . ..

J(λp, rp)



, jonka lävistäjä koostuu siis r_i×r_i kokoisista Jordanin lohkoista.

Esimerkki 3.4. Olkoon matriisi A= 1

2





3 0 −1 1 4 −1

−1 0 3





ja ratkaistaan sen ominaisarvot:

p_A(λ) = det(λI−A) =

λ− ³₂ 0 −¹₂

1

2 λ−2 −¹₂

−¹₂ 0 λ− ³₂

= (λ−2)

λ− ³₂ −¹₂

−¹₂ λ− ³₂

=(λ−2)(λ²−3λ+ 2) = (λ−1)(λ−2)(λ−2) = 0,

kun λ = 1 tai λ = 2. Matriisilla A on siis ominaisarvo λ1 = 1 ja kahden kertaluvun ominaisarvo λ₂ = 2. Ratkaistaan viel¨a vastaavat ominaisvektorit:

(26)

λ₁ =1 :

A−λ1I|0

=





1

2 0 −¹₂ |0

1

2 1 −¹₂ |0

−¹₂ 0 ¹₂ |0



−→





1 0 −1 |0 1 2 −1 |0

−1 0 1 |0





⇒v₁ =(1,0,1) λ₂ =2 :

A−λ₂I|0

=





−¹₂ 0 −¹₂ |0

1

2 0 −¹₂ |0

−¹₂ 0 −¹₂ |0



−→





−1 0 −1 |0 1 0 −1 |0

−1 0 −1 |0





⇒v₂ =(0,1,0).

Löytyy siis vain kaksi ominaisvektoria v₁ ja v₂ ja tarvitaan kolme, joten etsitään ominaisarvoon λ₂ liittyvä ja ominaisvektorista v₂ lähtevä Jordanin ketju {v₂, v₃}.

Nyt koska

(Av₂ =λ₂v₂

Av3 =v2+λ2v3 ⇒ (A−λ2I)v3 =v2, niin vektori v₃ löydetään yhtälön





−¹₂ 0 −¹₂ |0

1

2 0 −¹₂ |1

−¹₂ 0 −¹₂ |0





avulla. Siis v₃ = (1,0,−1).

Matriisi A on similaarinen sen Jordanin matriisin J_A kanssa ja Jordanin lohkot ovat

J(λ₁, r₁) =J(1,1) = 1

ja J(λ₂, r₂) =J(2,2) = 2 1

0 2

, joten

J_A=





1 0 0 0 2 1 0 0 2



. Tällöin on voimassa yhtälö A=V J_AV⁻¹,jossa matriisi

V =





1 0 1

0 1 0

1 0 −1





koostuu vektoreista v₁, v₂ ja v₃ ja sen k¨a¨anteismatriisi V⁻¹ =





1

2 0 ¹₂

0 1 0

1

2 0 −¹₂





voidaan ratkaista käyttäen apuna esimerkiksi Gaussin-Jordanin eliminointimenetel- mää.