• Ei tuloksia

Polynomimatriisit

N/A
N/A
Info
Lataa
Protected

Academic year: 2022

Jaa "Polynomimatriisit"

Copied!
58
0
0

Kokoteksti

(1)

Polynomimatriisit

Antti Lindberg

Matematiikan pro gradu -tutkielma

Jyväskylän yliopisto

Matematiikan ja tilastotieteen laitos Kesä 2014

(2)

Tiivistelmä: Antti Lindberg, Polynomimatriisit, Matematiikan pro gradu - tutkielma, 56 sivua, Jyväskylän yliopiston matematiikan ja tilastotieteen laitos, kesä 2014

Tämän tutkielman sisältö voidaan karkeasti jakaa kahteen osaan. Ensim- mäisessä on tarkoituksena tarkastella polynomimatriiseja ja erityisesti osoittaa toimiviksi kaksi niiden muokkaamiseen soveltuvaa algoritmia. Algoritmit toi- mivat osittain samalla idealla kuin lineaarialgebran perusteista tuttu Gaussin ja Jordanin menetelmä. Polynomit tuovat menetelmiin kuitenkin uutta sisältöä erityisesti jaollisuusominaisuuksiensa vuoksi. Tarkasteltavat matriisit ovat aina neliömatriiseja, ja polynomien kerroinkunnan karakteristika oletetaan nollaksi.

Ensimmäinen algoritmi osoittaa, että Gaussin menetelmän polynomimatrii- seille yleistetyillä rivioperaatioilla voidaan aina muokata polynomimatriisi ylä- kolmiomuotoon. Toinen puolestaan ottaa käyttöön myös sarakeoperaatiot. Täl- löin voidaan muokata mikä tahansa polynomimatriisi sellaiseksi diagonaalimat- riisiksi, jonka nollasta eroavat lävistäjäpolynomit ovat perusmuotoisia, ja edel- linen jakaa aina seuraavan. Lisäksi nollapolynomit voivat esiintyä lävistäjällä vain siten, että nollapolynomia seuraava lävistäjäpolynomi on myös nollapoly- nomi. Tällaista muotoa olevaa polynomimatriisia kutsutaan alkuperäisen mat- riisin Smithin normaalimuodoksi. Se on lisäksi yksikäsitteinen, mikä on myös tarkoituksena osoittaa. Tulos tarkoittaa myös sitä, että jokainen polynomimat- riisi on ekvivalentti Smithin normaalimuotonsa kanssa.

Tutkielman toisena osana on esitellyn polynomimatriisien teorian hyödyntä- minen kuntakertoimisten matriisien teoriassa. Yhtenä keskeisimpänä tavoittee- na on määritellä kuntakertoimisen matriisin karakteristinen polynomi käyttä- mättä lainkaan determinanttia. Tämä tapahtuu hyödyntämällä polynomimat- riisin yläkolmiomuotoa. Vaihtoehtoisena laskutapana esitetään myös polynomi- renkaan osamääräkuntaa hyödyntävä keino. Toinen tämän jälkimmäisen osan päätavoitteista on määritellä Smithin normaalimuodon avulla kuntakertoimi- selle matriisille similaarisuusinvariantit ja osoittaa, että niistä voidaan päätellä matriisin Frobeniuksen ja Jordanin muodot. Teoria pohjautuu lauseeseen, jonka mukaan kuntakertoimiset matriisit A ja B ovat similaariset täsmälleen silloin, kun polynomimatriisitA−xI jaB−xI ovat ekvivalentit. Toisin sanoen näillä polynomimatriiseilla on silloin sama Smithin normaalimuoto.

Avainsanat: Matriisiteoria, Lineaarialgebra, Polyomimatriisit, Karakteris- tinen polynomi, Smithin normaalimuoto, Similaarisuusinvariantit, Frobeniuksen muoto, Jordanin muoto

(3)

Sisältö

1 Polynomit 4

1.1 Kuntakertoiminen polynomirengas . . . 4 1.2 Jaollisuudesta . . . 5

2 Johdatus polynomimatriiseihin 7

2.1 Polynomimatriisi ja matriisipolynomi . . . 7 2.2 Rivioperaatiot ja alkeispolynomimatriisit . . . 12 2.3 Polynomimatriisista yläkolmiomatriisiksi . . . 12

3 Matriiseja ja lineaarisia operaattoreita 18

3.1 Matriisin ominaisarvo ja lineaariset operaattorit . . . 18 3.2 Kompleksi- ja reaalikertoimisista matriiseista . . . 19 3.3 Cayleyn ja Hamiltonin lause . . . 22

4 Karakteristinen polynomi 26

4.1 Määrittely ilman determinanttia . . . 26 4.2 Vertailua perinteiseen määrittelyyn . . . 27 4.3 Karakteristisen polynomin laskeminen osamääräkunnan avulla . 28 4.4 Cayleyn ja Hamiltonin lause yleisesti . . . 30

5 Smithin normaalimuoto polynomimatriiseille 34

5.1 Kääntyvien polynomimatriisien ryhmä . . . 34 5.2 Smithin normaalimuoto . . . 35 5.3 Smithin normaalimuodon laskeminen . . . 44 6 Invariantit tekijät ja similaarisuusinvariantit 47 6.1 Similaarisuus ja Smithin normaalimuoto . . . 47 6.2 Frobeniuksen muoto . . . 50 6.3 Similaarisuusinvarianttien yhteys Jordanin muotoon . . . 52

(4)

Johdanto

Reaalisen tai kompleksisen matriisinAkarakteristinen polynomi on yleensä ta- pana määritellä determinanttinadet(A−λI), missäIon yksikkömatriisi. Tällöin determinantti tulkitaan muuttujanλpolynomiksi. Määritelmä perustuu siihen, että matriisiyhtälöllä M x= 0on epätriviaali ratkaisux6= 0täsmälleen silloin, kun det(M) = 0. Luku λ taas on matriisin A ominaisarvo täsmälleen silloin, kun yhtälöllä(A−λI)x= 0on epätriviaali ratkaisu. Näin ollenλon matriisin A ominaisarvo täsmälleen silloin, kun det(A−λI) = 0. Toisin sanoen mat- riisin ominaisarvot ovat karakteristisen polynomin juuret. Näin matriisille voi- daan määritellä karakteristinen polynomi, mutta onko determinantin käyttö sen määrittelyssä kuitenkaan välttämätöntä? Edellä esitetty määrittely voi vaikut- taa yksinkertaiselta ja selkeältä, mutta siinä on kuitenkin oltava pohjalla tulos determinantin ominaisuudesta kääntyvyysmittarina. Tämä tulos ei kuitenkaan ole kovin intuitiivinen varsinkaan silloin, jos mielekästä geometrista tulkintaa ei ole. Toisaalta determinanttien käsittely voi olla myös työlästä ja hankalaa.

Tarvittavan laskennan määrä kasvaa nopeasti determinantin koon kasvaessa.

Ominaisarvo-ongelman ratkaisemiseksi on selvitettävä matriisinA−λIkään- tyvyys. Jos kyseinen matriisi sattuu olemaan esimerkiksi yläkolmiomatriisi, se on kääntyvä täsmälleen silloin, kun kaikki lävistäjäalkiot ovat nollasta eroavia.

Toisin sanoen ominaisarvoja ovat täsmälleen ne luvut λ, joilla jokin lävistäjä- alkioista on nolla. Jos taasA−λI ei ole yläkolmiomuotoa, se voidaan muokata sellaiseksi käyttämällä sopivia rivioperaatioita. Olennaista on kuitenkin se, että nämä operaatiot voidaan valita niin, että niitä vastaavat matriisit ovat käänty- viä luvustaλriippumatta. Näin muokatun matriisin kääntyvyys on yhtäpitävää alkuperäisen matriisin kääntyvyyden kanssa. Silloin voidaan rajoittua tarkaste- lemaan pelkästään sitä, ovatko lävistäjäalkiot nollasta eroavia.

Tämän havainnon motivoimina esitetään karakteristiselle polynomille vaih- toehtoinen määritelmä. Se perustuu polynomimatriisien teoriaan, joka on myös itsenäisenä asiana keskeisessä roolissa. Polynomimatriisiksi kutsutaan matrii- sia, jonka alkiot ovat polynomeja. Polynomien kerroinrenkaana tullaan käyttä- mään sellaista yleistä kuntaa, jonka karakteristika on nolla. Matriisista A−λI voidaan luontevasti siirtyä polynomimatriisiinA−xI. Muuttujasymbolina voi- si yhtä hyvin olla λ, kuten tämän johdannon alussa käytetyssä tulkinnassa, mutta sekaannuksien välttämiseksi varataan muuttujasymbolin rooli kirjaimelle x. Tarvittavat operaatiot matriisin muokkaamiseksi yläkolmiomuotoon voidaan yleistää polynomimatriiseille, ja näin lopulta saadaan myös tarkka määritelmä karakteristiselle polynomille.

Polynomimatriiseja voidaan tarkastella myös itsenäisenä kokonaisuutena.

Niiden muokkaamista voidaan viedä pidemmälle ottamalla rivioperaatioiden li- säksi käyttöön myös sarakeoperaatioita. Käänteisalkiota ei kuitenkaan löydy kuin nollasta eroaville vakiopolynomeille, joten tilanne on siinä mielessä täy- sin erilainen kuin tapauksessa, jossa matriisin alkiot olisivat jostakin kunnasta.

Matriisin alkioita kutsutaan jatkossa myös sen kertoimiksi ja edellisen kaltai- sille matriiseille käytetään nimitystä kuntakertoiminen matriisi. Vaikka polyno- meille ei läheskään aina löydy käänteisalkioita, pätee niille kuitenkin jakoyhtä- lö. Tätä jaollisuusominaisuutta hyödyntämällä jokainen polynomimatriisi voi- daan lopulta muokata tietyn tyyppiseksi diagonaalimatriisiksi, josta käytetään nimitystä Smithin normaalimuoto. Luvussa 5 todistetaan yksityiskohtaisesti sen olemassaolo ja yksikäsitteisyys, mikä on yksi tämän tutkielman keskeisimmistä

(5)

tavoitteista. Teoriaa voitaisiin yleistää myös korvaamalla polynomirengas ylei- sellä pääideaalialueella, mutta tämän tutkielman tarkoituksiin riittää tarkastella ainoastaan polynomirenkaan tapausta.

Lähestymistapa näihin polynomimatriisien muokkaamisiin on hyvin todis- tuskeskeinen ja tarkoituksella erilainen kuin lähdemateriaaleissa. Tarkoituksena on antaa täsmälliset ja yksityiskohtaiset todistukset, joiden kautta tulee osoite- tuksi algoritmien oikeellisuus ja yleispätevyys eikä pelkästään toimintaperiaate.

Tavoitteena on vastata tyhjentävästi kysymykseen, miksi äärellisellä määrällä toistoja päästään aina varmuudella haluttuun lopputulokseen. Tästä syystä to- distusten toteutustapa on sellainen, jossa itse algoritmin toiminta ei ole selkeästi esillä. Lisäksi todistuksia jaotellaan useisiin osiin jälleen todistusteknisistä syis- tä. Sekä yläkolmiomuotoon että Smithin normaalimuotoon tähtäävän algorit- min todistamisen jälkeen esitetään kuitenkin tiivistetysti se, miten algoritmia käytännössä käytetään, ja lisäksi annetaan konkreettiset laskuesimerkit.

Smithin normaalimuotoa voidaan hyödyntää esimerkiksi dierentiaaliyhtälö- ryhmien ratkaisemisessa [Ks. Petersen, s. 201-203]. Toisaalta sen avulla voidaan tarkastella myös kuntakertoimisten matriisien kanonisia muotoja kuten Frobe- niuksen ja Jordanin muotoa. Tätä on tarkoitus käsitellä tarkemmin viimeisessä luvussa. Idea on siinä mielessä samankaltainen kuin karakteristisen polynomin tapauksessa, että kuntakertoimisen matriisin A tarkastelemiseksi voidaan siir- tyä tarkastelemaan polynomimatriisia A−xI. Näin voidaan huomata jälleen yhteyksiä polynomimatriisien teorian ja matriisiteorian välillä.

Kaikki tutkielmassa esitettävät matriisiteorian tulokset ja aihekokonaisuu- det karakteristisesta polynomista kanonisiin muotoihin olisivat todistettavissa ja määriteltävissä myös täysin ilman polynomimatriiseja, ja näin tarkastelu yleen- sä myös tehdään. Tässä on kuitenkin tarkoituksena nimenomaan esitellä hie- man toisenlainen lähestymistapa näihin aiheisiin. Etuna tässä on esimerkiksi se, että algoritmien avulla laskut ovat hyvin selkeitä ja johtavat aina haluttuun lopputulokseen. Toisaalta polynomimatriisien mukanaolo nostaa käsittelytavan teoreettisuutta ja tuo lisää yksityiskohtia. Jos kiinnostus kohdistuisi ainoastaan kuntakertoimisiin matriiseihin, ei tämä lähestymistapa välttämättä olisi mie- lekkäin. Jos taas polynomimatriisit ovat tarkastelun kohteena myös itsenäisenä kokonaisuutena, on niiden teorian hyödyntäminen kuntakertoimisten matriisien tarkastelussa kannattavaa.

(6)

1 Polynomit

1.1 Kuntakertoiminen polynomirengas

Polynomit ovat tässä kirjoitelmassa erittäin keskeisessä roolissa. Käydään ly- hyesti läpi jatkossa käytettävät polynomeihin liittyvät merkinnät ja määritel- mät. Tutkielman tavoitteiden kannalta on jo alussa mielekästä rajoittaa tarkas- telu vain sellaisiin polynomeihin, joiden kerroinkunnan karakteristika on nolla.

Erityisesti polynomien kerroinrenkaana käytetään aina kuntaa. Nollasta poik- keavan karakteristikan kunnat vaatisivat usein erillisen tarkastelun, ja kaikki tämän tutkielman tulokset eivät olisi niille edes voimassa. Tästä syystä tällaiset kunnat jätetään tässä tutkielmassa tarkastelun ulkopuolelle. Myöhemmin sel- vinnee myös tarkempia syitä sille, miksi karakteristikan halutaan olevan nolla.

Jatkossa merkintäKtarkoittaa aina kuntaa, jonka karakteristika on nolla. Po- lynomien määrittely tehdään kuitenkin yleisellä kunnalla, jolle käytetään mer- kintääK.

Tarkasti määriteltynäK-kertoiminen polynomi pon jono(ak)k=0, missä on vain äärellisen monta nollasta eroavaa alkiota ak ∈ K. Jos an+k = 0 kaikilla k= 1,2, . . ., käytetään polynomillepmuodollista merkintää

p=

n

X

k=0

akxk.

Jos tässä esityksessäan6= 0, sitä kutsutaan polynominpjohtavaksi kertoimeksi.

Tällöin n∈ N∪ {0} on polynomin paste, merkitään deg(p) := n. Polynomin sanotaan olevan perusmuotoinen, jos sen johtava kerroin an = 1. Jos ak = 0 kaikilla k = 0,1,2, . . ., kyseessä on nollapolynomi p = 0. Nollapolynomin asteeksi voidaan sopia−∞, jolle pätevät seuraavat:

(1) −∞< akaikillea∈N∪ {0},

(2) a+ (−∞) =−∞+a=−∞kaikillea∈N∪ {0}, (3) −∞+ (−∞) =−∞.

Jos deg(p) ≤0, p on vakiopolynomi. Vakiopolynomit voidaan samaistaa kun- nanK kanssa. Usein polynomeja merkitään isoilla kirjaimilla, mutta tässä tut- kielmassa käytetään kuitenkin aina pieniä kirjaimia. Tällä pyritään välttämään sekaannuksia, sillä isoilla kirjaimilla merkitään jatkossa matriiseja, joiden ker- toimet voivat olla polynomeja. Muuttujasymbolina käytetään kirjainta x. K- kertoimisten polynomien joukolle käytetään merkintää K[x].

Polynomeille määritellään yhteen- ja kertolasku asettamalla

n

X

k=0

akxk

! +

m

X

k=0

bkxk

!

=

max{n,m}

X

k=0

(ak+bk)xk

 ja

n

X

k=0

akxk

!

·

m

X

k=0

bkxk

!

=

n+m

X

k=0

 X

i+j=k

aibj

xk.

JoukkoK[x]varustettuna näillä laskutoimituksilla muodostaa kommutatiivisen renkaan, jota kutsutaanK-kertoimiseksi polynomirenkaaksi. Polynomien tulon

(7)

ja summan asteille pätevät seuraavat laskusäännöt deg(p1· · ·pn) = deg(p1) +· · ·+ deg(pn)ja deg(p1+· · ·+pn) = max{deg(p1), . . . ,deg(pn)}.

Jokainen polynomip= Pn

k=0akxk ∈ K[x] määrittelee polynomikuvauksen p:K→K, jolle

p(t) =

n

X

k=0

aktk.

Polynomikuvausten joukkoP(K)voidaan varustaa pisteittäisellä yhteen- ja ker- tolaskulla, jolloin saadaan polynomikuvausten rengas. Yleisen kunnan tapauk- sessa voi kuitenkin käydä niin, että eri polynomit määrittävät saman poly- nomikuvauksen. Esimerkiksi jos kuntana on Z2, polynomit x+ 1 ∈ Z2[x] ja x2+ 1 ∈ Z2[x] määrittävät saman polynomikuvauksen, vaikka ne ovat eri po- lynomeja. Toisaalta kunnanZ2karakteristika on 2, ja edellä todettiin, että täl- laisia kuntia ei tässä tutkielmassa käytetä. Käytettäessä kuntia, joiden karakte- ristika on nolla, voidaan huoletta samaistaa polynomit ja polynomikuvaukset.

Karakteristikan nolluus ei kuitenkaan ole välttämätön ehto, sillä pelkkä kunnan äärettömyys riittää.

Lause 1.1.1. Olkoon K ääretön kunta. Tällöin renkaat K[x] ja P(K) ovat isomorset.

Todistus. Kuvaus Φ : K[x] → P(K), jolle Φ(p) = p, on helppo todeta ren- gashomomorsmiksi. Tällöin riittää osoittaa, että Ker(Φ) = {0}. Rengasho- momorsmin perusominaisuuksien mukaan pätee Φ(0) = 0. Osoitetaan, että Ker(Φ) ⊂ {0}. Oletetaan, että polynomi p∈K[x] määrittelee nollakuvauksen.

Tällöin riittää osoittaa, ettäp= 0. Koska polynominpmäärittelemä kuvaus on nollakuvaus, jokainen alkiot∈Kon sen juuri. Jospei olisi nollapolynomi, sillä voisi olla enintään asteensadeg(p)verran juuria [ks. esim. Lang, Theorem 4, s.

121]. Tämä on kuitenkin mahdotonta kunnan K äärettömyyden vuoksi. Näin ollenpon nollapolynomi, mikä todistaa väitteen.

Tästä eteenpäin tullaan käyttämään ainoastaan karakteristikan nolla kun- tia, joten jatkossa voidaan samaistaa polynomit ja vastaavat polynomikuvauk- set, jolloin voidaan puhua vain polynomeista. Tällöin käytetään merkintää p tai p(x). Joskus on kuitenkin oltava tarkkana siitä, puhutaanko polynomista vai polynomikuvauksen arvosta. Sekaannuksien välttämiseksi varataan muuttu- jasymboli xvain polynomeille. Jos halutaan merkitä polynomin arvoa jossakin kohdassa, käytetään kirjaintattai tarvittaessa jotain muuta kirjainta. Merkintä p(x)tarkoittaa siis polynomia, jonka muuttujasymbolina on x, ja merkintäp(t) taas polynominparvoa kohdassat∈K.

1.2 Jaollisuudesta

Sanotaan, että polynomi q ∈ K[x]\{0} jakaa polynomin p ∈ K[x], jos on ole- massa sellainen r∈ K[x], jolle p= rq. Tällöin käytetään myös merkintää q|p. Sanotaan, että polynomi p on jaoton, jos se ei ole jaollinen millään sellaisella polynomilla r∈K[x]\{0}, jolle1≤deg(r)<deg(p). Polynomeille on voimassa ns. jakoyhtälö.

(8)

Lause 1.2.1 (Polynomien jakoyhtälö). Olkoot p, q∈K[x]ja q6= 0. Tällöin on olemassa yksikäsitteiset polynomit r, s∈K[x], joille

p=rq+s ja deg(s)<deg(q).

Todistus. Sivuutetaan [ks. Metsänkylä & Näätänen, s. 133].

Lause 1.2.2. Olkoon q∈K[x]. Tällöin on olemassa jaottomat perusmuotoiset polynomit p1, . . . , pn ja a∈K, joille

q=a

n

Y

j=1

pj.

Todistus. Jos q = 0, väite on selvä. Oletetaan, että q 6= 0. Todistus tehdään induktiolla polynominqasteennsuhteen. Kunn= 0, polynomiqon vakiopoly- nomi, jolloinq=a·1jollekina∈K. Olkoonn≥1, ja tehdään induktio-oletus, että väite pätee kaikille enintään astettan−1oleville polynomeille.

Josqon jaoton, voidaan kirjoittaaq=a(a−1q), missä a∈Kon polynomin qjohtava kerroin. Voidaan siis olettaa, ettäqei ole jaoton. Tällöin on olemassa polynomitr, s∈K[x]\{0}, jolle1≤deg(r)<deg(q),1≤deg(s)<deg(q)jaq= rs. Tällöin induktio-oletuksen nojalla on olemassa jaottomat perusmuotoiset polynomit p1, . . . , pk ja pk+1, . . . , pn sekä b, c ∈ K, joille r = bp1· · ·pk ja s = cpk+1· · ·pn. Väite seuraa, kun valitaana=bc.

Lause 1.2.3. Olkoonq∈K[x]\{0}. Olkoot lisäksi polynomitp1, . . . , pn ja ska- laari a ∈ K kuten lauseessa 1.2.2. Tällöin, jos K = C, deg(pj) ≤ 1 kaikille j= 1, . . . , n. Jos taasK=R,deg(pj)≤2kaikille j= 1, . . . , n.

Todistus. Jos yleisesti polynomilla p ∈ K[x] on juuri c ∈ K, se on jaollinen polynomilla x−c. Algebran peruslauseen nojalla jokaisella sellaisella komplek- sikertoimisella polynomilla, joka ei ole vakiopolynomi, on juuri. Väitteen ensim- mäinen osa seuraa suoraan tästä.

Tapauksessa K = R polynomit pj voidaan ajatella myös kompleksikertoi- misiksi tulkinnalla R⊂C. Jos polynomilla pj on kompleksisenakin polynomi- na vain reaalisia juuria, se voi olla enintään astetta yksi, sillä muutoin se olisi jaollinen renkaassa R[x]. Jos c ∈ C on polynomin pj juuri, on sitä myös sen kompleksikonjugaattic. Siten polynominpj aidosti kompleksiset juuret esiinty- vät aina konjugaattipareina. Olkoon polynomillapj aidosti kompleksinen juuri c∈C\R. Tällöin se on jaollinen renkaassaC[x]polynomilla

(x−c)(x−c) =x2−2Re(c)x+|c|2.

Toisaalta x2−2Re(c)x+|c|2 ∈R[x]. Tällöin pj on jaollinen tällä polynomilla myös renkaassaR[x], joten sen aste voi olla enintään kaksi.

Olkoot polynomit p1, . . . , pk ∈ K[x] ja oletetaan, että pj 6= 0 jollakin j ∈ {1, . . . , k}. Sanotaan, että polynomi 0 6=s∈ K[x] on polynomien p1, . . . , pk ∈ K[x] suurin yhteinen tekijä, merkitään syt{p1, . . . , pk} = s, mikäli seuraavat ehdot pätevät:

(1) Polynomi s on perusmuotoinen ja jakaa jokaisen polynomin pj, kun j = 1. . . , k.

(9)

(2) Ehdoista06=r∈K[x] jar|pj kaikillaj= 1, . . . , kseuraa, ettär|s.

Tässä vaaditaan suurimmalta yhteiseltä tekijältä perusmuotoisuus, jotta siitä saadaan yksikäsitteinen.

Lause 1.2.4. Olkoot q1, . . . , qk ∈ K[x], ja oletetaan, että qj 6= 0 jollakin j. Tällöin on olemassa yksikäsitteinens= syt{q1, . . . , qk}.

Todistus. Osoitetaan ensin, että suurin yhteinen tekijä on yksikäsitteinen, jos se on olemassa. Olkoot polynomit s ja s0 polynomien {q1, . . . , qk} suurimpia yhteisiä tekijöitä. Tällöin suoraan määritelmästä seuraa, ettäs|s0 jas0|s. Koska molemmatsjas0 ovat perusmuotoisia, tästä seuraa, ettäs=s0.

Olemassaolotodistus tehdään induktiolla polynomien lukumääränksuhteen.

Tapaus k = 1 on triviaali, joten oletetaan, että k = 2. Jos toinen polyno- meista q1 tai q2 on nollapolynomi, väite on selvä. Jos esimerkiksi q1 = 0, syt{q1, q2}=a−1q2, missäa∈K\{0} on polynomin q2 johtava kerroin. Olete- taan, ettäq16= 06=q2. Voidaan lisäksi olettaa, ettädeg(q1)≥deg(q2). Tehdään induktio polynominq2 asteenn2 suhteen. Kun n2= 0, suoraan määritelmästä nähdään, että 1 = syt{q1, q2}. Oletetaan seuraavaksi, että syt{q1, q2} on ole- massa, kun deg(q2) ≤n−1, missä n ≥ 1. Olkoon deg(q2) = n. Jakoyhtälön nojalla on olemassa polynomitr, s∈K[x], joille

q1=rq2+uja deg(u)<deg(q2). (1) Induktio-oletuksen nojalla on olemassa syt{q2, u} =:s. Riittää osoittaa, että s on myös polynomienq1jaq2suurin yhteinen tekijä. Määritelmänsä mukaanson perusmuotoinen jas|q2. Lisäksis|u, joten yhtälön (1) nojallas|q1. Oletetaan, et- täw∈K[x]\{0}jakaa polynomitq1jaq2. Tällöin yhtälön (1) nojallaw|u. Silloin suurimman yhteisen tekijän määritelmän mukaanw|s, jotens= syt{q1, q2}.

Tehdään seuraavaksi induktio-oletus, että jollakin k ≥ 3 suurin yhteinen tekijä on olemassa, kun polynomeja on enintäänk−1kappaletta. Olkoot poly- nomitq1, . . . , qk∈K[x]jaqj 6= 0jollakinj. Josqj= 0 kaikillaj= 1, . . . , k−1, nähdään suoraan määritelmästä, ettäsyt{q1, . . . , qk}=a−1qk, missäa∈K\{0}

on polynomin qk johtava kerroin. Voidaan siis olettaa, että qj 6= 0 jollakin j∈ {1, . . . , k−1}. Induktio-oletuksen nojalla on olemassas0:= syt{q1, . . . , qk−1} ja s = syt{s0, qk}. Riittää osoittaa, että s = syt{q1, . . . , qk}. Määritelmänsä mukaan s on perusmuotoinen ja jakaa polynomit qk ja s0. Toisaalta s0 jakaa määritelmänsä mukaan polynomit q1, . . . , qk−1, jolloin myössjakaa polynomit q1, . . . , qk−1. Oletetaan, että w ∈K[x]\{0} jakaa polynomit q1, . . . , qk. Tällöin suurimman yhteisen tekijän määritelmän mukaan w|s0, jolloin määritelmästä nähdään edelleen, että myösw|s. Tämä tarkoittaa, ettäs= syt{q1, . . . , qk}.

2 Johdatus polynomimatriiseihin

2.1 Polynomimatriisi ja matriisipolynomi

Tässä tutkielmassa käytetään nimitystä polynomimatriisi matriisille, jonka al- kiot ovat polynomirenkaasta K[x]. Kirjallisuudessa käytetään myös nimitystä λ-matriisi, jolloin kerroinpolynomien muuttujasymbolina on yleensä λ. Rajoi- tutaan tarkastelemaan ainoastaan neliömatriiseja. Olkoonn≥1. TällöinK[x]- kertoimistenn×n-polynomimatriisien joukolle käytetään merkintääMatn(K[x]).

(10)

Jatkossan×n-matriisia voidaan kutsua myös yksinkertaisesti kokoanolevaksi matriisiksi. Kokoa1olevat polynomimatriisit tulkitaan aina polynomeiksi. Vas- taavasti kokoa1olevat kuntakertoimiset matriisit tulkitaan skalaareiksi. Useim- mat myöhemmin esitettävät tulokset ovat selviä1×1-matriiseille, joten tapaus n= 1 sivuutetaan yleensä erikseen mainitsematta.

Polynomimatriisien summa ja tulo määritellään aivan samoin kuin esimer- kiksi reaalikertoimisille matriiseillekin. Näillä laskutoimituksilla varustettuna joukko Matn(K[x]) muodostaa renkaan. Polynomimatriisille A = A(x) mää- ritellään aste deg(A(x))asettamalla

deg(A(x)) := max{deg([A(x)]ij)}.

Merkintä[A(x)]ijtarkoittaa matriisinA(x)alkiota kohdassa(i, j). Tapauksessa, jossadeg(A)≤0, kyseessä on vakiomatriisi. Sellainen samaistaaK-kertoimisten matriisien kanssa.

Merkittävä ero kuntakertoimisiin matriiseihin on se, että nollasta eroavilla kertoimilla ei välttämättä ole käänteisalkioita. Tämä rajoittaa tietysti käänty- vien matriisien joukkoa. Vaikka ainoastaan nollasta eroavilla vakiopolynomeilla on käänteisalkiot, käänteismatriisi voi kuitenkin olla myös monilla sellaisilla po- lynomimatriiseilla, joiden kaikki kerroinpolynomit eivät ole vakiopolynomeja.

Esimerkiksi 1 x2+ 1

0 1

1 −x2−1

0 1

=

1 −x2−1

0 1

1 x2+ 1

0 1

= 1 0

0 1

. Polynomimatriiseille voidaan määritellä myös determinantti aivan samoilla ke- hityssäännöillä, joilla reaali- ja kompleksikertoimisten matriisien determinant- tikin määritellään. Tällöin determinantti on aina polynomi. Polynomimatriisin sanotaan olevan singulaarinen, jos sen determinantti on nollapolynomi.

PolynomimatriisiA∈ Matn(K[x])määrittelee luonnollisesti kuvauksen A : K → Matn(K), t 7→ A(t), missä [A(t)]ij = [A]ij(t). Koska polynomit ja vas- taavat polynomikuvaukset voidaan lauseen 1.1.1 nojalla samaistaa keskenään, voidaan myös yleistäen polynomimatriisi A samaistaa kuvaukseen t 7→ A(t). Tämän tiedon avulla voidaan todistaa seuraavat tulokset polynomimatriiseille yleistämällä vastaavat kuntakeroimisia matriiseja koskevat tulokset.

Lause 2.1.1. Olkoot A, B ∈ Matn(K[x]) ja oletetaan, että AB = I. Tällöin myös BA=I.

Todistus. Käytetään hyväksi tietoa, että vastaava tulos pätee K-kertoimisille matriiseille. Oletuksen mukaan polynomimatriisejaAjaBvastaaville kuvauksil- le päteeA(t)B(t) =Ikaikillet∈K. Silloin pätee myös pisteittäinB(t)A(t) =I kaikillet∈K. Kuvaukset t7→B(t)A(t) =BA(t) jat7→I ovat samoja ja näin ollen myös polynomimatriisitBAjaI.

Tarkastellaan jatkoa varten tilannetta, jossa matriisista poimitaan alkiot vain tietyiltä riveiltä ja sarakkeilta. Kun niistä muodostetaan alkioiden keske- näinen järjestys säilyttäen uusi matriisi, sanotaan näin saatua matriisia alkupe- räisen matriisin alimatriisiksi. Jatkossa alimatriiseille käytetään seuraavanlaista merkintätapaa. OlkootA∈Matn(K[x])jaI, J⊂ {1, . . . , n}. Tällöin merkinnäl- lä(A)I,J tarkoitetaan sellaista matriisinA alimatriisia, joka muodostuu niistä

(11)

alkioista, jotka ovat indeksijoukon I määräämillä riveillä ja joukon J määrä- millä sarakkeilla. Tämä alimatriisi on silloin#I×#J -matriisi, mutta jatkossa kaikki tarkasteltavat alimatriisit ovat neliömatriiseja.

Matriisi voidaan myös osittaa jakamalla se pysty- ja vaakasuorilla janoilla pienemmiksi matriiseiksi, jotka ovat alkuperäisen matriisin alimatriiseja. Tällöin alkuperäistä matriisia kutsutaan lohkomatriisiksi tai ositetuksi matriisiksi. Loh- komatriisia kutsutaan lohkoyläkolmiomatriisiksi, jos sen lävistäjälohkot ovat ne- liömatriiseja ja kaikki niiden alapuoliset lohkot nollamatriiseja. Vastaavasti sitä kutsutaan lohkodiagonaalimatriisiksi, jos sen lävistäjälohkot ovat neliömatriiseja ja kaikki muut lohkot nollamatriiseja. Lohkomatriiseihin voi tutustua tarkem- min esimerkiksi Saarimäen kirjasta Reaalisia vektoriavaruuksia ja ominaisarvoja sivulta 10 alkaen.

Seuraavat kaksi lausetta antavat hyödylliset laskusäännöt polynomimatrii- sien determinanteille.

Lause 2.1.2. Olkoon A∈Matn(K[x]) lohkoyläkolmiomatriisi

A=

A1

...

0 Ak

. Tällöin

det(A) =

k

Y

j=1

det(Aj). (2)

Todistus. Oletetaan tunnetuksi, että tulos päteeK-kertoimisille matriiseille [ks.

Broida & Williamson, Theorem 4.14, s. 205]. Tällöin jokaisellet∈Kpätee det(A)(t) = det(A(t)) = det(A1(t))· · ·det(Ak(t)) = det(A1)(t)· · ·det(Ak)(t), joten yhtälön (2) polynomien kuvapisteet ovat samat kaikille t ∈ K. Tällöin myös itse polynomit ovat samat.

Lause 2.1.3 (Cauchyn ja Binet'n kaava). Olkoot A, B ∈ Matn(K[x]). Olkoot I, J ⊂ {1, . . . , n}, joille #I = #J =k ∈ {1, . . . , n}, ja (AB)I,J vastaava ali- matriisi. Tällöin

det((AB)I,J) = X

K⊂{1,...,n}

#K=k

det((A)I,K) det((B)K,J). (3)

Erityisesti

det(AB) = det(A) det(B).

Todistus. Lauseen todistus K-kertoimisille matriiseille sivuutetaan [ks. esim.

Broida & Williamson, s.212-214]. Yleistys polynomimatriiseille menee vastaa- vasti kuin lauseessa 2.1.2.

Kuntakertoimisista matriiseista poiketen, determinantti ei toimi aivan sa- malla tavalla kääntyvyysmittarina. Esimerkiksi voidaan valita matriisi A = diag(x, x)∈Mat2(K[x]). Yleisesti merkinnällädiag(a1, . . . , an)tarkoitetaan dia- gonaalimatriisia, jonka lävistäjäalkiot ovata1, . . . , an. Tässä tapauksessa mat- riisi A ei ole kääntyvä, vaikkadet(A) =x2 6= 0. Kääntyvän polynomimatriisin determinantti ei kuitenkaan voi olla nolla. Itseasiassa se on aina nollasta eroava skalaari.

(12)

Lause 2.1.4. Olkoon A∈Matn(K[x]) kääntyvä polynomimatriisi. Tällöin sen determinantti on nollasta eroava vakiopolynomi elidet(A)∈K\{0}.

Todistus. Oletuksen nojalla on olemassa A−1 ∈ Matn(K[x]), jolle A−1A = I. Tällöin lauseen 2.1.3 nojalladet(A−1) det(A) = 1, joten polynomidet(A)jakaa polynomin1. Tällöin se on välttämättä nollasta eroava vakiopolynomi.

Myös lauseen 2.1.4 käänteinen väite pätee. Toisin sanoen polynomimatriisi on kääntyvä, jos sen determinantti on nollasta eroava skalaari. Tämän todista- miseen palataan myöhemmin kääntyvien polynomimatriisien ryhmää käsittele- vässä pykälässä 5.1.

PolynomimatriisilleA∈Matn(K[x])voidaan määritellä ranki rank(A)aset- tamalla

rank(A) = max

t∈K{rank(A(t))}.

PolynomimatriisiA∈Matn(K[x])\{0} voidaan aina esittää myös muodossa

A=

deg(A)

X

k=0

Akxk,

missä[Ak]ij on polynomin[A]ij termin xk kerroin. TällöinAk ∈Matn(K)kai- killa indekseillä k. Tapauksessa A = 0 vastaava esitys on triviaali (A = A), sillä nollamatriisi voidaan polynomimatriisinakin tulkita skalaarikertoimiseksi matriisiksi. Polynomimatriiseille pätee samankaltainen jakoyhtälö kuin polyno- meillekin. Esitetään siitä hieman vaillinainen versio, jota kutsutaan myös jään- nöslauseeksi [vrt. Ayres, The Remainder Theorem, s. 181].

Lause 2.1.5 (Polynomimatriisien jakoyhtälö, Jäännöslause). Olkoon

A=

deg(A)

X

k=0

Akxk ∈Matn(K[x]),

missä Ak ∈ Matn(K) kaikilla k. Olkoon lisäksi Bx+C ∈ Matn(K[x]), mis- sä B, C ∈Matn(K) ja B on kääntyvä. Tällöin on olemassa polynomimatriisit R, Q∈Matn(K[x])ja matriisit G, F ∈Matn(K), joille

A(i)= (Bx+C)R+G(ii)= Q(Bx+C) +F.

Todistus. Todistetaan yhtälö (i). Yhtälö (ii) voidaan todistaa vastaavasti. Mo- lemmat yhtälöt ovat kuitenkin olennaisia, sillä yleisesti polynomimatriisit eivät kommutoi. Matriisien RjaQtai matriisienGjaF ei tarvitse olla samoja.

Tehdään induktiotodistus polynomimatriisinA asteendeg(A)suhteen. Jos deg(A) = 0, voidaan valita R = 0 ja G=A, jolloin väite on selvä. Oletetaan, että jollakin l≥1 väite pätee kaikille enintään astettal−1 oleville polynomi- matriiseille. Olkoondeg(A) =l. Asetetaan

A0:=A−(Bx+C)B−1Alxl−1.

Tällöin deg(A0)≤l−1, joten induktio-oletuksen nojalla on olemassa matriisit R0∈Matn(K[x])jaG0∈Matn(K), joilleA0= (Bx+C)R0+G0. Huomataan,

(13)

että

A= (Bx+C)B−1Alxl−1+A0

= (Bx+C)B−1Alxl−1+ (Bx+C)R0+G0

= (Bx+C)(B−1Alxl−1+R0) +G0, joten induktioaskel on otettu.

Tässä polynomimatriisia ei pidä sekoittaa matriisipolynomiin, jolla tarkoite- taan seuraavaa. OlkootA∈Matn(K)jap=akxk+ak−1xk−1+· · ·+a0∈K[x]. Silloin näitä vastaava matriisipolynomi on

p(A) =akAk+ak−1Ak−1+· · ·+a0I.

Matriisipolynomille pätevät esimerkiksi seuraavat laskusäännöt.

Lause 2.1.6. OlkootA∈Matn(K) jap=akxk+ak−1xk−1+· · ·+a0∈K[x]. (a) Olkoon R∈Matn(K)kääntyvä. Tällöinp(RAR−1) =Rp(A)R−1.

(b) Oletetaan, ettäAon lohkoyläkolmiomatriisi, jonka diagonaalimatriisit ovat A1, . . . , Al. Tällöin p(A)on muotoa

p(A) =

p(A1) ∗

...

0 p(Al)

.

Vastaavasti, josAon lohkodiagonaalimatriisi A= diag(A1, . . . , Al), pätee p(A) = diag(p(A1), . . . , p(Al)).

Todistus. Väite (a) nähdään oikeaksi laskemalla

p(RAR−1) =

k

X

j=0

aj(RAR−1)j =

k

X

j=0

ajRAjR−1=R

k

X

j=0

ajAj

R−1. OlkootA, B∈Matn(K)lohkoyläkolmiomatriiseja, joiden diagonaalimatriisit ovatA1, . . . , AljaB1, . . . , Bl. Oletetaan lisäksi, että neliömatriisitAjjaBjovat samaa kokoa kaikillej = 1, . . . , l. Tällöin tarkastelemalla matriisien summan ja tulon määritelmiä nähdään, että

A+B =

A1+B1

...

0 Al+Bl

 jaAB=

A1B1

...

0 AlBl

. Nämä laskusäännöt yleistyvät induktiolla äärellisille summille ja tuloille. Lisäk- si skalaarilla kertominen voidaan tehdä lohkoittain. Väite (b) lohkoyläkolmio- matriiseille seuraa näistä laskusäännöistä. Lohkodiagonaalimatriiseille päättely menee vastaavasti.

(14)

2.2 Rivioperaatiot ja alkeispolynomimatriisit

Selvitetään, miten tunnetut reaali- ja kompleksikertoimisten matriisien muok- kaamiseen käytetyt Gauss-Jordan -muunnokset yleistyvät polynomimatriiseille.

Näitä muunnoksia on kolmea tyyppiä, ja niitä vastaavia matriiseja kutsutaan al- keismatriiseiksi. Polynomimatriisien tapauksessa vastaavia matriiseja kutsutaan tässä tutkielmassa alkeispolynomimatriiseiksi. Ennen niiden tarkkaa määritte- lemistä esitellään kuitenkin vielä kantamatriisit. Kantamatriiseiksi kutsutaan matriiseja Eij∈M atn(K[x]), joille

[Eij]kl:=

( 1, kunk=ijal=j

0 muulloin .

Alkeispolynomimatriisit määritellään kantamatriisien avulla seuraavasti:

(1) Mi(α) =I+ (α−1)Eii (α∈K\{0}). (2) Pij =I−Eii−Ejj +Eij+Eji (i6=j). (3) Aij(r(x)) =I+r(x)Eji(i6=j).

Ne ovat kääntyviä ja niiden käänteismatriisit ovat

Mi(α)−1=Mi−1), Pij−1=Pij jaAij(r(x))−1=Aij(−r(x)).

Muunnoksen suorittaminen vastaa kyseisellä alkeispolynomimatriisilla ker- tomista vasemmalta. Ensimmäinen muunnos Mi(α)on rivinikertominen nol- lasta eroavalla skalaarillaα. Erona reaali- ja kompleksikertoimisiin matriiseihin huomataan, että kertoimeksiα ei sovi mikä tahansa nollasta eroava polynomi, vaan se on pidettävä skalaarina. Muunnosta vastaavalta matriisilta vaaditaan nimittäin kääntyvyys myös polynomimatriisien tapauksessa. Josαolisi ei-vakio polynomi, matriisi Mi(α) ei olisi kääntyvä. Toinen muunnos on rivien i ja j vaihto, joka on aivan sama kuin reaali- ja kompleksikertoimisille matriiseille.

Kolmantena muunnoksena onAij(r(x))eli rivinilisääminen rivillejkerrot- tuna polynomillar(x). Tässär(x)voi olla mikä tahansa polynomi, sillä matriisi Aij(r(x))on aina kääntyvä polynomistar(x)riippumatta.

2.3 Polynomimatriisista yläkolmiomatriisiksi

Tässä pykälässä selvitetään, miten polynomimatriisit voidaan muokata yläkol- miomuotoon käyttäen pelkästään edellä esitettyjä Gauss-Jordan -muunnoksia, joita jatkossa kutsutaan rivioperaatioiksi. Tavallisessa Gauss-Jordan-algoritmis- sa pyritään muokkaamaan matriisi porrasmuotoon tai yksinkertaiseen porras- muotoon, josta esimerkiksi vastaavan yhtälöryhmän ratkaisut on helppo lukea.

Tässä tavoitteet ovat kuitenkin erilaiset, ja porrasmuodon sijaan tavoitteena on yläkolmiomuoto. Tämä polynomimatriisin muokkaaminen yläkolmiomuotoon tulee myöhemmin olemaan tärkeässä roolissa määriteltäessäK-kertoimisen mat- riisin karakteristista polynomia.

Lause 2.3.1. Olkoon A ∈ Matn(K[x]). Tällöin on olemassa kääntyvä R ∈ Matn(K[x]) ja yläkolmiomatriisi U ∈Matn(K[x]), joille A=RU. Lisäksi mat- riisi R on alkeispolynomimatriisien tulo ja siten kääntyvä.

(15)

Todistus. Todistus tehdään induktiolla matriisin koon n suhteen. Ideana on muokata matriisiArivioperaatioilla yläkolmiomatriisiksi.

Aloitetaan tarkastelemalla ensin yleisestin×n-polynomimatriiseja, kunn≥ 2. Olkoon tätä vartenA∈Matn(K[x]), ja merkitään

A=

p011 ∗ · · · ∗ p021 ∗ · · · ∗ ... ... ...

p0n1 ∗ · · · ∗

 .

Tarkoituksena on määritellä rekursiivisesti matriisitAk :=Rk· · ·R1A, kunk≥ 1. Valitsemalla matriisitRksopiviksi alkeispolynomimatriisien tuloiksi pyritään siihen, että matriisiAk saadaan lohkoyläkolmiomuotoon

Ak =

pk11

0 D

jollakin k ∈N. Polynomimatriisi D on tällöin kokoa n−1 oleva neliömatriisi.

Tapauksessa n= 2matriisi D on polynomi. Jos p0j1 = 0kaikilla j = 2, . . . , n, matriisi on jo haluttua muotoa, joten voidaan olettaa, että p0j1 6= 0 jollakin j∈ {2, . . . , n}.

AsetetaanA0 =A. Oletetaan, että jollakin parillisellak∈N∪ {0} polyno- mimatriisit A0, . . . , Ak ovat jo määriteltyjä. Merkitään

Ak :=

pk11 ∗ · · · ∗ pk21 ∗ · · · ∗ ... ... ...

pkn1 ∗ · · · ∗

ja lisäksi voidaan olettaa, ettäpkj16= 0jollakinj ∈ {1, . . . , n}. Polynomimatriisit Ak+1jaAk+2määritellään valitsemalla rivioperaatioita vastaavat matriisitRk+1

jaRk+2 seuraavasti:

Vaihe 1: Olkoonpk1lensimmäisen sarakkeen asteeltaan pienin nollasta eroa- va polynomi. Jos l= 1, asetetaan Rk+1 =I. Josl 6= 1, asetetaanRk+1 =P1l. Merkitään

Ak+1=Rk+1Ak :=

pk+111 ∗ · · · ∗ pk+121 ∗ · · · ∗ ... ... ...

pk+1n1 ∗ · · · ∗

 .

Vaiheessa 1 tehdään siis tarvittaessa rivinvaihto, jotta ensimmäisen sarakkeen asteeltaan pienin nollasta eroava polynomi saadaan vasempaan ylänurkkaan.

Erityisesti tällöin pk+111 6= 0.

Vaihe 2: Jospk+1j1 = 0kaikillaj= 2, . . . , n, matriisi on jo haluttua muotoa, joten asetetaan Rk+2=I. Muussa tapauksessa olkoonj∈ {2, . . . , n} sellainen, että pk+1j1 6= 0. Tällöin vaiheen 1 mukaan deg(pk+111 )≤deg(pk+1j1 ). Polynomien jakoyhtälön mukaan

pk+1j1 =rk+1j pk+111 +pk+2j1 , missärk+1j , pk+2j1 ∈K[x]ja

deg(pk+2j1 )<deg(pk+111 ). (4)

(16)

Jako voi mennä myös tasan eli voi ollapk+2j1 = 0. Asetetaan kaikillej= 2, . . . , n

Rk+2,j =

( A1j(−rk+1j ), jospk+1j1 6= 0 I, jospk+1j1 = 0 =:pk+2j1 jaRk+2:=Rk+2,n· · ·Rk+2,2. Tällöin

Ak+2=Rk+2Ak+1=

pk+211 ∗ · · · ∗ pk+221 ∗ · · · ∗ ... ... ...

pk+2n1 ∗ · · · ∗

 ,

missäpk+211 =pk+111 6= 0jadeg(pk+2j1 )<deg(pk+111 )kaikillaj= 2, . . . , n.

Näin matriisitAk jaRk tulevat rekursiivisesti määritellyiksi kaikillek∈N.

Kaikillak∈N∪ {0} jaj= 2, . . . npolynomeille pkj1pätevät seuraavat:

(a) Jospkj1= 0, myöspk+1j1 = 0.

(b) Jos k+ 2 on parillinen japk+2j1 6= 0, päteedeg(pk+2j1 )<deg(pkj1).

Todistetaan väitteet (a) ja (b). Olkoonj ∈ {2, . . . , n}. Väite (a) seuraa tällöin suoraan vaiheen 1 määrittelystä, joskon parillinen. Jos taaskon pariton, väite (a) seuraa vaiheen 2 määrittelystä. Oletetaan väitteen (b) todistamiseksi, että pk+2j1 6= 0. Tällöin (a)-kohdan nojalla myöspkj16= 0. Silloin

deg(pk+2j1 )(i)<deg(pk+111 )

(ii)

≤ deg(pkj1).

Epäyhtälö (i) seuraa yhtälöstä (4). Epäyhtälö (ii) seuraa vaiheen 1 määrittelystä, jonka mukaan pk+111 on matriisin Ak ensimmäisen sarakkeen asteeltaan pienin nollasta eroava polynomi. Näin ollaan todistettu väitteet (a) ja (b).

Olkoonj∈ {2, . . . , n}. Oletetaan, ettäpkj16= 0kaikilla k∈N∪ {0}. Tällöin tuloksen (b) nojalladeg(pk+2j1 )<deg(pkj1)<deg(p0j1)kaikilla parillisillak∈N, mikä on ristiriita. Siispä on olemassa sellainen mj ∈ N∪ {0}, jolle pmj1j = 0. Asetetaan m := max{mj|j = 2, . . . , n}. Tällöin tuloksen (a) nojalla pmj1 = 0 kaikillaj= 2, . . . , n. Tämä tarkoittaa sitä, että matriisiAmon haluttua muotoa.

Toisin sanoen

Am=

pm11

0 D

,

missäD on kokoan−1 oleva neliömatriisi tai polynomi.

Aloitetaan seuraavaksi varsinainen induktiotodistus. Osoitetaan ensin, että alkuperäinen väite pätee2×2-matriiseille. OlkoonA∈Mat2(K[x]). Edellä todis- tetun nojalla on olemassa polynomimatriisitR0, U∈Matn(K[x]), joilleU =R0A on muotoa

U =

pm11

0 d

,

eliU on yläkolmiomatriisi. LisäksiR0 on alkeispolynomimatriisien tulo. Tällöin myösR:=R0−1 on alkeispolynomimatriisien tulo ja toisaaltaA=RU, mikä oli todistettava.

(17)

Induktio-oletuksena oletetaan, että jollakinn≥3lauseen väite pätee kaikille enintään kokoan−1oleville polynomimatriiseille. Induktioväitteenä on silloin, että väite pätee kokoanoleville polynomimatriiseille. Olkoon A∈Matn(K[x]). Kuten edellä osoitettiin, on olemassa R0, U0 ∈Matn(K[x]), joille U0 =R0A on lohkoyläkolmiomuotoa

U0=

pm11 X

0 D

ja R0 on alkeispolynomimatriisien tulo. Erityisesti siis A = R0−1U0. Polyno- mimatriisi D on kokoa n−1, joten induktio-oletuksen nojalla on olemassa R0, U0 ∈ Matn−1(K[x]), joille D = R0U0. Lisäksi U0 on yläkolmiomatriisi ja R0on alkeispolynomimatriisien tulo. Määritellään polynomimatriisit

U :=

pm11 X 0 U0

jaR00:=

1 0 0 R0

.

Tällöin U on yläkolmiomatriisi jaR00 on alkeispolynomimatriisien tulo. Lisäksi U0 =R00U, jotenA=R0−1R00U. AsetetaanR:=R0−1R00, jolloinA=RU jaR on alkeispolynomimatriisien tulo.

Huomautus 2.3.2. Lauseen 2.3.1 todistuksessa käytetään vain tyyppien 2 ja 3 alkeispolynomimatriiseja. Skalaarilla kertomista ei tarvita.

Lauseen 2.3.1 todistus antaa myös menetelmän kyseisen muodon laskemi- seksi polynomimatriisilleA∈Matn(K[x]). Laskeminen kannattaa suorittaa seu- raavissa vaiheissa.

1. Suoritetaan tarvittava rivien vaihto, jotta ensimmäisen sarakkeen asteel- taan pienin nollasta eroava polynomi saadaan paikalle(1,1).

2. Kirjoitetaan ensimmäisen sarakkeen polynomit jakoyhtälön avulla muo- dossapi1=rip11+si, kuni >1, ja sovelletaan rivioperaatioitaA1i(−ri). Jos jokin polynomeistasion nollasta eroava, siirrytään takaisin vaiheeseen 1. Muussa tapauksessa siirrytään vaiheeseen 3.

3. Tässä vaiheessa matriisin pitäisi olla muotoa p1

0 D

.

Jos D ei ole yläkolmiomatriisi tai pelkkä polynomi, siirrytään takaisin vaiheeseen 1 ja jatketaan rivioperaatioiden soveltamista matriisiinD. Esimerkki 2.3.3. Muunnetaan matriisi

−x+ 1 2 4

−1 −x 2

3 −1 −x+ 5

∈Mat3(R[x]) yläkolmiomuotoon:

−x+ 1 2 4

−1 −x 2

3 −1 −x+ 5

P12

−1 −x 2

−x+ 1 2 4

3 −1 −x+ 5

A12(−x+1), A13(3)

(18)

−1 −x 2

0 x2−x+ 2 −2x+ 6 0 −3x−1 −x+ 11

P23

−1 −x 2

0 −3x−1 −x+ 11

0

−1 3x+4

9

(−3x−1) +22

9 −2x+ 6

A23(13x−49)

−1 −x 2

0 −3x−1 −x+ 11

0 22

9 (−x+ 11) 1

3x−4 9

−2x+ 6

P23

−1 −x 2

0 22

9 1

9 −3x2+ 19x+ 10 0 −3x−1 −x+ 11

A23(229(3x+1))

−1 −x 2

0 22 9

1

9 −3x2+ 19x+ 10

0 0 1

9 −3x2+ 19x+ 10 9

22(3x+ 1)

−x+ 11

=

−1 −x 2

0 22 9

1

9 −3x2+ 19x+ 10

0 0 −9

22(x3−6x2−3x−28)

=:U.

Lisäksi lauseen 2.3.1 merkinnöin

R:=

P12P23A23

1 3x−4

9

P23A23

9

22(3x+ 1) −1

=A23

9

22(−3x−1)

P23A23

−1 3x+4

9

P23P12.

Lauseessa 2.3.1 yläkolmiomatriisin lävistäjäpolynomit eivät ole yksikäsittei- siä. Tulevaa yläkolmiomuodon soveltamista varten yksikäsitteisyys olisi kuiten- kin tärkeää, ja lausetta 2.3.1 voidaankin tietyin ehdoin tältä osin parantaa.

Lause 2.3.4. OlkoonA∈Matn(K[x])jaA= ˜RU˜ lauseen 2.3.1 antama esitys.

Merkitäändiag( ˜U) = (˜p1, . . . ,p˜n), ja oletetaan, että kaikki lävistäjäpolynomitp˜j ovat nollasta eroavia. Tällöin polynomimatriisilla A on esitys A=RU, missä matriiseille R, U ∈Matn(K[x])pätevät seuraavat:

(1) Ron alkeispolynomimatriisien tulo.

(2) U on yläkolmiomatriisi.

(19)

(3) Kun merkitään diag(U) = (p1, . . . , pn), lävistäjäpolynomit pj ∈ K[x] ovat perusmuotoisia ja järjestys huomioiden yksikäsitteisiä.

Todistus. Koska p˜j 6= 0 jokaisella j, voidaan kullekin j valita sellaiset kertoi- met αj ∈ K\{0}, joille polynomi pj := αjj on perusmuotoinen. Kertomalla matriisin U˜ jokainen rivi vastaavalla kertoimella αj saadaan lävistäjäpolyno- mit perusmuotoisiksi. Näitä rivioperaatioita vastaavat alkeispolynomimatriisit Mjj), joten asetetaan

R0:=

n

Y

j=1

Mjj).

Valitaan vielä U :=R0U˜ ja R := ˜RR−10 , jolloin A=RU on haluttua muotoa oleva esitys.

Osoitettavaksi jää polynomienpjyksikäsitteisyys. Oletetaan, että matriisilla A on myös esitysA=SV. Tässä siisS on alkeispolynomimatriisien tulo ja V on yläkolmiomatriisi, jonka lävistäjäpolynomit qj ovat perusmuotoisia. Riittää osoittaa, että pj =qj kaikilla j= 1, . . . , n.

Oletuksen mukaan RU = SV. MerkitsemälläW :=S−1R ja W˜ := R−1S saadaan yhtälöt

W U =V (5)

ja W V˜ =U. (6)

Kirjoittamalla matriisit auki yhtälöissä (5) ja (6) saadaan

w11 w12 · · · w1n

w21 w22 · · · w2n

... ... ... ...

wn1 wn2 · · · wnn

p1 p12 · · · p1n

0 p2 · · · p2n

... ... ... ...

0 0 · · · pn

=

q1 q12 · · · q1n

0 q2 · · · q2n

... ... ... ...

0 0 · · · qn

 (7)

ja

˜

w1112 · · · w˜1n

˜

w2122 · · · w˜2n

... ... ... ...

˜

wn1n2 · · · w˜nn

q1 q12 · · · q1n 0 q2 · · · q2n

... ... ... ...

0 0 · · · qn

=

p1 p12 · · · p1n 0 p2 · · · p2n

... ... ... ...

0 0 · · · pn

 . (8)

Todistetaan seuraavaksi, että polynomimatriisitW jaW˜ ovat yläkolmiomat- riiseja. Tehdään tämä todistus vain matriisille W, sillä matriisille W˜ todistus menee täysin vastaavasti. On osoitettava, ettäwij= 0, kuni > j. Tehdään tämä induktiollaj:n suhteen. Vertaamalla ensimmäisen sarakkeen kertoimia yhtälössä (7) nähdään, että

w11p1=q1

w21p1= 0 ...

wn1p1= 0.

(20)

Koska oletuksen mukaanp1 6= 0, on välttämättäwj1 = 0kaikilla j = 2, . . . , n. Tapausj= 1on siis kunnossa. Oletetaan seuraavaksi, että jollakink∈ {2, . . . , n}

pätee jokaisellej∈ {1, . . . , k−1}, ettäwij = 0kaikillai > j. Induktioväitteenä on tällöin, että wik = 0kaikilla i > k. Josk =n ei ole mitään todistettavaa, joten voidaan olettaa, ettäk < n. Olkooni > k. Yhtälöstä (7) nähdään, että

k

X

j=1

wijpkj= 0. (9)

Toisaalta induktio-oletuksen nojalla wij = 0 kaikilla j = 1, . . . , k−1, joten yhtälö (9) sievenee muotoon

wikpk = 0.

Tällöin wik= 0, koska oletuksen nojallapk 6= 0, ja indutioväite on siten todis- tettu.

Olkoonj ∈ {1, . . . , n}. Koska wij = 0 = ˜wij kaikilla i > j, nähdään yhtä- löistä (7) ja (8), että

wjjpj=qj jaw˜jjqj =pj.

Toisin sanoenpj jakaa polynominqjja myösqjjakaa polynominpj. Koska sekä pjettäqj ovat oletuksen mukaan perusmuotoisia, tästä seuraa, ettäpj=qj.

3 Matriiseja ja lineaarisia operaattoreita

3.1 Matriisin ominaisarvo ja lineaariset operaattorit

Sanotaan, että λ ∈ K on matriisin A ∈ Matn(K) ominaisarvo, jos Av = λv jollekin v ∈ Kn\{0}. Tällöin λ on matriisin A ominaisarvo täsmälleen silloin, kun yhtälöllä

(A−λI)v= 0

on epätriviaali ratkaisu. Tämä puolestaan on yhtäpitävää sen kanssa, että mat- riisiA−λI ei ole kääntyvä.

Usein matriisin karakteristinen polynomi määritellään determinantin avul- la. Matriisi A−λI ei ole kääntyvä täsmälleen silloin, kun det(A−λI) = 0. Silloin matriisinAominaisarvot ovat täsmälleen polynomindet(A−xI)juuret.

MatriisinAkarakteristinen polynomi χAmääritellään polynominadet(A−xI). Determinantin käyttäminen karakteristisen polynomin määrittelemisessä ei kui- tenkaan ole välttämätöntä. Myöhemmin luvussa 5 esitetään hieman toisenlai- nen tapa määrittelylle käyttäen hyväksi edellä todistettuja tuloksia polynomi- matriiseille ja todistetaan tunnettu Cayleyn ja Hamiltonin lauseK-kertoimisille matriiseille tätä määritelmää hyödyntäen. Lauseen mukaan matriisin karakte- ristinen polynomi nollaa sen, toisin sanoenχA(A) = 0. Sitä ennen on kuitenkin tarkoitus todistaa Caylen ja Hamiltonin lause reaali- ja kompleksikertoimisis- sa tapauksissa hyödyntäen reaali- ja kompleksilukujen ominaisuuksia. Tämän yhteydessä käy ilmi myös reaali- ja kompleksikertoimisille matriiseille soveltuva karakteristisen polynomin vaihtoehtoinen määrittely.

Renkaan Matn(K) matriisit liittyvät tunnetustin-ulotteisen K-kertoimisen lineaarisen vektoriavaruuden lineaarisiin operaattoreihin, ja näiden matriisien teoria on näin ollen myös vektoriavaruuden teoriaa ja päinvastoin. Tässä tut- kielmassa tarkastellaan ensisijaisesti matriiseja, eikä niinkään olla kiinnostuneita

(21)

vektoriavaruuksista ja lineaarisista operaattoreista. Jatkossa tarvitaan kuiten- kin myös lineaarisia vektoriavaruuksiaRn,Cn jaKn. Päämielenkiinto pidetään kuitenkin matriiseissa, ja lineaariset operaattorit ovat lähinä apuna niiden tar- kastelussa. Avaruudessa Cn käytetään tavallista sisätuloa(·|·), jolle

(x|y) =

n

X

j=1

xjyj,

missä x= (x1, . . . , xn), y = (y1, . . . , yn)∈ Cn. Äärellisiulotteisten lineaaristen vektori- ja sisätuloavaruuksien teorian perusteita ei ole tarkoitus kerrata tässä tämän tarkemmin. Näitä asioita on käsitelty esimerkiksi Axlerin kirjassa luvuis- sa 1, 2 ja 6. Kerroinkuntina on tosin käytetty vain kuntiaRjaC. Yleiselle ker- roinkunnalle vastaavaa teoriaa on käsitelty esimerkiksi Golanin kirjassa luvuissa 3, 5 ja 15. Perusasiat eivät tosin juurikaan poikkea toisistaan oli kerroinkuntaa rajoitettu tai ei.

Matriisia A ∈ Matn(K) vastaa kiinnitetyssä avaruuden Kn kannassa yksi- käsitteisesti lineaarinen operaattori LA : Kn → Kn. Sanotaan, että matriisit A, B∈Matn(K)ovat yhtäläiset tai similaariset, jos on olemassa sellainen kään- tyvä matriisiR∈GLn(K), jolleA=R−1BR. Tällöin matriisitAjaBvastaavat samaa lineaarista operaattoria mutta mahdollisesti eri kannoissa. Aliavaruuden V ∈Kn sanotaan olevan LA-invariantti, mikäliLA(V) ⊂V. Lineaarisen ope- raattorin ominaisarvot ja ominaisvektorit ovat samat kuin sitä vastaavan mat- riisin. Sillä ei ole merkitystä, missä kannassa vastaavuus on. Lineaaristen ope- raattoreiden perusasioita ei käsitellä tässä enempää [ks. tarvittaessa esim. Axler, luvut 3 ja 5, tai Golan, luvut 6 ja 8]. Lineaariselle operaattorille ja sitä stan- dardikannassa vastaavalle matriisille saatetaan käyttää joskus samaa merkintää, jos sekaannuksen vaaraa ei ole. Eri merkintöjä käytetään, jos sen voidaan katsoa selkeyttävän tilannetta. Lineaariselle operaattorille voidaan määritellä polynomi matriisipolynomin avulla asettamallap(LA) :=Lp(A).

3.2 Kompleksi- ja reaalikertoimisista matriiseista

Matriisin U ∈Matn(C)sanotaan olevan unitaarinen, mikäli UU =U U =I tai yhtäpitävästi sen sarakevektorit muodostavat avaruuden Cn ortonormaalin kannan. Tässä U on matriisin U kompleksikonjugaatin transpoosi eli U = (U)T. Seuraava Schurin tai Schurin ja Toeplizin lauseena tunnettu tulos on eräs kompleksikertoimisten matriisien teorian keskeisimmistä perustuloksista [ks. Horn & Johnson, Schurs unitary triangularization theorem, s. 79].

Lause 3.2.1 (Schurin ja Toeplizin lause). Olkoon A ∈ Matn(C). Tällöin on olemassa unitaarinen U ∈ Matn(C) ja yläkolmiomatriisi B ∈ Matn(C), joille A=U BU.

Todistus. Todistus tehdään induktiolla matriisin koonnsuhteen. Olkoonλ1jo- kin matriisinAominaisarvo jau1vastaava normitettu ominaisvektori. Komplek- sikertoimisella matriisilla on aina vähintään yksi ominaisarvo, jotenλ1 on ole- massa. Reaalisessa tapauksessa näin ei välttämättä ole, ja siksi tämä todistus ei toimi reaalisille matriiseille. Täydennetään vektori u1 avaruuden Cn orto- normaaliksi kannaksi {u1, . . . , un}, ja merkitään U = [u1, . . . , un] ∈ Matn(C).

(22)

Tällöin U on unitaarinen ja

UAU = [u1, . . . , un]T1u1, Au2, . . . , Aun]

=

λ1(u1|u1) ∗ λ1(u2|u1)

... Y

λ1(un|u1)

=

λ1 ∗ 0 Y

,

missä Y ∈ Matn−1(C). Tällöin väite pätee, kun n = 2, sillä silloin Y ∈ C.

Oletetaan seuraavaksi, että jollakin n ≥ 3 väite pätee kaikille enintään kokoa n−1oleville matriiseille. Tällöin edellä todetun nojalla on olemassa unitaarinen matriisiV1 jolle

V1AV1=

λ1 ∗ 0 Y

,

missäY ∈Matn−1(C). Edelleen induktio-oletuksen nojalla on olemassa unitaa- rinen matriisi U1, jolle U1Y U1 =: B1 on yläkolmiomatriisi. Asetetaan V2 :=

diag(1, U1)jaU :=V1V2, jolloin matriisitV2jaU ovat myös unitaarisia. Lisäksi tällöin

UAU =

λ1 ∗ 0 B1

on yläkolmiomatriisi.

Schurin ja Toeplizin lause ei siis päde yleisesti reaalisille matriiseille. Seu- raavaksi on tarkoitus osoittaa, että reaalisille matriiseille pätee kuitenkin hyvin samankaltainen tulos.

Lemma 3.2.2. Olkoon A :Rn → Rn lineaarinen operaattori. Tällöin on ole- massaA-invariantti aliavaruus V ⊂Rn, jolle dim(V)∈ {1,2}.

Todistus. Olkoon06=v∈Rn. Tällöin joukko {v, Av, A2v, . . . , Anv}

on lineaarisesti riippuva, koska se sisältään+ 1vektoria. Silloin

n

X

j=0

ajAjv= 0

joillekin aj ∈R. Lemman 1.2.3 nojalla on olemassa jaottomat perusmuotoiset polynomit pj jac∈R, joille

n

X

j=0

ajxj =c

k

Y

j=1

pj(x) jadeg(pj)≤2 kaikillaj= 1, . . . , k. Silloin

0 =

n

X

j=0

ajAj

v=c

k

Y

j=1

pj(A)

v.

Viittaukset

LIITTYVÄT TIEDOSTOT

1. Hajota identiteetin vasemman puoleinen matriisi kahden matriisin tu- loksi ja käytä Binet-Cauchy

Matriisin determinantti laskettaan komennolla det(D). Mieti onko matriiseille voimassa2. a) AB=0⇔A=0

Matematiikan perusopintojakso kev¨ at 2001 Laskuharjoitus 10 vk

Matriisin käyttö rahanjaossa ei joidenkin haastateltujen mukaan ole ongelmatonta myös- kään siinä suhteessa, ettei matriisi mahdollista laitosten toimintakontekstien,

Bakteriofagit ovat bakteereita infektoivia viruksia, jotka lisääntyvät isän- täsolussa. Bakteriofageista käytetään myös nimitystä fagi tai faagi. Sana fagi tulee

Monikielisyyteen panostetaan tänä vuonna myös sillä, että lehden ohjeistukset käännetään ruotsiksi ja englanniksi.. Alan keskeisen terminologian kehittymistä myös

Yksityistämisen välttämättö- myydestä ei Euroopan entisissä keskussuunnit- telutalouksissa (joista artikkelissa käytetään siirtymämaiden nimitystä) näytä vallitsevan

(Kaikilta metsiköiltä ki1jattiin kuitenkin muutama tunnus.) Suorakaiteen tai puolisuorakaiteen muotoiselle linjalle sijoitettujen koealojen joukkoa kutsutaan jatkossa