Linear Algebra II
April 20, 2017 | Author: Muris Bećirović | Category: N/A
Short Description
Download Linear Algebra II...
Description
Linearna algebra II Prof. dr. Hasan Jamak February 23, 2007
Sadrˇ zaj 1 Determinante 1.1 Komutativni prsten . . . . . . . . . . 1.2 Determinantna funkcija . . . . . . . 1.2.1 Zadaci . . . . . . . . . . . . . 1.3 Jedinstvenost determinantne funkcije 1.3.1 Zadaci . . . . . . . . . . . . . 1.4 Joˇs neke osobine determinanti . . . 1.4.1 Kramerovo pravilo . . . . . . 1.4.2 Zadaci . . . . . . . . . . . . . 1.5 Moduli . . . . . . . . . . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
2 Elementarne kanonske forme 2.1 Svojstvene vrijednosti . . . . . . . . . . . . 2.1.1 Zadaci . . . . . . . . . . . . . . . . . 2.2 Anuliraju´ci polinomi . . . . . . . . . . . . . 2.2.1 Zadaci . . . . . . . . . . . . . . . . . 2.3 Invarijantni potprostori . . . . . . . . . . . 2.3.1 Zadaci . . . . . . . . . . . . . . . . . 2.4 Simultana trougaonizacija i dijagonalizacija 2.4.1 Zadaci . . . . . . . . . . . . . . . . . 2.5 Direktna suma . . . . . . . . . . . . . . . . 2.5.1 Zadaci . . . . . . . . . . . . . . . . . 2.6 Invarijantne direktne sume . . . . . . . . . . 2.6.1 Zadaci . . . . . . . . . . . . . . . . . 2.7 Teorem o primarnoj dekompoziciji . . . . . 2.7.1 Zadaci . . . . . . . . . . . . . . . . . 3 Racionalna i Jordanova forma 3.1 Cikliˇcki potprostori . . . . . . . . . 3.1.1 Zadaci . . . . . . . . . . . . . 3.2 Racionalna kanonska forma matrice . 3.2.1 Zadaci . . . . . . . . . . . . . ˇ 3.3 Zordanova forma . . . . . . . . . . . 3.3.1 Zadaci . . . . . . . . . . . . . 3.4 Raˇcunanje invarijantnih faktora . . . 1
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . .
. . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . .
. . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . .
. . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . .
. . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . .
. . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . .
. . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . .
. . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . .
. . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . .
. . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . .
. . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . .
. . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . .
. . . . . . . . .
. . . . . . . . . . . . . .
. . . . . . .
. . . . . . . . .
3 3 4 8 9 12 13 18 19 20
. . . . . . . . . . . . . .
25 25 32 34 39 40 46 47 49 50 53 54 59 60 62
. . . . . . .
65 65 68 69 78 80 84 85
ˇ SADRZAJ
2 3.4.1
Zadaci . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
4 Normirani i Unitarni prostori 4.1 Metriˇcki prostori . . . . . . . . . . . . . . . . . . . . . 4.2 Normirani prostori . . . . . . . . . . . . . . . . . . . . 4.3 Skalarni proizvod . . . . . . . . . . . . . . . . . . . . . 4.4 Ortogonalizacija vektora . . . . . . . . . . . . . . . . . 4.5 Beselova nejednakost . . . . . . . . . . . . . . . . . . . 4.5.1 Zadaci . . . . . . . . . . . . . . . . . . . . . . . 4.6 Adjungovana linearna transformacija . . . . . . . . . . 4.6.1 Zadaci . . . . . . . . . . . . . . . . . . . . . . . 4.6.2 Aproksimacija metodom najmanjih kvadrata . 4.6.3 Minimalno rjeˇsenje sistema linearnih jednaˇcina 4.6.4 Zadaci . . . . . . . . . . . . . . . . . . . . . . . 4.7 Normalne i Ermitske linearne transformacije . . . . . . 4.8 Unitarne i ortogonalne transformacije . . . . . . . . . 4.9 Ortogonalne transformacije prostora . . . . . . . . . . 4.9.1 Zadaci . . . . . . . . . . . . . . . . . . . . . . . 4.10 Bilinearne i kvadratne forme . . . . . . . . . . . . . . . 4.11 Definitnost formi . . . . . . . . . . . . . . . . . . . . . 4.11.1 Urad¯eni zadaci . . . . . . . . . . . . . . . . . . 4.11.2 Zadaci . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . .
103 103 104 106 111 113 122 124 129 130 132 134 134 140 148 148 149 154 159 162
Glava 1
Determinante U ovom poglavlju ispitiva´cemo osnovne osobine determinanti kvadratnih matrica nad prstenima i poljima.
1.1
Komutativni prsten
Definicija 1.1.1. Ured¯enu trojku (R, +, ·) nepraznog skupa R i binarnih operacija + i · na R nazivamo prsten ako su zadovoljeni uslovi: (a) (R, +) je komutativna grupa; (b) (∀ x, y, z ∈ R) (xy)z = x(yz); (c) (∀ x, y, z ∈ R) x(y + z) = xz + xz, (x + y)z = xz + yz. Ako je xy = yx za svako x, y ∈ R, onda kaˇzemo da je prsten komutativan. Ako postoji element 1 ∈ R takav da je 1x = x1 za svako x ∈ R, onda kaˇzemo da je R prsten sa jedinicom, element 1 nazivamo jedinica prstena R. U naˇsem daljem razmatranju smatra´cemo da je R komutativan prsten sa jedinicom. Definicija 1.1.2. Neka je R komutativan prsten sa jedinicom. Preslikavanje A koje ured¯enom paru (i, j) prirodnih brojeva, 1 ≤ i ≤ m, 1 ≤ j ≤ n, pridruˇzuje element Aij prstena R nazivamo matrica. Uobiˇcajeno je da se matrica predstavlja pravougaonom ˇsemom od m vrsta i n kolona ˇciji su elementi Aij vrijednosti funkcije A na paru (i, j). Sabiranje i mnoˇzenje matrica nad prstenom R izvodi se na isti naˇcin kao i sabiranje i moˇzenje matrica nad poljem F. Dakle, (A + B)ij = Aij + Bij , (AB)ij =
n X Aik Bkj . k=1
Jasno, mogu se sabirati samo one matrice koje imaju jednak broj vrsta i jednak broj kolona, tj. matrica istog formata. Proizvod AB postoji samo ako matrica B ima onoliko vrsta koliko matrica A ima kolona. 3
4
GLAVA 1. DETERMINANTE Jednostavno se dokazuje da u prstenu, kao i u polju vrijedi: A(B + C) = AB + AC, (AB)C = A(BC).
1.2
Determinantna funkcija
Definicija 1.2.1. Neka je R komutativan prsten sa jedinicom, n prirodan broj i D : Rn×n → R funkcija koja kvadratnoj matrici A pridruˇzuje element D(A) prstena R. Kaˇzemo da je D n−linearno preslikavanje ako je za svako i, 1 ≤ i ≤ n, D linearna funkcija i te vrste, dok se ostale n − 1 vrste drˇze fiksnim. Oznaˇcimo sa α1 , α2 , . . . , αn vrste matrice A reda n × n nad prstenom R. Neka je D funkcija sa Rn×n u R. Sada moˇzemo pisati D(A) = D(α1 , α2 , . . . , αn ), ˇ tj. funkciju D moˇzemo shvatiti kao funkciju vrsta matrice A. Cinjenica da je D n-linearna funkcija znaˇci D(α1 , . . . , λαi + µβi , . . . , αn ) = λ D(α1 , . . . , αi , . . . αn ) +µ D(α1 , . . . , βi , . . . , αn ).
(1.2.1)
Ako fiksiramo sve vrste osim i−te, onda D moˇzemo posmatrati kao funkciju i−te vrste. Tada umjesto D(A) piˇsemo D(αi ). Sada relaciju (1.2.1) moˇzemo napisati u obliku D(λαi + µαi0 ) = λD(αi ) + µD(αi0 ). Primjer 1.2.2. Neka su k1 , . . . , kn prirodni brojevi, 1 ≤ ki ≤ n, i neka je γ proizvoljno odabran element polja F. Za svaku n × n matricu A nad poljem F definiˇsimo: D(A) = γA(1, k1 ) . . . A(n, kn ).
(1.2.2)
Tada je D n−linearna funkcija, odnosno, D je linearna funkcija svake vrste matrice A. Specijalno za γ = 1 i ki = i, 1 ≤ i ≤ n je D(A) = A11 A22 · · · Ann n-linearna funkcija. Drugim rijeˇcima proizvod dijagonalnih elemenata matrice A ∈ Fn×n je n−linearna funkcija.
Primjer 1.2.3. Odredimo sve 2−linearne funkcije matrica reda 2 × 2 nad poljem F. Oznaˇcimo sa ²1 i ²2 vrste jediniˇcne matrice, tj. neka je ²1 = (1, 0) i ²2 = (0, 1). Neka su α1 i α2 vrste proizvoljne matrice A reda 2 × 2. One se mogu napisati u obliku α1
= A11 ²1 + A12 ²2 ,
α2
= A21 ²1 + A22 ²2
Tada je D(A) = D(α1 , α2 ) = D(A11 ²1 + A12 ²2 , A21 ²1 + A22 ²2 ). Zbog linearnosti po svakoj vrsti immo: D(A) = +
A11 A21 D(²1 , ²1 ) + A11 A22 D(²1 , ²2 ) A12 A21 D(²2 , ²1 ) + A12 A22 D(²2 , ²2 ).
1.2. DETERMINANTNA FUNKCIJA
5
To znaˇci da je funkcija D odred¯ena sa ˇcetiri skalara: D(²1 , ²1 ), D(²1 , ²2 ), D(²2 , ²1 ), D(²2 , ²2 ). Ako su a, b, c i d ta ˇcetiri skalara, onda je D(A) = A11 A12 a + A11 A22 b + A12 A21 c + A12 A22 d.
Definicija 1.2.4. Neka je D n−linearna funkcija. Kaˇzemo da je D alterniraju´ca funkcija, ako vrijede uslovi: (a) D(A) = 0 kad god su dvije vrste matrice A jednake. (b) Ako je A0 matrica dobijena iz matrice A zamjenom mjesta dviju vrsta, onda je D(A0 ) = −D(A). Mi ´cemo u Lemi 1.2.8 dokazati da iz uslova (a) automatski slijedi uslov (b). Zbog ˇcega onda stavljamo oba uslova u definiciju? To je stvar konvencije. Ako funkcija D zadovoljava uslov (b) i matrica A ima dvije jednake vrste, onda se lahko vidi da je D(A) = −D(A). Da li odavde slijedi D(A) = 0? Odgovor ne mora biti potvrdan. Naime, u prstenu Z2 je 1 = −1, ali nije 1 = 0. To znaˇci da uslovi (a) i (b) nisu ekvivalentni. Definicija 1.2.5. Neka je R komutativni prsten sa jedinicom i neka je n prirodan broj. Za funkciju D : Rn×n → R kaˇzemo da je determinantna funkcija, ako je D n−linearna, alterniraju´ca funkcija i D(I) = 1, gdje je I jediniˇcna matrica reda n×n. Primjer 1.2.6. Neka je D 2−linearna funkcija iz prethodnog primjera. Ako je D alterniraju´ca funkcija, ona je D(²1 , ²1 ) = D(²2 , ²2 ) = 0 i D(²2 , ²1 ) = −D(²1 , ²2 ) = −D(I). Ako je D joˇs i determinantna funkcija,tj. ako je D(I) = 1, onda je D(A) = A11 A22 − A12 A21 .
Primjer 1.2.7. Neka je F polje i D 3−linearna funkcija na skupu 3×3 matrica nad poljem F. Neka su ²1 = (1, 0, 0), ²2 = (0, 1, 0) i ²3 = (0, 0, 1) vrste jediniˇcne matrice I reda 3 × 3. Odredimo D(A), gdje je x 0 −x2 0 . A= 0 1 1 0 x3 Vrste matrice A su α1 α2
= =
x²1 − x2 ²3 , ²2 ,
α3
=
²1 + x3 ²3 ,
pa je D(A) = D(x²1 − x2 ²3 , ²2 , ²1 + x3 ²3 ). Odavde je D(A) = = = =
xD(²1 , ²2 , ²1 + x3 ²3 ) − x2 D(²3 , ²2 , ²1 + x3 ²3 ) ¡ ¢ ¡ ¢ x D(²1 , ²2 , ²1 ) + x3 D(²1 , ²2 , ²3 ) − x2 D(²3 , ²2 , ²1 ) + x3 D(²3 , ²2 , ²3 ) ¡ ¢ ¡ ¢ x 0 + x3 · 1 · D(²1 , ²2 , ²3 ) − x2 −1 · D(²1 , ²2 , ²3 ) + x3 · 0 ¡ 4 ¢ x + x2 D(²1 , ²2 , ²3 ).
6
GLAVA 1. DETERMINANTE
Lema 1.2.8. Neka je D n−linearna funkcija na skupu svih matrica n × n prstena R. Pretpostavimo da je D(A) = 0 za svaku matricu A koja ima dvije jednake vrste. Tada je D alterniraju´ca funkcija. Dokaz. Neka je A0 matrica nastala iz matrice A med¯usobnom zamjenom i−te i j−te vrste, gdje su i i j razliˇciti prirodni brojevi. Neka je B matrica kod koje su vrste βk = αk za k 6= i i k 6= j i βi = βj = αi + αj . Dakle, matrica B ima dvije jednake rste, pa je D(B) = 0. Odavde imamo 0 = D(α1 , . . . , αi−1 , αi + αj , αi+1 , . . . , αj−1 , αi + αj , αj+1 , . . . , αn ) = D(α1 , . . . , αi−1 , αi , αi+1 , . . . , αj−1 , αi + αj , αj+1 , . . . , αn ) + D(α1 , . . . , αi−1 , αj , αi+1 , . . . , αj−1 , αi + αj , αj+1 , . . . , αn ) = D(α1 , . . . , αi−1 , αi , αi+1 , . . . , αj−1 , αi , αj+1 , . . . , αn ) + D(α1 , . . . , αi−1 , αi , αi+1 , . . . , αj−1 , αj , αj+1 , . . . , αn ) = D(α1 , . . . , αi−1 , αj , αi+1 , . . . , αj−1 , αi , αj+1 , . . . , αn ) + D(α1 , . . . , αi−1 , αj , αi+1 , . . . , αj−1 , αj , αj+1 , . . . , αn ) = 0 + D(A) + D(A0 ) + 0 = D(A) + D(A0 ). Dakle, D(A0 ) = −D(A). Neka je n > 1 prirodan broj i A matrica reda n × n nad prstenom R. Oznaˇcimo sa A(i | j) matricu reda (n − 1) × (n − 1) koja nastaje iz matrice A izostavljanjem njene i−te vrste i j−te kolone. Ako je D (n − 1)−linearna funkcija i A matrica reda n × n nad prstenm R, uvedimo oznaku Dij (A) = D[A(i | j)]. Teorem 1.2.9. Neka je n prirodan broj ve´ci od 1 i D bilo koja alterniraju´ca (n − 1)−linearna funkcija na skupu (n − 1) × (n − 1) matrica nad komutativnim prstenom R sa jedinicom 1. Za svako j, 1 ≤ j ≤ n, funkcija definisana sa n ³ ´ X Ej (A) = (−1)i+j Aij Dij (A), A ∈ Rn×n) (1.2.3) i=1
je alterniraju´ca n−linearna funkcija. Ako je, pri tome, D determinantna funkcija, onda je Ej determinantna funkcija. Dokaz. Prema definiciji funkcija Dij ne zavisi od i−te vrste matrice na koju se primjenjuje. Dakle, element Dij (A) prstena R ne zavsi od i−te vrste matrice A. Funkcija Dij je definisana pomo´cu (n − 1)−linearne funkcije D, pa je i sama (n − 1)−linearna funkcija. Zato je Aij Dij jedna n−linearna funkcija. Linearna kombinacija n−linearnih funkcija je n−linearna funkcija. Zbog toga je Ej jedna n−linearna funkcija. Da bi dokazali da je Ej alterniraju´ca funkcija dovoljno je dokazati da je Ej (A) = 0 za svaku matricu A ∈ Rn×n kod koje su dvije vrste jednake. Pretpostavimo da je k < l i da su k−ta i l−ta vrsta matrice A jednake, tj. da je αk = αl . U sumi (1.2.3) indeks i se mjenja od 1 do n. Ako je i 6= k i i 6= l, onda matrice A(i | k) i A(i | l) imaju iste i−tu i k−tu vrstu, pa je Dij (A) = D[A(i | j)] = 0. To znaˇci da ´ce suma (1.2.3) imati oblik Ej (A) = (−1)k+j Akj Dkj (A) + (−1)l+j Alj Dlj (A).
1.2. DETERMINANTNA FUNKCIJA
7
Neka je B matrica reda (n−1)×(n−1) nastala iz matrice A(l|j) tako ˇsto smo izvrˇsili l − k − 1 med¯usobnu zamjenu vrsta i to tako da su k−ta i k + 1 vrsta zamjenile med¯usobno mjesto, zatim bivˇsa k−ta sa k + 2 vrstom i tako dolje sve dok k−ta vrsta ne dod¯e izmed¯u vrsta l − 1 i l + 1. Kako su kod matrice A k−ta i l−ta vrste jednake to ´ce biti B = A[k, j]. Tada je Dkj (A) = D(B) = (−1)l−k−1 D(A[l, j]), tj. Dlj (A) = (−1)−l+k+1 Dkj (A), pa je Ej (A) = (−1)k+j Akj Dkj (A) + (−1)l+j Alj Dlj (A) = (−1)k+j Akj Dkj (A) + (−1)l+j (−1)k+1−l Alj Dkj (A) = (−1)k+j Akj Dkj (A) + (−1)k+j+1 Akj Dkj (A) = 0, jer je Alj = Akj . Dakle, Ej je alterniraju´ca n−linearna funkcija. Neka je sada D determinantna funkcija. Da bi dokazali da je Ej determinantna funkcija potrebno je dokazati da je Ej (I (n) ) = 1, gdje je I (n) jediniˇcna matrica reda n × n. Kako je I (n) (j | j) = I (n−1) , to je ³ ´ Djj (I (n) ) = D(I (n) (j | j)) = D I (n−1) = 1. Budu´ci da je Iij = δij , to u sumi (1.2.3) ostaje samo sabirak δjj Djj (I (n) ) koji je jednak 1. Ovim smo dokazali da je Ej (I (n) ) = 1. Primjer 1.2.10. Neka je n = 1. Posmatrajmo funkciju D : R1×1 → R definisanu sa D((α)) = α, gdje je (α) proizvoljna matrica reda 1 × 1. Tada je oˇcigledno D determinantna funkcija.
Primjer 1.2.11. Neka je n = 2 i B proizvoljna matrica reda 2 × 2 nad prstenom R. Tada je E1 (B) = (−1)1+1 B11 D11 (B) + (−1)2+1 B21 D21 = B11 B22 − B21 B12 , E2 (B) = (−1)1+2 B12 D12 (B) + (−1)2+2 B22 D22 = −B12 B21 + B11 B22 . Dakle, E1 (B) = E2 (B). Prema prethodnom teoremu je E1 determinantna funkcija na R2×2 . Kako vidimo ova determinantna funkcija se poklapa sa klasiˇcnom determinantom drugog reda.
Iz ova dva primjera vidimo da za n = 1 i n = 2 postoje determinantne funkcije reda n. Postavlja se pitanje da li za svaki prirodan broj n postoji determinantna funkcija. Odgovor na to pitanje slijedi iz prethodne teoreme primjenom indukcije po n. Posljedica 1.2.12. Neka je n prirodan broj ve´ci od 1. Tada postoji determinantna funkcija na Rn×n . Primjer 1.2.13. Neka je R prsten polinoma nad poljem realnih brojeva i
x−1 0 A= 0
x2 x−2 0
x3 1 . x−3
8
GLAVA 1. DETERMINANTE
Tada je
¯ ¯ x−2 E1 (A) = (x − 1) ¯¯ 0 ¯ ¯ 0 1 E2 (A) = −x2 ¯¯ 0 x−3
¯ 1 ¯¯ = (x − 1)(x − 2)(x − 3), x−3 ¯ ¯ ¯ ¯ ¯ ¯ x3 ¯¯ ¯ + (x − 2) ¯ x − 1 ¯ ¯ 0 x−3 ¯
= E3 (A)
(x − 1)(x − 2)(x − 3), ¯ ¯ ¯ ¯ ¯ ¯ x − 1 x2 ¯ ¯ 3 ¯ 0 x−2 ¯ ¯ + (x − 3) ¯ − = x ¯ 0 0 ¯ 0 0 ¯ ¯
=
1.2.1
¯ ¯ x−1 ¯ ¯ 0
¯ x3 ¯¯ x−2 ¯
(x − 1)(x − 2)(x − 3).
Zadaci
1. Svaki od sljede´cih izraza definiˇse funkciju D na skpu 3 × 3 matrica nad poljem realnih brojeva. U kojem sluˇcaju je D 3−linearna funkcija? (a) (b) (c) (d) (e)
D(A) = A11 + A22 + A33 ; D(A) = (A11 )2 + 3A11 A22 ; D(A) = A11 A12 A33 ; D(A) = A13 A22 A32 + 5A12 A22 A32 ; D(A) = 0;
2. Neka je R komutativan prsten sa jedinicom. Ako je A neka 2 × 2 matrica onda matricu adj A definiˇsemo relacijom µ ¶ A22 −A12 adj A = . −A21 A11 Neka det A oznaˇcava klasiˇcnu determinantu matrice A reda 2 × 2. Pokazati da je (a) (adj A)A = A(adj A) = (det A)I; (b) det (adj A) = det A; (c) adj (At ) = (adj A)t , pri ˇcemu At oznaˇcava transponovanu matricu matrice A. 3. Neka je A neka 2 × 2 matrica nad poljem F. (a) Pokazati da je A invertibilna ako i samo ako je det A 6= 0. Dati formulu za A−1 . (b) Ako je A2 = 0, pokazati da za svaki skalar α ∈ F vrijedi det (αI − A) = α2 . 4. Neka je F polje i A matrica reda 2×3 nad F. Definiˇsimo vektor (γ1 , γ2 , γ3 ) ∈ F3 relacijama: ¯ ¯ ¯ ¯ ¯ ¯ ¯ A11 A12 ¯ ¯ A13 A11 ¯ ¯ A12 A13 ¯ ¯ ¯ ¯ ¯ , γ2 = ¯ γ1 = ¯¯ ¯ A23 A21 ¯ , γ3 = ¯ A21 A22 ¯ , . A22 A23 ¯ Pokazati da je:
1.3. JEDINSTVENOST DETERMINANTNE FUNKCIJE
9
(a) rang A = 2 ako i samo ako je (γ1 , γ2 , γ3 ) 6= (0, 0, 0); (b) Ako A ima rang 2, onda je (γ1 , γ2 , γ3 ) baza prostora rjeˇsenja sistema liearnih jednaˇcina AX = 0.
1.3
Jedinstvenost determinantne funkcije
U ovom paragrafu ´cemo dokazati jedinstvenost determinantne funcije na skupu Rn×n . Da bi to dokazali moramo uvesti pojam permutacije i ispitati neke njene osnovne osobine. Neka je D alterniraju´ca n−linearna funkcija na Rn×n i A matrica nad R sa vrstama α1 , α2 , . . . , αn . Oznaˇcimo sa ²1 , ²2 , . . . , ²n vrste jediniˇcne matrice I (n) . Tada je n X A(i, k1 )²k1 , 1 ≤ i ≤ n. αi = k1 =1
Odavde je D(A) = D(
n X
A(1, k1 )²k1 , α2 , . . . , αn )
k1 =1 n X
=
A(1, k1 )D(²k1 , α2 , . . . αn ).
k1 =1
Ako u ovoj jednakosti zamjenimo α2 sa α2 =
n X
A(2, k2 )ek2
k2 =1
ima´cemo D(A) =
n n X X
A(1, k1 )A(2, k2 )D(²k1 , ²k2 , α3 , . . . , αn ).
k1 =1 k2 =1
Nastavljaju´ci ovaj postupak na kraju ´cemo imati D(A) =
n X n X k1 =1 k2 =1
···
n X A(1, k1 )A(2, k2 ) · · · A(n, kn )D(²k1 , ²k2 , . . . , ²kn ).
(1.3.1)
kn
Poˇsto je D alterniraju´ca funkcija, to je D(²k1 , ²k2 , . . . , ²kn ) = 0 kad god su dva indeksa k1 , k2 , . . . , kn jednaka. Dakle, D(²k1 , ²k2 , . . . , ²kn ) 6= 0 ako i samo ako su svi indeksi k1 , k2 , . . . , kn razliˇciti, tj. ako predstavljaju neku permutaciju skupa {1, 2, . . . , n}. Pri ˇcemu pod permutacijom skupa {1, 2, . . . , n} podrazumjevamo bijektivno preslikavanje skupa {1, 2, . . . , n} na samog sebe. Ako je π neka permutacija skupa onda izraz µ ¶ 1 2 ... n π= π(1) π(2) . . . π(n)
10
GLAVA 1. DETERMINANTE
znaˇci da permutacija π broju k pridruˇzuje broj π(k). Permutacija skupa {1, 2, . . . , n} ima n!. Skup svih tih permutacija ˇcini grupu u odnosu na slaganje (kompoziciju) preslikavanja. Tu grupu oznaˇcavamo sa Sn . Zbg toga formulu (1.2.2) moˇzemo napisati u obliku X ¡ ¢ D(A) = A(1, π(1))A(2, π(2)), . . . , A(n, π(n))D ²π(1) , ²π(2) , . . . , ²π(n) (1.3.2) π∈Sn
Sada ´cemo pokazati da je uvijek ¡ ¢ D ²π(1) , ²π(2) , . . . , ²π(n = ±1D(I). Niz π(1), π(2), . . . , π(n) nastao je od niza 1, 2, . . . , n med¯usobnom zamjenom mjesta u konaˇcnom broju parova. Svaka zamjena mjesta dovodi do promjene znaka determinantne funkcije. Ako smo imali ukupno m zamjena onda je ¡ ¢ D ²π(1) , ²π(2) , . . . , ²π(n) = (−1)m D (²1 , ²2 , . . . , ²n ) = (−1)m D(I). (1.3.3) Ispitajmo sada vezu izmed¯u broja m i permutacije π. Razmotrimo prvo sljede´ce primjere. Primjer 1.3.1. Neka je
µ π=
1 3
2 5
3 1
4 2
5 6
6 4
¶ .
Da bismo dobili niz 3, 5, 1, 2, 6, 4 iz niza 1, 2, 3, 4, 5, 6 potrebno je izvrˇsiti sljede´ce zamjene mjesta u parovima:(1, 3); (2, 5); (4, 2); (4, 6). Na taj naˇcin dobijamo redom nizove 3, 2, 1, 4, 5, 6; 3, 5, 1, 4, 2, 6; 3, 5, 1, 2, 4, 6 i 3, 5, 1, 2, 6, 4. Dakle, permutacija π je nastala iz niza 1, 2, 3, 4, 5, 6 med¯usobnom zamjenon mjesta u ˇcetiri para.
Primjer 1.3.2. Neka je µ σ=
1 7
2 4
3 1
4 6
5 3
6 5
7 2
¶ .
Izvrˇsimo redom sljede´ce transpozicije, tj. med¯usobne zamjene mjesta u parovima: (1, 7); (2, 4); (1, 3); (2, 6); (3, 5) i (2, 5) i na kraju ´cemo dobiti permutaciju σ.
U kursu Algebre 1 dokaza´ce se da se svaka permutacija moˇze prikazati kao proizvod transpozicija, tj. da se moˇze dobiti med¯usobnom zamjenom mjesta u konaˇcno mnogo parova. Ovu ˇcinjenicu ´cemo sada prihvatiti intuitivno bez dokaza i koristiti je u daljem radu. U prikazu permutacije u obliku proizvoda transpozicija broj transpozicija ne mora biti fiksan, tj. jedna permuacija se moˇze na viˇse naˇcina prikazati u obliku transpozicija i sa razliˇcitim brojem transpozicija. On ˇsto je konstatno u tom prikazu je parnost broja transpozicija. Ako je u jednom prikazu broj transpozicija neparan (paran), onda je u svim drugim prikazima taj
1.3. JEDINSTVENOST DETERMINANTNE FUNKCIJE
11
broj iste parnosti. Zbog toga permutacije dijelimo na parne i neparne. Za permutaciju kaˇzemo da je parna (neparna) ako se moˇze napisati u obliku proizvoda parnog (neparnog) broja transpozicija. Definiˇsimo znak permutacije: ½ 1, ako je π parna sgn π = −1, ako je π neparna m Rezimiraju´ ¡ ci naprijed reˇceno ¢zakljuˇcujemo da vrijedi (−1) = sgn π, pa iz (1.3.3) imamo D ²π(1) , ²π(2) , . . . , ²π(n = sgn π. Sada se (1.3.2) moˇze napisati u obliku X D(A) = (sgn π)A(1, π(1))A(2, π(2)), . . . , A(n, π(n))D(I). (1.3.4) π∈Sn
Ako je D determinantna funkcija, onda je D(I) = 1, pa iz (1.3.4) slijedi da je determintna funkcija jednoznaˇcno odred¯ena na skupu matrica reda n × n nad prstenom R. Ovako odred¯enu determinantnu funkciju oznaˇcavamo sa det. Dakle, X det(A) = sgn π A(1, π(1))A(2, π(2)), . . . , A(n, π(n)). (1.3.5) π∈Sn
Ovim smo dokazali sljede´ci teorem. Teorem 1.3.3. Neka je R komutativan prsten sa jedinicom i n prirodan broj. Postoji taˇcno jedna determinantna funkcija na skupu n × n matrica nad prstenom R i ta funkcija zadovoljava (1.3.5). Ako je D neka alterniraju´ca funkcija na Rn×n , tada za svaku matricu A ∈ Rn×n vrijedi D(A) = (det A)D(I), gdje je I jediniˇcna matrica reda n × n. Neka je R prsten i π i σ permutacije skupa {1, 2, . . . , n}. Posmatrajmo permutaciju σπ. Broj parova transpozicija u ovoj permutaciji jednak je zbiru broja parova u prikazu permutacija σ i π. To znaˇci da ´ce σπ biti parna permutacija, ako su obje permutacije σ i π parne ili su obje neparne, a neparna ako su permutacije σ i π razliˇcite parnosti. Zbog toga je sgn (σπ) = (sgn σ) (sgn π). Neka je R prsten cijelih brojeva i neka su σ i π permutacije skupa {1, 2, . . . , n}. Neka su ²1 , ²2 , . . . , ²n vrste jediniˇcne matrice I. Neka su A i B matrice sa vrstama ²σ(1) , ²σ(2) , . . . , ²σ(n) i ²π(1) , ²π(2) , . . . , ²π(n) , respektivno. i−ta vrsta matrice B sadrˇzi taˇcno jedan nenulti element 1 i on se nalazi u π(i)−toj koloni. Posmatrajmo matricu BA. Tu je n X (BA)ij = Bik Akj . k=1
i−ta vrsta ove matrice ´ce biti ²(πσ)(i) . Iz ovih uslova slijedi da je det(A) = sgn σ, det(B) = sgn π det(BA) = sgn (πσ). Kako je sgn (πσ) = sgn σ sgn π, to je det(BA) = det(B) · det(A).
12
GLAVA 1. DETERMINANTE
Teorem 1.3.4. Neka je R komutativan prsten sa jedinicom, A i B matrice reda n × n nad prstenom R. Tada je det(AB) = det(A) det(B). Dokaz. Neka je B data n × n matrica nad prstenom R. Definiˇsimo funkciju D : Rn×n → R relacijom D(C) = det(CB), C ∈ Rn×n . Specijalno za C = A imamo D(A) = det(AB). Pokaˇzimo da je D n−linearna alterniraju´ca funkcija. Ako su α1 , α2 , . . . , αn vrste matrice A, onda je D(A) = det(α1 B, α2 B, . . . , αn B), pri ˇcemu αi B oznaˇcava proizvod matrice αi reda 1 × n i matrice B. Taj rezultat je matrica reda 1 × n i predstavlja i−tu vrstu matrice AB. Kako je (λαi + µαi0 )B = λ αi B + µ αi0 B i funkcija det determinantna funkcija, pa je n−linearna funkcija, to je D n−linearna funkcija. Pokaˇzimo da je D alterniraju´ca funkcija. Neka je αi = αj za neke i, j ∈ {1, 2, . . . , n}. Tada je αi B = αj B, pa matrica AB ima dvije jednake vrste. Kako je det alterniraju´ca funkcija, to je det(AB) = 0. Dakle, D(A) = 0. Ovim smo pokazali da je D n−linearna alterniraju´ca funkcija, pa je na osnovu prethodne teoreme D(A) = det(A)D(I). Prema definiciji funkcije D imamo D(I) = det(IB) = det(B). Dakle, D(A) = det(A) det(B), tj. det(AB) = det(A) det(B).
1.3.1
Zadaci
1. Neka je R komutativan prsten sa jedinicom. Dokazati da je 0 a b 0 c = 0; (a) det −a −b −c 0 1 a a2 (b) det 1 b b2 = (b − a)(c − a)(c − b). 1 c c2 2. Neka je A neka 2 × 2 matrica nad poljem F. Dokazati da je det(I + A) = 1 + det(A) ako i samo ako je trag matrice A jednak nuli. (Trag matrice A je suma svih elemenata na glavnoj dijagonali matrice A. U naˇsem sluˇcaju to je A11 + A22 .)
1.4.
JOSˇ NEKE OSOBINE DETERMINANTI
13
3. Matrica A reda n×n naziva se gornje trougaona matrica ako je Aij = 0 kada je i > j, a donje trougaona, ako je Aij = 0 kad god je i < j. Gornju odnosno donju trougaonu matricu jednim imenom nazivamo trougaona matrica. Dokazati da je determinanta trougaone matrice jednaka proizvodu elemenata na glavnoj dijagonali, tj det(A) = A11 A22 . . . Ann . 4. Neka je A neka 3 × 3 matrica nad poljem kompleksnih brojeva. Formirajmo matricu xI − A kod koje su koeficijenti polinomi δij x − Aij prvog stepena. Ako je f = det(xI − A), pokazati da je f monik polinom stepena 3. Ako taj polinom napiˇsemo u obliku f = (x − λ1 )(x − λ2 )(x − λ3 ) dokazati da je λ1 + λ2 + λ3 = trag(A) i λ1 λ2 λ3 = det(A).
1.4
Joˇ s neke osobine determinanti
U ovom paragrafu dokaza´cemo joˇs neke osobine determinanti koje imaju veliku praktiˇcnu primjenu. Teorem 1.4.1. det(At ) = det(A). Dokaz. Prema definiciji transponovane matrice vrijedi Atij = Aji za svako i i svako j. Neka je σ proizvoljna permutacija skupa {1, 2, . . . , n}. Tada je At (i, σ(i)) = A(σ(i), i) za svako i. Kako je σ bijektivno¡ preslikavanje, to za svako i postoji j takav da je ¢ −1 −1 i = σ (j), pa je A (σ(i), i) = A j, σ (j) . Sada imamo X det(At ) = (sgn σ)At (1, σ(1))At (2, σ(2)) · · · At (n, σ(n)) σ∈Sn
=
X
(sgn σ)A(σ(1), 1)A(σ(2), 2) · · · A(σ(n), n)
σ∈Sn
=
X
¡ ¢ ¡ ¢ ¡ ¢ (sgn σ)A 1, σ −1 (1) A 2, σ −1 (2) . . . A n, σ −1 (n)
σ∈Sn
Pemutacije σ i σ −1 imaju isti znak, jer je σσ −1 identiˇcna permutacija, pa je parna. S druge strane kada σ prolazi skupom Sn isto je kao i da σ −1 prolazi skupom Sn . Naime, ako je τ ∈ Sn bilo koji element, onda je i τ −1 element Sn . Ako je τ −1 ∈ Sn , onda je i τ ∈ Sn . Zbog toga je X ¡ ¢ ¡ ¢ ¡ ¢ det(At ) = (sgn σ)A 1, σ −1 (1) A 2, σ −1 (2) . . . A n, σ −1 (n) σ∈Sn
=
X
¡ ¢ ¡ ¢ ¡ ¢ (sgn σ −1 )A 1, σ −1 (1) A 2, σ −1 (2) . . . A n, σ −1 (n)
σ −1 ∈Sn
= det(A)
Teorem 1.4.2. Neka je matrica B dobijena iz matrice A tako ˇsto smo i−toj vrsti dodali j−tu vrstu pomnoˇzenu skalarom λ. Tada je det(B) = det(A).
14
GLAVA 1. DETERMINANTE
Dokaz. Bez ograniˇcenja opˇstosti moˇzemo pretpostaviti da je i < j. Neka su β1 , β2 , . . . , βn vrste matrice B. Tada je ½ βk =
αk , ako je k 6= i αi + λαj , ako je k = i.
Zbo toga je det(B) = det(α1 , . . . , αi−1 , αi + λαj , αi+1 , . . . , αj , . . . , αn ) = det(α1 , α2 , . . . , αn ) + det(α1 , . . . αi−1 , λαj , αi+1 , . . . , αj , . . . , αn ) = det(A) + λdet(α1 , . . . αi−1 , αj , αi+1 , . . . , αj , . . . , αn ) = det(A) + 0 = det(A). Time je dokaz zavrˇsen. Teorem 1.4.3. Neka je A matrica reda r × r, B matrica reda r × s i C matrica reda s × s nad prstenom R. Tada je µ ¶ A B det = det(A)det(C), 0 C gdje je 0 nula matrica reda s × r. Dokaz. Definiˇsimo funkciju µ D(A, B, C) = det
A B 0 C
¶ .
Ako fiksiramo A i B, onda D zavisi samo C. Iz definicije funkcije D slijedi da je D s−linearna alterniraju´ca funkcija vrsta matrice C. Tada je µ ¶ A B D(A, B, C) = (det(C))D(A, B, I) = (det(C))det , 0 I gdje je I jediniˇcna matrica reda s × s. Primjenjuju´ci prethodnu teoremu na determinantu µ ¶ A B det 0 I dobi´cemo
µ det
A B 0 I
¶
µ = det
A 0 0 I
¶ = D(A, 0, I).
Funkcija D(A, 0, I) je r−linearna alterniraju´ca funkcija, pa je D(A, 0, I) = (det(A))D(I, 0, I) = (det(A)) · 1,
1.4.
JOSˇ NEKE OSOBINE DETERMINANTI
jer je
µ D(I, 0, I) = det
I 0 0 I
¶
15
³ ´ = det I (r+s) = 1.
Konaˇcno imamo D(A, B, C) = (det(C))D(A, B, I) = (det(C))D(A, 0, I) = (det(C))(det(A))D(I, 0, I) = (det(C)) (det(A)).
Primjer 1.4.4. Neka je
1 2 A= 4 1
−1 2 1 2
3 2 . −1 0
2 0 −1 3
Odredimo determinantu matrice A. To ´cemo uraditi tako ˇsto ´cemo matricu A prevesti u blok matricu i primjeniti prethodni teorem. To prevod¯enje se moˇze uraditi na sljede´ci naˇcin: pomnoˇzimo prvu vrstu sa -2 i dodamo drugoj. Tada ´ce druga vrsta imati oblik 0, 4,-4,-4. Zatim ponovo mnoˇzimo prvu vrstu sa -4 i dodajemo tre´coj. Tre´ca vrsta ´ce imati oblik 0,5,9,-13. Sada mnoˇzimo prvu vrstu sa -1 i dodajemo ˇcetvroj i dobijamo 0,3,1,-3. Sada drugu vrstu mnoˇzimo sa − 54 i dodajemo tre´coj i dobijamo 0,0,-4,-8. Drugu vrstu mnoˇzimo sa − 34 i nakon dodavanja ˇcetvrtoj dobije se 0,0,4,0. Tako smo dobili matricu 1 −1 2 3 0 4 −4 −4 . B= 0 0 −4 −8 0 0 4 0 Kako vidimo ovu matricu moˇzemo napisati u obliku blok matrice ¶ µ U V B= , 0 W gdje je
µ U=
1 0
−1 4
¶
µ , V =
2 −4
3 −4
¶
µ iW =
−4 4
−8 0
¶ .
Tada je det(B) = (det(U )) · (det(V )) = 4 · 32 = 128.
Neka je n prirodan broj ve´ci od 1 i A matrica reda n × n nad prstenom R. U teoremu 1.2.9 smo konstruisali determinantnu funkciju na Rn×n , pomo´cu neke zadane determinantne funkcije na R(n−1)×(n−1) . Sada ´cemo dokazati jedinstvenost determinantne funkcije na Rn×n . Dokazali smo ranije da za svaku n−linearnu alterniraju´cu funkciju D vrijedi D(A) = det(A)D(I). Kako svaka determinantna funkcija D je n−linearna alterniraju´ca funkcija za koju je D(I) = 1, to je D(A) = det(A) · 1 = det(A).
16
GLAVA 1. DETERMINANTE
Dakle, svaka determinantna funkcija D je jednaka det, gdje je X det(A) = (sgn π)A(1, π(1) · · · A(n, π(n)). π∈Sn
Ako u formuli (1.2.3) fiksiramo kolonu j imamo det(A) =
n X
(−1)i+j Aij det(A(i | j)).
(1.4.1)
i=1
Skalar (−1)i+j det(A(i | j)) se naziva kofaktor elementa Aij . Formulu (1.4.1) nazivamo razvoj determinante matrice A po j−toj koloni. Stavimo Cij = (−1)i+j detA(i | j). Tada formulu (1.4.1) moˇzemo napisati u obliku n X det A = Aij Cij . i=1
Postavlja se pitanje ˇcemu je jednaka suma n X
Aik Cij
i=1
ako je k 6= j. Da bi odgovorili na ovo pitanje posmatrajmo matricu B koja je nastala iz matrice A tako ˇsto smo njenu j−tu kolonu zamjenili sa k−tom kolononom, tj. Bij = Aik za svako i. Matrica B ima dvije kolone (i−tu i j−tu) jednake, pa je njena determinanta jednaka nuli. Dakle, 0 = det B n X = (−1)i+j Bij detB(i | j) i=1
=
n X
(−1)i+j Aik detB(i | j)
i=1
=
n X
Aik Cij .
i=1
Prema tome vrijedi
n X
Aik Cij = 0.
(1.4.2)
i=1
Formule (1.4.1) i (1.4.2) moˇzemo napisati u obliku n X
Aik Cij = δjk det A.
(1.4.3)
i=1
Budu´ci da je det(At ) = det(A), to se analogno pokazuje da vrijedi n X k=1
Aik Cjk = δij det A.
(1.4.4)
1.4.
JOSˇ NEKE OSOBINE DETERMINANTI
17
Matricu adj A koja je transponovana matrica kofaktora matrice A nazivamo klasiˇcna adjungovana matrica matrice A. Dakle, (adj A)ij = Cji = (−1)i+j A(j | i).
(1.4.5)
(adj A)A = (det A)I,
(1.4.6)
Iz formule (1.4.3) slijedi a iz fomule(1.4.4) slijedi A(adj A) = (det A)I. Dakle, A(adj A) = (adj A)A = (det A)I. Definicija 1.4.5. Za matricu A ∈ Rn×n kaˇzemo da je invertibilna ako postoji matrica A−1 ∈ Rn×n takva da je AA−1 = A−1 A = I. Teorem 1.4.6. Neka je A matrica reda n × n nad prstenom R. Matrica A je invertibilna ako i samo ako je det A invertibilan element prstena R. Kada je matrica A invertibilna onda je A−1 = (det A)−1 adj A. (1.4.7) Specijalno, kvadratna matrica A nad poljem F je invertibilna ako i samo ako je det A 6= 0. Dokaz. Neka je matrica A invertibilna. Tada postoji matrica A−1 i vrijedi A A−1 = I = A−1 A. Odavde je 1 = det(I) = det (A A−1 ) = det A · det (A−1 ) = det (A−1 ) · det A. Odavde slijedi da je element det A invertibilan element prstena R i vrijedi (det A)−1 = det A−1 . Obrnuto ako je det A invertibilan element prstena R, onda iz (1.4.7) slijedi da je matrica (det A)−1 adj A inverzna matrica matrice A. Primjer 1.4.7. Neka je
µ A=
2 5
3 a
¶ (a ∈ Z)
matrica nad prstenom cijelih brojeva. Odredimo adj A i ispitajmo za koje vrijednosti parametra a postoji inverzna matrica A−1 . Kratkim raˇcunom nalazimo det A = 2a − 15. U prstenu cijelih brojeva jedni invertibilni elementi su 1 i -1. Iz det A = 1 slijedi a = 8, a iz det A = −1 slijedi a = −7. Dalje je µ ¶ a −3 adj A = . −5 2 Odavde je (adj A)A = (2a − 15)I. Za a = 8 inverzna matrica je A−1 = adj A, a za a = −7 inverzna matrica je A−1 = −adj A.
18
GLAVA 1. DETERMINANTE
Prisjetimo se da su matrice A i B sliˇcne ako postoji invertibilna matrica P takva da je B = P −1 AP. Odavde je det(B) = det(P −1 AP ) = det(P −1 ) det (A) det (P ) = (det (P ))−1 det (A) det (P ) = det (A). Dakle, sliˇcne matrice imaju jednake determinante. S druge strane sve sliˇcne matrice odgovaraju istoj linearnoj transformaciji konaˇcno-dimenzionalnog vektorskog prostora. To nam daje ideju da definiˇsemo determinantu linearne transformacije konaˇcno-dimenzionalnog vektorskog prostora V. Determinanta linearne transformacije A konaˇcno dimenzionalnog prostora V je determinanta matrice A te linearne transformacije u odnosu na neku ured¯enu bazu prostora V.
1.4.1
Kramerovo pravilo
Primjenimo sada determinante na rjeˇsavanje sistema od n jednaˇcina sa n nepoznatih nad prstenom R. Neka je A matrica tog sistema. Taj sistem moˇzemo napisati u matriˇcnom obliku AX = B. Ako je matrica A invertibilna, tj. ako je det (A) invertibilan element prstena R, onda je X = A−1 B. Kako je A−1 = (det A)−1 adj A, to je X = (det A)−1 (adj A)B. Neka je X = (ξ1 ξ2 . . . ξn )t i B = (η1 η2 . . . ηn )t . Tada imamo ξj
= (det A)−1 = (det A)−1
n X i=1 n X
(adj A)ji ηi (−1)i+j ηi det A(i | j),
(j = 1, 2, . . . , n).
i=1
Neka je Cj matrica koja je nastala iz matrice A tako ˇsto smo j−tu kolonu zamjenili kolonom (η1 η2 . . . ηn )t slobodnih ˇclanova. Neka je Dj = det Cj . Determinantu Dj ´cemo raˇcunati razvijaju´ci je po j−toj koloni. Tada je Dj =
n X
(−1)i+j ηi det A(i | j).
i=1
Dakle, imamo ξj = (det A)−1 Dj ,
(j = 1, 2, . . . , n),
pa je rjeˇsenje sistema ¡ ¢ (det A)−1 D1 , (det A)−1 D2 , . . . , (det A)−1 Dn .
(1.4.8)
1.4.
1.4.2
JOSˇ NEKE OSOBINE DETERMINANTI
19
Zadaci
1. Kriste´ci klasiˇcnu adjungovanu matricu izraˇcunati inverznu matricu matrica: −2 3 2 cosθ 0 −sinθ 6 0 3 , 0 1 0 . 4 1 −1 sinθ 0 cosθ 2. Koriste´ci Kramerovo pravilo rijeˇsiti sisteme (a) x + y + 7 = 11 2x − 6y − z = 0 3x + 4y + 2z = 0 (b) 3x − 2y = 7 3y − 2z = 6 3z − 2x = −1. 3. Za kvadratnu matricu A kaˇzemo da je antisimetriˇ cna ako je At = −A. Ako je A antisimetriˇca reda n × n nad poljem kompleksnih brojeva i ako je n neparan broj, dokazati da je det A = 0. 4. Za matricu A ∈ Fn×n kaˇzemo da je ortogonalna ako je AAt = I. Ako je A ortogonalna, matrica dokazati da je det A = ±1. Navesti primjer ortogonalne matrice kod koje je determinanta -1. 5. Za matricu A ∈ Cn×n kaˇzemo da je unitarna ako je AA∗ = I, pri ˇcemu je A∗ konjugovana matrica matrice At . Ako je A unitarna matrica dokazati da je |det A| = 1. 6. Neka je V vektorski prostor n × n matrica nad poljem F. Neka je B fiksan element vektorskog prostora V i TB linearna transformacija prostora V definisana relacijom TB (A) = AB − BA. Pokazati da je det TB = 0. 7. Neka je A matrica reda m × n nad poljem F i neka je A 6= 0. Ako je r prirodan broj, za matricu r × r koja je nastala brisanjem m − r vrste i n − r kolona matrice A kaˇzemo da je submatrica matrice A. Najve´ci prirodan broj r naziva se determinantni rang matrice A ako postoji submatrica matrice A reda r × r ˇcija je determinanta razliˇcita od nule. Dokazati da je determinantni rang matrice jednak rangu kolona i rangu vrsta matrice, tj. da se ova sva tri ranga poklapaju. 8. Neka je A matrica reda n × n nad poljem F. Dokazati da postoji najviˇse n skalara λ takvih da je det (λI − A) = 0.
20
GLAVA 1. DETERMINANTE 9. Neka su A i B matrice reda n × n nad poljem F. Neka je je A invertibilna matrica. Pokazati da postoji najviˇse n skalara λ ∈ F takvih da matrica λ A+B nije invertibilna.
10. Neka je V = Cn×n i B fiksna n × N matrica iz V. Definiˇsimo linearnu transformaciju MB prostora V relacijom MB (A) = BAB ∗ . Dokazati da je det MB = |det B|2n . Neka je H skup svih hermitskih matrica prostora V, tj. H = {A ∈ V | A∗ = A}. Tada je H vektorski prostor nad poljem realnih brojeva. Pokazati da je funkcija TB definisana relacijom TB (A) = BAB ∗ linearna transformacija vektorskog prostora H i pokazati da je det TB = | det B |2n .
1.5
Moduli
Pojam vektorskog prostora ´cemo uopˇstiti uvode´ci pojam modula nad komutativnom prstenu sa jedinicom. Definicija 1.5.1. Neka je R komutativan prsten sa jedinicom. Kaˇzemo da je V modul nad prstenom R ako je 1. (V, +) Abelova grupa; 2. Postoji preslikavanje R×V → V, koje ured¯enom paru (α, x) ∈ R×V pridruˇzuje element α x ∈ V, koje ima osobine: (a) (α + β)x = α x + β x, (b) α (x + y) = α x + α y, (c) (α β) x = α(β x), (d) 1 x = x za svako α, β ∈ R i svako x, y ∈ V. Ako je V modul nad prstenom R, onda se to kra´ce kaˇze da je V jedan R−modul. Ako je R polje, onda je V vektorski prostor. Dakle, svaki vektorski prostor je i modul, ali obrnuto ne mora da vaˇzi. Svaki prsten je modul sam nad sabom, Drugi vaˇzan primjer modula je V = n R , tj. skup svih ured¯enih n−torki elemenata prstena R u odnosu na klasiˇcnu operaciju sabiranja n−torki po komponentama i mnoˇzenja n−torki skalarom po komponentama. Pojam linearne kombinacije za elemente modula se definiˇse isto kao i za vektorske prostore. Isto tako uvodi se pojam generatora i baze za module kao i za vektorske prostore. Linearno nezavisan generator se naziva baza modula.
1.5. MODULI
21
Primjer 1.5.2. Neka je R = Z prsten cijelih brojeva i V = Z6 = {¯0, ¯1, ¯2, ¯3, ¯4, ¯5}.
Definiˇsimo sabiranje u V relacijom a ¯ + ¯b = c¯ ako i samo ako je a + b ≡ c (mod 6). Tada je (V, +) Abelova grupa. Definiˇsimo sada preslikavanje R × V → V na sljede´ci naˇcin n a ¯ = ¯b ako i samo ako je na ≡ b (mod 6). Jednostavno se pokazuje da je V modul nad prstenom R. Oˇcigledno je skup {¯1} generator modula V, jer je a ¯ = a ¯1 za svako a ¯ ∈ V. Neka je ¯b ¯ ¯ prizvoljan element iz V. Tada je 6 b = 0, jer je 6b ≡ 0 (mod 6). Kako je 6 6= 0 u prstenu R = Z, svaki neprazan podskup skupa V je linearno zavisan. To znaˇci da modul V nema bazu.
Iz ovog primjera se vidi da postoje moduli koji nemaju bazu. S druge strane svaki vektorski prostor je modul, a svaki vektorski prostor ima bazu1 , pa, dakle, postoje moduli koji imaju bazu. Definicija 1.5.3. Za R−modul V kaˇzemo da je slobodan modul, ako on ima bazu. Ako V ima bazu sastavljenu od n elemenata, onda kaˇzemo da je V slobodan R−modul generisan sa n elemenata. Definicija 1.5.4. Modul V je konaˇcno generisan ako sadrˇzi konaˇcan podskup koji ga generiˇse. Rang konaˇcno generisanog modula je najmanji prirodan broj k takav da postoji k elemenata iz V koji generiˇsu V. Definicija 1.5.5. Neka su V i W R−moduli. Za preslikavanje f : V → W kaˇzemo da je homomorfizam modula ako vrijedi: (a) f (ab) = f (a) + f (b), (b) f (α a) = α f (a) za svako a, b ∈ V i svak α ∈ R. Injektivni homomorfizam modula naziva se monomorfizam modula. Sirjektivni homomorfizam modula naziva se epimorfizam modula. Bijektivni homomorfizam modula naziva se izomorfizam modula. Neka je V slobodan R−modul i neka je {e1 , e2 , . . . en } baza modula V. Tada se svaki element x modula V moˇze na jedinstven naˇcin prikazati u obliku x = ξ1 e1 + ξ2 e2 + · · · + ξn en , (ξi ∈ R). Dakle, svaki element x ∈ R jednoznaˇcno odred¯uje ured¯enu n−torku (ξ1 , ξ2 , . . . , ξn ) ∈ Rn . Ako je x=
n X i=1
ξi ei , y =
n X
ψi ei ,
i=1
1 Mi smo dokazali egzistenciju baza sa konaˇcno dimenzionalne vektorske prostore, ali to vrijedi i za bilo koje vektorske prostore. Dokaz te ˇcinjenice zasniva se na Zornovoj lemi. Zornova lema obezbjed¯uje egzistenciju maksimalnog linearno nezavisnog podskupa, a zatim se dokaˇze da je on baza vektorskog prostora.
22
GLAVA 1. DETERMINANTE
onda je x+y =
n X
(ξi + ψi )ei , αx =
i=1
n X
(αξi )ei .
i=1
To znaˇci da je preslikavanje f : V → Rn definisano sa f (x) = (ξ1 , ξ2 , . . . , ξn ), gdje je x = ξ1 e1 + ξ2 e2 + · · · + ξn en homomorfizam modula. Oˇcigledno je ovo preslikavanje izomorfizam modula. Dakle, svaki konaˇcno generisan slobodan R−modul sa bazom od n elemenata je izomorfan sa R−modulom Rn . Teorem 1.5.6. Neka je R komutativan prsten sa jedinicom. Ako je V slobodan R−modul sa bazom od n elemenata, tada je rang modula V jednak n. Dokaz. Na osnovu pretpostavke teorema i priˇce koja je prethodila teoremu slijedi da je modul V izomorfan sa modulom Rn . Ako pretpostavimo da tvrdnja nije taˇcna, tj. da je rang modula V manji od n, onda postoji generator {f1 , f2 , . . . , fm } modula V koji ima m < n elemenata. No tada, zbog izomorfizma postoji generator {α1 , α2 , . . . , αm } modula Rn . Neka je {²1 , ²2 , . . . , ²n } standardna baza modula Rn . Tada je m X ²j = λji αi (j = 1, 2, . . . , n) (1.5.1) i=1
Skalari λji (i = 1, 2, . . . , m; j = 1, 2, . . . , n) odred¯uju neku matricu P ∈ Rn×m . Elemente αi ∈ Rn moˇzemo prikazati pomo´cu standardne baze, tj. αi =
n X
Aik ²k ,
(i = 1, 2, . . . , m).
k=1
Sada jednakost (1.5.1) moˇzemo napisati u obliku
²j
= =
m X
Ã
n X
λji i=1 k=1 Ãm n X X
! Aik ²k !
λji Aik
k=1
²k ,
(j = 1, 2, . . . n)
i=1
Odavde slijedi δjk =
m X
λji Aik ,
(j = 1, 2, . . . , n, k = 1, 2, . . . , m).
i=1
Dakle, P A = I, P ∈ Rn×m , A ∈ Rm×n , gdje je I jediniˇcna matrica reda n × n. ∼
Neka je A kvadratna matrica reda n × n nastala dopisivanjem, na dnu matrici A, ∼
novih n − m vrsta sastavljenih od nula, a P kvadratna matrica reda n × n nastala
1.5. MODULI
23
dopisivanjem na kraju novih n − m kolona koje su sve sastavljene od nula. Tada je ∼∼
P A = I, pa je
µ ¶ ∼∼ ∼ ∼ 1 = det I = det P A = (det P ) (det A). ∼
∼
To znaˇci da je det A invertibilan element prstena R. No, matrica det A ima posljed∼
njih n − m vrsta sastavljenih od nula, pa je det A = 0. Kontradikcija! Pretpostavka da je rang modula V manji od n dovela nas je do kontradikcije, pa nije taˇcna. Ako je V R−modul, dualni modul V ∗ se sastoji od svih linearnih funkcija sa V u R. Ako je V slobodan modul ranga n, onda je i V ∗ slobodan modul ranga n. Ova ˇcinjenica se dokazuje potpuno isto kao i za vektorske prstore, pa njen dokaz ne´cemo ni navoditi. Ako je {e1 , e2 , . . . , en } ured¯ena baza modula V, onda postoji dualna baza {f1 , f2 , . . . , fn } modula V ∗ . Analogno kao i kod vektorskih prostora vrijedi: x = f1 (x)e1 + f2 (x)e2 + . . . + fn (x)en za svako x ∈ V, f = f (e1 )f1 + f (e2 )f2 + . . . + f (en )fn za svako f ∈ V ∗ .
24
GLAVA 1. DETERMINANTE
Glava 2
Elementarne kanonske forme 2.1
Svojstvene vrijednosti
U ovom paragrafu ispitujemo neka svojstva linearnih transformacija vektorskog prostora, tj. linearnih preslikavanja prostora u samog sebe. Prvo ´cemo uvesti pojam karakteristiˇcne (svojstvene) vrijednosti i karakteristiˇcnog (svojstvenog) vektora, a zatim uvesti pojam svojstvenog potprostora. Definicija 2.1.1. Neka je V vektorski prostor nad poljem F i T linearna transformacija prostora V. Ako za neko λ ∈ F postoji x ∈ V takav da je T (x) = λ x,
x 6= 0,
(2.1.1)
tada se λ zove svojstvena (ili karakteristiˇcna) vrijednost, a x pripadni svojstveni (karakteristiˇcni) vektor linearne transformacije T . Skup svih x ∈ V takvih da je T (x) = λx zove se svojstveni potprostor linearne transformacije T koji odgovara svojstvenoj vrijednosti λ. Iz jednakosti (2.1.1) slijedi (T − λ idV )(x) = 0, x 6= 0.
(2.1.2)
To znaˇci da je 0 6= x ∈ Ker(T − λ idV ), pa je Ker(T − λ idV ) nenulti potprostor prostora V. S druge strane, ako je Ker(T − λ idV ) nenulti potrpostor prostora V, onda je svako x ∈ Ker(T − λ idV ), x 6= 0 svojstveni vektor linearne transformacije T koji odgvara svojstvenoj vrijednosti λ. Ovim smo dokazali sljede´cu lemu. Lema 2.1.2. Neka je T linearna transformacija prostora V. Skalar λ ∈ F je svojstvena vrijednost linearne transformacije T ako i samo ako je Ker(T − λ idV ) nenulti potprostor prostora V. Ako je ovaj uslov ispunjen, onda je svaki nenulti vektor toga potprostora svojstveni vektor koji odgovara svojstvenoj vrijednosti λ. Lema 2.1.3. Neka je V vektorski prostor konaˇcne dimenzije n i T linearna transformacija toga prostora. Tada su sljede´ci uslovi ekvivalentni: (a) λ ∈ F je svojstvena vrijednost od T . 25
26
GLAVA 2. ELEMENTARNE KANONSKE FORME
(b) det (T − λ idV ) = 0. Dokaz. (a) ⇒ (b) Pretpostavimo da je λ ∈ F svosjstvena vrijednost i da je det (T − λ idV ) 6= 0. Tada je linearna transformacija T − λ idV injektivna, pa za svako x ∈ V, x 6= 0 vrijedi (T − λ idv )(x) 6= 0, tj. T (x) 6= λ x za svako 0 6= x ∈ V. Ovo je kontradikciji sa ˇcinjenicom da je λ svojstvena vrijednost linearne transformacije T . (b) ⇒ (a) Pretpostavimo da λ nije svojstvena vrijednost linearne transformacije T . Tada je (T −λ idv )(x) 6= 0, za svako x ∈ V, x 6= 0. Ovo znaˇci da je Ker(T −λ idV ) nula potprostor. Zbog toga je preslikavanje T − λ idv injektivno, pa kako je V konaˇcno dimenzionalan prostor, to je dim V
= rang(T − λidV ) + def (T − λidV ) = rang(T − λidV ) + 0 = rang(T − λidV ).
Dakle, preslikavanje je T −λidV je sirjektivno, pa je izomorfizam vektorskih prostora. Neka je {e1 , e2 , . . . , en } ured¯ena baza prostora V i neka preslikavanju T − λ idV u odnosu na ovu bazu odgovara matrica B. Tada je matrica B invertibilna, pa je det(B) 6= 0. Kontradikcija, jer je det(B) = det(T − λ idV ) = 0. U dokazu prethodne leme koristili smo ˇcinjenicu da je linearna transformacija A invertibilna (tj. izomorfizam) ako i samo ako je njena matrica A, u odnosu na neku ured¯enu bazu B toga prostora, invertibilna. Definicija 2.1.4. Neka je A matrica reda n × n nad poljem F. Kaˇzemo da je λ ∈ F svojstvena vrijednost matrice A ako je matrica A−λ I singularna, tj. neinvertibilna. Neka je λ ∈ F. Kako smo vidjeli λ je svojstvena vrijednost matrice A reda n × n ako i samo ako je det(A − λ I) = 0, tj. ako i samo ako je det(λ I − A) = 0. Posmatrajmo determinantu det(xI −A). Ova determinanta predstavlja neki polinom f stepena n u varijabli x. Prema tome, λ ∈ F je svojstvena vrijednost matrice A ako i samo je λ nula polinoma f koja leˇzi u polju F. Zbog toga polinom f = det(xI − A) nazivamo svojstveni ili karakteristiˇcni polinom matrice A. Vaˇzno je napomenuti da je polinom f monik polinom stepena n. Lema 2.1.5. Sliˇcne matrice A i B nad poljem F imaju iste svojstvene polinome. Dokaz. Neka su matrice A i B nad poljem F sliˇcne. Tada postoji invertibilna matrica P takva da je B = P −1 AP. Odavde je det (xI − B) = det(xI − P −1 AP ) ¡ ¢ = det P −1 (xI − A)P = det P −1 · det (xI − A) · det P = det (xI − A).
Ova lema omogu´cava definiciju svojstvenog polinoma linearne transformacije prostora V konaˇcne dimenzije. Naime, neka je A linearna transformacija prostora
2.1. SVOJSTVENE VRIJEDNOSTI
27
V konaˇcne dimenzije n. Tada u odnosu na ured¯enu bazu B prostora V linearnoj transformaciji A odgovara neka matrica A reda n × n nad poljem F. U odnosu na drugu bazu B1 odgovara´ce joj neka druga matrica B. Ako je P matrica prelaza sa baze B na bazu B1 , onda je B = P −1 AP, pa su matrice A i B sliˇcne nad poljem F. Kako smo vidjeli sliˇcne matrice imaju iste svojstvene polinome. Svojstveni polinom bilo koje matrice A koja je pridruˇzena linearnoj transformaciji u odnosu na neku ured¯enu bazu B prostora V nazivamo svojstveni polinom linearne transformacije A. Primjer 2.1.6. Neka je A linearna transformacija prostora R2 koja u odnosu na standarnu bazu ima matricu
µ A=
0 1
−1 0
Svojstveni polinom linearne transformacije A je ¯ ¯ x 1 det(xI − A) = ¯¯ −1 x
¶ . ¯ ¯ ¯ = x2 + 1. ¯
Kako vidimo ovaj polinom nema realnih korijena, pa linearna transformacija A nema svojstvenih vrijednosti niti svojstvenih vektora.
Primjer 2.1.7. Neka je
3 A= 2 2 realna matrica. Njen svojstveni ¯ ¯ x−3 −1 ¯ ¯ −2 x − 2 ¯ ¯ −2 −2
1 2 2
−1 −1 0
polinom je ¯ 1 ¯¯ 1 ¯¯ = x3 − 5x2 + 8x − 4 = (x − 1) (x − 2)2 . x ¯
Karakteristiˇcne vrijednosti su 1 i 2. Odredimo pripadne svojstvene vektore. Za svojstvenu vrijednost λ = 1 svojstveni vektori su nenulti vektori prostora Ker (A − 1 idV ) , gdje je A linearna transformacija pridruˇzena matrici A u odnosu na neku ured¯enu bazu B = {e1 , e2 , e3 } prostora V = R3 . Dakle, x 6= 0 je svojstveni vektor ako i samo ako je (A − I)[x]B = [0]B . Neka je x = ξ1 e1 + ξ2 e2 + ξ3 e3 . 2 2 2
Tada imamo 1 −1 ξ1 0 1 −1 ξ2 = 0 . 2 −1 ξ3 0
Rjeˇsenje ovog sistema je (ξ1 , 0, 2ξ1 ). Dakle, svojstveni vektori koji odgovaraju svojstvenoj vrijednosti 1 su svi nenulti vektori oblika x = α(e1 + 2e3 ). To znaˇci da je dimenzija prostora Ker(A − idv ) = 1 i da je taj potprostor generisan vektorom e1 + 2e3 . Za svojstvenu vrijednost 2 imamo svojstveni vektor x zadovoljava jednaˇcinu (A − 2I)[x]B = [0]B . Kako je
1 1 A − 2I = 2 0 2 2
−1 −1 , −2
28
GLAVA 2. ELEMENTARNE KANONSKE FORME
to imamo
1 1 2 0 2 2
−1 ξ1 0 −1 ξ2 = 0 . ξ3 0 −2
Rjeˇsenja ovog sstema su (ξ2 , ξ2 , 2ξ2 ) (ξ2 ∈ R). Dakle svojstvene vektori su nenulti vektori oblika α(e1 + e2 + 2e3 ). Kao ˇsto vidimo u oba sluˇcaja potrprostori Ker(A−idV ) i Ker(A−2idv ) imaju dimenzije 1.
Definicija 2.1.8. Neka je A linearna transformacija vektorskog prostora V konaˇcne dimenzije. Kaˇzemo da je linearna transformacija dijagonalizibilna ako i samo ako postoji baza prostora V u kojoj je svaki vektor svojstveni vektor te linearne transformacije. Rezon za davanje ovog imena leˇzi u sljede´coj ˇcinjenici. Neka je B = {e1 , . . . , en } ured¯ena baza sastavljena od svojstvenih vektora linearne transformacije A i ako svojstveni vektori ei odgovaraju svojstvenim vrijednostima λi , onda ovoj linearnoj transformaciji u odnosu na bazu B odgovara dijagonalna matrica λ1 0 · · · 0 0 λ2 · · · 0 [A]B = . . .. . . . . . . 0
0 ···
λn
Ako je linearna transformacija A dijagonalizibilna, onda njeni svojstveni vektori generiˇsu prostor V. U prethodna dva primjera linearne transformacije nisu dijagonalizibilne. U prvom sluˇcaju nemamo nijedan svojstveni vektor, a u drugom sluˇcaju imamo dva linearno nezavisna svojstvena vektora. Kako je dimenzija prostora V = R3 tri, to ova dva svojstvena vektora ne generiˇsu prostor V. Neka je A dijagonalizibilna linearna transformacija prostora V dimenzije n i neka su λ1 , · · · , λk razliˇcite svojstvene vrijednosti transformacije A od kojih se svaka pojavljuje s1 , s2 , . . . , sk , pri ˇcemu je s1 +s2 +· · ·+sk = n. Tada postoji ured¯ena baza B sastavljena od svojstvenih vektora te linearne transformacije. Matrica te linearne transformacije u odnosu na bazu B je λ1 I1 0 ··· 0 0 λ2 I2 · · · 0 [A]B = .. .. .. , . . . 0
0 ···
λk Ik
pri ˇcemu je It jediniˇcna matrica reda st × st , (t = 1, 2, . . . , k). Iz ove matrice primje´cujemo dvije stvari. 1. Prvo svojstveni polinom linearne transformacije A je f = (x − λ1 )s1 (x − λ2 )s2 · · · (x − λk )sk .
2.1. SVOJSTVENE VRIJEDNOSTI
29
2. Viˇsestrukost svojstvene vrijednosti λi kao korijena svojstvenog polinoma jednaka je dimenziji potprostora Ker(A − λi idV ). Ako je polje F algebarski zatvoreno, onda je faktorizacija na linearne faktore bilo kog polinoma uvijek mogu´ca. U tom sluˇcaju za dijagonalizibilnost linearne transformacije bitan drugi uslov. Ako polje nije algebarski zatvoreno, onda postoje polinomi koji nemaju faktorizaciju na linearne faktore. Zbog toga su za dijagonalizibilnost linearne transformacije, u ovom sluˇcaju, bitna oba uslova. Lema 2.1.9. Neka je A(u) = λu. Ako je f neki polinom, tada je (f (A))(u) = f (λ)u. Dokaz. Primjetimo prvo da iz A(u) = λu slijedi A2 (u) = A(A(u)) = A(λu) = λA(u) = λ2 u. Odavde se indukcijom zakljuˇcuje da je Ak (u) = λk u za svaki prirodan broj k. Neka je f=
m X ak xk . k=0
Tada je m X f (A) = ak Ak , k=0
pri ˇcemu je A0 = idV . Sada imamo Ãm ! m X X k (f (A))(u) = ak A (u) = ak Ak (u) =
k=0 m X
k=0
Ãm ! X ak λk u = ak λk u = f (λ)u
k=0
k=0
Lema 2.1.10. Neka je A linearna transformacija vektorskog prostora V konaˇcne dimenzije. Neka su λ1 , λ2 , . . . , λk razliˇcite svojstvene vrijednosti transformacije A i neka je Wi svojstveni potprostor transformacije A koji odgovara svojstvenoj vrijednosti λi . Ako je W = W1 + W2 + · · · + Wk , onda je dim W = dim W1 + dim W2 + · · · + dim Wk .
30
GLAVA 2. ELEMENTARNE KANONSKE FORME
Dokaz. Potprostor W = W1 +W2 +· · ·+Wk je generisan svim svojstvenim vektorima linearne transformacije A. Neka je w1 + w2 + · · · + wk = 0, (wi ∈ Wi ). Trebamo pokazati da je wi = 0 za svako i. Pretpostavimo suprotno, tj. da postoji j takav da je wj 6= 0. Posmatrajmo polinom f takav da je f (λi ) = δij (i = 1, 2, . . . , k). Da li takav polinom postoji? Odgovor je potvrdan npr. takav polinom je f = (x − λj + 1) ·
Y x − λi . λj − λi i6=j
Kako je 0 = f (A)(0) = f (A)(w1 ) + f (A)(w2 ) + · · · + f (A)(wk ) = f (λ1 )w1 + f (λ2 )w2 + · · · + f (λk )wk = 1 · wj = wj . Kontradikcija sa izborom elementa wj ! Neka je Bi ured¯ena baza potprostora Wi , (i = 1, 2, . . . , k) i neka je B = B1 ∪ B2 ∪ · · · ∪ Bk . Tada je B generator potprostora W. Pokaˇzimo da je B linearno nezavisan skup. Pretpostavimo suprotno tj. neka je podskup n o x1,j1 , . . . , x1,js1 , x2,j1 , . . . , x2,js2 , . . . , xk,j1 , . . . , xk,jsk (xi,ji ∈ Wi ) skupa B linearno zavisan skup. Tada je X X γi,ji xi,ji = 0 i
(2.1.3)
ji
i bar jedan od skalara γi,ji nije nula. U ovoj sumi grupiˇsimo vektore po potprostorima Wi . Neka je yi suma svih vektora gornje sume koji su iz potprostora Wi . Tada suma (2.1.3) ima oblik y1 + y2 + · · · yk = 0. Prema prvom djelu dokaza je yi = 0 za svako i. Kako je yi linearna kombinacija vektora baze Bi i yi = 0, to su svi koeficijenti u toj sumi jednaki nuli. Dakle, svi koeficijenti u sumi (2.1.3) su jednaki nuli. Kontradikcija! Pretpostavka da su vektori skupa B linearno zavisni dovela nas je do kontradikcije, pa nije taˇcna. Zato je B baza potprostora W, tj. dim W = dim W1 + dim W2 + · · · + dim Wk , ˇsto je i trebalo dokazati. Sumiraju´ci rezultate prethodnih lema imamo sljede´ci teorem.
2.1. SVOJSTVENE VRIJEDNOSTI
31
Teorem 2.1.11. Neka je A linearno preslikavanje vektorskog prostora V dimenzije n. Neka su λ1 , λ2 , . . . , λk razliˇcite svojstvene vrijednosti linearne transformacije A i neka je Wi = Ker (A − λi idV ). Tada su sljede´ci uslovi ekvivalentni. (a) A je dijagonalizibilna linearna transformacija. (b) Svojstveni polinom od A je f = (x − λ1 )d1 · · · (x − λk )dk , gdje je di = dim Wi (i = 1, 2, . . . , k). (c) dim W1 + · · · + dim Wk = dim V. Matriˇcni analogon ovom teoremu ima sljede´cu formulaciju. Teorem 2.1.12. Neka je A neka n×n matrica nad poljem F i neka su λ1 , λ2 , . . . , λk razliˇcite svojstvene vrijednosti matrice A u polju F. Za svako i, neka Wi predstavlja potprostor kolona matrice X (sa koeficijentima polja F) takvih da je (A − λi I)X = 0, i neka je Bi ured¯ena baza potprostora Wi . Baze B1 , B2 , . . . , Bk zdruˇzene zajedno formiraju kolone matrice P = (P1 , P2 , . . .) = (B1 , B2 , . . . , Bk ). Matrica A je sliˇcna dijagonalnoj matrici ako i samo ako je P kvadratna matrica. Kada je P kvadratna matrica, onda je P invertibilna i matrica P −1 AP je dijagonalna matrica. Primjer 2.1.13. Neka je A linearna transformacija prostora R3 koja u odnosu na standardnu bazu ima matricu
5 A = −1 3
−6 4 −6
−6 2 . −4
Izraˇcunajmo prvo karakteristiˇcni polinom. ¯ ¯ ¯ x−5 6 6 ¯¯ druga kolona ¯ 1 x−4 −2 ¯¯ = minus det (xI − A) = ¯¯ ¯ −3 6 x+4 ¯ tre´ca ¯ ¯ ¯ x−5 0 6 ¯¯ ¯ 1 x−2 −2 ¯¯ = ¯¯ ¯ −3 2 − x x + 4 ¯ ¯ ¯ ¯ x−5 0 6 ¯¯ ¯ 1 1 −2 ¯¯ = (x − 2) ¯¯ ¯ −3 −1 x + 4 ¯ ¯ ¯ ¯ x−5 0 6 ¯¯ ¯ 1 1 −2 ¯¯ = (x − 2) ¯¯ ¯ −2 0 x + 2 ¯ ¯ ¯ ¯ x−5 6 ¯¯ ¯ = (x − 2) ¯ −2 x + 2 ¯ = =
(x − 2)(x2 − 3x + 2) (x − 2)2 (x − 1).
32
GLAVA 2. ELEMENTARNE KANONSKE FORME
Da bi odredili dimenziju svojstvenih prostora prvo moramo na´ci matrice A − I i A − 2I, a zatim njihov rang. Imamo 4 −6 −6 3 −6 −6 3 2 , A − 2I = −1 2 2 . A − I = −1 3 −6 −5 3 −6 −6 Obje ove matrice su singularne, pa je njihov rang ≤ 3. Jednostavno se vidi da je rang(A − I) = 2 i rang(A−2I) = 1. Ako su W1 i W2 svojstveni potprostori koji odgovaraju svojstvenoj vrijednosti 1 i 2, respektivno, onda je dim W1 = 1 i dim W2 = 2. Poˇsto je dim W1 + dim W2 = dim V, to je linearna transformacija A dijagonalizibilna. Sada odred¯ujemo baze B1 i B2 potprostora W1 = Ker(A − idV ) i W2 = Ker(A − 2idV ). Jednostavno se nalazi da je B1 = {e1 }, gdje je e1 = (3, −1, 3) i da je B2 = {e2 , e3 }, gdje je e2 = (2, 1, 0) i e3 = (2, 0, 1). U odnosu na bzau B = {e1 , e2 , e3 } linearnoj transformaciji A odgovara dijagonalna matrica
1 0 D= 0 2 0 0 Matrica prelaza sa standardne baze na bazu B 3 P = −1 3
0 0 . 2
je 2 1 0
2 0 . 1
Nadalje je D = P −1 AP.
2.1.1
Zadaci
1. U svakom od sljede´cih sluˇcajeva, neka je A linearna transformacija prostora R2 koja u odnosu na standardnu bazu ima matricu A, i neka je B linearna transformacija prostora C2 koja u odnosu na standardnu bazu ima ima matricu B. Na´ci karakteristiˇcne polinome i karakteristiˇcne vrijednosti svake od ovih transformacija. Odrediti bazu prostora, ako postoji, sastavljenu od svojstvenih vektora. 2. Neka je V vektorski prostor dimenzije n. Na´ci svojstveni polinom linearne ˇ je svojstveni polinom nulte linearne transformacije? transformacije idV . Sta 3. Neka je A linearno preslikavanje prostora dardnu bazu ima matricu −9 4 −8 3 −16 8
R3 koje u odnosu na ured¯enu stan 4 4 . 7
Dokazati da se A moˇze dijagonalizirati i odrediti bazu sastavljenu od svojstvenih vektora.
2.1. SVOJSTVENE VRIJEDNOSTI 4. Neka je
33
6 −3 −2 4 −1 −2 . 10 −5 −3
Da li je A sliˇcna dijagonalnoj matrici nad poljem R? Da li je A sliˇcna dijagonalnoj matrici nad poljem C? 5. Neka je A linearno preslikavanje prostora R4 koje u odnosu na ured¯enu standardnu bazu ima matricu
0 a 0 0
0 0 b 0
0 0 . 0 0
0 0 0 c
Za koje vrijednosti parametara a, b i c A se moˇze dijagonalizirati? 6. Neka je A linearna transformacija n−dimenzionalnog vektorskog prostora V. Ako A ima n razliˇcitih svojstvenih vrijednosti dokazati da se A moˇze dijagonalizirati. 7. Neka su A i B matrice reda n × n nad poljem F. Ako je I − AB invertibilna matrica, onda je i matrica I − BA invertibilna i vrijedi (I − BA)−1 = I + B(I − AB)−1 A. 8. Koriste´ci prethodni zadatak dokazati da matrice AB i BA imaju iste svojstvene vrijednosti nad poljem F. 9. Neka je N matrica reda 2×2 nad poljem kompleksnih brojeva. Ako je N 2 = 0, dokazati da je N = 0 ili je N sliˇcna matrici µ
¶
0 0 1 0
.
10. Neka je V vektorski prostor realnih neprekidnih funkcija jedne realne promjenljive. Neka je T linearno preslikavanje prostora V definisano relacijom Zx (T f )(x) =
f (t)dt. 0
Dokazati da T nema ni jednu realnu svojstvenu vrijednost.
34
2.2
GLAVA 2. ELEMENTARNE KANONSKE FORME
Anuliraju´ ci polinomi
U prouˇcavanju linearnih preslikavanja naroˇcito vaˇzno mjesto imaju polinomi koji se anuliraju na na datom linearnom preslikavanju A. Vidje´cemo da je skup svih polinoma koji se anuliraju na preslikavanju A ideal algebre F[x]. Naime, ako se polinomi f i g anuliraju na A, onda je (α f + β g)(A) = α f (A) + β g(A) = 0. Moˇze se desiti da je taj ideal nula ideal, tj. da osim nultog polinoma ni jedan drugi polinom se ne anulira na A. Kako ´cemo sada vidjeti, to se ne moˇze desiti u sluˇcaju linearnih preslikavanja vektorskog prostora konaˇcne dimenzije. Neka je A linearno preslikavanje n−dimenzionalnog vektorskog prostora V. Tada je A ∈ L(V, V ). Prostor L(V, V ) ima dimenziju n2 , pa je niz 2
idV , A, A2 . . . , An
od n2 + 1 elementa prostora L(V, V ) linearno zavisan. Zbog toga postoje skalari α0 , α1 , . . . αn2 ∈ F takvi da je 2
αo idV + α1 A + · · · + αn2 An = 0 i bar jedan od tih skalara nije nula. To znaˇci da polinom 2
f = αo + α1 x + · · · + αn 2 x n
nije nula polinom i da je f (A) = 0. Ovim smo pokazali da postoji polinom stepena ≤ n2 koji se anulira na A. Svaki polinom algrbre F[x] ima jednoznaˇcnu faktorizaciju na proste faktore, pa tako i polinom f koji se anulira na A. Osim toga, svaki ideal je generisan nekim moniˇcnim polinomom, pa specijalno i ideal polinoma koji se anuliraju na A. Neka je p generatorni element tog ideala. Tada je p(A) = 0 i f (A) = 0 ako i samo ako je f = pq za neki plinom q ∈ F[x]. Definicija 2.2.1. Neka je A linearno preslikavanje vektorskog prostora V konaˇcne dimenzije nad poljem F. Minimalan polinom od A je jedinstven monik polinom koji generiˇse ideal polinoma koji se anuliraju na A. Rijeˇc ”minimalan” potiˇce od toga ˇsto taj polinom ima najniˇzi stepen od svih monik polinoma ideala. Minimalan plinom p linearnog preslikavanja A je jednoznaˇcno odred¯en sa ove tri osobine: (1) p je monik polinom nad poljem F. (2) p(A) = 0. (3) Ni jedan polinom koji se anulira na A nema stepen manji od stepena polinoma p.
´ POLINOMI 2.2. ANULIRAJUCI
35
Ako je A neka n × n matrica nad poljem F, onda mi moˇzemo takod¯e posmatrati sve polinome koji se anuliraju na matrici A. Minimalan polinom matrice A je jedinstven monik polinom koji generiˇse ideal svih polinoma algebre F[x] koji se anuliraju na A. Svakoj linearnoj transformaciji A u odnosu na neku ured¯enu bazu B pripada neka matrica A i obratno. Jasno je da je f (A) = 0 ako i samo ako je f (A) = 0. Dakle, minimalni polinomi linearnog preslikavanja i njemu pridruˇzene matrice u odnosu na neku bazu imaju isti minimalni polinom. No, jednom linearnom preslikavanju odgovara viˇse matrica (u odnosu na razliˇcite ured¯ene baze), sve te matrice su sliˇcne. Dakle, sliˇcne matrice imaju iste minimalne polinome. Ova ˇcinjenica je jasna i zbog toga ˇsto je (P −1 AP )k = P −1 Ak P, pa je f (P −1 AP ) = P −1 f (A)P za svaki polinom f ∈ F[x]. Teorem 2.2.2. Neka je A linearna transformacija n−dimenzionalnog vektorskog prostora V (ili, neka je A matrica reda n × n nad poljem F). Svojstveni (karakteristiˇcni) polinom i minimalni polinom linearnog preslikavanja A (ili matrice A) imaju iste nule, ali sa eventualno razliˇcitom viˇsestrukoˇs´cu. Dokaz. Neka je p minimalni polinom od A i neka je α ∈ F. Pokaˇzimo da je p(α) = 0 ako i samo ako je α svojstvena vrijednost od A. Neka je, prvo, p(α) = 0. Tada je p = (x − α)q za neko q ∈ F[x]. Poˇsto je degq < degp, to je q(A) 6= 0. Tada postoji bar jedno u ∈ V takvo da je (q(A))(u) 6= 0. Neka je v = (q(A))(u). Tada je 0 = (p(A))(u) = ((A − α idV )q(A)) (u) = (A − α idV ) (q(A)(u)) = (A − α idV )(v). Dakle, α je svojstvena vrijednost linearne transformacije A, pa je α nula svojstvenog polinoma. Neka je α svojstvena vrijednost i u pripadni svojstveni vektor linearne transformacije A. Tada je A(u) = α u, (u 6= 0). Odavde na osnovu Leme 2.1.9 je p(A(u)) = p(α)u. Budu´ci da je p(A) = 0 i u 6= 0, to mora biti p(α) = 0. Neka je A dijagonalizibilno linearno preslikavanje i neka su λ1 , λ2 , . . . , λk razliˇcite svojstvene vrijednosti od A. Posmatrajmo polinom p = (x − λ1 ) · · · (x − λk ). Ako je u svojstveni vektor linearne transformacije A tada on odgovara jednoj od svojstvenih vrijednosti λ1 , . . . , λk , pa jedno od linearnih preslikavanja A − λ1 idV , . . . , A − λk idV vektor u prevodi u nula vektor. Zbog toga je (A − λ1 idV ) · · · (A − λk idv )(u) = 0,
36
GLAVA 2. ELEMENTARNE KANONSKE FORME
tj. p(A)(u) = 0 za svaki svojstveni vektor linearne transformacije A. Kako je A dijagonalizibilno, to postoji baza satavljena od svojstvenih vektora. Neka je to baza {e1 , . . . , en }. Tada za svako v = ξ1 e1 + · · · ξn en ∈ V, vrijedi p(A)(v) = ξ1 p(A)(e1 ) + · · · ξn p(A)(en ) = 0. ˇ odavde moˇzemo zakljuˇciti? Ako je A dijagonalizibilna linearna Dakle, p(A) = 0. Sta transformacija, tada je minimalan polinom od A proizvod razliˇcitih linearnih faktora. Kako ´cemo kasnije vidjeti ova osobina karakterizira dijagonalizibilne linearne transformacije. Primjer 2.2.3. Razmotrimo linearna preslikavanja navedena u primjerima 2.1.13, 2.1.7 i 2.1.6. U Primeru 2.1.13 linearno preslikavanje je bilo dijagonalizibilno, svojstveni polinom je f = (x − 1)(x − 2)2 . Tada je minimalan polinom p = (x − 1)(x − 2). (Vidi tekst ispred primjera.) U Primjeru 2.1.7 linearno preslikavanje A nije bilo dijagonalizibilno, a svojstveni polinom je bio f = (x − 1)(x − 2)2 . Mi ne zamo da li je minimalan polinom p = (x − 1)(x − 2). Da bi to ispitali moramo na´ci proizvod (A − I)(A − 2I). Imamo 2 1 −1 1 1 −1 (A − I)(A − 2I) = 2 1 −1 2 0 −1 2 2 −1 2 2 −2 2 0 −1 = 2 0 −1 6= 0. 4 0 −2 Dakle, (x − 1)(x − 2) nije minimalan polinom, pa minimalan polinom ima stepen 3. Kako se mora anulirati za 1 i 2, to imamo dvije mogu´cnosti (x−1)2 (x−2) ili (x−1)(x−2)2 . Jedostavno se raˇcunom utvrdi, da je (A − I)(A − 2I)2 = 0, pa je minimalan plinom istovremeno i svojstveni polinom. U Primjeru 2.1.6 svojstveni polinom je x2 + 1. Ovaj polinom u polju R nema nula, pa ni jedan linearan polinom ne moˇze biti minimalan polinom. Dakle, i ovdje je minimalan polinom jednak svojstvenom polinomu.
Teorem 2.2.4 (Cayley-Hamilton). Neka je A linearna transformacija vektorskog prostora V konaˇcne dimenzije. Ako je f svojstveni polinom, onda je f (A) = 0. Drugim rijeˇcima minimalan polinom linearnog preslikavanja A dijeli svojstveni polinom tog preslikavanja. Dokaz. Neka je K skup svih polinoma nad poljem F u varijabli A. Tada je K komutativna algebra sa jedinicom nad poljem F. Neka je B = {e1 , . . . , en } ured¯ena baza prostora V i neka je A matrica linearnog preslikavanja A u odnosu na tu bazu. Tada je n X Aji ej , (i = 1, . . . , n). A(ei ) = j=1
Ova jednaˇcina moˇze se napisati i u ekvivalentnom obliku n X j=1
(δij A − Aji idV ) ej = 0, (i = 1, . . . , n).
´ POLINOMI 2.2. ANULIRAJUCI
37
Neka je B ∈ K n×n takva da je Bij = δij A − Aji idV . Ako je n = 2, onda je µ
A − A11 idV −A12 idV
B=
−A21 idV A − A22 idV
¶ ,
pa je det B = (A − A11 idv ) (A − A22 idv ) − A12 A21 idV = A2 − (A11 + A22 ) A + (A11 A22 − A12 A21 ) = A2 − trag(A)A + det A = f (A), gdje je f = x2 − trag(A)x + det A svojstveni polinom linearne transformacije A. U sluˇcaju da je n > 2, odmah se vidi da je opet det B = f (A), poˇsto je f determinanta matrice xI − A koja ima elemente (xI − A)ij = xδij − Aji . Mi ´cemo dokazati da je f (A) = 0. Da bi to dokazali potrebno je i dovoljno dokazati da je det B = 0. Imamo n n X X Bij (ej ) = (δij A − Aji idV )(ej ) j=1
j=1
=
n X
n X δij A(ej ) − Aji ej
j=1
j=1
= A(ei ) − A(ei ) = 0 Dakle,
n X Bij (ej ) = 0, (i = 1, . . . , n) j=1 ∼
Neka je B = adj B. Tada (2.2.1) moˇzemo napisati u obliku n X ∼ B ki Bij (ej ) = 0 (∀i, k ∈ {1, . . . , n}). j=1
Nakon sumiranja po i dobije se n n X X ∼ B k iBij (ej ) 0 = i=1 j=1
=
n X j=1
à n ! X∼ B k iBij (ej ). i=1
(2.2.1)
38
GLAVA 2. ELEMENTARNE KANONSKE FORME ∼
Izraz u zagradi predstavlja proizvod matrice B i njene adjungovane matrice B. Kako ∼
je B B = (det B)I, to je
n X ∼ B ki Bij = δkj det B. i=1
Dakle, 0=
n X
δkj (det B) ej = (det B)ek , (1 ≤ k ≤ n).
j=1
Kako su vektori e1 , . . . , en linearno nezavisni, to je det B = 0. Ovim je dokaz kompletiran. Ova teorema je se moˇze koristiti za odred¯ivanje minimalnog polinoma matrice. Ako je A matrica koja je pridruˇzena linearnoj transformaciji A u odnosu na neku ured¯enu bazu B, onda mi moˇzemo izraˇcunati svojstveni (karakteristiˇcni) polinom f matrice A. Znamo da minimalan polinom mora imati iste nule kao i karakteristiˇcni polinom. Neka je f = (x − α1 )d1 · · · (x − αk )dk faktorizacija karakteristiˇcnog polinoma f na faktore nad nekim algebarski zatvorenom polju, pri ˇcemu su skalari α1 , . . . , αk razliˇciti. Tada je minimalan polinom p = (x − α1 )r1 · · · (x − αk )rk , 1 ≤ rj ≤ dj . U opˇstem sluˇcaju ne moˇzemo viˇse niˇsta zakljuˇciti. Primjer 2.2.5. Neka je
0 1 A= 0 1
1 0 1 0
0 1 0 1
1 0 1 0
matrica reda 4 × 4 nad poljem racionalnih brojeva. Tada 2 0 2 0 0 0 2 0 2 4 2 A2 = 2 0 2 0 , A = 0 0 2 0 2 4
je 4 0 4 0
0 2 0 4
4 0 . 4 0
Odavde se vidi da je A3 = 4A. Neka je q(x) = x3 − 4x = x(x − 2)(x + 2). Tada je q(A) = 0, pa minimalan polinom p dijeli q(x). Dakle, kandidati za minimalan polinom su: x, x − 2, x + 2, x(x − 2)x(x + 2), x2 − 4 i x(x − 2)(x + 2). Kako je A 6= 0, A 6= 2I, A 6= −2I, to ni jedan od polinoma prvog stepena nije minimalan polinom. No, A2 6= 4I, pa ni polinom x2 − 4 nije minimalan polinom. Iz A2 6= ±2A slijedi da ni jedan od druga dva polinoma drugog stepena nije minimalan polinom. Prema tome, jedina mogu´cnost za minimalan polinom je p = x(x − 2)(x + 2). Kako sada odrediti karakteristiˇcni polinom? Karakteristiˇcni polinom je ˇcetvrtog stepena i mora imati iste nule kao i minimalan polinom. Tako imamo ove mogu´cnosti: f = x2 (x − 2)(x + 2) ili f = x(x − 2)2 (x + 2) ili f = x(x − 2)(x + 2)2 .
´ POLINOMI 2.2. ANULIRAJUCI
39
Ako bi bila prva mogu´cnost, onda bi λ = 0 bila dvostruka svojstvena vrijednost, pa bi matrica A − 0 · I morala imati rang 2. No A − 0 I = A i A ima rang 2, pa je ova mogu´cnost stvarna. Dakle, karakteristiˇcni polinom je f = x2 (x2 − 4). Tada je matrica A sliˇcna dijagonalnoj matrici 0 0 0 0 0 0 0 0 . 0 0 2 0 0 0 0 −2
2.2.1
Zadaci
1. Odrediti minimalan i karakteristiˇcan polinom matrice
0 0 c A = 1 0 b , 0 1 a gdje su a, b, c elementi polja F. 2. Neka je
1 1 0 −1 −1 0 A= −2 −2 2 1 1 −1
0 0 . 1 0
Pokazati da je f = x2 (x − 1)2 karakteristiˇcni polinom matrice A a zatim odrediti minimalan polinom matrice A. 3. Neka je V n−dimenzionalni vektorski prostor i A linearno preslikavanje tog prostora. Pretpostavimo da postoji neki prirodan broj k takav da je Ak = 0. Dokazati da je An = 0. 4. Na´ci sve matrice reda 3 × 3 nad poljem realnih brojeva ˇciji je minimalan polinom p = x2 . 5. Neka je n prirodan broj i V skup svih polinoma stpena ≤ n nad poljem F. Neka je D operator diferenciranja na V, tj. D(f ) = f 0 za svako f ∈ V. Odrediti karakteristiˇcni i minimalan polinom operatora D. 6. Neka je V = F n×n vektorski prostor matrica reda n × n nad poljem F. Neka je A fiksna n×n matrica i neka je T linearna transformacja prostora V definisana sa T (B) = AB. Dokazati da je minimalan polinom linearne transformacije T i minimalni polinom matrice A.
40
GLAVA 2. ELEMENTARNE KANONSKE FORME
2.3
Invarijantni potprostori
U ovom paragrafu uveˇs´cemo nekoliko novih pojmova koji su neophodni u studiji linearnih transformacija vektorskog prostora. Definicija 2.3.1. Neka je V vektorski prostor i A linearna transformacija od V. Ako je W potprostor prostora V takav da je A(x) ∈ W za svako x ∈ W, onda kaˇzemo da je W invarijantan potprostor prostora W u odnosu A. Dakle, potprostor W je invarjantan u odnosu na A ako je A(W ) ⊆ W. Primjer 2.3.2. Neka je A proizvoljna linearna transformacija prostora V. Tada su potprostori Ker A i Im A invarijantni potprostori prostora V.
Primjer 2.3.3. Neka je F polje i D linearna transformacija diferenciranja na prostoru F[x] polinoma nad F. Neka je n prirodan broj i W potprostor polinoma stepena ne ve´ceg od n. Tada je W invarijantan pod prostor u odnosu na D.
Primjer 2.3.4. Neka je A linearna transformacija vektorskog prostora V, koja komutira sa linearnom transformacijom B prostora V, tj. neka je AB = BA. Neka je W = Im A i N = Ker A. Pokaˇzimo da su W i N invarijantni u odnosu na B. Neka je x ∈ W proizvoljan. Tada je x = A(u) za neko u ∈ V. Odavde je B(x) = B(A(u)) = A(B(u)) ∈ Im A = W, tj. B(W ) ⊆ W. Neka je x ∈ N. Tada je A(x) = 0, pa je 0 = B(A(x)) = A(B(x)), dakle, B(x) ∈ Ker A = N. Kao primjer linearne transformacije koja komutira sa linearnom transformacijom B moˇzemo uzeti A = g(B), gdje je g ∈ F[x] bilo koji polinom. Primjer 2.3.5. Neka je A linearna transformacija prostora V = R2 koja u odnosu na standarnu bazu ima matrica µ ¶ 0 −1 A= . 1 0 Invarijantni potprostori od A su sigurno nula potprostor i sam prostor V. Pokaˇzimo da drugih potprostora nema. Pretpostavimo da je W invarijantan potprostor i da je {0} ⊂ W ⊂ V. Tada je 0 < dim W < 2, pa je dim V = 1. Neka je {e} baza od W. Tada je A(e) ∈ W, pa je A(e) = λe. Neka je e = (α, β) i bar jedan od skalara α i β nije nula. Imamo µ ¶ µ ¶ µ ¶ 0 −1 α −β A(e) = · = , 1 0 β α tj. (λα, λβ) = (−β, α). Odavde slijedi β = α = 0, ˇsto je u suprotnosti sa izborom skalara α i β. Pretpostavka da postoji netrivijalni invarijantni potprostor dovela nas je do kontradikcije, pa nije taˇcna.
Neka je W invarijantan potprostor prostora V u odnosu na linearnu transformaciju A. Tada je A(x) ∈ W za svako x ∈ W. To znaˇci da moˇzemo posmatrati preslikavanje AW : W → W definsano relacijom AW (x) = A(x) za svako x ∈ W. Preslikavanje AW nazivamo restrikcija preslikavanja A na potprostor W. Neka je V vektorski prostor konaˇcne dimenzije n nad poljem F, A linearna transformacija prostora V i W invarijantni potprostor u odnosu na A. Neka je
2.3. INVARIJANTNI POTPROSTORI
41
B 0 = {e1 , . . . , er } ured¯ena baza potprostora W. Nadopunimo ovu bazu do baze B = {e1 , . . . , er , er+1 , . . . , en } prostora V. Neka je A(ej ) =
n X
Aij ei
(j = 1, . . . , n).
i=1
Tada je A = (Aij ) matrica linearne transformacije A u odnosu na bazu {e1 , . . . , en } prostora V. Kako su vektori e1 , . . . , er ∈ W, to je A(ej ) ∈ W za svako 1 ≤ j ≤ r. To znaˇci da je Aij = 0 kada je j ≤ r i i > r. Zbog toga matricu A moˇzemo prikazati kao blok matricu u obliku µ ¶ B C A= , 0 D gdje je B matrica reda r × r, C matrica reda (n − r) × r i D matrica reda (n − r) × (n − r) nad poljem F. Induciranoj linearnoj transformaciji AW u odnosu na bazu B 0 odgovara matrica B. Lema 2.3.6. Neka je W invarijantni potprostor u odnosu na linearnu transformaciju A prostora V. Karakteristiˇcni (svojstveni) polinom linearne transformacije AW dijeli karakteristiˇcni polinom linearne transformacije A. Minimalni polinom od AW dijeli minimalni polinom od A. Dokaz. Neka je B 0 baza potprostora W i B ⊇ B 0 baza prostora V. Tada je µ A=
B C 0 D
¶ ,
gdje je B = [AW ]B0 i A = [A]B . Odavde je µ det (xI − A) = det
xI − B −C 0 xI − D
¶ = det (xI − B) det (xI − D).
Odavde slijedi da karakteristiˇcni polinom det(xI − B) linearnog preslikavanja AW dijeli karakteristiˇcni polinom det(xI −A) linearne transformacije A. Kako je matrica A gornje trougaona blok matrica, to je µ k
A =
B k Ck 0 Dk
¶ ,
gdje je Ck neka r × (n − r) matrica nad poljem F. Neka je m X p= αk x k k=0
42
GLAVA 2. ELEMENTARNE KANONSKE FORME
minimalan polinom matrice A. Tada je p(A) = 0, pa je m X 0 = p(A) = αk Ak k=0
m B k Ck X = αk k k=0 0 D m m P P k α C α B k k k=0 k k=0 . = m P k 0 αk D k=0
Dakle,
m m m X X X αk Dk = 0. αk Ck = 0 i αk B k = 0, k=0
k=0
k=0
Polinom p se anulira na AW , pa minimalni polinom transformacije AW dijeli polinom p. Time je dokaz zavrˇsen. Primjer 2.3.7. Neka je A linearna transformacija vektorskog prostora V konaˇcne dimenzije. Neka su λ1 , . . . , λk razliˇcite svojstvene vrijednosti linearne transformacije A koje leˇze u polju F. Neka je Wi svojstveni potprostor prostora V koji je generisan svim svojstvenim vektorima koji odgovaraju svojstvenoj vrijednosti λi , (1 ≤ i ≤ k). Neka je Bi ured¯ena baza potprostora Wi i B 0 = (B1 , B2 , . . . , Bk ). Tada je B0 linearno nezavisan skup. Oznaˇcimo sa W potprostor prostora V koji je generisan skupom B 0 . Ako je x ∈ W, onda je x=
r1 X
α1j1 e1j1 +
j1 =1
r2 X
α2j2 e2j2 + · · · +
j2 =1
rk X
αkjk ekjk .
jk =1
Odavde je A(x)
=
r1 X
α1j1 A (e1j1 ) +
j1 =1
=
λ1
r1 X
r2 X
j2 =1 r2 X
α1j1 e1j1 + λ2
j1 =1
rk X
α2j2 A (e2j2 ) + · · · +
j2 =1
αkjk A (ekjk )
jk =1 rk X
α2j2 e2j2 + · · · + λk
αkjk ekjk ,
jk =1
pa je A(x) ∈ W, tj. W je invarijantan u odnosu na A. Neka je AW restrikcija preslikavanja A na W. U odnosu na bazu B0 transformacija AW ima dijagonalnu matricu B kod koje se na glavnoj dijagonali nalaze svojstvene vrijednosti λ1 , . . . , λk od kojih se svaka pojavljuje r1 , r2 , . . . , rk puta. Nadopunimo bazu B0 do baze B prostora V. Linearna transformacija A u odnosu na bazu B ima matricu µ ¶ B C A= . 0 D Karakteristiˇcni polinom linearne transformacije AW je isti kao i karakteristiˇcni polinom matrice B, tj. g = (x − λ1 )r1 · · · (x − λk )rk , gdje je rj = dim Wj , (j = 1, . . . , k). Ako je f karakteristiˇcni polinom matrice A, onda je viˇsestrukost x − λi kao faktora od f najmanje dim Wi .
2.3. INVARIJANTNI POTPROSTORI
43
Definicija 2.3.8. Neka je W invarijantni potprostor prostora V u odnosu na linearnu transformaciju A. A−konduktor od u ∈ V u odnosu na W je skup SA (u, W ) svih polinoma g nad poljem F takvih da je (g(A))(u) ∈ W. U specijalnom sluˇcaju kada je W = {0} konduktor nazivamo A−anihilatorom elementa u. U oznaci SA (u, W ) indeks A naj´ceˇs´ce ´cemo izostavljati, jer ´ce se iz konteksta znati o kojem linearnom preslikavanju je rijeˇc. Lema 2.3.9. Ako je W neki invarijantni potprostor u odnosu na A, tada je W invarijantno u odnosu na svaki polinom u varijabli A nad poljem F. Tako, za svako u ∈ V konduktor SA (u, W ) je ideal algebre F[x]. Dokaz. Po pretpostavci W je invarijantan u odnosu na A, pa za u ∈ W vrijedi A(u) ∈ W. Dalje je A2 (u) = A(A(u)) ∈ W. Indukcijom zakljuˇcujemo da je Ak (u) ∈ W za svaki prirodan broj k. Odavde slijedi da za svaki polinom f ∈ F[x] vrijedi (f (A))(u) ∈ W za svako u ∈ W. Ovim je prvi do leme dokazan. Pokaˇzimo sada da je S(u, W ) potprostor prostora F[x]. Neka su f, g ∈ S(u, W ) i α i β skalari. Tada je (α f + β g)(A) = α f (A) + β g(A), pa je ((α f + β g)(A))(u) = (α f (A) + β g(A))(u) = α (f (A))(u) + β (g(A)(u) ∈ W. Neka je g ∈ S(u, W ) i f ∈ F[x]. Tada je (f g)(A)(u) = f (A) (g(A)(u)) ∈ W, tj. f g ∈ S(u, W ). Time smo dokazali da je S(u, W ) ideal algebre F[x]. Svaki ideal algebre F[x] je generisan taˇcno jedinim monik polinomom, pa je ideal S(u, W ) je generisan nekim monik polinomom g. Taj monik polinom takod¯e nazivamo A−konduktor elementa u u odnosu na W i oznaˇcavamo ga sa s(u, W ). U sluˇcaju da je W = {0}, onda A−konduktor elementa u nazivamo A−anhilatorom od u. Tada je g polinom sa najniˇzim stepenom za koji je g(A)(u) ∈ W. Polinom f je element ideala S(u, W ) ako i samo ako je f = gh za neko h ∈ S(u, W ), tj. alo i samo ako g dijeli f. Neka je h minimalan polinom linearne transformacije A. Tada je h(A) = 0, pa je sigurno h(A)(u) = 0 ∈ W. Dakle, h ∈ S(u, W ), pa g dijeli minimalan minimalan polinom linearne transformacije A. To znaˇci da svaki A−konduktor dijeli minimalan polinom linearne transformacije A. Kao prvu ilustraciju kako se koristi konduktor ima´cemo u karakterizaciji linearnih transformacija koje se mogu trougaonalizirati. Za linearnu transformaciju kaˇzemo da je trougaonozibilna, ako postoji ured¯ena baza u odnosu na koju linearno preslikavanje ima trougaonu matricu. Lema 2.3.10. Neka je V vektorski prostor konaˇcne dimenzije nad poljem F. Neka je A linearna transformacija vektorskog prostora V takva da je njen minimalan polinom proizvod linearnih faktora p = (x − λ1 )r1 · · · (x − λk )rk , (λi ∈ F ). Neka je W pravi potprostor od V ( W 6= V ) koji je invarijantan u odnosu na A. Tada postoji vektor u ∈ V takav da
44
GLAVA 2. ELEMENTARNE KANONSKE FORME
(a) u ∈ / W; (b) (A − λ idV )(u) ∈ W, za neku svojstvenu vrijednost λ linearne transformacije A. Dokaz. Kako je W pravi potprostor od V, to postoji v ∈ V i v ∈ / W. Neka je g A−konduktor elementa v u W. Tada g dijeli minimalan polinom p od A. Kako v∈ / W, to polinom g nije konstanta. Zato je g = (x − λ1 )t1 · · · (x − λk )tk i bar jedan od eksponenata ti nije nula. Neka je npr. tj > 0. Tada x − λj dijeli g, tj. g = (x − λj )h. Polinom h ima stepen niˇzi nego polinom g, a polinom g je polinom najniˇzeg stepena za koji je g(A)(v) ∈ W. Dakle, u = h(A)(v) ∈ / W. No, (A − λj idV )(u) = (A − λj idV )(h(A)(v)) = g(A)(v) ∈ W. Time je dokaz zavrˇsen. Ako su, dakle, ispunjeni uslovi prethodne leme, onda postoji element u ∈ V \ W ˇciji je konduktor linearan polinom. Teorem 2.3.11. Neka je V vektorski prostor konaˇcne dimenzije nad poljem F i neka je A linearna transformacija prostora V. Tada je transformacija A trougaonozibilna ako i samo ako je minimalan polinom od A proizvod linearnih polinoma nad F. Dokaz. Pretpostavimo da je minimalan polinom proizvod linearnih faktora, tj. da je p = (x − λ1 )r1 · · · (x − λk )rk . Cilj nam je da konstruiˇsemo ured¯enu bazu B ima trougaonu matricu α11 α12 α13 0 α22 α23 0 α33 [A]B = 0 .. .. .. . . . 0
0
0
u odnosu na koju transformacija A ··· ··· ···
α1n α2n α3n .. .
···
αnn
.
(2.3.1)
Iz ove matrice se odmah vidi da je A(ej ) = α1j e1 + α2j e2 + . . . + αjj ej , 1 ≤ j ≤ n,
(2.3.2)
tj. A(ej ) je element potprostora generisanog vektorima e1 , . . . , ej . Konstrukciju baze B zapoˇcinjemo primjenom prethodne leme na potprostor W = {0} i tako dobijamo vektor e1 . Sada pimjenjujemo lemu na potprostor W1 = F e1 i dobijamo vektor e2 . Zatim primjenjujemo lemu na potprostr W2 = Fe1 + Fe2 ,tj. potpreostor generesan vektorima e1 i e2 i dobijamo vektor e3 . Nastavljaju´ci ovaj postupak na
2.3. INVARIJANTNI POTPROSTORI
45
kraju dolazimo do ˇzeljene baze B. Primjetimo da relacija (2.3.2) obezbjed¯uje da je potprostor generisan vektorima e1 , . . . , ei invarijantan u odnosu na A, pa su uslovi prethodne leme ispunjeni za potprostore Wi (i = 1, . . . , n). Neka je A trougaonozibilna. Tada postoji baza u odnosu na koju linearna transformacija A ima trougaonu matricu (2.3.1). Karakteristiˇcni polinom transformacije A je isti kao i matrice A, pa je f = (x − α11 ) (x − α22 ) · · · (x − αnn ). Dakle, svojstveni polinom je faktorisan na linearne faktore, pa se i minimalni polinom p moˇze faktorisati na linearne faktore, jer dijeli f. Posljedica 2.3.12. Neka je F algebarski zatvoreno polje (kao npr. polje kompleksnih brojeva). Svaka n × n matrica nad poljem F je sliˇcna trougaonoj matrici. Dokaz. Tvrdnja slijedi iz prethodne teoreme, jer se nad algebarski zatvorenom polju svaki polinom moˇze faktorisati na linearne faktore. Teorem 2.3.13. Neka je V vektorski prostor konaˇcne dimenzije nad poljem F i neka je A linearna transformacija prostora V. Tada je A dijagonalizibilna transformacija ako i samo ako je minimalan polinom transformacije A oblika p = (x − λ1 ) · · · (x − λk ), gdje su λ1 , . . . , λk razliˇciti elementi polja F. Dokaz. Ve´c smo ranije dokazali da ako je A dijagonalizibilno onda je njegov minimalan polinom proizvod razliˇcitih linearnih faktora. Dokaˇzimo sada obrnutu tvrdnju. Neka je minimalan polinom p proizvod razliˇcitih linearnih faktora. Pretpostavimo da tvrdnja nije taˇcna. Neka je W potprostor generisan svim svojstvenim vektorima linearne transformacije A i neka W 6= V. Na osnovu Leme 2.3.10 postoji vektor u ∈ / W i svojstvena vrijednost λj od A takva da je v = (A−λj idV )(u) ∈ W. Kako je v ∈ W i W generisano svojstvenim vektorima linearne transformacije A, to je v = v1 + v2 + . . . + vk , gdje je A(vi ) = λi vi , 1 ≤ i ≤ k. Tada za bilo koji polinom h ∈ F[x] vektor h(A)(v) = h(λ1 )v1 + · · · + h(λk )vk leˇzi u W. Neka je p = (x − λj )q, za neki polinom q ∈ F[x]. Kako je polinom q − q(λj ) djeljiv polinomom x − λj , to je q − q(λj ) = (x − λj )h. Sada imamo q(A)(u) − q(λj )(u) = h(A) ((A − λj idV )(u)) = h(A)(v).
46
GLAVA 2. ELEMENTARNE KANONSKE FORME
No, h(A)(v) je iz W i kako je 0 = p(A)(u) = ((A − λj idV )q(A)) (u), to vektor q(A)(u) leˇzi u W. Zato je q(λj )u ∈ W. Kako u ∈ / W, to je skalar q(λj ) jednak nuli, tj. q(λj ) = 0. To zna´ci da je λj bar dvostruka nula minimalnog polinoma. Ovo je u konradikciji sa pretpostavkom da je minimalan polinom proizvod linearnih razliˇcitih faktora. Teorem 2.3.13 ima svoju praktiˇcnu primjenu. Pretpostavimo da je A matrica ˇ linearne transformacije A u odnosu na neku ured¯enu bazu B. Zelimo da ispitamo da li je transformacija A dijagonalizibilna. Prvo nalazimo karakteristiˇcan polinom i faktoriˇsemo ga na linearne faktore, ako je to mogu´ce. Neka se f moˇze napisati u obliku f = (x − λ1 )d1 · · · (x − λk )dk . Da bi utvrdili da li je A dijagonizabilno moˇzemo postupiti na dva naˇcina. Prvi naˇcin je da za svaku svojstvenu vrijednost λi koja je viˇsestrukosti di nad¯emo di linearno nezavisnih svojstvenih vektora. Ako je to mogu´ce, onda je A dijagonalizibilno. Ako to nije mogu´ce, onda A nije dijagonalizibilna linearna transformacija. Drugi naˇcin je da koristimo Teorem 2.3.13 i provjerimo da li je (A − λ1 idV ) · · · (A − λk idV ) nula transformacija, tj. da je minimalan polinom matrice A proizvod razliˇcitih linearnih faktora. Teorem 2.3.11 daje razliˇcit dokaz Cayley-Hamiltonovg teorema. Cayley-Hamiltonov teorem je oˇcit za trougaone matrice. Teorem 2.3.11 daje potrebne i dovoljne uslove da bi matrica bila sliˇcna trougaonoj matrici. Ti uslovi su ispunjeni za svaku kvadratnu matricu nad algebarski zatvorenim poljima. Dakle, Cayley Hamiltonova teorema vrijedi za kvadratne matrice nad poljem kompleksnih brojeva. Ako prihvatimo, bez dokaza, ˇcinjenicu da je svako polje potpolje algebraski zatvorenog polja, onda smo dokazali Cayley-Hamiltonov teorem za bilo koju kvadratnu matricu nad proizvoljnim poljem.
2.3.1
Zadaci
1. Neka je A linearna transformacija prostora R2 i neka je µ ¶ 1 −1 A= 2 2 matrica te transformacije u odnosu na ured¯enu standardnu bazu. (a) Pokazati da A nema jednodimenzionalnih invarijantnih potprostora. (b) Neka je T linearna transformacija prostora C2 koja u odnosu na ured¯enu standardnu bazu ima matricu A. Dokazati da T ima jednodimenzionalnih invarijantnih potprostora.
2.4. SIMULTANA TROUGAONIZACIJA I DIJAGONALIZACIJA 2. Neka je
47
0 1 0 A = 2 −2 2 . 2 −3 2
Da li je A sliˇcna trougaonoj matrici nad poljem realnih brojeva? Ako jeste na´ci tu trougaonu matricu. 3. Svaka matrica A za koju je A2 = A je sliˇcna dijagonalnoj matrici. 4. Neka je A neka 3 × 3 matrica. Ako A nije sliˇcna nekoj trougaonoj matrici nad poljem realnih brojeva, dokazati da je tada A sliˇcna dijagonalnoj matrici nad poljem kompleksnih brojeva. 5. Neka je V vektorski prostor n × n matrica nad poljem F. Neka je A ∈ V fiksna matrica i neka su A i B linearne transformacije prostora V definisane relacijama: A(B) = AB B(B) = AB − BA. Utvrdite da li su sljede´ce tvrdnje taˇcne ili netaˇcne. (a) Ako je A sliˇcna dijagonalnoj matrici, onda je linearna transformacija A dijagonalizibilna. (b) Ako je A sliˇcna dijagonalnoj matrici, onda je linearna transformacija B dijagonalizibilna.
2.4
Simultana trougaonizacija i dijagonalizacija
Neka je V vektorski prostor konaˇcne dimenzije i neka je F familija linearnih transformacija prostora V. Postavlja se pitanje da li postoji ured¯ena baza B prostora V takva da za svako A ∈ F matrica [A]B je trougaona (djagonalna). Budu´ci da sve dijagonalne matrice komutiraju, to je potrebno da ta familija F bude komutativna. Isto tako potrebno je da svaka transformacija familije F dude dijagonalizibilna. Analogno za trougaonizaciju potrebno je da svaka transformacija bude trougaonozibilna. No, nije neophodno da familija F bude komutativna. Kaˇzemo da je potprostor W invarijantan u odnosu na familiju F linearnih transformacija prostora V, ako je on invarijantan u odnosu na svaki ˇclan te familije. Lema 2.4.1. Neka je F komutativna familija trougaonozibilnih linearnih transformacija prostora V konaˇcne dimenzije. Neka je W pravi potprostor prostora V koji je invarijantan u odnosu na familiju F. Postoji vektor u ∈ V takav da: (a) u nije element skupa W ; (b) za svako A ∈ F, vektor A(u) je u potprostoru generisanom vektorom u i W.
48
GLAVA 2. ELEMENTARNE KANONSKE FORME
Dokaz. Bez umanjenja opˇstosti moˇzemo pretpostaviti da je familija F konaˇcna. Naime, prostor L(V, V ) je konaˇcne dimenzije, a F je njegov potskup, pa postoji maksimalan linearno nezavisan podskup {A1 , . . . , Ar } od F. Taj podskup je baza potprostora generisanog sa F. Ako je u vektor za koji vrijedi uslov (b) za svako Ai , tada ´ce uslov (b) vrijediti i za svaku linearnu kombinaciju transformacija A1 , . . . , Ar , pa samim tim i za svaku transformaciju familije F. Neka je familija F konaˇcna. Prema Lemi 2.3.10 moˇzemo na´ci vektor v1 ∈ /W i skalar λ1 takve da je (A1 − λ1 idV )(v1 ) ∈ W. Neka je V1 skup svih vektora v ∈ V takvih da je (A1 − λ1 idV )(v) ∈ W. Tada je W ⊆ V1 . No, W ⊂ V1 , jer je v1 ∈ V1 i v1 ∈ / W. Pokaˇzimo da je V1 invarijantno u odnosu na F. Neka je T proizvoljan element iz F. Tada T komutira sa A1 , pa je (A1 − λ1 idV )(T (v)) = T (A1 − λ1 idV )(v) za svako v ∈ V. Ako je v ∈ V1 , onda je (A1 −λ1 idV )(v) ∈ W. Kako je W invarijantno u odnosu na F, to je T (A1 −λ1 idV )(v) ∈ W, tj. T (v) ∈ V1 . Dakle, V1 je invarijantno u odnosu na F. Neka je U2 linearna transformacija prostora V1 dobijena kao restrikcija linearne transformacije A2 na V1 . Tada minimalan polinom od U2 dijeli minimalan polinom od A2 . Zbog toga moˇzemo primijeniti Lemu 2.3.10 na tu linearnu transformaciju i potprostor W. Tako ´cemo dobiti vektor v2 ∈ V1 \ W i skalar λ2 takve da je (A2 − λ2 idV )(v2 ) ∈ W. Primjetimo da / W; (a) v2 ∈ (b) (A1 − λ1 idV )(v2 ) ∈ W ; (c) (A2 − λ2 idV )(v2 ) ∈ W. Neka je V2 skup svih vektora v ∈ V1 takvih da (A2 − λ2 idv )(v) ∈ W. Tada je V2 invarijantno u odnosu na F. Sada moˇzemo primeniti Lemu 2.3.10 na linearnu transformaciju U3 , koja je restrikcija od A3 na V2 i potprostor W. Nastavljaju´ci ovaj postupak u konaˇcnom broju koraka dobi´cemo vektor u = vr ∈ / W takav da je (Aj − λj idv )(vr ) ∈ W, (j = 1, . . . , r). Teorem 2.4.2. Neka je V vektorski prostor konaˇcne dimenzije nad poljem F. Neka je F komutativna familija trougaonozibilnih linearnih transformacija prostora V. Tada postoji ured¯ena baza B prostora V takva da svaka linearna transformacija A iz F u odnosu na tu bazu ima trougaonu matricu A. Dokaz. Dokaz se zasniva na prethodnoj lemi, a realizuje se na isti naˇcin kao i dokaz Teorema 2.3.11 samo umjesto A uzimamo F. Posljedica 2.4.3. Neka je F komutativna familija n × n matrica nad algebarski zatvorenom polju F. Postoji nesingularna n × n matrica P nad poljem F takva da je P −1 AP gornje trougaona matrica za svako A ∈ F. Teorem 2.4.4. Neka je F komutativna familija dijagonalizibilnih linearnih transformacija prostora V konaˇcne dimenzije. Postoji ured¯ena baza prostora V takva da svaka linearna transformacija A iz F u odnosu na tu bazu ima dijagonalnu matricu A.
2.4. SIMULTANA TROUGAONIZACIJA I DIJAGONALIZACIJA
49
Dokaz. Tvrdnju ´cemo dokazati indukcijom u odnosu na dimenziju prostora V. Ako je dim V = 1 nemamo ˇsta dokazivati. Pretpostavimo da je tvrdnja taˇcna za sve vektorske prostore dimenzije manje od n. Izaberimo A ∈ F koje nije proizvod skalara i idV . Neka su λ1 , . . . , λk razliˇcite svojstvene vrijednosti od A i neka je Wi = Ker (A − λi idv ) (i = 1, . . . , k). Fiksirajmo indeks i. Tada je Wi invarijantno u odnosu na svaku linearnu transformaciju prostora V koja komutira sa A. Neka je Fi familija linearnih transformacija prostora Wi dobijenih restrikcijom transformacija familije F na Wi . Svaka linearna transformacija iz Fi je dijagonalizibilna, jer njen minimalan polinom dijeli minimalan polinom odgovaraju´ce linearne transformacije iz F koji je proizvod linearnih faktora. Poˇsto je dimenzija od Wi manja od dimenzije prostora V, to transformacije iz Fi (na osnovu pretpostavke indukcije) mogu biti simultano dijagonalizirane. Drugim rijeˇcima Wi ima bazu Bi sastavljenu od vektora koji su simultano svojstveni vektori za svaku linearnu transformaciju iz Fi . Kako je A dijagonalizibilno to na osnovu Teorema 2.1.11 B = (B1 , · · · , Bk ) je baza prostora V.
2.4.1
Zadaci
1. Na´ci invertibilnu dijagonalne, gdje µ 1 2 (a) A = 0 2 µ 1 1 (b) A = 1 1
matricu P ∈ R2×2 takvu da su matrice P −1 AP i P −1 BP su A i B matrice ¶ µ ¶ 3 −8 , B= ; 0 −1 ¶ µ ¶ 1 a , B= . a 1
2. Neka je F komutativna familija 3 × 3 matrica nad poljem kompleksnih brijeva. ˇ je sa sluˇcajem Koliko linearno nezavisnih elemenata sadrˇzi familija F? Sta n × n? 3. Neka je V n−dimenzionalni vektorski prostor i T linearna transformacija prostora V koja ima n razliˇcitih svojstvenih vrijednosti. Dokazati da linearne transformacije koje komutiraju sa T su jedino polinomi u varijabli T . 4. Neka su A, B, C i D kompleksne matrice reda n × n koje komutiraju. Neka je µ ¶ A B E= C D matrica reda 2n × 2n. Dokazati da je det E = det (AD − BC). 5. Neka je F polje, n prirodan broj i V vektorski prostor n×n matrica nad poljem F. Ako je A fiksna matrica iz V , neka je TA linearna transformacija prostora V definisana relacijom TA (B) = AB − BA, , (B ∈ V ). Posmatrajmo familiju F = {TA | kada A prolazi skupm dijagonalnih matrica}.
50
GLAVA 2. ELEMENTARNE KANONSKE FORME Dokazati da su operatori familije F simultano dijagonalizibilni.
2.5
Direktna suma
U kursu Uvod u linearnu algebru uveli smo pojam direktne sume potprostora i dokazali neke potrebne i dovoljne uslove da bi suma bila direktna. Navedimo joˇs nekoliko interesantnih osobina direktne sume. Definicija 2.5.1. Neka su W1 , . . . , Wk potprostori vektorskog prostora V. Kaˇzemo da su W1 , . . . , Wk nezavisni ako jednakost u1 + · · · + uk = 0, (ui ∈ Wi ) implicira da je svako ui nula vektor. ˇ ova definicija znaˇci za k = 2? Neka su W1 i W2 nezavisni potprostori i Sta neka je x ∈ W1 ∩ W2 . Tada je x + (−x) = 0, x ∈ W1 , −x ∈ W2 . Zbog nezavisnosti potprostora mora biti x = 0. Dakle, nezavisnost dva potprostora povlaˇci da je njihov presjek nula prostor. Obrnuto, neka je presjek potprostora W1 i W2 nula prostor. Tada je jasno da su ti potprostori nezavisni. U sluˇcaju kada je k > 2 nezavisnost potprostora W1 , . . . , Wk znaˇci mnogo viˇse nego W1 ∩ · · · ∩ Wk = {0}. Nezavisnost kaˇze da svako Wj u presjeku sa sumom preostalih potprostora daje nula potprostor. Neka su potprostori W1 , . . . , Wk nezavisni i neka je W = W1 + · · · + Wk . Tvrdimo da svako w ∈ W ima jedinstven prikaz w = u1 + · · · + uk , (ui ∈ Wi ). Pretpostavimo suprotno, tj. neka postoji element w ∈ W koji ima bar dva razliˇcita prikaza w = u1 + · · · + uk , w = v1 + · · · + vk , gdje su ui , vi ∈ Wi za svako i. Odavde je (u1 − v1 ) + · · · + (uk − vk ) = 0, ui − vi ∈ Wi . Zbog nezavisnosti potprostora W1 , . . . , Wk imamo ui − vi = 0, tj. ui = vi za svako i. Kontradikcija sa pretpostavkom da su prikazi razliˇciti! Lema 2.5.2. Neka je V vektorski prostor konaˇcne dimenzije, a W1 , . . . , Wk potprostori od V i W = W1 + · · · + Wk . Sljede´ci uslovi su ekvivalentni. (a) W1 , . . . , Wk su nezavisni. (b) Za svako j, 2 ≤ j ≤ k je Wj ∩ (W1 + · · · + Wj−1 ) = {0}.
2.5. DIREKTNA SUMA
51
(c) Ako je Bi ured¯ena baza potprostora Wi , 1 ≤ i ≤ k, tada je niz B = (B1 , . . . , Bk ) ured¯ena baza prostora W. Dokaz. Neka vrijedi (a). Neka je u ∈ Wj ∩ (W1 + · · · + Wj−1 ). Tada postoje vektori u1 , . . . , uj−1 , ui ∈ Wi takvi da je u = u1 + · · · + uj−1 . Odavde imamo u1 + . . . + uj−1 + (−u) + 0 + · · · + 0 = 0. Zbog nezavisnosti je u1 = · · · = uj−1 = u = 0, pa vrijedi (b). Neka vrijedi (b). Pokaˇzimo da vrijedi (a). Neka je u1 + · · · + uk = 0, (ui ∈ Wi ). Pretpostavimo da (a) ne vrijedi. Tada je bar jedno ui razliˇcito od nule. Neka je j najve´ci indeks za koji je uj 6= 0. Na osnovu ove pretpostavke imamo u1 + · · · + uj−1 + uj = 0, uj 6= 0. Odavde je uj = −u1 − · · · − uj−1 ∈ Wj ∩ (W1 + · · · + Wj−1 ) = {0}, tj. uj = 0. Kontradikcija! Pokaˇzimo sada da je (a) ekvivalentno sa (c). Neka vrijedi (a) i neka je B = (B1 , . . . , Bk ), gdje je Bi ured¯ena baza od Wi . Svaka linearna kombinacija vektora skupa B moˇze se napisati u obliku v1 + · · · + vk gdje je vi linearna kombinacija elemenata skupa Bi . Neka je linearna kombinacija elemenata skupa B jednaka nuli. Tada je v1 +· · ·+vk = 0, pa zbog nezavisnosti potprostora W1 , . . . , Wk imamo vi = 0 za svako i. No, vi je linearna kombinacija elemenata baze Bi , pa kako je ta linearna kombinacija jednaka nuli, to su svi koeficijenti te kombinacije jednaki nuli. Prema tome, skup B je linearno nezavisan. Da je on generator skupa W je oˇcito. Dakle, vrijedi (c). Potpuno analogno se dokazuje da iz (c) slijedi (a), pa to ostavljamo za vjeˇzbu. Definicija 2.5.3. Neka su W1 , . . . , Wk potprostori prostora V. Za sumu W1 +. . .+Wk kaˇzemo da je direktna ako je ispunjen bar jedan od uslova prethodne leme. Direktnu sumu potprostora oznaˇcavamo W = W1 ⊕ · · · ⊕ Wk . Definicija 2.5.4. Neka je V vektorski prostor. Projekcijom vektorskog prostora V nazivamo svaku linearnu transformaciju E prostora V takvu da je E 2 = E. Neka je E projekcija od V i S = Ker E i T = Im E. Vektor u je u T ako i samo ako postoji v ∈ V takav da je u = E(v). Odavde je E(u) = E 2 (v) = E(v) = u. Dakle, svaki nenulti vektor iz T je svojstveni vektor od E i odgovara svojstvenoj vrijednosti 1. Isto tako, svaki nenulti vektor potprostora S je svojstveni vektor
52
GLAVA 2. ELEMENTARNE KANONSKE FORME
linearne transformacije E koji odgovara svojstvenoj vrijednosti 0. Neka je sada x ∈ S ∩ T. Tada je x = E(y) za neko y ∈ V i E(x) = 0. Dakle, 0 = E(x) = E(E(y)) = E 2 (y) = E(y) = x. To znaˇci da je S ∩ T = {0}. Dakle, suma S + T je direktna suma. ˇ Cemu je jednaka ova suma? Neka je x ∈ V proizvoljan i y = x−E(x). Tada je E(y) = E(x)−E 2 (x) = E(x)−E(x) = 0, tj, y ∈ S. Tako imamo x = E(x)+(x−E(x)) ∈ T +S. Prema tome, V = S ⊕ T, a potprostori S i T su invarijantni u odnosu na E. Definicija 2.5.5. Ako postoji netrivijalan potprostor S prostora V koji je invarijantan u odnosu na linearnu transformaciju A, tada kaˇzemo da potprostor S reducira A i da je A reducibilno. Ako je V direktna suma potprostora S i T koji su invarijantni u odnosu na A, tada se kaˇze da je A potpuno reducibilno. Neka je E projekcija, S = Ker E i T = Im E. Ako je {e1 , e2 , . . . , er } baza potprostora T, a {er+1 , . . . , en } baza potprostora S, onda je B = {e1 , . . . , en } baza prostora V. Linearna transformacija E u odnosu na ovu bazu ima dijagonalnu matricu: µ ¶ I 0 [E]B = , 0 0 gdje je I jediniˇcna matrica reda r × r. Dakle, svaka projekcija je dijagonalizibilna. Projekcije koristimo da bi opisali razlaganje vektorskog prostora na direktnu sumu svojih potprostora. Neka je V = W1 ⊕ · · · ⊕ Wk i x ∈ V i x = u1 + · · · uk pri ˇcemu su ui ∈ Wi . Definiˇsimo preslikavanje Ej (x) = uj . Ovo preslikavanje je dobro definisano, zbog jedinstvenosti prikaza elementa x. Dalje je Im Ej = Wj i Ej2 = Ej . Odmah se vidi da je Ker Ej = W1 + · · · + Wj−1 + Wj+1 + · · · + Wk . Zbog toga je Ei Ej = 0, (i 6= j) za svako x ∈ V vrijedi x = E1 (x) + · · · + Ek (x). To znaˇci da je idV = E1 + · · · + Ek . Ove rezultate moˇzemo formulisati u obliku sljede´ceg teorema. Teorem 2.5.6. Ako je V = W1 ⊕ · · · ⊕ Wk , tada postoje linearne transformacije E1 , . . . , Ek prostora V takve da (a) svako Ei je projekcija, tj. Ei2 = Ei ; (b) Ei Ej = 0, ako je i 6= j; (c) idV = E1 + · · · + Ek ; (d) Im Ei = Wi . Obrnuto, ako su E1 , . . . , Ek linearne transformacije prostora V koje zadovoljavaju uslove (a), (b) i (c) i ako stavimo Wi = Im Ei , onda je V = W1 ⊕ · · · ⊕ Wk .
2.5. DIREKTNA SUMA
53
Dokaz. Prvi dio teoreme smo ve´c dokazali. Dokaˇzimo obrnutu tvrdnju. Zbog uslova (c) je x = idV (x) = E1 (x) + · · · + Ek (x) ∈ W1 + · · · + Wk . Dakle, V = W1 + . . . + Wk . Trebamo joˇs pokazati da je ova suma direktna. Zato je dovoljno pokazati jedinstvenost prikaza proizvoljnog elementa x iz V. Neka su x = u1 + . . . + uk x = v1 + . . . + vk dva razliˇcita prikaza elementa x pri ˇcemu su ui , vi ∈ Wi , (1 ≤ i ≤ k). Tada postoji j takvo da je uj 6= vj . Kako su uj , vj ∈ Wj = Im Ej , to postoje xj , yj ∈ V takav da je uj = Ej (xj ) i vj = Ej (yj ). Tada je à k ! k X X (b) (a) Ej (x) = Ej Ei (xi ) = Ej Ei (xi ) = Ej2 (xj ) = Ej (xj ) = uj . i=1
i=1
Analogno se pokazuje da je Ej (x) = vj , pa je uj = vj . Kontradikcija! Pretpostavka da suma nije direktna dovela nas je do kontradikcije, pa nije taˇcna.
2.5.1
Zadaci
1. Neka je V vektorski prostor konaˇcne dimenzije i neka je W1 bilo koji potprostor od V. Dokazati da postoji potprostor W2 prostora V takav da je V = W1 ⊕W2 . 2. Neka je V vektorski prostor konaˇcne dimenzije i neka su W1 , . . . , Wk potprostori prostora V takvi da je V dim V
= W1 + · · · + Wk , = dim W1 + · · · + dim Wk .
Dokazati da je V = W1 ⊕ · · · ⊕ Wk . 3. Na´ci projekciju E prostora R2 tako da je Im E potprostor generisan vektorom (1, −1), a potprostor Ker E je generisan vektorom (1, 2). 4. Neka je f polinom nad poljem f stepena n i E projekcija prostora V nad poljem F. Tada je f (E) = a idV + bE. Odrediti parametre a i b pomo´cu koeficijenata polinoma. 5. Ako je E projekcija, S = Im E i T = KerE, dokazati da je preslikavanje A = idV − E projekcija i da je njena jezgra S. 6. Neka je V realan vektorski prostor i E idempotentna linearna transformacija, tj. projekcija prostora V. Dokazati da je transformacija A = idV + E invertibilna i na´ci njen inverz.
54
2.6
GLAVA 2. ELEMENTARNE KANONSKE FORME
Invarijantne direktne sume
U ovom paragrafu teˇziˇste naˇseg interesovanja bi´ce na razlaganju vektorskog prostora V na direktnu sumu potprostora pri ˇcemu je svaki sumand invarijantan u odnosu na datu linearnu transformaciju. Neka je V = W1 ⊕ · · · ⊕ Wk i svaki sumand Wi invarijantan u odnosu na linearno preslikavanje A prostora V u samog sebe. Ovo razlaganje i linearna transformacija A prostora V induciraju linearno preslikavanje Ai : Wi → Wi koje je restrikcija preslikavanja A na skup Wi . Djelovanje transformacije A na prostoru V ´cemo opisati pomo´cu transformacija A1 , . . . , Ak . Ako je x ∈ V tada je x = u1 + · · · + uk , (ui ∈ Wi ), pa je A(x) = A(u1 ) + . . . + A(uk ) = A1 (u1 ) + · · · + Ak (uk ). Za ovakvu situaciju ´cemo re´ci da je A direktna suma transformacija A1 , . . . , Ak . Ovdje je vaˇzno napomenuti da linearna transformacija Ai nije linearne transformacije prostora V, ve´c njegovog potprostora Wi . Direktna suma V = W1 ⊕ · · · ⊕ Wk omogu´cava pridruˇzivanje vektoru x ured¯ene k−torke (x1 , . . . , xk ) vektora xi ∈ Wi , ˇ pri ˇcemu je x = x1 + · · · + xk . Cinjenica da je Wi invarijantan potprostor u odnosu na A omogu´cava transformaciji A da preko Ai djeluje na tom potprostoru. Ispitajmo kako se razlaganje linearne transformacije A u direktnu sumu linearnih tranasformacija A1 , . . . , Ak odraˇzava na matricu te linearne transformacije u odnosu na neku ured¯enu bazu. Neka je V = W1 ⊕ · · · ⊕ Wk pri ˇcemu su sumandi W1 , . . . , Wk invarijantni u odnosu na linearnu transformaciju A prostora V. Neka je Ai restrikcija od A na Wi . U svakom od potprostora Wi izaberimo ured¯enu bazu Bi . Neka je B = (B1 , . . . , Bk ). Tada je B baza prostora V. Neka je Ai matrica linearne transformacije Ai u odnosu na bazu Bi , a A matrica linearne transformacije A u odnosu na bazu B. Kako se A na Wi poklapa sa Ai , to je jasno da ´ce matrica A imati oblik A=
A1 0 ··· 0 A2 · · · .. .. . . 0 0 ···
0 0 .. .
,
(2.6.1)
Ak
pri ˇcemu su matrice Ai formata di × di gdje je di = dim Wi , a oznake 0 su nula matrice odgovaraju´ceg formata. Za matricu A za koju vrijedi (2.6.1) re´ci ´cemo da je direktna suma matrica A1 , . . . , Ak i pisati A = A1 ⊕ · · · ⊕ Ak . Teorem 2.6.1. Neka je A linearna transformacija prostora V, i neka su W1 , . . . , Wk i E1 , . . . Ek kao u Teoremu 2.5.6. Da bi svaki od potprostora Wi bio invarijantan u odnosu na A potrebno je i dovoljno da A komutira sa svakom od projekcija Ei , tj. AEi = Ei A, (i = 1, . . . , k).
2.6. INVARIJANTNE DIREKTNE SUME
55
Dokaz. Neka A komutira sa svakom projekcijom Ei i neka je u ∈ Wj . Tada je Ej (u) = u i A(u) = A(Ej (u)) = Ej (A(u)). Odavde slijedi da je A(u) ∈ Im Ej = Wj , pa je Wj invarijantno u odnosu na A. Neka je sada svako Wi invarijantno u odnosu na A. Neka je x proizvoljan vektor iz V. Tada je x = u1 + · · · + uk , (ui ∈ Wi ), pa kako je Ei (x) = ui , to je x = E1 (x) + · · · + Ek (x). Odavde je A(x) = A(E1 (x)) + · · · + A(Ek (x)). Budu´ci da je Ei (x) ∈ Wi i da je Wi invarijantno u odnosu na A, to je A(Ei (x)) ∈ Wi = Im Ei . Zato postoji yi ∈ V takvo da je A(Ei (x)) = Ei (yi ). Tada je (Ej AEi )(x) = Ej (A(Ei (x))) = Ej (Ei (yi )) ½ 0, ako je i 6= j = Ej (yj ), ako je i = j. Zbog toga je (Ej A)(x) = Ej (A(x)) = (Ej A)(E1 (x) + · · · + Ek (x)) = (Ej AE1 )(x) + · · · + (Ej AEk )(x) = Ej (yj ) = A(Ej (x)) = (AEj )(x). Kako je x proizvoljan element iz V, to je AEj = Ej A. Sada ´cemo opisati dijagonalizibilnu linearnu transformaciju A koriste´ci ”jezik” direktne sume. Teorem 2.6.2. Neka je A linearna transformacija vektorskog prostora konaˇcne dimenzije. Ako je A dijagonalizibilno i ako su λ1 , . . . , λk razliˇcite svojstvene vrijednosti od A, tada postoje linearne transformacije E1 , . . . , Ek prostora V takve da (a) A = λ1 E1 + · · · + λk Ek ; (b) idV = E1 + · · · + Ek ; (c) Ei Ej = 0, i 6= j; (d) Ei2 = Ei , tj. Ei je projekcija; (e) Im Ei je svojstveni potprostor od A koji odgovara svojstvenoj vrijednosti λi . Obrnuto, ako postoji k razliˇcitih skalara λ1 , . . . , λk i k nenultih linearnih transformacija prostora V koje zadovoljavaju uslove (a), (b) i (c), tada je linearna transformacija A dijagonalizbilna, λ1 , . . . , λk su njene razliˇcite svojstvene vrijednosti i vrijede uslovi (d) i (e).
56
GLAVA 2. ELEMENTARNE KANONSKE FORME
Dokaz. Pretpostavimo da je A dijagonalizibilno i da su λ1 , . . . , λk njene razliˇcite svojstvene vrijednosti. Neka je Wi svojstveni potprostor od A koji odgovara svojstvenoj vrijednosti λi , tj. neka je Wi = { x ∈ V | A(x) = λi x }. Tada je V = W1 ⊕ · · · ⊕ Wk . Neka su E1 , . . . Ek projekcije asocirane sa ovom dekompozicijom prostora V. Na osnovu Teorema 2.5.6 uslovi (b), (c), (d) i (e) su zadovoljeni. Pokaˇzimo da vrijedi uslov (a). Za svako x ∈ V imamo x = E1 (x) + · · · + Ek (x), pa je A(x) = A(E1 (x)) + · · · A(Ek (x)) = λ1 E1 (x) + · · · + λk Ek (x) = (λ1 E1 + · · · + λk Ek ) (x). Kako je x proizvoljan element prostora V, to je A = λ1 E1 + · · · + λk Ek . Ovim smo dokazali uslov (a). Obrnuto, neka je data linearna transformacija prostora V, nenulte linearne transformacije E1 , . . . , Ek i skalari λ1 , . . . , λk tako da vrijede uslovi (a), (b) i (c). Poˇsto je Ei ◦ Ej = 0 za i 6= j, to iz idV = E1 + . . . + Ek slijedi: Ei = Ei ◦ idV = Ei ◦ E1 + . . . + Ei ◦ Ek = Ei2 . Tako vrijedi (d). Iz A = λE1 + · · · + λk Ek imamo AEi = λ1 E1 ◦ Ei + . . . + λk Ek ◦ Ei = λi Ei2 = λi Ei . Dakle, (A − λi idV ) ◦ Ei = 0. To znaˇci da je ImEi ⊆ Ker(A − λi idV ).
(2.6.2)
Neka je α svojstvena vrijednost linearne transformacije A. Tada postoji y ∈ V takav da je A(y) = α y i y 6= 0. Osim toga je A − α idV = (λ1 − α)E1 + · · · + (λk − α)Ek , pa je 0 = (A − α idV )(y) = (λ1 − α)E1 (y) + · · · + (λk − α)Ek (y). Sada za svako j imamo 0 = Ej (0) = (λ1 − α)Ej ◦ E1 + · · · + (λk − α)Ej ◦ Ek = (λj − α)Ej2 = (λj − α)Ej . Dakle, (λj − α)Ej (y) = 0 za svako j. No, y 6= 0, pa za neko i vrijedi Ei (y) 6= 0. Zbog toga, za tako odabran indeks i je λi − α = 0. To znaˇci da ako postoji svojstvena vrijednost linearne transformacije A, onda je ona neki od skalara λ1 , . . . , λk . Pokaˇzimo sada da je svaki od skalara λ1 , . . . , λk svojstvena vrijednost. Neka je i proizvoljan
2.6. INVARIJANTNE DIREKTNE SUME
57
indeks. Kako Ei nije nula transformacija, to postoji bar jedno x ∈ V takvo da je Ei (x) 6= 0. Kako je Ei (x) ∈ Ker(A − λi idV ), to je 0 = (A − λi idV )(Ei (x)) = A(Ei (x)) − λi Ei (x), tj. A(Ei (x)) = λi Ei (x) i Ei (x) 6= 0. Dakle, λi je svojstvena vrijednost linearne transformacije A. Prema tome, jedine razliˇcite svojstvene vrijednosti linearne transformacije A su λ1 , . . . , λk . Pokaˇzimo sada da je A dijagonalizibilno. Iz relacije (2.6.2) slijedi da je svaki nenulti element potprostora Im Ei je svojstveni vektor transformacije A. Da bi pokazali da je A dijagonalizibilno moramo pokazati da postoji baza prostora V sastavljena od svojstvenih vektora. S obzirom na naprijed reˇceno dovoljno je dokazati da je Im Ei = Ker(A − λi idV ). Neka je x ∈ Ker(A − λi idV ). Tada je A(x) = λi x. Kako je k X x= Ej (x), j=1
to je λi
k X
k X Ej (x) = A Ej (x)
j=1 k X
j=1
λi Ej (x) =
j=1 k X
k X
A(Ej (x))
j=1
λi Ej (x) =
j=1
k X
λj Ej (x),
j=1
tj. k X
(λi − λj ) Ej (x) = 0.
j=1
Odavde slijedi (λi − λj ) Ej (x) = 0 za svako j ∈ {1, . . . , k}. Dakle, za svako j 6= i mora biti Ej (x) = 0. To znaˇci da je x = 0 + . . . + 0 + Ei (x) + 0 + . . . + 0 = Ei (x) ∈ Im Ei . Dakle, Ker(A − λi idV ) ⊆ Im Ei . Odavde i iz (2.6.2) slijedi Im Ei = Ker(A − λi idV ). Time je dokaz zavrˇsen Prvi dio Teorema 2.5.6 kaˇze da za dijagonalizibilnu linearnu transformaciju A skalari λ1 , . . . , λk i linearne transformacije E1 , . . . , Ek su jednoznaˇcno odred¯eni uslovima (a),(b) i (c) zbog toga ˇsto su skalari λi razliˇciti, a linearne transformacije Ei nisu nula linearne transformacije.
58
GLAVA 2. ELEMENTARNE KANONSKE FORME
Ako za linearne transformacije vrijede uslovi (b),(c) i (d) prethodnog teorema, onda je à n !t n X X λi Ei = λti Ei i=1
i=1
za svaki prirodan broj t. Naime, zbog osobine (c) mjeˇsoviti ˇclanovi Ei ◦ Ej , (i 6= j) se poniˇstavaju. Neka je A = λ1 E1 + . . . + λk Ek i neka je g=
n X
αj xj
j=0
polinom nad poljem F. Tada je n X g(A) = αj n X = αj k X
=
!j λi Ei
i=1
j=0
j=0
à k X à k X
! λji
Ei
i=1
n X αj λj Ei i
i=1
j=0
k X g(λi )Ei .
=
i=1
Dakle, za svaki polinom g vrijedi g(A) =
k P
g(λi )Ei .
i=1
Skalarima λ1 , . . . , λk pridruˇzimo Lagrangeove polinome pj =
Y (x − λi ) . (λj − λi ) i6=j
Odavde je pj (λi ) = δij , pa je p(A) =
k X i=1
p(λi )Ei =
k X δij Ei = Ej . i=1
Dakle, projekcije Ei ne samo da komutiraju sa A ve´c su polinomi u varijabli A.
2.6. INVARIJANTNE DIREKTNE SUME
2.6.1
59
Zadaci
1. Neka je E projekcija od V i neka je A linearna transformacija prostora V. Dokazati da je potprostor Im E invarijantan u odnosu na A ako i samo ako je EAE = AE. Dokazati da su Im E i Ker E invarijantni u odnosu na A ako i samo ako je EA = AE. 2. Neka je A linearna transformacija prostora V = R2 koji u odnosu na standarnu bazu ima matricu µ ¶ 2 1 A= . 0 2 Neka je W1 potprostor od V generisan vektorom e1 = (1, 0). (a) Dokazati da je W1 invarijantno u odnosu na A. (b) Dokazati da ne postoji potprostor W2 prostora V koji je invarijantan u odnosu na A i za koji je V = W1 ⊕ W2 . 3. Neka je A linearna transformacija prostora V konaˇcne dimenzije. Neka je R = Im A i N = Im A. Dokazati da su R i N nezavisni ako i samo ako je V = R ⊕ N. 4. Neka je A linearna transformacija prostora V. Pretpostavimo da je V = W1 ⊕ · · ·⊕Wk , gdje je svako od Wi invarijantno u odnosu na A. Neka je Ai inducirano preslikavanje tj. restrikcija od A na Wi (a) Dokazati da je det (A) = det (A1 ) · det (A2 ) · · · det (Ak ). (b) Dokazati da je karakteristiˇcni polinolinom f transformacije A proizvod karakterisˇcnih polinoma transformacija f1 , . . . , fk . (c) Dokazati da je minimalan polinom transformacije A najmanji zajedniˇcki sadrˇzilac minimalnih polinoma transformacija A1 , . . . , Ak . Uputstvo: Koristiti direktnu sumu matrica. 5. Neka je A matrica reda 4 × 4 iz Primjera 2.2.5. Na´ci matrice E1 , E2 i E3 takve da je A = λ1 E1 + λ2 E2 + λ3 E3 , E1 + E2 + E3 = I i Ei Ej = 0 za i 6= j. 6. Neka je A linearna transformacija iz Primjera 2.1.13. Koriste´ci Lagrangeove polinome predstavite matricu A u obliku A = E1 + 2E2 , E1 + E2 = I, E1 E2 = 0. 7. Neka je V vektorski prostor neprekidnih realnih funkcija na segmentu [−1, 1]. Neka je Wp potprostor svih parnih funkcija prostora V, a Wn potprostor svih neparnih funkcija prostora V. (a) Dokazati da je V = Wp ⊕ Wn . (b) Neka je A linearna transformacija na V zadana relacijom Z x (Af )(x) = f (t)dt. 0
Ispitati da li su potprostori Wp i Wn invarijantni u odnosu na A.
60
2.7
GLAVA 2. ELEMENTARNE KANONSKE FORME
Teorem o primarnoj dekompoziciji
Neka je V vektorski prostor konaˇcne dimenzije i A linearna transformacija prostora V, koja ima minimalan polinom koji je proizvod linearnih (ne obavezno razliˇcitih) faktora. Sada ´cemo dati jedan opˇsti metod za dekompoziciju ove linearne transformacije. Teorem 2.7.1. (Teorem o primarnoj dekompoziciji) Neka je A linearna transformacija prostora V konaˇcne dimenzije nad poljem F. Neka je p minimalni polinom transformacije A i neka je p = pr11 · · · prkk gdje su p1 , . . . , pr razliˇciti prosti (tj. nesvodljivi) moniˇcni polinomi nad poljem F i ri prirodni brojevi. Neka je Wi = Ker pi (A)ri , (i = 1, . . . , k). Tada (a) V = W1 ⊕ · · · ⊕ Wk ; (b) svako Wi je invarijantno u odnosu na A; (c) Ako je Ai restrikcija transformacije A na Wi , tada je minimalan polinom transformacije Ai upravo pri i . Dokaz. Za svako i formirajmo polinom fi =
Y rj p pj . = pri i j6=i
Polinomi f1 , . . . , fk su relativno prosti, pa je ideal algebre F[x] generisan ovim polinomima ˇcitava algebra F[x]. To znaˇci da postoje polinomi g1 , . . . , gk takvi da je k X
fi gi = 1.
i=1
Primjetimo da je proizvod fi fj za i 6= j djeljiv sa p, jer sadrˇzi sve faktore polinoma p. Posmatrajmo polinom hi = fi gi . Neka je Ei = hi (A) = fi (A)gi (A). Kako je f1 g1 + · · · + fk gk = 1, to je E1 + · · · + Ek = idV . Kako je p(A) = 0 i p | fi fj za i 6= j, to je Ei Ej = 0 za svako i 6= j. To zna´ci da su E1 , . . . , Ek projekcije, pa je V = Im E1 ⊕ · · · ⊕ Im Ek . Pokaˇzimo sada da je Im Ei = Wi za svako i. Neka je u ∈ Im Ei . Tada je u = Ei (v), (v ∈ V ), pa je pi (A)ri (u) = pi (A)ri (Ei (v)) = pi (A)ri (fi (A)gi (A)(v)) = 0, jer je polinom pri i fi = p, pa je pi (A)ri fi (A)gi (A) = 0 · gi (A) = 0. Dakle, u ∈ Ker pi (A)ri , tj. Im Ei ⊆ Ker pi (A)ri . Obrnuto, neka je u ∈ Ker pi (A)ri . Ako je j 6= i, tada je Y r Y fj gj = gj pkk = pri i gj prkk , k6=j
k6=j,i
2.7. TEOREM O PRIMARNOJ DEKOMPOZICIJI
61
pa je fj gj djeljivo sa pri i kad god je j 6= i. Zbog toga je fj (A)gj (A)(u) = 0 za svako j 6= i, pa je Ej (u) = 0 za svako j 6= i. Na osnovu ovog rezultata je u = E1 (u) + · · · + Ek (u) = Ei (u), pa je u ∈ ImEi . Prema tome Im Ei = Ker pi (A)ri . Ovim je tvrdnja pod (a) dokazana. Potprostor Wi = Im Ei je invarijantan u odnosu na A ako i samo ako je AEi = Ei A. Budu´ci da je Ei polinom u varijabli A, to je komutativnost AEi = Ei A ispunjena za svako i. Dakle, svaki od potprostora W1 , . . . , Wk je invarijantan u odnosu na A. Tako smo dokazali i uslov (b). Ako je Ai restrikcija od A na Wi , onda je pi (Ai )ri = 0, jer je pi (A)ri = 0 na Wi po definiciji. Odavde slijedi da minimalan polinom od Ai dijeli polinom pri i . Obrnuto, neka je g neki polinom takav da je g(Ai ) = 0. Tada je g(A)fi (A) = 0, jer je fi (A) nula na V osim na Wi , a g(A) = 0 na Wi . Tada minimalan polinom p od A dijeli fi g. Odavde slijedi da pri i dijeli g. To upravo znaˇci da je pri i minimalan polinom od Ai za svako i. Posljedica 2.7.2. Neka su E1 , . . . , Ek projekcije koje odgovaraju primarnoj dekompoziciji od A. Ako je T linearna transformacija koja komutira sa A, tada T komutira sa svakom projekcijom Ei , tj. svaki potprostor Wi je invarijantan u odnosu na T . Primjenimo prethodni teorem na sluˇcaj da su svi pi polinomi prvog stepena, tj. pi = x − λi , λi ∈ F. Tada je Wi = Im Ei = Ker (A − λi idV )ri . Neka je D = λ1 E1 + · + λk Ek . Prema Teoremu 2.6.2 transformacija D je dijagonalizibilna transformacija i zva´cemo je dijagonalizibilni dio od A. Posmatrajmo sada linearnu transformaciju N = A − D. Kako je A = AE1 + · · · + AEk D = λ1 E1 + · · · + λk Ek , to je N = (A − λ1 idV )E1 + · · · + (A − λk idV )Ek . Odavde je N r = (A − λ1 idV )r E1 + · · · + (A − λk idV )r Ek . Ako je r ≥ ri za svako i, onda je N r = 0, jer je linearna transformacija (A − λi idV )r nula transformacija na skupu Im Ei . Definicija 2.7.3. Neka je N linearna transformacija vektorskog prostora V. Kaˇzemo da je N nilpotentna linearna transformacija, ako postoji prirodan broj r takav da je N r = 0. Teorem 2.7.4. Neka je A linearna transformacija konaˇcno dimenzionalnog vektorskog prostora V nad poljem F. Pretpostavimo da se minimalni polinom p od A razlaˇze na linearne faktore nad poljem F. Tada postoji dijagonalizibilni operator D prostora V takav da
62
GLAVA 2. ELEMENTARNE KANONSKE FORME
(a) A = D + N , (b) DN = N D. Dijagonalizibilni operator D i nilpotentni operator N su jedinstveno odred¯eni uslovima (a) i (b) i svaki od njih je polinom u varijabli od A. Dokaz. U dijelu koji je prethodio definiciji dokazali smo da je D dijagonalizibilna i N nilpotentna linearna transformacija. Osim toga iz definicije D i N vidi se da su to polinomi u varijabli A. Ostalo nam je da dokaˇzemo jedinstvenost. Neka je A = D + N i A = D0 + N 0 pri ˇcemu D0 i N 0 komutiraju med¯usobno. Sada imamo D + N = D0 + N 0 , tj. D − D0 = N 0 − N . Kako su D i D0 dijagonalizibilni i komutiraju med¯usobno, to ih moˇzemo simultano dijagonalizirati. Zbog toga je i D−D0 dijagonalizibina linerana transformacija. Transformacije N i N 0 su nilpotenne i komutiraju, pa je 0
t
(N − N ) =
t X j=1
µ j
(−1)
t j
¶ (N 0 )t−j N j .
Odavde se vidi da za dovoljno veliko t moˇzemo dobiti da je svaki sabirak nula. To znaˇci da je linearna transformacija N 0 − N nilpotentna. Zato je D − D0 dijagonalizibilna i nilpotentna transformacija. Neka je npr. (D − D0 )r = 0. Tada minimalan polinom ove transformacije dijeli polinom xr . Zbog dijagonalizibilnosti, minimalan polinom mora imati jednostruke faktore. Zato je minimalan polinom x. Dakle, D − D0 = 0, tj. D = D0 . No, tada je i N = N 0 . Posljedica 2.7.5. Neka je V vektorski prostor konaˇcne dimenzije nad algebarski zatvorenim poljem F. Tada se svaka linearna transformacija A moˇze napisati kao suma jedne dijagonalno divizibilne D i jedne nilpotentne N linearne transformacije koje med¯usobno komutiraju. Linearne transformacije D i N su jednoznaˇcno odred¯ene. Zbog ove posljedice studija linearnih transformacija vektorskih prostora nad algebarski zatvorenim poljima svedena je na prouˇcavanje nilpotentnih linearnih transformacija. Za vektorske prostor nad nealgebarski zatvorenim poljima moramo na´ci neku zamjenu za svojstvene vrijednosti i svojstvene vektore. O ovome ´ce biti govora u narednom poglavlju.
2.7.1
Zadaci
1. Neka je A linearna transformacija prostora R4 koja u odnosu na ured¯enu standardnu bazu ima matricu 6 −3 −2 4 −1 −2 . 10 −5 −3 Izraziti minimalan polinom u obliku p = p1 p2 proizvoda nesvodljivih faktora p1 i p2 nad poljem relnih brojeva. Neka je Wi = Ker pi (A). Na´ci baze Bi
2.7. TEOREM O PRIMARNOJ DEKOMPOZICIJI
63
potprostora W1 i W2 . Ako je Ai redukcija od A na Wi na´ci matrice Ai od Ai u bazi B − i. 2. Neka je A linearna transformacija stndardnu bazu ima matricu 3 2 2
prostora R3 koja u odnosu na ured¯enu 1 −1 2 −1 . 2 0
Pokazati da postoji dijagonalizibilna linearna transformacija D i nilpotentna linearna transformacija N takve da je A = D + N i DN = N D. Na´ci matrice D i N koje odgovaraju ovim transformacijama u odnosu na stadardne baze. 3. Ako je V vektorski prostor polinoma stepena manjeg ili jednakog od n nad poljem F, dokazati da je linearna transformacija koja odgovara diferenciranju polinoma nilpotentna linearna transformacija. 4. Neka je A linearna transformacija konaˇcno dimenzionalnog vektorskog prostora V sa karakteristiˇcnim polinomom f = (x − λ1 )d1 · · · (x − λk )dk i minimalnim polinomom p = (x − λ1 )r1 · · · (x − λk )rk . Neka je Wi = Ker (A − λi idV )ri . (a) Dokazati da je Wi skup svih vektora u ∈ V takvih da je (A − λi idV )m (u) = 0 za neki prirodan broj m (koji moˇze da zavisi od u). (b) Dokazati da je dim Wi = di . (Uputstvo: Ako je Ai restrikcija od A na Wi , onda je Ai − λi idv nilpotentna transformacija, pa je njen karakteristiˇ nki polinom xei , gdje je ei dimenzija od Wi . Tada je karakteristiˇcni polinom (x − λi )ei . Zatim treba koristiti ˇcinjenicu da je karakteristiˇcni polinom od A proizvod karakteristiˇcnih polinoma od Ai . Iz ovog izvuˇci zakljuˇcak da je di = ei .) 5. Neka je V vektorski prostor konaˇcne dimenzije nad poljem F, a A linearna transformacija prostora V takva da je rang A = 1. Dokazati da je dijagonalizibila ili nilpotentna transformacije (jedno od ovog, a ne oboje istovremeno). 6. Neka je V vektorski prostor matrica reda n × n nad poljem F. Neka je A ∈ V fiksna matrica i neka je linearna transformacija A je definisan sa A(B) = AB−BA, (B ∈ V ). Ako je matrica A nilpotentna dokazati da je A nilpotentna transformacija.
64
GLAVA 2. ELEMENTARNE KANONSKE FORME 7. Dati primjer dvije razliˇcite matrice reda 4×4 koje imaju isti minimalni polinom (te matrice ne moraju imati iste karakteristiˇcne polinome, ali nisu sliˇcne.) 8. Ako je N nilpotentna linearna transformacija prostora V dimenzije n, onda je karakteristiˇcni polinom xn .
Glava 3
Racionalna i Jordanova forma 3.1
Cikliˇ cki potprostori
Neka je V vektorski prostor konaˇcne dimenzije i A proizvoljna ali fiksirana linearna transformacija toga prostora. Ako je u ∈ V proizvoljan vektor, tada postoji minimalan potprostor prostora V koji sadrˇzi u i invarijantan je u odnosu na A. Kako odrediti ovaj potprostor? Moˇzemo posmatrati skup svih potprostora prostora V koji sadrˇze u i invarijantni su u odnosu na A. Ovaj skup nije prazan, jer je V u ovom skupu. Presjek svih elemenata tog skupa bi ´ce minimalan potprostor prostora V koji sadrˇzi u i invarijantan je u odnosu na A. Do ovog potprostora moˇzemo do´ci na drugi naˇcin. Naime, neka je W invarijantan potprostor u odnosu na A koji sadrˇzi vektor u. Tada potprostor W sadrˇzi vektore u, A(u), A(A(u)) = A2 (u), . . . , Ak (u), . . . pa i njihove linearne kombinacije. To znaˇci da je g(A)(u) ∈ W za svaki polinom g ∈ F[x]. Ovo nam daje povod za sljede´cu definiciju. Definicija 3.1.1. Ako je u ∈ V, A−ciklˇcki potprostor generisan elementom u je potprostor Z(u, A) svih vektora oblika g(A)(u), g ∈ F[x]. Ako je Z(u, A) = V, onda kaˇzemo da je u cikliˇcki vektor linearne transformacije A. Drugi naˇcin opisivanja potprostora Z(u, A) je da je Z(u, A) potprostor prostora V generisan svim vektorima oblika Ak (u), (k = 0, 1, 2, . . .). Primjer 3.1.2. Ako je u nula vektor, onda je Z(u, A) = {0} nula potprostor prostora V. Ako je u svojstveni vektor linearne transformacije A, onda su vektori Ak (u) (k = 0, 1, 2, . . .) kolinearni sa u. To znaˇci da je potprostor Z(u, A) generisan nenultim vektorom u, pa je njegova dimenzija 1. Obrnuto, ako je dim Z(u, A) = 1, onda je u 6= 0 i bilo koji nenulti vektor t tog potprostpra generiˇse taj potprostor. Zato moˇzemo uzeti da u generiˇse taj potprostor. Tada je A(u) ∈ Z(u, A), pa je A(u) = λ u. Dakle, u je svojstveni vektor linearne transformacije A. Prema tome, potprostor Z(u, A) je dimenzije 1 ako i samo ako je u svojstveni vektor linearne transformacije A. Odavde odmah slijedi da za identiˇcnu linearnu transformaciju idV i za svaki nenulti vektor u vrijedi dim Z(u, idV ) = 1. 65
66
GLAVA 3. RACIONALNA I JORDANOVA FORMA
Primjer 3.1.3. Neka je A linearna transformacija prostora V = R2 koja u odnosu na standardnu bazu {e1 , e2 , } ima matricu µ A=
0 1
0 0
¶ .
Odredimo potprostore Z(e1 , A) i Z(e2 , A). Potprostor Z(e1 , A) je generisan vektorima e1 , A(e1 ), A2 (e1 ), A2 (e1 ), . . . , tj. vektorima
e1 , A(e1 ) = e2 , A2 (e1 ) = A(e2 ) = 0, . . . .
Dale Z(e1 , A) je generisan vektorima e1 , e2 , pa je cio prostor V. Dakle, e1 je cikliˇcki vektor linearne transformacije A. Iz matrice A vidimo da je e2 svojstveni vektor linearne transformacije A koji odgovara svojstvenoj vrijednosti λ = 0. Zbog toga je Z(e2 , A) jednodimenzionalni potprostor prostora V generisan vektorom e2 .
Definicija 3.1.4. Neka je A linearna transformacija vektorskog prostora V nad poljem F i u ∈ V. A−anihilator od u je ideal M (u, A) u F[x] koji se sastoji od svih polinoma g nad F takvih da je g(A)(u) = 0. Jedinstveni monik polinom pu koji generiˇse ideal M (u, A) zovemo takod¯er A−anihilator od u. Ako je p minimalan polinom transformacije A, onda je p(A) = 0, pa je specijalno p(A)(u) = 0. To znaˇci da je p ∈ M (u, A). Tada pu dijeli minimalan polinom p transformacije A. Teorem 3.1.5. Neka je u ∈ V bilo koji nenulti vektor i neka je pu A−anihilator od u. (a) Stepen polinoma pu jednak je dimenziji cikliˇckog potprostora Z(u, A). (b) Ako je stepen od pu jednak k, tada vektori u, A(u), . . . , Ak−1 (u) formiraju bazu potprostora Z(u, A). (c) Ako je U restrikcija linearne transformacije A na Z(u, A), onda je pu minimalan polinom transformacije U. Dokaz. Neka je w proizvoljan element potprostora Z(u, A). Tada postoji polinom g ∈ F[x] takav da je w = g(A)(u). Ako na polinome g i pu primjenimo algoritam o djeljenju imamo g = pu q + r, gdje je r = 0 ili je polinom stepena manjeg od stepena polinoma pu . Kako je pu q ∈ M (u, A), to je (pu q)(A)(u) = 0. Zato je g(A)(u) = r(A)(u). Neka je k = deg pu . Tada je r = 0 ili je deg r < k. Zbog toga je vektor r(A)(u) linearna kombinacija vektora u, A(u), . . . , Ak−1 (u). No, tada je i vektor g(A)(u) generisan istim tim vektorima. Dakle, svaki element potprostora Z(u, A) je generisan vektorima u, A(u), . . . , Ak−1 (u). Ako bi ovi vektori bili linearno zavisni onda bi postojali skalari α0 , α1 , . . . , αk−1 koji nisu svi jednaki nuli takvi da je α0 u + α1 A(u) + . . . + αk−1 Ak−1 (u) = 0. Dakle, nenulti polinom h1 = α0 +α1 x+. . .+αk−1 xk−1 ima osobinu da je h1 (A)(u) = 0, pa je h1 ∈ M (u, A). To znaˇci da pu | h1 . Ovo je nemogu´ce jer je h1 nenulti polinom
ˇ 3.1. CIKLICKI POTPROSTORI
67
stepena manjeg od stepena polinoma pu . Dakle, skup {u, A(u), . . . , Ak−1 (u)} je baza potprostora Z(u, A). Tako smo dokazali tvrdnje (a) i (b). Neka je U restrikcija od A na Z(u, A). Posmatrajmo transformaciju pu (U) prostora Z(u, A). Neka je w = g(A)(u) bilo koji vektor iz Z(u, A). Tada je pu (U)(w) = pu (A)(g(A)(u)) = g(A) [pu (A)(u)] = g(A)(0) = 0. To znaˇci da je transformacija pu (U) nula transformacija na Z(u, A), pa je pu (U) = 0. Tada minimalan polinom h transformacije U dijeli pu . S druge strane je 0 = h(U)(u) = h(A)(u), pa je h ∈ M (u, A), tj. pu dijeli h. Kako su pu i h monik polinomi to je h = pu . Primjenimo ovaj teorem na jedan specijalan sluˇcaj. Teorema kaˇze: ako je u cikliˇcki vektor transformacije A, onda minimalan polinom transformacije mora imati stepen dim V. Kako minimalni polinom dijeli karakteristiˇcni polinom i karakteristiˇcni polinom ima stepen jednak dim V, to je, u ovom sluˇcaju, minimalan polinom jednak karakteristiˇcnom polinomu transformacije A. Mi ´cemo kasnije dokazati da za bilo koju linearnu transformaciju A postoji vektor u ∈ V takav da je minimalan polinom od A anihilator vektora u. Iz tog ´ce slijediti da transformacija A ima cikliˇcki vektor ako i samo ako se minimalan polinom od A poklapa sa karakteristiˇcnim polinomom. Ali za ovaj zakljuˇcak potrebno je malo rada kako ´cemo vidjeti u izlaganju koje slijedi. Naˇs plan u prouˇcavanju opˇstih linearnih transformacija je korisiti linearne transformacije koje imaju cikliˇcki vektor. Tako, neka je U linearna transformacija prostora W dimenzije k koja ima cikliˇcki vektor u. Na osnovu Teorema 3.1.5 vektori u, U(u), . . . , U k−1 (u) ˇcine bazu prostora W, i anihilator pu elementa u je minimalan polinom za U, dakle, i karakteristiˇcni polinom za U. Ako stavimo ui = U i−1 (u), (i = 1, 2, . . . , k), tada transformacija U djeluje na ured¯enu bazu B = {u1 , . . . , uk } ovako: U(ui ) = ui+1 , i = 1, 2, . . . , k − 1 U(uk ) = −γ0 u1 − γ1 u2 − · · · − γk−1 uk , gdje je pu = γ0 + γ1 x + · · · + γk−1 xk−1 + xk minimalan polinom transformacije U. Iz definicije vektora ui jasno je da je U(ui ) = ui+1 (i = 1, 2, . . . , k − 1). Budu´ci da je pu (U) = 0, to je 0 = pu (U)(u) = γ0 u + γ1 U(u)x + · · · + γk−1 U k−1 (u) + U k (u),
tj.
68
GLAVA 3. RACIONALNA I JORDANOVA FORMA 0 = γ0 u1 + γ1 u2 + · · · + γk−1 uk + U(uk ).
Odavde imamo U(uk ) = −γ0 u1 − γ1 u2 − · · · − γk−1 uk . Linearna transformacija U u odnosu 0 0 0 1 0 0 0 1 0 .. .. .. . . .
na bazu B ima matricu ··· 0 −γ0 ··· 0 −γ1 ··· 0 −γ2 . .. .. . .
0 0 0 ···
(3.1.1)
1 −γk−1
Definicija 3.1.6. Matrica (3.1.1) zove se prate´ca matrica polinoma pu = γ0 + γ1 x + · · · + γk−1 xk−1 + xk . Teorem 3.1.7. Ako je U linearna transformacija prostora W konaˇcne dimenzije, tada U ima cikliˇcki vektor ako i samo ako postoji neka ured¯ena baza prostora W u odnosu na koju transformaciji U odgovara prate´ca matrica minimalnog polinoma transformacije U. Dokaz. Prvi dio tvrdnje smo ve´c dokazali. Dokaˇzimo drugi dio. Neka postoji ured¯ena baza B = {u1 , . . . , uk } prostora W u odnosu na koju transformacija U ima matricu (3.1.1) koja je prate´ca matrica minmalnog polinoma transformacije U. Tada se odmah vidi da je u = u1 cikliˇcki vektor transformacije U. Posljedica 3.1.8. Ako je A ∈ Fk×k prate´ca matrica moniˇcnog polinoma p, tada je p istovremeno i minimalni i karakteristiˇcni polinom matrice A. Dokaz. Matrica A u odnosu na ured¯enu standardnu (kanonsku) bazu prostora Fk odred¯uje transformaciju A. Tada na osnovu prethodne teoreme transformacija A ima cikliˇcki vektor. Minimalan polinom i karakteristiˇcni polinom transformacije A se poklapaju. No, ti polinomi su istovremeno i minimalni i karakteristiˇcni polinom matrice A. Zakljuˇcimo ovaj paragraf sljede´cim komentarom. Neka je A linearna transformacija prostora V i u ∈ V bilo koji vektor, a U restrikcija linearne transformacije A na Z(u, A). Tada transformacija U ima cikliˇcki vektor i to upravo vektor u. Zbog toga Z(u, A) ima ured¯enu bazu u odnosu na koju transformacija U ima matricu koja je prate´ca matrica polinoma pu , tj. A−anihilatora od u.
3.1.1
Zadaci
1. Neka je A linerana transformacija prostora R2 . Dokazati da bilo koji nenulti vektor koji nije svojstveni vektor od A je cikliˇcki vektor od A. 2. Neka je A linearna transformacija prostora R3 koja u odnosu na ured¯enu standardnu bazu ima matricu 2 0 0 0 2 0 . 0 0 −1
3.2. RACIONALNA KANONSKA FORMA MATRICE
69
ˇ je A−cikliˇcki potprostor generisan Dokazati da A nema cikiliˇckog vektora. Sta vektorom (−1, 1, 3)? 3. Neka je A linearna transformacija prostora C3 koja u odnosu na standardnu ured¯enu bazu ima matricu 1 i 0 −1 2 −i . 0 1 1 Na´ci A−anihilator vektora (1, 0, 0), zatim vektora (1, 0, i). 4. Dokazati da ako A2 ima cikliˇcki vektor, tada i A ima cikliˇcki vektor. Da li vrijedi obrnuto? 5. Neka je V vektorski prostor dimenzije n nad poljem F i neka je N nilpotentna linearna transformacija prostora V. Pretpostavimo da je N n−1 6= 0 i da je u neki vektor prostora V takav da je N n−1 (u) 6= 0. Dokazati da je u cikliˇcki vektor od N . Odrediti matricu koja odgovara N u odnosu na ured¯enu bazu {u, N (u), . . . , N n−1 (u)}. 6. Neka je A linearna transformacija prostora V konaˇcne dimenzije i neka transforamacija A ima cikliˇcki vektor. Ako transformacija U komutira sa A, dokazati da je tada U polinom od A. 7. Za svaku od linearnih transformacija A vektorskog prostora V na´ci ured¯enu bazu A−cikliˇckog potprostora generisanog vektorom z, tj. odrediti maksimalan linearno nezavisan skup oblika {z, A(z), A2 (z), . . .}. (a) V = R4 , A(a, b, c, d) = (a + b, b − c, a + c, a + d), z = (1, 0, 0, 0) (b) V je skup polinoma stepena ≤ 3 sa koeficijentima iz polja R, A(f ) = f ”, z = x3 . µ ¶ 0 1 2×2 t (c) V = R , A(A) = A i z = , 1 0 µ ¶ µ ¶ 1 1 0 1 2×2 (d) V = R , A(A) = ·A i z = . 2 2 1 0
3.2
Racionalna kanonska forma matrice
Primarni cilj u ovoj sekciji je dokazati da za svaku linearnu transformaciju A vektorskog prostora V konaˇcne dimenzije postoje vektori u1 , . . . , ur takvi da je V = Z(u1 , A) ⊕ · · · ⊕ Z(ur , A). Drugm rijeˇcima, mi ´cemo dokazati da je prostor V direktna suma A−cikliˇckih potprostora. Mi ´cemo tako dokazati da je A direktna suma konaˇcnog broja linearnih transformacija od kojih svaka ima cikliˇcki vektor. Zbog toga ´cemo prouˇcavanje
70
GLAVA 3. RACIONALNA I JORDANOVA FORMA
linearnih transformacija svesti na prouˇcavanje linearnih transformacija koje imaju cikliˇcke vektore. Teorem o cikliˇckoj dekompoziciji je jedan od najvaˇznijih rezultata linearne algebre i ima mnogo interesantnih posljedica. Teorem o cikliˇckoj dekompoziciji daje odgovor na sljede´ce pitanje. Koji A− invarijantni potprostor W ima osobinu da postoji A− invarijantni potprostor W 0 takav da je V = W ⊕ W 0 ? Iz Uvoda u linearnu algebru znamo da za svaki potprostor W prostora V postoji potprostor W 0 takav da je V = W ⊕W 0 i taj potprostor smo zvali komplement od W. Kako smo vidjeli komplement ne mora biti jednoznaˇcno odred¯en. Mi sada postavljamo pitanje koji A−invarijantni potprostor W ima komplement koji je takod¯e A−invarijantan. Neka je V = W ⊕ W 0 pri ˇcemu su W i W 0 A−invarijantni potprostori. Neka je u ∈ V tada je u = w + w0 za neke w ∈ W i w0 ∈ W 0 . Ako je f polinom nad poljem skalara F nad kojim posmatramo vektorski prostor, onda je f (A)(u) = f (A)(w + w0 ) = f (A)(w) + f (A)(w0 ). Kako su W i W 0 invarijantni u odnosu na A, to je f (A(w) ∈ W i f (A)(w0 ) ∈ W 0 . Zbog toga je f (A)(u) ∈ W ako i samo ako je f (A)(w0 ) = 0. U to sluˇcaju je f (A)(u) = f (A)(w). Ovo nam daje povod za uvod¯enje sljede´ce definicije. Definicija 3.2.1. Neka je A linearna transformacija prostora V i W potprostor prostora V. Kaˇzemo da je W A−dopustiv potprostor ako (a) W je invarijantan u odnosu na A; (b) ako je f (A)(u) ∈ W, (u ∈ V ), tada postoji vektor w ∈ W takav da je f (A)(u) = f (A)(w). Kako smo naprijed dokazali, ako je W invarijantan potprostor od V i ima invarijantan komplement, onda je W A−dopustiv. Da li vrijedi obrnuto? Nakon ˇsto dokaˇzemo Teorem o cikliˇckoj dekompoziciji bi ´ce mogu´ce dokazati da vrijedi i obrnuto. Postavlja se pitanje kako koristiti osobinu A−dopustivosti da bi dokazali da je V = Z(u1 , A) ⊕ · · · ⊕ Z(ur , A). Osnovni metod dolaska do ove dekompozicije je induktivna konstrukcija vektora u1 , . . . , ur . Pretpostavimo da smo konstruisali vektore u1 , . . . , uj i neka je Wj = Z(u1 , A) + · · · + Z(uj , A) pravi potprostor od V. Mi ˇzelimo na´ci nenulti vektor uj+1 ∈ V takav da je Wj ∩ Z(uj+1 , A) = {0}. Nakon toga uzimamo Wj+1 = Wj ⊕ Z(uj+1 , A). Ovako definisan potprostor Wj+1 ima´ce bar za 1 ve´cu dimenziju nego Wj , odnosno razlika dim V − dim Wj+1 je manja od razlike dim V − dim Wj . To znaˇci da ´cemo u konaˇcnom broju koraka
3.2. RACIONALNA KANONSKA FORMA MATRICE
71
dobiti da je za neko k ∈ N potprostor Wk cio prostor V. Plan ´ce biti dobar ako uspijemo na´ci vektor uj+1 . Dakle, za dati pravi potprostor W koji je ivarijantan u odnosu na A trebamo prona´ci vektor u takav da je W ∩ Z(u, A) = {0}. Izaberimo vektor v koji nije u W. Posmatrajmo A−konduktor S(v, W ) koji se sastoji od svih polinoma g ∈ F[x] takvih da je g(A)(v) ∈ W. Kao ˇsto znamo konduktor je ideal algebre F[x], pa je generisan nekim moniˇcnim polinomomom, recimo, polinomom f. Ovako konstruisan polinom f smo nazvali A−konduktor od v u odnosu na W. Vektor f (A)(v) je element potprostora W. Ako je W A−dopustiv, onda postoji z ∈ W takav da je f (A)(v) = f (A)(z). Neka je u = v − z i neka je g bilo koji polinom. Kako je v − u = z ∈ W, to je g(A)(v) − g(A)(u) ∈ W, pa je g(A)(v) ∈ W ako i samo ako je g(A)(u) ∈ W. To znaˇci da elementi u i v imaju isti konduktor. Tada je polinom f A−konduktor i od u. Ali f (A)(u) = 0, pa je g(A)(u) ∈ W ako i samo ako je g(A)(u) = 0, tj. W ∩ Z(u, A) = {0} i f je A−anihilator vektora u. Teorem 3.2.2. (Teorem o cikliˇckoj dekompoziciji) Neka je A linearna transformacija vektorskog prostora V konaˇcne dimenzije i neka je W0 pravi A−dopustiv potprostor od V. Tada postoje nenulti vektori u1 , . . . , ur u V sa A−anihilatorskim polinomima p1 , . . . , pr , respektivno, tako da je (a) V = W0 ⊕ Z(u1 , A) ⊕ · · · ⊕ Z(ur , A); (b) pk dijeli pk−1 , k = 2, . . . , r. Nadalje, cio broj r i anihilatori p1 , . . . , pr su jednoznaˇcno odred¯eni uslovima (a) i (b) i ˇcinjenicom da ni jedan od vektora u1 , . . . , ur nije nula vektor. Dokaz. Dokaz je jako dug, pa ´cemo ga podijeliti u ˇcetiri koraka. Prvi korak. Postoje nenulti vektori v1 , . . . , vr ∈ V takvi da je (i) V = W0 + Z(v1 , A) + . . . + Z(vr , A); (ii) ako je 1 ≤ k ≤ r i Wk = W0 + Z(v1 , A) + . . . + Z(vk , A) i A−konduktor pk ima maksimalan stepen od svih A−konduktora u odnosu na potprostor Wk−1 , tj. za svako k deg pk = max deg s(u, Wk−1 ), u∈V
gdje je s(u, Wk−1 ) oznaˇcava A−konduktor element u u odnosu na Wk−1 . Ovaj korak zavisi samo od ˇcinjenice da je W0 A−invarijantan prostor. Ako je W pravi A−invarijantan potprostor, onda 0 < max deg s(u, W ) ≤ dim V u∈V
i moˇzemo izabrati vektor v ∈ V takav da je deg s(v, W ) = max deg s(u, W ). u∈V
Potprostor W +Z(v, A) je suma dva A−invarijantna potprostora, pa je A−invarijantan potprostor i njegova dimenzija je ve´ca od dimenzije potprostora W. Primjenom ovog procesa na potprostor W = W0 dobija se vektor v1 . Ako je W1 = W0 + Z(v1 , A) pravi potprostor prostora V onda primjenjujemo ovaj postupak na potprostor W1 i tako dobijamo vektor v2 . Nastavljaju´ci ovaj postupak dobi´cemo redom potprostore
72
GLAVA 3. RACIONALNA I JORDANOVA FORMA
W0 , W1 , . . . , Wk . Kako je dim Wk > dim Wk−1 to ´ce se ovaj postupak okonˇcati u najviˇse dim V koraka. Ako se ovaj postupak okonˇcao u r koraka, onda je Wr = V. Drugi korak. Neka su v1 , v2 , . . . , vr nenulti vektori koji zadovoljavaju uslove (i) i (ii) prvog koraka. Fiksirajmo k, 1 ≤ k ≤ r. Neka je v bilo koji vektor u V i neka je f = s(v, Wk−1 ). Ako je f (A)(v) = v0 +
k−1 X
gi (A)(vi ), (vi ∈ Wi )
i=1
tada f dijeli svaki od polinoma gi i v0 = f (A)(z0 ), gdje je z0 ∈ W0 . Ako je k = 1, onda ova tvrdnja upravo znaˇci da je W0 A−dopustiv. Da bi dokazali tvrdnju za k > 1, primjeni´cemo algoritam djeljenja: gi = f hi + ri , ri = 0 ili deg ri < deg f.
(3.2.1)
Mi ´cemo pokazati da je ri = 0 za svako i. Neka je z=v−
k−1 X
(hi (A)) (vi )
(3.2.2)
i=1
Poˇsto je z − v ∈ Wk−1 , to je s(z, Wk−1 ) = s(v, Wk−1 ) = f. Nadalje f (A)(z) = v0 +
k−1 X ri (A)(vi ).
(3.2.3)
i=1
Pretpostavimo da tvrdnja nije taˇcna tj. da je za neko i ri 6= 0. Neka je j najve´ci indeks za koje je ri 6= 0, t. rj 6= 0 i ri = 0 za svako i > j. Tada j X f (A)(z) = v0 + ri (A)(vj ), rj 6= 0 i deg ri < deg f.
(3.2.4)
i=1
Neka je p = s(z, Wj−1 ). Kako je Wj−1 ⊆ Wk−1 , to konduktor f = s(z, Wk−1 ) mora dijeliti p. Dakle, postoji polinom g takav da je p = f g. Primjenimo g(A) na obje strane (3.2.4): X p(A)(z) = g(A)f (A)(z) = g(A)rj (A)(vj ) + g(A)(v0 ) + g(A)ri (A)(vi ). (3.2.5) 1≤i · · · . Kako je ovo striktno opadaju´ci niz prirodnih brojeva, to je on konaˇcan. Dakle, (r) u konaˇcnom broju koraka dobi´cemo matricu M ( r) za koju je matrica M1 oblika (3.4.5). Ovim smo dokazali sljede´cu lemu. Lema 3.4.1. Neka je M matrica iz F[x]m×n koja ima bar jedan nenulti element u prvoj koloni i neka je p najve´ci zajedniˇcki djelilac svih elemenata prve kolone matrice M. Tada je matrica M v-ekvivalentna matrici N koja ima prvu kolonu p 0 .. . . 0 Primjer 3.4.2. Ilustrujmo prethodnu proceduru na sljede´coj matrici
x2 + 2 x+1 M= 2x2 + 3
x−3 0 3x − 2
1 −x . 0
Ovdje je l(M1 ) = 1 = deg f2 i p(M1 ) = nzd (x2 + 2, x + 1, 2x2 + 3) = 1. Kako je x2 + 2 = 2x2 + 3 =
(x − 1)(x + 1) + 3 (2x − 2)(x + 1) + 5,
to je g1 = x − 1, r1 = 3 i g3 = 2x − 2, r3 = 5. Drugu vrstu mnoˇzimo sa −(x − 1) i dodajemo prvoj, a zatim drugu vrstu mnoˇzimo sa −2(x − 1) i dodajemo tre´coj. Kako nas interesuje samo prva kolon to ´cemo pisati samo prvu kolonu. 2 x +2 3 x+1 x + 1 → x + 1 → 3 = M10 . 2x2 + 3 5 5 Ovdje je l(M10 ) = 0, j = 2 i p(M10 ) = nzd(x + 1, 3, 5) = 1. Dalje imamo x+1
=
5 =
x ·3+1 3 5 · 3 + 0, 3
pa je g10 = x3 , r10 = 1 i g30 = 53 , r3 = 0. Sada mnoˇzimo drugu vrstu sa − x3 i dodajemo prvoj vrsti, a zatim mnoˇzimo drugu vrstu sa − 53 i dodajemo tre´coj vrsti. Imamo 1 3 1 M10 → 3 → 1 → 1 = M1 ”. 0 0 0
90
GLAVA 3. RACIONALNA I JORDANOVA FORMA
Odavde se lahko dobije
1 p(M1 ) . 0 M1 → 0 = 0 0
Teorem 3.4.3. Neka je P ∈ F[x]m×m . Sljede´ce tvrdnje su ekvivalentne. 1. Matrica P je invertibilna. 2. Determinanta matrice P je nenulti skalarni polinom. 3. Matrica P je v-ekvivalentna jediniˇcnoj matrici I ∈ Fm×m . 4. Matrica P je proizvod elementarnih matrica. Dokaz. 1. ⇒ 2. Neka je P invertibilna matrica. Tada je P P −1 = I, pa je det P · det P −1 = 1. Odavde slijedi da je det P invertibilan element algebre F[x]. Jedini invertibilni elementi algebre polinoma F[x] su nenulti skalari. Dakle, det P ∈ F \ {0}. 2. ⇒ 3. Neka je det P nenulti skalar polja F. Posmatrajmo prvu kolonu matrice P. Njeni elementi su polinomi p1 , p2 , · · · , pm . Neka je q = nzd(p1 , · · · , pm ). Dakle, neka su svi elementi prve kolone djeljivi sa q. Tada je i det P djeljivo sa q. Kako je det P nenulti skalar, to je i q nenulti skalar. Zbog toga je q = 1. To znaˇci da se primjenom prethodne leme matrica P prevodi u matricu 1 α2 · · · αm 0 Q= . .. B 0 koja je v-ekvivalentna sa matricom P. Elementarnim transformacijama vrsta druge i tre´ce vrste determinanta matrice se ne mjenja, ali primjenom elementarne transformacije prve vrste mijenja se samo nenulti skalarni faktor. Zbog toga ´ce det Q takod¯e biti nenulti skalar polja F. No, det Q = det B. Zato je det B nenulti skalar polja F. Zato moˇzemo primjeniti posljednju lemu na matricu B. Nastavljaju´ci ovaj postupak nakon m koraka dobijamo matricu 1 α2 · · · αm 0 1 · · · βm R= . . .. . . . . . 0
0
···
1
koja je v-ekvivalentna sa matricom A. Matrica R je v-ekvivalentna sa jediniˇcnom matricom I. Dakle, matrica A je v-ekvivalentna sa jediniˇcnom matricom I. Tvrdnje 3. ⇒ 4 i 4. ⇒ 1. su trivijalne i analogno se dokazuju kao i za matrice nad poljem.
ˇ 3.4. RACUNANJE INVARIJANTNIH FAKTORA
91
Posljedica 3.4.4. Neka su M i N matrice reda m × n sa koeficijentima iz algebre polinoma F[x]. Matrica N je v-ekvivalentna sa matricom M ako i samo ako postoji invertibilna matrica P ∈ F[x]m×m takva da je N = P M. Elementarne transformacije kolona matrice se uvodi na analogan naˇcin kao i elementarne transformacije vrsta, pa ih ne´cemo posebno definisati. Analogan Leme 3.4.1 vrijedi i za elementarne transformacije kolona matrice. Definicija 3.4.5. Matrica N je ekvivalentna matrici M ako polaze´ci od M moˇzemo do´ci do N sukcesivnim izvod¯enjem elementarnih transformacija vrsta ili elementarnim transformacijama kolona. Neka je matrica B dobijena iz matrice A elementarnim transformacijama kolona, onda je B = AQ gdje je Q matrica koja je proizvod elementarnih matrica koje odgovaraju elementarnim transformacijama kolona i to uzetih istim redom kako su izvod¯ene. Odavde i iz prethodne leme slijedi Teorem 3.4.6. Neka su M i N matrice reda m × n sa koeficijentima iz F[x]. Tada je N ekvivalentno matrici M ako i samo postoje invertibilne matrice P i Q takve da je N = P M Q. Teorem 3.4.7. Neka je A n × n matrica nad poljem F i p1 , . . . , pr invarijantni faktori matrice A. Matrica xI − A je ekvivalentna dijagonalnoj matrici reda n × n sa dijagonalnim elementima p1 , . . . , pr , 1, . . . , 1. Dokaz. Postoji invertibilna matrica P reda n × n sa matrica P AP −1 racionalna forma, tj. ova matrica je A1 0 · · · 0 A2 · · · P AP −1 = . .. .. .. . . 0
0
···
koeficijentima u F takva da je blok matrica 0 0 .. , .
Ar
gdje su Ai prate´ce matrice polinoma pi (i = 1, . . . , r). Prema Teoremu 3.4.6 matrica P (xI − A)P −1 = xI − P AP −1 je ekvivalentna matrici xI − A. Sada imamo xI1 − A1 0 ··· 0 xI2 − A2 · · · xI − P AP −1 = .. .. . . 0 0 ···
(3.4.6) 0 0 .. .
,
(3.4.7)
xIr − Ar
gdje su I1 , . . . Ir jediniˇcne matrice odgovaraju´ceg formata. Na poˇcetku ovog paragrafa vidjeli smo da je matrica xIj − Aj ekvivalentna matrici pj 0 0 · · · 0 0 0 1 0 ··· 0 0 0 0 1 ··· 0 0 .. .. .. .. .. . . . . . . 0 0 0 ··· 1 0 0 0 0 ··· 0 1
92
GLAVA 3. RACIONALNA I JORDANOVA FORMA
Iz (3.4.6) i (3.4.7) slijedi da je matrica xI − A sliˇcna dijagonalnoj matrici koja na glavnoj dijagonali ima polinome p1 , . . . , pr i n − r jedinica. Sukcesivnim izvod¯enjem elementarnih transformacija vrsta i kolona moˇzemo posti´ci da se na glavnoj dijagonali nalaze redom p1 , . . . , pr , 1, . . . , 1. Prethodni teorem ne daje efikasan naˇcin za raˇcunanje elementarnih divizora p1 , . . . , pr , jer se prezentiran dokaz zasniva na Teoremu o cikliˇckoj dekompoziciji. Mi ´cemo sada dati efikasan algoritam za reduciranje polinomnih matrica na dijagonalni oblik. Definicija 3.4.8. Neka je N matrica u F[x]m×n . Kaˇzemo da je N u Smith-ovoj normalnoj formi ako (a) svaki elemenat matrice N van glavne dijagonale je 0; (b) na glavnoj dijagonali matrice N nalaze se redom polinomi f1 , . . . , fl takvi da fk dijeli fk+1 , 1 ≤ k ≤ l − 1. U definiciji broj l je l = min{m, n}, a pod glavnom dijagonalom matrice N podrazumjevamo elemente Nkk , k = 1, . . . , l i prema definiciji je fk = Nkk (k = 1, . . . , l). Teorem 3.4.9. Neka je M ∈ F[x]m×n . Matrica M je ekvivalentna matrici N koja je u normalnoj formi. Dokaz. Ako je M = 0, onda nemamo ˇsta dokazivati. Neka je M 6= 0. Sada ´cemo dati algoritam za nalaˇzenje matrice M 0 koja je ekvivalentna matrici M i koja je oblika f1 0 · · · 0 0 M0 = . (3.4.8) , .. R 0 gdje je R neka matrica reda (n − 1) × (n − 1) i f1 dijeli svaki element matrice R. Primjenom ove procedure na matricu R dobi´cemo f2 itd. Tako ´cemo postupak okonˇcati u konaˇcnom broju koraka. Neka je l(M ) = min{deg (Mij )}. Nad¯imo prvu kolonu koja sadrˇzi ˇclan stepena l(M ) i neka ova kolona zamjeni mjesto sa prvom kolonom. Ovako dobivenu matricu oznaˇcimo sa M (0) . Sada opisujemo proceduru za nalaˇzenje matrice oblika g 0 ··· 0 0 (3.4.9) .. , . S 0 koja je ekvivalentna matrici M (0) . Na matricu M (0) uvedena u Lemi 3.4.1. Neka je rezultuju´ca matrica p a ··· b 0 c ··· d M (1) = . . .. .. .. . 0 e ···
f
primjenimo proceduru koja je
ˇ 3.4. RACUNANJE INVARIJANTNIH FAKTORA
93
Ako su elementi a, . . . , b jednaki nuli, onda je kraj. Ako nije, onda primijenjujemo proceduru Leme 3.4.1 na kolone matrice M (1) . Rezultuju´ca matrica je g 0 ··· 0 a0 c0 · · · e0 (2) M = . . .. , . . . . . b0
d0 · · ·
f0
gdje je q najve´ci zajedniˇcki djelilac elemenata p, a, . . . , b. U matrici M (2) elementi a0 , . . . , b0 prve kolone mogu, ali i ne moraju biti jednaki nuli. Ako to nije, onda primjenjujemo ponovo proceduru na vrste itd. Da li ´cemo ikad dobiti matricu oblika (3.4.9)? U najviˇse l(M ) koraka dobivamo matricu oblika (3.4.9). Naime, mi imamo korake: M (0) → M (1) → M (2) → · · · → M (t) , koja je oblika (3.4.9), jer je l(M (k+1) ) < l(M (k) ). Dakle, neka je M (t) matrica oblika (3.4.9). Polinom g u (3.4.9) moˇze ali i ne mora dijeliti sve elemente matrice S. Ako, q ne dijeli sve elemente matrice S, onda traˇzimo prvu kolonu u kojoj postoji ˇclan koji nije djeljiv sa q. Svaki element te kolone je oblika gh + r gdje je r = 0 ili je r 6= 0 i deg (r) < deg(g). Ovu kolonu dodajemo prvoj koloni. U novodobijenoj prvoj koloni imamo element oblika gh + r, r 6= 0 i deg (r) < deg (g) i element gh + r je odabran tako da r ima najniˇzi stepen med¯u svim r 6= 0. Primjenom procedure iz Leme 3.4.1 dobijamo matricu oblika (3.4.9) koja na mjestu (1, 1) ima element r. Ovu proceduru nastavljamo sve dok ne dobijemo matricu oblika (3.4.8). Sada ovu proceduru primjenjujemo na matricu R itd. Definicija 3.4.10. Neka je M ∈ F[x]m×n . Ako je 1 ≤ k ≤ min{m, n}, definiˇsimo δk (M ) kao najve´ci zajedniˇcki djelilac determinanti svih k × k submatrica matrice M. Kaˇzemo da je k × k submatrica matrice M dobijena brisanjem m − k vrste i n − k kolona matrice M. Drugim rijeˇcima selektujemo k−torke I = (i1 , . . . , ik ),
1 ≤ i1 ≤ · · · ≤ ik ≤ m
J
1 ≤ j1 ≤ · · · ≤ jk ≤ n,
= (j1 , . . . , jk ),
a zatim formiramo matricu
Mi1 j1 .. . Mik j1 Neka je
DI,J
··· ···
Mi1 j1 .. = det . Mik j1
Mi1 jk .. . . Mik jk ··· ···
Mi1 jk .. . . Mik jk
(3.4.10)
Tada je polinom δk (M ) najve´ci zajedniˇcki djelilac polinoma DI,J kada I i J prolaze svim mogu´cim k−torkama.
94
GLAVA 3. RACIONALNA I JORDANOVA FORMA
Teorem 3.4.11. Neka su matrice M, N ∈ F[x]m×n ekvivalentne. Tada je δk (M ) = δk (N ),
1 ≤ k ≤ min {m, n}.
(3.4.11)
Dokaz. Da bi tvrdnju dokazali dovoljno je dokazati da se elementarnom transformacijom vrsta e ne mijenja δk . Kako je inverz od e opet elementarna transformacija vrsta istog tipa zato je dovoljno dokazati da ako polinom f dijeli svaki od polinoma DI,J (M ) tada f dijeli i polinome DI,J (e(M )) za sve k−torke I i J. Neka su α1 , . . . , αm vrste matrice M i koristimo oznaku DJ (αi1 , . . . , αik ) = DI,J (M ). Za date I i J ispitajmo odnos izmed¯u DI,J (M ) i DI,J (e(M )). Ovaj odnos ´cemo ispitati za svaku od tri tipa elementarnih transformacija vrsta: (a) mnoˇzenje r − te vrste sa nenultim skalarom c; (b) zamjena r−te vrste sa r − tom plus g puta s−ta vrstom, s 6= r; (c) med¯usobna zamjena r−te i s−te vrste. Koncentriˇsimo se na transformacije prve i druge vrste. Ako r nije izabran med¯u vrstama i1 , . . . , ik tada DI,J (e(M )) = DI,J (M ). Ako je r med¯u indeksima i1 , . . . , ik , tada imamo dva sluˇcaja (a) DI,J (e(M )) = DJ (αi1 , . . . , cαr , . . . , αik ) = cDJ (αi1 , . . . , αr , . . . , αik ) = cDI,J (M ); (b) DI,J (e(M )) = DJ (αi1 , . . . , αr + gαs , . . . , αik ) = DI,J + gDJ (α1 , . . . , αs , . . . , αik ). Za operacije tipa (a) jasno je da bilo koji polinom f koji dijeli DI,J (M ) takod¯e dijeli i DI,J (e(M )). Za operacije tipa (c) primjetimo da DJ (αi1 , . . . , αis , . . . , αik ) = 0, ako je s = ij za neko j DJ (αi1 , . . . , αs , . . . , αik ) = ±DI 0 ,J (M ), ako je s = 6 ij za svako j. Skup I 0 u posljednjoj jednakosti je k−torka (i1 , . . . , s, . . . , ik ) aranˇzirana u rastu´cem poretku. Odavde je jasno da ako f dijeli svaki polinom DI,J (M ) onda f dijeli i DI,J (e(M )). Posljedica 3.4.12. Svaka matrica M ∈ F[x]m×n ekvivalentna je taˇcno jednoj matrici N koja je u normalnoj formi. Polinomi f1 , . . . , fl koji figuriˇsu na glavnoj dijagonali matrice N su fk =
δk (M ) , δk−1 (M )
gdje se po dogovoru uzima δ0 (M ) = 1.
1 ≤ k ≤ min{m, n}
ˇ 3.4. RACUNANJE INVARIJANTNIH FAKTORA
95
Dokaz. Ako je N u normalnoj formi sa dijagonalnim elementima f1 , . . . , fl , onda zbog ˇcinjenice da fi dijeli fi+1 slijedi da je proizvod fi1 · · · fik djeljiv proizvodom f1 · · · fk za svaku k−torku (i1 , . . . , ik ). Zbog toga je δk (M ) = f1 f2 · · · fk . Odavde slijedi matrice N su fk =
δk (M ) , δk−1 (M )
1 ≤ k ≤ min{m, n},
ˇsto je i trebalo dokazati. Matricu N iz posljednje posljedice nazivamo normalnom formom matrice M. Polinomi f1 , . . . , fl se ˇcesto nazivaju invarijantni faktori matrice M. Pretpostavimo da je A neka n × n matrica nad poljem F i neka su p1 , . . . , pr invarijantni faktori matrice A. Normalna forma matrice xI − A na glavnoj dijagonali ima elemente 1, 1, . . . , 1, pr , . . . , p1 . Broj n − r je najve´ci prirodan broj k takav da je δk (xI − A) = 1. Minimalan polinom p1 je koliˇcnik karakteristiˇcnog polinoma i najve´ceg zajedniˇckog djelitelja determinanti svih (n − 1) × (n − 1) submatrica matrice xI − A, itd. Primjer 3.4.13. Neka je V = R3 vektorski prostor nad poljem realnih brojeva. Neka je A linearna transformacija prostora V koja u odnosu na standardnu bazu ima matricue 5 −6 −6 4 2 . A = −1 3 −6 −4 Odrediti: (a) minimalan polinom i invarijantne faktore matrice A; (b) normalnu formu matrice xI − A; (c) ckliˇcku dekompoziciju prostor prostora V odred¯enu transformacijom A; ˇ (d) na´ci Zordanovu formu matrice A. Invarijantni faktori matrice A. Karakteristiˇcni polinom matrice A je f = det(xI − A) = (x − 1)(x − 2)2 . Nad¯imo determinante svih submatrica reda 2. Matrica A je reda 3 × 3 i ima µ ¶ µ ¶ 3 3 · =9 2 2 submatrica reda 2×2. Determinante ovih submatrica su: (x−2)(x−7), −2(x−2), −6(x−2), −6(x − 2), (x + 1)(x − 2), 6(x − 2), 3(x − 2), (x − 2) i (x + 2)(x − 2). Odavde se vidi da je najve´ci zajedniˇcki djelilac ovih polinoma monik polinom x − 2, tj. δ2 = x − 2. Sada traˇzimo determinante submatrica reda 1 × 1. To su: 5 − x, −6, −6, −1, 4 − x, 2, 3, −6 i −4 − x. Najve´ci zajedniˇcki djelilac ovih polinoma je monik polinom 1. Dakle, δ1 = 1. Prema dogovoru je δ0 = 1. Minimalan polinom p matrice A je p=
(x − 2)2 (x − 1) karakteristiˇcni polinom = = (x − 1)(x − 2). δ2 x−2
96
GLAVA 3. RACIONALNA I JORDANOVA FORMA
Druga dva invarijantna faktora su δ2 x−2 = =x−2 δ1 1 i
δ1 1 = = 1. δ0 1 Normalna forma matrice xI − A na glavno dijagonali ima elemente 1, x − 2, (x − 2)(x − 1). Normalna forma matrice xI − A. Odredimo sada normalnu formu matrice xI − A bez pozivanja na Teorem 3.4.11, a koriste´ci algoritam dat u Teoremu 3.4.9. Prema tom algoritmu traˇzimo prvu kolonu matrice xI − A koji ima nenulti element koji je najniˇzeg stepena. U prvoj koloni imamo nenulti element −1 koji ima stepen nula. Kako −1 dijeli sve elemente prve kolone, to moˇzemo pomo´cu ovog elementa poniˇstiti sve ostale elemente prve kolone. Pomnoˇzimo drugu vrstu sa 5 − x i dodajmo prvoj vrsti. Isto tako pomnoˇzimo drugu vrstu sa 3 i dodajmo tre´coj vrsti. Tako matrica xI − A prelazi u ekvivalentnu matricu 0 (x − 2)(x − 7) 2(2 − x) −1 . 4−x 2 0 3(2 − x) 2−x Zatim prva i druga vrsta med¯usobno zamjene mijesta. Novo dobivenu prvu vrstu pomnoˇzimo sa −1. Nakon toga dobijamo 1 x−4 −2 0 (x − 2)(x − 7) 2(2 − x) . 0 3(2 − x) 2−x Prvu kolonu mnoˇzimo sa −(x − 4) i dodajemo drugoj koloni, a zatim prvu kolonu mnoˇzimo sa 2 i dodajemo tre´coj koloni. Tako imamo matricu 1 0 0 0 (x − 2)(x − 7) 2(2 − x) . 0 3(2 − x) 2−x U matrici
µ
(x − 2)(x − 7) 3(2 − x)
2(2 − x) 2−x
¶
traˇzimo prvu kolonu koja ima element najniˇzeg stepena. U prvoj koloni postoji element prvog stepena i u drugoj koloni su oba elementa prvog stepena. Dakle, u prvoj koloni i drugoj vrsti se nalazi element 3(2 − x) najniˇzeg stepena. Odmah vidimo da ovaj element dijeli element (x − 2)(x − 7). Drugu vrstu pomnoˇzimo sa x−7 3 i dodajmo prvoj vrsti. Imamo µ ¶ µ ¶ x−7 1 (2 − x)(x − 1) 0 2(2 − x) + (2 − x) 3 0 3 → 3(2 − x) 2−x 3(2 − x) 2−x ¶ µ 1 (x − 2) x−2 3 → 1 0 3 (2 − x)(x − 1) ¶ µ x−2 0 → 1 0 3 (2 − x)(x − 1) µ ¶ x−2 0 → . 0 (x − 2)(x − 1) Dakle, normalna forma matrice xI − A je 1 0 0 0 x−2 . 0 0 0 (x − 2)(x − 1)
ˇ 3.4. RACUNANJE INVARIJANTNIH FAKTORA
97
Cikliˇ cka dekompozicija prostora V odred¯ena linearnom transformacijom A. Minimalan polinom matrice A je p = (x − 2)(x − 1). Sada traˇzimo nenulti vektor ˇciji je polinom p anihilator. Kako je p(A) = A2 − 3A + 2idV nula polinom u varijabli A, to je on anihilator bilo kog nenultog vektora. Zato za vektor u1 moˇzemo uzeti vektor (1, 0, 0). Potraˇzimo sada A(u1 ). Imamo A(u1 ) = Au1 = (5, −1, 3)t . Kako vidimo vektori u1 i A(u1 ) su linearno nezavisni. Budu´ci da je p minimalan polinom transformacije A, to je A2 (u1 ) = 3A(u1 ) − 2u1 , pa su vektori u1 , A(u1 ), A2 (u1 ) linearno zavisni. To znaˇci da je potprostor Z(u1 , A) generisan vektorima u1 i A(u1 ). Drugi invarijantni faktor matrice A je polinom x − 2. Sada traˇzimo nenulti vektor ˇciji je A − 2idV anihilator. Neka je to vektor u2 = (α, β, γ). Tada je A(u2 ) = 2u2 , tj. (2α, 2β, 2γ)t = A(α, β, γ)t . Odavde imamo sistem jednaˇcina 3α − 6β − 6γ −α + 2β + 2γ 3α − 6β − 6γ
= 0 = 0 = 0
Odavdje nalazimo α = 2β + 2γ. Dakle, za vektor u2 moˇzemo uzeti u2 = (2, 1, 0). Potprostor Z(u2 , A) je generisan vektorom u2 . Prema tome, cikliˇcka dekompozicija prostora V je V = Z(u1 , A) ⊕ Z(u2 , A), pri ˇcemu je potprostor Z(u1 , A) generisan vektorima (1, 0, 0) i (5, −1, 3), a potprostor Z(u2 , A) je generisan vektorom (2, 1, 0). Prate´ca matrica polinoma p = (x − 1)(x − 2) = x2 − 3x + 2 je µ ¶ 0 −2 B1 = . 1 3 Prate´ca matrica polinoma x − 2 je B2 = (2). U odnosu na bazu {u1 , A(u1 ), u2 } linearna transformacija ima matricu 0 −2 0 3 0 . B = B1 ⊕ B2 = 1 0 0 2 ˇ Zordanova forma Matrice A i B odgovaraju istoj linearnoj transformaciji samo u odnosu ˇ na razliˇcite baze, pa imaju istu Zordanovu formu. Matrica B je direktna suma matrica B1 ˇ ˇ i B2 . Zato je dovoljno na´ci Zordanovu formu matrica B1 i B2 . Matrica B2 je u Zordanovoj ˇ formi. Odredimo Zordanovu formu matrice B1 . Karakteristiˇcni polinom ove matrice je det(xI − B1 ) = x2 − 3x + 2 = (x − 1)(x − 2). Jednostavno se vidi da je ovo i minimalan polinom matrice B1 . Na osnovu Teorema 2.3.13 matrica B1 je sliˇcna dijagonalnoj matrici µ ¶ 1 0 . 0 2 ˇ Prema tome, Zordanova forma matrice A je 1 0 0 2 0 0
0 0 . 2
98
GLAVA 3. RACIONALNA I JORDANOVA FORMA
Primjer 3.4.14. Linearna transformacija A vektorskog prostora V u odnosu na bazu {e1 , e2 , e3 } ima matricu 3 −1 2 1 2 . A= 1 1 −1 3 ˇ Na´ci Zordanovu formu B matrice A, a zatim odrediti regularnu matricu P tako da je B = −1 P AP. Rjeˇ senje. Karakteristiˇcni polinom matrice A je f (x) = det(xI − A) = (x − 2)2 (x − 3). Svojstvene vrijednosti su λ1 = 2 viˇsestrukosti ν1 = 2 i λ2 = 3 viˇsestrukosti ν2 = 1. Odredimo sada potprostore W1 i W2 , pri ˇcemu je 2
W1 = Ker (A − 2 idV ) , W2 = Ker(A − 3 idV ). Imamo
1 A − 2I = 1 1
−1 2 2 −1 2 , (A − 2I)2 = 2 −1 1 1
−2 2 −2 2 . −1 1
Odavde je rag(A − 2idv ) = 2, rang(A − 2idv )2 = 2. Kako je rang(A − 2idV ) = 2, to je def (A − 2idv ) = 3 − 2 = 1 < ν1 = 2, pa restrikcija A1 od A na potprostor W1 nije dijagonalna. Dakle, imamo ˇzordanov blok redae ve´ceg od 1. No, ν1 = 2, pa je taj blok reda 2. No, x = (α, β, γ) ∈ W1 ⇔ (A − 2idv )2 (x) = 0, tj.
2 2 1
−2 −2 −1
α 0 2 β 0 2 · γ = 0 1 δ 0
, tj. α − β + γ = 0.
Dakle, W1 = {(α, α + γ, γ) | α, γ ∈ R}. Odredimo sada bazu {u1 , u2 } potprostora W1 u odnosu na koju restrikcija A1 od A na W1 ima ˇ Zordanovu matricu. Za vektor u1 biramo bilo koji vektor iz W1 koji nije u Ker(A − 2idV ). Neka je to vektor u1 = (α, α+γ, γ). Definiˇsimo sada vektor u2 relacijom u2 = (A−2idv )(u1 ). Tada je 1 −1 2 α γ u2 = 1 −1 2 · α + γ = γ . 1 −1 1 γ 0 Vektor v2 ne smije biti nula vektor, pa je γ 6= 0. Neka je γ = 1. Tada je u2 = (1, 1, 0). Sada moˇzemo odrediti vektor u1 . On nije nula vektor, jer je tre´ca komonenta 1, pa je dovoljno uzeti α = 0. Tako imamo u1 = (0, 1, 1). Iz definicije vektora u2 imamo u2 = (A − 2idV )(u1 ) = A(u1 ) − 2u1 , tj. A(u1 )2u1 + u2 . Dalje, je
3 A(u2 ) = 1 1
−1 2 1 1 2 · 1 = 2u2 . −1 3 0
ˇ 3.4. RACUNANJE INVARIJANTNIH FAKTORA
99
Transformacija A1 u odnosu na bazu {u1 , u2 } ima matricu · ¸ 2 0 B1 = . 1 2 Kako je
0 A − 3I = 1 1
−1 −2 −1
2 2 , 0
to se jednostavno nalazi W2 = {(2γ, 2γ, γ) | γ ∈ R}. Vektor u3 = (2, 2, 1) je generatorni element potprostora W2 . Za ovaj vektor vrijedi A(u3 ) = 3u3 . Restrikcija A2 od A u odnosu na bazu {u3 } ima matricu B2 = [3]. Linearna transformacija A u odnosu na bazu {u1 , u2 , u3 } ima matricu 2 0 0 B = B1 ⊕ B2 = 1 2 0 . 0 0 3 Matrica P prelaza sa poˇcetne baze na bazu {u1 , u2 , u3 } je 0 1 2 P = 1 1 2 . 1 0 1
Primjer 3.4.15. Linearna transformacija A vektorskog prostora V u odnosu na bazu {e1 , e2 , e3 } ima matricu −1 −1 0 A = 0 −1 −2 . 0 0 −1 ˇ Na´ci Zordanovu formu B matrice A, a zatim odrediti regularnu matricu P tako da je B = P −1 AP. Rjeˇ senje. Karakteristiˇcni polinom matrice A je f (x) = (x + 1)3 . Ovdje je W = Ker(A + idV )3 = V. Dalje, imamo 0 −1 0 0 −2 , A+I = 0 0 0 0 pa je rang(A + I) = 2. To znaˇci da imamo 3 − 2 = 1 svojstvenih vektora koji odgovaraju ˇ svojstvenoj vrijednosti λ = −1. Zbog toga moramo imati samo jedan Zordanov blok. Zato bazu traˇzimo u obliku {u1 , (A + idv )(u1 ), (A + idv )2 (u1 )}. Neka je u1 = (α, β, γ). Tada je u2 = (A + idv )(u1 ) = (β, −2γ, 0) i u3 = (A + idv )(u2 ) = (2γ, 0, 0). Ovi vektori moraju biti linearno nezavisni, pa je γ 6= 0. Neka je γ = 1, α = β = 0. Tada imamo u1 = (0, 0, 1), u2 = (0, −2, 0) i u3 = (2, 0, 0). Sada imamo u2 u3 A(u3 )
= (A + idV )(u1 ) = A(u1 ) + u1 ⇒ A(u1 ) = −u1 + u2 , = (A + idV )(u2 ) = A(u2 ) + u2 ⇒ A(u2 ) = −u2 + u3 , = −u3 .
U odnosu na bazu {u1 , u2 , u3 } linearna transformacija A ima matricu −1 0 0 0 . A = 1 −1 0 1 −1
100
GLAVA 3. RACIONALNA I JORDANOVA FORMA
Matrica prelaza je
0 2 −2 0 . 0 0
0 P = 0 1
ˇ Primjer 3.4.16. Odredimo Zordanovu kanonsku formu matrice
2 0 A= 0 0
1 2 0 1
0 0 1 0 . 3 0 −1 3
Karakteristiˇcni polinom je f (x) = (x − 2)2 (x − 3)2 . Neka je W1 = Ker(A − 2idV )2 . Dalje imamo 0 1 0 0 0 0 1 0 0 0 1 0 1 0 , (A − 2I)2 = 0 0 . A − 2I = 0 0 1 0 0 0 1 0 0 1 −1 1 0 1 −1 1 u = (α, β, γ, δ) ∈ W1 ⇔ (A − 2idV )2 (u) = 0 ⇔ (γ, γ, γ, β − γ + δ) = (0, 0, 0, 0). Dakle, γ = 0 i δ = −β. Tako za vektor u1 moˇzemo uzeti u1 = (α, β, 0, −β). Stavimo u2 = (A − 2idV )(u1 ). Tada je u2 = (β, 0, 0, 0). Kako je u2 6= 0, to je β 6= 0. Parametar α moˇzemo odabrati po volji. Neka je β = 1 i α = 0. Tada je u1 = (0, 1, 0, −1), u2 = (1, 0, 0, 0), ˇ A(u1 ) = 2u1 + u2 i A(u2 ) = 2u2 . Tako imamo Zordanov blok ¸ · 2 0 . B1 = 1 2 Neka je W2 = Ker(A − 3idV )2 . Jednostavno se nalazi rang(A − 3idV ) = 2. Tada je def ekt(A − 3idv ) = 4 − 2 = 2 = ν2 . To znaˇci da moˇzemo odrediti dva linearno nezavˇ isna svojstvena vektora i oni ˇcine bazu potprostora W2 . Zato je Zordanov blok · ¸ 3 0 B2 = . 0 3 ˇ Svojstveni vektori su u3 = (1, 1, 1, 0) i u4 = (0, 0, 0, 1). Dakle Zordanova kanonska forma matrice A je 2 0 0 0 1 2 0 0 B= 0 0 3 0 . 0 0 0 3
3.4.1
Zadaci
ˇ kanonsku formu B i odgovaraju´cu ma1. Zasvaku od matrica A na´ci Zordanovu −1 tricu P tako da je B = P AP. · ¸ · ¸ 11 −4 −5 1 1 1 2 (a) , (b) , (c) 21 −8 −11 , −1 3 3 2 3 −1 0 0 −1 −1 0 1 −1 −3 3 −2 6 −3 , (e) −4 4 −2 , (f) −3 −1 −2 , (d) −7 7 5 6 −2 1 1 1 −1 2
ˇ 3.4. RACUNANJE INVARIJANTNIH FAKTORA
2 0 (g) 0 0
1 0 2 1 0 3 1 −1
0 0 , 0 3
101
0 −3 1 2 −2 1 −1 2 . (h) −2 1 −1 2 −2 −3 1 4
ˇ 2. Za svaku od linearnih transformacija odrediti Zordanovu kanonsku formu i bazu koja odgovara toj formi. (a) Neka je V vektorski prostor polinoma stepena ≤ 2 i neka je A linearna transformacija prostora V zadana relacijom A(f (x)) = 2f (x) − f 0 (x). (b) Neka je V vektorski prostor polinoma stepena ≤ 3 i neka je A linearna transformacija prostora V zadana relacijom A(f (x)) = xf ”(x). (c) Neka je V vektorski prostor polinoma stepena ≤ 3 i neka je A linearna transformacija prostora V zadana relacijom A(f (x)) = f ”(x) + 2f (x). (d) Neka je V vektorski prostor funkcija generisan skupom {1, t, t2 , et , tet }, a A linearna transformacija prostora V zadana sa A(f (t)) = f 0 (t). (e) Neka je ·V = R2×2 ¸ i linearna transformacija toga prostora definisana sa 1 1 A(A) = · A za svaku matricu A ∈ R2×2 . 0 1 (f) Neka je ·V = R2×2 ¸ i linearna transformacija toga prostora definisana sa 3 1 A(A) = · A − At za svaku matricu A ∈ R2×2 . 0 3 (g) Neka je ·V = R2×2 ¸ i linearna transformacija toga prostora definisana sa 3 1 A(A) = · (A − At ) za svaku matricu A ∈ R2×2 . 0 3
102
GLAVA 3. RACIONALNA I JORDANOVA FORMA
Glava 4
Normirani i Unitarni prostori 4.1
Metriˇ cki prostori
Neka je F polje realnih brojeva i X neprazan skup, a d : X × X → F preslikavanje koje ured¯enom paru (x, y) ∈ X × X pridruˇzuje realan broj d(x, y). Preslikavanje d zove se metriˇcka funkcija ili metrika na X ako vrijedi 1. d(x, y) ≥ 0 i to d(x, y) = 0 ⇔ x = y; 2. d(x, y) = d(y, x); 3. d(x, y) ≤ d(x, z) + d(z, y) (relacija trougla); za svako x, y, z ∈ X. Ako je na skupu X zadana metriˇcka funkcija d, kaˇze se da je na tom skupu zadana metrika, a ured¯en par (X, d) zove se metriˇcki prostor. Najˇceˇs´ce ´cemo, radi jednostavnosti, umjesto (X, d) pisati X. Primjer 4.1.1. Neka je X polje kompleksnih brojeva, a d zadano ovako d(x, y) = |x − y| za x, y ∈ X, pri ˇcemu
Primjer 4.1.2. Neka je X = Fn , gdje je F polje realnih ili kompleksnih brojeva, funkcija d zadana na jedan od naˇcina: I) d1 (x, y) = max|ξj − ηj |; P II) d2 (x, y) = |ξj − ηj |; j
à III) d3 (x, y) =
P |ξj − ηj |
!1/2 ;
j
pri ˇcemu je x = (ξ1 , . . . , ξn ) i y = (η1 , . . . , ηn ) ∈ Fn . Tada je d metriˇcka funkcija.
Neka je (X, d) metriˇcki prostor. Za niz (xn )n∈N kaˇzemo da konvergira prema elementu x ∈ X ako za svako ² > 0 postoji prirodan broj n0 takav da je d(x, xn ) < ² ˇcim je n > n0 . U tom sluˇcaju kaˇzemo da je element x graniˇcna vrijednost niza (xn )n∈N i piˇsemo x = lim xn . n→∞
103
104
GLAVA 4. NORMIRANI I UNITARNI PROSTORI
Za podskup Y metriˇckog prostora X kaˇzemo da je ograniˇcen ako postoji pozitivan realan broj γ takav da je d(x, y) < γ za svako x, y ∈ Y. Za niz (xn )n∈N kaˇze se da je Koˇsijev niz ako za svako ² > 0 postoji prirodan broj n0 takav da je d(xm , xn ) < ² za svako m, n > n0 . Svaki konvergentan niz metriˇckog prostora X je Koˇsijev niz. Svaki Koˇsijev niz je ograniˇcen. Za metriˇcki prostor X kaˇze se da je potpun ili kompletan, ako svaki Koˇsijev niz prostora X konvergira u X. Za podskup Y metriˇckog prostora X kaˇze se da je zatvoren ako za svaki konvergentan niz (xn )n∈N prostora X vrijedi xn ∈ Y (n ∈ N) ⇒ lim xn ∈ Y. Komplement X \ Y zatvorenog skupa Y zove se otvoreni skup metriˇckog prostora X. Za zatvoren podskup Y metriˇckog prostora X kaˇze se da je kompaktan ako svaki niz (xn )n∈N iz Y sadrˇzi bar jedan konvergentan podniz (ynk )k∈N . Neka je f : X → Y preslikavanje metriˇckog prostora X u metriˇcki prostor Y. Kaˇze se da je preslikavanje f neprekidno u taˇcki x ∈ X ako za svako ² > 0 postoji δ > 0 takvo da za svako y ∈ X vrijedi d0 (f (x), f (y)) < ² ˇcim je d(x, y) < δ. Za preslikavanje f kaˇzemo da je neprekidno, ako je neprekidno u svakoj taˇcki x ∈ X. Svaka neprekidna realna funkcija f, tj. svako neprekidno preslikavanje f : X → R metriˇckog prostora X u metriˇcki prostor realnih brojeva sa metrikom d(x, y) = |x − y|, ograniˇcena je na svakom kompaktnom podskupu Y prostora X i na tom podskupu poprima svoju najmanju i svoju najve´cu vrijednost.
4.2
Normirani prostori
Pojam intenziteta obiˇcnog vektora moˇze prenijeti na proizvoljne vektorske prostore nad poljem F realnih ili kompleksnih brojeva. Neka je X vektorski prostor nad poljem F realnih ili kompleksnih brojeva. Preslikavanje k·k prostora X u polje realnih brojeva, koje svakom x ∈ X pridruˇzuje realan broj kxk , zove se norma na X ako su ispunjeni uslovi: 1. kxk ≥ 0 i to kxk = 0 ⇔ x = 0; 2. kλ xk = |λ| · kxk ; 3. kx + yk ≤ kxk + kyk
4.2. NORMIRANI PROSTORI
105
za svako x, y ∈ X i za svako λ ∈ F. Nejednakost 3. zove se relacija Minkovskog. Dokaˇzimo sada da vrijedi | kxk − kyk | ≤ kx − yk (x, y ∈ X). Imamo
(4.2.1)
3.
kxk = k(x − y) + yk ≤ kx − yk + kyk , tj. kxk − kyk ≤ kx − yk . Analogno imamo kyk − kxk ≤ ky − xk = k−1(x − y)k = | − 1| · kx − yk = kx − yk . Dakle, − kx − yk ≤ kxk − kyk ≤ kx − yk ˇsto je ekvivalentno sa (4.2.1), pa je dokaz zavrˇsen. Teorem 4.2.1. Ako je X normiran prostor, tada je relacijom d(x, y) = kx − yk (x, y ∈ X)
(4.2.2)
definisana metrika i ta metrika ima osobinu d(x + z, y + z) = d(x, y); d(λ x, λ y) = |λ| d(x, y)
(4.2.3)
za svako x, y ∈ X i svako λ ∈ F. Obrnuto, ako je na realnom (kompleksnom) vektorskom prostoru X zadana metrika d koja ima osobinu (4.2.3), tada je na X relacijom kxk = d(x, 0) (x ∈ X)
(4.2.4)
zadana norma, za koju vrijedi (4.2.2). Dokaz. Neka je X normiran prostor i funkcija d zadana relacijom (4.2.2). Pokaˇzimo da je d metrika. i) d(x, y) = kx − yk ≥ 0 i to d(x, y) = 0 ⇔ kx − yk = 0 ⇔ x − y = 0 ⇔ x = y. ii) d(x, y) = kx − yk = ky − xk = d(y, x). iii) d(x, y) = kx − yk = k(x − z) + (z − y)k ≤ kx − zk + kz − yk = d(x, z) + d(z, y) za svako x, y, z ∈ X.
106
GLAVA 4. NORMIRANI I UNITARNI PROSTORI Pokaˇzimo sada da ta metrika ima osobinu (4.2.3). Imamo d(x + z, y + z) = k(x + z) − (y + z)k = kx − yk = d(x, y), d(λ x, λ y) = kλ x − λ yk = kλ(x − y)k = |λ| kx − yk = |λ| d(x, y).
Obrnuto, neka je na prostoru X zadana metrika d za koju vrijedi (4.2.3). Dokaˇzimo da je relacijom (4.2.4). Imamo i) kxk = d(x, 0) ≥ 0 i pri tome kxk = 0 ⇔ d(x, 0) = 0 ⇔ x = 0. ii) kλ xk = d(λ x, 0) = d(λ x, λ0) = |λ| d(x, 0) = |λ| kxk . iii) kx + yk = d(x + y, 0) = d(x + y − y, 0 − y) = d(x, −y) ≤ d(x, 0) + d(0, −y) = kxk + d(0 + y, −y + y) = kxk + d(y, 0) = kxk + kyk Dakle, relacijom (4.2.4)je definisana norma na X. Prema prvom dijelu dokaza ovako definisana norma definiˇse metriku d0 na X tako da je d0 (x, y) = kx − yk . Pokaˇzimo da je d = d0 . d0 (x, y) = kx − yk = d(x − y, 0) = d(x − y + y, 0 + y) = d(x, y) za svako x, y ∈ X. Dakle, d0 = d. Neka je X realan (kompleksan) normirani prostor. Ako je prostor X kompletan u odnosu na metriku odred¯enu normom, tada se X zove Banahov prostor.
4.3
Skalarni proizvod
U kursu Uvod u linearnu algebru upoznali smo se sa pojmom skalarnog proizvoda obiˇcnih vektora. Sada ´cemo taj pojam proˇsiriti na proizvoljne vektorske prostore. Definicija 4.3.1. Neka je F polje realnih ili kompleksnih brojeva i V vektorski prostor nad tim poljem. Skalarni proizvod na V je funkcija koja svakom paru (x, y) vektora prostora V pridruˇzuje skalar hx, yi iz F takav da za sve x, y, z ∈ V i svako λ ∈ F vrijedi (a) hx + y, zi = hx, zi + hy, zi ; (b) hλ x, yi = λ hx, yi (c) hy, xi = hx, yi, gdje nadvuˇcena linija predstavlja konjugaciju u skupu kompleksnih brojeva; (d) hx, xi ≥ 0 i to hx, xi = 0 ⇒ x = 0; za svako x, y, z ∈ V i svako λ ∈ F.
4.3. SKALARNI PROIZVOD
107
Primjetimo da uslovi (a), (b) i (c) impliciraju (e) hx, λy + zi = λ(hx, yi + hx, zi . Primjer 4.3.2. U vektorskom prostoru Fn skalarni proizvod definisan relacijom hx, yi =
n X
αj βj ,
j=1
gdje je x = (α1 , . . . , αn ) i y = (β1 , . . . , βn ), naziva se standardni skalarni proizvod.
Primjer 4.3.3. (Frobeniusov skalarni proizvod matrica) Neka je V vektorski prostor matrica reda n × n nad poljem F. U skupu V je relacijom X hA, Bi = Ajk B jk j,k
je definisan skalarni proizvod. Ako uvedemo oznaku B ∗ za konjugaciju i transponovanje ∗ matrice B, tj. za Bkj = B jk onda se prethodna jednakost moˇze napisati u obliku hA, Bi = tr(B ∗ A).
Primjer 4.3.4. Neka je Fn×1 vektorski prostor kolona matrica nad poljem F i Q n × n invertibilna matrica nad poljem F. Za X, Y ∈ Fn×1 stavimo hX, Y i = Y ∗ Q∗ QX. Ovom relacijom smo definisali skalarni proizvod koji zovemo standardni skalarni proizvod na Fn×1 .
Primjer 4.3.5. Neka je V vektorski prostor svih neprekidnih kompleksnih funkcija na segmentu 0 ≤ t ≤ 1. Neka je
Z hf, gi =
1
f (t)g(t)dt. 0
Ako je rijeˇc o realnim funkcijama onda se konjugacija izostavlja.
Primjer 4.3.6. Neka su V i W vektorski prostori nad poljem F. Neka je < ·, · >) skalarni proizvod na W. Ako je A linearno nesingularno preslikavanje prostora V u W, tada je jednaˇcinom pA hx, yi = hA(x), A(y)i definisan skalarni proizvod pA na V.
Vektorski prostor V na kome je zadan skalarni proizvod zove se unitaran prostor. Konaˇcnodimenzionalan unitaran prostor nad poljem realnih brojeva zove Euklidov prostor, a nad poljem kompleksnih brojeva zove se Ermitov prostor. Neka je V unitaran kompleksni vektorski prostor. Tada za x, y ∈ V hx, yi = Re hx, yi + i Im hx, yi gdje su Re hx, yi i Im hx, yi realni i imaginarni dio kompleksnog broja hx, yi . Ako je z kompleksan broj, tada je Im z = Re (−iz). Odavde slijedi Im hx, yi = Re (−i hx, yi) = Re hx, iyi . Dakle, hx, iyi = Im hx, yi − iRe hx, yi .
108
GLAVA 4. NORMIRANI I UNITARNI PROSTORI
ˇ Teorem 4.3.7 (Koˇ si-Svarcova nejednakost). Neka je V unitaran vektorski prostor tada je |hx, yi|2 ≤ hx, xi · hy, yi (4.3.1) za svako x, y ∈ V, pri ˇcemu znak jednakosti vrijedi ako i samo su vektori x i y linearno zavisni. Dokaz. Neka su vektori x i y linearno zavisni. Tada je x = λ y ili je y = λ x. U prvom sluˇcaju imamo ¯ hy, yi hy, yi = hx, xi hy, yi . |hx, yi|2 = |hλ y, yi|2 = |λ|2 |hy, yi|2 = λ λ U drugom sluˇcaju imamo ¯ ¯2 ¯ hx, xi hx, xi λ hx, xi¯ = |λ|2 |hx, xi|2 = λλ |hx, yi|2 = |hx, λ xi|2 = ¯¯ = hx, xi hy, yi . Neka su sada vektori x i y linearno nezavisni. Tada je vektor x − λy razliˇcit od nule za svako λ ∈ F. Oznaˇcimo ovaj vektor sa z. Tada je hz, zi > 0. Tako imamo ¯ hx, yi + λλ ¯ hy, yi . 0 < hz, zi = hx − λy, x − λyi = hx, xi − λ hy, xi − λ Ako se specijalno uzme
λ = hx, yi hy, yi−1 ,
dobi´ce se hx, xi − hx, yi hy, xi hy, yi−1 − hy, xi hx, yi hy, yi−1 + hx, yi hy, xi hy, yi−1 > 0, odnosno
hx, xi hy, yi − |hx, yi|2 > 0.
Odavde slijedi (4.3.1) sa znakom < . Teorem 4.3.8. U svakom unitarnom prostoru X relacijom 1
kxk = hx, xi 2 (x ∈ X)
(4.3.2)
definisana je norma. Tako definisana norma zadovoljava relaciju paralelograma kx + yk2 + kx − yk2 = 2 kxk2 + 2 kyk2 (x, y ∈ X)
(4.3.3)
i vrijedi hx, yi =
´ i³ ´ 1³ kx + yk2 − kx − yk2 + kx + iyk2 − kx − iyk2 4 4
(4.3.4)
za svako x, y ∈ X. Pri tome u relaciji (4.3.4) drugi sumand na desnoj strani pojavljuje se samo u kompleksnom sluˇcaju. Obratno, ako je X normiran prostor ˇcija norma zadovoljava relaciju paralelograma, tada se relacijom (4.3.4) moˇze definisati skalarni proizvod na X, koji preko (4.3.2) reproducira zadanu normu.
4.3. SKALARNI PROIZVOD
109
Dokaz. 1. Neka je X unitarni prostor. Pokaˇzimo da relacija (4.3.2) definiˇse normu na X. 1 (i) kxk = hx, xi 2 ≥ 0, pri tome 1
kxk = 0 ⇒ hx, xi 2 = 0 ⇒ hx, xi = 0 ⇒ x = 0. ³ ´1 ¡ ¢1 1 ¯ hx, xi 2 = |λ|2 kxk2 2 = |λ| kxk za svako x ∈ V i (ii) kλ xk = hλ x, λ xi 2 = λλ svako λ ∈ F. (iii) kx + yk2 = hx + y, x + yi = hx, xi + hx, yi + hy, xi + hy, yi ³ ´ = kxk2 + hx, yi + hx, yi + kyk2 = kxk2 + 2Re hx, yi + kyk2 ≤ kxk2 + 2 |hx, yi| + kyk2 1
1
≤ kxk2 + 2 hx, xi 2 hy, yi 2 + kyk2 = kxk2 + 2 kxk kyk + kyk2 = (kxk + kyk)2 . Dakle, kx + yk ≤ kxk + kyk . Napomena Dokaˇzimo prvi √ znak √ ≤ . Neka je z = a + ib proizvoljan kompleksan broj. Tada je a ≤ |a| = a2 ≤ a2 + b2 = |z| , tj. Re hx, yi ≤ |hx, yi| . Drugi znak ˇ ≤ je zbog primjene Koˇsi-Svarcove nejednakosti. Dokaˇzimo sada da je norma zadana relacijom (4.3.2) zadovoljava relaciju paralelograma. kx + yk2 = hx + y, x + yi = kxk2 + hx, yi + hy, xi + kyk2
(4.3.5)
kx − yk2 = hx − y, x − yi = kxk − hx, yi − hy, xi + kyk2
(4.3.6)
Sabiranjem ovih jednakosti imamo kx + yk2 + kx − yk2 = 2 kxk2 + 2 kyk2 za svako x, y ∈ V. Dokaˇzimo sada da vrijedi (4.3.4).Iz relacija (4.3.5) i (4.3.6) dobija se ´ 1 1³ 1 kx + yk2 − kx − yk2 = hx, yi + hy, xi = Re hx, yi 4 2 2
(4.3.7)
za svako x, y ∈ V. Kako je Im hx, yi = Re hx, iyi , to u prethodnu jednakost moˇzemo umjesto y staviti iy i dobi´cemo ´ 1³ kx + iyk2 − kx − iyk2 = Re hx, iyi = Im hx, yi (4.3.8) 4 za svako x, y ∈ V. Iz jednakosti (4.3.7) i (4.3.8) slijedi (4.3.4). 2. Neka je sada V normiran vektorski prostor ˇcija norma zadovoljava relaciju paralelograma. Pokaˇzimo da relacija (4.3.4) definiˇse skalarni proizvod na V. Imamo ³ ´ 4 hx, xi = kx + xk2 − kx − xk2 + i kx + ixk2 − kx − ixk2 = 4 kxk2 + i(|1 + i|2 − |1 − i|2 ) kxk2 = 4 kxk2 . | {z } =0
110
GLAVA 4. NORMIRANI I UNITARNI PROSTORI
Dakle, hx, xi = kxk2 . Odavde slijedi prva osobina skalarnog proizvoda. Dokaˇzimo sada hx + y, zi = hx, zi + hy, zi . ³ ´ 4 hx + y, zi − kx + y + zk2 − kx + y − zk2 + i kx + y + izk2 − kx + y − izk2 . (4.3.9) Prema relaciji paralelograma kx + y + zk2 + kx − y + zk2 = 2 kx + zk2 + 2 kyk2 kx + y − zk2 + kx − y + zk2 = 2 kxk2 + 2 ky − zk2 , odakle se dobija kx + y + zk2 − kx + y − zk2 = −2 kxk2 + 2 kyk2 + 2 kx + zk2 − 2 ky − zk2 . (4.3.10) Analogno se dobija kx + y + zk2 − kx + y − zk2 = −2 kyk2 + 2 kxk2 + 2 ky + zk2 − 2 kx − zk2 . (4.3.11) Sabiranjem jednakosti (4.3.10) i (4.3.11) dobije se ³ ´ ³ ´ kx + y + zk2 − kx + y − zk2 = kx + zk2 − kx − zk2 + ky + zk2 − ky − zk2 . (4.3.12) Ako u prethodnu jednakost umjesto z stavimo iz ima´cemo kx³+ y + izk2 − kx + y − ´ izk2 = kx + izk2 − kx − izk2 + (4.3.13) ³ ´ 2 2 + ky + izk − ky − izk . Iz (4.3.9),(4.3.12) i (4.3.13) slijedi hx + y, zi = hx, zi + hy, zi . Iz ove orelacije se indukcijom jednostavno dokazuje da je hnx, yi = n hx, yi za svaki prirodan broj n. Kako je h0, yi = 0 za svako y ∈ V, to je 0 = h0, yi = h0x, yi = 0 hx, yi . Dalje, imamo 0 = h0, yi = h−x + x, yi = h−x, yi + hx, yi , tj. h−x, yi = − hx, yi . Tadsa za svaki negativan cio broj −n vrijedi h(−n)x, yi = hn(−x), yi = n h−x, yi = n (− hx, yi) = (−n) hx, yi .
4.4. ORTOGONALIZACIJA VEKTORA Neka je λ =
m n.
111
Tada je hλx, yi =
No,
¿ À ¿ À 1 1 x, y = m · x, y = m x, y . n n n
Dm
E
¿ À ¿ À 1 1 hx, yi = n · x, y = n x, y , n n
tj.
¿
1 x, y n
À =
1 hx, yi . n
Dakle, jednakost hλx, yi = λ hx, yi vrijedi za svaki racionalni broj λ. Pokaˇzimo da ova relacija vrijedi za λ = i. Prema (4.3.4) imamo ³ ´ 4 hix, yi = kix + yk2 − kix − yk2 + i kix + iyk2 − kix − iyk2 ³ ´ 2 2 2 2 = ki(x − iy)k − ki(x + iyk + i ki(x + y)k − ki(x − y)k ³ ´ = k(x − iy)k2 − k(x + iyk2 + i k(x + y)k2 − k(x − y)k2 ³ ³ ´´ = i k(x + y)k2 − k(x − y)k2 + i k(x + iyk2 − k(x − iy)k2 = 4i hx, yi Neka je λ = a + ib gdje su a i b racionalni brojevi. Tada je h(a + ib)x, yi = hax + ibx, yi hax, yi + hibx, yi = a hx, yi + ib hx, yi = (a + ib) hx, yi . Neka je λ = α + iβ, gdje su α i β realni brojevi. Tada postoje nizovi {rn } i {sn } racionalnih brojeva takvih da rn → α i sn → β kada n → ∞. Tada rn + isn → λ. Kako je norma neprekidno preslikavanje prostora V u prostor F, to je i preslikavanje x 7→ hx, yi neprekidno preslikavanje, to je D hλx, yi = =
4.4
E lim (rn + isn )x, y = lim h(rn + isn )x, yi
n→∞
n→∞
lim (rn + isn ) hx, yi = λ hx, yi .
n→∞
Ortogonalizacija vektora
Za obiˇcne vektore imamo definisan pojam ugla, pa specijalno i pojam ortogonalnosti. →
→
→
→
U Uvodu u linearnu algebru vidjeli smo da je a ⊥ b ako i samo a · b = 0. Ova ˇcinjenica nam daje povod za uvod¯enje opˇtije definicije.
112
GLAVA 4. NORMIRANI I UNITARNI PROSTORI
Definicija 4.4.1. Za vektore x i y unitarnog prostora V kaˇzemo da su med¯usbno ortogonalni ako vrijedi hx, yi = 0. Za vektor x unitarnog prostora V kaˇzemo da je normiran ili jediniˇ cni vektor ako je kxk = 1, tj. ako je hx, xi = 1. Za podskup A prostora V kaˇzemo da je ortogonalan ako ne sadrˇzi nula vektor a ako su svaka dva razliˇcita vektora skupa A med¯usobno ortogonalna. Za skup A kaˇzemo da je normiran ako je svaki vektor iz A normiran. Za skup A kaˇzemo da je ortonormiran ako je ortogonalan i normiran. Teorem 4.4.2. Svaki ortogonalan podskup unitarnog prostora V je linearno nezavisan. Dokaz. Neka je A ortogonalan skup. Da bi dokazali da je A linearno nezavisan dovoljno je dokazati da je svaki konaˇcan podskup od A linearno nezavisan. Neka je {a1 , . . . an } proizvoljan konaˇcan podskup skupa A. Pretpostavimo da je ovaj skup linearno zavisan. Tada postoje skalari α1 , . . . , αn takvi da je α1 a1 + · · · + αn an = 0 i bar jedan od skalara α1 , . . . , αn je razliˇcit od nule. Bez ograniˇcenja opˇstosti moˇzemo pretpostaviti da je αn 6= 0. Tada imamo 0 = h0, an i = hα1 a1 + · · · + αn an , an i = hα1 a1 , an i + · · · + hαn an , an i = α1 ha1 , an i + · · · + αn−1 han−1 , an i + αn han , an i | {z } | {z } =0
=0 2
= αn kan k
Ortogonalan skup ne sadrˇzi nula vektor, pa je kan k 6= 0. Zato iz αn kan k = 0 slijedi αn = 0. Kontradikcija sa pretpostavkom da je αn 6= 0. Pretpostavka da tvrdnja nije taˇcna dovela nas je do kontradikcije. Teorem 4.4.3. Za svaki linearno nezavisni prebrojivi podskup A = {ai }i∈N unitarnog prostora V moˇze se formirati ortogonalan skup B = {bi }i∈N prostora V tako da vektori Bn = {b1 , . . . , bn } generiˇse isti potprostor prostora V kao i skup An = {a1 , . . . , an } za svako n ∈ N. Dokaz. Kako je skup A linearno nezavisan, to su svi njegovi elementi razliˇciti od nule. Zato je specijalno a1 ∈ A razliˇcit od nule. Neka je b1 = a1 . Tada je skup B1 = {b1 } ortogonalan skup. Neka je b2 = a2 + λb1 . Tada je b2 ∈ V i vektori b1 i b2 generiˇsu isti potprostor kao i vektori a1 i a2 . Pokuˇsajmo odrediti skalar λ tako da je b2 ortogonalan na b1 . Iz uslova ortogonalnosti slijedi hb2 , b1 i = 0, tj. ha2 , b1 i + λ hb1 , b1 i = 0. Dakle, λ kb1 k2 = − ha2 , b1 i . Kako je b1 6= 0, to je kb1 k 6= 0, pa je λ = − kb1 k−2 ha2 , b1 i . Pretpostavimo da smo ve´c konstruisali vektore b1 , . . . , bm koji ispunjavaju traˇzene uslove. Neka je bm+1 = am+1 + λ1 b1 + · · · + λm bm . (4.4.1) Skalare λ1 , . . . , λm odred¯ujemo iz uslova hbm+1 , bj i = 0 za j = 1, . . . , m. Imamo hbm+1 , bj i = ham+1 , bj i + λ1 hb1 , bj i + · · · + λj hbj , bj i + · · · + λm hbm , bj i = ham+1 , bj i + λj hbj , bj i = ham+1 , bj i + λj kbj k2 .
4.5. BESELOVA NEJEDNAKOST Odavde je
113
λj = − kbj k−2 ham+1 , bj i (j = 1, . . . , m).
Skup Bm+1 = {b1 , . . . , bm+1 } je ortogonalan i skup Bk generiˇse isti potprostor kao i skup Ak za k = 1, . . . , m + 1. Tada na osnovu principa matematiˇcke indukcije zakljuˇcujemo da tvrdnja vrijedi za svaki prirodan broj. Neka je skup B ortogonalan. Stavimo c = kbk−1 b. Tada je skup C = {kbk−1 b | b ∈ B} ortonormiran skup. Postupak konstrukcije vektora b1 , b2 , . . . izloˇzen u ˇ prethodnoj teoremi naziva se Gram-Smitov postupak ortogonalizacije. Ako je B = {a1 , . . . , an } ured¯ena baza unitarnog prostora V, onda se ortonormiranjem ovog skupa dobija skup {e1 , . . . , en } koji je linearno nezavisan i generiˇse isti potprostor prostora V kao i skup B, tj. generiˇse ˇcitav prostor V. Dakle, {e1 , . . . , en } je baza prostora V sa osobinom hei , ej i = δij . To znaˇci da svaki unitaran prostor konaˇcne dimenzije ima ortonormiranu bazu.
4.5
Beselova nejednakost
Definicija 4.5.1. Neka je A ortonormiran podskup unitarnog prostora V. Tada se skalari hx, ai (a ∈ A) (4.5.1) zovu Furierovi koeficijenti vektora x ∈ V u odnosu na A. Teorem 4.5.2. Za svako x ∈ V i za svaki ortonormirani podskup A unitarnog prostora V skup {a ∈ A | hx, ai 6= 0} je prebrojiv, a X |hx, ai|2 ≤ kxk2 . (4.5.2) a∈A
Dokaz. Ako je x = 0, onda je skup {a ∈ A | hx, ai 6= 0} prazan, pa je tvrdnja jasna. Osim toga suma na lijevoj strani u (4.5.2) jednaka je 0, a desna strana je 0. Neka je zato x 6= 0. Dokaˇzimo da za svaki konaˇcan podskup A0 skupa A vrijedi X |hx, ai|2 ≤ kxk2 . (4.5.3) Neka je z = x −
a∈A0
P
hx, ai a ∈ V. Tada je hz, zi ≥ 0, tj.
a∈A0
*
0 ≤
x−
X
hx, ai a, x −
a∈A0
= hx, xi −
X
b∈A0
+
XX
X
+ hx, bi b
b∈A0
hx, bi hx, bi −
X
hx, ai hx, ai
a∈A0
hx, ai hx, bi ha, bi .
a∈A0 b∈A0
Kako je skup A0 ortonormiran, to je XX X hx, ai hx, bi ha, bi = hx, ai hx, ai. a∈A0 b∈A0
a∈A0
114
GLAVA 4. NORMIRANI I UNITARNI PROSTORI
Zbog toga posljednja nejednakost postaje X 0 ≤ hx, xi − hx, ai hx, ai, a∈A0
tj.
X
|hx, ai|2 ≤ kxk2 .
a∈A0
Dakle, nejednakost (4.5.2) vrijedi za svaki konaˇcan podskup skupa A. Posmatrajmo sada skup 1 An = {a ∈ A | |hx, ai| ≥ kxk2 } (n ∈ N). n Pokaˇzimo da skup An ima najviˇse n elemenata. Pretpostavimo da ovo nije taˇcno. Tada postoji podskup A0 skupa An koji ima n + 1 element. Tada je X
|hx, ai|2 ≥
a∈A0
X1 n+1 kxk2 = kxk2 > kxk2 . n n 0
a∈A
Ovo je u kontradikciji sa (4.5.3). Dakle, skup An ima najviˇse n elemenata. Pokaˇzimo sada da su skupovi B = { a ∈ A | hx, ai 6= 0 } i C = ∪ An jednaki. n∈N n 2o kxk Neka je a ∈ B. Tada je hx, ai 6= 0. Kako niz konvergira nuli, to postoji n 2
n ∈ N takav da je |hx, ai| > kxk2 n ,
kxk2 n ,
n∈
N
tj. a ∈ An , pa je a ∈ C. Obrnuto, ako je a ∈ C,
onda je |hx, ai| > dakle, hx, ai 6= 0, tj. a ∈ B. Ovim smo dokazali da je B = C. Skup C je prebrojiva unija prebrojivih skupova, pa je prebrojiv skup. No, tada je i B prebrojiv. Ako u sumi (4.5.2) izostavimo sabirke koje je je hx, ai = 0, onda je moˇzemo P napisati u obliku |hx, ai|2 ≤ kxk2 . Kako je B prebrojiv skup, to je ova suma red a∈B
sa pozitivnim ˇclanovima. Prema (4.5.3) parcijalne sume ovog reda su ograniˇcene sa kxk2 . Zbog toga je red konvergentan i njegova suma je ≤ kxk2 . Nejednakost (4.5.2) naziva se Beselova nejednakost. Kako ´cemo vidjeti Beselova nejednakost moˇze nekad pre´ci u jednakost. Teorem 4.5.3. Neka je V kompletan unitarni prostor, a A ortonormiran podskup od V. Tada su sljede´ci uslovi ekvivalentni: 1. A je maksimalan ortonormiran podskup prostora V ; 2. Za svako x ∈ V vrijedi Beselova jednakost X |hx, ai|2 = kxk2 ; a∈A
3. Za svaka dva vektora x, y ∈ V vrijedi Parsefalova jednakost X hx, yi = hx, ai hy, ai; a∈A
4.5. BESELOVA NEJEDNAKOST
115
4. Za svako x ∈ V vrijedi x=
X
hx, ai a.
a∈A
Pri tome se u uslovima 2., 3. i 4. radi o redovima koji konvergiraju i ˇcija suma ne zavisi od poretka ˇclanova. Dokaz. Dokaza´cemo redom implikacije 1. ⇐ 2. ⇓ ⇑ 4. ⇒ 3. 1. ⇒ 4. Prema prethodnom teoremu skup {a ∈ A | hx, ai 6= 0 } je prebrojiv, tj. P moˇzemo ga napisati u obliku {a1 , a2 , . . . }. Trebamo dokazati da red hx, ai · a a∈A
konvergira. Posmatrajmo parcijalne sume ovog reda. Neka je xn =
n X
hx, ak i ak (n = 1, 2, . . .).
k=1
Imamo kxn+p − xn k2 = hxn+p − xn , xn+p − xn i * n+p + n+p X X = hx, ak i ak , hx, aj i aj j=n+1
k=n+1
=
n+p X
=
=
k=n+1 n+p X
hx, ak i hx, aj i hak , aj i
j=n+1
k=n+1 n+p X
n+p X
hx, ak i hx, ak i |hx, ak i|2 .
k=n+1
Dakle, kxn+p − xn k2 =
n+p X
|hx, ak i|2 .
k=n+1
Na osnovu prethodnog teorema red
∞ P k=1
|hx, ak i|2 je konvergentan, pa njegove parci-
jalne sume formiraju konvergentan niz. Neka je yn =
n P i=1
|hx, ai i|2 n−ta parcijalna
suma posljednjeg reda. Kako je ovaj red konvergentan, to za svako ² > 0 postoji n0 ∈ N takav da je |yn+p − yn | < ² za svako n > n0 i p ∈ N.
116
GLAVA 4. NORMIRANI I UNITARNI PROSTORI
Dakle,
kxn+p − xn k2 = yn+p − yn < ² za svako n > n0 i p ∈ N.
Odavde slijedi da parcijalne sume {xn }n∈N ˇcine Koˇsijev niz. Kako je V kompletan vektorski prostor, to svaki Koˇsijev niz konvergira, pa specijalno i niz {xn }n∈N . Neka je x0 = lim xn . Pokaˇzimo da je x0 = x. Imamo n→∞
* n X
D E 0 ® x , aj = lim xn , aj = lim hxn , aj i = lim n→∞
=
lim
n→∞
n X
n→∞
n→∞
+ hx, ak i ak , aj
k=1
hx, ak i hak , aj i
k=1
= hx, aj i za svako j. Ako je a 6= aj za svako j, onda je hx, ai = 0. Tada je n n X X 0 ® hx, ak i · 0 = 0. hx, ak i hak , ai = lim x , a = lim n→∞
n→∞
k=1
k=1
Dakle, hx0 , ai = hx, ai za svako a ∈ A. Odavde slijedi hx0 − x, ai = 0 za svako a ∈ A. Tada je x0 − x = 0 ili je skup A ∪ {x0 − x} ortogonalan. Kako je skup A maksimalan ortonormiran skup, to ova posljednja mogu´cnost otpada. Dakle, x0 = x. 4. ⇒ 3. Skup A0 = {a ∈ A | hx, ai 6= 0 ∨ hy, ai 6= 0} je unija dvaju prebrojivih skupova, pa je prebrojiv. Neka je A0 = {1, 2, 3, . . .}. Prema 4. je x=
∞ X
hx, ak i ak ,
∞ X
y=
tj. x = lim
n X
n→∞
Odavde imamo
hx, aj i aj ,
lim
n→∞
* = = = =
lim
n X
n→∞
n→∞
lim
j=1 n X
n→∞
lim
∞ X j=1
hx, aj i aj ,
j=1
n X
hy, ak i ak .
k=1
n X
n→∞
hx, aj i
n X
n→∞
hx, aj i aj , lim
j=1 n X
n X
y = lim
j=1
* hx, yi =
hy, ak i ak ,
k=1
k=1
+ hy, ak i ak
k=1
+
hy, ak i ak
k=1 n X hy, ak i haj , ak i k=1
hx, aj i hy, aj i
j=1
hx, aj i hy, aj i =
X a∈A
hx, ai hy, ai.
4.5. BESELOVA NEJEDNAKOST
117
3. ⇒ 2. Oˇcigledno, jer se 2. dobija iz tri za y = x. 2. ⇒ 1. Neka vrijedi 2. Ako skup A ne bi bio maksimalan ortonormiran skup u V, postojao bi jediniˇcni vektor x ∈ V koji je ortogonala na svako a ∈ A. Vektor x nije nula vektor. Na osnovu 2. imamo X X 0 6= kxk2 = hx, ai a = 0 · a = 0. a∈A
a∈A
Kontradikcija! Dakle, A je maksimalan ortonormiran skup. Primjer 4.5.4. Neka je H vektorski prostor C([0, 1]) svih neprekidnih kompleksnih funkcija definisanih na intervalu [0, 2π] sa skalarnim proizvodom Z 2π hf, gi = f (t)g(t)dt. 0
Neka je A = {eint = cos nt + i sin nt | n ∈ Z}. Pokaˇzimo da je skup A ortonormiran podskup od H. Jasno je daje A podskup od H. Z 2π Z 2π 1 1 hfm , fn i = eimt eint dt = ei(m−n)t 2π 0 2π 0 ¯2π ¯ 1 = ei(m−n)t ¯¯ = 0. 2π(m − n) 0
hfn , fn i =
1 2π
Z
2π
ei(n−n)t dt =
0
1 2π
Z
2π
1 dt = 1. 0
Dakle, hfm , fn i = δmn . Odredimo sada Furierove koeficijente funkcije f (t) = t. Z 2π Z 2π 1 1 −1 hf, fn i = teint dt = te−int dt = , (n 6= 0), 2π 0 2π 0 in Z 2π 1 hf, f0 i = hf, 1i = t · 1dt = π. 2π 0 Neka je k proizvoljan prirodan broj i A0 = {eint | n ∈ [−k, k]} konaˇcan podskup skupa A. Tada na osnovu Beselove nejednakosti imamo 2
kf k
≤
k X
2
|hf, fn i|
n=−k
=
−1 X
2
2
|hf, fn i| + |hf, f0 i| +
=
n=−k
= 2
2
|hf, fn i|
n=1
n=−k −1 X
k X
k X
1 1 + π2 + 2 n2 n n=1
k X 1 + π2 . 2 n n=1
Odredimo normu funkcije f (t) = t. Imamo Z 2π Z 2π 4π 2 1 1 2 f (t)f (t)dt = t2 dt = . kf k = 2π 0 2π 0 3
118
GLAVA 4. NORMIRANI I UNITARNI PROSTORI
Sada imamo 2
k X 1 4π 2 + π2 ≤ , 2 n 3 n=1
tj. k X 1 π2 ≤ . 2 n 6 n=1
Kako je k proizvoljan prirodan broj to je ∞ X 1 π2 ≤ . n2 6 n=1
Teorem 4.5.5. Neka je V konaˇcnodimenzionalan unitaran prostor, a Y potprostor prostora V. Tada je skup Y ⊥ = {z ∈ V | hy, zi = 0, (y ∈ Y )}
(4.5.4)
potprostor prostora V i on je komplement potprostora Y. Dokaz. Skup Y ⊥ nije prazan, jer je 0 ∈ Y ⊥ . Neka su x, y ∈ Y ⊥ . Tada za svako u ∈ Y vrijedi hu, xi = hu, yi = 0, pa je hu, αx + βyi = α ¯ hu, xi + β¯ hu, yi = 0. Dakle, Y ⊥ je potprostor prostora V. Neka je x ∈ Y ∩ Y ⊥ . Tada je hx, xi = 0, tj. kxk = 0, pa je x = 0. Dakle, Y ∩ Y ⊥ = {0}. Neka je {e1 , . . . , ep } ortonormirana baza prostora Y. Nadopunimo ovu bazu do baze prostora V i ortonormirajmo. Neka je, dakle {e1 , . . . , ep , ep+1 , . . . , en } ortonormirana baza prostora V. Neka je x proizvoljan element prostora V. Tada je x = α1 e1 + · · · + αp ep + αp+1 ep+1 + · · · + αn en . Neka je u = α1 e1 + · · · + αp ep i z = αp+1 ep+1 + · · · + αn en . Tada je x = u + z i u ∈ Y. Trebamo pokazati da je z ∈ Y ⊥ . Dovoljno je pokazati da je hz, ej i = 0 za svako j = 1, . . . , p. Imamo * n + X hz, ej i = αi ei , ej i=p+1
= =
n X i=p+1 n X
αi hei , ej i αi δij = 0,
(1 ≤ j ≤ p).
i=p+1
Dakle, x ∈ Y + Y ⊥ , pa je V = Y ⊕ Y ⊥ . Iz V = Y ⊕ Y ⊥ slijedi da za svako x ∈ V postoji taˇcno jednan element y ∈ Y i taˇcno jedan element z ∈ Y ⊥ takav da je x = y + z. Vektor y zove se ortogonalna projekcija vektora x na potprostor Y.
4.5. BESELOVA NEJEDNAKOST
119
Potprostor Y ⊥ iz prethodne teoreme naziva se ortogonalni komplement potprostora Y. Neka je B = {e1 , . . . , en } ortonormirana baza prostora V. Tada je skup B maksimalan ortonormiran podskup od V, pa moˇzemo primjeniti Parsefalovu jednakost. Dakle, za x, y ∈ V vrijedi hx, yi =
n X
hx, ei i hy, ei i.
(4.5.5)
i=1
Ako je x =
n P
n P
ξi ei i y =
i=1
ηi ei , onda je
i=1
* hx, ek i = * hy, ek i =
n X
+ ξi ei , ek
i=1 n X
=
n X i=1
+
n X
=
ηi ei , ek
ξi hei , ek i = ηi hei , ek i =
i=1
i=1
n X i=1 n X
ξi δik = ξk , ηi δik = ηk .
i=1
Na osnovu ovog iz (4.5.5) slijedi hx, yi =
n X
ξi η¯i .
(4.5.6)
i=1
Dakle, u unitarnom konaˇcnodimenzionalnom prostoru V skalarni proizvod zadovoln n P P java (4.5.6) ako je x = ξi ei i y = ηi ei , pri ˇcemu je {e1 , . . . , en } ortonormirana i=1
i=1
baza prostora V. Moˇzemo postaviti problem na drugi naˇcin. Naime, neka je {e1 , . . . , en } baza n n P P prostora V. Za vektore x = ξi ei i y = ηi ei , definiˇsimo hx, yi relacijom (4.5.6). i=1
i=1
Jednostavno se pokazuje da je ovom relacijom definisan skalarni proizvod. U odnosu na taj proizvod baza {e1 , . . . , en } je ortonormirana. Neka je V unitaran prostor i {e1 , . . . , en } baza prostora koja nije ortonormirana. n n P P Tada za vektore x = ξi ei i y = ηi ei vrijedi i=1
i=1
hx, yi =
* n X i=1
=
n X i=1
ξi ei ,
n X
+ ηj ej
j=1
n X ξi hei , ej i η¯j j=1
= (ξ1 , . . . , ξn ) · G · (η1 , . . . , ηn )∗ . Pri tome je Gjk = hej , ek i (1 ≤ j, k ≤ n), a G tzv. Gramova matrica vektora {e1 , . . . , en }. Determinanta Gramove matrice naziva se Gramova determinanta.
120
GLAVA 4. NORMIRANI I UNITARNI PROSTORI
Definicija 4.5.6. Neka je V unitaran vektorski prostor, W potprostor od V i neka je u proizvoljan vektor u V. Za vektor z ∈ W kaˇzemo da je najbolja aproksimacija vektora u ako je ku − zk ≤ ku − xk za svako x ∈ W. Neka je V vektorski prostor obiˇcnih vektora u ravni i W vektorski prostor vektora → na pravoj p koji leˇze u posmatranoj ravni. Neka je u proizvoljan nenulti vektor od V koji nije u W. Neka je O taˇcka prave p. Tada postoji taˇcno jedna taˇcka A ravni takva −→ → → → da je u = OA. Neka je z ∈ W koji najbolje aproksimira vektor u . Tada postoji −−→ −−→ −−→ → → → → taˇcka B ∈ p takva da je z = OB. Tada je u − z = BA. Neka je x = OC proizvoljni −→ → → → vektor potprostora W. Tada je u − x = CA. Kako je z najbolja aproksimacija od → → u , to je BA ≤ CA. Ova relacija vrijedi za svaki vektor x , tj. za svaku taˇcku C prave p. Taˇcka prave p koja je najbliˇza taˇcki A je podnoˇzje normale povuˇcene iz taˇcke A → na pravu p. Dakle, CA ⊥ p. Tako zakljuˇcujemo, ako je z najbolja aproksimacija → → → vektora u , oda je vektor u − z ortogonalan na svaki vektor potprostora W. Da ovo nije sluˇcaj samo za vektore ravni vidimo iz sljede´ceg teorema. Teorem 4.5.7. Neka je W potprostor unitarnog prostora V i neka je u neki vektor prostora V. (i) Vektor z ∈ W je najbolja aproksimacija vektora u u W ako i samo ako je vektor u − z ortogonalan na svaki vektor prostora W. (ii) Ako postoji najbolja aproksimacija vektora u u W, onda je ona jedinstvena. (iii) Ako je W konaˇcnodimenzionalan i {a1 , a2 , . . . , an } ortonogonalna baza potprostora W, tada vektor n X hu, ak i z= ak kak k2 k=1 je najbolja aproksimacija vektora u u W. Dokaz. (i) Za svaki vektor v ∈ W vrijedi ku − vk2 = hu − v, u − vi = h(u − z) + (z − v), (u − z) + (z − v)i = hu − z, u − zi + hu − z, z − vi + hz − v, u − zi + hz − v, z − vi = ku − zk2 + 2Re hu − z, z − vi + kz − vk2 . Ako je u − z ortogonalan na svaki vektor skupa W, onda je (u − z) ⊥ (z − v), pa je hu − z, z − vi = 0. Zbog toga je Re hu − z, z − vi = 0. Tada imamo ku − vk2 = ku − zk2 + kz − vk2 ≥ ku − zk2 . Odavde slijedi ku − zk ≤ ku − vk . Obrnuto, neka je ku − zk ≤ ku − vk za svako v ∈ W. Tada je 2Re hu − z, z − vi + kz − vk2 ≥ 0
4.5. BESELOVA NEJEDNAKOST
121
za svako v ∈ W. Kada v prolazi skupom W, onda i element z − v prolazi ˇcitavim skupom W, tj. ako je w proizvoljan element iz W, onda za v = z − w ∈ W je w = z − v. Neka je x ∈ W proizvoljan element iz W. Tada je 2Re hu − z, xi + kxk2 ≥ 0. Ako je v 6= z, onda je x=−
(4.5.7)
hu − z, z − vi (z − v) kz − vk2
vektor potprostora W. Za ovaj vektor iz (4.5.7) slijedi °2 ¿ À ° ° hu − z, z − vi ° hu − z, z − vi °− ° ≥ 0. 2Re u − z, − (z − v) + (z − v) ° ° 2 2 kz − vk kz − vk Odavde nakon kra´ceg raˇcuna slijedi |hu − z, z − vi|2 |hu − z, z − vi|2 −2 + ≥ 0. kz − vk2 kz − vk2 Ovo je mogu´ce ako i samo ako (u − z) ⊥ (z − v). (ii) Neka najbolja aproksimacija vektora u u W postoji. Dokaˇzimo jedinstvenost. Pretpostavimo da su z i z1 najbolje aproksimacije vektora u. Tada su vektori u − z i u − z1 ortogonalni na svaki vektor prostora W. To znaˇci da su vektori u − z, u − z1 ∈ W ⊥ . Kako je W ⊥ potprostor, to je z1 − z = (u − z) − (u − z1 ) ∈ W ⊥ . S druge strane z, z1 ∈ W, pa je z1 − z ∈ W. To znaˇci z1 − z ∈ W ∩ W ⊥ = {0}. Dakle, z1 = z. (iii) Neka je Neka je W konaˇcnodimenzionalan prostor i {a1 , . . . , an } njegova ortogonalna baza. Da bi dokazali da je vektor n X hu, ak i z= ak kak k2 k=1
najbolja aproksimacija vektora u u W dovoljno je dokazati da je u − z ortogonalan na svaki vektor potprostora W. Prvo pokaˇzimo da je u − z ortogonalan na svako ai (1 ≤ i ≤ n). Imamo * n + X hu, ak i hu − z, ai i = hu, ai i − hz, ai i = hu, ai i − a k , ai kak k2 k=1 = hu, ai i −
n X hu, ak i hak , ai i kak k2 k=1
= hu, ai i −
hu, ai i hai , ai i kai k2
= 0. Neka je x =
n P
βj aj proizvoljan element iz W. Tada je
j=1
* hx, u − zi =
n X βj aj , u − z j=1
+ =
n n X X βj haj , u − zi = βj 0 = 0. j=1
j=1
122
GLAVA 4. NORMIRANI I UNITARNI PROSTORI
Dakle, u − z je ortogonalan na svaki vektor potprostora W, pa je z najbolja aproksimacija vektora u u W. Definicija 4.5.8. Neka je V unitaran prostor i W potprostor prostora V. Kada postoji najbolja aproksimizacija z ∈ W vektora u ∈ V, onda vektor z nazivamo ortogonalna projekcija vektora u na W. Preslikavanje koje svakom vektoru prostora V pridruˇzuje njegovu ortogonalnu projekciju naziva se ortogonalno projiciranje prostora V na potprostor W. Prema prethodnom teoremu ortogonalno projiciranje unitarnog prostora na potprostor konaˇcne dimenzije uvijek postoji. No ovaj teorem ima i sljede´cu posljedicu. Posljedica 4.5.9. Neka je V unitaran prostor, W konaˇcnodimenzionalan potprostor i E orogonalno projiciranje prostora V na potprostor W. Tada je preslikavanje x 7→ x − E(x) ortogonalno projiciranje od V na W ⊥ . Dokaz. Neka je x proizvoljan element iz V. Tada je x − E(x) ∈ W ⊥ i za bilo koji z ∈ W ⊥ vrijedi x − z = Ex + (x − E(x) − z). Kako je E(x) ∈ W i x − E(x) − z ∈ W ⊥ , to je kx − zk2 = kE(x)k2 + kx − E(x) − zk2 ≥ kE(x)k2 = k(x − E(x)) − zk2 , pri ˇcemu znak jednakosti vaˇzi ako je z = x − E(x). Odavde slijedi da je x − E(x) najbolja aproksimacija vektora x na W ⊥ .
4.5.1
Zadaci
1. Neka je R skup realnih brojeva. Funkcija d : R×R → R definisana je relacijom d(x, y) = |arctg(x − y)| . Dokazati da je (R, d) metriˇcki prostor. 2. U skupu C[a, b] svih realnih neprekidnih funkcija na segmentu [a, b] posmatraRb jmo relaciju d(x, y) = a |x(t) − y(t)| dt. Da li je skup C[a, b] metriˇcki prostor? 3. U skupu svih beskonaˇcnih brojnih nizova rastojanje izmed¯u x = (x1 , . . . , xn , . . .) i y = (y1 , . . . , yn , . . .) definisano je pomo´cu d(x, y) =
∞ X i=1
2−i
|xi − yi | . 1 + |xi − yi |
Dokazati da je posmatrani skup metriˇcki prostor u odnosu na uvedeno rastojanje.
4.5. BESELOVA NEJEDNAKOST
123
4. Za dvije norme k·k1 i k·k2 kaˇzemo da su ekvivalentne ako i samo ako postoje pozitivni realni brojevi α i β takvi da je α · kxk1 ≤ kxk2 ≤ β · kxk1 . Za dvije norme kaˇzemo da vode do istog pojma konvergencije ako svaki niz koji konvergira u jednoj normi konvergira i u drugoj o obratno. Dvije norme vode do istog pojma konvergencije ako i samo ako su ekvivalentne. 5. Neka je V unitaran prostor. Dokazati da u V vrijedi Pitagorin teorem: (∀ x, y ∈ V ) (hx, yi = 0 ⇒ kx + yk2 = kxk2 + kyk2 ). 6. U prostoru R4 definisan je standardni skalarni proizvod. Neka je W potprostor od R4 koji se sastoji od svih vektora koji su ortogonalni na vektore a = (1, 0, −1, 1) i b = (2, 3, −1, 2). Na´ci bazu potprostora W. ˇ 7. Primjenom Gram-Smitovog postupka ortogonalizirati vektore a1 = (1, 0, 1), a2 = (−1, 0, 1) i a3 = (4, 3, 0) date u odnosu na standardnu bazu prostora R3 u kojem je definisan standardni skalarni proizvod. 8. Neka je V unitaran prostor i x, y ∈ V. Dokazati da je x = y ako i samo ako je hx, zi = hy, zi za svako z ∈ V. 9. Neka je V vektorski prostor svih polinoma stepena manjeg ili jednakog tri nad poljem realnih brojeva. U prostoru V definiˇsimo skalarni proizvod relacijom Z 1 hf, gi = f (t)g(t)dt. 0
(a) Na´ci ortogonalni komplement potprostora W svih konstantnih polinoma. ˇ (b) Primjenom Gram-Smitovog postupka ortogonalizirati bazu {1, x, x2 , x3 }. ˇ 10. Gram-Smitovim postupkom ortogonalizirati skup S, a zatim odrediti ortonormiranu bazu BS potprostora generisanog skupom S i izraˇcunati Furierove koeficijente vektora x u odnosu na BS . (a) V = R3 , S = {(1, 0, 1), (0, 1, 1), (1, 3, 3)} i x = (1, 1, 2). (b) V je skup svih polinoma stepena ≤ 2 nad R 1 poljem R. Neka je skalarni proizvod u V zadan relacijom hf, gi = 0 f (t)g(t)dt. S = {1, x, x2 } i h(x) = 1 + x. (c) Neka½· je V = R2×2 proizvod ¸ u· kojem je skalarni ¸ · ¸¾ definisan · u Primjeru ¸ 4.3.3, 3 5 −1 9 7 −17 −1 27 S= , , iA= . −1 1 5 −1 3 −16 −4 8 (d) Neka je S = {sin t, cos t, 1,R t}, a V prostor generisan skupom S nad poljen π realnih brojeva, hf, gi = 0 f (t)g(t)dt i h(t) = 2t + 1.
124
GLAVA 4. NORMIRANI I UNITARNI PROSTORI
11. Neka je W konaˇcnodimenzionalan potprostor unitarnog prostora V, i neka je E ortogonalna projekcija od V na W S. Dokazati da je hE(x), yi = hx, E(y)i za svako x, y ∈ V. 12. Neka je S podskup unitarnog prostora V. Pokazati da (S ⊥ )⊥ sadrˇzi potprostor generisan skupom S. Ako je V konaˇcno dimenzionalan unitaran vektorski prostor, pokazati da je (S ⊥ )⊥ potprostor generisan skupom S. 13. Neka je V konaˇcno dimenzionalan unitaran prostor i B = {e1 , . . . en } njegova ortonormirana baza. Neka je A linearna transformacija prostora V, a A njena matrica u odnosu na bazu B. Dokazati da je Aij = hA(ej ), ei i .
4.6
Adjungovana linearna transformacija
U ovom paragrafu prouˇcava´cemo linearne funkcionale unitarnog vektorskog prostora i njihov odnos sa skalarnim proizvodom. Neka je V unitaran prostor i z neki fiksan vektor u V. Mi definiˇsemo funkciju fz sa V u skalarno polje F relacijom fz (x) = hx, zi . Kako je skalarni proizvod linearna funkcija po prvom argumentu, pa je fz linearni funkcional na V. Ako je V konaˇcnodimenzionalan unitaran prostor pokaza´cemo da za svaki linearni funkcional f postoji vektor z ∈ V takav da je f = fz . Teorem 4.6.1. Neka je V konaˇcnodimenzionalni vektorski prostor i f proizvoljan funkcional na V. Tada postoji taˇcno jedan vektor z ∈ V takav da je f (x) = hx, zi za svako x ∈ V. Dokaz. Neka je {e1 , . . . , en } ortonormirana baza prostora V. Stavimo z=
n X
f (ej )ej .
(4.6.1)
j=1
Neka je fz (x) = hx, zi . Tada je fz linearni funkcional. Potraˇzimo vrijednosti ovog funkcionala na vektorima baze. Imamo * + n n ³ ´ X X fz (ei ) = hei , zi = ei , f (ej )ej = f (ej ) hei , ej i j=1
=
n X
j=1
f (ej )δij = f (ei ).
j=1
Neka je x =
n P k=1
αk ek proizvoljni element prostora V. Tada je Ã
f (x) = f
n X
! αk ek
k=1
fz (x) = fz
à n X k=1
= !
αk ek
n X
αk f (ek )
k=1 n X
=
k=1
αk fz (ek ) =
n X k=1
αk f (ek ).
4.6. ADJUNGOVANA LINEARNA TRANSFORMACIJA
125
Dakle, f (x) = fz (x) za svako x ∈ V, pa je f = fz . Ovim smo egzistenciju vektora z ∈ V dokazali. Pokaˇzimo jedinstvenost. Neka osim vektora z postoji i vektor u ∈ V takav da je f = fz = fu . Tada za svako x ∈ V vrijedi hx, zi = hx, ui . Odavde je hx, z − ui = 0 za svako x ∈ V. Specijalno za x = z − u imamo 0 = hz − u, z − ui = kz − uk2 . To je jedino mogu´ce ako je z − u = 0, tj. z = u. Teorem 4.6.2. Za svaku linearnu transformaciju A konaˇcnodimenzionalnog unitarnog prostora V postoji taˇcno jedna linearna transformacija A∗ prostora V takva da je hA(x), yi = hx, A∗ (y)i (4.6.2) za svako x, y ∈ V. Dokaz. Neka je y bilo koji vektor u V. Tada je preslikavanje x 7→ hA(x), yi definisan funkcional na V. Na osnovu prethodnog teorema postoji jedinstven vektor z ∈ V takav da je hA(x), yi = hx, zi za svako x ∈ V. Dakle, elementu y ∈ V jednoznaˇcno smo pridruˇzili element z iz V. Ovo preslikavanje oznaˇcimo sa A∗ , tj. neka je z = A∗ (y). Tada je hA(x), yi = hx, zi = hx, A∗ (y)i . Da li je ovo preslikavanje linearno preslikavnje? Neka su y, u ∈ V proizvoljni. Tada je hx, A∗ (y + u)i = hA(x), y + ui = hA(x), yi + hA(x), ui = hx, A∗ (y)i + hx, A∗ (u)i = hx, A∗ (y) + A∗ (u)i za svako x ∈ V. Odavde je hx, A∗ (y + u) − A∗ (y)A∗ (u)i = 0 za svako x ∈ V. Specijalno, za x = A∗ (y + u) − A∗ (y) − A∗ (u) imamo hx, xi = 0, pa je x = 0, tj. A∗ (y + u) − A∗ (y) − A∗ (u) = 0. Dakle, A∗ (y + u) = A∗ (y) + A∗ (u). Analogno se pokazuje da je A∗ (λ x) = λA∗ (x) za svako x ∈ V i svako λ ∈ F. Ovim smo egzistenciju linearnog preslikavanja A∗ za koje vrijedi (4.6.2) dokazali. Dokaˇzimo jedinstvenost tog preslikavanja. Neka osim preslikavanja A∗ za koje vrijedi (4.6.2) postoji i preslikavanje B takvo da je hA(x), yi = hx, B(y)i za svako x, y ∈ V. Dakle, hx, A∗ (y)i = hx, B(y)i za svako x, y ∈ V. Dakle, hx, A∗ (y) − B(y)i = 0 za svako x i svako y. Specijalno za x = A∗ (y)−B(y) imamo hA∗ (y) − B(y), A∗ (y) − B(y)i = 0, tj. kA∗ (y) − B(y)k2 = 0. Dakle, A∗ (y) = B(y) za svako y ∈ V. Odavde slijedi B = A∗ . Time je i jedinstvenost dokazana.
126
GLAVA 4. NORMIRANI I UNITARNI PROSTORI
Teorem 4.6.3. Neka je V konaˇcnodimenzionalan unitaran vektorski prostor i neka je B = {e1 , . . . , en } ured¯ena ortonormirana baza prostora V. Neka linearno preslikavanje A u odnosu na bazu B ima matricu A. Tada je Akj = hA(ej ), ek i za svako j i svako k. Dokaz. Kako je B ortonormirana baza, to je x=
n X
hx, ek i ek .
k=1
Matrica A je definisana relacijom A(ej ) =
n X
Akj ek .
k=1
Vektor A(ej ) u ortnormiranoj bazi ima prikaz A(ej ) =
n X
hA(ej ), ek i ek ,
k=1
pa je Akj = hA(ej ), ek i . Posljedica 4.6.4. Neka je V konaˇcnodimenzionalan unitarni prostor i A linearno transformacija prostora V. Ako je A matrica koja odgovara linearnoj transformaciji A u odnosu na ortonormiranu bazu B, onda je A∗ matrica koja odgovara linearnoj transformaciji A∗ u odnosu na bazu B. Dokaz. Neka je B = {e1 , . . . , en } ortonormirana baza prostora V i neka je A = [A]B i B = [A∗ ]B . Na osnovu prethodnog teorema je Akj = hA(ej ), ek i i A∗kj = hA∗ (ej ), ek i . Na osnovu definicije transformacije A∗ imamo Bkj = hA∗ (ej ), ek i = hek , A∗ (ej )i = hA(ek ), ej )i = Ajk .
Teorem 4.6.5. Neka je V konaˇcnodimenzionalan unitaran vektorski prostor i B = {e1 , . . . , en } baza prostora V. Ako je A matrica linearne transformacije A u odnosu ¯ −1 A∗ G ¯ matrica linearne transformacije A∗ u odnosu na bazu na B, onda je B = G B, gdje je G Gramova matrica vektora baze B. Dokaz. Prema definiciji transformacije A∗ vrijedi hA(ei ), ej i = hei , A∗ (ej )i . Kako je A(ei ) =
n P k=1
Aki ek i A∗ (ej ) = *
n X k=1
n P t=1
Btj et , to je
+ Aki ek , ej
* =
ei ,
n X t=1
+ Btj et
4.6. ADJUNGOVANA LINEARNA TRANSFORMACIJA n X
n X
Aki hek , ej i =
127
Btj hei , et i
t=1
k=1 n X
Aki Gjk =
n X
Btj Gti .
t=1
k=1
Nakon konjugacije posljednje jednakosti imamo n X
Aki · Gjk =
n X
Btj Gti .
t=1
k=1
¯ ¯ · B = A¯t · G, ¯ tj. B = G ¯ −1 A∗ G. Odavde imamo G Primjer 4.6.6. Neka je {e1 , e2 } ortonormirana baza prostora V. Neka linearna transformacija A u odnosu na bazu B = {ie1 + 2e2 , −e1 + ie2 } ima matricu · ¸ i 2 A= . 1 −1 Odredimo matricu linearne transformacije A∗ u odnosu na bazu B. Ovaj problem ´cemo rijeˇsiti na dva naˇcina. Prvi naˇcin ´ce biti ”pjeˇsice”, tj. direktnim ¯ ¯ −1 A∗ G. raˇcunom, a drugi naˇcin je primjenom formule B = G Prvi naˇ cin Neka je f1 = ie1 + 2e2 , f2 = −e1 + ie2 . Tada je A(f1 ) = if1 + f2 , A(f2 ) = 2f1 − f2 i hf1 , f1 i = hf1 , f2 i = hf2 , f1 i = hf2 , f2 i =
hie1 + 2e2 , ie1 + 2e2 i = i · ¯i + 2 · ¯2 = 1 + 4 = 5 hie1 + 2e2 , −e1 + ie2 i = i · −1 + 2 · ¯i = −i − 2i = −3i h−e1 + ie2 , ie1 + 2e2 i = −1 · ¯i + i · ¯2 = i + 2i = 3i ¯ + i · ¯i = 1 + 1 = 2. h−e1 + ie2 , −e1 + ie2 i = −1 · (−1)
Dalje imamo hA(f1 ), f1 i hA(f2 ), f1 i hA(f1 ), f2 i hA(f2 ), f2 i
= = = =
hif1 + f2 , f1 i = i hf1 , f1 i + hf2 , f1 i = 5i + 3i = 8i h2f1 − f2 , f1 i = 2 hf1 , f1 i − hf2 , f1 i = 10 − 3i hif1 + f2 , f2 i = i hf1 , f2 i + hf2 , f2 i = i · (−3i) + 2 = 3 + 2 = 5 h2f1 − f2 , f2 i = 2 hf1 , f2 i − hf2 , f2 i = 2 · (−3i) − 2 = −2 − 6i.
hf1 , A∗ (f1 )i = hf2 , A∗ (f1 )i =
hf1 , B11 f1 + B21 f1 i = B11 hf1 , f1 i + B21 hf1 , f2 i = B11 · 5 + B21 · (−3i) hf2 , B11 f1 + B21 f2 i = B11 hf2 , f1 i + B21 hf2 , f2 i = B11 · 3i + B21 · 2
hf1 , A∗ (f2 )i = hf2 , A∗ (f2 )i =
hf1 , B12 f1 + B22 f2 i = B12 hf1 , f1 i + B22 hf1 , f2 i = B12 · 5 + B22 · (−3i) hf2 , B12 f1 + B22 f2 i = B12 hf2 , f1 i + B22 hf2 , f2 i = B12 · 3i + B22 · 2
Kako je hA(ei ), ej i = hei , A∗ (ej )i i, j = 1, 2, to je B11 · 5 B11 · 3i B12 · 5 B12 · 3i
+ + + +
B21 · (−3i) B21 · 2 B22 · (−3i) B22 · 2
= 8i = 10 − 3i = 5 = −2 − 6i
128
GLAVA 4. NORMIRANI I UNITARNI PROSTORI
Ovu su dva sistema sa po dvije nepoznate. Rjeˇsenja prvog sistema je B11 = 9 + 46i, B21 = 74 − 15i, a rjeˇsenje drugog je B12 = 28 + 6i, B22 = −10 − 45i. Dakle, matrica B linearne transformacije A∗ u odnosu na bazu B je · ¸ 9 − 46i 28 − 6i . B= 74 + 15i −10 + 45i Drugi naˇ cin Gramova matrica baze B je · ¸ 5 −3i G= . 3i 2 Odavde se lako nalazi · ¸ 5 3i ¯= G , −3i 2
· ¯ −1 = G
2 −3i 3i 5
¸
· ,
A∗ =
−i 1 2 −1
¸ .
Odavde je · ¯= ¯ −1 A∗ G B=G
2 −3i 3i 5
¸ · ¸ · ¸ · −i 1 5 3i 9 − 46i · · = 2 −1 −3i 2 74 + 15i
28 − 6i −10 + 45i
¸ .
Primjer 4.6.7. Neka je V konaˇcnodimenzionalan unitaran prostor i E ortogonalna projekcija od V na potprostor W. Tada za bilo koja dva vektora x, y ∈ V vrijedi hE(x), yi = =
hE(x), E(y) + (y − E(y)i hE(x), E(y)i + hE(x), y − E(y)i | {z }
=
hE(x), E(y)i + hx − E(x), E(y)i | {z }
= =
hE(x) + (x − E(x)), E(y)i hx, E(y)i .
=0
=0
Dakle, E ∗ = E.
Definicija 4.6.8. Neka je A linearna transformacija unitarnog prostora V. Ako postoji transformacija A∗ prostora V takva da je hA(x), yi = hx, A∗ (y)i za svako x, y ∈ V, onda se transformacija A∗ naziva adjungovana transformacija transformacije A. Teorem 4.6.9. Neka je V konaˇcnodimenzionalan unitarni prostor. Ako su A i B linearne transformacije prostora V i λ skalar polja F, (i) (A + B)∗ = A∗ + B ∗ ; ¯ ∗; (ii) (λ A)∗ = λA (iii) (AB)∗ = B ∗ A∗ ; (iv) (A∗ )∗ = A.
4.6. ADJUNGOVANA LINEARNA TRANSFORMACIJA
129
Dokaz. (i) Neka su x, y ∈ V proizvoljni. h(A + B)(x), yi = hA(x) + B(x), yi = hA(x), yi + hB(x), yi = hx, A∗ (y)i + hx, B∗ (x)i = hx, A∗ (y) + B∗ (y)i = hx, (A∗ + B∗ )(y)i . Zbog jedinstvenosti adjungovanog preslikavanja je (A + B)∗ = A∗ + B ∗ . (ii) Za svako x, y ∈ V h(λ A)(x), yi = hλ A(x), yi = λ hA(x), yi ® ¯ hx, A∗ (y)i = x, λA ¯ ∗ (y) = λ ® ¯ A∗ )(y) . = x, (λ ¯ ∗. Dakle, (λ A)∗ = λA (iii) Za svako x, y ∈ V h(AB)(x), yi = hA(B(x), yi = hB(x), A∗ (y)i = hx, B ∗ (A∗ (y))i = hx, (B∗ A∗ )(y)i . Dakle, (AB)∗ = B ∗ A∗ (iv) Za svako x, y ∈ V je hA∗ (x), yi = hy, A∗ (x)i = hA(y), xi = hx, A(y)i . Dakle, (A∗ )∗ = A. Teorem 4.6.10. Operacija adjungovanja matrica ima ove osobine 1. A∗∗ = (A∗ )∗ = A; 2. (A + B)∗ = A∗ + B ∗ ; 3. (αA)∗ = α ¯ A∗ ; 4. (AB)∗ = B ∗ A∗ .
4.6.1
Zadaci
1. Za svaki od sljede´cih unitarnih prostora V i linearnih transformacija A na´ci A∗ (x) za dati vektor x. (a) V = C2 sa standardnim skalarnim proizvodom. Neka je A linearna transformacija definisana sa A(²1 ) = (1, −2), A(²2 ) = (i, −1), x = (α, β). (b) V = R2 , A(α, β) = (2α + β, α − 3β), x = (3, 5). (c) V = C2 , A(z1 , z2 ) = (2z1 + iz2 , (1 − i)z1 ), x = (3 − i, 1 + 2i).
130
GLAVA 4. NORMIRANI I UNITARNI PROSTORI (d) V je skup svih polinoma nad R stepena ≤ 1, hf, gi = A(f ) = f 0 + 3f, f (t) = 4 − 2t.
R1
−1 f (t)g(t)dt,
2. Neka je A linearna transformacija prostora V = C2 definisana sa A(²1 ) = (1 + i, 2), A(²2 ) = (i, i). Koriste´ci standardni skalarni proizvod na´ci matricu linearne transformacije A∗ u standardnoj ured¯enoj bazi {²1 , ²2 }. Da li A∗ komutira sa A? 3. Neka je V konaˇcnodimenzionalan vektorski prostor i A linearna transformacija prostora V. Pokazati da je ImA∗ ortogonalni komplement od Ker A. 4. Neka je V linearna transformacija unitarnog prostora V i y, z neki fiksni vektori iz V. POkazati da je A(x) = hx, yi z linearna transformacija prostora V i na´ci A∗ . 5. Neka je V vektorski prostor polinoma nad R stepena stepena ne ve´ceg od dva sa skalarnim proizvodom Z hf, gi =
1
f (x)g(x)dx. 0
Ako je t bilo koji realan broj, na´ci polinom gt (x) ∈ V takav da je hf, gt i = f (t) za svaki polinom f ∈ V. 6. Neka je G Gramova matrica neke baze B prostora V i A matrica linearne transformacije A u odnosu na tu bazu. Odrediti matricu linearne transformacije A∗ u odnosu na bazu B. 3 1 −2 1 2 0 1 −1 , A = 2 0 3 . G= 1 −2 −1 2 0 1 3
4.6.2
Aproksimacija metodom najmanjih kvadrata
Posmatrajmo sljede´ci problem: Eksperimentom je u jednom periodu mjerena neka veliˇcina, tako da smo u vremenima t1 , t2 , . . . , tn doboli redom veliˇcine y1 , y2 , . . . yn Ove podatke moˇzemo pisati u obliku ured¯enih parova: (t1 , y1 ), (t2 , y2 ), . . . , (tn , yn ). Ovi ured¯eni parovi odred¯uju neki skup taˇcaka u ravni u odnosu na neki Dekartov pravougli koordinatni sistem. Eksperimentom je utvrd¯eno da postoji linearna veza izmed¯u vremena mjerenja t i dobivene vrijednosti mjerenja y. Neka je ta linearna zavisnost izraˇzena formulom y = ct + d. Naˇs zadatak je da odredimo c i d tako da prava y = ct + d odstupa ˇsto je mogu´ce manje od taˇcaka dobivenih mjerenjem. Za svaku taˇcku Mi (ti , yi ) posmatrajmo taˇcku Pi (ti , cti + d) na pravoj y = ct + d koja ima istu apcisu kao i taˇcka Mi . Sada trebamo na´ci razliku |yi − cti − d| za svako i.
4.6. ADJUNGOVANA LINEARNA TRANSFORMACIJA
131
Cilj nam je da odredimo c i d tako da suma ovih vrijednosti bude minimalna. Neka je n X E= (yi − cti − d)2 . i=1
Trebamo odrediti c i d za koji ova suma ima minimalnu vrijednost. Neka je A=
t1 t2 .. .
1 1 .. .
,
· X=
c d
¸
i Y =
tn 1
y1 y2 .. .
.
yn
Tada je E = kY − AXk2 . Sada ´cemo na´ci opˇsti metod za nalaˇzenje x0 ∈ Fn koji minimizira E, tj. za datu matricu A ∈ Fm×n mi ´cemo na´ci x0 ∈ Fn tako da je ky − Ax0 k ≤ ky − Axk za svako x ∈ Fn . Lema 4.6.11. Neka je A linearno preslikavanje prostora Fn u prostor Fm . Tada postoji taˇcno jedno preslikiavanje A∗ prostora Fm u prostor Fn tako da je hA(x), yim = hx, A∗ (y)in za svako x ∈ Fn i svako y ∈ F m . Dokaz ove leme je isti kao i dokaz Teorema 4.6.2, pa ga ostavljamo ˇcitaocu za vjeˇzbu. Lema 4.6.12. Neka je A ∈ Fm×n . Tada je rang(A∗ A) = rangA. Dokaz. Dovoljno je dokazati da matrice A∗ A i A imaju istu v-reduciranu eˇsalon matricu, tj. da za svako x ∈ Fn vrijedi (A∗ A)x = 0 ⇔ Ax = 0. Jasno je da iz Ax = 0 slijedi A∗ Ax = 0. Obrnuto, neka je A∗ Ax = 0. Tada je 0 hA∗ Ax, xin = hAx, (A∗ )∗ xim = hAx, Axim . Dakle, Ax = 0. Posljedica 4.6.13. Ako je A neka m × n matrica nad poljem F ranga n, onda je A∗ A invertibilna matrica. Dokaz. Prema prethodnoj lemi je rang(A∗ A) = rang(A) = n. Kako je A∗ A reda n×n i rang(A∗ A) = n, onda je matrica A∗ A v-ekvivalentna sa jediniˇcnom matricom I, pa je invertibilna. Neka je sada A neka m × n matrica nad poljem F i y ∈ Fm . Definiˇsimo W = {Ax | x ∈ Fn }. Tada postoji jedinstven vektor u W koji najbolje aproksimira y. Neka je to vektor Ax0 (x0 ∈ Fn ). Tada je kAx0 − yk ≤ kAx − yk za svako x ∈ Fn . Dakle, E = kAx0 − yk je minimalna vrijednost.
132
GLAVA 4. NORMIRANI I UNITARNI PROSTORI
Kako smo vidjeli u Teoremu 4.5.7 vektor Ax0 je najbolja aproksimacija vektora y u W ako i samo ako je y −Ax0 ∈ W ⊥ . Dakle, hAx, Ax0 − yim = 0 za svako x ∈ Fn . Odavde je hx, A∗ (Ax0 − y)im = 0 za svako x ∈ Fn . Dakle, (A∗ A)x0 = A∗ y. Ako je rangA = n, onda imamo x0 = (A∗ A)−1 A∗ y. Ovim smo dokazali sljede´ci teorem Teorem 4.6.14. Neka je A ∈ Fm×n i y ∈ Fm . Tada postoji x0 ∈ Fn takav da je (A∗ A)x0 = A∗ y i kAx0 − yk ≤ kAX − yk za svako x ∈ Fn . Ako je joˇs rangA = n, onda je x0 = (A∗ A)−1 A∗ y. Primjer 4.6.15. Vratimo se naˇsem (1, 2), (2, 3), (3, 5) i (4, 7). Tada je 1 2 A= 3 4
eksperimentu. Neka smo mjerenjem dobili taˇcke 1 2 3 1 i y= 5 1 1 7
Tada je
· A∗ A =
1 1
2 1
3 1
4 1
¸
∗
−1
(A A) to je
·
Dakle, c =
17 10 ,
c d
1 = 20
·
¸ = x0 =
4 −10 1 10
.
1 · ¸ 1 = 30 10 . 1 10 4 1
1 2 · 3 4
Kako je
·
−10 30 17 0
¸ ,
¸ .
d = 0.
Ovaj metod se moˇze generalizirati sa linearnih polinoma na polinome proizvoljnog stepena. Npr za polinom drugog stepena y = ct2 + dt + e se uzima 2 y1 t1 t1 1 c y2 .. .. . x = d , y = . i A = ... . . . . 2 e tm tm 1 ym
4.6.3
Minimalno rjeˇ senje sistema linearnih jednaˇ cina
Pretpostavimo da je sistem Ax = b saglasan i nema jedinstveno rjeˇsenje. Postavlja se pitanje kako odrediti rjeˇsenje sistema koje je po normi minimalno. Teorem 4.6.16. Neka je A ∈ Fm×n i b ∈ Fm . Pretpostavimo da je sistem Ax = b saglasan. Neka je A linearno preslikavanje prostora Fn u prostor Fm koje u odnosu na standardne baze ima matricu A. Tada vrijedi:
4.6. ADJUNGOVANA LINEARNA TRANSFORMACIJA
133
(a) Postoji taˇcno jedno minimalno rjeˇsenje s sistema Ax = b i s ∈ ImA∗ . (b) s je jedino rjeˇsenje jednaˇcine Ax = b koje leˇzi u ImA∗ , tj. ako u zadovoljava (AA∗ )u = b, onda je s = A∗ u. Dokaz. (a) Neka je W = ImA∗ i W 0 = KerA. Neka je x rjeˇsenje sistema Ax = b. Tada, zbog Fn = W ⊕ W ⊥ je x = s + y, gdje je s ∈ W i y ∈ W ⊥ . No, W ⊥ = W 0 (vidi zadatak 3), pa je b = Ax = As + Ay = As. Tako je s rjeˇsenje sistema Ax = b koje leˇzi u W. Ostalo nam je da dokaˇzemo da je s jedinstveno minimalno rjeˇsenje. Posmatrajmo sada homogeni sistem Ax = 0. Skup rjeˇsenja ovog sistema je W 0 = KerA. Skup rjeˇsenja sistema Ax = b je v + W 0 gdje je v bilo koje partikularno rjeˇsenja sistema Ax = b. Kako je s partikularno rjeˇsenje sistema Ax = b, to je skup svih rjeˇsenja ovog sistema s + W 0 . Neka je z bilo koje rjeˇsenje ovog sistema. Tada je z = s + u, u ∈ W 0 . Kako je s ∈ W = W 0 ⊥ , to je kzk2 = ks + uk2 = ksk2 + kuk2 ≥ ksk2 . Dakle, s je minimalno rjeˇsenje. Ako je kzk = ksk , onda u = 0, pa je z = s. Ovim je i jedinstvenost minimalnog rjeˇsenja dokazana. (b) Neka je v rjeˇsenje sistema Ax = b koje leˇzi u W. Tada je v − s ∈ W ∩ W 0 = W ∩ W ⊥ = {0}. Tada je v = s. Konaˇcno, pretpostavimo da je AA∗ )u = b i v = A∗ u. Tada je v ∈ W i Av = b. Zato s = v = A∗ u. Primjer 4.6.17. Nad¯imo minimalno rjeˇsenje sistema x + x − x + Matrica sistema je
1 A= 1 1
2y y 5y
+ z + 2z
= = =
4 −11 19.
2 11 4 −1 2 , a matrica slobodnih ˇclanova b = −11 . 5 0 19
Prvo moramo rijeˇsiti sistem AA∗ x = b. Kako je 6 1 6 AA∗ = 1 11 −4 to se jednostavno nalazi da je
11 −4 26
1 u = −2 0
rjeˇsenje sistema AA∗ x = b. Minimalno rjeˇsenje datog sistema je −1 s = A∗ u = 4 . −3
134
GLAVA 4. NORMIRANI I UNITARNI PROSTORI
4.6.4
Zadaci
1. Za svaki od skupova podataka aproksimacijom metodom najmanjih kvadrata na´ci (i) linearnu funkciju (ii) lvadratnu funkciju. (a) {(−3, 9), (−2, 6), (0, 2), (1, 1)} (b) {(1, 2), (3, 4), (5, 7), (7, 9), (9, 12)} (c) {(−2, 4), (−1, 3), (0, 1), (1, −1), (2, −3)}. 2. Na´ci minimalno rjeˇsenje svakog od sljede´cih sistema linearnih jednaˇcina. x + y − z = 0 (a) 2x − y + z = 3 x − y + z = 2 x + 2y − z = 1 (b) 2x + 3y + z = 2 . 4x + 7y − z = 4
4.7
Normalne i Ermitske linearne transformacije
Definicija 4.7.1. Linearna transformacija A naziva se autoadjungovana ili ermitska ako vrijedi A∗ = A. Linearna transformacija A naziva se antiermitska ako je A∗ = −A. Teorem 4.7.2. (a) Svojstvene vrijednosti ermitske lineane transformacije su realne. (b) Svojstveni vektori koji odgovaraju razliˇcitim svojstvenim vrijednostima ermitske linearne transformacije su ortogonalni. (c) Ako je V realan unitaran prostor konaˇcne dimenzije, tada se karakteristiˇcni polinom razlaˇze na linearne faktore. (d) Svojstvene vrijednosti antiermitske transformacije su ˇcisto imaginarne. Dokaz. (a) Neka je x svojstvena vrijednost linearne transformacije A koja odgovara svojstvenoj vrijednosti λ. Kako je A ermitska, to je ¯ hx, xi . λ hx, xi = hλx, xi = hA(x), xi = hx, A∗ (x)i = hx, A(x)i = hx, λxi = λ Odavde slijedi
¯ hx, xi = (λ − λ) ¯ kxk2 . 0 = (λ − λ)
¯ tj. λ je realan broj. Kako je x 6= 0 to je λ = λ, (b) Neka su λ1 i λ2 razliˇcite svojstvene vrijednosti ermitske transformacije A i x, y njihovi svojstveni vektori, respektivno. Tada je λ1 hx, yi = hλ1 x, yi = hA(x), yi = hx, A∗ (y)i = hx, A(y)i = hx, λ2 yi = λ2 hx, yi .
4.7. NORMALNE I ERMITSKE LINEARNE TRANSFORMACIJE
135
Kako je λ1 6= λ2 , to je hx, yi = 0, tj. vektori x i y su ortogonalni. (c) Neka je dim V = n i B ortonormirana baza prostora V. Ako je A = [A]B , onda je A ermitska matrica. Neka je W = Cn×1 vektorski prostor matrica reda n × 1 nad poljem kompleksnih brojeva. Definiˇsimo hX, Y i = Y ∗ X za svako X, Y ∈ W. Tada je W unitaran prostor. Neka je T (X) = AX za svako X ∈ W. Tada je T linearna transformacija unitarnog prostora W. Dalje imamo hT (X), Y i = hAX, Y i = Y ∗ (AX) = Y ∗ A∗ X = (AY )∗ X = hX, AY i = hX, T (Y )i . Dakle, T je ermitska linearna transformacija vektorskog prostora W. Neka je E1 = (1, 0, . . . , 0)t , E2 = (0, 1, 0, . . . , ))t , . . . , En = (0, . . . , ), 1)t . Tada je {E1 , . . . , En } baza prostora W. U odnosu na ovu bazu linearna transformacija A ima matricu A. Svojstveni polinom f (x) = det(xI − A) matrice A je polinom stepena n nad poljem kompleksnih brojeva. Kako svaki nekonstantni polinom nad poljem kompleksnih brojeva ima bar jednu nulu (Osnovni stav algebre), tako i polinom f (x) ima bar jednu nulu λ. Tada je f (x) = (x − λ)g(x). Polinom g(x) ima bar jednu nulu α, pa je g(x) = (x − α)h(x). Nastavljaju´ci ovaj postupak zakljuˇcujemo da se polinom f (x) razlaˇze na linearne faktore. Nule karakteristiˇcnog polinoma su svojstvene vrijednosti linearne transformacije T . Kako je T ermitska transformacija, to na osnovu (a) njene svojstvene vrijednosti su realne, pa su sve nule polinoma f (x) realne. Dakle, polinom f (x) se razlaˇze na linearne faktore nad poljem realnih brojeva, ˇsto je i trebalo dokazati. Za svaku od svojstvenih vrijednosti moˇzemo odrediti pripadne svojstvene vektore koji imaju realne koordinate. (d) Neka je A antiermitska, tj. neka je A∗ = −A. Tada imamo λ hx, xi = hλx, xi = hA(x), xi = hx, A∗ (x)i = hx, −A(x)i = hx, −λxi ¯ hx, xi . = −λ ¯ tj. λ je ˇcisto imaginaran. Dakle, λ = −λ, Prethodni teorem se odnosio na ermitske transformacije unitarnog prostora konaˇcne dimenzije. Posatvlja se pitanje ˇsta je sa vektorskim prostorima beskonaˇcne dimenzije. Da li njihovi ermitski operatori moraju imati realne svojstvene vrijednosti? Odgovor na ovo pitanje daje sljede´ci primjer. Primjer 4.7.3. Neka je V vektorski prostor neprekidnih kompleksnih (ili realnih) funkcija
R1 na segmentu [0, 1] sa skalarnim proizvodom hf, gi = 0 f (t)g(t)dt. Posmatrajmo transformaciju A prostora V definisanu sa A(f (t)) = tf (t). Pokaˇzimo da je A ermitska transformacija, tj. da je A∗ (f (t)) = tf (t) za svako f ∈ V. Imamo Z 1 hA(f (t)), g(t)i = tf (t)g(t)dt. 0
Z hf (t), A(f (t))i =
Z
1
f (t)tf (t)dt = 0
1
tf (t)g(t)dt. 0
Dakle,hA(f (t)), g(t)i = hf (t), A(f (t))i . S druge strane je hA(f ), gi = hf, A∗ (g)i . Zbog jedinstvenosti adjungovanog preslikavanja je A∗ = A. Dakle, A je ermitska transformacija. Pretpostavimo da je λ svojstvena vrijednost i f pripadni svojstveni vektor, tj. da je A(f ) = λf i
136
GLAVA 4. NORMIRANI I UNITARNI PROSTORI
f 6= 0. Tada je λf = tf, pa je (λ − t)f = 0. Za svako t 6= λ je f (t) = 0. Kako je f neprekidna funkcija to je i f (λ) = 0, Dakle, f = 0. Kontradikcija! Prema tome ermitska transformacija A nema svojstvenih vrijednosti niti svojstvenih vektora.
Teorem 4.7.4. Neka je V unitaran vektorski prostor i A linearna transformacija od V za koju postoji adjungovana linearna transformacija A∗ . Ako je potprostor W prostora V invarijantan u odnosu na A, onda je potprostor W ⊥ invarijantan u odnosu na A∗ . Dokaz. Trebamo pokazati da za svako y ∈ W ⊥ vrijedi A∗ (y) ∈ W ⊥ . Kako je A(x) ∈ W za svako x ∈ W, to je hA(x), yi = 0 za svako x ∈ W i svako y ∈ W ⊥ . Dakle, (∀x ∈ W ) (∀y ∈ W ⊥ ) hA(x), yi = hx, A∗ (y)i . To znaˇci da je element A∗ (y) ortogonalan na sve elemente skupa W, pa je A∗ (y) ∈ W ⊥ , tj. potprostor W ⊥ je invarijantan u odnosu na A∗ . Teorem 4.7.5 (Schur-ov teorem). Neka je A linearna transformacija unitarnog vektorskog prostora konaˇcne dimenzije. Ako se karakteristiˇcni polinom f (x) linearne transformacije A razlaˇze na linearne faktore, tada postoji ortonormirana baza B prostora V u odnosu na koju linearnoj transformaciji A odgovara gornjetrougaona matrica A = [A]B . Dokaz. Tvrdnju ´cemo dokazati indukcijom u odnosu na n = dim V. Ako je n = 1 tvrdnja je oˇcigledna. Pretpostavimo da je tvrdnja taˇcna za linearna preslikavanja unitarnih vektorskih prostora dimenzije (n−1) ˇciji se karakteristiˇcni polinom razlaˇze na linearne faktore. Kako se karakteristiˇcni polinom razlaˇze na linearne faktore, to linearna transformacija A ima svojstvene vrijednosti i pripadne svojstvene vektore. ¯ svojstvena vrijednost od A∗ i obratno Ako je λ svojstvena vrijednost od A, onda je λ ∗ ¯ svojstvena vrijednost od A. Zato ako je λ svojstvena vrijednost od A onda je λ ∗ neka je A (z) = λz i z je jediniˇcni vektor. Neka je W = [z]. Pokaˇzimo da je W ⊥ invarijantno u odnosu na A. Ako je y ∈ W ⊥ i x = γz ∈ W, onda je hA(y), xi = hA(y), γzi = hy, A∗ (γz)i ¯ hy, zi = 0. = hy, γA∗ (z)i = hy, γλzi = γ¯ λ Tako je A(y) ∈ W ⊥ . Neka je T restrikcija od A na W ⊥ . Tada karakteristiˇcni polinom od T dijeli karakteristiˇcni polinom od A. Kako se karakteristiˇcni polinom od A razlaˇze na linearne faktore, tako se i karakteristiˇcni polinom od T razlaˇze na linearne faktore. Iz V = W ⊕ W ⊥ , to je dim W ⊥ = n − 1. Tada na osnovu pretpostavke indukcije postoji ortonormirana baza B1 prostora W ⊥ u odnosu na koju linearnoj transformaciji T odgovara gornje trougaona matrica [T ]B1 . Jasno je da je B = {z} ∪ B1 ortonormirana baza i da je matrica [A]B gornje trougaona. Teorem 4.7.6. Neka je A linearna transformacija realnog unitarnog prostora V konaˇcne dimenzije. Tada je A ermitska linearna transformacija ako i samo ako postoji ortonormirana baza B sastavljena od svojstvenih vektora linearne transformacije A.
4.7. NORMALNE I ERMITSKE LINEARNE TRANSFORMACIJE
137
Dokaz. Neka je A ermitska linearna transformacija. Tada se na osnovu Teorema 4.7.2 karakteristiˇcni polinom od A razlaˇze na linearne faktore. Zato moˇzemo primjeniti Shurov teorem na A. Dakle, postoji ortonormirana baza B prostora V u odnosu na koju je matrica A = [A]B gornje trougaona. Kako je baza B ortonormirana to je [A∗ ]B = A∗ . No, A∗ = A, pa je A∗ = [A∗ ]B = [A]B = A. Dakle, i matrica A∗ je gornje trougaona. No, A∗ = At , pa je A∗ donje trougaona matrica. Tako je A∗ istovremeno i gornje i donje trougaona matrica, pa je A∗ dijagonalna matrica. No, A∗ = A, pa je A dijagonalna matrica. Tako se baza B sastoji od svojstvenih vektora. Obrnuto, ako postoji ortonormirana baza B realnog unitarnog prostora V sastavljena od svojstvenih vektora linearne transformacije A. Tada je matrica A = [A]B realna dijagonalna matrica, pa je A∗ = A. Dakle, matrica A je ermitska, pa kako je baza B ortonormirana, to je i transformacija A ermitska. Posljedica 4.7.7. Neka je A neka n × n ermitska matrica. Tada postoji matrica P takva da je P ∗ AP dijagonalna matrica. Ako je A realna simetriˇcna matrica, tada postoji matrica P takva da je P t AP dijagonalna. Dokaz. Neka je V = Cn sa standardnim skalarnim proizvodom i neka je A linearna transformacija koja odgovara matrici A u odnosu na standardnu bazu prostora V. Budu´ci da je standardna baza prostora V ortonormirana i matrica A ermitska, to je i linearna tranformacija A ermitska. Tada na osnovu prethodne teoreme postoji ortonormirana baza {e1 , . . . , en } sastavljena od svojstvenih vektora linearne transformacije A. U odnosu na ovu bazu transformaciji A odgovara dijagonalna matrica B. Neka je P matrica prelaza sa standardne baze na bazu sastavljenu od svojstvenih vektora. Tada je B = P −1 AP. Pokaˇzimo da je P ∗ = P −1 . Dovoljno je dokazati da je P ∗ P = I. Imamo ∗
(P P )ik =
n X j=1
Pij∗ Pjk
=
n X j=1
P¯ji Pjk =
n X
Pjk P¯ji .
j=1
Neka je xt = (P1t , P1t , . . . , Pnt ) t−ta kolona matrice P. Tada iz prethodne jednakosti slijedi (P ∗ P )ik = hxk , xi i = δki , jer je baza ortonormirana. Dakle, P P ∗ = I. Ako je A realna matrica i kako su svojstvene vrijednosti realne, to moˇzemo odabrati svojstvene vektore sa realnim koordinatam, pa je matrica P realna. Tada je P ∗ = P t . Definicija 4.7.8. Za linearnu transformaciju A unitarnog vektorskog prostora V kaˇzemo da je normalna ako vrijedi AA∗ = A∗ A. Lema 4.7.9. Linearna transformacija A je normalna ako i samo ako vrijedi hA(x), A(y)i = hA∗ (x), A∗ (y)i za svako x, y ∈ V.
138
GLAVA 4. NORMIRANI I UNITARNI PROSTORI
Dokaz. Neka je A normalna linearna transformacija. Tada je hA(x), A(y)i = hx, A∗ (A(y))i = hx, A(A∗ (y))i = hx, A∗∗ (A∗ (y))i = hA∗ (x), A∗ (y)i
(∀ x, y ∈ V ).
Obrnuto, neka vrijedi hA(x), A(y)i = hA∗ (x), A∗ (y)i za svako x, y ∈ V. Tada je hA(x), A(y)i = hx, A∗ (A(y))i = hx, (A∗ A)(y)i hA∗ (x), A∗ (y)i = hx, A∗∗ (A∗ (y))i = hx, A(A∗ (y))i = hx, (AA∗ )(y)i za svako x, y ∈ V. Dakle, hx, (A∗ A)(y)i = hx, (AA∗ )(y)i za svako x, y ∈ V. Da bi ova jednakost vrijedila za svako x mora biti (A∗ A)(y) = (AA∗ )(y) za svako y, tj. AA∗ = A∗ A. Teorem 4.7.10. Neka je V unitaran vektorski prostor i a ∈ V. Neka je A normalna linearna transformacija prostora V. Tada je a svojstveni vektor linearne transformacije A koji odgovara svojstvenoj vrijednosti λ ako i samo ako je a svojstveni vektor ¯ linearne transformacije A∗ koji odgovara svojstvenoj vrijednosti λ. Dokaz. Iz ˇcinjenice da je A normalna linearna transformacija slijedi kA(x)k2 = hA(x), A(x)i = hA∗ (x), A∗ (x)i = kA∗ (x)k2 za svako x ∈ V. Dakle, kA(x)k = kA∗ (x)k za svako x ∈ V. Neka je λ ∈ F i A normalna linearna transformacija, tada je i A − λ idV takod¯e normalna linearna ¯ idV . Sada se jednostavno pokazuje transformacija. Naime, (A − λ idV )∗ = A∗ − λ da je (A − λ idV )(A − λ idV )∗ = (A − λ idV )∗ (A − λ idV ). Zbog toga je k(A − λ idV )(a)k = k(A − λ idV )∗ (a)k . Dakle, (A − λ idV )(a) = 0 ⇔ (A − λ idV )∗ (a) = 0, tj.
¯ a. A(a) = λ a ⇔ A∗ (a) = λ
Definicija 4.7.11. Za kvadratnu kompleksnu matricu A kaˇzemo da je normalna ako je AA∗ = A∗ A. Teorem 4.7.12. Neka je S potprostor konaˇcne dimenzije unitarnog kompleksnog prostora V, a A normalna linearna transformacija. Tada je S invarijantno u odnosu na A ako i samo ako je S invarijantno u odnosu na A∗ . Dokaz. Neka je S invarijantno u odnosu na A. Dokaˇzimo da je S invarijantno u odnosu na A∗ . Tvrdnju dokazujemo indukcijom u odnosu na dim S = r. Ako je r = 0, onda je S = {0}, pa je tvrdnja jasna. Ako je r = 1, onda postoji a ∈ S, a 6= 0. Tada je b ∈ S ako i samo ako je b = αa za neko α ∈ C. Kako je S
4.7. NORMALNE I ERMITSKE LINEARNE TRANSFORMACIJE
139
invarijantno u odnosu na A, to je A(a) = αa. Dakle, a je svojstveni vektor linearne transformacije A, pa je a svojstveni vektor i linearne transformacije A∗ . Odavde slijedi S invarijantno u odnosu na A∗ . Neka je sada r > 1 i neka je tvrdnja taˇcna za sve potprostore dimenzije manje od r. Kako je S invarijantno u odnosu na A, to je restrikcija AS linearno preslikavanje prostora S. Neka je f (x) svojstveni polinom linearne transformacije AS . Ovaj polinom je stepena r > 1, pa u polju kompleksnih brojeva ima bar jednu kompleksnu nulu. Ta kompleksna nula je svojstvena vrijednost linearne transformacije AS i neka je x ∈ S svojstveni vektor koji odgovara toj svojstvenoj vrijednosti. Tada je x i svojstveni vektor linearne transformacije A. Potprostor [x] je invarijantan u odnosu na A. Tada je potprostor [x]⊥ invarijantan u odnosu na A∗ . No, tada je i potprostor [x]⊥ invarijantan u odnosu na A∗∗ = A. Sada imamo S = S ∩ V = S ∩ ([x] ⊕ [x]⊥ ) = [x] ⊕ (s ∩ [x]⊥ ). Odavde slijedi da je dim(S ∩ [x]⊥ ) = r − 1. Tada na osnovu pretpostavke indukcije slijedi da je potprostor S ∩[x]⊥ invarijantan u odnosu A∗ . Tada iz S = [x]⊕(S ∩[x]⊥ ) i [x] invarijantno u odnosu na A∗ slijedi da je S invarijantno u odnosu na A∗ . Dakle, tvrdnja vrijedi za r > 1. Obrnuto, neka je S invarijantno u odnosu na A∗ . Tada na osnovu naprijed dokazanog slijedi da je S inavraijantno u odnosu na A∗∗ = A. Teorem 4.7.13. Neka je V unitaran vektorski prostor konaˇcne dimenzije i A linearna transformacija od V i B ortonormirana baza prostora V. Neka je A matrica linearne transformacije A u odnosu na B gornje trougaona. Tada je A normalna linearna transformacija ako i samo ako je matrica A dijagonalna. Dokaz. Kako je B ortonormirana baza, to je matrica od A∗ u odnosu na B upravo matrica A∗ . Ako je A dijagonalna, onda je AA∗ = AA∗ , pa je AA∗ = A∗ A, tj. A je normalna linearna transformacija. Obrnuto, neka je A normalna linearna transformacija i B = {e1 , . . . , en }. Kako je A gornje trougaona matrica, to je A(e1 ) = A11 e1 . To znaˇci da je e1 svojstveni vektor linearne transformacije A. Tada je A∗ (e1 ) = A¯11 e1 . S druge strane je X X A∗ (e1 ) = (A∗ )j1 ej = A¯1j ej . j
j
Dakle, A1j = 0 za j = 2, 3, . . . . Specijalno je A12 = 0. Tada je A(e2 ) = A22 ej . Ponavljamo isti postupak za e2 i zakljuˇcujemo da je A2j = 0 za svako j = 3, 4, . . . . Nastavljaju´ci ovaj postupak zakljuˇcujemo da je A dijagonalna matrica. Schurov teorem implicira sljede´ci teorem za matrice. Teorem 4.7.14. Za svaku kompleksnu matricu A reda n×n postoji unitarna matrica U takva da je matrica U −1 AU gornje trougaona matrica. Iz pretposljednja dva teorema slijedi teorem. Teorem 4.7.15. Neka je V kompleksan unitaran prostor konaˇcne dimenzije i A normalna linearna transformacija prostora V. Tada V ima ortonormiranu bazu sastavljenu od svojstvenih vektora transformacije A.
140
GLAVA 4. NORMIRANI I UNITARNI PROSTORI
Teorem 4.7.16 (Spektralni teorem). Neka je A normalna linearna transformacija konaˇcnodimenzionalnog kompleksnog (ili ermitska linearna transformacija realnog) unitarnog vektorskog prostora V. Neka su λ1 , . . . , λk razliˇcite svojstvene vrijednosti od A. Neka je Wj svojstveni potprostor odred¯en svojstvenom vrijednoˇs´cu λj i Ej ortogonalna projekcija od V na Wj . Tada je Wj ortogonalan na W − i kada je i 6= j, V je direktna suma od W1 , . . . , Wk i A = λ1 E1 + · · · + λk Ek .
(4.7.1)
Dokaz. Neka je u ∈ Wj , v ∈ Wi i neka je i 6= j. Tada je ® ¯ i v = λi hu, vi . λj hu, vi = hλj u, vi = hA(u), vi = hu, A∗ (v)i = u, λ Dakle, (λj −λi ) hu, vi = 0. Kako je λj −λi 6= 0, to je hu, vi = 0. Time smo dokazali da je Wj ortogonalan na Wi kad god je j 6= i. Ako je A ermitska linearna transformacija realnog unitarnog prostora V, onda na osnovu teorema 4.7.6 postoji ortonormirana baza prostora V sastavljena od svojstvenih vektora transformacije A. Ako je pak rijeˇc o kompleksnom vektorskom prostoru, onda na osnovu teorema 4.7.15 postoji ortonormirana bazaB sastavljena od svojstvenih vektora. Tada je V = W1 +· · ·+Wk . Pokaˇzimo da je ova suma direktna. Neka je v1 + · · · vk = 0 i vi ∈ Wi . Tada je * + X X 0 = vi , vj = hvi , vj i = hvi , vi i = kvi k2 j
j
za svako i. Dakle, vi = 0 za svako i. Ovim smo pokazali da element 0 ima jedinstven prikaz. Tada je suma V = W1 + · · · + Wk direktna. Ova direktna suma inducira razlaganje A = AE1 + · · · AEk = λ1 E1 + · · · + λk Ek . Time je dokaz zavrˇsen. Razlaganje (4.7.1) naziva se spektralna rezolucija od A.
4.8
Unitarne i ortogonalne transformacije
Definicija 4.8.1. Neka su V i W unitarni prostori nad istim poljem i neka je A linearno preslikavanje prostora V u W. Kaˇzemo da preslikavanje A ˇ cuva skalarni proizvod ako hA(x), A(y)i = hx, yi za svako x, y ∈ V. Pod izomorfizmom unitarnih prostora podrazumjevamo svaki izomorfizam unitarnih prostora koji ˇcuva skalarni proizvod. Ako A ˇcuva skalarni proizvod, onda je kA(x)k = kxk za svako x ∈ V. Odavde odmah slijedi da je A injektivno preslikavanje. Naime, ako je x ∈ Ker(A), onda je A(x) = 0, pa je kxk = kA(x)k = 0. Teorem 4.8.2. Neka su V i W unitarni vektorski prostori konaˇcnih i jednakih dimenzija nad istim poljem. Ako je A linearna transformacija sa V na W, tada su sljede´ci uslovi ekvivalentni. 1. A ˇcuva skalarni proizvod.
4.8. UNITARNE I ORTOGONALNE TRANSFORMACIJE
141
2. A je izomorfizam unitarnih prostora. 3. A preslikava svaku ortonormiranu bazu prostora V u ortonormiranu bazu prostora W. 4. A preslikava neku ortonormiranu bazu prostora V u ortonormiranu bazu prostora W. Dokaz. (1) ⇒ (2) Kako A ˇcuva skalarni proizvod, to je A injektivno, pa je def (A) = 0. Zbog toga je dimW = dimV = def (A) + rang(A) = 0 + rang(A) = rang(A). Dakle, A je sirjektivno preslikavanje, pa je A izomorfizam unitarnih prostora. (2) ⇒ (3) Neka je A izomorfizam vektorskih prostora i neka je {e1 , . . . , en } ortonormirana baza prostora V. Kako A ˇcuva skalarni proizvod, to je hA(ei ), A(ej )i = hei , ej i = δij . Dakle, skup {A(e1 ), . . . , A(en )} je ortonormiran, pa je linearno nezavisan. Kako on ima dimV = dimW elemenata, to je on i baza prostora W. (3) ⇒ (4) Oˇcigledno. (4) ⇒ (1) Neka je {e1 , . . . , en } ortonormirana baza takva da je {A(e1 ), . . . , A(en )} ortonormirana baza prostora W. Tada je hA(ei ), A(ej )i = hei , ej i = δij . Neka su x = α1 e1 + · · · + αn en , i y = β1 e1 + · · · + βn en proizvoljni vektori prostora V. Tada je * n + n X X βk A(ek ) hA(x), A(y)i = αj A(ej ), j=1
=
n X
αj
j=1
=
n X
à n X
αj
=
!
β¯k hA(ej ), A(ek )i
k=1
à n X
j=1 n X
k=1
! β¯k δjk
k=1
αj β¯j
j=1
= hx, yi . Dakle, hA(x), A(y)i = hx, yi , tj. A ˇcuva skalarni proizvod. Posljedica 4.8.3. Neka su V i W unitarni vektorski prostori konaˇcnih dimenzija nad nekim poljem. Tada su V i W izomorfni ako i samo ako imaju iste dimenzije.
142
GLAVA 4. NORMIRANI I UNITARNI PROSTORI
Dokaz. Neka je dimV = dimW = n i neka su {e1 , . . . , en } i {f1 , . . . , fn } ortonormirane baze prostora V i W respektivno. Posmatrajmo preslikavanje A : V → W definisano sa A(ei ) = fi za svako i. Tada je A linearno preslikavanje koje ortonormiranu bazu preslikava u ortonormiranu bazu. Zato na osnovu prethodne teoreme A ˇcuva skalarni proizvod i predstavlja izomorfizam unitarnih prostora. Obrnuto, neka su unitarni prostori V i W izomorfni. Tada su njihove dimenzije jednake. Primjer 4.8.4. Neka je V n−dimenzionalni unitarni vektorski prostor nad poljem F. Tada svaka ured¯ena ortonormirana baza B = {e1 , . . . , en } prostora V odred¯uje izomorfizam prostora V na prostor Fn sa standardnim skalarnim proizvodom. Ovaj izomorfizam je odred¯en sa A(e1 ) = (1, 0, . . . , 0), A(e2 ) = (0, 1, 0, . . . , 0), . . . , A(en ) = (0, . . . , 0, 1). Odavde, za x = α1 e1 + · · · αn en vrijedi A(x) = (α1 , . . . , αn ).
Teorem 4.8.5. Neka su V i W unitarni prostori nad nekim poljem i A linearna transformacija prostora V u prostor W. Tada A ˇcuva skalarni proizvod ako i samo ako je kA(x)k = kxk za svako x ∈ V. Dokaz. Ako A ˇcuva skalarni proizvod, onda je jasno da je kA(x)k = kxk za svako x ∈ V. Obrnuto, neka je kA(x)k = kxk za svako x ∈ V. Tada je kA(x)k2 = kxk2 za svako x ∈ V, pa na osnovu (4.3.4) imamo ³ ´ 4 hA(x), A(y)i = kA(x) + A(y)k2 − kA(x) − A(y)k2 ³ ´ +i kA(x) + iA(y)k − kA(x) − iA(y)k2 ³ ´ = kA(x + y)k2 − kA(x − y)k2 ³ ´ +i kA(x + iy)k2 − kA(x − iy)k2 ³ ´ ³ ´ = kx + yk2 − kx − yk2 + i kx + iyk2 − kx − iyk2 = 4 hx, yi . za svako x ∈ V. Dakle, A ˇcuva skalarni proizvod. Definicija 4.8.6. Za linearnu transformaciju A prostora V koja ˇcuva skalarni proizvod na V kaˇzemo da je unitarna transformacija. Ako je V realan unitaran vektorski prostor, onda se linearna transformacija koja ˇcuva skalarni proizvod naziva ortogonalna transformacija. Unitarna transformacija prostora V je izomorfizam prostora V u samog sebe koji ˇcuva skalarni proizvod. Neka su A i B unitarne linearne transformacije prostora V. Tada su A i B izomorfizmi i vrijedi k(AB)(x)k = kA(B(x))k = kB(x)k = kxk
4.8. UNITARNE I ORTOGONALNE TRANSFORMACIJE
143
za svako x ∈ V. Dakle, kompozicija dvije unitarne linearne transformacije je unitarna linearna transformacija. Zbog ˇcinjenice da su unitarne transformacije bijekcije to za svaku unitarnu transformaciju A postoji A−1 . Ova transformacija je linearna. Da li je unitarna? Odgovor je potvrdan. Neka je y ∈ V proizvoljan. Tada postoji x ∈ V takav da je y = A(x). Sada imamo ° ° −1 ° ° −1 °A (y)° = °A (A(x))° = kxk = kA(x)k = kyk . Dakle, skup svih unitarnih transformacija prostora V ˇcini grupu u odnosu na slaganje preslikavanja. Prema Teoremu 4.8.2 linearna transformacija A konaˇcnodimenzionalnog unitarnog prostora V je unitarna ako i samo ako za bar jednu ortonormiranu bazu {e1 , . . . , en } prostora V je {A(e1 ), . . . , A(en )} ortonormirana baza prostora V. Teorem 4.8.7. Neka je A linearna transformacija unitarnog prostora V. Tada je A unitarna transformacija ako i samo ako postoji A∗ i vrijedi AA∗ = A∗ A = idV . Dokaz. Neka je A unitarna transformacija. Tada je A invertibilna transformacija (jer je izomorfizam) i vrijedi D E ® ® hA(x), yi = A(x), (AA( − 1))(y) = A(x), A(A−1 (y)) = x, A−1 (y) za svako x, y ∈ V. Odavde slijedi daje A−1 adjungovana transformacija prostora V, tj. A∗ = A−1 . Obrnuto, neka je A∗ postoji i ima osobinu AA∗ = A∗ A = idV . Tada je A invertibilno i vrijedi A−1 = A∗ . Ostaje nam joˇs da dokaˇzemo da A ˇcuva skalarni proizvod. Imamo hA(x), A(y)i = hx, A∗ (A(x))i = hx, idV (y)i = hx, yi za svako x, y ∈ V. Primjer 4.8.8. Neka je Cn×1 vektorski prostor nad poljem kompleksnih brojeva C u kojem je skalarni proizvod dat relacijom hX, Y i = Y ∗ X. Neka je A proizvoljna n × n matrica nad poljem kompleksnih brojeva. Matrica A odred¯uje preslikavanje A : Cn×1 → Cn×1 definisano sa A(X) = AX. Tada je hA(X), A(Y )i = hAX, AY i = (AY )∗ (AX) = Y ∗ A∗ AX za svako X, Y ∈ C n×1 . Preslikavanje A je unitarna transformacija ako i samo ako je A∗ A = I.
Definicija 4.8.9. Za kvadratnu matricu A nad poljem kompleksnih brojeva C kaˇzemo da je unitarna ako je A∗ A = I. Za matricu A nad poljem kompleksnih brojeva kaˇzemo da je ortogonalna ako je At A = I. Teorem 4.8.10. Neka je V konaˇcnodimenzionalni unitarni prostor i neka je A linearna transformacija prostora V. Tada je A unitarna linearna transformacija prostora V ako i samo ako je unitarna matrica A koja odgovara transformaciji A u odnosu na ortonormiranu bazu.
144
GLAVA 4. NORMIRANI I UNITARNI PROSTORI
Dokaz. Dokaz slijedi neposredno iz prethodne teoreme. Teorem 4.8.11. Neka je A unitarna linearna transformacija unitarnog prostora V. Tada su svojstvene vrijednosti transformacije A po modulu jednake 1. Dokaz. Neka je A(x) = λx, x 6= 0. Tada je ¯ hx, xi = hλx, λxi = hA(x), A(x)i = hx, xi . |λ|2 hx, xi = λλ Dakle, |λ|2 = 1, tj. |λ| = 1. Teorem 4.8.12. Neka je A linearna transformacija realnog konaˇcnodimenzionalnog unitarnog vektorskog prostora V. Tada V ima ortonormiranu bazu od svojstvenih vektora koji odgovaraju svojstvenim vrijednostima koje su po apsolutnoj vrijednosti jednake 1, ako i samo ako je A istovremeno ermitska i ortogonalna linearna transformacija. Dokaz. Pretpostavimo da V ima bazu {e1 , . . . , en } sastavljenu od svojstvenih vektora koji odgovaraju svojstvenim vrijednostima λi takvim da je |λi | = 1. Na osnovu Teorema 4.7.6 transformacija A je ermitska. Dakle, A∗ = A. Sada imamo AA∗ (ei ) = A(A∗ (ei )) = A(λi ei ) = λi A(ei ) = λ2i ei = ei za svako i = 1, . . . , n. Dakle, (AA∗ )(ei ) = idV (ei ) za svako i. To znaˇci da se transformacije AA∗ i idV podudaraju na bazi prostora V, pa su te transformacije jednake. Dakle, AA∗ = idV , tj. A je ortogonalna transformacija. Obrnuto, neka je A ermitska i ortogonalna transformacija. Tada V ima ortonormiranu bazu od svojstvenih vektora. Kako je A ortogonalna transformacija, to su svojstvene vrijednosti po modulu jednake 1. Posljedica 4.8.13. Neka je A linearna transformacija konaˇcnogenerisanog kompleksnog unitarnog prostora V. Tada V ima ortonormiranu bazu od svojstvenih vektora koji odgovaraju svojstvenim vrijednostima koje su po modulu jednake 1 ako i samo je A unitarna linearna transformacija. Dokaz je analogan dokazu prethodnog teorema. Primjer 4.8.14. Neka je A : R2 → R2 rotacija ravni za ugao ϕ, , 0 < ϕ < π. Jasno je da rotacija ravni ˇcuva udaljenost i uglove pa je kA ∗ (x)k = kxk za svako x ∈ R2 . Matrica transformacije A u odnosu na neku ortonormiranu bazu {e1 , e2 } prostora R2 je · ¸ cos ϕ − sin ϕ . sin ϕ cos ϕ Odavde se vidi da linearna transformacija A∗ predstavlja rotaciju za ugao −ϕ. Zato je AA∗ = idV , tj. A je ortogonalna transformacija.
Definicija 4.8.15. Neka je L jednodimenzionalni potprostor od R2 , tj. L predstavlja pravu koja prolazi kroz koordinatni poˇcetak. Linearno preslikavanje A prostor (tj. ravni) R2 takvo da je A(x) = x za svako x ∈ L i A(x) = −x za svako x ∈ L⊥ nazivamo simetrija prostora R2 u odnosu na L.
4.8. UNITARNE I ORTOGONALNE TRANSFORMACIJE
145
Primjer 4.8.16. Neka je A simetrija prostora R2 u odnosu na L. Neka su v1 ∈ L i v2 ∈ L⊥ jediniˇcni vektori. Kako je A(v1 ) = v1 i A(v2 ) = −v2 , to su v1 i v2 svojstveni vektori 2 i formiraju ortonormiranu ¸ bazu prostora R . U odnosu na ovu bazu linearno preslikavanje A · 1 0 ima matricu . Ova matrica je dijagonalna i na glavnoj dijagonali ima svojstvene 0 −1 vrijednosti koje su po apsulutnoj vrijednosti jednake 1, pa je A ortogonalna transformacija prostora R2 .
Primjer 4.8.17. Neka je L jednodimenzionalni potprostor prostora R2 i B = {(1, 0), (0, 1)} standardna baza prostora R2 . Neka simetrija prostora R2 u odnosu na L u na bazu B ima matricu A. Pretpostavimo da je ϕ ugao koji prava L zaklapa sa pozitivnim dijelom x ose. Neka je v1 = (cos ϕ, sin ϕ) i v2 = (− sin ϕ, cos ϕ). Tada je v1 ∈ L i v2 ∈ L⊥ . Zbog toga je B1 = {v1 , v2 } ortonormirana baza prostora R2 . U odnosu na ovu bazu transformacija A ima matricu · ¸ 1 0 [A]B1 = . 0 −1 Matrica prelaza sa baze B na bazu B1 je · cos ϕ P = sin ϕ
− sin ϕ cos ϕ
¸ .
Tada je [A]B1 = P −1 AP, pa je · A = P [A]B1 P −1 =
cos 2ϕ sin 2ϕ
sin 2ϕ − cos 2ϕ
¸ .
Znamo za kompleksnu normalnu (realnu simetriˇcnu) matricu A postoji ortonormirana baza prostora Fn sastavljena od svojstvenih vektora matrice A. Tada je matrica A sliˇcna dijagonalnoj matrici D koja na glavnoj dijagonali ima svojstvene vrijednosti matrice A. Neka je P matrica ˇcije su kolone komponente svojstvenih vektora gore naprijed navedene ortonormirane baze. Tada je D = P −1 AP. Kako su kolone matrice P komponente ortonormirane baze, to je matrica P unitarna (ortogonalna) pa je P −1 = P ∗ . Dakle, D = P ∗ AP. Definicija 4.8.18. Neka su A, B kompleksne (realne) matrice reda n × n. Kaˇzemo da je matrica A unitarni (ortogonalni) ekvivalent matrice B ako i samo ako postoji unitarna matrica P takva da je A = P ∗ BP. Teorem 4.8.19. Neka je A kompleksna matrica reda n × n. Tada je A normalna matrica ako i samo ako je A unitarni ekvivalent dijagonalnoj matrici. Dokaz. Neka je A = P ∗ DP, gdje je D dijagonalna i P unitarna matrica. Tada je AA∗ = (P ∗ DP )(P ∗ DP )∗ = (P ∗ DP )(P ∗ D∗ P ) = P ∗ D(P P ∗ )D∗ P = P ∗ DID∗ P = P ∗ DD∗ P. Analogno se pokazuje da je A∗ A = P ∗ D∗ DP. Kako je D dijagonalna matrica, to je DD∗ = D∗ D. Zato je AA∗ = A∗ A, tj. A je normalna matrica. Obrnuto, neka je A normalna matrica. Tada matrici A u odnosu na standardnu bazu prostora Fn moˇzemo pridruˇziti transformaciju A prostora F n koja je normalna
146
GLAVA 4. NORMIRANI I UNITARNI PROSTORI
transformacija. Kako je baza ortonormirana i matrica A normalna, to je i transformacija A normalna. Tada postoji ortonormirana baza B1 sastavljena od svojstvenih vektora transformacije A. U odnosu na ovu bazu transformaciji A pripada dijagonalna matrica D. Neka je P matrica prelaza sa standardne baze na bazu B1 prostora Fn . Kako su obje baze ortonormirane, to je matrica prelaza unitarna matrica i vrijedi D = P ∗ AP, tj. A = Q∗ DQ, gdje je Q = P ∗ unitarna matrica. Dakle, matrica A je ortogonalni ekvivalent dijagonalne matrice. Analogno se dokazuje i teorem. Teorem 4.8.20. Neka je A neka n × n realna matrica. Matrica A je simetriˇcna ako i samo ako je ortogonalni ekvivalent realne dijagonalne matrice. Primjer 4.8.21. Neka je
4 A= 2 2
2 4 2
2 2 . 4
Kako je A simetriˇcna matrica, to je ona, na osnovu prethodnog teorema, ortogonalni ekvivalent realnoj dijagonalnoj matrici D, tj. postoji ortogonalna matrica P takva da je P t AP = D. Da bi odredili D i P moramo na´ci karakteristiˇcni polinom, svojstvene vrijednosti i svojstvene vektore matrice A. Karakteristiˇcni polinom je f (x) = det (xI − A) = (x − 2)2 (x − 8). Svojstveni vektori koji odgovaraju svojstvenoj vrijednosti 2 su (−1, 1, 0) i (−1, 0, 1). Ovi vektori nisu ortonormirani, pa primjenjujemo Gram-Schmidtov postupak ortonogonalizacije i imamo svojstvene vektore (−1, 1, 0) i − 21 (1, 1, −2). Normiranjem ovih vektora imamo ortonormirani skup 1 1 { √ (−1, 1, 0), √ (1, 1, −2)} 2 6 svojstvenih vektora koji odgovaraju svojstvenoj vrijednosti 2. Sliˇcno nalazimo da je vektor √1 (1, 1, 1) svojstveni vektor koji odgovara svojstvenoj vrijednosti 8. Tada je 3 1 1 1 { √ (−1, 1, 0), √ (1, 1, −2), √ (1, 1, 1)} 2 6 3 ortonormirana baza svojstvenih vektora matrice A. Traˇzena −1 √ √1 √1 2 6 3 2 √1 P = 2 √16 √13 , D = 0 0 −2 √1 0 √ 6 3
matrice P i D su: 0 2 0
0 0 . 8
Definicija 4.8.22. Neka je V realan unitaran prostor. Za funkciju f : V → V kaˇzemo da je izometrija ako kf (x) − f (y)k = kx − yk za svako x, y ∈ V. Svaka ortogonalna transformacija konaˇcnodimenzuionalnog realnog unitarnog prostora je izometrija. Drugi primjer izometrije je translacija, koja se definiˇse relacijom f (x) = x + a (x ∈ V ), gdje je a proizvoljan ali fiksiran element prostora V.
4.8. UNITARNE I ORTOGONALNE TRANSFORMACIJE
147
Teorem 4.8.23. Neka je f : V → V izometrijska transformacija realnog unitarnog prostora V konaˇcne dimenzije. Tada postoji jedinstvena ortogonalna linearna transformacija A i jedinstvena translacija g prostora V takve da je f = g ◦ A. Dokaz. Stavimo A(x) = f (x) − f (0), (x ∈ V ). Tada je kA(x)k2 = kf (x) − f (0)k2 = kx − 0k2 = kxk2 za svako x ∈ V. Dakle, kA(x)k = kxk za svako x ∈ V. Tako za x, y ∈ V je kA(x) − A(y)k2 = hA(x) − A(y), A(x) − A(y)i = hA(x), A(x)i = 2 hA(x), A(y)i + hA(y), A(y)i = kxk2 + kyk2 − 2 hA(x), A(y)i . No, pa je
kA(x) − A(y)k2 = kx − yk2 = kxk2 + kyk2 − hx, yi , kxk2 + kyk2 − 2 hA(x), A(y)i = kxk2 + kyk2 − hx, yi ,
tj. hA(x), A(y)i = hx, yi . Stavimo z = A(x + y) − A(x) − A(y). Tada je kzk2 = kA(x + y) − A(x) − A(y)k2 = k(A(x + y) − A(x)) − A(y)k2 = kA(x + y) − A(x)k2 + kA(y)k2 − 2 hA(x + y) − A(x), A(y)i = kx + y − xk2 + kyk2 − 2 hA(x + y), A(y)i + 2 hA(x), A(y)i = = 2 kyk2 − 2 hx + y, yi + 2 hx, yi = 2 kyk2 − 2 hx, yi − 2 hy, yi + 2 hx, yi = 0. Dakle, z = 0, tj. A(x + y) − A(x) − A(y) = 0, tj. A(x + y) = A(x) + A(y) za svako x, y ∈ V. Dalje, neka je u = A(αx) − αA(x). Tada je kuk2 = kA(αx) − αA(x)k2 = hA(αx) − αA(x), A(αx) − αA(x)i = hA(αx), A(αx)i − 2α hA(αx), A(x)i + α2 hA(x), A(x)i = hαx, αxi − 2α hαx, xi + α2 hx, xi = 0. Dakle, u = 0, tj. A(αx) = αA(x). Tako smo pokazali da je A linearno preslikavanje. Iz hA(x), A(y)i = hx, yi slijedi da je A ortogonalna transformacija. Iz A(x) = f (x) − f (0) slijedi da je f (x) = A(x) + f (0). Definiˇsimo preslikavanje g : V → V relacijom g(x) = x + f (0) za svako x ∈ V. Tada je g translacija prostora V za vektor f (0). Osim toga je f (x) = A(x) + f (0) = g(A(x) = (g ◦ A)(x) za svako x ∈ V. Dakle, f = g ◦ A. Ostalo je joˇs da dokaˇzemo jedinstvenost. Pretpostavimo da osim A i g postoje U i h, pri ˇcemu je U ortogonalna transformacija i h translacija i da je f = g ◦A = h◦U. Neka je g(x) = s + a i h(x) = x + b. Tada je A(x) + a = U(x) + b za svako x ∈ V Specijalno za x = 0 imamo a = b. Dakle, h = g. Tada se uslov f = g ◦ A = h ◦ U svodi na A(x) = U(x) za svako x ∈ V, pa je A = U.
148
4.9
GLAVA 4. NORMIRANI I UNITARNI PROSTORI
Ortogonalne transformacije prostora
R2 Teorem 4.9.1. Neka je A ortogonalni operator u R2 i A = [A]B matrica transformacije A u odnosu na standardnu bazu B prostora R2 . Tada je ispunjen taˇcno jedan od uslova: (a) A je rotacija i det A = 1. (b) A je simetrija u odnosu na neku pravu koja prolazi koordinatnim poˇcetkom i det A = −1. Dokaz. Kako je A ortogonalna transformacija, to ona svaku ortonormiranu bazu prevodi u ortonormiranu bazu. Dakle, B1 = {A(e1 ), A(e2 )} je ortonormirana baza. Vektor A(e1 ) je jediniˇcni vektor. Neka je ϕ = ] (e1 , A(e1 )) , 0 ≤ ϕ < 2π. Tada je A(e1 ) = cos ϕ e1 + sin ϕ e2 . Vektor A(e2 ) = α e1 + β e2 je jediniˇcni i ortogonalan je na A(e1 ). Zato je α2 + β 2 = 1 i α · cos ϕ + β · sin ϕ = 0. Odavde se nalazi α = ± sin ϕ, i β = ∓ cos ϕ. Dakle, imamo dvije mogu´cnosti A(e2 ) = − sin ϕ e1 + cos ϕ ili A(e2 ) = sin ϕ e1 − cos ϕ e2 . Ako je prva mogu´cnost, onda je · A=
cos ϕ − sin ϕ sin ϕ cos ϕ
¸ .
To znaˇci da je A rotacija oko koordinatnog poˇcetka za ugao ϕ. Tada je det A = 1. Ako je druga mogu´cnost, onda je · ¸ cos ϕ sin ϕ A= . sin ϕ − cos ϕ Na osnovu Primjera 4.8.17 slijedi da je A simetrija u odnosu na pravu koja sa x osom zaklapa ugao ϕ2 . Osim toga je det A = −1. Posljedica 4.9.2. Svako izometrijsko preslikavanje je kompozicija tranlacije i rotacije ili kompozicija jedne translacije i osne simetrije.
4.9.1
Zadaci
1. Za svaku os sljede´cih transformacija A prostora V utvrditi, da li je unitarna ili normalna ili nije ni jedno ni drugo. (a) V = R2 , A(a, b) = (2a − 2b, −2a + 5b). (b) V = R3 , A(a, b, c) = (−a + b, 5b, 4a − 2b + 5c). (c) V = C2 , A(a, b) = (2a + ib, a + 2b).
4.10. BILINEARNE I KVADRATNE FORME
149
R1 (d) V je skup polinoma stepena ≤ 2 nad R i A(f ) = f 0 i hf, gi = 0 f (t)g(t)dt. µ ¶ µ ¶ a b c d 2×2 (e) V = R , A = . Na V je Frobeniusov skalarni c d a b proizvod. 2. Neka je A ermitska linearna transformacija prostora V konaˇcne dimenzije. Dokazati da za svako x ∈ V vrijedi kA(x) ± ixk2 = kA(x)k2 + kxk2 . Zakljuˇciti da je A − i idV invertibilna linearna transformacija i da je ¡ ¢∗ (A − idV )−1 = (A + i idV )−1 . 3. Neka je A normalna linearna transformacija konaˇcnodimenzionalnog unitarnog prostora V ˇciji se karakteristiˇcni polinom razlaˇze na linearne faktore. Dokazati da V ima ortonormiranu bazu sastavljenu od svojstvenih vektora linearne transformacije A, pa na osnovu toga zakljuˇciti da je A ermitska linearna transformacija. 4. Koji od sljede´cih parova matrica su unitarno ekvivalentne? · ¸ · ¸ 1 0 0 1 (a) , ; 0 1 1 0 · ¸ · ¸ 0 1 0 12 (b) , ; 1 0 1 0 2 0 1 0 2 0 0 (c) −1 0 0 , 0 −1 0 ; 0 0 1 0 0 0 1 1 0 1 0 0 (d) 0 2 2 , 0 2 0 . 0 0 3 0 0 3 5. Za svaku od sljede´cih matrica A na´ci unitarnu ili ortogonalnu matricu P i dijagonalnu matricu D tako da je P ∗ AP = D. · ¸ · ¸ · ¸ 1 2 0 −1 2 3 − 3i (a) (b) (c) 2 1 1 0 3 + 3i 5 2 1 1 0 2 2 (d) 2 0 2 (e) 1 2 1 . 1 1 2 2 2 0
4.10
Bilinearne i kvadratne forme
Ako je A linearna transformacija konaˇcnodimenzionalnog unitarnog prostora V funkciju f : V × V → F definisana sa f (x, y) = hA(x), yi
150
GLAVA 4. NORMIRANI I UNITARNI PROSTORI
moˇzemo posmatrati kao neku zamjenu za linearnu transformaciju A. Mnoga pitanja koja se postavljaju za transformaciju mogu se postaviti i za funkciju f. Naime, odmah se vidi da je f odred¯ena sa A. Ako je B = {e1 , . . . en } ortonormirana baza prostora V, tada transformaciji A pripada matrica A ˇciji su elementi odred¯eni sa A(ei ) =
n X
Aji ej .
j=1
Odavde je f (ei , ek ) = hA(ei ), ek i =
* n X
+ Aji ej , ek
j=1
=
n X
Aji hej , ek i =
j=1
n X
Aji δjk = Aki ,
j=1
tj. Aki = f (ei , ek ). Osobine funkcije f su opisane u sljede´coj definiciji. Definicija 4.10.1. Neka je V kompleksni ili realni vektorski prostor nad poljem F. Funkciju f sa skupa V × V ured¯enih parova vektora u polje skalara F nazivamo seskvi-linearnom formom na V ako je (a) f (α1 x1 + α2 x2 , y) = α1 f (x1 , y) + α2 f (x2 , y) (b) f (x, α1 y1 + α2 y2 ) = α ¯ 1 f (x, y1 ) + α ¯ 2 f (x, y2 ) za svako α1 , α2 ∈ F i svako x1 , x2 , y1 , y2 ∈ V. Dakle, seskvi-linearna funkcija je linearna po prvom argumentu kada drugi argument drˇzimo fiksiran, a po drugom agumentu je aditivna, ali nije homogena. To nekako dod¯e kao da je jedan i po put linearna. Ako je rijeˇc o realnom prostoru, onda je linearna po oba argumenta i tada kaˇzemo da je f bilinearna forma. Skup svih seskvi-linearnih (bilinearnih formi) prostora V je potprostor vektorskog prostora svih skalarnih funkcija na V × V. Teorem 4.10.2. Neka je V unitarni prostor konaˇcne dimenzije i f forma na V. Tada postoji jedinstvena linearna transformacija A prostora V takva da je f (x, y) = hA(x), yi za svako x, y ∈ V, i preslikavanje f 7→ A je izomorfizam vektorskog prostora formi u vektorski prostor L(V, V ). Dokaz. Fiksirajmo vektor y ∈ V i posmatrajmo preslikavanje x 7→ f (x, y) prostora V u polje F. Kako je f linearno po prvom argumentu, pa je ovo preslikavanje linearni funkcional na V. Tada na osnovu Teorema 4.6.1 postoji taˇcno jedan vektor y 0 ∈ V takav da je f (x, y) = hx, y 0 i . Na ovaj naˇcin elementu y ∈ V pridruˇzili smo element
4.10. BILINEARNE I KVADRATNE FORME
151
y 0 ∈ V. Ovo preslikavanje oznaˇcimo sa U, tj. U(y) = y 0 . Neka su y, z ∈ V i α, β ∈ V proizvoljni. Tada za svako x ∈ V imamo ¯ (x, z) hx, U(αy + βz)i = f (x, αy + βz) = αf ¯ (x, y) + βf = α ¯ hx, U(y)i + β¯ hx, U(z)i = hx, αU(y)i + hx, βU(z)i = hx, αU(x) + βU(z)i . Dakle, hx, U(αy + βz)i = hx, αU(y) + βU(z)i za svako x ∈ V, pa je U(αy + βz) = αU(y) + βU(z), tj. U je linearna transformacija prostora V. Linearna transformacija A = U ∗ zadovoljava relaciju f (x, y) = hA(x), yi . Ako osim transformacije A postoji i transformacija A0 takva da je f (x, y) = hA0 (x), yi , onda je h(A − A0 )(x), yi = 0 za svako x, y ∈ V. Zato je (A − A0 )(x) = 0 za svako x ∈ V. Zato je A = A0 . Dakle, za svako f postoji taˇcno jedna linearna transformacija Af ∈ L(V, V ) takva da je f (x, y) = hAf (x), yi za svako x, y ∈ V. Pokaˇzimo sada da je preslikavanje Φ : f 7→ Af linearno preslikavanje. Neka su f i g forme na V i α, β ∈ F. Tada je hAα f +β g (x), yi = (α f + β g)(x, y) = α f (x, y) + β g(x, y) = α hAf (x), yi + β hAg (x), yi = hαAf (x), yi + hβAg (x), yi = h(αAf )(x), yi + h(βA)(x), yi = h(αAf )(x) + (βAg )(x), yi = h(αAf + βAg ) (x), yi . Dakle, hAα f +β g (x), yi = h(αAf + βAg ) (x), yi , (∀ x, y ∈ V ). Zbog proizvoljnosti elementa y odavde slijedi Aα f +β g (x) = (αAf + βAg ) (x) za svako x ∈ V. Tada je Aα f +β g = αAf + βAg , tj. Φ(α f + β g) = αΦ(f ) + βΦ(g). Tako je preslikavanje Φ linearno preslikavanje. Neka je A ∈ L(V, V ) proizvoljna transformacija prostora V. Tada je relacijom f (x, y) = hA(x), yi definisana forma na V za koju je Af = A. To znaˇci da preslikavanje Φ sirjektivno. Pokaˇzimo injektivnost ovog preslikavanja. Neka je f ∈ Ker Φ. Tada je Af nula preslikavanje, tj. Af (x) = 0 za svako x ∈ V. Tada za svako x, y ∈ V vrijedi f (x, y) = hAf (x), yi = h0, yi = 0. Dakle, f je nula forma, pa preslikavanje Φ injektivno, tj. izomorfizam.
152
GLAVA 4. NORMIRANI I UNITARNI PROSTORI
Posljedica 4.10.3. Neka je V unitaran vektorski prostor konaˇcne dimenzije. Neka su f i g proizvoljne forme na V i neka su Af i Ag matrice linearnih transformacija Af i Ag u odnosu na ortonormiranu bazu {e1 , . . . , en } prostora V. Tada je relacijom hf, gi = trag(Af A∗g ) definisan skalarni proizvod na prostoru formi i za koji vrijedi X hf, gi = f (ek , ej )g(ek , ej ). j,k
Definicija 4.10.4. Neka je f forma na V i B = {e1 , . . . , en } bilo koja ured¯ena baza prostora V. Tada se matrica A sa elementima Ajk = f (ek , ej ) naziva matrica forme f u odnosu na bazu B. Neka je B = {e1 , . . . , en } baza prostora V i x =
f (x, y) = f
à n X
α s es ,
s=1
n X
! βt et
=
X
n P s=1
α s es i y =
αs βt f (es , et ) =
t,s
t=1
Odavde imamo
n P t=1
X
βt et . Tada je
αs βt Ats .
t,s
¢ ¡ f (x, y) = β1 , , β2 · · · βn A
α1 α2 .. .
= Y ∗ AX,
αn gdje je X = [x]B , Y = [y]B i A matrica forme f. Neka je B1 = {a1 , a2 , . . . , an } neka druga ured¯ena baza prostora V i neka je n P aj = Pij ei , (1 ≤ i ≤ n). Odredimo matricu B forme f u odnosu na novu bazu. i=1
Imamo
à Bjk = f (ak , aj ) = f = =
n X
à n X
s=1 n X
t=1 Ã n X
s=1 ∗
t=1
n X
Psk es ,
s=1
n X
! Ptj et
t=1
!
Psk Ptj f (es , et ) ! Ptj Ats
Psk
= (P AP )jk . Dakle, matrica B je oblika B = P ∗ AP. Matrica P je unitarna matrica, jer je matrica prelaza sa jedne ortonormirane baze na drugu, pa je P ∗ = P −1 . Teorem 4.10.5. Neka je f forma kompleksnog unitarnog vektorskog prostora V konaˇcne dimenzije. Tada postoji ortonormirana baza prostora V u odnosu na koju forma f ima gornje trougaonu matricu.
4.10. BILINEARNE I KVADRATNE FORME
153
Dokaz. Za formu f postoji taˇcno jedna linearna transformacija A takva da je f (x, y) = hA(x), y)i za svako x, y ∈ V. Tada postoji ortonormirana baza {e1 , . . . , en } prostora V u odnosu na koju transformacija A ima gornje trougaonu matricu A. Dakle, f (ek , ej ) = hA(ek ), ej i = 0 kad god je j > k. Definicija 4.10.6. Forma f realnog ili kompleksnog unitarnog prostora V naziva se ermitska ako je f (x, y) = f (y, x) za svako x, y ∈ V. Ako je forma f ermitska, onda iz f (x, y) = hA(x), yi i f (x, y) = f (y, x) imamo hA(x), yi = hA(y), xi = hx, A(y)i , pa je A∗ = A. Obrnuto, ako je A∗ = A onda se jednostavno pokazuje da je forma f ermitska. Dakle, Forma f je ermitska ako i samo je pripadna transformacija A ermitska. Kada je f ermitska transformacija tada je f (x, x) = f (x, x), pa je broj f (x, x) realan broj. No vrijedi i obrnuto kako se vidi iz sljede´ceg teorema. Teorem 4.10.7. Neka je V kompleksan vektorski prostor i f forma na V takva da je f (x, x) realan broj za svako x ∈ V. Tada je f ermitska forma. Dokaz. Trebamo dokazati da je f (x, y) = f (y, x) za svako x, y ∈ V. Imamo f (x + y, x + y) = f (x, x) + f (y, x) + f (x, y) + f (y, y) ∈ R, f (x + iy, x + iy) = f (x, x) + ¯if (x, y) + if (y, x) + f (y, y) ∈ R. Kako su f (x, x) i f (y, y) realni brojevi, to je f (x, y) + f (y, x), i(−f (x, y) + f (y, x)) ∈ R. Stavimo α = f (x, y) i β = f (y, x). Tada je α + β ∈ R i i(−α + β) ∈ R. Konjugacija realnog broja je sam taj broj. Zato je α+β = α ¯ + β¯ ¯ −iα + iβ = i¯ α − iβ. Mnoˇze´ci drugu jednaˇcinu sa i a zatim sabiraju´ci dobijeni rezultat sa prvom jednaˇcinom ¯ tj. f (x, y) = f (y, x). Sto ˇ je i trebalo dokazati. nalazimo 2α = 2β, Posljedica 4.10.8. Neka je A linearna transformacija kompleksnog unitarnog prostora V konaˇcne dimenzije. Tada je A ermitska transformacija ako i samo ako je hA(x), xi realan broj za svako x ∈ V. Teorem 4.10.9. Za svaku ermitsku formu f unitarnog prostora konaˇcne dimenzije V, postoji ortonormirana baza prostora V u odnosu na koju formi f odgovara dijagonalna matrica sa realnim elementima.
154
GLAVA 4. NORMIRANI I UNITARNI PROSTORI
Dokaz. Neka je A linearna transformacija takva da je f (x, y) = hA(x), yi za svako x, y ∈ V. Tada, poˇsto je f (x, y) = f (y, x) i hA(y), xi to je hA(x), yi = f (y, x) = hx, A(y)i za svako x, y ∈ V, tako da je A = A∗ . Tada postoji ortonormirana baza od svojstvenih vektora transformacije A. Neka je {e1 , . . . , en } ortonormirana baza i A(ej ) = λj ej , 1 ≤ j ≤ n. Tada f (ek , ej ) = hA(ek ), ej i = δkj λk . Kako je A ermitska transformacija, to su njene svojstvene vrijednosti realne, pa je broj δkj λk realan za svako k. Dakle,f (ek , ej ) je realan broj za svako k i svako j.
4.11
Definitnost formi
Definicija 4.11.1. Za ermitsku formu f realnog ili kompleksnog prostora V kaˇzemo da je 1. pozitivno semidefinitna ako f (x, x) ≥ 0 za svako x ∈ V. 2. pozitivno definitna ako je f (x, x) > 0 za svako x 6= 0. 3. negativno semidefinitna ako je f (x, x) ≤ 0 za svako x ∈ V. 4. negativno definitna ako je f (x, x) < 0 za svako x 6= 0. Neka je f forma prostora V konaˇcne dimenzije. Neka je B = {e1 , . . . , en } ured¯ena baza prostora V i A matrica forme f u odnosu na bazu B, tj. neka je Ajk = f (ek , ej ). Ako je x = α1 e1 + · · · + αn en , tada je n n X X α j ej , α k ek ) f (x, x) = f (
= =
j=1 n X
k=1 n X
αj αk f (ej , ek ) j=1 k=1 n X n X αj αk Akj .
j=1 k=1
Dakle, f (x, x) ≥ 0 ako i samo ako je A = A∗ i n X n X αj αk Akj ≥ 0 za sve skalare α1 , . . . , αn . j=1 k=1
(4.11.1)
4.11. DEFINITNOST FORMI
155
Teorem 4.11.2. Neka je F polje realnih ili kompleksnih brojeva. Neka je A neka n × n matrica nad poljem F. Funkcija g definisana relacijom g(X, Y ) = Y ∗ AX je pozitivno definitna forma na prostoru Fn×1 , ako i samo ako postoji invertibilna matrica P sa koeficijentima iz F takva da je A = P ∗ P. Dokaz. Funkcija g(X, Y ) = Y ∗ AX je forma na prostoru matrica kolona. Neka je A = P ∗ P za neku invertibilnu matricu P. Pokaˇzimo da je g ermitska forma. Prema Teoremu 4.10.7 forma g je ermitska ako i samo akoje g(X, X) realan broj za svako X ∈ Fn×1 . Imamo g(X, X) = X ∗ AX = X ∗ P ∗ P X = (P X)∗ (P X). Matrica P X je neka matrica kolona npr. P X = (α1 α2 · · · αn )t . Tada je (P X)∗ (P X) = α¯1 α1 + α ¯ 1 α2 + · · · + α ¯ n αn = |α1 |2 + |α2 |2 + · · · + |αn |2 . Ovaj broj ne samo da je realan ve´c je i nenegativan.To znaˇci da je forma g ermitska i pozitivno semidefinitna. Ovaj broj ´ce biti nula ako i samo ako je αi = 0 za svako i, tj. ako i samo ako je P X = 0. Kako je P invertibilna matrica, to je g(X, X) = 0 ako i samo ako je X = 0. Dakle, forma g je pozitivno definitna. Obrnuto, neka je forma g pozitivno definitna na prostoru matrica kolona, tj na n×1 F . Matrica frorme g u odnosu na standardnu bazu prostora kolona matrica je matrica A = P ∗ P. Definiˇsimo hX, Y i = g(X, Y ), (X, Y ∈ Fn×1 ). Da li je ovom relacijom definisan skalarni proizvod? a) hX, Xi = g(X, X) ≥ 0 i pri tome je hX, Xi = 0 ako i samo ako je g(X, X) = 0, tj. ako i samo ako je X = 0, jer je g pozitivno definitna forma. b) hX1 + X2 , Y i = g(X1 + X2 , Y ) = g(X1 , Y ) + g(X2 , Y ) = hX1 , Y i + hX2 , Y i . c) hλX, Y i = g(λX, Y ) = λ g(X, Y ) = λ hX, Y i . d) hY, Xi = g(Y, X) = g(X, Y ) = hX, Y i, jer je g ermitska. Dakle, relacijom hX, Y i = g(X, Y ), (X, Y ∈ Fn×1 ) je definisan skalarni proizvod na Fn×1 . Prostor Fn×1 ima ortonormiranu bazu {Q1 , Q2 , . . . , Qn } u odnosu na ovaj skalarni proizvod. Tada je δjk = hQj , Qk i = g(Qj , Qk ) = Q∗k AQj . Neka je Q matrica sa kolonama Q1 , Q2 , . . . , Qn . Tada prethodna jednakost daje Q∗ AQ = I. Matrica Q je matrica prelaza sa standardne baze prostora Fn×1 na ortonormiranu bazu {Q1 , Q2 , . . . , Qn }. Zbog toga je matrica Q invertibilna. Stavimo P = Q−1 . Tada je I = Q∗ AQ = (P −1 )∗ AP −1 , pa je A = P ∗ P. Iz ove teoreme slijedi da, ako je forma pozitivno definitna, onda njena matrica A ima pozitivnu determinantu.
156
GLAVA 4. NORMIRANI I UNITARNI PROSTORI
Lema 4.11.3. Neka je A invertibilna n × n matrica nad poljem F. Sljede´ce tvrdnje su ekvivalentne. a) Postoji gornje trougaona matrica P takva da je Pkk = 1 (1 ≤ k ≤ n) takva da je matrica B = AP donjetrougaona. b) Glavni minori
A11 · · · .. ∆k = det . Ak1 · · ·
A1k .. , (1 ≤ k ≤ n) . Akk
matrice A su razliˇciti od nule. Dokaz.PNeka je P neka n × n matrica nad poljem F i neka je B = AP. Tada je Bjk = Ajr Prk . Ako je P gornje trougaona matrica i Pkk = 1 za svako k, Tada je r
k−1 X
Ajr Prk = Bjk − Akk , (k > 1).
r=1
Ako je B donjetrougaona matrica, onda je Bjk = 0 za j < k. Zato je B donjetrougaona matrica ako i samo ako je k−1 X
Ajr Prk = −Akk (1 ≤ j ≤ k − 1, 2 ≤ k ≤ n).
(4.11.2)
r=1
Odavde vidimo da je tvrdnja pod a) ekvivalentna sa tvrdnjom da postoje skalari Prk 1 ≤ r ≤ k, 1 ≤ k ≤ n koji zadovoljavaju (4.11.2) i Pkk = 1 1 ≤ k ≤ n. U (4.11.2) za svako k > 1 imamo sistem od k − 1 linearnih jednaˇcina po nepoznatim P1k , . . . , Pk−1,k . Matrica ovo sistema je A11 ··· A1,k−1 .. .. , . . Ak−1,1 · · ·
Ak−1,k−1
a njena determinanta je glavni minor ∆k−1 (A). Ako je svako ∆k−1 (A) 6= 0, onda svaki sistem (4.11.2) ima jedinstveno rjeˇsenje. Dakle, ako vrijedi b) onda vrijedi i a). Obrnuto, neka vrijedi a). Mi ´cemo pokazati da je ∆k (B) = B11 B22 · · · Bkk (k = 1, 2, . . . , n).
(4.11.3)
Neka su A1 , A2 , . . . , An kolone matrice A, a B1 , B2 , . . . , Bn kolone matrice B. Tada iz definicije proizvoda matrica slijedi B1 = A1 r−1 P Br = Pjr Aj + Ar , r > 1. j=1
(4.11.4)
4.11. DEFINITNOST FORMI
157
Fiksirajmo k, 1 ≤ k ≤ n. Iz 4.11.4) vidimo da je r−ta kolona matrice ∆k (B) nastala od r−te kolone matrice ∆k (A) tako ˇsto joj je dodana linearna kombinacija preostalih kolona te matrice. Ovom operacijom se ne mijenja vrijednost determinante. Zato je ∆r (B) = ∆r (A). 1 ≤ r ≤ k. Kako je matrica B donje trougaona, to je ∆k (B) = B11 B22 · · · Bkk . Kako su matrice A i P invertibilne, to su njihove determinante razliˇcite od nule. Zbog toga je det(B) = det(A)·det(P ) = B11 B22 · · · Bnn 6= 0. Odavde slijedi da je ∆k (A) = ∆k (B) 6= 0 za svako k = 1, 2, . . . , n. Teorem 4.11.4. Neka je f forma konaˇcnodimenzionalnog prostora V i neka je A matrica od f u odnosu na bazu B. Forma f je pozitivno definitna ako i samo ako vrijedi: 1. A∗ = A, 2. svi glavni minori ∆1 (A), ∆2 (A), . . . , ∆n (A) matrice A su pozitivni. Dokaz. Neka je A∗ = A i neka su sve glavni minori pozitivni. Tada na osnovu prethodne leme postoji gornje trougaona i invertibilna matrica P takva da je matrica B = AP donje trougaona. Da li su ispunjeni uslovi prethodne leme? Jesu, jer je det(A) = ∆n (A) 6= 0, pa je invertibilna. Matrica P ∗ je donje trougaona. Zato je i matrica P ∗ B donje trougaona. Dakle, matrica D = P ∗ B = P ∗ AP je donje trougaona. Kako je matrica A ermitska, tj. A∗ = A, to je D∗ = (P ∗ AP )∗ = P ∗ A∗ P = P ∗ AP = D donje trougaona. Dakle, matrica D je dijagonalna. Dalje, imamo ∆k (D) = ∆k (P ∗ B) = ∆k (B) = ∆k (A) > 0 (k = 1, 2, . . . , n). Poˇsto je D dijagonalna matrica to je ∆k (D) = D11 D22 · · · Dkk . Iz ∆k (A) > 0 za svako k slijedi Dkk > 0 za svako k. Ako je A matrica forme f u odnosu na ured¯enu bazu B = {e1 , . . . , en }. Tada je D = P ∗ AP matrica forme f u odnosu na bazu B1 = {a1 , . . . , an } definisanu sa aj =
n X
Pij ei .
i=1
Kako je D dijagonalna matrica sa pozitivnim elementima na glavnoj dijagonali, to je X ∗ DX > 0, X 6= 0 odakle, slijedi da je forma f pozitivno definitna. Neka je sada forma f pozitivno definitna koja u odnosu na bazu B = {e1 , . . . , en } ima matricu A. Tada po definiciji pozitivne definitnosti slijedi da je A∗ = A. Trebamo joˇs dokazati da je ∆k (A) > 0, 1 ≤ k ≤ n. Neka je Vk potprostor prostora V generisan vektorima {e1 , . . . , ek } i neka je fk forma sa Vk × Vk . Forma fk je pozitivno definitna na Vk . Ova forma u odnosu na bazu {e1 , . . . , ek } ima matricu A11 · · · A1k .. .. . . . Ak1 · · ·
Akk
158
GLAVA 4. NORMIRANI I UNITARNI PROSTORI
Dakle, matrica od fk je ∆k (A). Kako smo vidjeli determinanta matrice pozitivno definitne forme je pozitivna. Zbog toga je ∆k (A) > 0 za svako k. Da bi kompletirali naˇsu diskusiju o odnosu izmed¯u pozitivno definitnih formi i njihovih matrica podvucimo sljede´ce. Neka je f forma kompleksnog prostora V i ima matricu A u odnosu na neku ured¯enu bazu. Da bi forma f bila pozitivno definitivna potrebno je i dovoljno da je A∗ = A i X ∗ AX > 0 za svaku kompleksnu matricu X 6= 0, X ∈ Cn×1 . Zbog Teorema 4.10.7 uslov A∗ = A je ispunjen ˇcim je ispunjen uslov X ∗ AX > 0 za svaku kompleksnu matricu X ∈ Cn×1 . U drugu ruku, ako je V realan vektorski prostor, onda ´ce forma f biti pozitivno definitna ako i samo ako je At = A i X t AX > 0 za svako X 6= 0, X ∈ Rn×1 . Ovaj uslov naˇzalost no povlaˇci ispunjavanje uslova A = At . Ako je matrica A reda n×n kompleksna matrica koja zadovoljava uslov X t AX > 0 za svaku realnu matricu X 6= 0, onda kaˇzemo da je matrica A pozitivno definitna. Linearna transformacija A unitarnog vektorskog prostora V konaˇcne dimenzije je nenegativna ako je A = A∗ i hA(x), xi ≥ 0 za svako x ∈ V. Transformacija A je pozitivno definitna ako je A = A∗ i hA(x), xi > 0 za svako x ∈ V, x 6= 0. Ako je A neka n × n matrica nad poljem kompleksnih brojeva sljede´ce ˇcinjenice su ekvivalentne. 1. A je pozitivno definitna, tj.
PP j
k
Akj αj α¯k > 0, gdje su α1 , . . . , αn kompleksni
brojevi i svi su razliˇciti od nule. 2. hX, Y i = Y ∗ AX je skalarni proizvod prostora Cn×1 . 3. U odnosu na standardni skalarni proizvod hX, Y i = Y ∗ X prostora Cn×1 linearno preslikavanje X → AX je pozitivno definitno. 4. A = P ∗ P za neku invertibilnu n × n matricu P nad poljem C. 5. A = A∗ i glavni minori matrice A su pozitivni. Ako je A neka matrica reda n × n nad realnim prostorom, onda imamo sljede´ce ekvivalencije: 1. A = At i
PP j
k
Akj αj α¯k > 0, gdje su α1 , . . . , αn realni brojevi i svi su razliˇciti
od nule. 2. hX, Y i = Y t∗ AX je skalarni proizvod prostora Rn×1 . 3. U odnosu na standardni skalarni proizvod hX, Y i = Y ∗ X prostora Rn×1 linearno preslikavanje X → AX je pozitivno definitno. 4. Postoji invertibilna matrica P sa realnim koeficijentima takva da je A = P t P.
4.11. DEFINITNOST FORMI
4.11.1
159
Urad¯eni zadaci
Zadatak 1. Svesti na kanonski oblik sljede´ce forme: a) x2 + 4x + y 2 , b) x2 − 12x − 4y 2 c) x2 − 2xy + y 2 . Odrediti definitnost ovih formi. · ¸ 1 2 Rjeˇ senje a) Matrica forme je . Njene svojstvene vrijednosti su λ1 = 3 i 2 1 λ2 = −1. Pripadni svojstveni vektori su f1 = √12 (1, 1) i f2 = √12 (−1, 1). U odnosu na ortonormiranu bazu {f1 , f2 } forma ima oblik 3x21 − y12 . Ova forma nije definitna, jer moˇze primati i pozitivne i negativne vrijednosti. · ¸ 1 −6 b) Matrica je . Svojstvene vrijednosti ove matrice su λ1 = −8 i −6 −4 λ2 = 5. Pripadni svojstveni vektori su f1 = √113 (2, 3) i f2 = √113 (−3, 2). U odnosu na ortonormiranu bazu {f1 , f2 } forma ima oblik −8x21 +3y12 . Ova forma nije definitna, jer moˇze primati i pozitivne i negativne vrijednosti. · ¸ 1 −1 c) Matrica forme je . Svojstvene vrijednosti su λ1 = 0, λ2 = 2. −1 1 Svojstveni vektori su f1 = √12 (1, 1) i f2 = √12 (−1, 1). U odnosu na novu bazu forma ima oblik 2y12 , pa je pozitivno semidefinitna. Zadatak 2. Neka je A pozitivno definitna linearna transformacija unitarnog prostora V dimenzije n nad poljem F realnih ili kompleksnih brojeva. Dokazati da postoji taˇcno jedna pozitivno definitna linearna transformacija T takva da je A = T 2 i da postoji polinom f (x) ∈ F[x] ˇciji stepen ne premaˇsuje broj razliˇcitih svojstvenih veijednosti linearne tranasformacije A, takav da je T = f (A). Rjeˇ senje Kako je A pozitivno definitna postoji ortonormirana baza B = {f1 , . . . , fn } od svojstvenih vektora linearne transformacije A. Svojstvene vrijednosti su pozitivne. Neka su λ1 , . . . , λn svojstvene vrijednosti a f1 , . . . , fn pripadni svojstveni vektori. Stavimo p T (fi ) = λi fi (i = 1, . . . , n). Ovom relacijom je definisana linearna transformacija za koju vrijedi p T 2 (fi ) = T (T (fi )) = T ( λi fi ) = λi fi = A(fi ), (i = 1, . . . , n). Dakle, transformacije T 2 i A se podudaraju na bazi B, pa su jednake. Svojstvene vrijednosti transformacije T su pozitivne, pa je T pozitivno definitna. Dakle, dokazali smo postojanje transformacije T sa ˇzeljenom osobinom. Neka je D pozitivno definitna linearna transformacija za koju je D2 = A. Kako je D pozitivno definitna, to postoji ortonormirana baza {g1 , . . . , gn } sastavljena od svojstvenih vektora koji odgovaraju svojstvenim vrijednostima µ1 , . . . , µn , koje su pozitivne. Sada imamo A(gj ) = D2 (gj ) = D(µj gj ) = µ2j gj , (j = 1, . . . , n). Dakle, µ21 , . . . , µ2n su svojstvene vrijednosti linearne transformacije A. No, svojstvene vrijednosti transformacije A su λ1 , . . . , λn , pa uz eventualnu prenumeraciju vrijedi λj = µ2j za svako j = 1, . . . , n. Dakle, p µj = λj (j = 1, . . . , n)
160
GLAVA 4. NORMIRANI I UNITARNI PROSTORI
i vektori g1 , . . . , gn su vektori f1 , . . . , fn . To znaˇci da se T i D poklapaju, pa je jedinstvenost dokazana. Neka su λ1 , . . . λk razliˇcite svojstvene vrijednosti linearne transformacije A. Potraˇzimo polinom f (x) takav da je p f (λj ) = λj (j = 1, . . . , k). Na osnovu Lagranˇzove interpolacione formule ovaj polinom je jednoznaˇcno odred¯en i vrijedi k p Y x − λj X f (x) = λi · . λi − λj i=1
Odavde je f (A)(fi ) = f (λi )fi =
j6=i
p λi fi = T (fi ), (i = 1, . . . , n).
Dakle, T = f (A). Linearna transformacija T za koju je A = T 2 oznaˇcava se sa A1/2 . Zadatak 3. Neka je A linearna transformacija unitarnog prostora V konˇcne dimenzije. Dokazati da postoji jedinstvena pozitivno semidefinitna linearna transformacija D i unitarna transformacija U prostora V takve da je A = DU. Rjeˇ senje. Pretpostavimo da postoje linearne transformacije D i U. Tada je A = DU, A∗ = U ∗ D∗ . Odavde je AA∗ = DUU ∗ D∗ = DD∗ = D2 , jer je D pozitivno semidefinitna, pa je ermitska transformacija. Transformacija AA∗ je pozitivno semidefinitna, pa na osnovu prethodnog zadatka postoji taˇcno jedna pozitivno semidefinitna linearna transformacija D takva da je AA∗ = D2 . Neka je {a1 , . . . , an } baza prostora V sastavljena od svojstvenih vektora linearne transformacije D. Tada je D(ai ) = µi ai , odnosno AA∗ (ai ) = µ2i ai (i = 1, . . . , n). Tada je
® hA∗ (ai ), A∗ (aj )i = hAA∗ (ai ), aj i = µ2i ai , aj = µ2i δij,
pa postoji ortonormirana baza {b1 , . . . , bn } prostora V u odnosu na koju je A∗ (ai ) = µi bi (i = 1, . . . , n). Ako sada stavimo U ∗ (ai ) = bi (i = 1, . . . , n) bi´ce U ∗ unitarna transformacija prostora V. Osim toga imamo A∗ (ai ) = µi bi = µi U ∗ (ai ) = U ∗ (µi ai ) = U ∗ (D(ai )) = (U ∗ D)(ai ) za svako i, 1 ≤ i ≤ n. Dakle, A∗ = U ∗ D, tj. A = D∗ U = DU. Zadatak 4. Matricu A predstaviti u obliku proizvoda jedne pozitivno definitne matrice D i jedne ortogonalne matrice U , gdje je
4.11. DEFINITNOST FORMI
µ a) A =
2 −1 2 1
161
¶
µ ,
b) A =
1 −4 1 4
4 −2 2 4 −1 . c) A = 4 −2 4 2
¶ ,
Rjeˇ senje. Prema prethodnom zadatku trebamo odrediti svojstvene vrijednosti i svojstvene vektore matrice AA∗ . a) Svojstvene vrijednosti i pripadni svojstveni vektori matrice AA∗ su 1 1 λ1 = 2, f1 = √ (1, −1); λ2 = 8, f2 = √ (1, 1). 2 2 ∗ 2 Da bi odrdili transformaciju √ D takvu da je√AA = D moramo prona´ci polinom f (x) takav da je√ f (λ1 ) = λ1 i f (λ2 ) = λ2 . Jednostavnim raˇcunom se nalazi √ 2 f (x) = 6 x + 2 3 2 . Zato je √ √ √ 2 2 2 2 ∗ (AA ) + idV = (AA∗ + 4idv ) . D= 6 3 6 Odavde je √ √ 2 2 ∗ (AA + 4idv ) (e1 ) = (AA∗ (e1 ) + 4idv (e1 )) D(e1 ) = 6 6 √ √ 2 2 = ((5, 3) + 4(1, 0)) = (3, 1) 6 2 √ √ √ 2 2 2 ∗ (AA (e2 ) + 4idV ) = ((3, 5) + 4(0, 1)) = (1, 3). D(e2 ) = 6 6 2 Tako je traˇzena pozitivno definitna matrica √ √
D=
3 2 2 √
2 2
2 2
√ 3 2 2
.
√ Odredimo sada √ ortogonalnu matricu U. Jednostavno se nalazi da je D(f1 ) = 2f1 i D(f2 ) = 2 2f2 . To znaˇci da je {f1 , f2 } ortonormirana baza prostora V i elementi te baze su svojstveni vektori linearne transformacije D. Sada uvodimo vektore b1 i √ √ b2 tako da √je 2 b1 = A∗ (f ), 2 2 b = A∗ (f2 ). Jednostavnim raˇcunom nalazimo 1 2 √ ∗ A (f1 ) = 2(0, −1) = − 2e2 , pa je b1 = −e2 . Sliˇcno nalazimo da je b2 = e1 . Transformacija U se definiˇse relacijom U ∗ (f1 ) = b1 , U ∗ (f2 ) = b2 . Direktno se nalazi √ √ 2 2 U ∗ (e1 ) = 2 (e1 − e2 ) i U ∗ (e2 ) = 2 (e1 + e2 ) . Tako je √ √ 2 2
U = ∗
√
− pa je
U =
√ 2 2
2 2
√
2 2
√
2 2
Na koncu je A = DU.
2 2
−
,
√
√
.
2 2 2 2
162
GLAVA 4. NORMIRANI I UNITARNI PROSTORI
4.11.2
Zadaci
1. Neka je V = C2 sa standardnim skalarnim proizvodom. Za koji vektor x iz V postoji pozitivno definitna transformacija A takva da je x = A(e1 ), gdje je e1 = (1, 0). 2. Neka je V = R2 sa standardnim skalarnim proizvodom. Ako je θ realan broj, neka je A rotacija prostora V, tj. Aθ (x1 , x2 ) = (x1 cos θ − x2 sin θ, x1 sin θ + x2 cos θ). Za koje vrijednosti θ je transformacija Aθ pozitivno definitna? 3. Neka je V konaˇcnodimenzionalni unitarni prostor. Ako su A i C pozitivno definitna linearna preslikavanja prostora V, dokazati da je A + C pozitivno definitno preslikavanje. Navesti primjer pozitivno definitnih transformacija A i C takvih da AC nije pozitivno definitna. · ¸ 1 21 4. Neka je A = 1 1 . 2
3
(a) Pokazati da je A pozitivno definitna. (b) Neka je V prostor 2 × 1 realnih matrica sa skalarnim proizvodom hX, Y i = Y t AX. ˇ Na´ci ortonormiranu bazu prostora V, koja je nastala Gram-Smitovim postupkom baze {X1 , X2 } definisane sa · ¸ · ¸ 1 0 X1 = , X2 = . 0 1 (c) Odrediti invertibilnu matricu P takvu da je A = P t P. 5. Koje od sljed´cih matrica su pozitivno definitne? · ¸ · ¸ 1 −1 1 1 2 1 1+i , , 2 −1 1 . 3 4 1−i 3 3 −1 1
View more...
Comments