Előadásvázlat a Lineáris algebra II. tárgyhoz Kovács Zoltán 2005. január 4.
Tartalomjegyzék 1. Euklideszi vektorterek 3 1.1. Bilineáris és kvadratikus formák, skaláris szorzatok................ 3 1.2. Norma, szög, távolság euklideszi vektorterekben................. 5 1.3. Merőlegesség.................................... 8 1.4. Lineáris operátorok euklideszi vektorterekben................... 12 2. Lineáris transzformációk szerkezete 17 2.1. Invariáns altér, sajátvektor, sajátérték........................ 17 2.2. A karakterisztikus polinom............................. 20 2.3. Önadjungált transzformációk szerkezete...................... 23 2.4. Ortogonális transzformációk szerkezete...................... 26 3. Geometriai alkalmazások 29 3.1. Geometriai transzformációk............................ 29 3.2. Kúpszeletek elemi és analitikus geometriája.................... 34 3.3. Másodrendű görbék a valós síkon......................... 35 2
1. fejezet Euklideszi vektorterek Ebben a fejezetben (végesen generált) valós vektorterekről lesz szó. 1.1. Bilineáris és kvadratikus formák, skaláris szorzatok Definíció. Legyen V vektortér R felett. Egy L: V V F leképezést bilineáris formának nevezünk, ha mindkét változójában lineáris, azaz x, y, z V, α, β F : L(αx + βy, z) = αl(x, z) + βl(y, z), illetve x, y, z V, α, β F : L(x, αy + βz) = αl(x, y) + βl(x, z). Definíció. Legyen L bilineáris forma egy n dimenziós V vektortéren, (e 1,..., e n ) pedig V bázisa. L ezen bázisra vonatkozó mátrixán az M = ( L(e i, e j ) ) M n n mátrixot értjük. 1.1. Tétel. (Bilineáris formák báziselőállítása.) Legyen L bilineáris forma egy n dimenziós V vektortéren, (e 1,..., e n ) V bázisa. Ha az x vektor koordinátái X = (x 1,..., x n ) t, az y vektor koordinátái Y = (y 1,..., y n ) t, továbbá az L mátrixa M = (m ij ), akkor azaz Bizonyítás: L(x, y) = x i y j m ij, i,j=1 L(x, y) = X t M Y. L(x, y) = L( x i e i, y j e j ) = x i y j L(e i, e j ) = x i y j m ij. i=1 j=1 i,j=1 i,j=1 3
1.2. Tétel. Rögzítsük a V vektortér (e 1,..., e n ) és (e 1,..., e n) bázisát, az (e 1,..., e n ) (e 1,..., e n) báziscsere mátrixa legyen S. Egy L bilineáris forma mátrixa az első bázisban M, a második bázisban M. Ekkor teljesül, hogy M = S t MS. Bizonyítás: Az S illetve S t mátrix elemeit jelöljük s ij -vel, illetve ŝ ij -vel! ( ) m ij = L(e i, e j) = L s ki e k, s lj e l = s ki s lj L(e k, e l ) = = k=1 ( ) s ki m kl s lj = l=1 k=1 l=1 l=1 k=1 ( ) ŝ ik m kl s lj = Definíció. Az L bilineáris formát szimmetrikusnak nevezzük, ha l=1 k=1 x, y : L(x, y) = L(y, x). l=1 s ki s lj m kl = k=1 (S t M) il s lj = (S t MS) ij 1.3. Tétel. Egy bilineáris forma akkor és csakis akkor szimmetrikus, ha tetszőleges bázisra vonatkozó mátrixa szimmetrikus. Bizonyítás: Ha az L bilineáris forma szimmetrikus, akkor (a báziselőállításnál alkalmazott jelölésekkel) L(e i, e j ) = L(e j, e i ) m ij = m ji, Innen közvetlenül látható, hogy ha L szimmetrikus, akkor a mátrixa is szimmetrikus. Most tegyük fel, hogy L mátrixa valamely (e 1,..., e n ) bázisra vonatkozóan szimmetrikus. Ekkor L(x, y) = x i y j m ij és L(y, x) = y i x j m ij = y j x i m ji = y j x i m ij. i,j=1 i,j=1 Definíció. Legyen L egy szimmetrikus bilineáris forma. A l=1 i,j=1 Q: V F, Q(x) = L(x, x) módon értelmezett függvényt kvadratikus formának nevezzük, melynek poláris formája L. 1.4. Tétel. Kvadratikus forma poláris formája egyértelmű. Bizonyítás: Ha Q(x) = L(x, x) teljesül (ahol L szimmetrikus bilineáris forma), akkor azaz L(x + y, x + y) = L(x, x) + L(y, y) + 2L(x, y), 2L(x, y) = Q(x + y) Q(x) Q(y). L(x, y) értékét Q tehát egyértelműen meghatározza. 4 i,j=1
Definíció. Egy kvadratikus forma rögzített bázisra vonatkozó mátrixán a poláris forma mátrixát értjük. A bilineáris formák báziselőállításából közvetlenül következik az alábbi állítás: 1.5. Tétel. (Kvadratikus formák báziselőállítása.) Legyen Q kvadratikus forma egy n dimenziós V vektortéren, (e 1,..., e n ) V bázisa. Ha az x vektor koordinátái (x 1,..., x n ), továbbá a Q mátrixa M = (m ij ), akkor Q(x) = x i x j m ij. i,j=1 Definíció. A V valós vektortéren értelmezett Q kvadratikus formát pozitív definitnek mondunk, ha x V \ {0} : Q(x) > 0. Definíció. Legyen V valós vektortér. V -n adott skaláris szorzaton olyan, : V V R szimmetrikus bilineáris formát értünk, melyből képezett kvadratikus forma pozitív definit. Ilyenkor a (V,, ) párt euklideszi vektortérnek, vagy röviden euklideszi térnek nevezzük. Példa. A szabadvektorok tere a benne geometriai úton értelmezett skaláris szorzattal. Példa. (R n,, ), ahol az X = (x 1,..., x n ) és Y = (y 1,..., y n ) szám n-esek ún. kanonikus skaláris szorzatát a következőképpen értelmezzük: X, Y = x i y i. i=1 Példa. Legyen P n a legfeljebb n-edfokú (valós együtthatós) polinomok tere. Benne a skaláris szorzatot értelmezhetjük a következőképpen: p, q = 1 1 p(t) q(t) dt, p, q P n. 1.2. Norma, szög, távolság euklideszi vektorterekben Definíció. Legyen ( E,, ) euklideszi vektortér. Az x vektor hosszán az x = x, x számot értjük. 1.6. Tétel. (A Cauchy Bunyakovszkij Schwarz-egyenlőtlenség.) Egy euklideszi vektortér bármely két vektorára teljesül, hogy x, y 2 x, x y, y. Egyenlőség akkor és csakis akkor áll fenn, ha x és y lineárisan függők. 5
Bizonyítás: y = 0-ra az állítás triviálisan teljesül, a továbbiakban feltesszük, hogy y 0. Legyen λ R tetszőleges, s tetszőlegesen rögzített x-re és y 0-ra tekintsük az alábbi kifejezést: f(λ) = x λy, x λy = x, x 2λ x, y + λ 2 y, y. λ R : f(λ) 0, mert vektor önmagával való skaláris szorzata mindig nemnegatív, tehát a másodfokú polinom diszkriminánsa nem pozitív: x, y 2 x, x y, y 0. Egyenlőség akkor és csakis akkor állhat fenn, ha x λy = 0, amiből x és y lineáris függősége következik. Megfordítva, ha x és y lineárisan függők, akkor vagy x = λy vagy y = λx valamely alkalmas skalárra. Bármelyiket behelyettesítve az egyenlőtlenség egyik ill. másik oldalába, egyenlő kifejezéseket kapunk. Megjegyzés. A CBS egyenlőtlenség mások szokásos (az előzővel triviálisan ekvivalens) alakja: x, y x y. Példa. R n kanonikus skaláris szorzatára a CBS egyenlőtlenséget az alábbiak szerint írhatjuk (ezt az alakot tanultuk a bevezető analízis tárgyból): ( ) ( ) ( ) x i y i, x i, y i R, i = 1,..., n. i=1 i=1 x 2 i i=1 y 2 i 1.7. Tétel. (Minkowski-egyenlőtlenség.) Egy euklideszi vektortér tetszőleges x és y vektorára: Bizonyítás: x + y x + y. x + y 2 = x + y, x + y = = x, x + 2 x, y + y, y x, x + 2 x, y + y, y x, x + 2 x y + y, y = = x 2 + 2 x y + y 2 = ( x + y ) 2. A következő tételben összefoglaljuk a norma tulajdonságait: 1.8. Tétel. Az ( E,, ) euklideszi vektortérben a : E R normafüggvény rendelkezik az alábbi tulajdonságokkal: (N1) x E : x 0; továbbá x = 0 x = 0. (N2) x E, λ R : λx = λ x. 6
(N3) x, y E : x + y x + y. Bizonyítás: Az első tulajdonság következik a skaláris szorzás pozitív definit voltából, a második pedig a bihomogenitásból. A harmadik állítás a Minkowski-egyenlőtlenség megismétlése. Az eddigiekben a norma mindig egy (a vektortéren adott) skaláris szorzatból származott. A fentebbi tételben megfogalmazott három tulajdonság vezet el a normált vektortér fogalmához. Hangsúlyozzuk, hogy a következő definíció kiindulópontja nem egy euklideszi vektortér, hanem egy vektortér, azaz nincs benne adva skaláris szorzat. Definíció. Egy V vektorteret normált vektortérnek nevezünk, ha benne adva van egy : V R normafüggvény, mely rendelkezik az N1, N2, N3 tulajdonságokkal. Fontos kérdés, hogy a definíció valóban újdonságot ad-e, vagy egy normához mindig be lehet vezetni a vektortéren olyan skaláris szorzatot, mely éppen az adott normát definiálja. A válasz tagadó, azaz vannak olyan normált vektorterek, melyek nem euklideszi vektortérből származnak. Erre vonatkozik az alábbi tétel: 1.9. Tétel. Legyen adva egy ( V, ) normált vektortér. Egy norma akkor és csakis akkor származik skaláris szorzatból, ha a vektortérben teljesül a paralelogramma reláció: x, y V : x + y 2 + x y 2 = 2 ( x 2 + y 2). Bizonyítás: Ld. feladatgyűjtemény: 289. feladat. Definíció. Egy euklideszi vektortér x és y vektorának távolságán a számot értjük. d(x, y) = x y 1.10. Tétel. Tetszőleges euklideszi vektortér metrikus tér az előbb értelmezett távolságfüggvényre. Bizonyítás: A metrikus tér axiómái közül csak a háromszög-egyenlőtlenség teljesülése nem magától érthetődő. alkalmazva a Minkowski-egyenlőtlenséget. d(x, y) + d(y, z) = x y + y z x z = d(x, z), 1.11. Tétel. (Pitagorasz tétele.) Egy euklideszi vektortér x és y vektora akkor és csakis akkor merőlegesek egymásra, ha d(x, y) 2 = x 2 + y 2 7
Bizonyítás: d(x, y) 2 = x y, x y = x, x 2 + y, y 2 2 x, y = x 2 + y 2 2 x, y. Definíció. Az x és y nem nullvektorok ϕ szögét a cos ϕ = (ϕ [0, π]) összefüggéssel x y értelmezzük. A nullvektor tetszőleges vektorral bezárt szöge derékszög. Megjegyzés. Az előbbi definíció jobb oldalán 1 és 1 közötti szám van, ezt a CBS egyenlőtlenség garantálja. x,y 1.3. Merőlegesség Definíció. Egy euklideszi vektortér két vektorát egymásra ortogonálisnak vagy merőlegesnek mondjuk, ha skaláris szorzatuk zéró. Egy vektorrendszert ortogonálisnak mondunk, ha egymásra merőleges vektorok alkotják. Az olyan vektort, melynek hossza 1, egységvektornak nevezzük. Egy vektorrendszert ortonormáltnak mondunk, ha egymásra merőleges egységvektorok alkotják. 1.12. Tétel. Nemzéró vektorok ortogonális rendszere mindig lineárisan független. Bizonyítás: Legyen (e 1,..., e k ) nemzéró vektorok ortogonális rendszere, s tekintsük olyan lineáris kombinációjukat, amely zérusvektort ad: α 1 e 1 + + α k e k = 0. Szorozzuk skalárisan az egyenlőség mindkét oldalát e i -vel (i = 1,..., n): A bal oldalon i j-re e j, e i = 0, tehát α 1 e 1, e i + + α k e k, e i = 0. α i e i, e i = 0, ahol a skaláris szorzat pozitív definitsége miatt e i, e i = 0, tehát α i = 0. 1.13. Tétel. Legyen B = (b 1,..., b n ) bázisa egy euklideszi vektortérnek. Létezik a térben olyan E = (e 1,..., e n ) ortonormált bázis, hogy 1 k n-re: L(b 1,..., b k ) = L(e 1,..., e k ). Bizonyítás (A Gram-Schmidt eljárás): A bizonyítás konstruktív. e 1 = b 1 b 1, továbbá tegyük fel, hogy (e 1,..., e j ) (j < n) olyan ortonormált lineárisan független rendszer, melyre 1 k jl(b 1,..., b k ) = L(e 1,..., e k ). 8
Megkonstruáljuk a j + 1-edik vektort. Legyen f j+1 = b j+1, e 1 e 1 b j+1, e j e j + b j+1. Ezzel egy olyan vektort kaptunk, mely e 1,..., e j mindegyikére merőleges. Szorozzuk ugyanis az előző sort skalárisan e i -vel! Ekkor b j+1, e r e r, e i = 0 i r-re, tehát 1 { }} { f j+1, e i = b j+1, e i e i, e i + b j+1, e i = 0 (i = 1,..., j.) Mivel az (e 1,..., e j, f j+1 ) vektorrendszerből lineárisan kombinálható a (b 1,..., b j, b j+1 ) vektorrendszer s megfordítva, ezért a lineáris kombináció tranzitivitását használva teljesül, hogy L(b 1,..., b j+1 ) = L(e 1,..., e j, f j+1 ). A L(b 1,..., b j+1 ) j + 1 dimenziós altérben tehát (e 1,..., e j, f j+1 ) j + 1 tagú generátorrendszer, tehát bázis. Ebből az is következik, hogy f j+1 nem lehet nullvektor, tehát normálható, s e j+1 = f j+1 f j+1 -re (e 1,..., e j, e j+1) a megfelelő ortonormált vektorrendszer. Az eljárás n lépésben a vektortér n tagú generátorrendszerét, vagyis bázisát adja, melyre a megkívánt generátortulajdonság teljesül. Következmény. Minden euklideszi vektortérnek van ortonormált bázisa. Minden ortonormált rendszer vagy bázis, vagy kiegészíthető ortonormált bázissá. Az ortonormált bázisok használata leegyszerűsít bizonyos számításokat, amint azt az alábbi fontos példák mutatják. 1.14. Tétel. Legyen adva egy euklideszi vektortér, s abban rögzítsünk egy ortonormált bázist! Ha az x és y vektorok koordinátái a rögzített bázisra vonatkozóan (x 1,..., x n ) ill. (y 1,..., y n ) akkor a két vektor skaláris szorzatát az alábbi módon számíthatjuk ki: x, y = x 1 y 1 + + x n y n. 1.15. Tétel. (Vektor Fourier-előállítása.) Legyen E = (e 1,..., e n ) ortonormált bázis egy (V,, ) euklideszi vektortérben. Ekkor x V : x = x, e i e i. i=1 Bizonyítás: Mindkét állítás triviális számolás. 9
1.16. Tétel. (Bessel-egyenlőtlenség.) Legyen E = (e 1,..., e k ) ortonormált vektorrendszer egy (V,, ) euklideszi vektortérben. Ekkor x V : k x, e i 2 x 2. Továbbá minden x-re akkor és csakis akkor teljesül egyenlőség, ha E bázis. i=1 Bizonyítás: Egészítsük ki E-t ortonormált bázissá (ha már bázis akkor nem veszünk hozzá vektort): (e 1..., e k,..., e n ). Ekkor x, e i 2 = i=1 k x, e i 2 + i=1 x, e i 2 = x 2 i=k+1 teljesül, amiből az állítás leolvasható. Ha E bázis, akkor az egyenlőség minden x-re teljesül. Megfordítva, ha E nem lenne bázis, akkor kiegészíthető ortonormált bázissá. Legyen egy kiegészítő vektor e. x = e-re a bal oldal 0-t, a jobb oldal 1-t ad, ami ellentmondás. Definíció. A (V,, V ) és (W, W ) euklideszi tereket izometrikusan izomorf nak nevezzük, ha létezik olyan ϕ: V W bijektív lineáris leképezés (azaz izomorfizmus), melyre x, y V : x, y V = ϕ(x), ϕ(y) W. 1.17. Tétel. (Véges dimenziós euklideszi terek struktúratétele.) Egy n dimenziós euklideszi vektortér izometrikusan izomorf R n -nel, ahol R n -ben a skaláris szorzat a kanonikus. Bizonyítás: A véges dimenziós vektorterek struktúratételének bizonyításában már konstruáltunk izomorfizmust egy valós n dimenziós vektortér és R n között. Ehhez bázis rögzítésére volt szükség. Most azt látjuk be, hogy ha ortonormált bázist rögzítünk, akkor ez az izomorfizmus izometrikus. Legyen tehát (V,, ) n dimenziós euklideszi vektortér, benne (e 1,..., e n ) ortonormált bázis. Értelmezzük a V R n leképezést úgy, hogy minden vektorhoz rendeljük hozzá az (e 1,..., e n ) bázisra vonatkozó koordinátáit: V x (x 1,..., x n ) R n, ha x = x 1 e 1 + + x n e n. A véges dimenziós vektorterek struktúratételéből már tudjuk, hogy ez a leképezés izomorf leképezése V -nek R n -re. Most belátjuk a leképezés izometrikus voltát. Legyen x, y V két tetszőleges vektor, x (x 1,... x n ), y (y 1,..., y n ). A vektorok skaláris szorzatát V -ben a koordináták kompozítumaként számíthatjuk ki (ld. 1.14.): x, y = x 1 y 1 + + x n y n, ez pontosan megegyezik az R n -beli képek skaláris szorzatával. 10
Következmény. Két euklideszi vektortér akkor és csakis akkor izometrikusan izomorf, ha ugyanaz a dimenziójuk. Definíció. Legyen (V,, ) euklideszi vektortér, H V altér. H ortogonális komplementerén a következő H V halmazt értjük: H = { x V y H : x, y = 0 }, azaz minden olyan vektort V -ből, mely az összes H-beli vektorra merőleges. 1.18. Tétel. x H akkor és csakis akkor teljesül, ha x merőleges H tetszőleges bázisának minden vektorára. Bizonyítás: Ha x H, akkor x minden H-beli vektorra merőleges, többek közt egy tetszőleges bázis minden vektorára is. Megfordítva, legyen (e 1,..., e k ) egy bázis H-ban, s teljesüljön, hogy Legyen y H tetszőleges: y = k i=1 α ie i. i : x, e i = 0. k x, y = x, α i e i = i=1 k α i x, e i = 0, i=1 azaz x H. Megjegyzés. Az előző tétel a síkra merőleges egyenes tételének általánosítása. 1.19. Tétel. Egy altér ortogonális komplementere mindig altér, továbbá, ha H V altér, akkor H H = V, H = H. Bizonyítás: Először belátjuk, hogy H altér. A zéróvektor nyilván benne van H -ben, mert a zéróvektor minden vektorra merőleges. Ha x 1, x 2 H, akkor y H : y, x 1 = 0 és y, x 2 = 0 = y, x 1 + y 2 = y, x 1 + y, x 2 = 0, tehát az összegvektor is benne van H -ben. A skalárszorosra hasonlóan: y, x 1 = 0 = y, αx 1 = α y, x 1 = 0. A direktösszeg tulajdonságot úgy látjuk be, hogy ellenőrizzük, H és H egy-egy ortonormált bázisának egyesítése a tér bázisát adja. Legyen tehát (e 1,..., e r ) ortonormált bázis H-ban, f 1,..., f s pedig H -ben. Az egyesített rendszer ortogonális, tehát lineárisan független (ld. 1.12.) Ha nem lenne bázis, akkor egészítsük ki ortonormált bázissá. Legyen e egy a kiegészítő vektorok közül. e e i (i = 1,..., r), tehát e H, ugyanakkor e f i (i = 1..., s) tehát (e, f 1,..., f s ) 11
lineárisan független vektorrendszer lenne H -ben, ami nyilván ellentmondás, mert (f 1,..., f s ) maximális lineárisan független rendszer H -ben. H = H. H H, mert x H és y H: x y. Az, hogy a tartalmazás nem valódi, onnan következik, hogy a dimenziójuk megegyezik: } H H = V = dim H + dim H = dim V H H = V = dim H + dim H = dim H = dim H. = dim V Definíció. Rögzítsük egy V euklideszi vektortér H alterét! Ekkor x V egyértelműen felbomlik x = pr H x + ort H x alakban, ahol pr H x H, ort H x H. A pr H x vektort az x vektor merőleges vetületének nevezzük a H altérre, míg ort H x az x vektor H-ra merőleges komponense. Az ort H x számot az x vektor H altértől való távolságának nevezzük (melyre a d(x, H) jelölést is alkalmazhatjuk). 1.20. Tétel. (Az előző definíció jelöléseivel.) d(x, H) = min{ x y y H }. Bizonyítás: Az egyszerűség kedvéért: pr H x = x. Ekkor ort H x = x x. A Pitagorasz-tételt alkalmazva: x y 2 = (x x ) + (x y) 2 = (x x ) 2 + x y 2 (x x ) 2. 1.4. Lineáris operátorok euklideszi vektorterekben 1.21. Tétel. Legyen (V,, ) euklideszi vektortér, ϕ L(V ; V ) lineáris operátor. Ekkor az L: V V R, L(x, y) = ϕ(x), y ( ) leképezés bilineáris forma. Megfordítva, minden bilineáris formához egyértelműen létezik olyan ϕ L(V ; V ) lineáris operátor, hogy ( ) teljesül. A tételt analóg módon megfogalmazhatjuk a második változóval kapcsolatban. Bizonyítás: Legyen ϕ: V V lineáris operátor, és L(x, y) = ϕ(x), y. L(x 1 + x 2, y) = ϕ(x 1 + x 2 ), y L definíciója = ϕ(x 1 ) + ϕ(x 2 ), y ϕ lineáris = ϕ(x 1 ), y + ϕ(x 2 ), y a skaláris szorzás lineáris = L(x 1, y) + L(x 2, y) L definíciója 12
továbbá L(αx, y) = ϕ(αx), y L definíciója = αϕ(x), y ϕ lineáris = α ϕ(x), y a skaláris szorzás lineáris = αl(x, y) L definíciója. Belátjuk az egyértelműséget. Tegyük fel, hogy egyaránt teljesül. Ez azt jelenti, hogy x, y : ϕ(x), y = L(x, y) és ψ(x), y = L(x, y) x, y ϕ(x), y = ψ(x), y = (ϕ ψ)(x), y = 0. Rögzített x mellett ez előbbi egyenlőség minden y-ra teljesül, azaz x : (ϕ ψ)(x) = 0 = ϕ = ψ. A létezés bizonyítása maradt hátra. Rögzítsünk egy (e 1,..., e n ) ortonormált bázist! Ebben a bázisban L mátrixa legyen (m ij ) M n n. ψ-t értelmezzük úgy, hogy ϕ(e i ) = m ik e k. k=1 (Azaz ψ mátrixa L mátrixának transzponáltja.) A lineáris kiterjesztés tétele szerint így valóban meghatároztunk egy lineáris operátort. Ellenőrizni kell a ( ) tulajdonság teljesülését. Mivel ( ) mindkét oldalán bilineáris forma van, elegendő azt bebizonyítani, hogy az előbb rögzített ortonormált bázison ugyanazokat az értékeket veszik fel. ϕ(e i ), e j = = m ik e k, e j k=1 m ik e k, e j e k, e j csak k = j-re ad 0-tól különböző értéket, nevezetesen 1-et: k=1 = m ij. Megjegyezzük, hogy ha az L(x, y) = x, ϕ(y) feltétellel keresünk lineáris operátort, akkor az előző bizonyításrész úgy módosul, hogy ϕ konstrukciójakor L mátrixát használjuk (nem pedig a transzponáltat). 13
Definíció. Egy euklideszi vektortér ϕ lineáris operátorának adjungáltja az a ϕ -gal jelölt lineáris operátor, melyre x, y : ϕ(x), y = x, ϕ (y). 1.22. Tétel. Egy euklideszi vektortér minden lineáris operátorának egyértelműen létezik adjungáltja. Bizonyítás: Legyen ϕ lineáris operátor, ekkor ϕ(x), y = L(x, y) bilineáris forma, ehhez egyértelműen létezik olyan ψ lineáris operátor, hogy L(x, y) = x, ψ(y). ψ lesz az ϕ operátor adjungáltja. 1.23. Tétel. Ortonormált bázisban az operátor mátrixa és az adjungált operátor mátrixa egymás transzponáltja. Bizonyítás: L(x, y) = ϕ(x), y = x, ϕ (y). Tetszőleges ortonormált bázisban ϕ mátrixa L mátrixának transzponáltja, ϕ mátrixa pedig megegyezik L mátrixával. 1.24. Tétel. Az adjungálásra teljesülnek az alábbi tulajdonságok: (ϕψ) = ψ ϕ (ϕ ) = ϕ (ϕ + ψ) = ϕ + ψ (λϕ) = λϕ (λ id) = id. Bizonyítás: Valamennyi tulajdonság a definíció szerint egyszerűen ellenőrizhető. Pl. az első tulajdonság: (ϕψ)(x), y = ϕ(ψ(x)), y = ψ(x), ϕ (y) = x, ψ (ϕ (y)) = x, (ψ ϕ )(y). Másik lehetőség a bizonyításra az, hogy minden tulajdonságot visszavezethetünk a mátrixok transzponálásának megfelelő tulajdonságára, ugyanis az előzőek szerint a lineáris transzformációk adjungálásának a mátrixok transzponálása felel meg. Definíció. Egy lineáris operátort önadjungáltnak nevezünk, ha megegyezik az adjungáltjával. 1.25. Tétel. Egy lineáris operátor akkor és csakis akkor önadjungált, ha tetszőleges ortonormált bázisban a mátrixa szimmetrikus. Definíció. Egy euklideszi vektortér egy lineáris operátorát ortogonális operátornak nevezzük, ha adjungáltja megegyezik az inverzével. 1.26. Tétel. Egy euklideszi vektortér lineáris operátora akkor és csakis akkor ortogonális, ha tetszőleges ortonormált bázisra vonatkozó mátrixa egymásra merőleges, egységnyi hosszú oszlopvektorokból (ill. sorvektorokból) áll. Az ilyen mátrixot ortogonális mátrixnak nevezzük. 14
Bizonyítás: A ϕ operátor akkor és csakis akkor ortogonális, ha ϕϕ = id, ϕ ϕ = id. Ortonormált bázis rögzítése után ϕ mátrixát jelölje U, ϕ mátrixa ekkor U t. A fenti első összefüggés pedig azzal ekvivalens, hogy UU t = I, amiből a mátrixszorzás definícióját felhasználva adódik az oszlopokra vonatkozó állítás. (U t oszlopai megegyeznek U soraival!) A sorokra az állítás az U t U = I összefüggést felhasználva jön ki. 1.27. Tétel. Ortogonális mátrix inverze megegyezik a transzponáltjával. Bizonyítás: Ld. az előző bizonyítást. 1.28. Tétel. Legyen V euklideszi vektortér, ϕ τ V. A következő állítások ekvivalensek: 1. ϕ ortogonális; 2. ϕ megtartja a skaláris szorzatot, azaz x, y V : ϕ(x), ϕ(y) = x, y ; 3. ϕ megtartja a vektorok hosszát: x V : ϕ(x) = x ; 4. ϕ megtartja a távolságot: x, y V : d(ϕ(x), ϕ(y)) = d(x, y); 5. tetszőleges ortonormált bázis képe ortonormált bázis. Bizonyítás: 1 2 Először teljesüljön, hogy ϕ ϕ = id. Ekkor ϕ(x), ϕ(y) = x, ϕ ϕ(y) = x, y. Megfordítva, ha ϕ megtartja a skaláris szorzatot, azaz ϕ(x), ϕ(y) = x, y, akkor ϕ ϕ(x), y = x, y ϕ ϕ(x), y = id(x), y, 15
amiből következik, hogy x, y V : (ϕ ϕ id)(x), y = 0, vagyis ϕ ϕ = id. 2 3 2 = 3 nyilvánvaló, a norma definíciója miatt: Megfordítva, könnyen ellenőrizhető, hogy: ϕ(x) = ϕ(x), ϕ(x) = x, x = x. x, y = 1 2 ( x + y 2 x 2 y 2), azaz a skaláris szorzat a normából kifejezhető. 3 4 Következik onnan, hogy a norma és távolság egymásból kölcsönösen kifejezhetők: d(x, y) = x y, x = d(x, 0). 2 = 5 A skaláris szorzat tartásból következik, hogy ortonormált vektorrendszer képe ortonormált vektorrendszer, hisz a hossz és a merőlegesség megmarad. 5 = 2 Legyen x = n i=1 x ie i, y = n i=1 y ie i, ahol (e 1,..., e n ) ortonormált bázis. Ekkor ϕ(x) = n i=1 x iϕ(e i ) és ϕ(y) = n i=1 y iϕ(e i ) is teljesül. Mivel (ϕ(e 1 ),..., ϕ(e n )) is ortonormált bázis: x, y = x i y i ϕ(x), ϕ(y) = i=1 x i y i. i=1 Az előző tétel közvetlen következménye az alábbi: 1.29. Tétel. Ha egy báziscsere olyan, hogy mind a régi, mind az új bázis ortonormált, akkor a báziscsere mátrixa ortogonális. Bizonyítás: Legyen (e 1,..., e n ) a régi bázis, (f 1,..., f n ) az új bázis. Értelmezzük a ϕ lineáris transzformációt a lineáris kiterjesztés tétele alapján a ϕ(e i ) = f i relációval. ϕ ortonormált bázist ortomormált bázisba visz át, ezért ortogonális operátor. ϕ mátrixa az (e 1,..., e n ) bázisra vonatkozóan megegyezik a báziscsere mátrixával: f i = ϕ(e i ) = s ji e j. j=1 Azt már tudjuk, hogy ortogonális operátor mátrixa ortonormált bázisban ortogonális mátrix. 16
2. fejezet Lineáris transzformációk szerkezete A fejezet fő problémája a következő: Egy lineáris operátorhoz keresünk olyan bázist, melyben a mátrixa egyszerű. Egyszerű mátrixnak számít, ha elég sok zérus van benne, pl. a mátrix diagonális, vagy trianguláris. (Majd később látjuk, a diagonális mátrix általában nem érhető el, de komplex vektorterekben az elérhető, hogy zérustól különböző elem legfeljebb a fődiagonálisban, vagy közvetlenül alatta szerepeljen.) A következőekben ismét általánosan, F feletti vektorterekről lesz szó, ahol F = R vagy C. 2.1. Invariáns altér, sajátvektor, sajátérték Definíció. Egy V vektortér H alterét az ϕ: V V lineáris operátor invariáns alterének nevezzük, ha x H : ϕ(x) H. Az x V nem zéró vektort az ϕ lineáris operátor sajátvektorának nevezzük, ha λ F, hogy ϕ(x) = λ x. λ-t ilyenkor az x sajátvektorhoz tartozó sajátértéknek nevezzük. Példa. V és {0} minden lineáris operátornak invariáns altere. Ezeket triviális invariáns altereknek nevezzük. Példa. Egy sajátvektor által generált altér mindig invariáns. (Ellenőrizzük!) Példa. Lineáris operátor képtere és magtere invariáns altér. (Ellenőrizzük!) Példa. Tekintsük R 2 origó körüli elforgatását. Egyszerű geometriai megfontolás mutatja, hogy ha az elforgatás nem identitás, vagy középpontos tükrözés, akkor nincs valódi (azaz egy dimenziós) invariáns altere. A középpontos tükrözésnek minden egy dimenziós altér invariáns altere lesz. R 3 -ban tekintsünk egy tengely körüli elforgatást, a tengely illeszkedjen az origóra. A tengely egy dimenziós, az origóra illeszkedő, s a tengelyre merőleges sík két dimenziós invariáns altér. 17
A fejezet kérdésfelvetése (mi az a legegyszerűbb mátrix, amihez egy mátrix hasonló) szempontjából a legegyszerűbb szituáció az, amikor a mátrix egy diagonális mátrixhoz hasonló: 2.1. Tétel. Egy lineáris operátor akkor és csakis akkor diagonalizálható, ha van a térben a sajátvektoraiból álló bázis. Bizonyítás: Legyen először (a 1,..., a n ) a ϕ lineáris operátor sajátvektoraiból álló bázis. Ekkor ϕ(a i ) = λ i a i, ahol λ i a ϕ megfelelő sajátértéke. Ez azt jelenti, hogy ϕ mátrixának i-edik oszlopa i (0,..., λ i,..., 0) t, azaz az i-edik oszlopban csak az i-edik elem lehet zérustól különböző. Megfordítva, ha van olyan bázis, amelyben az operátor mátrixa diagonális, akkor az a bázis sajátvektorokból áll. Valóban, legyen (e 1,..., e n ) a szóban forgó bázis, melyben az operátor mátrixa λ 1 0... 0 0 λ 2... 0.... 0 0... λ n A lineáris operátor mátrixának képzési szabálya szerint ekkor fennáll, hogy tehát e i a λ i sajátértékhez tartozó sajátvektor. ϕ(e i ) = λ i e i, 2.2. Tétel. Legyen λ a ϕ: V V lineáris operátor sajátértéke! Az L λ = { v V ϕ(v) = λv } halmaz a ϕ operátor invariáns altere, melyet a λ sajátértékhez tartozó sajátaltérnek nevezünk. Úgy is fogalmazhatunk, hogy egy lineáris operátor egy sajátértékéhez tartozó sajátvektorai a nullvektorral kiegészítve alteret alkotnak, mely altér invariáns. Bizonyítás: Először belátjuk, hogy L λ altér. A zérusvektor triviálisan kielégíti a ϕ(0) = λ0 összefüggést, tehát a halmaz nem üres. Legyen x, y L λ, azaz ϕ(x) = λx, ϕ(y) = λy. Ekkor: továbbá α F-re: ϕ(x + y) = ϕ(x) + ϕ(y) = λx + λy = λ(x + y), ϕ(αx) = αϕ(x) = αλx = λ(αx). Belátjuk, hogy L λ invariáns altér. Teljesüljön, hogy x L λ, azaz ϕ(x) = λx. Be kell látni, hogy ϕ(x) szintén benne van L λ -ban. ez pontosan a bizonyítandó állítást jelenti. ϕ(ϕ(x)) = ϕ(λx) = λϕ(x), 18
Definíció. A L λ altér dimenzióját a λ sajátérték geometriai multiplicitásának nevezzük. 2.3. Tétel. Az ϕ: V V lineáris operátor különböző sajátértékekhez tartozó sajátvektorai lineárisan függetlenek. Bizonyítás: Legyenek λ 1,..., λ k különböző sajátértékek, a 1,..., a k hozzájuk tartozó egy-egy sajátvektor, azaz ϕ(a i ) = λ i a i (i = 1,..., k). A bizonyítást a sajátértékek száma szerinti teljes indukcióval végezzük el. k = 1-re az állítás nyilván teljesül, mert egy nem zérusvektor önmagában mindig lineárisan független vektorrendszert alkot. Tegyük fel, hogy n = k 1-re az állítás igaz, azaz a 1,..., a k 1 lineárisan függetlenek. Állítsuk elő a zérusvektort az a 1,..., a k vektorok lineáris kombinációjaként: µ 1 a 1 + + µ k 1 a k 1 + µ k a k = 0. ( ) Alkalmazzuk ( ) mindkét oldalára a ϕ lineáris operátort! A linearitás miatt: Használjuk fel, hogy ϕ(a i ) = λ i a i : µ 1 ϕ(a 1 ) + + µ k 1 ϕ(a k 1 ) + µ k ϕ(a k ) = 0. Most ( ) mindkét oldalát szorozzuk meg λ k -val! Végezetül vonjuk ki ( )-ból ( )-ot: µ 1 λ 1 a 1 + + µ k 1 λ k 1 a k 1 + µ k λ k a k = 0. ( ) µ 1 λ k a 1 + + µ k 1 λ k a k 1 + µ k λ k a k = 0. ( ) µ 1 (λ 1 λ k )a 1 + + µ k 1 (λ k 1 λ k )a k 1 + µ k (λ k λ k )a } {{ } k = 0. 0 Mivel a 1,..., a k 1 lineárisan függetlenek, ezért ez utóbbi összefüggésben valamennyi együttható zérus: µ 1 (λ 1 λ k ) = 0,..., µ k 1 (λ k 1 λ k ) = 0. Mivel λ i λ k 0 (i = 1,..., k 1), ezért µ 1 =... = µ k 1 = 0. Ezeket az értékeket ( )-ba visszahelyettesítve µ k a k = 0 következik, azaz a k 0 miatt µ k = 0 is. Ez azt jelenti, hogy a ( ) lineáris kombinációban minden együttható 0. Következmény. Egy n dimenziós vektortér egy lineáris operátorának legfeljebb n különböző sajátértéke van. Ha pontosan n (különböző) sajátérték van, akkor létezik a térben az operátor sajátvektoraiból álló bázis, s ebben a bázisban az operátor mátrixa diagonális, a főátlóban pedig az operátor sajátértékei állnak. Bizonyítás: Az állítás első része onnan következik, hogy egy n dimenziós vektortérben bármely lineárisan független vektorrendszer legfeljebb n tagú, márpedig az előző tétel miatt a különböző sajátértékekhez tartozó sajátvektorok lineárisan függetlenek. Az állítás második része a 2.1.-ből következik. Világos, hogy ez az állítás nem megfordítható, tehát lehet a mátrix diagonális, ebből még nem következik, hogy a sajátértékek különbözők. Gondoljunk az identikus operátorra, illetve az egységmátrixra. 19
2.2. A karakterisztikus polinom 2.4. Tétel. Jelölje az n n-es egységmátrixot I! Az F test feletti n dimenziós vektortér ϕ lineáris operátorának mátrixát valamely rögzített bázisra vonatkozóan jelölje M! ϕ sajátértékei pontosan a det(m λi) = 0 ( ) (λ-ra felírt) egyenlet megoldásai az F testben. Az előbbi egyenletet a ϕ karakterisztikus egyenletének illetve az M mátrix karakterisztikus egyenletének nevezzük. Bizonyítás: A λ F skalár akkor és csakis akkor sajátérték, ha létezik olyan x 0 vektor, hogy ϕ(x) = λx. Jelölje id a vektortér identikus operátorát! Ekkor: ϕ(x) = λx ϕ(x) = (λ id)(x) (ϕ λ id)(x) = 0. Tehát λ F akkor és csakis akkor sajátérték, ha létezik olyan nem nulla vektor, hogy (ϕ λ id)(x) = 0. Bázis rögzítése után ez a feltétel azt jelenti, hogy az (M λi)x = 0 homogén lineáris egyenletrendszernek van triviálistól különböző megoldása. (Az x vektor adott bázisra vonatkozó koordinátáit az X oszlopvektor jelöli.) A triviálistól különböző megoldás létezésének szükséges és elégséges feltétele, hogy az M λi mátrix rangja kisebb legyen mint n, a vektortér dimenziója, azaz a mátrix determinánsa 0 legyen. (Indokolhatunk a Cramer-szabállyal is: ha a determináns nem nulla, akkor a megoldás egyértelmű, vagyis csak a triviális megoldás van.) 2.5. Tétel. ( ) bal oldalán egy n-edfokú polinom áll, melynek főegyütthatója ( 1) n. Ezt a polinomot a ϕ operátor, vagy az M mátrix karakterisztikus polinomjának nevezzük. Bizonyítás: Az M λi mátrixot a következőképpen írhatjuk fel: m 11 λ m 22 λ. m nn λ A determináns definícióját alkalmazva, tehát a determinánst összegként felírva, az összeg mindegyik tagjában szerepel tényezőként valahány elem a főátlóból, esetleg egy sem. Ez azt jelenti, hogy λ egy n-edfokú polinomját kapjuk, a főegyüttható pedig akkor jelentkezik, amikor valamennyi tényezőt a főátlóból választottuk: (m 11 λ)(m 22 λ) (m nn λ) = ( 1) n λ n +.... 20
2.6. Tétel. Egy lineáris operátor karakterisztikus polinomja független a bázis megválasztásától. Hasonló mátrixok karakterisztikus polinomja megegyezik. Bizonyítás: Azt kell belátni, hogy ha S tetszőleges invertálható mátrix, akkor M és S 1 MS karakterisztikus polinomja megegyezik. det(s 1 MS λi) = det(s 1 MS λs 1 IS) = = det(s 1 (M λi)s) = szorzástétel = det(s 1 ) det(m λi) det(s) = = det(s 1 ) det(s) det(m λi) = det(m λi) } {{ } =det(s 1 S=1) 2.7. Tétel. Egy komplex test feletti vektortér, vagy egy valós test feletti páratlan dimenziós vektortér minden lineáris operátorának van sajátvektora. Bizonyítás: Ha komplex test feletti a vektortér, akkor a karakterisztikus polinom egy komplex együtthatós n-edfokú polinom, s a karakterisztikus egyenlet gyökeit C-ben keressük. Az algebra alaptétele szerint mindig lesz gyök C-ben, tehát mindig van sajátérték. Valós test feletti vektortér esetén a karakterisztikus polinom valós együtthatós n-edfokú polinom, s a karakterisztikus egyenletnek nem biztos, hogy van valós gyöke. Ha azonban a karakterisztikus polinom fokszáma páratlan, akkor van valós gyök, amint azt szintén az algebrából tudjuk. Definíció. Egy sajátérték algebrai multiplicitásán azt értjük, hogy hányszoros multiplicitású gyöke a karakterisztikus egyenletnek. Egy lineáros operátor spektruma a sajátértékek olyan sorozata, melybe minden sajátérték annyiszor szerepel, ahányszoros az algebrai multiplicitása. A spektrum teljes, ha a spektruma n tagú, azaz a tagszám megegyezik a vizsgált vektortér dimenziójával. 2.8. Tétel. Komplex test feletti vektortér bármely lineáris operátorának spektruma teljes, azaz multiplicitásokkal együtt annyi sajátértéke van, amennyi a vektortér dimenziója. Az operátor karakterisztikus egyenlete pedig ahol (λ 1,..., λ n ) az operátor spektruma. (λ λ 1 )(λ λ 2 ) (λ λ n ) = 0, Bizonyítás: Az algebrából tudjuk, hogy egy n-edfokú polinomnak multiplicitásokkal együtt pontosan n gyöke van C-ben, s a polinom a tételben leírt módon bomlik elsőfokú tényezők szorzatára. (Mivel a tételben a karakterisztikus egyenletet írtuk fel, ezért a karakterisztikus polinom a bal oldaltól egy ( 1) n faktorban különbözik!) A következőekben a geometriai és az algebrai multiplicitás összehasonlításával foglalkozunk. Először egy konkrét példán szemléltetjük a két fogalmat. 21
Példa. Tekintsük a deriválást, mint lineáris operátort a komplex együtthatós, legfeljebb (n 1) edfokú polinomok n dimenziós terében! A λ C szám akkor lesz sajátérték, ha valamely nemzéró polinomra p (t) = λp(t). Mivel a deriválás során a fokszám eggyel csökken, ezért ez az összefüggés csak λ = 0-ra és konstans polinomokra teljesülhet. A λ = 0 tehát egyetlen sajátértéke a deriválás operátornak, s mivel a spektrum teljes, ezért az algebrai multiplicitásnak n-nek kell lennie. A λ = 0-hoz tartozó sajátaltér azonban a konstans polinomokból áll, s így a sajátérték geometriai multiplicitása 1. A két fogalom tehát nem egyezik meg. 2.9. Tétel. Egy sajátérték geometriai multiplicitása nem lehet nagyobb az algebrai multiplicitásnál. Bizonyítás: Legyen λ 0 a ϕ operátor sajátértéke, L 0 a hozzá tartozó invariáns altér. Vegyünk fel V -ben úgy egy bázist, hogy egy L 0 -ban felvett (e 1,..., e g ) bázist kiegészítünk a tér bázisává. (e 1,..., e g ) a ϕ operátor sajátvektoraiból áll, és a λ 0 sajátérték geometriai multiplicitása g. Ebben a bázisban ϕ mátrixa λ 0... 0... 0... λ 0, 0 azaz a karakterisztikus polinom: λ 0 λ... 0... 0... λ 0 λ P (λ) = 0. Az első r oszlopból (λ 0 λ)-t kiemelve azt kapjuk, hogy a karakterisztikus polinomra: P (λ) = (λ 0 λ) g P (λ). A karakterisztikus polinomot tehát (λ 0 λ)-nak legalább g-edik hatványa osztja, ami az algebrai multiplicitás definíciója szerint az állításunkat jelenti. 2.10. Tétel. Egy komplex test feletti lineáris operátor akkor és csakis akkor diagonalizálható, ha minden sajátértékének geometriai multiplicitása megegyezik az algebraival. Egy valós test feletti lineáris operátor akkor és csakis akkor diagonalizálható, ha spektruma teljes, továbbá, ha minden sajátértékének geometriai multiplicitása megegyezik az algebraival. 22
Bizonyítás: Tehát annak szükséges és elégséges feltételét keressük, hogy legyen sajátvektorokból álló bázis. Legyen a tér n dimenziós. Az előző tétel szerint legfeljebb annyi lineárisan független sajátvektor lehet, ahány tagú a spektrum. Tehát pontosan n lineárisan független sajátvektor pontosan akkor létezik, ha a spektrum egyrészt teljes, másrészt minden sajátértékhez annyi lineárisan független (hozzá tartozó) sajátvektort tudunk felsorolni, ahányszor a spektrumban előfordul. 2.11. Tétel. (Jordan-féle normálalak.) Egy C feletti vektortérben minden lineáris operátorhoz létezik olyan bázis, melyben az operátor mátrixa a következő alakú: a főátlóban az operátor (λ 1,..., λ k ) sajátértékei szerepelnek, közvetlenül a főátló alatt 1 vagy nulla szerepel, minden más mátrixelem zérus: λ 1 0... 0. 1..... 0 0 1 λ 1 0 0 0 1 λ 1.... λ k 0... 0. 1..... 0 0 1 λ k 0 0 0 1 λ k (Egy sajátérték több blokkban is szerepelhet. Ha egy blokk mérete 1 1, akkor a blokkban nem szerepel egyes.) Megjegyzés. A tételt úgy is fogalmazhatjuk, hogy minden (komplex elemekből álló) négyzetes mátrix hasonló a tételben megadotthoz. Bizonyítás: Nem tárgyaljuk. 2.3. Önadjungált transzformációk szerkezete Ebben a paragrafusban kiindulópontunk egy (V,, ) euklideszi vektortér, tehát a vektortér R feletti. Tudjuk, ilyenkor egy lineáris operátor sajátértékeiről általában semmit nem tudunk garantálni, a karakterisztikus polinomnak nem biztos, hogy vannak valós gyökei. Az önadjungált operátorok esetében azonban teljesül a diagonalizálhatóság, amint azt a paragrafus fő tétele kimondja. Az alábbi technikai jellegű állítás könnyen ellenőrizhető: Lemma. Értelmezzük a következő C n C n C leképezést: (X, Y ) X, Y = x 1 ȳ 1 + + x n ȳ n, 23
ahol X = (x 1,..., x n ), Y = (y 1,..., y n ). A definiált leképezés mindkét változóban additív, az első változóban (komplex) homogén, X, X = 0 X = 0, továbbá X, λy = λ X, Y. Megjegyzés. A definiált leképezés nem skaláris szorzat, mert nem valós test fölötti vektortérben vagyunk. 2.12. Tétel. R feletti n n-es szimmetrikus mátrix karakterisztikus egyenletének multiplicitásokkal együtt n valós gyöke van. Bizonyítás: Legyen A valós elemekből álló szimmetrikus mátrix. Ekkor az lineáris operátorra könnyen teljesül, hogy L A : C n C n, X L A (X) = A X L A (X), Y = X, L A (Y ) azaz A X, Y = X, A Y. A komplex test feletti téren ható L A lineáris operátor spektruma teljes, azaz multiplicitásokkal együtt n (komplex) sajátértéke van, ezek A karakterisztikus egyenletének gyökei. Jelöljön egy sajátértéket λ! Ekkor egyrészt X C n sajátvektorra : A X, X = λx, X = λ X, X ( ) másrészt ( )-ot és ( )-ot összehasonlítva: azaz λ = λ, tehát λ valós. A X, X = X, A X = X, λx = λ X, X. ( ) (λ λ) X, X = 0, } {{ } 0 2.13. Tétel. (Önadjungált operátorok spektruma.) Legyen adott egy euklideszi téren egy ϕ önadjungált lineáris operátor! Ekkor ϕ spektruma teljes, továbbá létezik a térben ϕ sajátvektoraiból álló ortonormált bázis. Ebben a bázisban ϕ mátrixa diagonális, a főátlóban ϕ sajátértékei állnak. Bizonyítás: A lemma alapján tudjuk, hogy a ϕ operátor karakterisztikus egyenletének multiplicitásokkal együtt n valós gyöke van, hiszen ortonormált bázisban ϕ mátrixa szimmetrikus. A sajátvektorokból álló ortonormált bázis létezését kell bizonyítani. A bizonyítás az euklideszi tér dimenziója szerinti teljes indukció. 1 dimenziós térben 1 sajátérték van, s az ehhez tartozó tetszőleges sajátvektor a tér kívánt bázisa. Tegyük fel, hogy az állítás igaz minden n 1 24
dimenziós euklideszi térre. Bebizonyítjuk, hogy n dimenziósra is igaz. Legyen tehát dim V = n, ϕ: V V önadjungált lineáris operátor. A lemma miatt tudjuk, hogy létezik sajátvektor, jelölje ezt v. Legyen H = L(v), azaz H a v sajátvektor által generált 1 dimenziós altér. Jelölje ennek ortogonális komplementerét H. H -ről azt állítjuk, hogy invariáns altere a ϕ operátornak. Valóban, legyen x H. Ez azt jelenti, hogy x merőleges v-re: x, v = 0. Be kell látni, hogy ϕ(x) is merőleges v-re: ϕ(x), v = x, ϕ(v) ϕ önadjungált = x, λv v sajátvektor = λ x, v = 0 linearitás H invariáns tulajdonsága azt jelenti, hogy ϕ leszűkíthető H -re, tehát a leszűkítés egy n 1 dimenziós téren ható önadjungált operátor. Erre az indukciós feltevés miatt igaz, hogy létezik benne a ϕ sajátvektoraiból álló ortonormált bázis. Ezt kiegészítve v -vel a tér kívánt ortonormált bázisát v kapjuk. Az előző tétel fontos következménye, hogy a diagonális mátrix nemcsak önadjungált operátoroknál, hanem kvadratikus formáknál is elérhető. 2.14. Tétel. (Kvadratikus formák főtengelytranszformációja.) Egy n dimenziós euklideszi téren értelmezett Q kvadratikus forma esetén létezik a térnek olyan ortonormált bázisa, hogy ebben Q mátrixa diagonális. Bizonyítás: Legyen Q poláris formája az L szimmetrikus bilineáris forma. Tudjuk (1.21.), hogy L-hez létezik olyan ϕ lineáris operátor, hogy L(x, y) = ϕ(x), y. Mivel L szimmetrikus, ezért ortonormált bázisra vonatkozó mátrixa szimmetrikus, mátrixa transzponáltja pedig megegyezik ϕ mátrixával (a rögzített ortonormált bázisban). Mindez azt jelenti, hogy ϕ mátrixa ortonormált bázisban szimmetrikus, tehát ϕ önadjungált. Tehát létezik olyan ϕ önadjungált operátor, hogy x V : Q(x) = ϕ(x), x. Legyen (e 1,..., e n ) a ϕ sajátvektoraiból álló ortonormált bázis. Kvadratikus forma (adott bázisra vonatkozó) mátrixa megegyezik a poláris formájának mátrixával. Ennek i-edik sora j-edik eleme: L(e i, e j ) = ϕ(e i ), e j = λ i e i, e j = λ i e i, e j, ahol λ i a ϕ megfelelő sajátértéke. e i, e j = { 1, ha i = j 0, ha i j A megadott bázisban tehát Q mátrixa: λ 1 0... 0 0 λ 2... 0..., 0 0... λ n 25
ahol (λ 1,..., λ n ) a ϕ spektruma. Definíció. Azon ortonormált bázis vektorait, melyben egy kvadratikus forma mátrixa diagonális, a kvadratikus forma főtengelyeinek nevezzük. Ha olyan báziscserét hajtunk végre, hogy az új bázis a kvadratikus forma főtengelyeiből áll, akkor ezt a báziscserét főtengelytranszformációnak nevezzük. Az előző tétel közvetlen következménye az alábbi: 2.15. Tétel. (Kvadratikus formák négyzetösszegre transzformálása.) Főtengelyek alkotta ortonormált bázisban teljesül, hogy Q(x) = λ 1 x 2 1 + + λ n x 2 n, ahol (x 1,..., x n ) az x vektor koordinátái, λ 1,..., λ n pedig Q (erre a bázisra vonatkozó) mátrixának sajátértékei. Megjegyezzük, hogy egy kvadratikus forma mátrixa nemcsak ortonormált bázisban lehet diagonális, s a főátlóban álló elemek sincsenek egyértelműen meghatározva, azaz ha két különböző bázisra vonatkozóan a kvadratikus forma mátrixa diagonális, akkor a diagonálisban álló elemek nem biztos, hogy megegyeznek. Ezzel kapcsolatban bizonyítás nélkül mondjuk ki a következő összefüggést: 2.16. Tétel. (Tehetetlenségi tétel.) Kvadratikus formák kétféle négyzetösszegre transzformálásakor a pozitív együtthatók száma mindkét esetben megegyezik. Hasonlóan a negatív együtthatók száma mindkét esetben megegyezik, s végül a zérus együtthatók száma is mindkét esetben megegyezik. 2.4. Ortogonális transzformációk szerkezete 2.17. Tétel. Tetszőleges ortogonális mátrix determinánsa +1 vagy 1. Bizonyítás: Legyen M ortogonális mátrix. Alkalmazzuk a szorzástételt, s azt a tényt, hogy négyzetes mátrix és transzponáltja determinánsa megegyeznek: 1 = det(m M 1 ) = det M det M 1 = (det M) 2. 2.18. Tétel. Ortogonális mátrix karakterisztikus egyenletének gyökei olyan komplex számok, melyek modulusa (abszolút értéke) 1. Bizonyítás: Legyen M ortogonális mátrix! Az L M : C n C n, X L M (X) = M X lineáris operátorról egyszerű számolással látható, hogy X, Y = L M (X), L M (Y ) (= M X, M Y ). 26
Legyen L M, azaz M egy sajátértéke λ. Tehát λ λ = 1. X, X = M X, M X = λx, λx = λ λ X, X, 2.19. Tétel. R 2 tetszőleges ortogonális operátorának mátrixa tetszőleges ortonormált bázisban ( ) cos α sin α, sin α ± cos α ahol a felső előjelek a +1 determinánsú, míg az alsó előjelek a 1 determinánsú operátorra vonatkoznak. A fentebbi mátrix az összes 2 2-es ortogonális mátrixot megadja. Bizonyítás: Foglalkozzunk a +1 determinánsú esettel, a 1 determinánsú eset analóg. Legyen tetszőleges ortonormált bázisban a ϕ ortogonális operátor mátrixa ( ) α β U =. γ δ Mivel U ortogonális, ezért inverze megegyezik a transzponáltjával: ( ) 1 ( ) α β α γ =. ( ) γ δ β δ Másrészt az inverz mátrixot a tanult módon a kofaktorokkal meghatározva: ( ) 1 ( ) α β δ β =. ( ) γ δ γ α ( )-ot és ( )-ot összehasonlítva: α = δ, γ = β, tehát a keresett mátrix: ( ) α β, β α ahol α 2 + β 2 =1 (a mátrix determinánsa 1), tehát létezik olyan α [0, π), hogy α = cos α, β = sin α, ami a bizonyítandó állítást jelenti. 2.20. Tétel. R 2 egy 1 determinánsú ortogonális operátorának spektruma ( 1, +1). Létezik az operátor sajátvektoraiból álló ortonormált bázis, melyben az operátor mátrixa ( ) 1 0, 0 1 vagyis az operátor tengelyes tükrözés. 27
Bizonyítás: A karakterisztikus egyenlet: λ 2 + bλ 1 = 0 (b valamilyen konstans), melynek diszkriminánsa b 2 + 4 > 0, tehát van két (különböző) valós sajátérték. Mivel a sajátértékek abszolút értéke 1, ezért a sajátértékek +1 ill. 1. Azt kell belátni, hogy az ehhez tartozó sajátvektorok ortogonálisak. (Normálással tehát valóban ortonormált bázishoz jutunk.) Legyen az 1 sajátértékhez tartozó egyik sajátvektor e 1, a 1-hez tartozó pedig e 2. tehát e 1, e 2 = 0. e 1, e 2 = ϕ(e 1 ), ϕ(e 2 ) = 1 e 1, 1 e 2 = e 1, e 2, 2.21. Tétel. R 3 +1 determinánsú ortogonális operátorához létezik olyan ortonormált bázis melyben mátrixa: 1 0 0 0 cos α sin α. 0 sin α cos α R 3 1 determinánsú ortogonális operátorához létezik olyan ortonormált bázis melyben mátrixa: 1 0 0 0 cos α sin α. 0 sin α cos α Bizonyítás: Három dimenzióban biztosan van valós sajátérték, s ez (lévén az abszolút értéke +1) +1 vagy 1. Ebből következik, hogy az operátornak van 1 dimenziós invariáns altere, melyet jelöljön H. Egyszerűen látható, hogy H is invariáns altér, melyen tehát az operátor leszűkítése szintén ortogonális operátor. x H : ϕ(y) H, ϕ(x), ϕ(y) = x, y = 0. H -re az előző tételt alkalmazva rövid esetvizsgálat után adódik állításunk. (Esetleg szükség lesz a bázisvektorok sorrendjének megváltoztatására.) 28
3. fejezet Geometriai alkalmazások 3.1. Geometriai transzformációk Geometriai alapfogalmak R n néhány objektumára lineáris algebrai jellegű és geometriai jellegű elnevezések egyaránt használatosak. Definíció. R n egy nulla dimenziós lineáris sokaságát (vagyis R n egy vektorát) R n egy pontjának nevezzük. R n egy egydimenziós lineáris sokaságát R n egyenesének nevezzük. R n egy n 1 dimenziós lineáris sokaságát R n egy hipersíkjának nevezzük. Példa. R hipersíkjai a pontok, R 2 hipersíkjai az egyenesek, R 3 hipersíkjai a kétdimenziós lineáris sokaságok. Példa. Legyenek x y R n pontok! Ekkor a következő halmaz, melyet (x, y) felezőmerőleges hipersíkjának nevezünk, hipersík: { u R n x u = y u }. 3.1. Tétel. Legyenek x, y R n pontok, x y. Ekkor R n minden egyenese felírható l = { tx + (1 t)y t R } alakban. Megfordítva, minden ilyen előállítás R n egy egyenesét adja meg. Bizonyítás: Legyen l = L(v) + y = { y + tv t R } (v 0) egydimenziós lineáris sokaság. Definiáljuk x-et a következőképpen: x = y + v. Ekkor y + tv = y + t(x y) = tx + (1 t)y. Megfordítva, tx + (1 t)y = y + (x y)t. l tehát egy L(x y) irányterű, y eltolóvektorú lineáris sokaság. 29
Definíció. Az (x 1,..., x n+1 ) (x i R n ) pontokat általános helyzetűeknek nevezzük, ha nincsenek benne egyetlen hipersíkban sem. Példa. Jelölje R n természetes bázisát (e 1,..., e n ). (0, e 1,..., e n ) általános helyzetűek. 3.2. Tétel. Legyenek (P 0,..., P n ) általános helyzetű pontok R n -ben. Ekkor (P 1 P 0,..., P n P 0 ) bázis R n -ben. Bizonyítás: Legyen L(P 1 P 0,..., P n P 0 ) jel. = H. Ha H R n, akkor H-t tartalmazza egy H-val jelölt n 1 dimenziós altér. A H + P 0 hipersíkban valamennyi pont benne van, ami ellentmondás. Affin transzformációk Definíció. Az F : R n R n bijektív leképezést affin transzformációnak nevezzük, ha egyenestartó, azaz tetszőleges egyenes képe egyenes. Példa. Jelölje Gl(n) R n bijektív lineáris transzformációinak csoportját. Minden ϕ Gl(n) lineáris leképezés egyben affin transzformáció is. Valóban: ϕ[tx + (1 t)y] = tϕ(x) + (1 t)ϕ(y). Mivel x y és ϕ bijektív, ezért ϕ(x) ϕ(y). Tehát egyenes. ϕ(l) = { tϕ(x) + (1 t)ϕ(y) t R n } Példa. Legyen w R n. Értelmezzük az alábbi leképezést: τ w : R n R n, x τ w (x) = x + w. Legyen l = { x + tv t R } (v 0) egyenes. τ w (x + tv) = x + w + tv, azaz τ w (l) a L(v) irányterű, x + w eltolóvektorú egyenes. A τ w transzformációt w vektorú eltolásnak nevezzük. τ w affin, de w 0-ra τ w / Gl(n), mert τ w (0) = w 0. Példa. Legyen λ 0 valós szám. Értelmezzük a következő leképezést: δ λ : R n R n, x δ λ (x) = λx. Mivel δ λ Gl(n), ezért az első példa szerint affin. δ λ -t λ arányú, origó középpontú homotéciának vagy középpontos hasonlóságnak nevezzük. 3.3. Tétel. (Az affin leképezések főtétele.) Az F : R n R n bijekció akkor és csakis akkor affin leképezés, ha ϕ Gl(n) és w R n, hogy F = τ w ϕ, azaz x R n : F (x) = ϕ(x) + w. 30
Következmény. (R n affin transzformációi.) Legyen F : R n R n affin transzformáció, F (X) jel. = X X R n. Ekkor A M n n invertálható mátrix és v R n vektor, hogy X = AX + v. Ezt a mátrixalakban leírt összefüggést részletesen kiírva pl. két dimenzióban, a következő összefüggést kapjuk. Ha F : R 2 R 2 affin transzformáció, F (x, y) jel. = (x, y ). Ekkor A = (a ij ) M 2 2 invertálható mátrix és (v 1, v 2 ) R 2 számpár, hogy x = a 11 x + a 12 y + v 1 y = a 21 x + a 22 y + v 2, det A = a 11 a 22 a 12 a 21 0. Definíció. Az F : R n R n leképezésnek x R n fixpontja, ha F (x) = x. 3.4. Tétel. (Az affin transzformációk fixponttétele.) Legyen F : R n R n affin, F = τ v ϕ, ahol ϕ Gl(n), v R n. (i) Ha ker(ϕ id R n) = {0}, akkor F -nek egyértelműen létezik fixpontja. (ii) Ha F -nek van n + 1 általános helyzetű fixpontja, akkor F = id R n. Bizonyítás: (i) Legyen ker(ϕ id R n) = {0}. A nullitás+rang tétel szerint ekkor im(ϕ id R n) = R n. Tehát speciálisan F (0)-hoz!x R n : ϕ(x) x = F (0). Ez ekvivalens azzal, hogy F (x) F (0) x = F (0) F (x) = x, azaz x fixpont. Az egyértelműség bizonyítása. Teljesüljön, hogy F (x) = x és F (y) = y. Ez ekvivalens azzal, hogy ϕ(x) + v = x és ϕ(y) + v = y ϕ(x) x = v és ϕ(y) y = v = ϕ(x y) (x y) = 0 = x y ker(ϕ id R n) = {0} x y = 0 x = y. (ii) Legyenek (P 0,..., P n ) az általános helyzetű fixpontok: i {0,..., n} : ϕ(p i ) + v = P i (ϕ id R n)(p i ) = v. A ϕ id R n lineáris transzformáció tehát a (P 1 P 0,..., P n P 0 ) bázis minden vektorán a zéróvektort veszi fel, ezért ez a transzformáció a zérus leképezés, amiből az állításunk nyilvánvalóan következik. 3.5. Tétel. (Az affin transzformációk alaptétele.) Legyenek (P 0, P 1,..., P n ) és (Q 0, Q 1,..., Q n ) általános helyzetű pont (n + 1)-esek. Egyértelműen létezik olyan F : R n R n affin leképezés, melyre teljesül, hogy: i {0,..., n} : F (P i ) = Q i. 31
Bizonyítás: Tudjuk, hogy E = (P 1 P 0,..., P n P 0 ) továbbá E = (Q 1 Q 0,..., Q n Q 0 ) R n egy-egy bázisát alkotják. A lineáris kiterjesztés tétele szerint egyértelműen létezik olyan ϕ Gl(n) lineáris izomorfizmus, hogy ϕ(e) = E. Legyen F = τ Q0 ϕτ P0. Azaz: X R n : F (X) = ϕ(x P 0 ) + Q 0. Egyszerű behelyettesítés mutatja, hogy F rendelkezik a kívánt tulajdonsággal. Az egyértelműséget a következőképpen látjuk be. Legyenek F 1 és F 2 affin transzformációk a kívánt tulajdonsággal. i {0,..., n} : F2 1 F 1 (P i ) = P i, ami a fixponttétel szerint azt jelenti, hogy F 1 2 F 1 = id R n F 1 = F 2. Izometriák Definíció. Az F : R n R n bijektív leképezést izometriának vagy egybevágóságnak nevezzük, ha távolságtartó, azaz x, y R n : d ( F (x), F (y) ) = d(x, y). Példa. R n ortogonális transzformációi egyben R n izometriái is, amint arról már korábban volt szó. Izometria továbbá minden eltolás is: τ v (x) τ v (y) = x + v (y + v) = x y. Példa. Legyen H R n egy hipersíkja. Az x R n pont x -vel jelölt képét definiáljuk a következőképpen. Ha x H, akkor x = x, egyébként x az az egyértelmű pont, melyre (x, x ) felezőmerőleges hipersíkja H. Az így definiált leképezés izometria, melyet a H hipersíkra vonatkozó tükrözésnek nevezzük. 3.6. Tétel. (Az izometriák főtétele.) Egy F : R n R n bijektív leképezés akkor és csakis akkor izometria, ha ϕ Gl(n) ortogonális transzformáció és v R n vektor, hogy F = τ v ϕ, azaz x R n : F (x) = ϕ(x) + v. Bizonyítás: Mivel minden ortogonális transzformáció és eltolás izometria, ezek kompozíciója is az. Legyen most F : R n R n egybevágóság. v-t és ϕ-t a következőképpen konstruáljuk meg. v = F (0), ϕ: R n R n, ϕ(c) = F (x) v. (ϕ-ről pillanatnyilag még nem tudjuk, hogy lineáris leképezés.) Először belátjuk, hogy az előbbiekben megkonstruált ϕ megtartja a skaláris szorzatot. Emlékeztetünk arra, hogy ξ, η R n : ξ, η = ξ 2 + η 2 ξ η 2. 2 32