Lineáris algebra és mátrixok alkalmazása a numerikus analízisben



Hasonló dokumentumok
Lineáris Algebra gyakorlatok

MATEMATIKA FELADATGYŰJTEMÉNY

Fejezetek a lineáris algebrából PTE-PMMK, Műszaki Informatika Bsc. Dr. Kersner Róbert

BUDAPESTI KÖZGAZDASÁGTUDOMÁNYI EGYETEM. Puskás Csaba, Szabó Imre, Tallos Péter LINEÁRIS ALGEBRA JEGYZET

Miskolci Egyetem. Diszkrét matek I. Vizsga-jegyzet. Hegedűs Ádám Imre

Bevezetés a számításelméletbe I. feladatgyűjtemény. Szeszlér Dávid, Wiener Gábor

A lineáris tér. Készítette: Dr. Ábrahám István

NUMERIKUS MÓDSZEREK FARAGÓ ISTVÁN HORVÁTH RÓBERT. Ismertető Tartalomjegyzék Pályázati támogatás Gondozó

Mátrixok. 3. fejezet Bevezetés: műveletek táblázatokkal

Áttekintés a felhasznált lineáris algebrai ismeretekről.

Lineáris algebra I. Kovács Zoltán. Előadásvázlat (2006. február 22.)

Vektortér. A vektortér elemeit vektornak, a test elemeit skalárnak nevezzük. Ezért a függvény neve skalárral való szorzás (nem művelet).

Sztojka Miroszláv LINEÁRIS ALGEBRA Egyetemi jegyzet Ungvár 2013

KOVÁCS BÉLA, MATEMATIKA I.

Gráfelmélet/Diszkrét Matematika MSc hallgatók számára. Párosítások

Széchenyi István Egyetem, 2005

JANUS PANNONIUS TUDOMÁNYEGYETEM. Schipp Ferenc ANALÍZIS I. Sorozatok és sorok

ÉS TESZTEK A DEFINITSÉG

Parciális differenciálegyenletek numerikus módszerei számítógépes alkalmazásokkal Karátson, János Horváth, Róbert Izsák, Ferenc

Lineáris programozás. Modellalkotás Grafikus megoldás Feladattípusok Szimplex módszer

Lineáris algebra - jegyzet. Kupán Pál

Color profile: Generic CMYK printer profile Composite 150 lpi at 45 degrees

Differenciálegyenletek a hétköznapokban

Matematikai alapismeretek. Huszti Andrea

Teszt kérdések. Az R n vektortér

2) = 0 ahol x 1 és x 2 az ax 2 + bx + c = 0 ( a,b, c R és a 0 )

Miskolci Egyetem GÉPÉSZMÉRNÖKI ÉS INFORMATIKAI KAR. Analízis I. példatár. (kidolgozott megoldásokkal) elektronikus feladatgyűjtemény

1.1. Gyökök és hatványozás Hatványozás Gyökök Azonosságok Egyenlőtlenségek... 3

KOVÁCS BÉLA, MATEMATIKA I.

Mátrixaritmetika. Tartalom:

KOVÁCS BÉLA, MATEMATIKA I.

Diszkrét matematika I., 12. előadás Dr. Takách Géza NyME FMK Informatikai Intézet takach november 30.

5. Előadás. Megyesi László: Lineáris algebra, oldal. 5. előadás Lineáris függetlenség

Ismerkedés az Abel-csoportokkal

Lineáris Algebra GEMAN 203-B. A három dimenziós tér vektorai, egyenesei, síkjai

A kvantummechanika általános formalizmusa

MATEMATIKA JAVÍTÁSI-ÉRTÉKELÉSI ÚTMUTATÓ

LÁNG CSABÁNÉ SZÁMELMÉLET. Példák és feladatok. ELTE IK Budapest javított kiadás

Juhász Tibor. Lineáris algebra

KOVÁCS BÉLA, MATEMATIKA I.

Brückler Zita Flóra. Lineáris rendszerek integrálása

Matematikai logika 1 A MATEMATIKAI LOGIKA ALAPJAI. Pécsi Tudományegyetem, Bevezetés

MATEMATIKA ÍRÁSBELI ÉRETTSÉGI-FELVÉTELI FELADATOK május 19. du. JAVÍTÁSI ÚTMUTATÓ

Lineáris algebrai módszerek a kombinatorikában

Fejezetek az abszolút geometriából 6. Merőleges és párhuzamos egyenesek

Komputer statisztika gyakorlatok

GAZDASÁGMATEMATIKA KÖZÉPHALADÓ SZINTEN

Számítástudomány matematikai alapjai segédlet táv és levelező

4. előadás. Vektorok

Lineáris algebra bevezető

Brósch Zoltán (Debreceni Egyetem Kossuth Lajos Gyakorló Gimnáziuma) Számelmélet I.

Elsôfokú egyenletek, egyenletrendszerek, egyenlôtlenségek

MATEMATIKA Kiss Árpád Országos Közoktatási Szolgáltató Intézmény Vizsgafejlesztő Központ

15. LINEÁRIS EGYENLETRENDSZEREK

MATEMATIKA JAVÍTÁSI-ÉRTÉKELÉSI ÚTMUTATÓ

Csődvalószínűségek becslése a biztosításban

Számelméleti feladatok az általános iskolai versenyek tükrében dr. Pintér Ferenc, Nagykanizsa

Vektorok, mátrixok, lineáris egyenletrendszerek

Szeminárium-Rekurziók

Az áprilisi vizsga anyaga a fekete betűkkel írott szöveg! A zölddel írott rész az érettségi vizsgáig még megtanulandó anyag!

Dualitás Dualitási tételek Általános LP feladat Komplementáris lazaság 2015/ Szegedi Tudományegyetem Informatikai Tanszékcsoport

Intergrált Intenzív Matematika Érettségi

A gyakorlatok HF-inak megoldása Az 1. gyakorlat HF-inak megoldása. 1. Tagadások:

Analízisfeladat-gyűjtemény IV.

2. Interpolációs görbetervezés

86 MAM112M előadásjegyzet, 2008/2009

Számsorozatok Sorozat fogalma, példák sorozatokra, rekurzív sorozatokra, sorozat megadása Számtani sorozat Mértani sorozat Kamatszámítás

Diszkrét Matematika I.

LINEÁRIS ALGEBRA PÉLDATÁR MÉRNÖK INFORMATIKUSOKNAK

A lineáris programozás 1 A geometriai megoldás

2. Halmazelmélet (megoldások)

Vektorterek. =a gyakorlatokon megoldásra ajánlott

MATEMATIKA 9. osztály Segédanyag 4 óra/hét

Első sorozat (2000. május 22. du.) 1. Oldjamegavalós számok halmazán a. cos x + sin2 x cos x. +sinx +sin2x =

Relációs algebra áttekintés és egy táblára vonatkozó lekérdezések

Analízis előadás és gyakorlat vázlat

8. Mohó algoritmusok Egy esemény-kiválasztási probléma. Az esemény-kiválasztási probléma optimális részproblémák szerkezete

Természetes számok: a legegyszerűbb halmazok elemeinek. halmazokat alkothatunk, ezek elemszámai természetes 3+2=5

22. szakkör (Csoportelméleti alapfogalmak 1.)

Három dimenziós barlangtérkép elkészítésének matematikai problémái

MATEMATIKA ÉRETTSÉGI május 9. EMELT SZINT

Valószínűségszámítás és statisztika. István Fazekas

Tartalomjegyzék. Typotex Kiadó III. Tartalomjegyzék

Bevezetés a játékelméletbe Kétszemélyes zérusösszegű mátrixjáték, optimális stratégia

Természettudományi Kar. Kornis Kristóf. Matematika BSc Matematikus szakirány. Szakdolgozat. Témavezető: Arató Miklós egyetemi docens. Budapest, 2014.

MATEMATIKA TANTERV Bevezetés Összesen: 432 óra Célok és feladatok

MATEMATIKA JAVÍTÁSI-ÉRTÉKELÉSI ÚTMUTATÓ

1. zárthelyi,

Egyetemi matematika az iskolában

5. gyakorlat. Lineáris leképezések. Tekintsük azt a valós függvényt, amely minden számhoz hozzárendeli az ötszörösét!

Numerikus módszerek 1.

A TERMELÉSI FOLYAMATOK HATÉKONY ÉS OPTIMÁLIS IRÁNYÍTÁSA A KOMPLEX MÓDSZER ALKALMAZÁSÁVAL

Alkalmazott modul: Programozás

9. ÉVFOLYAM. Tájékozottság a racionális számkörben. Az azonosságok ismerete és alkalmazásuk. Számok abszolútértéke, normál alakja.

Analízis lépésről - lépésre

p j p l = m ( p j ) 1

JANUS PANNONIUS TUDOMÁNYEGYETEM. Schipp Ferenc ANALÍZIS II. ***************

II. Halmazok. Relációk. II.1. Rövid halmazelmélet. A halmaz megadása. { } { } { } { }

MATEMATIKA tankönyvcsaládunkat

MATEMATIKA I. RÉSZLETES ÉRETTSÉGI VIZSGAKÖVETELMÉNY A) KOMPETENCIÁK

Átírás:

Eötvös Loránd Tudományegyetem Természettudományi kar Lineáris algebra és mátrixok alkalmazása a numerikus analízisben Szakdolgozat Készítette: Borostyán Dóra Matematika BSc matematikai elemző Témavezető: Fialowski Alice egyetemi docens Algebra és Számelmélet Tanszék Budapest 23

Tartalomjegyzék Bevezetés... 4. Előismeretek... 9.. Mátrixok... 9.2. Lineáris egyenletrendszerek megoldhatósága... 4 2. Direkt módszerek... 5 2.. Gauss-elimináció... 5 2.2. LU-felbontás... 7 2.3. Cholesky-felbontás... 2 3. Legkisebb négyzetek módszere... 22 3.. Főbb eredmények... 23 4. Iterációs módszerek... 27 4.. Jacobi-iteráció... 28 4.2. Gauss-Seidel-iteráció... 3 4.3. Richardson-iteráció... 33 Összefoglalás... 36 Köszönetnyilvánítás... 37 Irodalomjegyzék... 38 Nyilatkozat... 39 3

Bevezetés Szakdolgozatom témája a lineáris algebra alkalmazása a numerikus analízisben. Bármennyire is idegennek hangzik, ez a témakör jelen van a hétköznapi életünkben több területen is, mint gondolnánk. Fizika, mechanika, kémia, építészet, pénzügy és közgazdaságtan területein előforduló problémákra is alkalmazzuk a lineáris algebrai egyenletrendszerek felírását. Ez a problémamegoldás magában foglalja a mátrixok alkalmazását is, hiszen az egyenletrendszereket mátrixok formájában is felírhatjuk. A lineáris egyenletrendszerek megoldásán kívül a másik fő mátrixszámítási művelet a mátrix sajátértékeinek és sajátvektorainak meghatározása. Motivációnak szeretnék ezekre a módszerekre két mindennapjainkban is előforduló modellre példát mutatni. (A példák és ábráik a 3 -ból származnak.) Elsőként egy fizikai példa: Egy mechanikai rendszer rezgései Egy mátrix sajátértékeinek és sajátvektorainak kiszámítása alapvető matematikai segédeszköz egy mechanikai szerkezet rezgéseinek tanulmányozásához. Ebben az esetben a sajátértékek a frekvencia négyzetes értékei, a sajátvektorok pedig a rendszer rezgésmódjai. Vegyük például egy épület rezgési frekvenciájának kiszámítását, amely fontos szerepet játszik abban, hogy meghatározzuk az épület szilárdságát egy földrengés esetén. Az egyszerűség kedvéért ezt most egy egyszerűbb modellen vizsgáljuk meg, de a módszer ugyanez bonyolultabb modellekre is. Tekintsünk egy kétemeletes épületet (földszint + két emelet), amelynek a merev mennyezeteinek tömegeit m, m 2, m 3 -mal jelöljük. A falaknak elhanyagolható a tömege, de a rugalmasságuk egy rugóval van modellezve, amelynek a rugóállandói k, k 2, k 3 (minél nagyobb k i, annál szilárdabb a fal). A mennyezet vízszintes elmozdulását y, y 2, y 3 -mal jelöljük, az épület alapja pedig földhöz rögzített. Másképpen, ez a kétemeletes épület egy olyan rendszert határoz meg, melyben a 3 tömeg rugókkal kapcsolódik egy fix talpazathoz. 4

Ez az alábbi ábrán is látható. A mechanika törvényeiből tudjuk, hogy a tömeg és a gyorsulás szorzata egyenlő az alkalmazott erők összegével. Az itt használt erők a rugók általi visszaható erők (kötélerők). Ezek egyenlők a rugó merevségének és nyúlásának szorzatával. Az y, y 2, y 3 irányú elmozdulások a t idő függvényei. Ezek első deriváltjai, y, y 2, y 3, jelölik a sebességeket, és a második deriváltak, y, y 2, y 3, pedig az m, m 2, m 3 súlyok gyorsulásait. Így az alábbi 3 egyenletet kapjuk: amit mátrix formájában értelmezünk: ahol y = y y 2, M = y 3 m y + k y + k 2 y y 2 =, m 2 y 2 + k 2 y 2 y + k 3 y 2 y 3 =, m 3 y 3 + k 3 y 3 y 2 =, () My + Ky =, (2) m m 2, K = m 3 k + k 2 k 2 k 2 k 2 + k 3 k 3. k 3 k 3 Az M mátrix a tömegmátrix, a K mátrix pedig a merevség mátrix. Mindkét mátrix szimmetrikus. Az () egyenletrendszer azon pontos megoldásait keressük, amelyek időben periodikusak, hogy ábrázolni tudjuk majd a rendszer rezgéseit. Ezért a következő helyettesítést végezzük: y t = y e iωt, 5

ahol i a képzetes egység, és ω a megoldás rezgési frekvenciája. Egyszerű számítás után megkapjuk, hogy ebben az esetben a gyorsulás y t = ω 2 y(t), és ez leegyszerűsíthető a (2) felírás szerint a következőre: Ky = ω 2 My. (3) Ha az összes súly -gyel egyenlő, akkor M az egységmátrix, és (3) egy szokásos sajátérték probléma a K mátrixra, azaz y a K ω 2 sajátértékhez tartozó sajátvektora. Ha a súlyok bármilyen értéket felvehetnek, akkor (3) egy általánosított sajátérték probléma, azaz ω 2 az M /2 KM /2 mátrix sajátértéke. Természetesen, ha egy n-emeletes épületet tekintünk, akkor egy ugyanilyen mátrix problémát kapnánk, csak n + -es méretben. Az M mátrix mindig diagonális, a K pedig mindig tridiagonális lesz. Második példám egy képtömörítési módszert mutat be: Képtömörítés SVD faktorizációval Egy fekete-fehér képet tekinthetünk olyan derékszögű A mátrixnak, melynek mérete azonos a pixelek számával. A mátrixba írt a ij adatokat a, intervallumból vesszük, ahol a egy fehér pixelt, az pedig egy fekete pixelt jelképez. A közbeeső értékek, < a ij <, pedig a szürke különböző árnyalatainak felelnek meg. Tegyük fel, hogy a kép mérete olyan nagy, hogy nem tudjuk számítógépen tárolni vagy e- mailben elküldeni. Most megmutatjuk, hogy az SVD (singular value decomposition) hogyan minimalizálja a kép méretét úgy, hogy egy, a képhez látszólag közel hasonló képet felcserél az eredetivel. Egy A C m n r rangú mátrix SVD faktorizációja a következő: A = VΣU és Σ = Σ, ahol U C n és V C m két unitér mátrix és Σ egy diagonális mátrix μ,, μ r elemekkel, amelyekre μ μ 2 μ r >. Ezek az értékek az A A (ahol A az A mátrix adjungáltja) sajátértékeinek pozitív négyzetgyökei, amelyeket A szinguláris értékeinek (singular values) nevezünk. Tehát az SVD faktorizációt sajátérték-problémának is tekinthetjük. Ha U és V oszlopait u i és v i -ként jelöljük, akkor az A mátrix SVD faktorizációja a következőképp is felírható: A = VΣU = μ i v i u i. r i= 6

Mivel a szinguláris értékek csökkenő sorrendben vannak, így A könnyen közelíthető az első k r taggal. k A k = μ i v i u i. i= A k lesz az A legjobb közelítése a k rangú mátrixok között. Természetesen k sokkal kisebb, mint r, így A közelítése A k -val sok memóriát spórol meg. Az A R m n mátrix tárolása m n skalárt igényel. Viszont A k tárolásához elég k darab μ i v i C m vektor és k darab u i C n vektor, azaz, k m + n skalár. Így tehát jobban megéri, ha k kicsi, és megelégszünk A egy közelítésével is. Az ábrán az eredeti kép 5 752 pixelből áll, így az ennek megfeleltetett A mátrix mérete 5 752. Az eredeti kép mellett még további 3 kép látható, amelyek 3 különböző, A -t közelítő A k mátrixnak felelnek meg. Az első közelítés k = értékkel nagyon elmosódott képet ad, de k = 2-ra a lényeg már látható. Viszont a k = 6-ra kapott kép és az eredeti között nincs szinte semmi különbség, mégis a közelített értékkel a tárolási helyet az ötödére csökkentettük: k(m + n) m n = 6(5 + 752) 5 752 2%. Ennek a képtömörítési módszernek a fő számítási költsége az A mátrix SVD faktorizációja. Mint korábban kifejtettük, az A szinguláris értékei az A A mátrix sajátértékeinek a pozitív négyzetgyökei. Így az SVD faktorizáció egy lehetséges módszer egy mátrix sajátértékeinek és sajátvektorainak meghatározásához. Megjegyzem még, hogy természetesen képtömörítéshez léteznek más, sokkal hatékonyabb és olcsóbb algoritmusok is, mint az SVD faktorizáció. 7

A példák után ismertetem a szakdolgozatom tartalmát. Az első fejezetben felsorolom a definíciókat, tételeket, melyek ehhez a témakörhöz előismeretként szükségesek. A többi fejezetben pedig a különböző alkalmazásokat részletezem alaposabban. A fő fejezetek a direkt és iterációs módszerek és a legkisebb négyzetek módszere. Igyekszem példákkal is alátámasztani a módszerek hasznosságát az érthetőség érdekében. 8

. Előismeretek.. Mátrixok Tekintsünk egy A F k n -es mátrixot az F test fölött. Felsorolok néhány fontosabb mátrixtulajdonságot, illetve alapvető elnevezéseket, fogalmakat, melyek szükségesek lesznek a fejezetek megértéséhez. (Mindezek az, 2, 4, és 6 forrásokból származnak.) A mátrixok körében az összeadás asszociatív és kommutatív, a szorzás szintén asszociatív, viszont nem kommutatív. Továbbá a szorzás művelete disztributív az összeadásra nézve. Emiatt a következők igazak λ F, és A, B, C mátrixokra: o A + B + C = A + B + C ; o A + B = B + A; o A BC = AB C; o A B + C = AB + AC, A + B C = AB + AC; Ha két mátrix azonos méretű, akkor a köztük lévő relációkat ("=", "<", ">"," ", " ") elemenként végezzük. Azokat a mátrixokat, amelyeknek minden eleme nulla, nullmátrixnak nevezzük. Jelölése:. Az A F k n mátrix transzponáltján azt a B F n k mátrixot értjük, amelyre b ij = a ji. Jelölése: A T. Az A valós mátrixot szimmetrikusnak nevezzük, ha A T = A. Azokat a mátrixokat, amelyeknek ugyanannyi sora van, ahány oszlopa, négyzetes mátrixoknak nevezzük. A négyzetes mátrix esetén A inverzének nevezzük azt a mátrixot, amellyel A-t balról vagy jobbról megszorozva, az egységmátrixot kapjuk eredményül. Jelölése: A (AA = E). Továbbá, ha egy mátrixnak van inverze, akkor a mátrixot reguláris mátrixnak nevezzük. Egy A valós négyzetes mátrixot ortogonálisnak nevezünk, ha van inverze és A = A T. Jele: 9

Egy A négyzetes mátrix diagonális, ha minden főátlón kívüli eleme nulla, azaz a ij = i j-re. Jelölése: diag(a, b,, z), ahol a, b,, z a főátló elemei. Egységmátrixnak hívjuk azt a speciális négyzetes diagonális mátrixot, melynek főátlójában csupa -esek szerepelnek (a többi eleme ). Jelölése: E. Erre igaz: EA = AE = A. Egy A mátrixot felső háromszögmátrixnak nevezünk, ha a főátló alatti elemei mind nullák. Pl.: A = A * jel helyén bármilyen F-beli szám állhat. Egy A mátrixot alsó háromszögmátrixnak nevezünk, ha a főátló feletti elemei mind nullák. Pl.: A = Egy A négyzetes mátrix determinánsát det(a)-val jelöljük. Egy négyzetes mátrixnak pontosan akkor van inverze, ha determinánsa nem nulla: det A. Fontos még a determinánsok szorzási szabálya: két A, B négyzetes mátrixra: det(ab) = det(a) det(b). Egy n k-s mátrix rangja a mátrix lineárisan független oszlopainak vagy sorainak maximális száma. Másképpen, a rang a mátrix oszlopvektorai vagy sorvektorai által kifeszített altér dimenziója az F k vektortérben. Jelölése: r(a).. Következnek a szükséges definíciók, tételek. Definíció. Legyenek V és V 2 ugyanazon F kommutatív test feletti vektorterek. A V -ről V 2 -be ható A függvényt (homogén) lineáris leképezésnek nevezzük, ha művelettartó, azaz. minden u, v V -re A u + v = Au + Av ; 2. minden u V, λ F-re A λu = λ(au).

Definíció. Legyen A lineáris leképezés V -ről V 2 -be. Az A leképezés képtere a képelemek halmaza, ezt ImA-val jelöljük. Tehát ImA = y V 2 x V Ax = y} = Ax x V. Definíció. Legyen A lineáris leképezés V -ről V 2 -be. Az A leképezés magtere a V 2 nullvektorára képződő elemek halmaza, ezt KerA-val jelöljük. Tehát KerA = x V Ax =. Megjegyzés. ImA és KerA alteret alkotnak. Legyen mostantól az alaptest C (komplex számok teste). Definíció. Legyen A C n n egy tetszőleges négyzetes mátrix. Ha egy nullvektortól különböző v C n vektor és egy λ C szám esetén teljesül az Av = λv egyenlőség, akkor a v vektort a mátrix sajátvektorának, és a λ számot a sajátvektorhoz tartozó sajátértéknek nevezzük (és fordítva). Egy összetartozó sajátértéket és sajátvektort sajátpárnak nevezünk. Tétel.. Minden sajátvektorhoz csak egy sajátérték tartozik. 2. Egy adott λ sajátértékhez tartozó összes sajátvektor és a alteret alkotnak. Ezt az alteret a λ-hoz tartozó sajátaltérnek nevezzük. Egy n n-es négyzetes mátrixnak pontosan n darab sajátértéke van multiplicitással. Ezeket a det A λe = egyenletből kapjuk. Az ezekhez a sajátértékekhez tartozó sajátvektorokat pedig az A λe v = egyenletrendszer nem nulla (v ) megoldásai adják.

Tétel. Egy adott A C n n mátrix esetén a p A λ = det(a λe) polinomot a mátrix karakterisztikus polinomjának, a P A λ = egyenletet pedig karakterisztikus egyenletnek nevezzük. Definíció. A (V, ) párt normált térnek hívjuk, ha V egy vektortér, és V C egy adott függvény, ún. norma, az alábbi tulajdonságokkal:. x = x =, 2. αx = α x, x V, α K, 3. x + y x + y, x, y V (háromszög-egyenlőtlenség). Például a C n vektortér normált tér, ha az x = x,x 2,, x n T vektor normáját az alábbi módon definiáljuk: p x p = x p + x p 2 +... + x p n Az ilyen típusú normák közül a leggyakoribbak a következők: p =,2,. -es norma (oktaédernorma): x = x + x 2 +... + x n, 2 2-es norma (euklideszi norma): x 2 = x 2 + x 2 2 +... + x 2 n, maximumnorma: x = max x, x 2,, x n. Ezeket a normákat vektornormáknak nevezzük. Tétel. Tegyük fel, hogy a C n és a C m normált terekben ugyanazt a vektornormát használjuk. Ekkor a korábban megismert vektornormák az alábbi mátrixnormákat indukálják: Oktaédernorma p = : A = max j =,,n Maximumnorma p = : A = max j =,,m m i= a ij (oszlopösszegnorma), n j = a ij (sorösszegnorma), Euklideszi norma p = 2 : A 2 = ρ(a A), ahol ρ az A mátrix spektrálsugara, és A az A mátrix transzponált konjugáltja. 2

Definíció. Legyen A C n n, λ i az A sajátértékei, i =,, n. Spektrálsugárnak hívjuk az abszolút értékben legnagyobb sajátértéket, ρ A = max i n λ i. Definíció. A C m n mátrix adjungáltja A = A T. A önadjungált, ha A = A. Definíció. Egy m n-es mátrixnak pszeudoinverze egy olyan A n m-es mátrix, amelyre. AA A = A, 2. A AA = A, 3. AA önadjungált, 4. A A önadjungált. Definíció. A C n n szimmetrikus, pozitív definit (SZPD) mátrix, ha A = A T és Ax, x > x C n,x. Definíció. A C n n szigorúan diagonálisan domináns (SZDD), ha a ii > n j = j i a ij i =,, n. Definíció. A C n n M-mátrix, ha a ij i j és g R n,g > : Ag >. Tétel. Legyen az A R n n mátrix olyan, hogy a főátlóján kívüli elemek nempozitívak. Ekkor A pontosan akkor M-mátrix, ha van olyan g > vektor, mellyel Ag >. 3

.2. Lineáris egyenletrendszerek megoldhatósága Egy n ismeretlenes, k egyenletből álló lineáris egyenletrendszer általános alakját a következőképpen definiáljuk: a x + + a n x n = b a 2 x + + a 2n x n = b 2 a k x k + + a kn x n = b k, ahol a ij és b j adottak (i =,, k ; j =,, n), és keressük azokat az x j (j =,, n) számokat, amelyek teljesítik a fenti egyenleteket. Az egyenletrendszer mátrixos alakban is felírható, ehhez bevezetjük az a a 2 a n a 2 a 22 a 2n A = a k a k2 a kn együtthatómátrixot. Így az egyenletrendszer a következőképp értelmezhető: Ax = b, ahol b az egyenletrendszer jobb oldalának értékeit tartalmazza egy k elemű oszlopvektorban, x pedig egy n elemű oszlopvektor, amely a megoldás vektorát jelöli. Célunk: megkeresni azt az x-t, amellyel Ax = b. Ennek az új alakban felírt egyenletrendszernek a megoldhatóságát írja le a következő tétel. Tétel. 2 Egy Ax = b egyenletrendszer akkor és csak akkor megoldható, ha az A együtthatómátrix és a b vektorral kibővített együtthatómátrix rangja megegyezik: r A = r(a b). Ha az egyenletrendszer megoldható és r A < n, akkor végtelen sok megoldás van, ha r A = n, akkor egyértelmű a megoldás. A következő fejezetekben feltesszük, hogy az egyenletrendszerünk mátrixa négyzetes és valós A R n n, és csak egyértelmű megoldásunk van. Ennek szükséges és elégséges feltétele, hogy a mátrix determinánsa nullától különbözzön, det A. 4

2. Direkt módszerek A lineáris egyenletrendszerek megoldásának és a sajátérték feladatoknak a két fő numerikus megoldási módja a direkt vagy az iterációs módszer. Elsőként a direkt módszerekkel foglalkozunk, mely alkalmazásánál a megoldást véges számú lépés után pontosan megkapjuk. Ezen belül pedig elsőként az egyik leggyakoribb eljárással, a Gauss-eliminációval ismerkedünk meg. 2.. Gauss-elimináció Ezen eljárás során célunk, hogy az Ax = b egyenletrendszer együtthatómátrixát aritmetikai műveletekkel felső háromszögmátrixszá alakítsuk. Ez azért fontos, mert az ilyen alakú mátrixokból és a b vektor segítségével könnyen megkapjuk az egyenletekbe visszafelé történő helyettesítésekkel a megoldást. Tekintsünk egy példát: A = 2 2 2 3 2 7 2 2 2 3 2 7, x = x x 2 x 3 = x x 2, b = x 3 5 2 5 2 A módszer során eltávolítjuk x -et a második és harmadik egyenletből, majd x 2 -t a harmadik egyenletből. Ennek eredményeképpen, x 3 -t megkapjuk a harmadik egyenletből, ezután x 2 -t a másodikból, majd x -t az elsőből. A következő műveleteket végezhetjük a mátrix sorai között: egy sor nem nulla skalárral való szorzása; egy sor konstansszorosának hozzáadása egy másik sorhoz; két sor felcserélése. Mindezt illusztrálva, elvégezzük az eljárást a példán. Az elimináció során a b-vel kiegészített együtthatómátrixból indulunk ki: 2 5 2 2 3 2 7 2 5

Első lépésben mindig meghatározzuk a p elemet, amely ekkor a mátrix főátlójának első eleme, azaz az, indexelésű elem lesz, jelen esetben p =. Ez azért szükséges, mert e szerint az elem szerint fogjuk elvégezni a sorok közti műveleteket. Célunk, hogy a p elem alatti elemeket kinullázzuk, hisz egy felső háromszögmátrixot szeretnénk kapni. Ehhez a következő sorműveleteket hajtjuk végre az. lépésben: a 2. sorból kivonjuk az. sor 2 p szeresét 2 p = a 2 p, azaz: 2. sor. sor 2, a 3. sorból kivonjuk az. sor 3 p szeresét 3 p = a 3 p Így az. lépés után ezt az eredményt kapjuk:, azaz: 3. sor. sor 3. 2 5 3 9 5 A felső háromszögmátrixos alak elérése érdekében felcseréljük a 2. és 3. sort. 2 5 5 3 9 Ezek után a 2. lépésben ismét meghatározzuk a p elemet, ami most a főátló második eleme lesz, tehát a 2,2 indexelésű elem, azaz p =. A p alatt található, így nem kell már sorok közti műveleteket végeznünk a kinullázáshoz. Áttérhetünk a 3. lépésre, viszont ott már nincs teendőnk, mivel a felső háromszög alak előállt az együtthatómátrixban. Utolsó lépésben csak vissza kell helyettesítenünk az egyenletekbe, lentről fölfelé haladva. Ezzel megkapjuk a megoldást: x =, x 2 = 2, x 3 = 3. A következő tételek segítségével meghatározzuk, mikor alkalmazható a Gauss-elimináció. 2... Tétel. 2 A Gauss-módszer pontosan akkor hajtható végre, ha az A mátrix egyik főminorja sem zérus, azaz det A :k, : k (k =,, n). A tétel bizonyításában A () a kiinduló együtthatómátrixot, A (2) pedig az első lépés után kapott együtthatómátrixot jelöli (a többi hasonlóan A n -ig). Az a () ij, a (2) ij,, a (n) ij együtthatómátrixok elemei. pedig ezen 6

Bizonyítás. 2 A Gauss-elimináció során az egyes sorokból kivonjuk más sorok számszorosait. Ez az eljárás nem változtatja meg a determinánst. Tehát det A :,: = det A :,: = a (), det A : 2,: 2 = det A 2 :2,: 2 = a () a (2) 22, det A : n, : n = det A n :n, : n = a () a (n) nn. Az utolsó feltétel a visszahelyettesítés miatt kell, hiszen ez úgy kezdődik, hogy a (n) nn -nel osztanunk kell az x n ismeretlen kiszámításához. Ebből következik az állítás. Az alábbi tétel szintén arra ad feltételt, hogy mikor alkalmazható a Gauss-módszer. 2..2. Tétel. 5 Ha az A mátrix. szimmetrikus, pozitív definit mátrix (SZPD) vagy 2. szigorúan diagonálisan domináns (SZDD) vagy 3. M-mátrix, akkor a Gauss-módszer végrehajtható. 2.2. LU-felbontás Amint azt az előző fejezetben láthattuk, egy mátrix Gauss-eliminációval felső háromszögmátrix alakra hozható. Ezt kibővítve kapjuk az alábbi tételt. 2.2.. Tétel. 3 Legyen A = a ij, i, j =,, n egy olyan n n-es mátrix, melynek minden k-ad rendű főminorja reguláris. Ekkor létezik olyan L normált (főátlóiban -esek állnak) alsó háromszögmátrix és egy U felső háromszögmátrix, melyre A = LU. 7

Megjegyzés. Ha egy reguláris mátrixnak létezik LU-felbontása, akkor az LU-felbontása egyértelmű. A felbontásban szereplő U felső háromszögmátrix megegyezik a Gauss-elimináció során kapott felső háromszögmátrixszal, az L alsó háromszögmátrixot pedig az elimináció során használt skalárszorzók segítségével tudjuk meghatározni. Szemléltetésül az alábbi példában megadom az A mátrix LU-felbontását. (A példa 6 -ból származik.) Gauss-elimináció: Tehát U = 2 4 2 2 2 2 4 A = 2 4 2 2 2 2 3 2 2 2 4, a kapott felső háromszögmátrix. Az L-et a lépésenkénti skalárszorzókból kaphatjuk meg. Ismét kijelöljük a p elemet, akárcsak a Gauss-eliminációnál. Az első lépésben p = 2 (= a ) és a következő műveleteket végeztük el: (magát az. sort változatlanul hagytuk) a 2. sorból kivontuk az. sor 4 -szeresét, azaz: 2. sor-. sor 4 = 2. sor 2.sor p 2 a 3. sorból kivontuk az. sor 2 2 -szeresét, azaz: 3. sor-. sor = 3.sor +.sor. Ezek alapján határozzuk meg az első lépés utáni v vektort: v = p 2 2.. A vektorban lévő értékek azokat a műveleteket és skalárszorosokat jelölik, amelyeket az adott sor Gausseliminálásához alkalmaztunk. A jelöli az első sor változatlanul hagyását, a 2-t úgy kaptuk, hogy a 2. sorhoz viszonyítva nézzük az első sorral végzett műveletet, (mivel a 2. sorból kivontuk az. sor kétszeresét), az -t pedig hasonlóan, a harmadik sorhoz viszonyítva az első sorral végzett műveletet jelöli (3. sorhoz hozzáadtuk az első sor egyszeresét). A második lépésben p = (= a 22 ), és a következő műveleteket végeztük el:. sort változatlanul hagytuk 2. sort változatlanul hagytuk 3. sorból kivonjuk a 2. sor 3 -szeresét, azaz: 3. sor-2. sor 3 =3. sor +3 2. sor. p 8

Így ezek alapján: v 2 = 3, mivel az első két sort változatlanul hagytuk, a harmadik sorhoz pedig hozzáadtuk a második sor háromszorosát. E két vektorból kapjuk a következő mátrixokat: L v = 2, L 2 v 2 = 3 Tehát a v, v 2 vektorokat beleírtuk egy-egy normált alsó háromszögmátrixba. Ezekből L-et a következő képlettel kaphatjuk meg: L = L v L 2 v 2. Azaz, kiszámoljuk az L v, L 2 v 2 inverzeket, majd szorzatukból megkapjuk az L alsó háromszögmátrixot.. Tehát L = L v = L = 2 3 LU = 2 2, L 2 v 2 = 3 = 3 2 3. Most már ellenőrizhetjük az A = LU felbontás helyességét. 2 3 2 2 4 = 2 4 2 2 Ennek a mátrixszorzásnak az eredménye tényleg megegyezik A-val. Az LU-felbontás több szempontból is hasznos, például megkönnyíti a mátrix determinánsának kiszámolását. Ugyanis az A mátrix determinánsa megegyezik az U determinánsával (det A = det U), melyet könnyedén megkapunk U főátlóbeli elemeinek szorzataként. Másrészt inverz számításnál is sokkal kevesebb műveletet igényel, ha először meghatározzuk az LU-felbontást, majd megoldjuk a lineáris egyenletrendszereket. 9

2.3. Cholesky-felbontás A Cholesky-módszer az LU-faktorizációhoz hasonló felbontás, viszont ebben az esetben az A mátrix szimmetrikus, pozitív definit. Ha a mátrix SZPD, úgy kevesebb műveletet kell elvégeznünk a faktorizáció során. Ehhez kapcsolódóan két tételt ismertetek, melyek közül az elsőnél csak a szimmetrikusság feltétele is elegendő. 2.3.. Tétel. 2 Szimmetrikus A R n n mátrix esetén egyértelműen létezik egy L normált alsó háromszögmátrix és egy D diagonális mátrix, melyekkel A = LDL T. 2.3.2. Tétel. (Cholesky-felbontás) 2 Tegyük fel, hogy A egy szimmetrikus, pozitív definit mátrix. Ekkor létezik pontosan egy olyan pozitív diagonálisú G alsó háromszögmátrix, mellyel A = GG T. Tekintsünk egy példát a felbontásra 6. Kétféle módszerrel is megoldható a Choleskyfelbontás: LU-felbontásból kiindulva, vagy gyökvonásos módszerrel. Most a gyökvonásos algoritmusra mutatok példát. Legyen A az alábbi SZPD mátrix, ami egyenlő egy alsó háromszögmátrix és egy felső háromszögmátrix szorzatával, mivel ezek jelölik GG T -t. (Egy alsó háromszögmátrix transzponáltja egy felső háromszögmátrix.) A = 5 6 6 = g g 2 g 22 g 3 g 32 g 33 g g 2 g 3 g 22 g 23 g 33 A fenti egyenlet alapján kifejezzük A oszlopainak elemeit a G és G T elemeivel. A szimmetria miatt elég csak egy alsó vagy felső háromszög alakban kiszámolni A elemeit. (Most az alsó háromszög alak szerint számolunk.) Fontos még megjegyezni, hogy A szimmetriája miatt g 2 = g 2, g 3 = g 3 és g 23 = g 32.. oszlop: 2 5 = g g = 5, = g 2 g = g 2 5 g 2 =, 2

= g 3 g = g 3 5 g 3 = 5 = 5 5, 2. oszlop: 6 = g 2 g 2 + g 2 22 = g 2 2 + g 2 2 22 = + g 22 g 22 = 6, = g 3 g 2 + g 32 g 22 = g 3 g 2 + g 32 g 22 = g 32 6 g 32 = 6 = 6 6, 3. oszlop: 6 = g 3 g 3 + g 32 g 23 + g 2 33 = g 2 3 + g 2 32 + g 2 33 = + + g 5 6 33 2 g 33 = 3 3 3 =. 3 3 Ezek alapján G = 5 6 5 5 tényleg megegyezik az A mátrixszal. 6 6 3 3 3, és G T = 5 5 6 5 6 6 3 3 3, szorzatuk pedig Ha a megoldáshoz a másik módszert választjuk, akkor az LU-felbontásból indulunk ki, tehát ismerjük az U és L mátrixokat. A szimmetrikus mátrixokra vonatkozó tétel képletével felírjuk a felbontást: A = LDL T, ahol D = diag(u). Ezután ugyanúgy az A = GG T felbontást használjuk, amit a G = LD /2 segítségével fejezünk ki. 2

3. Legkisebb négyzetek módszere A legkisebb négyzetek módszerének létrejötte azon alapszik, hogy szükség volt egy általános megoldási módszerre az Ax = b egyenletrendszer megoldásához abban az esetben, amikor nincs az egyenletrendszernek klasszikus értelemben vett megoldása, vagyis, amikor b nincs benne A értékkészletében. (A fejezetet 3 alapján dolgoztam ki.) Tehát, a cél egy olyan x vektort találni, amely az Ax-hez a legközelebb eső vektor. Többféle norma áll rendelkezésünkre az Ax és b közötti távolság megadásához, de a legegyszerűbb választás (ami miatt a módszer neve, hogy legkisebb négyzetek ) az euklideszi vektornorma. Más szóval, a legkisebb négyzetek módszer lényege, hogy megtalálja a megoldást, x R k -t, a következő minimalizálási problémára: b Ax = min n y R k b Ay, (3.) n ahol A R n k egy n sorból és k oszlopból álló mátrix, b egy R n -beli vektor és n jelöli az euklideszi normát R n -ben ( a = a, a ). Mint tudjuk, négyzetes mátrix esetén n = p, és emellett, ha A reguláris, akkor létezik egy egyértelmű minimalizáló x = A b vektor, és a minimum egyenlő nullával. Ilyen esetben a legkisebb négyzetek módszere gyakorlatilag egyet jelent a lineáris egyenletrendszer megoldásával. Ha A nem reguláris vagy n p, akkor ez esetben a legkisebb négyzetek módszer általános módszert ad a lineáris egyenletrendszerek megoldására, nem négyzetes vagy szinguláris mátrixokra nézve. Ha az Ax = b egyenletrendszernek létezik megoldása, akkor ez a megoldása a legkisebb négyzetek módszernek is. Ennek (az állításnak) a megfordítása nem igaz, ezt láthatjuk is az alábbi geometriai megközelítésből. A legkisebb négyzetek módszere geometriai szempontból is értelmezhető: meg akarjuk találni a b vektor ortogonális vetületét az A értelmezési tartományán. Ez a meghatározás helyes, mivel Ax a legközelebbi vektor b-hez Im(A)-ban. Az ortogonális vetítés egy jól ismert tulajdonsága, hogy b Ax ortogonális Im(A)-ra. A 3.. ábrán látható a b vektor és Ax ortogonális vetítése a vektor alterére, Im(A)-ra. Ennek következtében világos, hogy (3.) mindig ad legalább egy megoldást, viszont az Ay = b egyenletrendszernek nincs megoldása, ha b nincs benne Im(A)-ban. 22

3..ábra: Legkisebb négyzetek módszere: b vetítése Im(A)-ra. 3 Fontos még megemlíteni, hogy a másik fő alkalmazása a legkisebb négyzetek módszerének az adatillesztés. 3.. Főbb eredmények Továbbra is tekintsük a (3.)-ben található legkisebb négyzetek problémát: keressük azt az x R k megoldást, ami minimalizálja a b Ay n normát, ahol A R n k egy n soros k oszlopból álló mátrix, és b R n, n pedig az euklideszi normát jelöli. 3... Lemma. 3 Egy x R k vektor megoldása a legkisebb négyzetek módszerének akkor és csak akkor, ha kielégíti az úgynevezett normálegyenletet: A Ax = A b, (3.2) ahol A az A transzponált konjugáltja, és A A egy k méretű négyzetes mátrix. Bizonyítás. 3 Legyen x R k a (3.) megoldása. Például: b Ax 2 b Ay n 2, y R k. Bármely z R k -ra és bármely t R-re legyen y = x + tz. Ekkor b Ax Ebből az alábbira következtetünk: n 2 2 n b Ax n + 2t Ax b, Az + t 2 Az n 2. 23

2 sgn(t) Ax b, Az + t Az n 2, ami arra utal, hogy ha t tart a -hoz, akkor Ax b, Az = z R k. Ezután arra jutunk, hogy A Ax A b =. Ezt megfordítva, ha x a (3.2)-beli normálegyenlet megoldása, akkor Ax b, Az =, z R k. Tehát b Ax Vagyis, x megoldása (3.)-nek is. 2 b Ay n 2 n y = x + tz R k. 3..2. Tétel. 3 Minden A R n k -s mátrixra a (3.2)-beli normálegyenletnek mindig létezik legalább egy megoldása. Továbbá, ez a megoldás egyértelmű akkor és csak akkor, ha Ker(A) =. A normálegyenlet partikuláris megoldása kifejezhető A egy pszeudoinverzének (A ) elemeivel. 3..3. Tétel. 3 Az x b = A b vektor megoldása a (3.)-ben definiált legkisebb négyzetek módszernek. Ha (3.)-nek több megoldása is van, akkor közülük x b az az egyértelmű megoldás, ami a legkisebb normával rendelkezik. Például, x x b -re, melyre Ax b b 2 = Ax b 2, a következőt kapjuk x b 2 < x 2. Bizonyítás. 3 Minden x R k -re Ax b felbontható a következőképpen: Ax b = A x x b E AA b. Ez a felbontás ortogonális, mivel A x x b Im(A) és E AA b Im(A), mert AA az ortogonális vetítés mátrixa C m -nek Im(A)-ra. Ebből a felbontásból arra következtethetünk, hogy 2 Ax b 2 = Ax Axb 2 2 2 2 + Ax b b 2 Ax b b 2, (3.3) 24

ami alapján láthatjuk, hogy x b valóban megoldása (3.)-nek. Továbbá, ha Ax b b 2 = Ax b 2, akkor (3.3)-mal látható, hogy Ax = Ax b és z = x x b Ker(A). Ezzel a következő felbontást kapjuk x-re: x = z + x b. Ez a felbontás ortogonális, mivel z Ker(A) és x b = A b (Ker(A)). Emiatt, ha x x b, x 2 2 = z 2 2 + x 2 b 2 > x 2 b 2. Megjegyzés. Az x b = A b vektornak egyszerű geometriai értelmezése van: x b a (Ker(A)) -nak az az egyértelmű megoldás vektora, aminek az A mátrix szerinti képe megegyezik b-nek Im(A)-ra való vetítésével. Végül tekintsünk egy példát a módszerre. Van 3 hegy, melyeket x,x 2 és x 3 -mal jelölünk. Egy helyről mérve őket rendre a következő magasságokat kaptuk: 2474 láb, 3882 láb és 4834 láb ( láb=3,48 cm). Viszont x -ről tekintve a másik 2 hegyre, x 2 422 lábbal, x 3 pedig 2354 lábbal magasabbnak tűnik. Ha pedig x 2 -ről nézzük a harmadik hegyet, akkor onnan x 3 95 lábbal tűnik magasabbnak. Ezek alapján felírhatjuk a kiinduló egyenletrendszert: Ax = b, A = Minimalizálni akarjuk az x x 2 x 3 = 2474 3882 4834 422 2354 95 = b Ax b 2 -t. A normálegyenlet alakjának elérése érdekében mindkét oldalt megszorozzuk A -gal. A A = A = A b = 2474 3882 4834 422 2354 95 = = 3 3 3 32 4354 838 25

3 3 3 A Ax = A b x x 2 x 3 = 32 4354 838 Ebből az egyenletrendszerből kiszámítva a megoldást: x = 2472, x 2 = 3886, x 3 = 4832 értékeket kapjuk. 26

4. Iterációs módszerek Egy iterációs módszer alkalmazásánál végtelen sok lépésre van szükség ahhoz, hogy a pontos megoldáshoz jussunk. Ez úgy lehetséges, hogy az iteráció során a megoldást olyan x k konvergens sorozatokkal közelítjük, amelyek határértéke az Ax = b egyenletrendszer egyértelmű megoldása (x ), és mivel végtelen lépés szükséges, így az iterációk száma (k) a + -be tart. Az A mátrixot továbbra is négyzetesnek és regulárisnak tekintjük. A lineáris iterációs módszerek általános alakja a következőképp írható fel: x (k+) = Bx (k) + f, ahol a B mátrixot iterációs mátrixnak nevezzük és x (i) az x vektor i-edik iterációját jelöli. Az alábbi definíció a konzisztencia fogalmát ismerteti. Definíció. Az x (k+) = Bx (k) + f iterációt az Ax = b egyenletrendszerrel konzisztensnek hívjuk, ha x = Bx + f. (Az x az egyenletrendszer megoldása.) Egy iterációs módszer a következő felbontáson alapul: A = M N, ahol M reguláris. Ekkor az iterációs eljárás az alábbi módon definiálható: ( 3 alapján) adott x () R n kezdeti vektor Mx (k+) = Nx (k) + b k. Az iteráció konvergenciájára a következő tétel ad feltételt. 4... Tétel. 3 (4.) A (4.)-ben definiált iterációs módszer akkor és csak akkor konvergens, ha az M N mátrix spektrálsugara kielégíti a következő feltételt: ρ(m N) <. A tétel bizonyításához szükséges az alábbi definíció: Definíció. Az r (k) = b Ax (k) vektort (illetőleg az e (k) = x (k ) x -et) a k-adik iteráció hibájának nevezzük. Nyilvánvaló, hogy az iteráció akkor konvergens, ha e (k) a -hoz tart. 27

A 4... tétel bizonyítása: Bizonyítás. 3 Az e (k) hiba megadható indukciós eljárással a következőképpen: e (k) = x (k) x = M Nx (k ) + M b M Nx + M b = M N x (k ) x = = M Ne (k ). Mivel e (k) = (M N) k e (), és célunk, hogy a hiba -hoz tartson, ezért lim k + e (k) = minden e () -ra, ami akkor és csak akkor teljesül, ha ρ(m N) <. Tehát ha a megoldást közelítő sorozatok konvergálnak egy határhoz, pontosabban x -hoz, és az iterációk száma tart a végtelenbe, akkor a következőre jutunk: M N x = Ax = b. Továbbá a (4.)-ben definiált sorozattal ekvivalens a következő felírás: (k x +) = M Nx (k) + M b. Ez esetben az M N mátrixot nevezzük az iterációs módszer iterációs mátrixának. Könnyen láthatjuk, hogy ez a felírás megegyezik az általános alakban felírt egyenlettel, ha B = M N és f = M b. Az alfejezetekben a klasszikus iterációs módszereket mutatom be példákkal és összehasonlítást is végzek a módszerek gyorsasága között. 4.. Jacobi-iteráció Az előző x (k+) = M Nx (k) + M b alakból az M = D és N = D A helyettesítéssel kaphatjuk meg a Jacobi-iteráció alakját: x (k+) = D D A x (k) + D b x (k+) = (E D A)x (k) + D b. Itt E D A jelöli a Jacobi-iteráció iterációs mátrixát, melyet B J -vel fogunk jelölni. A felbontásban szereplő D az A együtthatómátrix diagonális mátrixát jelöli. Itt A az A = L + D + U alakban írható fel, ahol L és U nem az LU-felbontás mátrixai, hanem L a diagonális alatti elemek --szereseinek, U pedig a diagonális fölötti elemek --szereseinek mátrixa. A 28

számolásokat a Jacobi-iteráció komponensenkénti alakjával érdemesebb elvégezni, ami a következőképpen írható fel: x i k+ = a ii n j =,j i k a ij xj b i, i =,, n. Példaként tekintsük az alábbi egyenletrendszert, és végezzünk el egy lépést a Jacobiiterációval. (A kiinduló adatok a -ből származnak.) A = 5 2 3 Először kiszámítjuk a B J iterációs mátrixot. B J = E D A = B J =, b = 7 5 2, x () = 5 2 3 /5 /2 /3 5 2 3 Ezután ellenőrizzük a konvergencia feltételét, tehát a ρ(b J ) < feltételt. Ehhez meg kell határoznunk B J sajátértékeit, ugyanis ezek közül abszolút értékben a legnagyobbra lesz szükségünk, mivel ρ B J = max λ (ahol λ a B J mátrix sajátértékét jelöli). det(b J λe) = det λ /5 /2 λ /3 λ λ 3 + λ = λ = λ3 λ = = λ 3 + + + λ = λ3 + λ = λ2 λ 2 =, λ 3 = Tehát ρ B J =,36 <, azaz az iteráció konvergens. Most már elkezdhetjük az x () vektor kiszámítását. x () = Így: x () x 2 () x 3 () és a szükséges képlet x i k+ = a ii k b i n j =,j i a ij xj. x = 5 + 7 = 6 5 x 2 () = 2 + 5 = 2 x 3 () = 3 + 2 = 3 29

Tehát egy lépés után az x () = 6/5 2 /3 vektort kapjuk. A következő fejezetben nézünk egy példát a Gauss-Seidel-iterációval is. Következtetéseket csak ezután vonunk le. 4.2. Gauss-Seidel-iteráció Az M = D L és N = U helyettesítéssel kapjuk meg a Gauss-Seidel-iteráció alakját: (k x +) = (D L) Ux (k) + (D L) b. Ezesetben a (D L) U mátrixot nevezzük iterációs mátrixnak és B GS -sel jelöljük. Az iteráció komponensenkénti alakja a következő: x i (k+) = a ii i a ij j = n xj(k+) + a ij xj(k) b i. j =i+ (k+) A fő különbség a Jacobi és a Gauss-Seidel iterációk között, hogy az utóbbi x i megadásához felhasználja a már addig kiszámolt,, i indexű x (k+) elemeket, míg a (k) (k+) Jacobi-iteráció csak az x vektort használja fel x elemeinek megadásához. Tekintsük most az alábbi példát ( 9 ) és végezzünk el egy lépést Gauss-Seidel-iterációval. A = 2 4 2, b =, x () = 2 B GS = (D L) U = 2 4 2 B GS = /2 /2 Most is ellenőriznünk kell a konvergencia feltételét. λ 3 = λ = det(b GS λe) = det λ /2 λ /2 λ = λ λ 2 = λ 3 3

Tehát ρ B GS = <, azaz az iteráció konvergens minden kezdővektorra. Továbbá ha a spektrálsugár -val egyenlő, akkor az iterációról tudjuk, hogy véges. Így elkezdhetjük az első lépés kiszámítását. x () = () x () x 2 () x 3, szükséges képlet: x i (k +) = a ii i a ij j = xj(k +) + j =i+ a ij xj(k ) b i n x = 2 2 + = 2 x 2 () = 4 2 + 2 = 4 x 3 () = 2 + 4 = Tehát Gauss-Seidel-iterációval egy lépés után x () = /2 /4 Összehasonlítva az előző fejezetből a Jacobi-iteráció, és a most számolt Gauss-Seideliteráció spektrálsugarait, láthatjuk, hogy a Gauss-Seidel-iterációhoz tartozó a kisebb. Minél kisebb a spektrálsugár, annál gyorsabban tart az iteráció a megoldáshoz. Tehát ez esetben a 2. módszer, azaz a Gauss-Seidel-iteráció konvergál gyorsabban a megoldáshoz. Ez a megállapítás azonban nem általánosítható, tudunk olyan példát is mutatni, amelyben a Jacobiiteráció konvergál gyorsabban. A konvergencia vizsgálatához szükséges és elégséges feltételt adott az iterációs mátrix spektrálsugarára szabott feltétel ellenőrzése. Ugyanakkor elégséges feltételt ad a konvergenciára, ha az iterációs mátrix valamely normában kisebb, mint. Viszont a konvergencia feltételeinek ellenőrzését nem mindig kell elvégeznünk, ugyanis bizonyos típusú együtthatómátrixokra a konvergencia adott. Így csak azt kell megállapítani, hogy A tényleg az éppen adott tulajdonságú együtthatómátrixnak felel-e meg. E szempontból a következő esetek lehetségesek.. 4.2.. Tétel. 2 Ha az egyenletrendszer együtthatómátrixa M-mátrix, akkor a Jacobi és a Gauss-Seideliterációk konvergálnak az egyenletrendszer megoldásához tetszőleges kezdeti vektor esetén. 3

4.2.2. Tétel. 2 Szigorúan diagonálisan domináns (SZDD) együtthatómátrixok esetén a Jacobi és Gauss- Seidel-iterációk minden kezdővektor esetén az egyenletrendszer megoldásához konvergálnak. 4.2.3. Tétel. 2 Ha az A együtthatómátrix szimmetrikus és pozitív definit (SZPD), akkor a Gauss-Seideliteráció konvergál az egyenletrendszer megoldásához tetszőleges kezdeti vektor esetén. Fontos még meghatározni, hogy meddig tart egy iterációs eljárás, hány lépés után kell leállnunk. Erre ad feltételt a Banach-féle fixponttétel: x (k) x Lk L x () x (). A mi esetünkben L a B iterációs mátrix normája, és szükséges, hogy B <, azaz az iterációs mátrix valamely normában kisebb legyen, mint. Ennek segítségével és az első iterációs lépés eredményével megadható, hogy hány lépésre van szükségünk adott pontosság eléréséhez. Tekintsünk egy példát erre: hány iterációs lépést kell megtennünk ahhoz, hogy 2 nagyságú hibával határozzuk meg az egyenlet megoldását? 6 Tegyük fel, hogy az alábbiakat már kiszámoltuk: x () =, Jacobi-iterációval: x () = /5 9/4 37/9, Gauss-Seidel-iterációval: x () = /5 43/2 35/2 B J =,75 = 3 4 < és B GS =,4 = 2 5 < Oldjuk meg először Jacobi-iterációval a feladatot, ekkor L = B J. 3 x (k) x 4 3 4 k /5 9/4 37/9 < 2 3 4 3 4 k k 4 37 9 < 2 < 9 37 4 k > log 9 48 log 3 25,74 k = 26 4 Tehát 26 lépést kell megtennünk Jacobi-iterációval az adott pontosságú közelítés eléréséhez. 32

Most oldjuk meg a feladatot Gauss-Seidel-iterációval, ekkor L = B GS. 2 x (k) x 5 2 5 k /5 43/2 35/2 < 2 k > 2 5 2 5 k k 5 3 35 2 < 2 < log 36 75 log 2 5 36 5 35 6,75 k = 7 Így 2 pontosság mellett, a Gauss-Seidel-iterációval csak 7 lépést kell elvégeznünk a megoldás közelítéséhez. 4.3. Richardson-iteráció Ennél az iterációs módszernél feltesszük, hogy az együtthatómátrix szimmetrikus és pozitív definit (SZPD), valamint definiálunk egy p paramétert, amire p R, p. A Richardson iteráció alakját a lineáris egyenletrendszer általános alakjából a következő átalakításokkal kapjuk meg: Ax = b pax = pb = pax + pb x = x pax + pb x = (E pa)x + pb Tehát megszoroztuk az egyenletrendszert p-vel, -ra rendeztünk, majd mindkét oldalhoz hozzáadtunk x-et. Vagyis a Richardson-iteráció alakja: x (k+) = E pa x k + pb. Ez esetben az iterációs mátrix E pa, melyet B R -rel jelölünk. A főtengelytétel alapján tudjuk, hogy ha A szimmetrikus, akkor a sajátértékei valósak. Mivel A nemcsak szimmetrikus, hanem pozitív definit is, ezért tudjuk, hogy sajátértékei mind pozitívak. Az iterációs mátrix sajátértékéről most teszünk egy állítást, amit szeretnénk, hogy teljesüljön, majd megpróbáljuk bizonyítani sejtésünket. 33

4.3.. Állítás. 8 Az E pa mátrix sajátértéke pλ i. Bizonyítás. 8 A sajátérték, sajátvektor definíciójából a következőnek kell teljesülni: Av i = λ i v i E pa v i = pλ i v i. Csak a bal oldali tagot alakítjuk át: E pa v i = v i pav i = v i pλ i v i = pλ i v i. Tehát beláttuk, hogy a bal oldali kifejezés egyenlő a jobb oldalival, azaz pλ i tényleg E pa sajátértéke. Ezzel az állítással már megkaptuk, hogy ρ B R = max pλ i <. Tegyük fel, hogy λ λ 2 λ n >, azaz λ i >. Ekkor λ a legnagyobb, ezért erre nézzük meg, hogy mikor teljesülne a spektrálsugárra vonatkozó becslés. < pλ < Rendezzük a bal oldali egyenlőtlenséget p-re. < pλ p = 2 λ Az alábbi tétel ugyanezt a képletet adja p -re, emellett az iteráció konvergenciájához fontos feltételt ad. 4.3.2. Tétel. 7 Legyen A szimmetrikus, pozitív definit mátrix. Ekkor az x (k+) = E pa x k + pb iteráció p ; 2 ρ A p opt = 2 λ +λ n sajátértékei. esetén tetszőleges x () mellett konvergens. Ekkor az optimális paraméter és ρ B R (p opt ) = λ λ n λ +λ n, ahol ρ A = λ λ 2 λ n > az A mátrix Nézzünk meg egy példát, amiben az optimális p paramétert keressük. 9 A = 2 2 Látható, hogy A szimmetrikus, mivel A = A T, továbbá a mátrixnak egyik főminorja sem zérus, ezért A pozitív definit. Tehát A SZPD mátrix, így alkalmazható a Richardson iteráció. Először meg kell határoznunk az együtthatómátrix spektrálsugarát, hogy tudjuk, p-t mely 34

intervallumból kell választanunk. A spektrálsugár kiszámításához az A karakterisztikus polinomja szükséges, hogy megkapjuk a gyököket. p A λ = (2 λ) 2 = 4 4λ + λ 2 = λ 2 4λ + 3 λ 2 4λ + 3 = λ = 3, λ 2 = Tehát ρ A = 3, így p ; 2 3. Az optimális p: p opt = 2 3+ = 2. 35

Összefoglalás Dolgozatomban ismertettem a lineáris egyenletrendszerek két fontosabb numerikus megoldási módját, a direkt és iterációs módszereket, valamint a legkisebb négyzetek módszerét. Direkt módszereken belül megvizsgáltuk a Gauss-elimináció, LU-felbontás és a Cholesky-felbontás alkalmazását, az iterációs módszerek közül pedig a Jacobi-, Gauss-Seidelés Richardson-iterációval ismerkedtünk meg. Mindezen módszerek alkalmazásánál fontos szerepe volt a mátrixoknak, hiszen a példákban ezek segítségével kaptuk meg az adott problémára a megoldást. Emellett többször is előfordult, hogy az éppen használt módszer alkalmazhatóságához vagy a feladat megoldhatóságához egy adott mátrixtulajdonságra volt szükség. Ezek alapján is látható, hogy az algebrából ismert mátrixok az analízis területein is rendkívül jól alkalmazhatóak. Fontos még megemlíteni, hogy a szakdolgozatban említetteken kívül a lineáris egyenletrendszerek megoldásához természetesen még számtalan más módszer is létezik. 36

Köszönetnyilvánítás Ezúton szeretném megköszönni témavezetőmnek, Fialowski Alice tanárnőnek, hogy segítőkészségével, türelmével, hasznos tanácsaival hozzájárult a szakdolgozatom elkészítéséhez. Továbbá köszönöm családom bíztatását, szaktársaim segítőkészségét és mindazoknak, akik támogattak a szakdolgozat megírása során. 37

Irodalomjegyzék Freud Róbert: Lineáris algebra, ELTE Eötvös Kiadó, 26 2 Faragó István - Horváth Róbert: Numerikus módszerek, TYPOTEX, 2 3 Grégoire Allaire, Sidi Mahmoud Kaber: Numerical Linear Algebra, Springer 4 Stoyan Gisbert, Takó Galina: Numerikus módszerek I., TYPOTEX 5 Faragó István: Alkalmazott analízis II. előadás anyaga, 6 Fekete Imre: Alkalmazott analízis II. gyakorlat anyaga 7 László Lajos: Numerikus módszerek I. előadás anyaga (IK), http://numanal.inf.elte.hu/~laszlo/ea6.pdf 8 Lócsi Levente: Numerikus módszerek I. gyakorlat anyaga (IK) 9 Bozsik József, Krebsz Anna: Numerikus módszerek példatár, ELTE IK, 2 http://cs.wpunj.edu/~kaufmanl/cs48/leastsquarescorr.ppt http://www.stud.u-szeged.hu/betyar.gabor/jacobi.pdf 38

Nyilatkozat Név: Borostyán Dóra ELTE Természettudományi Kar, szak: Matematika BSc ETR azonosító: BODSABT.ELTE NEPTUN azonosító: AZWB6V Szakdolgozat címe: Lineáris algebra és mátrixok alkalmazása a numerikus analízisben A szakdolgozat szerzőjeként fegyelmi felelősségem tudatában kijelentem, hogy a dolgozatom önálló munkám eredménye, saját szellemi termékem, abban a hivatkozások és idézések standard szabályait következetesen alkalmaztam, mások által írt részeket a megfelelő idézés nélkül nem használtam fel. Budapest, 23. 5. a hallgató aláírása 39