EÖTVÖS LORÁND TUDOMÁNYEGYETEM INFORMATIKAI KAR KÖZÖNSÉGES DIFFERENCIÁLEGYENLETEK NUMERIKUS MÓDSZEREI JEGYZET Krebsz Anna Lektorálta: dr. Hegedűs Csaba A jegyzet az ELTE Informatikai Karának 4. évi Jegyzetpályázatának támogatásával készült. Budapest, 4
Tartalomjegyzék Előszó............................................... 4. A Csererendszer modell.................................. 5. Alapfogalmak........................................ 8.. Monoton mátrixok..................................... 8.. M-mátrixok..........................................3. A mátrix exponenciális függvény............................. 7.4. Logaritmikus norma.................................... 9.5. Állandó együtthatós lineáris differenciaegyenletek.................... 6.6. Differenciálegyenletek alapvető tulajdonságai...................... 3 3. Numerikus módszerek bevezetése........................... 44 3.. Alapfogalmak........................................ 44 3.. A legegyszerűbb numerikus módszerek.......................... 49 3... Euler-módszer................................... 49 3... Implicit Euler-módszer............................... 5 3..3. Javított (módosított) Euler-módszer....................... 5 3.3. A stabilitás általános definíciója.............................. 54 3.4. Változó lépéstávolság.................................... 55 4. Explicit Runge Kutta-módszerek (ERK)....................... 57 4.. Az ERK-módszerek általános jellemzése......................... 57 4.. Harmadrendű ERK-módszerek.............................. 58 4.3. Az ERK-módszerek stabilitása és konvergenciája.................... 6 4.4. Ismert ERK-módszerek.................................. 64 4.5. Összefüggések a lépcsőszám és a rend között....................... 65 4.6. Beágyazott módszerek................................... 65 4.7. Az ERK-módszerek hatékonysága............................. 67 4.8. Hibabecslések........................................ 68 4.9. Lépésválasztás....................................... 7 5. Lineáris többlépéses módszerek (LTM)........................ 74 5.. Általános lineáris többlépéses módszerek......................... 74 5.. Adams-módszerek..................................... 75 5.3. A középpont szabály.................................... 79 5.4. Többlépéses módszerek -stabilitása........................... 8 5.5. Többlépéses módszerek konzisztenciája.......................... 84 5.6. -stabil többlépéses módszerek maximális rendje.................... 9
Tartalomjegyzék 3 6. Implicit Runge Kutta-módszerek (IRK)....................... 9 6.. IRK-módszerek....................................... 9 6.. IRK-módszerek konstrukciója............................... 9 6.3. IRK-módszerek konvergenciája.............................. 95 6.4. Rosenbrock-módszerek................................... 96 7. Stabilitás........................................... 98 7.. Belső, lényegi instabilitás................................. 98 7.. Aszimptotikus stabilitás.................................. 98 7.3. Merev (stiff) differenciálegyenletek............................ 5 8. Közönséges differenciálegyenletek peremérték feladatai.............. 9 8.. Peremérték feladatok.................................... 9 8.. Fredholm alternatíva tétel................................. 8.3. A peremérték feladatok kondicionáltsága......................... 5 8.4. A másodrendű egyenlet és klasszikus peremfeltételei.................. 9 8.5. Egy modellfeladat..................................... 9. Véges differencia eljárások................................ 4 9.. Bevezetés, alapvető fogalmak............................... 4
ELŐSZÓ A jegyzet az ELTE IK MSc Modellalkotó szakirányának Közönséges differenciálegyenletek numerikus megoldása tárgyához készült. A jegyzet alapjául szolgáló irodalom Stoyan Gisbert, Takó Galina: Numerikus módszerek. könyve, [9] volt. Olyan jegyzetet szerettem volna készíteni, amely tartalmazza az elméletet a fontos definíciókkal, tételekkel és részletes bizonyításokkal. Emellett példákon keresztül segíti a megértést és a kitűzött feladatok megoldásával a tudás elmélyítését. A logaritmikus normáról szóló fejezet feladataihoz dr. Hegedűs Csaba kézzel írt előadásjegyzetét és a [], [5], [7] irodalmakat alapul véve készítettem. [6] felhasználásával készült a Runge Kuttamódszerek és a Lineáris többlépéses módszerek fejezet. Mivel a BSc képzésben nem tananyag a diffenciaegyenletek elmélete, a lineáris többlépéses módszerek vizsgálatához viszont nélkülözhetetlen, ezért egy alfejezet került a jegyzetbe [] és [4] felhasználásával. Ezúton szeretnék köszönetet mondani dr. Hegedűs Csabának, akivel a jegyzet születésekor hétről hétre megbeszélhettem a soron következő anyagrészt. Tanácsot adott, hogyan lehetne rövidebben, egyszerűbben bizonyítani. Köszönöm ezúton is, hogy bármikor fordulhattam hozzá kérdéseimmel. Köszönöm továbbá az ELTE IK MSc Modellalkotó Informatikus szakirány 3/4-es tanév I. féléves hallgatóinak a jegyzettel kapcsolatos megjegyzéseit és a hibák felderítését. Fiamnak a tanácsokat és az anyaghoz elkészített programokat. Utoljára és legfőképpen páromnak köszönöm a segítségét, mellyel levette a vállamról az otthoni munkák terhét. Budapest, 4. november 7. Krebsz Anna
. fejezet A Csererendszer modell [SG..] Tekintsünk egy gazdasági vagy ökológiai rendszert, ami n alrendszerből áll. Az alrendszerek termelnek árut, energiát, koncentrációkat és azokat cserélik ki egymással és a külvilággal. A következő adatokkal dolgozunk: c j : általánosított koncentráció a j. alrendszer állapotát mutatja a közös egységben (pl. pénzben). a ij c j τ: mutatja, hogy a j. alrendszer τ időegység alatt ennyi egységet ad át az i. alrendszernek (i j) re. d j c j τ: mutatja, hogy a j. alrendszer τ időegység alatt ennyi egységet ad át a külvilágnak. b j τ: mutatja, hogy a j. alrendszer τ időegység alatt ennyi egységet kap a külvilágtól. A j. alrendszer által elvesztett és kapott mennyiség a [t; t + τ] időintervallumban n n V eszt j = τ a ij + d j c j, Kap j = τ a ji c i + b j. i=,i j Vezessük be a következő jelöléseket a mátrixos alak felírásához. i=,i j A = (a, a,..., a n ) = (a ij ), a ii =, e = (,,..., ) T A j. alrendszer által elvesztett (átadott) és kapott mennyiség a [t; t + τ] időintervallumban V eszt j = τ(e T a j + d j ) c j, Kap j = τ(ac) j + τb j. A t + τ időpontban a c j (t + τ) koncentráció a c j (t) koncentrációból számítható a mérlegegyenlet alapján. c j (t + τ) = c j (t) + Kap j V eszt j Részletesen felírva c j (t + τ) = c j (t) + τ(ac(t)) j + τb j τ(e T a j + d j ) c j (t) = c j (t) + τ(b Bc(t)) j, ahol B = (b ij ) = A + diag(e T a j + d j ), b ij = { e T a j + d j ha i = j a ij ha i j. Az egyenletet átrendezve és τ-val leosztva. c j (t + τ) c j (t) τ = (Ac(t)) j + b j (e T a j + d j ) c j (t) = (b Bc(t)) j.
6. Csererendszer modell τ esetén a c = b Bc, c() = c közönséges differenciálegyenletet kapjuk, melyet még ki kell egészítenünk a kezdetiértékekkel, hogy a megoldás egyértelmű legyen. A c(t) vektorfüggvény deriválását elemenként értjük. Ezzel elkészült a csererendszer matematikai modellje. A kezdetiértékproblémát megoldva arra kaphatunk választ, hogyan reagál a rendszer a külső (b i ) vagy a belső (a ij ) változásokra, t esetén beáll-e a stacionárius állapot. Ha az összes d i >, akkor a B mátrixnak nem csak az előjel elrendeződése megfelelő, hanem főátló domináns is az oszlopaira nézve és M-mátrix is. Ebből következnek a fenti modell előnyös tulajdonságai. -. Példa. Konkrét példaként tekintsük a Balaton szennyeződésének egy egyszerű kompartment (csererendszer) modelljét. A tavat 3 részre osztjuk:. medence: Keszthely/Szigliget. medence: Szemes 3. medence: Siófok. Minden medencében (azaz alrendszerben, kompartmentben) feltételezzük, hogy egységes a koncentráció. Ennek a jó keveredésnek a feltételezése éppen azt eredményezi, hogy nem parciális, hanem közönséges differenciálegyenletekre jutunk. Az egyes medencék között mindkét irányban történik áramlás. A modell a ij számai azt a víztérfogatot jelölik, mely időegység alatt a j-edik medencéből az i-edikbe áramlik. A könnyebb számolás miatt tényleges mérési eredmények helyett Így az A mátrix a =, a =, a 3 = a 3 =, a 3 =., a 3 =.. A =... Az i. medencében a víztérfogat változását α i -val jelöljük. α i = n j=,j i α =, az. medence a Zalából α =, a. medence kívülről nem kap utánpótlást α 3 =, a 3. medence vízvesztesége a Sióba folyik. A kiáramló víz mennyisége az egyes medencékben: (a ji a ij ). d = d =, d 3 = = α 3. A modellben tükröződik a szállítóanyag (víz) megmaradása. A definiált B mátrixunk és inverze + B =. +. + =.... +.. }{{}}{{} A diag(e T a j +d j ) B = 6 >,
. A Csererendszer modell 7 ahol a pozitivitást elemenként értjük. A későbbiekben látni fogjuk, hogy B M-mátrix, ugyanis az átlón kívüli elemei nem pozitívak és megadható olyan pozitív elemű g vektor, hogy Bg >. g = 3 > Bg =.8 > 4. Ezen kívül B minden sajátértéke valós és pozitív: λ.5, λ.3, λ 3 3.57. A bevitt szennyeződés tömegét időegységenként jelöljük b j -vel. Pl. b = 3, b =, b 3 = 4. Feltételezzük, hogy kezdetben nincs szennyeződés. Ezután a (passzív) környezetvédelem néhány kérdésére kereshetünk választ, pl. a koncentráció küszöbértékeivel kapcsolatban.
. fejezet Alapfogalmak.. Monoton mátrixok A valós számok körében, ha < a b, akkor a b. Mátrixok körében ez általában nem teljesül. -. Példa. Tekintsük a következő invertálható mátrixokat. [ ] [ ] 3 A = B = 3 4 4 5 Mutassuk meg, hogy bár A B (elemenként értve a relációt), mégsem igaz a fordított reláció az inverzeikre. Megoldás. A = [ ] 4, B = 3 [ 5 ] 3 4 Látjuk, hogy a kapott eredmény nem pozitív elemű mátrix. B A = [ ] -. Definíció. Az A R n n invertálható mátrixot monoton mátrixnak nevezzük, ha A (minden eleme nemnegatív). Jelölés: Az x y és A B relációkat elemenként értjük. Csak részben rendezettséget ad. -. Példa. Melyek a -es monoton mátrixok? Megoldás. Legyen a, b, c, d és det(a) = ad bc >. [ ] [ ] a b A =, A d b = c d ad bc c a A det(a) = ad bc < esethez a, b, c, d feltétel kell. -. T Legyen A R n n monoton mátrix, x, y, b, c R n, melyekre Ax = b és Ay = c. Ekkor b c x y. Bizonyítás. x y = A (b c)
.. Monoton mátrixok 9 -. T Legyenek A, B R n n monoton mátrixok. Ha A B B A. Bizonyítás. A B B A B B = I Az egyenlőtlenség mindkét oldalán nemnegatív elemű mátrixok állnak. Szorozzuk jobbról mindkét oldalt A -zel. B A -3. Példa. Igazoljuk, hogy az A = tridiag(,, ) mátrix monoton. Megoldás.. mo: Az A LU-felbontása A = LU, ahol L = tridiag( i i,, ), U = tridiag(, i +, ). i Oldjuk meg a felbontás segítségével az Ax i = LUx i = e i lineáris egyenletrendszereket i =,..., n-re. Először oldjuk meg az Lh i = e i, i i j j h = h + h = h = h i + h i = h i = > h j + h j = h j = j j majd az Ux i = h i háromszög alakú egyenletrendszert. h j > (j = i +,..., n) n + n x n = h n x n = n n + h n > n n x n x n = h n x n = n n (h n + x n ) > j + x j x j+ = h j x j = j j j + (h j + x j+ ) > (j = n,..., ) A kapott x i megoldások lesznek az inverz oszlopai, innen A pozitivitása nyilvánvaló.. mo: Belátható, hogy A = (α ij ) n i,j= elemei α ij = (n + ) Innen a pozitivitás nyilvánvaló. Feladatok { i(n + j) ha i j j(n + i) ha i j.
. Alapfogalmak -. Tekintsük az A=tridiag(a i, d i, c i ) 3-átlós mátrixot, ahol a = c n =, a i < (i =,..., n) c i < (i =,..., n ) a i + d i + c i (i =,..., n) és j : a j + d j + c j > Mutassuk meg, hogy monoton mátrix... M-mátrixok -. Definíció. Az A R n n mátrix főátló domináns a soraira, ha n a ii > a ij (i =,,..., n). j=,j i -3. Definíció. Az A R n n mátrix Z-mátrix, ha a ij, minden i j-re. -4. Definíció. Az A R n n mátrix M-mátrix, ha Z-mátrix és g > : Ag >. Az M-mátrixok tulajdonságai -3. T Ha A M-mátrix, akkor a ii > minden i-re. Bizonyítás. Vegyük a definícióban szereplő g > vektort, melyre Ag >. Írjuk fel az Ag vektor i. komponensét (i =,,..., n) n < (Ag) i = a ii g i + a ij g j a ii g i > j=,j i }{{} Mivel j i-re a ij és g j >, a szumma értéke nem pozitív, amiből g i > miatt a ii > következik minden i-re. -4. T Ha A M-mátrix, akkor a definícióban szereplő g vektorral elkészített G = diag(g) mátrixra AG főátló domináns a soraira. Bizonyítás. Legyen e = [,,..., ] T és à = AG. < Ag = AGe = Ãe n < (Ãe) i = ã ij (i =,,..., n) j= Mivel ã ij = a ij g j i j-re és ã ii = a ii g i >, az előző összeget az elemek abszolút értékével is kifejezhetjük. n n < ã ii + ã ij = ã ii ã ij (i =,,..., n) j=,j i j=,j i Átrendezve éppen a sorokra vonatkozó főátló dominanciát kapjuk.
.. M-mátrixok -5. T Ha A M-mátrix, akkor a definícióban szereplő g vektorral elkészített G = diag(g) mátrixra G AG főátló domináns a soraira és Re (λ i (A)) >. Bizonyítás. Legyen e = [,,..., ] T és B = G AG, ekkor b ij = a ijg j g i (i j) és b ii = a ii >. Be kell látnunk, hogy B főátló domináns a soraira, azaz a ii = b ii > n j=,j i b ij = n j=,j i a ij g j g i (i =,,..., n). Ha az egyenlőtlenséget beszorozzuk a g i > értékkel, akkor a ii g i > n j=,j i a ij g j (i =,,..., n). Ez éppen az AG mátrix főátló dominanciáját adja, amit a 4. tételben bizonyítottunk. A sajátértékekre vonatkozó állítást az első egyenlőtlenségből kapjuk, ha a Gersgorin tételt alkalmazzuk a B mátrixra. Az a ii középpontú Gersgorin körök a jobboldali félsíkon vannak. Másrészt a tételből B és a hasonlósági transzformáció miatt A invertálhatósága is következik. -5. Definíció. Az A mátrixot stabilnak nevezzük, ha bármely λ i sajátértékre Re (λ i ) <. -6. T Ha A M-mátrix, akkor A stabil. Bizonyítás. Láttuk, hogy M-mátrixok esetén Re (λ i ) >. A A mátrix sajátértékei λ i -k, így Re ( λ i ) < miatt A stabil. -7. T A Schur-komplemens megőrzi az M-mátrix tulajdonságot. Bizonyítás. A Gauss-eliminációnak csak az első lépését vizsgáljuk. A tanult képletben a () ij = a ij a i a j, i, j =,..., n }{{} a } {{} az előjel viszonyokat vizsgálva i j-re a >, a i, a j, így a () ij. Tehát az [A a ] Schur-komplementerben az előjelviszonyok megfelelőek. Tekintsük a elimináció. lépését leíró L mátrixot és a g > vektort, melyre Ag >. Mivel L = I l e T és i -re (l ) i = a i a, így L. < L Ag = [ a u T [A a ] ] g = [ ] (Ag) [A a ]g ahol g = [g,..., g n ] T. Ezzel megkaptuk az [A a ] Schur-komplementerhez az M-mátrix definíciójában szereplő g > vektort, melyre [A a ]g >. -8. T Ha az L alsóháromszög- és U felsőháromszög mátrix Z-mátrix és a diagonális elemek pozitívak, akkor
. Alapfogalmak a) L és U M-mátrix, továbbá b) L és U. Bizonyítás. a) A diagonálison kívüli elemekre a feltételek teljesülnek. Keressünk olyan g > vektort, melyre Lg >. Írjuk fel a feltételeket minden komponensre. l g > g > l g + l g > g > l g l l i g +... + l ii g i > g i > l ii (l i g +... + l ii g i ) (i =,..., n) A fenti egyenlőtlenségek a keresett vektor konstrukcióját mutatják. Felsőháromszög mátrixra ugyanígy elkészíthető g > : Ug >. b) L meghatározásához az Lx i = e i egyenleteket kell megoldani i =,..., n-re, a kapott x i vektorok lesznek L oszlopai. l x = x = l x + l x = x = l x = l l i x +... + l ii x i = x i = [l i x +... + l i,i x i, ] > l ii }{{} = j = i +,..., n-re l j x +... + l jj x j = x j = l j x +... +... + l j,j x j, l jj }{{}}{{} = Felsőháromszög mátrixra ugyanígy bizonyítható az inverz elemeinek előjele. -9. T Ha A M-mátrix, akkor A. (A reláció elemenként értendő.) Bizonyítás. Könnyen meggondolható (lásd feladatok), hogy ha A M-mátrix, akkor létezik LUfelbontása és L, U is M-mátrix. Ekkor L, U. A = (LU) = U L -. T Ha A M-mátrix, akkor g = A e jó a definícióban szereplő g vektornak, ahol e = [,,..., ] T. Bizonyítás. Mivel A, így g = A e (, ami kevés) és Ag = AA e = e >. g pozitivitását indirekt bizonyítjuk. Tegyük fel, hogy i : g i =, ekkor n g i = (A ) ij =, j= vagyis A tartalmaz csupa nullákból álló sort. Ez ellentmond az invertálhatóságnak.
.. M-mátrixok 3 A fentiek alapján az M-mátrix definícióját kicserélhetnénk a következővel. -6. Definíció. (Ekvivalens a korábbi definícióval.) Az A R n n mátrix M-mátrix, ha Z-mátrix és A. Megjegyzések.. Ha A (pl. monoton mátrix vagy M-mátrix), akkor az Ag = e megoldása pozitív. Tegyük fel, hogy i : g i =, ekkor n = g i = (A ) ij, j= vagyis A tartalmaz csupa nullákból álló sort. Ez ellentmond az invertálhatóságnak.. Ha az Ax = b, b és A M-mátrix, akkor A -ból következik, hogy x. 3. Ha A M-mátrix, akkor monoton is, ugyanis A. -. T Ha A M-mátrix, akkor A T is M-mátrix. Bizonyítás. (A T ) ij = a ji minden i j-re, tehát A T is Z-mátrix. Válasszuk a g = (A T ) e = (A ) T e vektort. Ez A miatt teljesül. Már csak azt kell belátnunk, hogy nem lehet g egyik komponense sem. Ha az i. komponense lenne, akkor n = g i = (A ) ji (A ) ji = j =,..., n j= vagyis az inverz j. oszlopának összege nulla, ami csak úgy teljesülhet a nemnegativitás miatt, hogy az oszlop minden eleme nulla. Ez ellentmond az invertálhatóságnak. -. T Ha A M-mátrix, akkor g, h > és G = diag(g), H = diag(h) diagonális mátrixokra HAG sorok és oszlopok szerint is főátló domináns. Bizonyítás. Vezessük be a következő jelöléseket B = HAG és G = diag(g) = diag(g i ), H = diag(h) = diag(h i ). Ekkor b ij = h i a ij g j (i, j =,..., n). Írjuk fel B-re, mit jelent, hogy a sorokra főátló domináns. Használjuk fel az előjelekre tett feltételeket. h i a ii g i > n j=,j i h i a ij g j a ii g i > n j=,j i a ij g j = n j=,j i a ij g j (i =,..., n) A kapott feltétel azt jelenti, hogy az A M-mátrix definíciójában szereplő g > : Ag >. Nézzük meg, mit jelent, hogy B az oszlopokra főátló domináns. h i a ii g i > n h j a ji g i h i a ii > n n h j a ji = a ji h j (i =,..., n) j=,j i j=,j i j=
4. Alapfogalmak Átrendezve n (A T h) i = h i a ii + a ji h j > j= (i =,..., n). A kapott feltétel épp azt jelenti, hogy h > vektorra A T h >. -3. L (Szétbontásból származó mátrix normájának becslése) Legyen D = diag(d,..., d n ) diagonális mátrix és A, A mátrixok, hogy A soraira e T i A < d i i =,..., n. Ekkor (A + D) A n max i= e T i A d i e T i A. Bizonyítás. Az A -re tett feltételből következik, hogy (A + D) főátló domináns a soraira, így létezik inverze. A mátrixnorma definícióját felhasználva Tegyük fel, hogy y i = y. Az i. egyenletet felírva és becsülve (A + D) A max (A + D) A x. x = }{{} A x = (A + D) y D y = A x A y n n d i y i = a () ij x j a () ij y n n j a () ij x j + a () ij y j. j= j= j= j= x = és y i = y miatt Átrendezve n n d i y i a () ij + y i a () ij et i A + y i e T i A. j= j= y i ( d i e T i A ) e T i A y i =y e T i A d i e T i A. Mivel nem tudjuk, milyen i-re veszi fel y a végtelen normáját, ezért a jobboldali tört értékét minden i-re kiértékeljük és maximumot veszünk. Ezzel a lemmát beláttuk. -4. T Ha A M-mátrix és g > a definícióban szereplő vektor, akkor A -re a következő becslés adható A g min n i= (Ag). i
.. M-mátrixok 5 Bizonyítás. Lemmával: Legyen G = diag(g), ekkor AG = Ag és G = g. A = GG A = G(AG) (AG) G Mivel AG főátló domináns a soraira, ezért alkalmazhatjuk a Lemmát (AG) -re a következő mátrixokkal. (AG) A = I, D + A = AG, D = diag(ag), A = AG D n max i= e T i I (AG) ii e T i (AG D) ii = A mátrixokra ismert előjelfeltételeket felhasználva (AG) n max i= n max i= a ii g i + n j=,i j a ij g j = A kapott egyenletlenséget beírva a korábbi becslésbe a ii g i n j=,i j a ij g j min n i= (Ag) i A (AG) G g min n i= (Ag) i Lemma nélkül: Tekintsük az Ax = b LER-t tetszőleges b-re. A = max b A b b = max b x b A továbbiakban x -ra fogunk felső becslést adni. Legyen g > vektor az M-mátrix definícójában szereplő, melyre Ag >. Rögzített b esetén keressünk olyan m > számot, melyre A(m g ± x) = m Ag ± b m (Ag) i ± b i (i =,..., n) Mivel Ag >, így osztáskor a reláció iránya nem változik, b i m (i =,..., n) m = (Ag) i b min n i= (Ag) i jó választás. A LER-t a nemnegatív A -zel megszorozva Innen m g ± x mg i x i (i =,..., n) x i m g i (i =,..., n). x m g = b g min n i= (Ag). i A becslést beírva az inverz normabecslésébe, kapjuk az állítást. -4. Példa. Készítsünk az A=tridiag(-,,-) mátrixhoz a definícióban szereplő g > vektort.
6. Alapfogalmak Megoldás.. mo: Az A LU-felbontása A = LU, ahol L = tridiag( i i,, ), U = tridiag(, i +, ). i Oldjuk meg a felbontás segítségével az Ag = LUg = e LER-t. Először oldjuk meg az Lh = e, i i h = h + h = h = + h = 3 > h i + h i = h i = + i i majd az Ug = h háromszög alakú egyenletrendszert. h i > (i =,..., n) n + n g n = h n g n = n n + h n > n n g n g n = h n g n = n n (h n + g n ) > i + g i g i+ = h i g i = i i i + (h i + g i+ ) > (i = n,..., ). mo: Írjuk fel g-re az Ag > feltételeket. g g > < g < g g + g g 3 > g > (g + g 3 ) g i + g i g i+ > g i > (g i + g i+ ) (i = 3,..., n ) g n + g n > < g n < g n Ha a g i értékek egy szigorúan konkáv függvény egyenletes felosztáshoz tartozó értékei, akkor a fenti feltételek teljesülnek. -5. Példa. Igazoljuk, hogy ha A M-mátrix, akkor B is M-mátrix. a ij b ij i j, és < a ii b ii, Bizonyítás. A feltétel miatt B előjeleloszlása megfelel és A B. Ha g > -ra Ag >, akkor Bg Ag >. -6. Példa. Igazoljuk, hogy ha A M-mátrix és P permutációmátrix, akkor P T AP is M-mátrix. Bizonyítás. A permutációmátrixszal végzett hasonlósági transzformáció az i, j-edik sorokat és i, j- edik oszlopokat cseréli meg. Az áltóbeli két elem helyet cserél az átlón kívüli elemek ott maradnak. Ezzel az előjel viszonyok a mátrixon belül nem változnak. Mivel A M-mátrix g > : Ag > APP T g > P T AP(P T g) >, így a g = P T g választással megkaptuk a keresett pozitív elemű vektort, melyre P T AP g >.
.3. A mátrix exponenciális függvény 7 Feladatok -. Igazoljuk, hogy ha A = s I B alakba írható, ahol b ij minden i, j-re és s > ρ(b), akkor A M-mátrix. -3. Igazoljuk, hogy ha A M-mátrix, akkor A = s I B alakba írható, ahol b ij minden i, j-re és s > ρ(b). -4. Igazoljuk, hogy ha A M-mátrix, akkor az LU-felbontásból kapott L és U mátrix is M-mátrix. -5. Igazoljuk, hogy ha A tridiagonális M-mátrix, akkor a Gauss-elimináció végrehajtható. -6. Igazoljuk, hogy ha A M-mátrix, akkor a főminorok pozitívak. -7. Igazoljuk, hogy ha A M-mátrix, akkor az ILU-felbontás végrehajtható és a kapott L, U is M-mátrix. -8. Igazoljuk, hogy ha A M-mátrix, akkor a Jacobi-iteráció konvergál. -9. Igazoljuk, hogy ha A M-mátrix, akkor a Gauss Seidel-iteráció konvergál. -. Igazoljuk, hogy ha A M-mátrix pontosan akkor, ha van olyan D > diagonális mátrix, hogy B = DAD -re (B + BT ) pozitív definit (lásd Miroslav Fiedler: Special Matrices and Their Applications in Numerical Mathematics). -. Igazoljuk, hogy ha A M-mátrix pontosan akkor, ha van van olyan D > diagonális mátrix, melyre DA + A T D pozitív definit (lásd Miroslav Fiedler: Special Matrices and Their Applications in Numerical Mathematics)..3. A mátrix exponenciális függvény Valós és komplex számok esetén az exponenciális függvényt a k= x k k!, x K hatványsor összegfüggvényeként definiáljuk. Mátrixok esetén is ez lesz a definíció. Legyen A egy n n-es mátrix, ekkor e A = I + A + A +... = Ez a sor abszolút konvergens, mert a mátrixnorma szorzatra vonatkozó tulajdonságát felhasználva A k k! A k, k N, k! innen a majoránskritérium feltételét vizsgálva kapjuk, hogy A k k! A k = e A. k! k= A ϕ(t) mátrixfüggvényt ugyanígy definiáljuk: k= k= ϕ(t) = e At A k t k =. k! k= A k k!.
8. Alapfogalmak Az előzőekből következik, hogy minden t-re a végtelen sor abszolút konvergens. Sőt minden véges intervallumon a hatványsor egyenletesen is konvergens, így akárhányszor differenciálható és ϕ (t) = k= k Ak t k k! = k= A Ak t k (k )! = k= A Ak t k k! = Ae At. -5. T (A mátrix exponenciális függvény tulajdonságai). e A = I,. e At invertálható és inverze e At, 3. e At e As = e A(s+t), s, t R, 4. e At deriválható minden t-re és ( e At) = Ae At. -6. T Ha A egyszerű struktúrájú mátrix (diagonalizálható), azaz létezik C invertálható mátrix, melyre A = CDC, ahol D diagonális, (C oszlopai a sajátvektorok). Továbbá f(z) = k= c k z k egy konvergens hatványsor összegfüggvénye az origó körüli z < R körlemez minden pontjában és az összes sajátérték benne van a körben, akkor f(a) = C f(d) C. -7. Példa. A következő A mátrix esetén határozzuk meg az e A mátrixot. 3 3 A = 5 3 Megoldás. A mátrix sajátértékei: λ, =, λ 3 = 4. A λ, = -höz tartozó sajátvektorok: v = [,, ] T, v = [,, 3] T. A λ 3 = 4-hez tartozó sajátvektor: v 3 = [,, ] T. A spektrálfelbontás: 3 3 A = 5 = 3 3 4 3 = CDC. 3 Innen e e A = C(e D )C = e 3 e 4 3. 3-7. L (A mátrix exponenciális függvény nemnegativitása) Legyen A R n n tetszőleges mátrix. Ekkor e At, t a ij i j.
.4. Logaritmikus norma 9 Bizonyítás. : Legyen t ekkor az exponenciális mátrixfüggvény Taylor-sorfejtéséből e At (e At ) ij = a ij t + (A ) ij t + 3! (A3 ) ij t 3 +..., i j. t -val leosztva az egyenlőtlenséget kapjuk, hogy a ij + (A ) ij t + 3! (A3 ) ij t +..., i j. Elégendően kicsi t-t választva ebből következik, hogy i j-re a ij lehet csak. : Rögzítsük a t -t és bontsuk fel A t m -et két mátrixra: A = I, A = I + A t m, ahol m > egész (értékét később fogjuk megadni). ( ) e A t m ) m ( ) m m = (e A +A = e A e A Mivel e A = e I, elegendő A -t megmutatni elég nagy m-re. A diagonális elemre t (A ) ij = a ij, i j. m (A ) ii = + a ii t m a iit m a ii t m. Ha a ii, akkor (A ) ii triviális. Az a ii < esetben válasszuk a feltételnek eleget tevő m-et (minden i-re), majd ezek közül a legnagyobbat. Az exponenciális mátrixfüggvény Taylor-sorfejtéséből e A = I + A + A +..., ami csupa nemnegatív mátrix összegéből áll. Megjegyzés. Ha A nem konstans mátrix, hanem A = A(t) folytonos t-ben, akkor a ij, i j még mindig elégséges ahhoz, hogy c(t) legyen, ahol c (t) = Ac(t)+b(t) és c(), b(t). A bizonyítást lásd [SG. old.]..4. Logaritmikus norma -7. Definíció. Legyen A R n n és. egy vektornorma által indukált mátrixnorma. Ekkor az A mátrix logaritmikus normája a következő mennyiség: µ(a) = lim h + I + ha. h Megjegyezzük, hogy a logaritmikus norma nem mátrixnorma, mert negatív értéke is lehet, de sok tulajdonságában hasonlít a normára. A későbbiekben látni fogjuk, hogy a differenciálegyenletek stabilitásában lesz fontos szerepe. Alsó indexben jelöljük, hogy mely normában számoljuk a logaritmikus normát, például µ (A) az euklideszi normára vonatkozik. Nézzük a speciális n = esetet. Ha A = a R, akkor µ(a) = a, ha pedig A = a C, akkor µ(a) = Re (a), vagyis a logaritmikus norma a valós rész kiterjesztése. A [5] és a [] irodalom részletesen tárgyalja a logaritmikus norma történetét és alkalmazásait. A kitűzött feladatok egy része is innen származik.
. Alapfogalmak -8. T (A logaritmikus norma tulajdonságai) a) A logaritmikus norma jól definált és µ(a) A. b) µ (A) = λ max(a + A T ) c) Ha a. skaláris szorzat segítségével definiált, akkor µ(a) = sup y = (Ay, y). d) A c) pont normájával e At e µ(a)t minden t -ra. Bizonyítás. a) Először belátjuk, hogy az f(h) = I + ha h : R R függvény h > -ra monoton fogyó és alulról korlátos. A vektornorma összegre és különbségre vonatkozó háromszög egyenlőtlenségéből és az indukált normákra ismert I = -ből h A I + ha + h A A I + ha h A. < h < h esetén újra a háromszög egyenlőtlenséggel ) I + h A = ( h I + h (I + ha) h h h h + h I + ha I + ha = + h, h h I + h A I + ha h, h tehát az f monoton, korlátos függvénynek létezik határértéke -ban jobbról. b) A valós skaláris szorzatban lim f(h) = µ(a) h + ( ) (Ay, y) = (y, A T y) = (A T y, y) (Ay, y) = (A + AT )y, y. Az A sym = (A + AT ) szimmetrikus mátrix, az A szimmetrikus részének is nevezik. A Rayleigh-hányadosról tanultak szerint ( (Ay, y) (y, y) = (A + AT )y, y) ( y λ max )) (A + AT. Itt a maximális sajátérték negatív is lehet. A B := I + ha jelöléssel B = λ max (B T B) B T B = (I + ha) T (I + ha) = I + h(a + A T ) + h A T A A kapott kifejezés I + hc alakú, melynek sajátértékei λ i = + hλ i (C) alakúak. λ max (B T B) = + hλ max (A + A T + ha T A). A Bauer-Fike tételt illetve a sajátértékek folytonos függését a mátrix elemeitől felhasználva λ max (A + A T + ha T A) = λ max (A + A T ) + O(h).
.4. Logaritmikus norma A kapott eredményeket egyberakva I + ha = B = + hλ max (A + A T ) + O(h ). A gyökvonáshoz a Taylor-formulát használjuk. Vezessük be a következő valós függvényt: g(h) := + hλ + Kh, λ = λ max (A + A T ), O(h ) Kh. g() =, g (h) := λ + Kh + hλ + Kh g () = λ g(h) = + λ h + O(h ). Ezt felhasználva I + ha = + hλ max(a + A T ) + O(h ) I + ha = h λ max(a + A T ) + O(h), ahonnan h + esetén következik az állítás. c) Legyen y = tetszőleges vektor. (I + ha)y h = ( (I + ha)y )( (I + ha)y + ) h( (I + ha)y + ) = (I + ha)y h( (I + ha)y + ) Írjuk át a valós skaláris szorzat segítségével a számlálót más alakba (I + ha)y = (y + hay, y + hay) = y +h(ay, y) + h Ay = }{{} = = h(ay, y) + h Ay. Az előző törtbe visszaírva (I + ha)y (Ay, y) + h Ay = h (I + ha)y + ) ( (I + ha)y + ) (Ay, y) (h +). Ugyanis a baloldalon álló tört y-ban és h-ban is folytonos. Az y = által meghatározott kompakt halmazon pedig felveszi a maximumát. Innen kapjuk, hogy d) Tegyük fel, hogy µ-re µ(a) = max (Ay, y). y = µ v (Av, v), v R n. Ez a c) pont alapján azt jelenti, hogy µ µ(a). Tekintsük az y (t) = Ay(t) differenciálegyenletet t -ra és szorozzuk skalárisan y(t)-vel n µ y(t) (Ay(t), y(t)) = (y (t), y(t)) = y i(t)y i (t) = ( n ) y i(t)y i (t) = i= i= = ( n ) yi (t) = ( y(t) ) d = dt y(t) = i= = n yi (t) = n yi (t) d dt y(t) = i= = y(t) d dt y(t) i=
. Alapfogalmak A kapott egyenlőtlenséget osztva y(t) -vel és szorozva e µt -vel e µt µ y(t) e µt d dt y(t). Átrendezve e µt µ y(t) + e µt d dt y(t) = (e µt y(t) ). Tehát az ( e µt y(t) ) függvény t-ben fogyó, így e µt y(t) y() y(t) e µt y(). Ide beírva a differenciálegyenlet y(t) = e At y() megoldását e At y() e µt y() eat y() y() Mivel y() tetszőleges, a mátrixnormára is ez a korlát. e µt. e At = e At y() sup e µt y() y() Megjegyzés. A skaláris szorzattal definiált normában felírt logaritmikus normát a (Ay, y) µ(a) = max (Ay, y) = max y = y (y, y) alakban is felírhatjuk. A jobboldalon szereplő hányados a Rayleigh-hányados, melynek tulajdonságairól szimmetrikus mátrix esetén tanultak. Összehasonlításul a norma négyzetére A = max y Ay y = max y (Ay, Ay) (y, y) = max y (A T Ay, y). (y, y) Komplex elemű mátrixok és komplex skaláris szorzat esetén az állítás változik: µ(a) = max y Re (Ay, y) (y, y) -8. Példa. Számítsuk ki a következő mátrix logaritmikus normáját a spektrálnormában. [ ] 4 A = 6 Megoldás. ( A + A T) = ([ ] 4 + 6 [ ]) 4 = 6 [ ] 4 6 A sajátértékei λ = 4, λ = 6, így µ (A) = max λ i i Az eredményünkből az is látható, hogy µ ( A) = max λ i i ( )) (A + AT = 4. ( )) ( A AT = 6.
.4. Logaritmikus norma 3-9. Példa. Számítsuk ki a következő mátrix logaritmikus normáját a spektrálnormában. [ ] A = Megoldás. ( A + A T) = A sajátértékei λ =, λ = 3, így ([ ] + µ (A) = max λ i i Az eredményünkből az is látható, hogy µ ( A) = max λ i i [ ]) = ( )) (A + AT = 3. ( )) ( A AT =. [ ] -. Példa. Számítsuk ki a következő mátrix logaritmikus normáját a normában. [ ] 4 A = 6 Megoldás. I + ha µ (A) = lim h + h Mivel h + határétéket kell számolnunk, ezért feltehető, hogy h < 6, így a diagonális elemek pozitívak. [ ] 4h h I + ha = = max( h, 4h) = h h 6h h µ (A) = lim = h + h -. Példa. Számítsuk ki a következő mátrix logaritmikus normáját az -es normában. [ ] 4 A = 6 Megoldás. I + ha µ (A) = lim h + h Mivel h + határétéket kell számolnunk, ezért feltehető, hogy h < 6, így a diagonális elemek pozitívak. [ ] 4h h I + ha = = max( h, 4h) = h h 6h h µ (A) = lim = h + h
4. Alapfogalmak -9. T (További tulajdonságok) Az -es és mátrixnormában µ (A) = max i µ (A) = max i a ii + a ji j i a ii + a ij. j i Megjegyezzük, hogy komplex elemű mátrixok esetén a ii helyett Re (a ii )-t kell írnunk. Feladatok -. Számítsuk ki a következő mátrixok logaritmikus normáját a spektrálnormában. A = [ ] 4 6, A 7 = [ ] -3. Igazoljuk, hogy µ() =, µ(i) = és µ( I) =. -4. Igazoljuk a definícióval, hogy µ (A) = µ (A ). -5. Igazoljuk, hogy c esetén µ(c A) = c µ(a). -6. Igazoljuk, hogy c < esetén µ(c A) = c µ( A). -7. Igazoljuk, hogy µ(a + B) µ(a) + µ(b). Bizonyítás. A számlálót és nevezőt -vel szorozva és a normákra vonatkozó háromszögegyenlőtlenséget felhasználva bármely h > -ra teljesül a következő egyenlőtlenség: I + h(a + B) h Mindkét oldalon h + határértéket véve I + ha + hb I + ha + I + hb = = h h I + ha I + hb +. h h I + ha I + hb µ(a + B) lim + lim = µ(a) + µ(b). h + h h + h -8. Igazoljuk, hogy µ(a) µ(b) A B. -9. Igazoljuk, hogy z C esetén µ(a + z I) = µ(a) + Re z. -. Igazoljuk, hogy ha D = diag(d ii ) és p N vagy p =, akkor a p normában felírt logaritmikus normában µ p (D) = max d ii és µ p ( D) = min d ii. -. Igazoljuk, hogy ha A szimmetrikus mátrix, akkor µ(a) = λ max (A). -. Igazoljuk, hogy z C esetén µ(z I) = Re (z).
.4. Logaritmikus norma 5 Bizonyítás. Legyen z = z + z i C, ekkor + hz I + hzi =... = + hz = + hz ( + hz ) + (hz ). A határérték kiszámításához a következő függvény deriváltját használjuk. f(h) := ( + hz ) + (hz ), f() =, f (h) = ( + hz )z + hz ( + hz ) + (hz ) lim h + ( + hz ) + (hz ) h f(h) f() = lim = f () = z h + h = z = Re (z) -3. Igazoljuk, hogy skaláris szorzattal definiált normában felírt logaritmikus norma esetén bármely y vektorra µ( A) yt Ay y T y µ(a). -4. Igazoljuk, hogy az A mátrixra felírt Gersgorin-körökre µ ( A) = min {( n i=g i ) R}, max {( n i=g i ) R} = µ (A), és az A T mátrixra felírt Gersgorin-körökre µ ( A) = min {( n G ) } i= i R, max {( n G ) } i= i R = µ (A). A kétféle típusú Gersgorin-körök metszetében vannak az A sajátértékei. Bizonyítás. Az i-edik Gersgorin-kör sugara r i = j i a ij, ezért a logaritmikus norma alakja µ (A) = max(a ii + a ij ) = max(a ii + r i ). i i j i Ez azt jelenti, hogy a -normában a logaritmikus norma a Gersgorin-körök úniójának valós tengellyel vett metszetének legfelső pontja. Nézzük az alsó becslést: µ ( A) = max( a ii + i j i a ij ) = max( a ii + r i ) = min(a ii r i ). i i Ez az eredmény azt jelenti, hogy az -normában a logaritmikus norma a Gersgorin-körök úniójának valós tengellyel vett metszetének legalsó pontja. Az -es normában felírt állítást ugyanígy bizonyítjuk, de ott A T -ra írjuk fel a Gersgorinköröket. Mivel A és A T sajátértékei azonosak és ( n i= G i) ( n G ) i= i tartalmazza az összes sajátértéket, ezért ezzel a sajátértékek és a logaritmikus norma (az -es illetve -normában) kapcsolatára is kaptunk egy állítást. -5. Igazoljuk, hogy az A bármely λ i sajátértékére µ( A) Re (λ i ) µ(a). (Az előző feladatban a Gersgorin-körökre vonatkozó állítás éppen az -es és -normában bizonyítja az állítást. Általánosan nehéz bizonyítani.)
6. Alapfogalmak -6. Igazoljuk, hogy ha µ(a) <, akkor A µ(a). -7. Jelölje A sym = (A + AT ) az A szimmetrikus részét. Igazoljuk, hogy µ (A) c ci A sym pozitív szemidefinit. -8. Jelölje α(a) = max i Re λ i az A sajátértékeinek maximális valós részét (spectral abscissa). Igazoljuk, hogy α(a) µ(a)..5. Állandó együtthatós lineáris differenciaegyenletek A legismertebb differenciaegyenlet a Fibonacci-sorozatra felírt x n+ = x n + x n, x = x = egyenlet a megadott kezdeti feltételekkel. Ehhez hasonló differenciaegyenleteket kapunk többlépéses módszerek eredményeképpen, ezért fontos külön foglalkoznunk az x n n. tag felírásával és a differenciaegyenlet stabilitásával. Az egyenlet megoldásának vizsgálata nagyon hasonló az állandó együtthatós lineáris differenciálegyenletek megoldásához (lásd [] 46. oldalán), így annak ismerete segít a témakör megértésében. -8. Definíció. Legyen l N és α,... α l R, α l, f n R, (n N ), ekkor a l α k y n+k = f n n N k= egyenletet l-edrendű lineáris differenciaegyenletnek nevezzük. Ha α k független n-től, akkor állandó együtthatós (csak ezekkel foglalkozunk), ha f n minden n-re, akkor homogén egyenletnek nevezzük. A differenciaegyenlet megoldásán az y = (y n n =,,...) végtelen sorozatot értjük, melyre l α k y n+k = f n n = l, l +,.... k= Ha az y,..., y l kezdeti feltételeket megadjuk, akkor a differenciaegyenlet megoldása egyértelmű lesz. A l ϱ(z) = α k z k k= l-edfokú polinomot a differenciaegyenlet karakterisztikus polinomjának (vagy karakterisztikus egyenletének) nevezzük.
.5. Állandó együtthatós lineáris differenciaegyenletek 7 -. T A homogén differenciaegyenlet megoldásai lineáris alteret képeznek, vagyis ha y () = (y n () ) és y () = (y n () ) ugyanazon homogén differenciaegyenlet két megoldása, akkor tetszőleges c, c R konstansokra c y () + c y () is megoldása a homogén egyenletnek. Bizonyítás. Lásd Feladatok. -. T Az inhomogén differenciaegyenlet teteszőleges megoldása előállítható ugyanazon inhomogén egyenlet egy partikuláris megoldásának és a homogén egyenlet általános megoldásának összegeként. a) Ha v = (v n ) az inhomogén egyenlet partikuláris megoldása és y = (y n ) a homogén egyenlet általános megoldása, akkor v + y az inhomogén egyenlet megoldása. b) Ha v () = (v n () ) és v () = (v n () ) ugyanazon inhomogén differenciaegyenlet két megoldása, akkor v () v () a homogén egyenlet megoldása. Bizonyítás. Lásd Feladatok. -. T A homogén differenciaegyenlet y (), y (),..., y (m) megoldásai akkor és csak akkor lineárisan függetlenek, ha az y, y,..., y m R l vektorok lineárisan függetlenek, ahol y j = (y (j), y(j),..., y(j) l )T. Bizonyítás. Lásd a [4] jegyzet 43. oldalán. -3. T Ha y (),..., y (m), (m l) lineárisan független megoldásai a homogén differenciaegyenletnek, akkor a homogén egyenlet tetszőleges y megoldása felírható a következő alakban: m y = c k y (k), c,..., c m. Bizonyítás. Lásd Feladatok. k= A továbbiakban a homogén differeciaegyenlet lineárisan független megoldásainak egy maximális elemszámú rendszerét szeretnénk előállítani. Ebben fontos szerepet játszanak a karakterisztikus polinom gyökei. -4. T Ha µ a ϱ karakterisztikus polinom gyöke, akkor y = (y n ) = (µ n ) a homogén egyenlet megoldása. Bizonyítás. Helyettesítsük be y = (y n ) = (µ n )-t a homogén egyenletbe. l l l α k y n+k = α k µ n+k = µ n α k µ k = µ n ϱ(µ) =. k= k= k= -5. T Ha µ,..., µ l a ϱ karakterisztikus polinom gyökei, akkor l y = (y n ), y n c j µ n j j= a homogén egyenlet megoldása. Ha a gyökök különbözők, akkor a (µ n j ) megoldások lineárisan függetlenek.
8. Alapfogalmak Bizonyítás. Helyettesítsük be y = (y n ) = ( l j= c j µ n j )-t a homogén egyenletbe: l l l l l α k c j µ n+k j = c j µ n j α k µ k j = c j µ n j ϱ(µ j ) =. k= j= j= k= j= A függetlenség bizonyításához vegyük a megoldások lineáris kombinációját, mely -t ad minden n-re. Belátjuk, hogy ez csak úgy teljesülhet, ha minden c j =. l c j µ n j = n =,,... j= Azonos kezdeti feltételek esetén c,..., c l -re egy lineáris egyenletrendszert kapunk n =,,..., l -re:... c µ µ... µ l... c. =. µ l µ l... µ l l c l A kapott mátrix a Vandermonde-mátrix transzponáltja, így különböző gyökök esetén a LERnek egyetlen megoldása c = c =... = c l =. Ezzel a függetlenséget beláttuk. -6. T Ha µ a ϱ karakterisztikus polinom gyöke m multiplicitással, akkor (µ n ), (nµ n ), (n(n )µ n ),..., a homogén egyenlet megoldásai és lineárisan függetlenek. ( ) n! (n m + )! µn m+ Bizonyítás. Korábban már beláttuk, hogy (µ n ) megoldása a homogén egyenletnek. Nézzük (nµ n )-t és használjuk fel, hogy ϱ(µ) = és ϱ (µ) = : l α k (n + k)µ n+k = nµ n k= Megjegyezzük, hogy l α k µ k + µ n k= l α k kµ k = nµ n ϱ(µ) + µ n ϱ (µ) =. k= ( l ) α k µ n+k = (µ n ϱ(µ)) = nµ n ϱ(µ) + µ n ϱ (µ), k= vagyis éppen a differenciaegyenlet µ szerinti deriváltját kaptuk. Nézzük a következő függvényt, (n(n )µ n )-t: l α k (n + k)(n + k )µ n+k = k= l = n(n )µ n α k µ k + nµ n k= l α k [n(n ) + ik + k(k )]µ n+k = k= l k= α k kµ k + µ n l α k k(k )µ k = k= = n(n )µ n ϱ(µ) + nµ n ϱ (µ) + µ n ϱ (µ) = = (µ n ϱ(µ)). Az általános eset a differenciaegyenlet µ szerinti j. deriváltja alapján (j =,..., m )-re a szorzat deriválási szabályának felhasználásával kapható meg. ( ) ( ) (µ n ϱ(µ)) (j) = µ n ϱ(µ) (j) j + nµ n ϱ(µ) (j ) j +... + (µ n ) (j) ϱ(µ) =, n j
.5. Állandó együtthatós lineáris differenciaegyenletek 9 mivel µ gyöke a ϱ deriváltjainak is. Ebből végigszámolható az általános képlet esete. Az m. megoldásfüggvényre l k= α k (n + k)(n + k )... (n + k m + )µ n+k m+ = (µ n ϱ(µ)) (m ) =. }{{} =y n+k A függetlenség bizonyításához vegyük a megoldások lineáris kombinációját, mely -t ad minden n-re. Belátjuk, hogy ez csak úgy teljesülhet, ha minden c j =. m j= c j n! (n m + j)! µn m+j = n =,,... Azonos kezdeti feltételek esetén c,..., c m -re egy lineáris egyenletrendszert kapunk n =,,..., m -re:... µ... µ µ....... µ m (m )µ m (m )(m )µ m 3 m!... (m n)! c c c 3. c m =. A kapott alsóháromszögű LER-nek egyetlen megoldása c = c =... = c m =. Ezzel a függetlenséget beláttuk. (A fenti mátrix általánosított Vandermonde-mátrix transzponáltja, az Hermite-interpolációnál találkozunk még vele.) Megjegyzések.. m-szeres gyök esetén a tételben megadott megoldások helyett szokás a (µ n ), (nµ n ), (n µ n ),..., (n m µ n) rendszert is használni. A rendszer bármely eleme előállítható a tételbeli elemekkel és ez fordítva is igaz.. A tételt a következő alakban is meg szokták fogalmazni: Ha µ a karakterisztikus polinom m-szeres gyöke és P (z) egy legfeljebb m -edfokú polinom, akkor a P polinomból előállított p = (p n ) = (P (n)µ n ) megoldása a homogén egyenletnek. -7. T Tegyük fel, hogy µ,..., µ m egymástól és -tól különböző komplex számok. A P (z),..., P m (z) valós együtthatós polinomokkal felírt m P k (n)µ n k =, n =,,... k= azonosság pontosan akkor állhat fenn, ha mindegyik P k (z) polinom azonosan nulla. Bizonyítás. Lásd a [4] jegyzet 46. oldalán.
3. Alapfogalmak -8. T A homogén differenciaegyenlet tetszőleges y = (y n ) megoldása előállítható a y = m k= m k j= c kj n j µ n k =, i =,,... alakban, ahol µ,..., µ m a karakterisztikus polinomnak az m,..., m k multiplicitású gyökei, így m k= m k = l. Bizonyítás. Az előző két tételből következik. -. Példa. Írjuk fel az x n+ = x n + x n, x = x = Fibonacci-sorozat n. tagját és vizsgáljuk a sorozat stabilitását. Megoldás. A differenciaegyenlet x n+ x n x n = átrendezéséből a karakterisztikus polinom: ϱ(z) = z z. Ennek gyökei: µ = + 5 és µ = 5. Az általános megoldás alakja: ( ) n ( ) n + 5 5 x n = c + c, ahol c, c R. Ezeket a konstansokat a kezdeti feltételből határozzuk meg: A. egyenletet átírva Innen = (c + c ) + c = + 5 = 5 x = c + c = ( ) ( ) + 5 5 x = c + c = 5 (c c ) = 5 + (c c ) = c c 5 ( ) + 5 Tehát a Fibonacci-sorozat n. tagjának képlete: x n = ( ) n+ + 5 5 5, c = 5 = 5 ( ) n+ 5. Vizsgáljuk most a sorozat érzékenységét a kezdeti feltételek változására. Ha x helyett x ε -ból illetve x helyett x ε -ből indulnánk, akkor a δ n hibasorozatra Hozzávéve a kezdeti feltételeket δ n+ = x n+ x n+ = (x n + x n ) ( x n + x n ) = = (x n x n ) + (x n x n ) = δ n + δ n. δ n+ = δ n + δ n, δ = ε, δ = ε, vagyis ugyanolyan differenciaegyenletet kapunk, melynek megoldása ( ) n ( ) n + 5 5 δ n = d + d = c + c ( ) 5.
.5. Állandó együtthatós lineáris differenciaegyenletek 3 alakú, ahol d és d értékét a kezdeti feltételekből egy -es LER megoldásával kell meghatározni. Nézzük meg, hogy a kezdeti feltételekben bekövetkező változás hogyan befolyásolja a megoldása változását. Mivel ( 5 ) n 5 < (n ) így ha d, akkor + 5 > ( ) n + 5 (n ), lim δ n = +, n tehát az eltérés bármilyen nagy lehet. (A stabilitáshoz bármely kezdeti feltétel esetén teljesülnie kell, hogy az eltérés korlátos marad.) Látjuk, hogy a problémát az -nél nagyobb abszolútértékű gyök jelenti. Feladatok -9. Igazoljuk, hogy ha y () = (y () i ) és y () = (y () i ) ugyanazon homogén differenciaegyenlet két megoldása, akkor tetszőleges c, c R esetén c y () + c y () is megoldása a homogén egyenletnek. -3. Ha v () = (v n () ) és v () = (v n () ) ugyanazon inhomogén differenciaegyenlet két megoldása, akkor v () v () a homogén egyenlet megoldása. -3. Igazoljuk, hogy ha y (),..., y (m) a homogén differenciaegyenlet megoldásai, akkor tetszőleges c,..., c m R esetén m y = c k y (k) is megoldása a homogén egyenletnek. -3. Igazoljuk, hogy ha y (),..., y (m) a homogén differenciaegyenlet lineárisan független megoldásai, akkor a homogén egyenlet y általános megoldása felírható a következő alakban: y = k= m c k y (k). Az y,..., y l kezdeti feltételek megadása esetén igazoljuk az egyértelműséget. -33. Írjuk fel a x n+ = x n 4 x n differenciaegyenlet általános megoldását és vizsgáljuk a stabilitását a δ = ε és δ = esetben! -34. Írjuk fel a x n+ = 4x n 4x n differenciaegyenlet általános megoldását és vizsgáljuk a stabilitását a δ = ε és δ = esetben! -35. Írjuk fel a x n+ = 9 x n + 7x n 9 x n + x n 3 differenciaegyenlet általános megoldását és vizsgáljuk a stabilitását! (A karakterisztikus polinom gyökei:,,,.) k=
3. Alapfogalmak.6. Differenciálegyenletek alapvető tulajdonságai -9. Definíció. Legyen f(x, y) az x R és y R n argumentumának folytonos vektorfüggvénye, f : R n+ R n. A közönséges differenciálegyenletekből álló rendszer általános alakja y (x) = f(x, y(x)), y(x ) = y. Az y(x ) = y feltételt kezdeti feltételnek nevezzük. A differenciálegyenlet rendszer megoldását egy véges intervallumon keressük. A differenciálegyenlet rendszer megoldása az y : [a; b] R n függvény, folytonosan differenciálható és kielégíti a fenti egyenletet és kezdeti feltételt az x [a; b] pontban. A derivált jelölésére a dy(x) dx vagy d dx y(x), az egyenletre az y = f(x, y) jelölést is használjuk. -. Definíció. A magasabbrendű differenciálegyenlet kezdetiérték feladatának általános alakja: y (n) = f(x, y, y,..., y (n ) ), y(x ) = y (), y (x ) = y (),..., y(n ) (x ) = y (n ), ahol f : R n+ R n adott függvény folytonos az (x, y (),..., y(n ) ) pont környezetében. A differenciálegyenlet megoldása az y R R függvény, mely az x pont környezetében értelmezett, n-szer folytonosan differenciálható és kielégíti a fenti egyenletet és kezdeti feltételeket. -9. T A fenti magasabbrendű differenciálegyenlet kezdetiérték feladatának megoldása azonos a következő elsőrendű diff. egy. rendszer kezdetiérték feladatának megoldásával: y = y, y = y 3,... y n = y n, y n = f(x, y, y,..., y n ), y (x ) = y (), y (x ) = y (),..., y n(x ) = y (n ). Bizonyítás. Nyilvánvaló. Mivel bármely véges zárt intervallum egy lineáris transzformációval a [; ]-re transzformálható, a továbbiakban olyan diff. egy. rendszerekkel foglalkozunk, melynek megoldása az y : [; ] R n függvény. y (C [; ]) n ([; ]-en folytonosan differenciálható) és kielégíti a következő egyenletet és kezdeti feltételt (x = ). y (x) = f(x, y(x)), x [; ], y() = y -. Definíció. Az f(x, y) függvény a második változójában eleget tesz a Lipschitz-feltételnek R n -en, ha létezik olyan L f állandó, melyre f(x, u) f(x, v) L f u v, x [; ], u, v R n. Ekkor f-et Lipschitz-folytonosnak nevezzük és f Lip(y)-nal jelöljük.
.6. Differenciálegyenletek alapvető tulajdonságai 33 Megjegyzések.. Az analízisben D := [x a; x + a] {y R n : y y b} R R n hengerre szokás definiálni a Lipschitz-feltételt, ahol (x, u), (x, v) D és y(x ) = y a kezdeti feltétel.. Ha f(x, y) folytonos, akkor a Cauchy Peano-féle egzisztencia tétel szerint mindig van a kezdetiérték problémának megoldása. 3. Ha f(x, y) folytonos és második változójában eleget tesz a Lipschitz-feltételnek, akkor a Picard Lindelöf tétel szerint a kezdetiérték-feladat lokálisan egyértelműen megoldható. A pontosítást lásd Differenciálegyenletek tárgyból. -3. Példa. Az f(x, y) = cy( y), (c > konstans) folytonos függvény a második változójában Lipschitz-folytonos [; ]-en, így < y esetén az y = cy( y), y() = y kezdetiérték feladatnak van egyértelmű megoldása. A konkrét példa a hírek terjedésére a [] jegyzetben található. Megoldás. Tetszőleges x [; ] és y >, y esetén f(x, y ) f(x, y ) = c y ( y ) y ( y ) = c y y (y y ) = = c y y (y + y ) c y y. Tehát f Lipschitz-folytonos (L = c), a tanult tételek szerint a kezdetiérték feladatnak egyértelmű a megoldása. Ha y =, akkor y(x). Ha y =, akkor y(x). Ha < y <, akkor y(x) = +de cx, ahol d = y y. Ellenőrizzük az utóbbit! y(x)( y(x)) = dce cx y (x) = ( + de cx ) + de cx ( ) + de cx = y() = + d = y d = y y. dce cx ( + de cx ) -4. Példa. Az f(x, y) = y függvény a második változójában nem Lipschitz-folytonos [; ]-en, az y = y, y() = kezdetiérték feladatnak nincs egyértelmű megoldása.
34. Alapfogalmak Megoldás. Tetszőleges x [; ] és y >, y esetén f(x, y ) f(x, y ) = y y = y y y + y y y y. Mivel y nem korlátos, ezért f nem Lipschitz-folytonos. A példánk mutatja, hogy ha nem teljesül a tulajdonság, akkor az egyértelműség nem biztos, hogy teljesül. A kezdetiérték feladatnak y() = kezdeti feltétel esetén két megoldása van: ) y, ugyanis y és y() =. ) y(x) = 4 x, mivel y (x) = x = y(x) és y()=. Ha y y > lenne, akkor y y =: L lenne a Lipschitz konstans. Tehát egy pozitív kezdeti feltétel megoldaná a problémát, de feladatunkban y = szerepel. Feladatok -36. Az f(x, y) = y + 5 függvény a második változójában az egész R-en Lipschitz-folytonos. (L f = ) -37. Lipschitz-folytonosak-e a következő függvények a második változójukban a [; ]-en? a) f(x, y) = e y, b) f(x, y) = y 3, c) f(x, y) = 3 y, d) f(x, y) = y, -38. Igazoljuk, hogy ha f(t, y), g(t, y) Lip(y) az L f, L g Lipschitz-konstanssal (ugyanazon a halmazon) és a, b R, akkor az L φ = a L f + b L g Lipschitz-konstanssal. φ(t, y) = a f(t, y) + b g(t, y) Lip(y) -39. Igazoljuk, hogy ha f(t, y), g(t, y) Lip(y) az L f, L g Lipschitz-konstanssal (ugyanazon a halmazon), akkor φ(t, y) = f(t, g(t, y)) Lip(y) az L φ = L f L g Lipschitz-konstanssal. -4. Igazoljuk, hogy ha f(t, y), g(t, y) Lip(y) az L f, L g Lipschitz-konstanssal (ugyanazon a halmazon) és a, b R, akkor az L φ = a b L f L g Lipschitz-konstanssal. φ(t, y) = a f(t, b g(t, y)) Lip(y) A numerikus megoldás előtt vizsgáljuk a hibák szemszögéből az egyenleteket. Milyenek azok az egyenletek, melyeknél az egyszer elkövetett hibáktól később nem kell tartani?
.6. Differenciálegyenletek alapvető tulajdonságai 35 -. Definíció. Legyen f : [; ] R n R folytonos és. vektornorma R n -en. A differenciálegyenletet disszipatívnak (lecsengőnek) nevezzük az adott vektornormában, ha u(x) v(x) u() v() minden tetszőleges (a kezdeti értékben különböző) u(x), v(x) megoldásra és minden x [; ]- re. A megoldásokat ilyenkor kontraktívnak nevezzük. -3. T (Skaláris egyenlet disszipativitása, n = eset) Legyen f(x, y) folytonos mindkét argumentumában és folytonosan differenciálható y szerint. Az y (x) = f(x, y(x)), x [; ], differenciálegyenlet disszipatív, ha y() = y f(x, y) y, y, x [; ]. Bizonyítás. Tekintsünk két megoldást, u, v-t és vezessük be a z(x) = u(x) v(x) eltérést és a ϕ(x) = { f(x,u(x)) f(x,v(x)) u(x) v(x) f u (x, u(x)) ha u(x) v(x) ha u(x) = v(x) segédfüggvényt. Ekkor z (x) = u (x) v (x) = f(x, u(x)) f(x, v(x)) = ϕ(x)(u(x) v(x)) = (ϕz)(x). A z-re kapott differenciálegyenlet megoldása A deriváltra vonatkozó feltétel miatt ( x ϕ(s) exp ( x ) z(x) = z() exp ϕ(s) ds. Ezzel igazoltuk, hogy u(x) v(x) u() v(). ) ϕ(s) ds z(x) z(). Megjegyzés. Ha éppen ellenkezően f(x, y) y akkor az előző bizonyításból x ϕ(s) ds Mx, így M, u(x) v(x) e Mx u() v() azaz a két megoldás eltérése exponenciálisan nőhet.