1. Számsorozatok és számsorok 1.1. Számsorozatok A számsorozatok egyszer függvények, amelyek hasznos épít kövei lesznek a kés bbi fogalmaknak. 1.1 Deníció. Az a : IN IR típusú függvényeket (valós) számsorozatoknak nevezzük. A számsorozat tehát olyan függvény, amely természetes számokhoz rendel hozzá valós számokat. Ekkor az a(n) helyett az a n jelölést szokásos használni (ezt a sorozat n-edik elemének hívjuk), és magára az a sorozatra a zárójeles (a n ) jelölést is gyakran alkalmazzuk. Pl. ( 1 n ) azt a sorozatot jelöli, amelynek elemei: a 1 = a(1) = 1; a 2 = a(2) = 1 2 ; a 3 = a(3) = 1 3 stb. Egy speciális típusú sorozat az olyan sorozat, amely minden természetes számhoz ugyanazt a valós számot rendeli hozzá, vagyis minden eleme egyenl : 1.2 Deníció. Az (a n ) sorozatot konstans sorozatnak nevezzük, ha létezik olyan α IR szám, amelyre a n = α minden n IN esetén. Fontosak a korlátos sorozatok is. 1.3 Deníció. Az (a n ) sorozatot korlátosnak nevezzük, ha K IR : a n K n IN esetén. Megjegyezzük, hogy a sorozatot alulról korlátosnak nevezzük, ha minden eleme nagyobb vagy egyenl, mint egy bizonyos valós szám, azaz m IR, amelyre a n m n IN, és felülr l korlátosnak nevezzük, ha M IR : a n M n IN. Nyilvánvalóan, egy sorozat pontosan akkor korlátos, ha alulról is és felülr l is korlátos. 1.1.1. Konvergens sorozatok A sorozatok elemei gyakran úgy viselkednek, hogy az n index növelésével minden határon túl megközelítenek egy bizonyos számot. 1.4 Deníció. Azt mondjuk, hogy az (a n ) sorozat konvergens (más szóval létezik véges határértéke), ha van olyan A IR szám, hogy bármely ε > 0 számhoz van olyan N IN küszöbindex, hogy minden n IN, n N esetén a n A < ε. Ekkor az A számot a sorozat határértékének nevezzük, és a lim a n = A vagy az a n A jelölést alkalmazzuk. Úgy is fogalmazhatunk, hogy az (a n ) sorozat tart az A számhoz. 1
Pl. az ( 1 ) sorozat konvergens, és nullához tart. Ugyanis, legyen ε > 0 tetsz leges. Ekkor n mindig van ε-nál kisebb 1 N ha pedig n > N, akkor alakú szám (N IN): 1 N < ε, 1 n < 1 N < ε, azaz 1 n 0 < ε n N. Pl. ε = 1-hez jó lesz küszöbindexnek N = 2, ε = 1/2-hez N = 3, ε = 1/100-hoz N = 101 stb. Vizsgáljuk meg, hogy mi a kapcsolat a korlátosság és a konvergencia között! 1.5 Állítás. Minden konvergens sorozat korlátos. Biz.: Tegyük fel, hogy lim a n = A IR. Ez azt jelenti, hogy ε > 0 N : a n A < ε n N. Így ε = 1 esetén is létezik N 1 index, amelyre a n A < 1 n N 1. Mivel a n = (a n A) + A miatt a n a n A + A, ezért a n 1 + A n N 1. Az N 1 -edik elem el tt pedig csak véges sok elem van, így azok a korlátosság tényét nem befolyásolják, nyilvánvalóan a sorozat minden eleme abszolút értékben kisebb vagy egyenl mint K := max{ a 1, a 2,..., a N1 1, A + 1}. Az állítás megfordítása nem igaz: a sorozat korlátosságából nem következik a konvergenciája, pl. a (( 1) n ) sorozat korlátos, de nem konvergens. 1.2. M veletek sorozatokkal A sorozatok között m veleteket is értelmezhetünk. Ekkor értelmesek az alábbi m veletek: a + b; λ a; a b; Legyenek a, b : IN IR, λ IR. a b, 2
és ezeket a következ képpen deniáljuk: (a + b) : IN IR : (a + b)(n) = a(n) + b(n) a n + b n (λ a) : IN IR : (λ a)(n) = λ a(n) λ a n (a b) : IN IR : (a b)(n) = a(n) b(n) a n b n a : IN IR : ( a a(n) )(n) = = an b b b(n) b n (b n 0) A következ kben arra szeretnénk választ kapni, hogy konvergens sorozatok között a fent bevezetett m veleteket elvégezve mit mondhatunk a kapott új sorozatok konvergenciájáról. Ehhez hasznos lesz a következ fogalom. 1.6 Deníció. Egy (a n ) sorozatot nullasorozatnak nevezünk, ha lim a n = 0. Nyilvánvalóan, (a n ) nullasorozat ε > 0 N IN : a n < ε n N. 1.7 Állítás. lim a n = α (a n α) nullasorozat. Biz.: lim a n = α ε > 0 N : a n α < ε n N (a n α) nullasorozat ε > 0 N : a n α < ε n N. A következ állítás két egyszer segédtételt tartalmaz, amelyek leegyszer sítik a f tételeink bizonyítását. 1.8 Állítás. Legyenek (a n ), (b n ), (c n ) olyan sorozatok, amelyekre a.) (a n ) és (b n ) nullasorozat; b.) (c n ) korlátos sorozat. Ekkor (a n + b n ) és (c n a n ) is nullasorozat. Biz.: a.) ε > 0 N 1 és N 2 : a n < ε 2 n N 1, és b n < ε 2 n N 2. Ekkor n N := max{n 1, N 2 } esetén a n + b n a n + b n < ε. b.) Tegyük fel, hogy c n K n, és legyen ε > 0 tetsz leges. Mivel (a n ) nullasorozat, N : a n < ε K n N. Így a n c n K ε K = ε n N. A m veletek során a konvergens sorozatok jól viselkednek. 1.9 Állítás. Legyenek (a n ), (b n ) tetsz leges konvergens sorozatok, λ IR rögzített szám. Ekkor a.) (a n + b n ) is konvergens, és lim(a n + b n ) = lim a n + lim b n ; b.) (λ a n ) is konvergens, és lim(λ a n ) = λ lim a n ; 3
c.) (a n b n ) is konvergens, és lim(a n b n ) = lim a n lim b n ; d.) ha lim b n 0, akkor ( an b n ) is konvergens, és lim an b n = lim an lim b n. Biz.: Itt csak az a.) és a c.) állítás bizonyítását mutatjuk meg. Vezessük be a következ jelöléseket: A := lim a n, B := lim b n (A, B IR) a.) (a n A) és (b n B) nullasorozatok ((a n A) + (b n B)) is nullasorozat ((a n + b n ) (A + B)) is nullasorozat lim(a n + b n ) = A + B. c.) a n b n AB = (a n A)b n + (b n B)A. Itt mindkét tag egy nullasorozat és egy korlátos sorozat szorzatsorozata, a két tag nullához tart, így az összegsorozat is nullasorozat. Nézzünk néhány további módszert a konvergencia eldöntésére! 1.10 Állítás. (Közrefogási elv vagy rend relv) Tegyük fel, hogy a n c n b n, lim a n, lim b n és lim a n = lim b n = α IR. Ekkor lim c n, és lim c n = α. Ha egy sorozat konvergenciáját a konvergencia denícióját alkalmazva akarjuk megmutatni, akkor nehézséget okozhat az A határérték megsejtése. Ezért hasznos a következ tétel: 1.11 Állítás. (Cauchy-féle konvergenciakritérium) Az (a n ) sorozat pontosan akkor konvergens, ha bármely ε > 0 számhoz N IN küszöbindex, hogy m, n N esetén a n a m < ε. Ez a tulajdonság azt jelenti, hogy a sorozat elemei tetsz legesen megközelítik egymást. 1.2.1. Divergens sorozatok Azokat a sorozatokat, amelyek nem konvergensek, divergens sorozatoknak nevezzük. Egy sorozat többféleképpen lehet divergens. 1.12 Deníció. Azt mondjuk, hogy az (a n ) sorozatnak + a határértéke, ha minden K IR számhoz létezik N IN küszöbindex, amelyre minden n N esetén a n > K. Jelölése: lim a n = + vagy a n +. Ilyen például az a n = n sorozat. 4
1.13 Deníció. Azt mondjuk, hogy az (a n ) sorozatnak a határértéke, ha minden K IR számhoz létezik N IN küszöbindex, amelyre minden n N esetén a n < K. Jelölése: lim a n = vagy a n. Ilyen például az a n = n sorozat. Olyan sorozatra is lehet példát mutatni, amely úgy divergens, hogy sem + -hez, sem pedig -hez nem tart, tehát sem véges, sem végtelen határértéke nem létezik. Ezzel a tulajdonsággal rendelkezik pl. az a n = ( 1) n sorozat, amelynek elemei váltakozva -1-gyel és +1-gyel egyenl k. A + -hez vagy -hez tartó sorozatokkal végzett m veletek nagy körültekintést igényelnek. Itt összegy jtjük a legfontosabb szabályokat. 1. Összeadás: Ha lim a n = A (véges) és lim b n = +, akkor lim(a n + b n ) = +. Ha lim a n = A (véges) és lim b n =, akkor lim(a n + b n ) =. Ha lim a n = + és lim b n = +, akkor lim(a n + b n ) = +. Ha lim a n = és lim b n =, akkor lim(a n + b n ) =. Ha lim a n = + és lim b n =, akkor lim(a n + b n )-r l nem tudunk semmit. 2. Szorzás: { Ha lim a n = A 0 (véges) és lim b n = +, akkor lim(a n b n ) = { Ha lim a n = A 0 (véges) és lim b n =, akkor lim(a n b n ) = +, ha A > 0;, ha A < 0., ha A > 0; +, ha A < 0. Ha lim a n = + és lim b n = +, akkor lim(a n b n ) = +. Ha lim a n = és lim b n =, akkor lim(a n b n ) = +. Ha lim a n = + és lim b n =, akkor lim(a n b n ) =. Ha lim a n = 0 és lim b n = vagy +, akkor lim(a n b n )-r l nem tudunk semmit. 3. Osztás: Ha lim b n = + vagy, akkor lim( 1 b n ) = 0. 5
Ha lim b n = 0 és (b n ) elemei egy bizonyos indext l kezdve mind pozitívak (ill. negatívak), akkor lim( 1 b n ) = + (ill. ). A lim b n = 0 feltételb l önmagában nem következik semmi. an b n = a n 1 b n alapján a hányadossorozat határértékét meg lehet vizsgálni. A határozatlan esetek: a) lim a n = + vagy és lim b n = + vagy. b) lim b n = 0. 1.2.2. Monoton sorozatok 1.14 Deníció. Egy (a n ) sorozatot monoton növ nek nevezünk, ha a 1 a 2..., monoton fogyónak nevezünk, ha a 1 a 2..., szigorúan monoton növ nek nevezünk, ha a 1 < a 2 <..., szigorúan monoton fogyónak nevezünk, ha a 1 > a 2 >... Ha (a n ) egyike a fentieknek, akkor monoton sorozatnak nevezzük. Nyilvánvalóan, egy szigorúan monoton növ (fogyó) sorozat egyben monoton növ (fogyó) is. 1.15 Állítás. Ha az (a n ) sorozat monoton növ és felülr l korlátos, akkor konvergens, és határértéke a sorozat elemeib l álló halmaz legkisebb fels korlátja, azaz lim a n = sup{a 1, a 2,...}. Biz.: Jelölje α := sup{a 1, a 2,...}. Belátandó, hogy lim a n = α. A sup deníciója alapján egyrészt a n α n IN. Másrészt, ε > 0 esetén α ε nem fels korlát, tehát létezik olyan n 0 index, amelyre a n0 > α ε. Mivel a sorozat monoton növ, ezért n > n 0 esetén a n > a n0, tehát a n > α ε. Ezért ε > 0 N : α ε < a n α lim a n = α. Hasonlóan igazolható, hogy ha (a n ) monoton fogyó és alulról korlátos, akkor konvergens, és határértéke a sorozat elemeib l álló halmaz legnagyobb alsó korlátja, azaz lim a n = inf{a 1, a 2,...}. 1.16 Állítás. Ha az (a n ) sorozat monoton növ és felülr l nem korlátos, akkor lim a n = +. (Ha az (a n ) sorozat monoton fogyó és alulról nem korlátos, akkor lim a n =.) Egy monoton sorozatnak tehát mindig van határértéke! 6
1.3. Számsorok Legyen (a n ) : IN IR egy tetsz leges sorozat. Kérdés: Hogyan értelmezhetnénk a sorozatot alkotó végtelen sok elem összegét? Végtelen sok számot még számítógéppel sem tudunk összeadni, annak azonban van értelme, hogy a sorozat els elemeib l egyre többet és többet összeadva megvizsgáljuk, hova tartanak ezen véges sok elemek összegei. 1.17 Deníció. Az S n := a 1 + a 2 + a 3 +... + a n, n IN számot az (a n ) sorozat n-edik részletösszegének nevezzük. Tehát S 1 = a 1, S 2 = a 1 + a 2, S 3 = a 1 + a 2 + a 3 és így tovább. Vegyük észre, hogy ezzel egy újabb számsorozatot készítettünk. Tekintsük ezen részletösszegek (S n ) sorozatát! 1.18 Deníció. Az ((a n ), (S n )) rendezett párt az (a n ) sorozathoz tartozó számsornak (numerikus sornak, vagy egyszer en csak sornak) nevezzük, és a n=1 a n (még rövidebben an ) szimbólummal jelöljük. A végtelen sok elem összegét ezen sorozat határértékeként fogjuk értelmezni, amennyiben az létezik. 1.19 Deníció. Azt mondjuk, hogy az ((a n ), (S n )) sornak létezik összege, ha az (S n ) sorozatnak van határértéke. Amennyiben létezik összeg, akkor arra is szokásos a n=1 a n jelölés használata. Ez a szimbólum tehát a sort is és az összegét is jelöli, de a szövegkörnyezetb l mindig egyértelm, hogy melyikr l van szó. 1.20 Deníció. Ha az (S n ) sorozat konvergens (divergens), akkor a sort konvergens (divergens) sornak nevezzük. Példa. Legyen a n = q n, ahol q IR (mértani sorozat). Ekkor S n = q + q 2 +... + q n = q qn 1 q 1, tehát lim S n = lim(q qn 1 ). Vizsgáljuk meg, létezik-e ez a határérték! Ez a q q 1 számtól, azaz a mértani sorozat hányadosától függ. Több eset lehetséges: 1. Ha q < 1, akkor lim q n = 0, így a lim S n határérték létezik, és nem más, mint A mértani sor ekkor tehát konvergens, és összege q 1 q. 2. Ha q > 1, akkor lim q n = +, így lim S n létezik, és + -nel egyenl. Ebben az esetben tehát a sor divergens, létezik összege, és az +. 3. Ha q 1, akkor lim q n nem létezik, és belátható, hogy lim S n sem létezik, tehát ekkor a mértani sor szintén divergens, de most úgy, hogy nem létezik összege. Érdemes megjegyezni, hogy a 1 1 n 2 sornak π2 6 az összege, így konvergens. n q 1 q. sornak + az összege, tehát divergens, ugyanakkor a 7
1.3.1. Konvergenciakritériumok Egy sor összegének meghatározása nem mindig egyszer feladat. A gyakorlatban igen sokszor csak a konvergencia vagy a divergencia tényét tudjuk megállapítani. Erre számos módszer kínálkozik, ismerkedjünk meg a legfontosabbakkal. Mindenekel tt megmutatjuk, hogy egy sor csak akkor lehet konvergens (azaz akkor létezhet véges összege), ha az a 1, a 2, a 3... számok sorozata nullához tart. Igaz tehát a következ állítás. 1.21 Állítás. Ha a n konvergens, akkor a n 0. Biz.: Ha a n konvergens, akkor (S n ) konvergens, így a Cauchy-féle konvergenciakritérium szerint bármely ε > 0 hibakorláthoz van olyan N küszöbindex, hogy minden m > N és n := m + 1 esetén ε > S n S m = a 1 + a 2 +... + a m + a m+1 (a 1 + a 2 +... + a m ) = a n. Ez pedig éppen azt jelenti, hogy a n 0. Ha tehát az (a n ) sorozat nem tart nullához, akkor a a n sor biztosan divergens! A következ tételpár pozitív tagú sorok konvergenciavizsgálatára használható, és egy másik, ismerten konvergens vagy divergens sorral való összehasonlításon alapul. 1.22 Tétel. (Összehasonlító kritériumok) Legyen (a n ), (b n ) IR + és n IN esetén a n b n. Ekkor 1 o ha b n konvergens, akkor a n konvergens; 2 o ha a n divergens, akkor b n divergens. Biz.: Legyen S n := a 1 + a 2 +... + a n és T n := b 1 + b 2 +... + b n, n IN. Mivel az (a n ) és (b n ) sorozat elemei pozitívak, így (S n ) és (T n ) szigorúan monoton növeked. 1 o Ha b n konvergens, akkor (T n ) konvergens. Ekkor n IN esetén S n T n < lim T n = n=1 b n, tehát (S n ) korlátos is, ezért (S n ) konvergens, azaz a n konvergens. 2 o Ha a n divergens, akkor (S n ) felülr l nem korlátos. Ekkor n IN esetén T n S n miatt (T n ) is felülr l nem korlátos, amib l következik, hogy (T n ) nem konvergens (divergens), így b n divergens. 8
Végezetül, a következ két tétel segítségével az (a n ) sorozat elemeinek vizsgálatával tudunk a konvergencia tényére következtetni. Ezeket a tételeket bizonyítás nélkül közöljük. 1.23 Tétel. (Hányadoskritérium, D'Alembert) Legyen (a n ) olyan sorozat, amelyhez q (0, 1) és N IN, hogy n > N esetén a n+1 /a n q. Ekkor a n konvergens. 1.24 Tétel. (Gyökkritérium, Cauchy) Legyen (a n ) olyan sorozat, amelyhez q (0, 1) és N IN, hogy n > N esetén n a n q. Ekkor a n konvergens. 2. Többváltozós függvények dierenciálszámítása Az el z félévben találkoztunk az IR n (n IN) szimbólummal. Ez a rendezett valós szám-n-esek halmazát jelentette, tehát IR n := {(x 1, x 2,..., x n ) : x i IR, i = 1, 2,..., n}. Ezen a halmazon összeadást és skalárral való szorzást is értelmezhetünk: (x 1, x 2,..., x n ) + ( x 1, x 2,..., x n ) := (x 1 + x 1, x 2 + x 2,..., x n + x n ), λ (x 1, x 2,..., x n ) := (λ x 1, λ x 2,..., λ x n ) (λ IR). Könnyen megmutatható, hogy ezen két m velet tulajdonságai megegyeznek a geometriai vektorok, vagyis az irányított szakaszok összeadásának és skalárral való szorzásának tulajdonságaival, ezért IR n elemeit is szokásos vektoroknak nevezni. (Az "n-dimenziós vektor" kifejezést fogjuk használni.) Deniálunk ezenkívül egy skaláris szorzásnak nevezett m veletet, amely számot ad eredményül: 2.1 Deníció. Az x = (x 1, x 2,..., x n ) és y = (y 1, y 2,..., y n ) IR n vektorok skaláris szorzatán az x, y := számot értjük. n x i y i IR i=1 Bevezetünk egy olyan fogalmat is, amely IR 2 ill. IR 3 esetén a megfelel síkvektorok hosszát fejezi ki, de IR n -ben is használjuk: 9
2.2 Deníció. Az x = (x 1, x 2,..., x n ) IR n vektor euklideszi normáján az x := x 2 1 + x 2 2 +... + x 2 n IR számot értjük. Ebben a fejezetben f : IR n IR m típusú függvények dierenciálszámításával foglalkozunk. Az ilyen függvény n-dimenziós vektorokhoz m-dimenziós vektorokat rendel hozzá, azaz f : (x 1, x 2,..., x n ) (y 1, y 2,..., y m ) módon képez. Elnevezés: n-változós, m-dimenziós vektor érték függvény. Itt n és m tetsz leges pozitív egész számok lehetnek. Ha mindkett t 1-nek választjuk, a már jól ismert valós-valós függvényeket kapjuk. Az alkalmazásokban azonban fontosan a többváltozós, ill. vektor érték függvények is. Mint látni fogjuk, az IR n IR m típusú függvények dierenciálszámításában szükségünk lesz egy egyszer típusú leképezés, az ún. lineáris leképezés fogalmára. Ezért ismerkedjünk meg el ször ezzel a fogalommal! 2.1. Lineáris leképezések és mátrixok Tekintsük azt a függvényt, amely minden valós számhoz az ötszörösét rendeli hozzá! f : IR IR, f(x) = 5x Nézzük meg, hogy mit rendel hozzá ez a függvény két szám összegéhez: x 1, x 2 IR, f(x 1 + x 2 ) = 5(x 1 + x 2 ) = 5x 1 + 5x 2 = f(x 1 ) + f(x 2 ) Azaz két szám összegéhez a megfelel függvényértékek összegét rendeli. Mit rendel egy szám λ-szorosához? x IR, λ IR, f(λ x) = 5 (λ x) = λ 5x = λ f(x). Azaz egy x szám λ-szorosához az x-beli függvényérték λ-szorosát rendeli. 2.3 Deníció. (Valós lineáris függvény) Ha egy f : IR IR függvényre igaz az alábbi két tulajdonság: 1. f(x 1 + x 2 ) = f(x 1 ) + f(x 2 ) x 1, x 2 IR, és 10
2. f(λx) = λf(x) x IR, λ IR, akkor az f függvényt lineáris függvénynek nevezzük. Mint láttuk, az f(x) = 5x függvény eleget tesz a fenti deníciónak, így lineáris függvény. Lineárisak-e a következ valós függvények? a.) f(x) = 0 x IR Legyen x 1, x 2, λ IR tetsz leges. Ekkor f(x 1 + x 2 ) = 0 = f(x 1 ) + f(x 2 ), és f(λx) = 0 = λ f(x). Tehát f lineáris. b.) f(x) = 1 x IR Legyen x 1, x 2 IR. Ekkor f(x 1 + x 2 ) = 1, azonban f(x 1 ) + f(x 2 ) = 1 + 1 = 2 1. Azaz az azonosan 1 függvény nem lineáris. c.) f(x) = x 2 Ez sem lineáris, hiszen pl. f(2x) = (2x) 2 = 4x 2 2 f(x) = 2x 2. d.) f(x) = sin x - szintén nem lineáris, hiszen pl. sin(2 90 o ) = 0 2 sin(90 o ) = 2 e.) f(x) = 5x + 2 f(x 1 + x 2 ) = 5(x 1 + x 2 ) + 2 = 5x 1 + 5x 2 + 2, de f(x 1 ) + f(x 2 ) = 5x 1 + 2 + 5x 2 + 2 = 5x 1 + 5x 2 + 4 5x 1 + 5x 2 + 2 Tehát ez sem lineáris! Ezt a függvényt, és általában az f(x) = ax + b (b 0) alakú függvényeket helyesen lineáris inhomogén függvénynek nevezzük, utalva arra, hogy a valódi lineáris függvényt l csak annyiban különbözik, hogy egy nemnulla konstanst hozzáadtunk. Belátható, hogy az IR IR függvények körében csak az f(x) = a x alakúak lineárisak, ahol a IR rögzített szám. (Az világos az el z ekb l, hogy az ilyen függvény lineáris, de az is könnyen meggondolható, hogy ha egy valós függvény lineáris, akkor csak ilyen alakú lehet. Ugyanis ha f lineáris, akkor f(x) = f(1 x) = f(1) x = a x, ahol a = f(1).) Vegyük észre, hogy a lineáris függvény deníciója f : IR n IR m függvényekre is átvihet, mert ehhez csak az szükséges, hogy szám-n-eseket összeadhassunk, és megszorozhassunk tetsz leges skalárral. 2.4 Deníció. (f : IR n IR m lineáris függvény) Ha egy f : IR n IR m függvényre igaz az alábbi két tulajdonság: 1. f(x + x) = f(x) + f( x) x, x IR n, 2. f(λx) = λf(x) x IR n, λ IR. akkor az f függvényt lineáris függvénynek (vagy lineáris leképezésnek) nevezzük. A fenti egyenl ségek IR m -beli egyenl ségek! 11
Kérdés: az f : IR n IR m függvények körében milyen alakúak a lineáris függvények? Tekintsük el ször az f : IR 2 IR leképezéseket. Ezek számpárokhoz valós számokat rendelnek hozzá: f : (x 1, x 2 ) y IR Az ilyen függvényeket a következ képpen szemléltethetjük. Az értelmezési tartomány (x 1, x 2 ) pontjának megfeleltetjük az xy-sík egy pontját, majd az erre mer leges z tengelyen felmérjük az f(x 1, x 2 ) függvényértéket. Ha például f az IR 2 IR képez konstans 1 függvény, akkor a z = 1 magasságban vízszintesen elhelyezked síkot kapjuk, ez lesz a függvény "grakonja". 2.5 Tétel. Egy f : IR 2 IR függvény pontosan akkor lineáris, ha f(x 1, x 2 ) = a 1 x 1 +a 2 x 2 alakú, ahol a 1, a 2 IR rögzített számok. Biz.: ( ) Ha az f függvény f(x 1, x 2 ) = a 1 x 1 + a 2 x 2 alakú, akkor 1. f((x 1, x 2 ) + ( x 1, x 2 )) = f(x 1 + x 1, x 2 + x 2 ) = a 1 (x 1 + x 1 ) + a 2 (x 2 + x 2 ) = (a 1 x 1 + a 2 x 2 ) + (a 1 x 1 + a 2 x 2 ) = f(x 1, x 2 ) + f( x 1, x 2 ) (x 1, x 2 ), ( x 1, x 2 ) IR 2 esetén. 2. f(λ (x 1, x 2 )) = f(λx 1, λx 2 ) = a 1 λx 1 + a 2 λx 2 = λ(a 1 x 1 + a 2 x 2 ) = λf(x 1, x 2 ) (x 1, x 2 ) IR 2 és λ IR esetén. Tehát f lineáris. ( ) Tegyük fel, hogy f lineáris. Mivel az (x 1, x 2 ) vektor felírható x 1 (1, 0) + x 2 (0, 1) alakban, így (x 1, x 2 ) IR 2 esetén f(x 1, x 2 ) = f(x 1 (1, 0) + x 2 (0, 1)) Mivel f lineáris, ezért tagonként alkalmazhatjuk f-et, és az x 1 és x 2 szorzó kihozható: f(x 1 (1, 0) + x 2 (0, 1)) = x 1 f(1, 0) + x 2 f(0, 1). Vezessük be az a 1 := f(1, 0), a 2 := f(0, 1) jelöléseket. Ezzel f(x 1, x 2 ) = a 1 x 1 + a 2 x 2. Ez azt jelenti, hogy az f : IR 2 IR lineáris leképezések megadhatók két számmal: a 1 és a 2, hozzátéve, hogy melyik az x 1 és melyik az x 2 együtthatója, vagyis egy rendezett számpárral: (a 1, a 2 ). (Itt megállapodás szerint el re írjuk az x 1 együtthatóját, és há- 12
tulra az x 2 együtthatóját. A sorrend fontos, hiszen pl. az f(x 1, x 2 ) = 2x 1 + 3x 2 és az f(x 1, x 2 ) = 3x 1 + 2x 2 függvény két különböz lineáris függvény!) Térjünk át az f : IR 2 IR 2 leképezésekre. Ezek már számpárokhoz számpárokat rendelnek: f(x 1, x 2 ) (y 1, y 2 ) Pl. f(x 1, x 2 ) = (2x 1 + x 2, 3x 1 x 2 2). Világos, hogy a képvektor y 1 és y 2 koordinátája is x 1 és x 2 függvénye: y 1 = f 1 (x 1, x 2 ), y 2 = f 2 (x 1, x 2 ), ahol az f 1 és f 2 függvények IR 2 IR típusúak, és úgy nevezzük ket, hogy f els és második koordináta-függvénye. (A megadott konkrét példában f 1 (x 1, x 2 ) = 2x 1 + x 2, ill. f 2 (x 1, x 2 ) = 3x 1 x 2 2.) Mivel az IR 2 -beli vektorok egyenl sége a megfelel elemeik egyenl ségét jelenti, így egy f : IR 2 IR 2 függvény pontosan akkor lesz lineáris, ha f 1 és f 2 is lineáris, azaz ha a függvény f(x 1, x 2 ) = (a 11 x 1 + a 12 x 2, a 21 x 1 + a 22 x 2 ) alakú, ahol a 11, a 12, a 21, a 22 IR rögzített számok. (Egyik sem függhet x 1 -t l és x 2 -t l!) Így tehát az f : IR 2 IR 2 lineáris leképezések négy számmal adhatók meg: a 11, a 12, a 21, a 22. Mivel fontos az is, hogy melyik szám hol áll, ezért ezeket a számokat egy két sorból és két oszlopból álló számtáblázattal, ún. 2 2-es mátrixszal adjuk meg: [ a 11 a 12 a 21 a 22 ] Mindig az els sorba írjuk az y 1 -ben szerepl együtthatókat: az els helyre az x 1, a második helyre az x 2 együtthatóját, és a második sorba az y 2 együtthatóit, szintén az els helyre az x 1 a második helyre az x 2 együtthatóját. Hangsúlyozzuk, hogy minden f : IR 2 IR 2 lineáris függvényhez egyértelm en hozzá tudunk rendelni egy ilyen 2 2-es "táblázatot", és ez fordítva is igaz: minden 2 2-es táblázatnak egyértelm en megfeleltethet egy f : IR 2 IR 2 lineáris függvény. Térjünk rá ezek után a még általánosabb eset, az f : IR n IR m típusú leképezések vizsgálatára, ahol n, m IN tetsz leges. Ilyenkor a függvény n-változós, és értéke minden IR n -beli pontban egy m-dimenziós vektor: f : (x 1, x 2,..., x n ) (y 1, y 2,..., y m ). 13
A képvektor mindegyik koordinátája x 1, x 2,..., x n függvénye, azaz y 1 = f 1 (x 1, x 2,..., x n ) y 2 = f 2 (x 1, x 2,..., x n ). y m = f m (x 1, x 2,..., x n ) ahol az f i, i = 1, 2,..., m függvények IR n IR típusúak (f koordináta-függvényei). Belátható, hogy egy f : IR n IR m függvény pontosan akkor lineáris, amikor y 1 = a 11 x 1 + a 12 x 2 +... + a 1n x n y 2 = a 21 x 1 + a 22 x 2 +... + a 2n x n. y m = a m1 x 1 + a m2 x 2 +... + a mn x n alakú, ahol a ij, i = 1, 2,..., m, j = 1, 2,..., n rögzített valós számok. Itt már m n darab valós szám határozza meg a leképezést, pontosabban egy m n-es mátrix: a 11 a 12... a 1n a 21 a 22... a 2n.. a m1 a m2... a mn Úgy is szokás fogalmazni, hogy egy f : IR n IR m lineáris leképezés reprezentálható egy m n-es mátrixszal. A mátrixokat nagybet vel (pl. A), a mátrix i-edik sorának j-edik elemét pedig a megfelel kisbet vel és indexelve (a ij ) szokásos jelölni. Az f : IR n IR m képez lineáris függvények halmazát Lin(IR n, IR m ) jelöli, az m n-es mátrixok halmazát pedig az IR m n szimbólum. Az el z ekben láthattuk, hogy a Lin(IR n, IR m ) és az IR m n halmaz között szoros kapcsolat van: az elemeik kölcsönösen egyértelm en megfeleltethet k egymásnak. 2.2. M veletek mátrixokkal A mátrixok körében többféle m veletet értelmezünk. Láttuk, hogy a mátrixok azért fontosak, mert segítségükkel egyszer en megadhatjuk az IR n IR m típusú lineáris leképezéseket. Az ilyen leképezéseknek létezik összege, skalárszorosa, kompozíciója. Éppen ezért a mátrixok közötti m veleteket nem öncélúan értelmezzük, hanem úgy, hogy szoros 14
kapcsolatban legyenek a lineáris leképezések körében végzett m veletekkel. 2.2.1. Mátrixok összeadása Célunk: úgy értelmezni az összeadást mátrixok között, hogy két mátrix összege a megfelel lineáris leképezések összegét reprezentálja. Tekintsünk két IR 2 IR 2 lineáris leképezést: f(x 1, x 2 ) = (a 11 x 1 + a 12 x 2, a 21 x 1 + a 22 x 2 ), és g(x 1, x 2 ) = (b 11 x 1 + b 12 x 2, b 21 x 1 + b 22 x 2 ). [ ] [ ] a 11 a 12 b 11 b 12 (Így tehát az f leképezés mátrixa, a g leképezésé pedig.) a 21 a 22 b 21 b 22 Képezzük f és g összegét, szem el tt tartva, hogy két függvényt mindig úgy adunk össze, hogy az értelmezési tartomány minden egyes pontjában összeadjuk a két függvényértéket: (f+g)(x 1, x 2 ) = f(x 1, x 2 )+g(x 1, x 2 ) = (a 11 x 1 +a 12 x 2 +b 11 x 1 +b 12 x 2, a 21 x 1 +a 22 x 2 +b 21 x 1 +b 22 x 2 ). Látható, hogy eredményül szintén f : IR 2 IR 2 lineáris leképezést kaptunk, amelynek mátrixa [ ] a 11 + b 11 a 12 + b 12. a 21 + b 21 a 22 + b 22 Vegyük észre, hogy az f és g leképezés mátrixának megfelel elemei összeadódtak. Ez általánosabban, IR n IR m lineáris leképezésekre is igaz. Ez motiválja a következ deníciót: 2.6 Deníció. Az A, B IR m n mátrixok A + B összegén azt a C IR m n mátrixot értjük, amelynek elemeire c ij := a ij + b ij, i = 1, 2,..., m, j = 1, 2,..., n. Egyszer bben fogalmazva: m n-es mátrix csak m n-es mátrixszal adható össze, és az összeadást elemenként végezzük. A mátrixok összeadása a következ m veleti tulajdonságokkal rendelkezik: Kommutatív, azaz A + B = B + A A, B IR m n Asszociatív, azaz (A + B) + C = A + (B + C) A, B, C IR m n 15
A csupa nulla elem m n-es mátrix (jelölje most 0) rendelkezik azzal a tulajdonsággal, hogy bármely mátrixhoz adva az illet mátrixok kapjuk vissza: A + 0 = A. Minden A = (a ij ) IR m n mátrixhoz létezik ellentett mátrix, azaz olyan, amelyet A-hoz hozzáadva a nullmátrixot kapjuk. Ezt A-val jelöljük, és könnyen látható, hogy elemei a a ij (i = 1, 2,..., m, j = 1, 2,..., n) számok. 2.2.2. Mátrixok szorzása skalárral Célunk úgy értelmezni a mátrix skalárszorosát, hogy az a mátrixnak megfelel lineáris leképezés skalárszorosát reprezentálja. Képezzük az f(x 1, x 2 ) = (a 11 x 1 + a 12 x 2, a 21 x 1 + a 22 x 2 ) lineáris leképezés λ IR skalárszorosát. Figyelembe véve, hogy egy függvény skalárral való szorzása azt jelenti, hogy a függvényértéket minden helyen megszorozzuk az adott számmal: (λ f)(x 1, x 2 ) = λ f(x 1, x 2 ) = λ (a 11 x 1 + a 12 x 2, a 21 x 1 + a 22 x 2 ) = = (λa 11 x 1 + λa 12 x 2, λa 21 x 1 + λa 22 x 2 ). Látható, hogy lineáris leképezést kaptunk (IR 2 IR 2 ), amelynek mátrixa [ λa 11 λa 12 λa 21 λa 22 ]. Vagyis az f lineáris leképezés mátrixának minden eleme λ-val szorzódik. Ugyanezt a meg- gyelést tehetjük, ha tetsz leges, IR n IR m lineáris leképezés skalárszorosát vizsgáljuk. Ez motiválja a következ deníciót: 2.7 Deníció. Az A = (a ij ) IR m n mátrixnak a λ IR skalárszorosán azt az à = (ã ij ) IR m n mátrixot értjük, amelyre ã ij = λ a ij, i = 1, 2..., m, j = 1, 2,..., n. Jelölése: λ A vagy egyszer bben λa. Mátrixot tehát úgy szorzunk valós számmal, hogy a mátrix minden elemét megszorozzuk az adott számmal. A mátrixok skalárral való szorzása az alábbi m veleti tulajdonságokkal rendelkezik. λ(a + B) = λa + λb (λ + µ)a = λa + µa A, B IR m n, λ IR; A IR m n, λ, µ IR; λ(µa) = (λµ)a A IR m n, λ, µ IR. 16
2.2.3. Mátrixszorzás A mátrixok közötti szorzásm veletet úgy szeretnénk értelmezni, hogy két mátrix szorzata a megfelel lineáris leképezések kompozícióját reprezentálja. Nyilvánvalóan, ha egy g lineáris (vagy nem lineáris) leképezés pl. IR n -b l IR m -be képez, akkor ennek csak abban az esetben képezhetjük a kompozícióját egy másik hasonló típusú leképezéssel f g sorrendben (el ször g hat, azután f!), ha f : IR m IR l. Itt l tetsz leges pozitív egész lehet, de m nem tetsz leges: az IR m a g függvény képtere. Mit lehet mondani egy f : IR m IR l és egy g : IR n IR m lineáris leképezés kompozíciójáról? Az egyszer ség kedvéért azt az esetet nézzük meg részletesebben, amikor n = m = l = 2, azaz mindkét lineáris leképezés IR 2 IR 2 típusú. Legyen tehát g(x 1, x 2 ) = (b 11 x 1 + b 12 x 2, b 21 x 1 + b 22 x 2 ) és f(y 1, y 2 ) = (a 11 y 1 + a 12 y 2, a 21 y 1 + a 22 y 2 ). Az f g kompozíció felírásához az f függvény argumentumában y 1 és y 2 helyébe helyettesítsük be az (x 1, x 2 ) g-képét: (f g)(x 1, x 2 ) = (a 11 (b 11 x 1 +b 12 x 2 )+a 12 (b 21 x 1 +b 22 x 2 ), a 21 (b 11 x 1 +b 12 x 2 )+a 22 (b 21 x 1 +b 22 x 2 )) Az eredmény koordináta-függvényeiben x 1 és x 2 együtthatóit leolvasva látható, hogy f g szintén lineáris leképezés IR 2 IR 2, és a következ mátrixszal azonosítható: [ a 11 b 11 + a 12 b 21 a 11 b 12 + a 12 b 22 a 21 b 11 + a 22 b 21 a 21 b 12 + a 22 b 22 ]. Ennek a mátrixnak az i-edik sorában és j-edik oszlopában (i, j = 1, 2) lév elemét úgy kaphatjuk meg, hogy az A (f mátrixa) i-edik sorában lév vektort skalárisan szorozzuk a B (g mátrixa) j-edik oszlopában lév vektorral. Általában pedig, ha f : IR m IR l és g : IR n IR m lineáris leképezések, akkor (f g) : IR n IR l lineáris leképezés lesz, amelynek mátrixa l n-es, és i-edik sorának j-edik eleme a m k=1 a ikb kj, i = 1,..., l, j = 1,... n képlettel adható meg. Ez indokolja a következ deníciót. 2.8 Deníció. Az A IR l m és B IR m n mátrixok A B szorzatán azt a C IR l n mátrixot értjük, amelynek i-edik sorában és j-edik oszlopában lév elem az A mátrix i-edik 17
sorvektorának és a B mátrix j-edik oszlopvektorának a skaláris szorzata, vagyis amelyre c ij := m a ik b kj, i = 1, 2,..., l, j = 1, 2,..., n. k=1 Vegyük észre, hogy ha adva van egy f lineáris leképezés IR n -b l IR m -be, akkor egy x IR n vektor képét (vagyis az f(x) IR m vektort) is meg tudjuk kapni mátrixszorzás segítségével: a leképezés mátrixával megszorozzuk az x vektort mint n 1-es oszlopmátrixot. Egy IR n -b l IR m -be képez lineáris leképezés tehát nem más, mint egy m n-es mátrixszal való szorzás: f(x) = A x. 2.3. f : IR n IR m típusú függvények folytonossága Az f : IR n IR m típusú függvények folytonosságának az értelmezéséhez szükségünk lesz az IR k -beli vektorsorozat fogalmára. Az els fejezetben számsorozatokkal foglalkoztunk. Láttuk, hogy a számsorozat nem más, mint egy IN IR képez függvény. Ennek mintájára deniálhatjuk az IR k -beli vektorsorozatokat. 2.9 Deníció. Egy IN IR k képez függvényt IR k -beli vektorsorozatnak nevezzük. Jelölés: (x n ) IR k. Ilyen sorozatokra is értelmezhet a konvergencia. Jelölje az sorozat n. elemének, az x n vektornak az i-edik koordinátáját x n,i (i = 1, 2,..., k). 2.10 Deníció. Az (x n ) : IN IR k vektorsorozatot konvergensnek nevezzük, ha minden koordináta-sorozata konvergens valós számsorozat, azaz (x n,i ) IR sorozat konvergens minden i = 1, 2,..., k esetén. Jelölje az (x n,i ) koordináta-sorozat határértékét x i. Ekkor az (x n ) vektorsorozat határértékének az (x 1, x 2,..., x k ) IRk vektort nevezzük. Pl. az az IR 2 -beli vektorsorozat, amelynek n-edik eleme x n := ( 1, 5), konvergens, és n határértéke a (0, 5) vektor. Az x n := ( 1, n) vektorsorozat azonban nem konvergens, mivel n a második koordináta-sorozata + -hez tart. 2.11 Deníció. Azt mondjuk, hogy az f : IR n IR m függvény folytonos az x 0 D(f) pontban, ha minden x n x 0 D(f)-beli vektorsorozatra a képvektorok (f(x n )) IR m sorozata az f(x 0 ) függvényértékhez tart. 2.12 Deníció. Az f : IR n IR m függvényt folytonos függvénynek nevezzük, ha x 0 D(f) pontban folytonos. 18
Folytonosak például a konstans függvények, hiszen ha f(x) = b IR m x IR n, akkor bármely x 0 IR n ponthoz tartó (x n ) sorozatot választva az értelmezési tartományban, az (f(x n )) képvektorok sorozata a konstans b vektorsorozat lesz, ez pedig b-hez tart, ami egyben az x 0 -beli helyettesítési érték is, azaz éppen f(x 0 ). például következ f : IR 2 IR függvény a (0, 0) pontban: f(x, y) := { 1, ha x vagy y = 0 0 egyébként. Nem folytonos ugyanakkor Ugyanis, ha pl. az x n = ( 1, 1 ) sorozattal tartunk a (0, 0) ponthoz, akkor a függvényértékek (f(x n )) = (f( 1, 1 )) sorozata 0-hoz tart, miközben f (0, 0)-beli helyettesítési értéke n n n n nem nulla, hanem 1. Most megmutatjuk, hogy nemcsak a konstans, hanem az IR n IR m lineáris függvények is folytonosak. I. Ha m = n = 1, vagyis f : IR IR és lineáris, akkor f(x) = a x alakú, ahol a IR. Legyen x 0 IR tetsz leges pont, és x n x 0 tetsz leges sorozat. Belátandó, hogy f(x n ) f(x 0 ). Ez igaz, hiszen f(x n ) = a x n a x 0 = f(x 0 ). II. Nézzük most azt az esetet, amikor n = 2 és m = 1, tehát f : IR 2 IR. Ekkor a függvény f(x 1, x 2 ) = a 1 x 1 + a 2 x 2 alakú. Legyen x 0 IR 2 tetsz leges pont, és x n x 0 tetsz leges sorozat IR 2 -ben, vagyis (x n,1, x n,2 ) (x 0,1, x 0,2 ). Belátandó, hogy f(x n ) f(x 0 ). Ez igaz, hiszen f(x n ) = f(x n,1, x n,2 ) = a 1 x n,1 +a 2 x n,2 a 1 x 0,1 +a 2 x 0,2 = f(x 0,1, x 0,2 ) = f(x 0 ). III. Az általános eset és bizonyítása a következ : 2.13 Állítás. Ha f Lin(IR n, IR m ), akkor f folytonos. Biz.: Legyen x 0 IR n = D(f) tetsz leges. Megmutatjuk, hogy f folytonos x 0 -ban. Legyen x j x 0 tetsz leges olyan IR n -beli vektorsorozat, amely x 0 -hoz tart. Ez azt jelenti, hogy (x j ) koordinátánként konvergál x 0 -hoz, vagyis az i-edik koordináták x j,i sorozata tart az x 0 vektor i-edik koordinátájához, x 0,i -hez minden i = 1, 2,..., n. Másképpen: x j,i x 0,i 0. Mivel f Lin(IR n, IR m ), ezért f el áll f(x) = A x alakban, ahol A IR m n. Belátandó, hogy f(x n ) f(x 0 ), vagyis A x j A x 0. Ez utóbbi az (A x j ) i (A x 0 ) i i = 1, 2..., n koordinátánkénti konvergenciát jelenti. Átfogalmazva a következ t kel megmutatnunk: (A x j ) i (A x 0 ) i 0. A mátrixszal való szorzást elvégezve (A x j ) i (A x 0 ) i = n n a ik x j,k a ik x 0,k = k=1 k=1 19 n a ik (x j,k x 0,k ) 0. k=1
Az utolsó lépésben felhasználtuk a sorozatok határértékének m veleti tulajdonságait. Megmutatható még az is, hogy folytonos függvények összege és skalárszorosa is folytonos. Célunk a továbbiakban az f : IR n IR m függvények deriváltjának az értelmezése. Ehhez el ször emlékezzünk vissza a valós-valós függvények deriváltjára ( n = m = 1 eset). 2.4. IR IR függvények deriváltja Egy IR IR függvény deriváltja olyan x 0 pontban értelmezhet, amelyre x 0 intd(f), azaz x 0 bels pontja f értelmezési tartományának. (Ez azt jelenti, hogy van olyan ρ > 0 sugár, amelyre a K ρ (x 0 ) := (x 0 ρ, x 0 + ρ) környezet D(f)-beli. 2.14 Deníció. Azt mondjuk, hogy az f : IR IR függvény dierenciálható az x 0 intd(f) pontban, ha létezik és véges a következ határérték: f(x) f(x 0 ) lim. x x 0 x x 0 Ezt a számot nevezzük az f függvény x 0 -beli deriváltjának. Jelölése: f (x 0 ). M ködhet-e ez a deníció, ha f : IR n IR m? Nem, ugyanis a nevez ben szerepl x x 0 kifejezés ekkor egy IR n -beli vektor lenne, az ezzel való osztást pedig nem értelmezzük. Ezért most olyan ekvivalens deníciót keresünk az IR IR függvények dierenciálhatóságára, amelyet már ki lehet terjeszteni az f : IR n IR m függvények esetére. A derivált fenti deníciójának az átfogalmazásához szükségünk lesz a kisrend függvény fogalmára. 2.15 Deníció. Egy r : IR IR függvényt kisrend nek nevezünk az x 0 D(r) pontban, ha 1) r(x 0 ) = 0; és 2) lim x x0 r(x) x x 0 = 0. 2.16 Megjegyzés. 2)-ben a nevez ben x x 0 is írható. Pl. az x 0 = 0 pontban az r 1 (x) = x 2 függvény kisrend, ugyanis 1) r 1 (0) = 0 2 = 0; és 2) lim x x0 r 1 (x) x x 0 = lim x 0 x 2 x 0 = lim x 0 x = 0. 20
Ugyanakkor az r 2 (x) = x identitásfüggvény már nem kisrend a 0 pontban, hiszen bár r 2 (0) = 0, a 2) feltétel nem teljesül: lim x 0 x x 0 = 1 0. A 2) tulajdonság azt fejezi ki, hogy a kisrend függvény annyira gyorsan tart a nullához az x 0 -ban, hogy még a szintén nullához tartó x x 0 kifejezéssel osztva is nullához tart. Ez szemléletesen azt jelenti, hogy a függvény grakonja az identitásfüggvény (s t minden lineáris függvény) alatt halad be a nullába az x 0 környezetében. Ez a függvény ábrázolásakor abból látható, hogy a függvény grakonja hozzásimul az x-tengelyhez. Ez igaz az r(x) = x 2 függvényre, míg nem igaz az identitásfüggvényre, amelynek a grakonja a nullában csak keresztezi az x tengelyt, de nem simul hozzá. Ezzel eljutottunk az érintkezés fogalmához. 2.17 Deníció. Azt mondjuk, hogy az f : IR IR függvény az x 0 pontban érintkezik a g : IR IR függvénnyel, ha f g kisrend x 0 -ban. Ez grakusan azt jelenti, hogy az f és a g függvény az x 0 -ban ugyanazt az értéket veszi fel, és a két függvény görbéje az x 0 pont környezetében egymáshoz simul. 2.18 Megjegyzés. Ha r és p kisrend x 0 -ban, akkor r + p és λ r (λ IR tetsz leges) szintén kisrend x 0 -ban. 2.19 Megjegyzés. A kisrend ség deníciójából látszik, hogy ha r : IR IR kisrend x 0 -ban, akkor r folytonos is x 0 -ban (hiszen x 0 -ban a határértéke nulla (különben nullához tartó kifejezéssel vett hányadosa nem tarthatna nullához), és ez a helyettesítési értéke is.) Ezzel elérkeztünk egy olyan állításhoz, amely ekvivalens deníciót ad a dierenciálhatóságra. 2.20 Állítás. Egy f : IR IR függvény pontosan akkor dierenciálható az x 0 intd(f) pontban, ha létezik olyan a IR szám, amely mellett f x 0 -ban érintkezik az a(x x 0 ) + f(x 0 ) =: l(x) függvénnyel, vagyis amelyre az r(x) := f(x) l(x) = f(x) (a(x x 0 ) + f(x 0 )), x K(x 0 ) (1) függvény kisrend x 0 -ban. Biz.: ( ) Tegyük fel, hogy f dierenciálható x 0 -ban, és legyen a := f (x 0 ). Megmutatjuk, hogy f érintkezik az l(x) = f (x 0 )(x x 0 ) + f(x 0 ) függvénnyel az x 0 pontban. Ehhez belátandó, hogy az r(x) := f(x) (f (x 0 )(x x 0 ) + f(x 0 )). 21
függvény kisrend x 0 -ban. Ez igaz, ugyanis r(x 0 ) = 0; lim x0 r(x) f(x) (f x x 0 = lim (x 0 )(x x 0 )+f(x 0 )) f(x) f(x x0 x x 0 = lim 0 ) x0 x x 0 f (x 0 ) = 0. ( ) Tegyük fel, hogy (1) igaz. Ekkor Mindkét oldal x 0 -beli határértékét véve f(x) f(x 0 ) x x 0 = a + r(x) x x 0. lim x0 f(x) f(x 0 ) x x 0 = a. Tehát f dierenciálható x 0 -ban, és f (x 0 ) = a. 2.21 Következmény. Az f : IR IR függvények dierenciálhatósága a következ képpen is megfogalmazható. 2.22 Deníció. Azt mondjuk, hogy az f : IR IR függvény dierenciálható az x 0 intd(f) pontban, ha van olyan a IR szám, amely mellett f x 0 -ban érintkezik az a(x x 0 ) + f(x 0 ) =: l(x) függvénnyel. Ekkor az a számot az f x 0 -beli deriváltjának nevezzük, és f (x 0 )-lal jelöljük. 2.23 Deníció. Ha f : IR IR dierenciálható x 0 -ban, akkor a vele x 0 -ban érintkez l(x) = f (x 0 )(x x 0 ) + f(x 0 ) függvényt az f x 0 -beli érint jének nevezzük. Vegyük észre, hogy az érint egy lineáris inhomogén függvény: ahol A = f (x 0 ) és B = f(x 0 ) f (x 0 )x 0. l(x) = Ax + B alakú, A deriválhatóság tehát azt jelenti, hogy a függvénynek van érint je az adott pontban, és a derivált nem más, mint ennek az érint nek a meredeksége. A derivált 2.22. deníciója már közvetlenül átvihet az IR n IR m függvények esetére. 2.24 Deníció. Egy r : IR n IR m függvényt kisrend nek nevezünk az x 0 D(r) pontban, ha 1) r(x 0 ) = 0 (ez az IR m -beli (0, 0,..., 0) vektor!); és 2) lim x x0 r(x) x x 0 = 0.1 1 Az IR n IR m függvények határértékér l itt részletesen nem tanulunk. Ezt a limeszt úgy értsük, hogy ha az x vektor közel van x 0 -hoz akkor r(x) x x 0 közel van a nullvektorhoz. 22
2.25 Megjegyzés. Két kisrend függvény összege és egy kisrend függvény skalárszorosa is kisrend. Továbbá, ha r kisrend x 0 -ban, akkor ott folytonos is. 2.26 Deníció. Azt mondjuk, hogy az f : IR n IR m függvény az x 0 pontban érintkezik a g : IR n IR m függvénnyel, ha f g kisrend x 0 -ban. Legyen f : IR n IR m, x 0 intd(f). 2 2.27 Deníció. Azt mondjuk, hogy az f : IR n IR m függvény dierenciálható az x 0 intd(f) pontban, ha van olyan A Lin(IR n, IR m ) lineáris leképezés (m n-es mátrix), amely mellett f érintkezik az A(x x 0 ) + f(x 0 ) =: l(x) függvénnyel x 0 -ban. Ezt az A mátrixot az f függvény x 0 pontbeli deriváltjának nevezzük. Jelölése: f (x 0 ). A deníció értelmes, ugyanis megmutatható, hogy ha létezik a deníció szerinti A mátrix, akkor csak egy létezik. Nem fordulhat tehát el olyan, hogy egy függvénynek két vagy több deriváltja is legyen egy pontban. 2.28 Deníció. Ha f : IR n IR m dierenciálható x 0 -ban, akkor a vele x 0 -ban érintkez l(x) = f (x 0 )(x x 0 ) + f(x 0 ) függvényt az f x 0 -beli érint jének nevezzük. Ebben az általánosabb esetben is értelmezzük tehát az érint t, ez egy lineáris inhomogén függvény (lineáris és konstans függvény összege), de már IR n IR m típusú. A valós-valós függvényeknél (Matematika 1) láttuk, hogy ahhoz, hogy egy függvény dierenciálható lehessen egy pontban, ott folytonosnak kell lennie. Más szóval, a folytonosság a dierenciálhatóság szükséges feltétele. Nem nehéz belátni, hogy ez IR n IR m függvények esetében is így van. 2.29 Állítás. Ha f : IR n IR m dierenciálható x 0 -ban, akkor f folytonos x 0 -ban. Biz.: Mivel az r := f l különbségfüggvény kisrend, így f = l + r. pedig két, x 0 -ban folytonos függvény összege áll, így f is folytonos x 0 -ban. A jobb oldalon 2.4.1. A deriválás tulajdonságai 2.30 Állítás. Ha f és g : IR n IR m függvények dierenciálhatók x 0 -ban, akkor f + g is dierenciálható x 0 -ban, és (f + g) (x 0 ) = f (x 0 ) + g (x 0 ). 2 A halmaz bels pontja IR n -ben is értelmezhet : olyan pontot jelent, amelynek valamely környezete teljes egészében a halmazban van. Ha pl. a H halmaz IR 2 -beli, akkor x 0 inth azt jelenti, hogy van olyan x 0 középpontú nyílt körlap, amely teljes egészében H-ban van. Pl. az x 2 1 + y 2 2 1 R 2 -beli halmaznak ((0, 0) középpontú egységsugarú zárt körlap) bels pontja a (0, 0), de nem bels pontja az (1, 0) pont.) 23
Biz.: Elegend megmutatni, hogy az l(x) := (f (x 0 ) + g (x 0 ))(x x 0 ) + (f(x 0 ) + g(x 0 )) függvényre az r := (f + g) l függvény kisrend x 0 -ban. 1) r(x 0 ) = (f + g)(x 0 ) (f(x 0 ) + g(x 0 )) = 0; 2) r(x) x x 0 = (f + g)(x) l(x) x x 0 = f(x) [f (x 0 )(x x 0 ) + f(x 0 )] x x 0 + g(x) [g (x 0 )(x x 0 ) + g(x 0 )] x x 0 Mivel f és g dierenciálható x 0 -ban, így a jobb oldalon mindkét hányados nullához tart, ha x x 0. Tehát lim x0 r(x) x x 0 = 0 2.31 Állítás. Ha f : IR n IR m dierenciálható x 0 -ban, és λ IR tetsz leges szám, akkor λ f is dierenciálható x 0 -ban, és (λ f) (x 0 ) = λ f (x 0 ). Biz.: Elegend megmutatni, hogy az r(x) := (λ f)(x) [(λ f (x 0 ))(x x 0 ) + (λ f)(x 0 )] függvény kisrend x 0 -ban. 1) r(x 0 ) = (λ f)(x 0 ) (λ f)(x 0 ) = 0; 2) r(x) x x 0 = λf(x) [f (x 0 )(x x 0 ) + f(x 0 )] x x 0 f(x) l(x) = λ x x 0, ahol l(x) := f (x 0 )(x x 0 ) + f(x 0 ). Mivel f l kisrend x 0 -ban, így a jobb oldali hányados határértéke nulla, ha x x 0. 24
2.4.2. Néhány speciális függvény deriváltja 1. Legyen B : IR n IR m konstans leképezés, azaz olyan, amelyre létezik b IR m : B(x) = b, x IR n. Ekkor B diható minden x 0 IR n pontban, és B (x 0 ) = 0 (az m n-es nullmátrix). Biz.: Belátandó, hogy az r(x) = B(x) [0(x x 0 ) + B(x 0 )] függvény kisrend x 0 -ban. Mivel B(x) = b x IR n, ezért r(x) = b b = 0 a konstans nulla függvény IR n IR m, ami kisrend. 2. Legyen f Lin(IR n, IR m ), azaz f(x) = A x alakú függvény, ahol A IR m n. Ekkor f diható minden x 0 IR n pontban, és f (x 0 ) = f A. Biz.: Belátandó, hogy az r(x) = f(x) [A(x x 0 ) + f(x 0 )] függvény kisrend x 0 -ban. Mivel A(x x 0 ) = Ax Ax 0, és f(x) = Ax, így a jobb oldal Ax Ax + Ax 0 Ax 0 = 0 x IR n, ezért r ismét a konstans nulla függvény IR n IR m, ami kisrend. 2.32 Következmény. Minden f : IR n IR m, f(x) = Ax + B alakú (tehát lineáris inhomogén) függvény minden x 0 IR n pontban dierenciálható, és deriváltja (az összeget tagonként deriválva) f (x 0 ) = A + 0 = A. 2.4.3. Kompozíció deriváltja Legyen g : IR n IR m és f : IR m IR l. Tegyük fel, hogy létezik az f g : IR n IR l kompozíciófüggvény. Sokszor hasznos lesz a kompozíciófüggvény deriváltja, amelynek képletét a következ állításban adjuk meg. 2.33 Állítás. (Láncszabály) Ha léteznek a g (x 0 ) Lin(IR n, IR m ) és f (g(x 0 )) Lin(IR m, IR l ) deriváltak, akkor f g dierenciálható x 0 -ban, és (f g) (x 0 ) = f (g(x 0 )) g (x 0 ). A képletben szerepl kompozíció, mint láttuk, mátrixszorzást jelent. 2.4.4. Iránymenti derivált Legyen f : IR n IR m, a intd(f), e pedig egy olyan IR n -beli vektor, amelynek az euklideszi normája 1, azaz e = 1. 2.34 Deníció. Az α(t) := a + t e (t IR) IR IR n képez függvényt az a ponton átmen, e irányú egyenesnek nevezzük. Vegyük észre, hogy az α függvény egy IR IR n típusú lineáris inhomogén függvény, így minden t 0 IR pontban dierenciálható, és α (t 0 ) = e. Tekintsük az f α : IR IR m függvényt. Ekkor (f α)(t) = f(α(t)) = f(a + t e). 25
2.35 Deníció. Azt mondjuk, hogy az f : IR n IR m függvénynek létezik az a intd(f) pontban az e irányú deriváltja, ha az f α függvény dierenciálható a t 0 = 0 pontban. Ez utóbbi derivált értékét nevezzük az f függvény a pontbeli, e irány menti deriváltjának. Jelölése: e f(a). A következ állítás megadja a derivált és az iránymenti deriváltak közötti kapcsolatot. 2.36 Állítás. Tegyük fel, hogy f : IR n IR m dierenciálható a-ban. Ekkor minden e IR n, e irány szerint létezik e f(a), és e f(a) = f (a) e (A jobb oldalon mátrix-vektor szorzat áll.) Biz.: A kompozíció deriválási szabálya és a lineáris inhomogén függvény deriválási szabálya miatt, kihasználva, hogy α(0) = a: (f α) (0) = f (α(0)) α (0) = f (a) e A tétel megfordítása nem igaz! derivált, még nem következik a függvény deriválhatósága. Abból, hogy minden irányban létezik az iránymenti 2.5. A derivált alakja Már tudjuk, hogy egy f : IR n IR m függvény deriváltja egy pontban, ha létezik, akkor egy Lin(IR n, IR m )-beli elem, ami azonosítható egy m n-es mátrixszal. Még nem esett szó azonban arról, hogy hogyan számíthatók ki ennek a mátrixnak az elemei. Legyen f : IR n IR m. Láttuk, hogy ekkor f-nek van m darab koordináta-függvénye: f(x) = (f 1 (x), f 2 (x),..., f m (x)). Mindegyik f i, i = 1, 2,..., m koordináta-függvény IR n IR képez, és a P i i-edik projekciós operátor segítségével f i felírható f i = P i f alakban. Mivel a P i operátor lineáris, tehát P i Lin(IR m, IR), így mindenhol dierenciálható, és deriváltja saját maga: P i (y 0 ) = P i y 0 IR m. 2.37 Következmény. Tegyük fel, hogy f dierenciálható az a intd(f) pontban. Ekkor minden koordináta-függvénye is dierenciálható a-ban, és f i(a) = P i f (a) Lin(IR n, IR) (Ugyanis f i(a) = (P i f) (a) = P i (f(a)) f (a) = P i f (a).) 26
Ennek az állításnak a megfordítása is igaz! Ugyanis tegyük fel, hogy f mindegyik f i koordináta-függvénye dierenciálható az a-ban, azaz létezik f i(a) Lin(IR n, IR) IR 1 n (mindegyik f i(a) derivált egy sorvektorral azonosítható). Ekkor az r i (x) := f i (x) (f i(a)(x a) + f i (a)), i = 1, 2,..., m (2) függvények kisrend ek. Jelölje A IR m n a következ mátrixot: f 1(a) f A := 2(a). f m(a) Ekkor az r(x) := r 1 (x) r 2 (x). r m (x) IR n IR m függvényt bevezetve a (2) alatti m darab egyenl ség felírható egy vektori egyenl ségként r(x) = f(x) (A(x a) + f(a)) alakban. Mivel r mindegyik koordináta-függvénye kisrend a-ban így r is az. Vagyis f dierenciálható a-ban és deriváltja éppen az A mátrix lesz. Ezzel beláttuk a következ állítást. 2.38 Állítás. Egy f : IR n IR m függvény pontosan akkor dierenciálható az a intd(f) pontban, ha az f i koordináta-függvények (i = 1, 2,..., m) is dierenciálhatók a-ban. Emellett f 1(a) f f (a) = 2(a). f m(a) A továbbiakban meghatározzuk a derivált alakját. El ször két speciális esetet tárgyalunk: 1. f : IR IR m, 2. f : IR n IR. 27
2.5.1. Az f : IR IR m függvények deriváltja Ha f : IR IR m, akkor f(t) = (f 1 (t), f 2 (t),..., f m (t)), ahol az f i koordináta-függvények IR IR típusúak. Ekkor f pontosan akkor dierenciálható a t = t 0 pontban, ha mindegyik koordináta-függvénye dierenciálható, és ekkor a derivált: f 1(t 0 ) f f (t 0 ) = 2(t 0 ). f m(t 0 ) 2.5.2. Az f : IR n IR függvények deriváltja Tudjuk, hogy ha f : IR n IR, akkor f (a) egy n elem sormátrix (sorvektor): f (a) = [λ 1, λ 2,..., λ n ] Határozzuk meg az itt szerepl λ i számokat! Tudjuk, hogy ha f dierenciálható a-ban, akkor minden irány mentén is dierenciálható. Tekintsük speciálisan azt az e i vektort, amelynek i-edik koordinátája 1, a többi pedig nulla. Ekkor tehát létezik ei f(a), és 0 0 ei f(a) = f. (a) e i = [λ 1, λ 2,... λ i,..., λ n ]. 0 1 i) = λ i Vagyis a deriváltvektor i-edik eleme nem más, mint az i-edik egységvektor menti deriváltja f-nek a-ban. 2.39 Deníció. A ei f(a) IR számot az f függvény a pontbeli i-edik parciális deriváltjának nevezzük. Jelölése: i f(a). Ezek lesznek tehát a λ i számok. Így beláttuk a következ állítást. 2.40 Állítás. Tegyük fel, hogy az f : IR n IR függvény dierenciálható a-ban. Ekkor f (a) = [ 1 f(a), 2 f(a),..., n f(a)]. 28
Vizsgáljuk meg közelebbr l ezeket a speciális, parciális deriváltnak hívott iránymenti deriváltakat! Legyen α i (t) = a + t e i = (a 1, a 2,..., a i 1, a i + t, a i+1,..., a n ) az a ponton átmen, e i irányú egyenes. Határozzuk meg az f α i : IR IR függvény t = 0 pontbeli deriváltját! Mivel ez egy valós-valós függvény, használhatjuk a dierenciahányados határértékét: (f α i ) (0) = lim t 0 (f α i )(t) (f α i )(0) t 0 = lim t 0 f(a 1,..., a i 1, a i + t, a i+1,..., a n ) f(a 1,..., a i 1, a i, a i+1,..., a n ) t Áttérve t helyett az x i = a i + t változóra, a következ alakban tudjuk felírni az e i irány menti deriváltat: Jelölje ϕ (i) a = lim x i a i f(a 1,..., a i 1, x i, a i+1,..., a n ) f(a 1,..., a i 1, a i, a i+1,..., a n ) x i a i azt az IR IR függvényt, amelyet úgy deniálunk, hogy f-nek az i-ediken kívül az összes többi változóját rögzítjük az a vektor koordinátáira, azaz legyen ϕ (i) a (s) := f(a 1,..., a i 1, s, a i+1,..., a n ) Ezt a függvényt az f függvény a ponthoz tartozó i-edik parciális függvényének hívjuk. Így tehát az f : IR n IR függvény i-edik parciális deriváltját, azaz f deriváltvektorának i-edik elemét a következ alakban is felírhatjuk: ϕ (i) a (s) ϕ (i) a (a i ) λ i = i f(a) = lim s ai s a i = (ϕ (i) a ) (a i ) Vagyis az i-edik parciális derivált a-ban nem más, mint az a ponthoz tartozó i-edik parciális függvény deriváltja a i -ben. Kérdés: Következik-e a parciális deriváltak létezéséb l a dierenciálhatóság? ugyanis tekintsük a következ f : IR 2 IR függvényt: f(x, y) := { 1, ha x vagy y = 0 0 egyébként. Nem, Ez a függvény az x és az y tengely mentén mindenhol 1-et vesz fel, a tengelyeken kívül pedig nullát. Erre az f függvényre az a = (0, 0) pontbeli els és második parciális függvény 29
is az azonosan 1 függvény: ϕ (1) (0,0)(x) = 1 x IR; ϕ(2) (0,0)(y) = 1 y IR. Ezért létezik az els és a második parciális deriváltja is a (0, 0)-ban, és mindkett 0-val egyenl. Ugyanakkor az f függvény mégsem lehet dierenciálható ebben a pontban, hiszen itt nem folytonos. Tehát a parciális deriváltak létezéséb l nem következik, hogy a függvény is dierenciálható lenne. Adható ugyanakkor elégséges feltétel is a dierenciálhatóságra: 2.41 Állítás. Tegyük fel, hogy az a ponthoz tartozó ϕ (i) a : IR IR parciális függvények folytonosan dierenciálhatók az a i pontban minden i = 1, 2,..., m esetén. Ekkor f dierenciálható a-ban. 2.5.3. Az f : IR n IR m függvények deriváltja Ha f : IR n IR m, akkor f(x) = (f 1 (x), f 2 (x),..., f m (x)), ahol az f i koordináta-függvények IR n IR típusúak. Beláttuk, hogy f (a) pontosan akkor létezik, ha léteznek az f i(a) (i = 1, 2,..., m) deriváltak, és f 1(a) f f (a) = 2(a). f m(a) Mint azt a 2.5.2. fejezetben láttuk, egy IR n IR függvény deriváltja a parciális deriváltak sorvektora. Ebb l következ en az f (a) deriváltmátrix f 1(a) 1 f 1 (a) 2 f 1 (a)... n f 1 (a) f f (a) = 2(a). = 1 f 2 (a) 2 f 2 (a)... n f 2 (a). f m(a) 1 f m (a) 2 f m (a)... n f m (a) alakú. Ezt a mátrixot f a pontbeli Jacobi-mátrixának nevezzük. 2.42 Megjegyzés. El fordulhat, hogy létezik a Jacobi-mátrixban szerepl összes parciális derivált, a függvény mégsem dierenciálható a-ban. Ugyanakkor ha ezek a parciális deriváltak folytonosak is a-ban, akkor a Jacobi-mátrix valóban a derivált. 30