DIFFERENCIÁLÁS, GRADIENS VEKTOR, HESSE MÁTRIX, LÁNCSZABÁLY,

Hasonló dokumentumok
DR. NAGY TAMÁS. egyetemi docens. Miskolci Egyetem Alkalmazott Matematikai Tanszék

Dierenciálhatóság. Wettl Ferenc el adása alapján és

ALGORITMUSAI. DR. NAGY TAMÁS egyetemi docens. Miskolci Egyetem Alkalmazott Matematikai Tanszék

2. SZÉLSŽÉRTÉKSZÁMÍTÁS. 2.1 A széls érték fogalma, létezése

Többváltozós, valós értékű függvények

DR. NAGY TAMÁS. egyetemi docens. Miskolci Egyetem Alkalmazott Matematikai Tanszék

Matematika A1a Analízis

Dierenciálhányados, derivált

9. TÖBBVÁLTOZÓS FÜGGVÉNYEK DIFFERENCIÁLSZÁMITÁSA. 9.1 Metrika és topológia R k -ban

Matematika III előadás

Boros Zoltán február

Differenciálszámítás. 8. előadás. Farkas István. DE ATC Gazdaságelemzési és Statisztikai Tanszék. Differenciálszámítás p. 1/1

Lineáris leképezések. Wettl Ferenc március 9. Wettl Ferenc Lineáris leképezések március 9. 1 / 31

ÉS TESZTEK A DEFINITSÉG

Többváltozós, valós értékű függvények

Kétváltozós függvények differenciálszámítása

A legjobb közeĺıtés itt most azt jelentette, hogy a lineáris

Az egyenlőtlenség mindkét oldalát szorozzuk meg 4 16-al:

Taylor-polinomok. 1. Alapfeladatok április Feladat: Írjuk fel az f(x) = e 2x függvény másodfokú Maclaurinpolinomját!

First Prev Next Last Go Back Full Screen Close Quit

6. ELŐADÁS DIFFERENCIÁLSZÁMÍTÁS II. DIFFERENCIÁLÁSI SZABÁLYOK. BSc Matematika I. BGRMA1HNND, BGRMA1HNNC

f(x) vagy f(x) a (x x 0 )-t használjuk. lim melyekre Mivel itt ɛ > 0 tetszőlegesen kicsi, így a a = 0, a = a, ami ellentmondás, bizonyítva

0-49 pont: elégtelen, pont: elégséges, pont: közepes, pont: jó, pont: jeles

Feladatok a Gazdasági matematika II. tárgy gyakorlataihoz

9. feladatsor: Többváltozós függvények deriválása (megoldás)

MATEMATIKA 2. dolgozat megoldása (A csoport)

Megoldott feladatok november 30. n+3 szigorúan monoton csökken, 5. n+3. lim a n = lim. n+3 = 2n+3 n+4 2n+1

VIK A1 Matematika BOSCH, Hatvan, 5. Gyakorlati anyag

Feladatok megoldásokkal az első gyakorlathoz (differencia- és differenciálhányados fogalma, geometriai és fizikai jelentése) (x 1)(x + 1) x 1

Függvény differenciálás összefoglalás

Norma Determináns, inverz Kondíciószám Direkt és inverz hibák Lin. egyenletrendszerek A Gauss-módszer. Lineáris algebra numerikus módszerei

1. Parciális függvény, parciális derivált (ismétlés)

2014. november Dr. Vincze Szilvia

Matematika I. Vektorok, egyenesek, síkok

SCILAB programcsomag segítségével

A fontosabb definíciók

Gauss-Jordan módszer Legkisebb négyzetek módszere, egyenes LNM, polinom LNM, függvény. Lineáris algebra numerikus módszerei

Matematika szigorlat június 17. Neptun kód:

KONVEX HALMAZ, FARKAS TÉTEL, GORDAN TÉTEL, EXTREMÁLIS PONT, EXTREMÁLIS IRÁNY, LINEÁRIS PROGRAMOZÁS ELMÉLETE

Feladatok megoldásokkal a 9. gyakorlathoz (Newton-Leibniz formula, közelítő integrálás, az integrálszámítás alkalmazásai 1.

Feladatok megoldásokkal a harmadik gyakorlathoz (érintési paraméterek, L Hospital szabály, elaszticitás) y = 1 + 2(x 1). y = 2x 1.

Parciális dierenciálegyenletek

1. Bevezetés. 2. Felületek megadása térben. A fenti kúp egy z tengellyel rendelkező. ismerhető fel, hogy. 1. definíció. Legyen D R n.

KOVÁCS BÉLA, MATEMATIKA I.

Analízis II. Analízis II. Beugrók. Készítette: Szánthó József. kiezafiu kukac gmail.com. 2009/ félév

A KroneckerCapelli-tételb l következik, hogy egy Bx = 0 homogén lineáris egyenletrendszernek

MATE-INFO UBB verseny, március 25. MATEMATIKA írásbeli vizsga

Óravázlatok: Matematika 2.

Konvex optimalizálás feladatok

Vektorterek. Wettl Ferenc február 17. Wettl Ferenc Vektorterek február / 27

Matematika A1a Analízis

Matematika (mesterképzés)

2014. szeptember 24. és 26. Dr. Vincze Szilvia

KOVÁCS BÉLA, MATEMATIKA I.

Függvények július 13. Határozza meg a következ határértékeket! 1. Feladat: x 0 7x 15 x ) = lim. x 7 x 15 x ) = (2 + 0) = lim.

sin x = cos x =? sin x = dx =? dx = cos x =? g) Adja meg a helyettesítéses integrálás szabályát határozott integrálokra vonatkozóan!

MATEMATIKA ÉRETTSÉGI TÍPUSFELADATOK KÖZÉPSZINT Függvények

Függvények július 13. f(x) = 1 x+x 2 f() = 1 ()+() 2 f(f(x)) = 1 (1 x+x 2 )+(1 x+x 2 ) 2 Rendezés után kapjuk, hogy:

Vektorok és koordinátageometria

A L Hospital-szabály, elaszticitás, monotonitás, konvexitás

6. Folytonosság. pontbeli folytonosság, intervallumon való folytonosság, folytonos függvények

Matematika II. 1 sin xdx =, 1 cos xdx =, 1 + x 2 dx =

Konjugált gradiens módszer

Függvények Megoldások

Figyelem, próbálja önállóan megoldani, csak ellenőrzésre használja a következő oldalak megoldásait!

MATEMATIKA ÉRETTSÉGI TÍPUSFELADATOK KÖZÉP SZINT Függvények

HÁZI FELADATOK. 1. félév. 1. konferencia A lineáris algebra alapjai

Egyváltozós függvények 1.

Nemlineáris programozás 2.

Haladó lineáris algebra

Határozott integrál és alkalmazásai

Függvények határértéke, folytonossága

b) Ábrázolja ugyanabban a koordinátarendszerben a g függvényt! (2 pont) c) Oldja meg az ( x ) 2

Szélsőérték-számítás

Összeállította: dr. Leitold Adrien egyetemi docens

Maple: Deriváltak és a függvény nevezetes pontjai

MATEMATIKA ÉRETTSÉGI TÍPUSFELADATOK MEGOLDÁSAI KÖZÉPSZINT Függvények

Függvények vizsgálata

Ipari matematika 2. gyakorlófeladatok

Matematika II képletek. 1 sin xdx =, cos 2 x dx = sh 2 x dx = 1 + x 2 dx = 1 x. cos xdx =,

ALGORITMUSAI DR. NAGY TAMÁS. egyetemi docens. Miskolci Egyetem Alkalmazott Matematikai Tanszék

A derivált alkalmazásai

Vektorok, mátrixok, lineáris egyenletrendszerek

First Prev Next Last Go Back Full Screen Close Quit. (Derivált)

FELVÉTELI VIZSGA, július 21. Írásbeli próba MATEMATIKÁBÓL A. RÉSZ

Határozatlan integrál (2) First Prev Next Last Go Back Full Screen Close Quit

Ellipszisekr½ol részletesen

Komplex számok trigonometrikus alakja

15. LINEÁRIS EGYENLETRENDSZEREK

MATEMATIKA ÉRETTSÉGI TÍPUSFELADATOK KÖZÉP SZINT Függvények

PTE PMMFK Levelező-távoktatás, villamosmérnök szak

Exponenciális, logaritmikus függvények

12. Mikor nevezünk egy részhalmazt nyíltnak, illetve zártnak a valós számok körében?

Differenciálegyenletek. Vajda István március 4.

First Prev Next Last Go Back Full Screen Close Quit. (L Hospital szabály, Taylor-polinom,

Egyenletek, egyenlőtlenségek VII.

MATEMATIKA ÉRETTSÉGI TÍPUSFELADATOK MEGOLDÁSAI KÖZÉPSZINT Függvények

A dierenciálszámítás alapjai és az érint

Q 1 D Q 2 (D x) 2 (1.1)

MATEK-INFO UBB verseny április 6.

Átírás:

DIFFERENCIÁLÁS, GRADIENS VEKTOR, HESSE MÁTRIX, LÁNCSZABÁLY, IMPLICIT FÜGGVÉNY TÉTEL DR NAGY TAMÁS egyetemi docens Miskolci Egyetem Alkalmazott Matematikai Tanszék A bemutatott kutató munka a TÁMOP-B-0//KONV-00-000 jel½u projekt részeként az Európai Unió támogatásával, az Európai Szociális Alap társ nanszírozásával valósul meg This research was carried out as part of the TAMOP-B-0//KONV-00-000 project with support by the European Union, co- nanced by the European Social Fund Miskolc, 0

TARTALOMJEGYZÉK Tartalomjegyzék Bevezetés Di erenciálhatóság egyváltozós függvény esetén Iránymenti derivált 5 Di erenciálhatóság többváltozós függvény esetén 5 Di erenciálhatóság fogalma 5 Gradiens vektor vizsgálata Gradiens vektor tulajdonságai 8 Példa gradiens vektorrra 9 5 Kétszer di erenciálhatóság többváltozós függvény esetén 0 5 Kétszer di erenciálhatóság fogalma 0 5 Példa Hesse mátrixra 0 5 Gyakori függvények gradiense és Hesse mátrixa Középérték tétel, Taylor tétel Láncszabály 8 Implicit függvény tétel 5

BEVEZETÉS Bevezetés Az optimalizálási feladatban szerepl½o többváltozós valós függvények (akár a célfüggvény, akár a feltételi függvények nagyon sok esetben di erenciálható függvények Így a di erenciálhatóság az optimalizálásban nagyon fontos szerepet játszik, ezért foglalkozunk vele külön tananyagban A tananyag a többváltozós valós függvények di erenciálhatóságának kérdéseit taglalja, többek között megismerkedünk az iránymenti derivált, a gradiens vektor, a Hesse mátrix fogalmával, majd az összetett függvény deriválási szabályával, az ún láncszabállyal, illetve az ehhez szorosan kapcsolódó ún implicit függvény tétellel Di erenciálhatóság egyváltozós függvény esetén El½oször az egyváltozós függvény di erenciálásával foglalkozunk nagyon röviden és azt fogjuk általánosítani a többváltozós függvényekre Az f : R! R egyváltozós valós függvény di erenciálhatósága jól ismert fogalom, mi szerint akkor mondjuk, hogy az f(x függvény az x R pontban di erenciálható, ha létezik az alábbi határérték és az véges f 0 (x x x!x f(x f(x ; x vagy szokás az el½oz½ovel ekvivalens de níciót is használni f 0 f(x + f(x (x :!0 A határértéket di erenciálhányadosnak, vagy deriváltnak nevezzük és ahogy látjuk f 0 (x szimbólummal jelöljük Szokásos az f 0 helyett a df szimbólummal való jelölés is dx Geometriai értelmet is adhatunk a deriváltnak Az f(x f(x di erenciahányados az f(x x x függvény képének az x és x értékeknél a függvénypontokat összeköt½o egyenes, nevezetesen a szel½o egyenes iránytangense (iránytényez½oje A derivált pedig ennek a di erenciahányadosnak a határértéke, amely geometriailag a függvény x pontbeli érint½o egyenesének az iránytényez½oje Iránytangens (iránytényez½o alatt az egyenes és az x tengely pozitív félegyenese által bezárt szög tangensét értjük Megkülönböztetünk jobboldali és baloldali deriváltakat, aszerint, hogy jobbról, ill balról tartunk az x ponthoz, vagy a második értelmezésben a pozitív, ill negatív értékeken keresztül tart a zérushoz Ez utóbbi esetben a határérték jelölésben a! 0+, ill a! 0 szimbólumokat használjuk A jobboldali és baloldali deriváltakat nevezhetjük iránymenti deriváltaknak is, mivel más-más irányból képezzük a határértéket Például az f(x jxj függvény az x 0 pontban nem deriválható, viszont ebben a pontban létezik jobboldali és baloldali derivált, amely rendre + és Az egyváltozós függvény di erenciálására adott második formulát egyszer½uen általánosíthatjuk többváltozós függvényekre is, ezt a deriváltat iránymenti deriváltnak nevezzük és az alábbi pontban fogjuk precizen de niálni Sajnos egyik formula sem alkalmas a többváltozós függvény di erenciálására Amennyiben az els½o formulát átírjuk az f(x f(x + f 0 (x(x x + jx xj (x; x x

DIFFERENCIÁLHATÓSÁG EGYVÁLTOZÓS FÜGGVÉNY ESETÉN alakra, akkor az f(x függvény x R pontbeli di erenciálhatósága az alábbiak szerint fogalmazható át De níció: Az f : R! R függvény di erenciálható az x pontban, ha létezik egy f 0 (x R véges valós szám és egy : R! R függvény úgy, hogy ahol x!x (x; x x 0 f(x f(x + f 0 (x(x x + jx xj (x; x x Az átfogalmazásra azért volt szükségünk, mert ez a formula már alkalmas többváltozós függvények di erenciálhatóságának de niálására Ezért vizsgáljuk meg közelebbr½ol ezt a formulát, tekintsuk az alábbi ábrát Az ábrán az x jelölésére az x 0 szimbólumot használtuk Az ábrán látható, hogy az x pontbeli függvényérték három mennyiség összegeként adódik Az els½o mennyiség az x x 0 pontbeli függvényérték, a második mennyiség a deriválttal kapcsolatos, pontosabban az x x 0 pontbeli érint½oegyenesen mért mennyiség, a harmadik mennyiség pedig az az érték, amely zérushoz tart, ahogy közelítünk a x x 0 ponthoz Mint látni fogjuk a többváltozós függvények esetében is ez a három tag jelenik meg A második tag viszont nem az érint½oegyenessel kapcsolatos Kétváltozós esetben még ábrázolhatók a viszonyok, de több változó esetében már nem Kétváltozós esetben a második tag az ún érint½osíkon mért mennyiséget fejezi ki A formulából az f 0 (x derivált jelentése is kiolvasható Amennyiben az x pont elegend½oen közel van az x x 0 ponthoz, akkor a harmadik tag elhanyagolhatóan kicsi, így az f(x és az f(x függvények különbsége (f megközelít½oleg a derivált és az x értékek különbségének a szorzata, képletben: f f 0 (x(x x Szokás azt is mondani, ha egy egységgel jobbra mozdulunk az x x 0 ponttól, akkor a függvény megváltozása megközelít½oleg a deriválttal azonos Itt azonban a "megközelít½oleg" nem minden esetben igaz

IRÁNYMENTI DERIVÁLT 5 Gondoljunk az x függvényre és legyen x A derivált értéke itt x Egy egységgel jobbra mozdulva, a függvény megváltozása f Ez a megváltozás ( pedig nem mondható, hogy megközelít½oleg egyenl½o a derivált értékével ( Még rosszabb a helyzet magasabb kitev½oj½u hatványfüggvény esetén Gondoljunk az ln x függvényre és legyen x 0 A derivált értéke itt 0; 05 x 0 Egy egységgel jobbra mozdulva, a függvény megváltozása f ln ln 0 0:089 Ez a megváltozás már megközelít½oleg egyenl½o a derivált értékével Ezért is szokás mondani a fentebb említetteket, mert bizonyos esetekben a derivált valóban közel van a függvényváltozáshoz Ha például x, akkor már elég gyenge a közelítés Mint láttuk ez a felfogás nagyon hibás eredményre vezethet, ezért csak azt mondhatjuk, hogy elegend½oen kicsi > 0 esetén jobbra mozdulva a függvény megváltozása f f 0 (x A derivált el½ojele viszont egyértelm½uen jelzi azt, hogy a függvény milyen irányban változik Pozitív érték½u derivált esetén a függvény jobbra növekszik, balra pedig csökken Negatív érték½u derivált esetén a függvény jobbra csökken, balra pedig növekszik Sokszor a második formula átírását használjuk, amely szerint az f : R! R függvény di erenciálható az x pontban, ha létezik egy f 0 (x R véges valós szám és egy : R! R függvény úgy, hogy f(x + f(x + f 0 (x + jj (x; ahol!0 (x; 0 Iránymenti derivált Legyen S R n egy nemüres halmaz és legyen f : S! R függvény Legyen x S és legyen d R n ; d 0 olyan vektor, hogy x + d S; > 0 elegend½oen kicsi valós számra Az f függvénynek az x pontban a d irány mentén vett iránymenti deriváltjának nevezzük és f 0 (x; d-vel jelöljük az alábbi határértéket, ha létezik: f 0 (x; d f(x + d f(x : Az f 0 (x; d iránymenti derivált az f függvénynek a változását méri a d irányban A d irány elvileg bármilyen vektor lehet, a változás mérése azonban csak akkor lesz hasonló az egyváltozós esethez, ha a d irányvektor hossza egy, azaz kdk A fenti képlet számlálójában a függvény megváltozása (f szerepel, így az iránymenti derivált azt fejezi ki, hogy elegend½oen kicsi > 0 esetén a függvény megváltozása a d irányban megközelít½oleg az iránymenti derivált értékének és a számnak a szorzata, képletben: f f 0 (x; d Di erenciálhatóság többváltozós függvény esetén Di erenciálhatóság fogalma Legyen S R n egy nemüres halmaz, legyen f : S! R függvény Az f függvény di erenciálható az S halmaz egy x bels½o pontjában, ha létezik egy rf(x R n vektor és egy

DIFFERENCIÁLHATÓSÁG TÖBBVÁLTOZÓS FÜGGVÉNY ESETÉN : R n! R függvény úgy, hogy f(x f(x + rf(x(x x + kx xk (x; x x minden x S-re, ahol x!x (x; x x 0 Megjegyzés: A kés½obbiekben általában úgy használjuk a di erenciálhatósági összefüggést, hogy az x helyébe x-et, x helyébe pedig x + d ( R vektort írunk, ekkor x x d: Ez esetben a di erenciálhatósági formula az alábbi alakot ölti: f(x + d f(x + rf(xd + jj kdk (x; d minden d vektorra és valós számra A formulában szerepl½o határérték az alábbiak szerint alakul,!0 (x; d 0 Az alábbiakban a de nícióban szerepl½o, nagyon fontos rf(x vektort vizsgáljuk rf(x vektort gradiens vektornak nevezzük A Gradiens vektor vizsgálata TÉTEL (d és d irányba vett iránymenti derivált kapcsolata Legyen f : S! R di erenciálható függvény Ekkor a d és a d irányba vett iránymenti deriváltak abszolút értékben nem, csak el½ojelben különböznek egymástól, azaz Bizonyítás Induljunk ki a f 0 (x; d f 0 (x; d: f(x + d f(x + rf(xd + jj kdk (x; d di erenciálhatósági összefüggésb½ol Átrendezés és határértékképzés után adódik, hogy Most induljunk ki a f(x + d f(x rf(xd: f(x + ( d f(x + rf(x( d + jj k dk (x; ( d di erenciálhatósági összefüggésb½ol Az átrendezés és határértékképzés után a következ½o adódik f(x + ( d f(x rf(xd: A baloldal értéke az els½o esetben f 0 (x; d, a második esetben pedig f 0 (x; d A jobboldalak gyelembe vételével valóban a tételbeli f 0 (x; d f 0 (x; d összefüggést kapjuk Qed

DIFFERENCIÁLHATÓSÁG TÖBBVÁLTOZÓS FÜGGVÉNY ESETÉN A fenti tétel egy fontos megállapítást mond ki di erenciálhatóság (létezik a rf(x vektor esetére, nevezetesen, ha egy irányban növekszik (csökken a függvény, akkor az ellenkez½o irányban ugyanolyan mértékben csökken (növekszik TÉTEL (az iránymenti derivált és a rf(x vektor kapcsolata Legyen f : S! R di erenciálható függvény és legyen a d irányvektor egységhosszúságú, azaz kdk Ekkor az iránymenti derivált megegyezik a rf(x vektor és az egységhosszúságú irányvektor skaláris szorzatával, azaz f 0 (x; d rf(xd: Bizonyítás A fenti tétel bizonyításából kiolvasható az állítás, azaz Qed f(x + d f(x rf(xd: TÉTEL (a rf(x vektor a parciális deriváltak vektora Legyen f : S! R di erenciálható függvény A rf(x vektor elemei az f függvény parciális deriváltjai, azaz @f(x rf(x ; @f(x ; : : : ; @f(x : Bizonyítás Induljunk ki a d és bizonyításából, ahol d irányba vett iránymenti derivált kapcsolatát bemutató tétel f(x + d f(x f(x + ( d f(x rf(xd: rf(xd: Mindegyik összefüggésben írjuk a d vektor helyébe az i-edik (i ; ; : : : ; n egységvektorokat, amelyeknek i-edik komponense, a többi pedig zérus f(x + e i f(x rf(xe i : f(x + ( e i f(x rf(xe i : A jobboldalakon szerepl½o rf(xe i mennyiség a rf(x vektor i-edik koordinátája, jelben (rf(x i A baloldalakon pedig a határértéket részletezve az alábbi adódik: f(x + e i f(x f(x ; x ; : : : ; x i ; x i + ; x i+ ; : : : ; x n f(x (rf(x i :

DIFFERENCIÁLHATÓSÁG TÖBBVÁLTOZÓS FÜGGVÉNY ESETÉN 8 A második összefüggés baloldalát egy kis átalakítással írjuk fel f(x + ( e i f(x f(x ; x ; : : : ; x i ; x i ; x i+ ; : : : ; x n f(x f(x ; x ; : : : ; x i ; x i + ; x i+ ; : : : ; x n f(x!0 (rf(x i ; amelyb½ol f(x ; x ; : : : ; x i ; x i + ; x i+ ; : : : ; x n f(x (rf(x!0 i : A jobboldalak azonosak, a baloldali mennyiségeket pedig a közös határértékkel írhatjuk, azaz f(x ; x ; : : : ; x i ; x i + ; x i+ ; : : : ; x n f(x :!0 Ez utóbbi összefüggés az ismert de níció szerint az f függvény i-edik parciális deriváltja A jobboldal pedig a rf(x vektor i-edik koordinátája Ebb½ol azonnal következik a tétel állítása Qed A gradiens képzés tulajdonságai: Legyenek f; g : R n! R di erenciálható függvények; ; n R skalárok Ekkor igazak az alábbi összefüggések r [f(x] rf(x r [f(x g(x] rf(x rg(x r [f(x g(x] g(x rf(x + f(x rg(x f(x g(x rf(x f(x rg(x r g(x [g(x] r [f(x] n n [f(x] n rf(x Gradiens vektor tulajdonságai TÉTEL (a gradiens vektor tulajdonságai Legyen f : S! R di erenciálható függvény a A rf(x vektor iránya az f függvény legnagyobb növekedési irányát jelöli ki, b a rf(x vektor hossza (krf(xk az f függvény legnagyobb növekedésének mértékét adja, c a rf(x vektor az x ponton átmen½o f(x allando szintfelület érint½osíkjának normálisa Bizonyítás a Az f 0 (x; d rf(xd alapképletben a jobboldalon lév½o skaláris szorzat akkor a legnagyobb, ha a d irányvektor párhuzamos a rf(x vektorral, tehát a gradiens vektor az f függvény legnagyobb növekedési irányába mutat

DIFFERENCIÁLHATÓSÁG TÖBBVÁLTOZÓS FÜGGVÉNY ESETÉN 9 b Ha a d irányvektor a gradiens vektor irányába mutató egység hooszúságú vektor, azaz d rf(x krf(xk, akkor f 0 (x; d krf(xk, amelyb½ol nyilvánvaló az állítás c Az alapképlet szerint, ha a gradiens vektor mer½oleges az irányvektorra, akkor a rf(xd skalárszorzat zérus, tehát az f függvény ebben az irányban nem változik Ez az irány nem más, mint az x ponton áthaladó szintfelület (azonos függvényérték½u pontok halmaza normálisa Qed Példa gradiens vektorrra Példa: Tekintsük az alábbi kétváltozós függvényt! f(x ; x x + x A kétváltozós függvény képe az R térben egy felület, amelyet az alábbi ábra mutat Vizsgáljuk meg a gradiens vektort az x (; pontban @f rf(x ; @f (x ; 8x : Az adott pontban f(x ; rf(x (; 8 ; krf(xk p + 8 0: Ezek jelentése a következ½o Az x (; pontban a függvény értéke és ez a függvényérték a rf(x (; 8 irányban történ½o elmozdulás esetén növekszik a legnagyobbat A krf(xk 0 pedig a növekedés mértékét jelenti Ha a rf(x (; 8 irányban elmozdulunk egy elegend½oen kicsit ( > 0, akkor a függvény növekedése (f megközelít½oleg 0, a függvény értéke pedig megközelít½oleg + 0 Az x (; pontban a függvényérték, így ehhez a ponthoz tartozó szintfelület az f(x ; x x + x egyenletet kielégít½o görbe Az egyenlet átalakított alakja: x p + x ; p azaz a görbe esetünkben egy origó centrumú ellipszis A ellipszis x irányú féltengelyének hossza p, x irányú féltengelyének hossza pedig p Az alábbi ábra mutatja az R síkon a szintgörbét és az x (; pontban a gradiens vektor irányát Láthatjuk, hogy a gradiens vektor mer½oleges a szintgörbe x (; pontbeli érint½ojére

5 KÉTSZER DIFFERENCIÁLHATÓSÁG TÖBBVÁLTOZÓS FÜGGVÉNY ESETÉN 0 5 Kétszer di erenciálhatóság többváltozós függvény esetén 5 Kétszer di erenciálhatóság fogalma Legyen S R n egy nemüres halmaz, legyen f : S! R függvény Az f függvényt kétszer di erenciálhatónak mondunk az S halmaz egy x bels½o pontjában, ha létezik egy rf(x R n vektor, egy H(x R nn szimmetrikus mátrix és egy : R n! R függvény úgy, hogy f(x f(x + rf(x(x x + (x xh(x(x x + kx xk (x; x x minden x S-re, ahol x!x (x; x x 0 A H(x mátrixot Hesse mátrixnak nevezzük, elemei az f függvény másodrend½u parciális deriváltjai, azaz @ f(x @ f(x @ : : : f(x @ f(x @ f(x @ H(x : : : f(x 5 ; @ f(x : : : @ f(x @ f(x más szóvan úgy is mondhatjuk, hogy a Hesse mátrix i-edik sorvektora a rf(x gradiens vektor i-edik koordinátájának @f(x @x i, mint valós függvénynek a gradiense Éppen ezért a Hesse mátrixot nagyon gyakran r f(x szimbólummal jelöljük Mivel a vegyes másodrend½u parciális deriváltak megegyeznek, így a Hesse mátrix szimmetrikus 5 Példa Hesse mátrixra Példa: Tekintsük az alábbi háromváltozós függvényt! f(x ; x x x x + x x x Határozzuk meg a gradiens vektort és a Hesse mátrixot az x (; ; pontban A Hesse mátrix könnyebb el½oállítása miatt a gradiens vektort oszlopvektorként adjuk meg

5 KÉTSZER DIFFERENCIÁLHATÓSÁG TÖBBVÁLTOZÓS FÜGGVÉNY ESETÉN H(x @ f @ f @ f @x r( @f r( @f r( @f @x rf(x @ f @ f @ f @x 5 @f @f @f @x @ f @x @ f @x @ f @x @x 5 5 x x x + x x x x x x x x x x x x x x x x x x x x + x x x x + x x @ ( @f @ ( @f @ ( @f @x x 5 ; @ ( @f @ ( @f @ ( @f @x x x x x x @ @x ( @f @ @x ( @f @ @x ( @f @x x x 5 x x x x x x + x x x + x 0 5 : Az adott x (; ; pontban a gradiens vektor és a Hesse mátrix értéke az alábbi: 0 80 0 rf(x 5 ; H(x 9 5 : 0 0 9 0 Megjegyzés: Hasonlóan a di erenciálhatóságnál látottakhoz, a kétszer di erenciálhatóság esetében is gyakran használatos az alábbi formula: f(x + d f(x + rf(xd + dh(xd + kdk (x; d minden d vektorra és valós számra A formulában szerepl½o határérték az alábbiak szerint alakul,!0 (x; d 0 A dii erenciálhatóságot mint láttuk egy bels½o pontban de niáltuk Az f függvényt di erenciálhatónak mondunk az S R n halmazon, ha az f függvény az S halmaz minden bels½o pontjában di erenciálható Ez természetesen a kétszer di erenciálhatóságra is vonatkozik 5 Gyakori függvények gradiense és Hesse mátrixa Néhány gyakran használt függvény gradiense és Hesse mátrixa: f(x rf(x r f(x c T x c 0 x x T x x E x T Ax (A + A T x A T + A (Ax (Ax T (Ax x T A T Ax A T Ax A T A 5 c T Ax A T c 0 Megjegyezzük, hogy a függvénynél, ha az A mátrix szimmetrikus, ekkor a gradiens Ax, a Hesse mátrix pedig A A Hesse mátrix meghatározásánál nem valósérték½u függvény deriváltját kell meghatározni, hanem egy vektorérték½u függvényét Gyakran használt függvény

KÖZÉPÉRTÉK TÉTEL, TAYLOR TÉTEL például az f(x Ax vektorérték½u függvény, a példában a,, gradiens vektor ilyen függvény Ennek a komponensei valósérték½u lineáris függvények, amelynek a gradiensét viszont már könny½u számítani Egy kis meggondolás után kapjuk, hogy r(ax A T Ebb½ol már a példabeli Hesse mátrixok adódnak Középérték tétel, Taylor tétel Az alábbi tétel az egyszer ill a kétszer di erenciálható függvényekre ad meg egy-egy fontos összefüggést A tétel középérték tételként ill Taylor tételként ismert TÉTEL (Középérték tétel, Taylor tétel Legyen S R n egy nemüres, nyílt, konvex halmaz, legyen f : S! R függvény Ha az f függvény di erenciálható az S halmazon, akkor minden x S és x S vektorok esetén létezik olyan ^x S vektor, hogy f(x f(x + rf(^x(x x; ahol ^x vektor az x és x vektorokat összeköt½o szakasz valamely bels½o pontja Ha az f függvény kétszer di erenciálható az S halmazon, akkor minden x S és x S vektorok esetén létezik olyan ^x S vektor, hogy f(x f(x + rf(x(x x + (x xh(^x(x x ahol ^x vektor az x és x vektorokat összeköt½o szakasz valamely bels½o pontja Az alábbi két fejezetben két fontos összefüggést ismertetünk a dii erenciálással kapcsolatban, az egyik az összetett függvény deriválási szabálya, az ún láncszabály, a másik pedig ezzel szorosan kapcsolatos az ún implicit függvény tétel A láncszabályt is és az implicit függvény tételt is több alkalmazási környezetben mondjuk ki, el½osegítve ezzel a könnyebb alkalmazását Láncszabály TÉTEL (Láncszabály Legyen f : R n! R di erenciálható függvény Legyen továbbá x (x ; x ; : : : ; x n R n vektor és p R skalár Használjuk a függvényre az f(x ; x ; : : : ; x n jelölést Tegyük fel, hogy az x (x ; x ; : : : ; x n R n vektor a p skalár valamilyen di erenciálható függvénye, azaz x x (p; x x (p; x n x n (p:

LÁNCSZABÁLY Ekkor az f függvénynek a p skalár szerinti deriváltja, amelyet f 0 p szimbólummal jelölünk, a következ½oképpen számítható: f 0 p @f dx dp + @f dx dp + : : : + @f dx n dp Amennyiben a @f @x j (j ; : : : ; n mennyiségeket a rf R n vektorba, a @x j (j ; : : : ; n mennyiségeket az x 0 p R n vektorba foglaljuk, akkor a fenti összefüggés az alábbi egyszer½ubb formában írható fel fp 0 rf x 0 p: A láncszabályban megfogalmazott állítás szavakban megfogalmazva a következ½ot jelenti Az f függvény az x j mennyiségeken keresztül közvetve függ a p skalártól Mint tudjuk, a derivált a p skalár elemi megváltozásához tartozó függvényváltozást jelenti Amikor a p megváltozik, akkor megváltoznak az x j mennyiségek is, amelyek az f függvénykapcsolat alapján hatást gyakorolnak az f függvényre A láncszabály szerint a teljes hatás az x j mennyiségek megváltozásain keresztül gyakorolt közvetett hatások összegeként adódik, tehát az egyes hatások szuperponálódnak TÉTEL (Láncszabály Legyen f : R n+! R di erenciálható függvény Legyen továbbá x (x ; x ; : : : ; x n R n vektor és p R skalár Használjuk a függvényre az f(x ; x ; : : : ; x n ; p jelölést Tegyük fel, hogy az x vektor a p skalár valamilyen di erenciálható függvénye, azaz x x (p; x x (p; x n x n (p: Ekkor az f függvénynek a p skalár szerinti deriváltja a következ½oképpen számítható: f 0 p @f + @f dx dp + @f dx dp + : : : + @f dx n dp Amennyiben a @f @x j (j ; : : : ; n mennyiségeket a r x f R n vektorba, a @x j (j ; : : : ; n mennyiségeket az x 0 p R n vektorba foglaljuk, akkor a fenti összefüggés az alábbi egyszer½ubb formában írható fel fp 0 @f + r xf x 0 p: Ebben az esetben az f függvény nemcsak az x j mennyiségeken keresztül közvetve függ a p skalártól, hanem közvetlenül is A láncszabály most a közvetlen és a közvetett hatásokat fejezi ki A teljes hatás közvetlen és a közvetett hatások összege A fenti összefüggés egyszer½uen belátható, ha az x n+ x n+ (p p választással élünk és alkalmazzuk a láncszabály els½o formuláját mennyiségek vektorára azért használtuk a r x f jelölést, mert azt akartuk kihangsúlyozni, hogy az f függvény gradiens vektorának csak az els½o n eleme szerepel, azaz csak az x típusú változók szerinti parciális deriváltakat tartalmazza Megjegyezzük, hogy az @f @x j TÉTEL (Láncszabály, általános formula

LÁNCSZABÁLY Legyen f : R n+m! R di erenciálható függvény Legyen továbbá x (x ; x ; : : : ; x n R n vektor és legyen p (p ; p ; : : : ; p m R m vektor Az f(x ; x ; : : : ; x n ; p ; p ; : : : ; p m jelölést használjuk a függvényre Tegyük fel, hogy az x vektor a p ; p ; : : : ; p m skalárok valamilyen di erenciálható függvénye, azaz x x (p ; p ; : : : ; p m ; x x (p ; p ; : : : ; p m ; x n x n (p ; p ; : : : ; p m : Ekkor az f függvénynek a p i (i ; ; : : : ; m skalár szerinti deriváltja a következ½oképpen számítható: f 0 p i @f i + @f i + @f i + : : : + @f i minden i ; ; : : : ; m esetén Foglaljuk az fp 0 i (i ; : : : ; m mennyiségeket az fp 0 R m vektorba, a @f i (i ; : : : ; m mennyiségeket a r p f R m vektorba, a @f @x j (j ; : : : ; n mennyiségeket a r x f R n vektorba, valamint a @x j i (i ; : : : ; m; j ; : : : ; n mennyiségeket a J x;p R mn ún Jacobi-mátrixba A Jacobi-mátrix tehát az alábbi @x : : : n @x J x;p : : : n 5 : @x m m : : : n m Ekkor a fenti összefüggés az alábbi egyszer½ubb formában írható fel: f 0 p r p f + J x;p r x f: Példa: Legyen n, m Legyen f(x ; x ; p x x p x p + p x p p Példánkban a Lácszabály formulát kell alkalmazni A számított értékek: @f x x p " # @f x x r x f p x x p # + p x 0 p p p @f " @x

8 IMPLICIT FÜGGVÉNY TÉTEL 5 A keresett p szerinti derivált: f 0 p @f + r xf x 0 p x x p + x x p ( + p + x x p p p : Számítsuk ki egy adott p értékre a deriváltat, legyen p, ekkor x ; x, a derivált pedig f 0 p 8 + + : A közvetlen hatás 8, a közvetett hatás együttesen 8, amelyben az x megváltozásának hatása, az x megváltozásának hatása pedig Az olvasó elvégezhet egy ellen½orzést úgy, hogy az f függvénybe behelyettesíti az x ; x függvényeket és ezt a függvényt, amely már csak p-t½ol függ, deriválja Ekkor is megkapja a deriváltra a értéket, de azt nem tudja megmondani, hogy mik voltak az egyes hatások A teljes hatás, azaz a érték½u derivált jelentése az alábbi: Ha a p értéket -r½ol elegend½oen kicsi -val megváltoztatjuk, akkor a függvény értékének megváltozása megközelít½oleg, ebb½ol a közvetlen hatás eredménye 8, a közvetetté pedig 8, amelynek megoszlása ill 8 Implicit függvény tétel TÉTEL (Implicit függvény tétel Legyenek f ; f ; : : : ; f n : R n+! R folytonosan di erenciálható függvények Legyen továbbá x (x ; x ; : : : ; x n R n vektor és p R skalár Használjuk az f i (x ; x ; : : : ; x n ; p (i ; ; : : : ; n jelölést Legyen az x (x ; x ; : : : ; x n R n vektor és a p R skalár között de niálva az alábbi egyenletrendszer f (x ; x ; : : : ; x n ; p 0 f (x ; x ; : : : ; x n ; p 0 f n (x ; x ; : : : ; x n ; p 0 De niáljuk a J x R nn Jacobi-mátrixot, amely i-edik sorának j-edik eleme @f i @x j, úgy is fogalmazhatnánk, hogy az i-edik sor az f i függvény gradiens vektorának els½o n eleme, tehát csak az x típusú változók szerinti parciális deriváltakat tartalmazza, ezért szerepel az x szimbólum a J x jelölésben A Jacobi-mátrix tehát @f @f J x @f @f @f @f Tegyük fel, hogy egy (x; p pont kielégíti az egyenletrendszer egyenleteit, azaz f i (x; p 0 (i ; ; : : : ; n Az alábbi két állítást fogalmazhatjuk meg 5 :

8 IMPLICIT FÜGGVÉNY TÉTEL a Ha az (x; p pontban a J x Jacobi-mátrix determinánsa nem zérus (J x invertálható, akkor az (x; p pont környezetében léteznek az alábbi folytonosan di erenciálható függvények és az (x; p pont környezetében igaz, hogy x x (p x x (p x n x n (p f (x (p; x (p; : : : ; x n (p; p 0 f (x (p; x (p; : : : ; x n (p; p 0 f n (x (p; x (p; : : : ; x n (p; p 0 b Az (x; p pontban az x i (p (i ; ; : : : ; n függvények p szerinti deriváltjára igaz, hogy Amennyiben a @x i 5 @f @f @f @f @f @f 5 @f @f 5 : (i ; : : : ; n mennyiségeket az x0 p R n vektorba, a @f i (i ; : : : ; n mennyiségeket az fp 0 R n vektorba, a @f i @x j (i ; : : : ; n; j ; : : : ; n mennyiségeket a már ismertetett J x R nn Jacobi-mátrixba foglaljuk, akkor a fenti összefüggés az alábbi egyszer½ubb formában írható fel x 0 p J x f 0 p: Bizonyítás: A b részt bizonyítjuk, hogy lássuk a láncszabály egyik alkalmazását Vegyük mindegyik egyenletnek a p szerinti parciális deriváltját A baloldal deriváltja a Láncszabály formula szerint írható fel, a jobboldal pedig zérus, mivel konstans deriváltja zérus @f i + @f i dx dp + @f i dx dp + : : : + @f i dx n dp 0; (i ; ; : : : ; n A fenti egyenleteket az alábbi egyszer½ubb formában írhatjuk: @f @f 5 + @f @f @f @f @f @f 5 5 0; amely a bevezetett mátrix-vektor jelölésekkel még egyszer½ubben írható, azaz f 0 p + J x x 0 p 0:

8 IMPLICIT FÜGGVÉNY TÉTEL Mivel a Jacobi-mátrix invertálható, így azonnal adódik a tételben szerepl½o formula TÉTEL (Implicit függvény tétel, általános formula Legyenek f ; f ; : : : ; f n : R n+m! R folytonosan di erenciálható függvények Legyen továbbá az x (x ; x ; : : : ; x n R n vektor és a p (p ; p ; : : : ; p m R m vektor Használjuk az f i (x ; x ; : : : ; x n ; p ; p ; : : : ; p m (i ; ; : : : ; n jelölést Legyen az x (x ; x ; : : : ; x n R n és a p (p ; p ; : : : ; p m R m vektorok között de niálva az alábbi egyenletrendszer f (x ; x ; : : : ; x n ; p ; p ; : : : ; p m 0 f (x ; x ; : : : ; x n ; p ; p ; : : : ; p m 0 f n (x ; x ; : : : ; x n ; p ; p ; : : : ; p m 0 De niáljuk a J x R nn Jacobi-mátrixot, amely i-edik sorának j-edik eleme @f i @x j, azaz @f @f @f @f @f @f @x J x 5 : Tegyük fel, hogy egy (x; p pont kielégíti az egyenletrendszer egyenleteit, azaz f i (x; p 0 (i ; ; : : : ; n Az alábbi két állítást fogalmazhatjuk meg a Ha az (x; p pontban a J x Jacobi-mátrix determinánsa nem zérus (J x invertálható, akkor az (x; p pont környezetében léteznek az alábbi folytonosan di erenciálható függvények és az (x; p pont környezetében igaz, hogy x x (p ; p ; : : : ; p m x x (p ; p ; : : : ; p m x n x n (p ; p ; : : : ; p m f (x (p; x (p; : : : ; x n (p; p 0 f (x (p; x (p; : : : ; x n (p; p 0 f n (x (p; x (p; : : : ; x n (p; p 0 b Az (x; p pontban az x i (p (i ; ; : : : ; n függvények p k (k ; ; : : : ; m szerinti deriváltjaira igaz, hogy k k k 5 @f @f @f @f @f @f Amennyiben a @x i k (i ; : : : ; n mennyiségeket az x 0 p k R n vektorba, a @f i k (i ; : : : ; n mennyiségeket az fp 0 k R n vektorba, a @f i @x j (i ; : : : ; n; j ; : : : ; n mennyiségeket a 5 @f k @f k k 5

8 IMPLICIT FÜGGVÉNY TÉTEL 8 már ismertetett J x R nn Jacobi-mátrixba foglaljuk, akkor a fenti összefüggés az alábbi egyszer½ubb formában írható fel x 0 p k J x f 0 p k (k ; ; : : : ; m: Megjegyzés: A fenti formulát írhatjuk mátrixos alakban is Az x 0 p k (k ; ; : : : ; m vektorokat foglaljuk egy X 0 p mátrixba úgy, hogy ezek a vektorok a mátrix oszlopvektorai legyenek, hasonlóan módon foglaljuk az fp 0 k (k ; ; : : : ; m vektorokat egy F 0 p mátrixba Az X 0 p ill F 0 p mátrixok i-edik sorának k-edik eleme tehát @x i @f k ill i k : Ekkor a fenti formulából az alábbi formulát kapjuk X 0 p Jx F 0 p; amely részletezve m m m 5 @f @f @f @f @f @f 5 @f @f @f @f @f m @f m m 5 : Példa: Legyen n, m Legyen f (x ; x ; p ; p x p x p 5 0 f (x ; x ; p ; p p x p p 0 Legyen az adott pont az x ; x ; p ; p El½oször határozzuk meg a Jacobi-mátrixot p J x 0 p 0 p p A Jacobi-mátrix determinánsa az adott pontban, tehát nem zérus, így léteznek a pont környezetében az x x (p ; p és x x (p ; p függvények A tétel b része szerint, anélkül, hogy ezeket a függvényeket meghatároznánk, kiszámíthatók ezek p ; p szerinti parciális deriváltjai A további szükséges számított mennyiségek: " # 0 Jx p Az adott pontban az értékek: f 0 p f 0 p 0 p p p " # @f @f " @f @f J x f 0 p f 0 p # 0 0 8 p x p x p p x p p

8 IMPLICIT FÜGGVÉNY TÉTEL 9 Az eredmények értékelése: Ha a p értéket -r½ol elegend½oen kicsi -val megváltoztatjuk, akkor az f függvény értékének megváltozása megközelít½oleg 8, az f függvény értékének megváltozása pedig megközelít½oleg Ha a p értéket -r½ol elegend½oen kicsi -val megváltoztatjuk, akkor az f függvény értékének megváltozása megközelít½oleg (, az f függvény értékének megváltozása pedig megközelít½oleg A létez½o x x (p ; p ; x x (p ; p függvények p ill p szerinti parciális deriváltjai az adott pontban " # @x 8 x 0 p Jx fp 0 x 0 p " @x # Jx fp 0 Az eredmények értékelése: Az x 0 p vektor elemeinek jelentése: Ha a p értéket -r½ol elegend½oen kicsi -val megváltoztatjuk, akkor az x (p ; p függvény értékének megváltozása megközelít½oleg 8, az x (p ; p függvény értékének megváltozása pedig megközelít½oleg Ha a p értéket -r½ol elegend½oen kicsi -val megváltoztatjuk, akkor az x (p ; p függvény értékének megváltozása megközelít½oleg, az x (p ; p függvény értékének megváltozása pedig megközelít½oleg Megjegyzés: Általánosan is felírhatjuk a formulákat, mégpedig minden olyan esetben, amelyben a Jacobi-mátrix determinánsa nem zérus Könnyen meggy½oz½odhetünk róla, hogy p 0; p ; p ; p > 0 esetekben a Jacobi-mátrix invertálható, az inverz # J x " 0 p 0 p p p ; ekkor a kérdéses deriváltak általánosan x 0 p J x f 0 p x 0 p J x f 0 p " p x " p x p p x p # # Tapasztalhattuk a példa kapcsán, hogy az x x (p ; p ; x x (p ; p függvények konkrét ismerete nélkül is meg tudtuk határozni a deriváltjaikat Gyakorlásképpen meghatározhatjuk ezeket a függvényeket, az egyenletrendszert kell megoldani x ; x változókra, amelyek a következ½ok: x x (p ; p p + 5 p x x (p ; p p p p

8 IMPLICIT FÜGGVÉNY TÉTEL 0 Feladat: Végezzen el egy ellen½orzést, a fenti függvényeket deriválja p ; p szerint! Ekkor a deriváltakra a már ismert eredményeket fogja megkapni