Eötvös Loránd Tudományegyetem Természettudományi Kar Nemesné Jónás Nikolett Lagrange-féle multiplikátor módszer és alkalmazása Matematika BSc, Matematikai elemz szakirány Témavezet : Szekeres Béla János, tudományos segédmunkatárs MTA-ELTE Numerikus Analízis és Nagy Hálózatok Kutatócsoport Budapest, 2017
Köszönetnyilvánítás Ezúton szeretnék köszönetet mondani témavezet mnek, Szekeres Béla Jánosnak, aki felkeltette érdekl désem a téma iránt, és segítségével, hasznos tanácsaival hozzájárult a szakdolgozatom elkészüléséhez. Köszönettel tartozom a családomnak az egyetemi éveim alatt nyújtott kitartó támogatásukért. 2
Tartalomjegyzék 1. Bevezetés 4 2. Szükséges el ismeretek 5 2.1. Parciális deriváltak és széls értékek kapcsolata................ 5 2.2. Feltételes széls érték probléma......................... 6 3. A Lagrange-multiplikátor módszer alkalmazásai 10 3.1. Többváltozós függvény, egy feltétel...................... 10 3.2. Háromváltozós függvény, két feltétel...................... 18 3.3. Feltételek egyenl tlenségként.......................... 19 4. További gyakorlati példák 22 4.1. Maximális terméshozam............................ 22 4.2. Henger felületének minimalizálása....................... 25 4.3. Maximális entrópia számítása......................... 26 3
1. fejezet Bevezetés A széls érték feladatok fontos gyakorlati alkalmazása a matematikai analízisnek. Szakdolgozatom témája ezzel kapcsolatos, feltételes széls értékek keresése Lagrange-multiplikátor módszerrel. A dolgozat els fejezetében áttekintem az elmélethez kapcsolódó deníciókat és tételeket a [1] munka alapján. A második fejezetben egyszer példákon keresztül mutatom be a Lagrange-multiplikátor módszer alkalmazását. A harmadik fejezetben pedig néhány gyakorlatban is el forduló alkalmazást vizsgálok: terméshozam optimalizálása adott költség- és hozamfüggvények mellett, adott térfogatú henger felületének minimalizálása, illetve entrópiafüggvény maximalizálása. 4
2. fejezet Szükséges el ismeretek 2.1. Parciális deriváltak és széls értékek kapcsolata 2.1.1. Deníció. Az f függvénynek lokális minimuma (maximuma) van az a R n pontban, ha van a-nak olyan K környezete, amiben f értelmezve van, és minden x K-ra: f(a) f(x) (illetve(f(a) f(x)). Ebben az esetben az f függvény lokális minimumhelyének (maximumhelyének) nevezzük az a R n pontot. 2.1.2. Megjegyzés. Ha minden a-n kívüli x K-ra f(x) < f(a) (illetve f(x) > f(a)), akkor szigorúan lokális maximumról, maximumhelyr l (illetve szigorúan lokális minimumról, minimumhelyr l) beszélünk. Ezeket közösen lokális széls értéknek, széls értékhelynek nevezzük. 2.1.3. Tétel. Ha az f függvénynek az a R n pontban lokális széls értéke van, és létezik mindegyik parciális deriváltja a-ban, akkor ezek a parciális deriváltak elt nnek ebben az a pontban, azaz: i f(a) = 0, i = 1...n-re. 2.1.4. Tétel. Legyen A R n halmaz korlátos és zárt, f : A R folytonos. Tegyük fel, hogy f-nek A belsejének minden pontjában léteznek a parciális deriváltjai. Ekkor f a maximumát (vagy minimumát) A határán, vagy pedig olyan bels pontban veszi fel, ahol a parciális deriváltak nullák. 5
2.1.5. Deníció. Jacobi-mátrixnak nevezzük egy n-változós függvény els rend parciális deriváltjait tartalmazó mátrixot. J = f 1 x 1....... f m x 1... 2.1.6. Deníció. Legyen f(x), x D( R n ) n-változós függvény, melynek létezik minden másodrend parciális deriváltja az a D pontban. Hesse-mátrixnak nevezzük az f függvény H f (a) = f 1 x n. f m x n. másodrend parciális deriváltjaiból alkotott négyzetes mátrixot. 2 f (a) 2 f x 2 1 x 1 x 2 (a)... 2 f x 2 x 1 (a). 2 f x n x 1 (a) 2 f (a)... x 2 2.... 2 f x n x 2 (a)... 2.2. Feltételes széls érték probléma 2 f x 1 x n (a) 2 f x 2 x n (a). 2 f x 2 n (a). A feltételes széls érték keresésekor úgy keressük az adott f(x) függvény széls értékét, hogy közben egy, vagy több feltételnek is teljesülnie kell. 2.2.1. Tétel. (Lagrange-féle multiplikátor-módszer) Legyen f(x), x D( R n ) n- változós függvény folytonosan dierenciálható az a D pontban, továbbá g i, i = 1...m folytonosan dierenciálható függvények, melyek értelmezve vannak az a pontban, és teljesül rá, hogy g i (a) = 0, valamint g i(a) Jacobi-mátrix sorvektorai lineárisan függetlenek. Ha f- nek feltételes széls értéke van az a-ban a g 1 (x) = 0, g 2 (x) = 0,..., g m (x) = 0 feltétel mellett, akkor az L(x) = f(x) + λ 1 g 1 (x) + λ 2 g 2 (x) +... + λ m g m (x) = f(x) + m λ i g i (x) Lagrange függvény összes parciális deriváltja elt nik az a pontban: x i (a) = 0, (i = 1, 2... n). Ez a Lagrange-féle multiplikátor módszer szükséges feltétele. i=1 2.2.2. Megjegyzés. A tételben szerepl λ i skalárok a Lagrange-multiplikátorok, amelyek közül legalább az egyik nem nulla. 6
A bizonyítás el tt szükséges az egyváltozós implicitfüggvény-tétel ismerete: 2.2.3. Tétel. (Egyváltozós implicitfüggvény-tétel) Tegyük fel, hogy a kétváltozós, valós érték f függvény elt nik az (a, b) R 2 pontban, és folytonos az (a, b) egy környezetében. Tegyük fel, hogy a 2 f parciális derivált létezik, véges és nullától különböz az (a, b) pont egy környezetében. Ekkor léteznek olyan δ és ɛ pozitív számok, hogy: 1. Minden x (a δ, a + δ)-hoz létezik egyetlen ϕ(x) (b ɛ, b + ɛ) szám, melyre f(x, ϕ(x)) = 0, továbbá 2. az így deniált ϕ függvény folytonos az (a δ, a + δ) intervallumban. A 2.2.1 Tétel bizonyítása. A bizonyítást n = 2, m = 1 és feltételes minimum esetén végezzük, de a feltételes maximum esete is hasonlóan gondolható meg. A feltételek alapján a g := g 1 : R 2 R függvény folytonosan dierenciálható, és az a := (a 1, a 2 ) pontban g(a 1, a 2 ) = 0. Ebben a pontban a rangfeltétel rang( 1 g(a 1, a 2 ), 2 g(a 1, a 2 )) = 1. Ezért feltehetjük, hogy 2 g(a 1, a 2 ) 0. Ekkor az egyváltozós implicitfüggvény-tétel szerint létezik a 1 -nek K(a 1 ) és a 2 -nek K(a 2 ) környezete, és létezik olyan ϕ : K(a 1 ) K(a 2 ) dierenciálható függvény, amelyre és ϕ(a 1 ) = a 2. Ez azt jelenti, hogy minden x K(a 1 ) esetén g(x, ϕ(x)) = 0, H = { (x, y) R 2 g(x, y) = 0 } { (x, ϕ(x)) R 2 x K(a 1 ) } =: H. (2.1) Azaz g(a 1, ϕ(a 1 )) = 0, melyet deriválva teljesül, hogy 1 g(a 1, a 2 ) + ϕ (a 1 ) 2 g(a 1, a 2 ) = 0. (2.2) Mivel az f függvény H halmazra vett lesz kítésének lokális minimuma van az (a 1, a 2 ) H pontban, ezért létezik r > 0, hogy az (a 1, a 2 ) pont K r (a 1, a 2 ) környezetére minden (x, y) K r (a 1, a 2 ) H esetén f(x, y) f(a 1, a 2 ). (2.3) 7
A (2.1) alapján x K(a 1 ) esetén (x, ϕ(x)) H H. Felhasználva, hogy ϕ folytonos K(a 1 )-en, meggondolható, hogy létezik olyan K (a 1 ) K(a 1 ) környezet, hogy minden x K (a 1 ) esetén (x, ϕ(x)) K r (a 1, a 2 ) H. Így (2.3)-ból következik, hogy minden x K (a 1 ) esetén f(x, ϕ(x)) f(a 1, ϕ(a 1 )) = f(a 1, a 2 ). Ez azt jelenti, hogy a h : K (a 1 ) R, h(x) := f(x, ϕ(x)) valós függvénynek lokális minimuma van az a 1 pontban. A h függvény dierenciálható (dierenciálható függvények kompozíciója), ezért h (a 1 ) = 0. A kompozíciófüggvény deriválási szabályai alapján h (x) = f (x, ϕ(x)) (x, ϕ (x)) = = ( 1 f(x, ϕ(x)), 2 f(x, ϕ(x))), (1, ϕ(x)) = = 1 f(x, ϕ(x)) + ϕ (x) 2 f(x, ϕ(x)). Ezért h (a 1 ) = 1 f(a 1, a 2 ) + ϕ (a 1 ) 2 f(a 1, a 2 ) = 0. (2.4) Legyen λ R tetsz leges szám, és szorozzuk meg λ-val a (2.2) egyenl séget, majd adjuk össze a (2.4) egyenl séggel, így nyerjük az alábbi azonosságot 1 f(a 1, a 2 ) + λ 1 g(a 1, a 2 ) + ϕ (a 1 ) [ 2 f(a 1, a 2 ) + λ 2 g(a 1, a 2 )] = 0. (2.5) A λ szám megválasztható úgy, hogy 2 f(a 1, a 2 ) + λ 2 g(a 1, a 2 ) = 0 (2.6) ( a λ := ) 2f(a 1, a 2 ) 2 g(a 1, a 2 ) megfelel. Ha a λ esetén (2.5)-ben a szögletes zárójelben lév tényez 0, akkor 1 f(a 1, a 2 ) + λ 1 g(a 1, a 2 ) = 0 (2.7) 8
is teljesül. Összesítve az eredményeket, azt kapjuk, hogy ha az f függvénynek feltételes minimuma van a g = 0 feltétel mellett, az a = (a 1, a 2 ) pontban, akkor az F := f + λ g függvénynek az els változó szerinti parciális deriváltja 0 (ezt mutatja (2.7)), és a második változó szerinti parciális deriváltja is 0 (ezt mutatja (2.6)). Tehát F (a) = F (a 1, a 2 ) = ( 1 F (a 1, a 2 ), 2 F (a 1, a 2 )) = 0. 2.2.4. Tétel. (Elégséges feltétel) A 2.2.1 Tétel feltételei mellett az L Lagrange-függvény Hesse-mátrixa az a pontban pozitív denit, akkor az f függvénynek lokális minimuma van az a pontban, a g i = 0, i = 1...m feltétel mellett, ha pedig az L Lagrange-függvény Hessemátrixa az a pontban negatív denit, akkor az f függvénynek lokális minimuma van az a pontban a g i = 0, i = 1...m feltétel mellett. 9
3. fejezet A Lagrange-multiplikátor módszer alkalmazásai 3.1. Többváltozós függvény, egy feltétel 3.1.1. Példa. Határozzuk meg az f(x, y) = x 2 +y 2 függvény széls értékhelyét a g(x, y) = x + y = 10 feltétel mellett. Els ként felírjuk a Lagrange-függvényt, majd meghatározzuk az els rend parciális deriváltakat, amiket egyenl vé teszünk nullával. L(x, y) = x 2 + y 2 + λ(x + y 10). = 2x + λ = 0, x (3.1) = 2y + λ = 0. y (3.2) A (3.1) és (3.2) egyenletekb l lehetséges széls érték helyeket kapunk, de ezek még függnek a bevezetett λ multiplikátortól: x = λ 2, (3.3) y = λ 2. (3.4) 10
A (3.3), (3.4) formulákból következik, hogy λ = x = y, továbbá az x+y = 10 feltétel 2 miatt x = y = 5. Az f(x, y) = x 2 + y 2 függvény széls értékei az x + y = 10 feltétel mellett az (x, y) = (5, 5) pont, aminek értéke: f(5, 5) = 5 2 + 5 2 = 25 + 25 = 50. Ez az érték a függvény minimuma, mivel a feltételnek megfelel (x, y) pontpárokat behelyettesítve 50-nél nagyobb értékeket kapunk. 3.1.2. Példa. Határozzuk meg az f(x, y) = x+2y függvény széls értékhelyét a g(x, y) = x 2 + y 2 = 4 feltétel mellett. Els ként felírjuk a Lagrange-függvényt, majd meghatározzuk az els rend parciális deriváltakat. L(x, y, λ) = x + 2y + λ(x 2 + y 2 4). Els rend parciális deriváltak, amiket egyenl vé teszünk nullával: x = 1 + 2xλ = 0, (3.5) 11
y = 2 + 2yλ = 0. (3.6) Az (3.5) és (3.6) egyenletekb l lehetséges széls értékhelyeket kapunk, de ezek még függnek a bevezetett λ multiplikátortól: x = 1 2λ, (3.7) y = 1 λ. (3.8) A (3.7) és (3.8) értékeket a feltételbe visszahelyettesítve kapunk a λ-ra megfelel értékeket, amiket a parciális deriváltakba beírva megkapjuk a keresett (x, y) helyet: λ 1 = 5 4, (3.9) λ 2 = 5 4. (3.10) Mindkét λ esetén vissza kell helyettesítenünk a parciális deriváltakba, hogy az összes lehetséges széls értékhelyet megkapjuk: λ 1 = 5 4 esetén: 5 1 + 2x = 0, (3.11) 4 5 2 + 2y = 0. (3.12) 4 A (3.11) és (3.12) egyenletekb l álló egyenletrendszert megoldva kapjuk az egyik lehetséges széls érték helyet: (x 1, y 1 ) = ( ) 5 λ 2 = esetén hasonlóan járunk el: 4 ( 2 5, 4 5 ). ( ) 5 1 + 2x = 0, (3.13) 4 12
( ) 5 2 + 2y = 0. (3.14) 4 A (3.13) és (3.14) egyenletekb l álló egyenletrendszert megoldva kapjuk a másik lehetséges széls értékhelyet: (x 2, y 2 ) = ( 2 4 5, ). 5 Az ( f(x, y) = x + 2y függvénynek a g(x, y) = x 2 + y 2 = 4 feltétel mellett az (x 1, y 1 ) = 2, 4 ) ( ) 2 4 és (x 2, y 2 ) = 5, pontokban van széls értéke, aminek értékei: 5 5 5 (x 1, y 1 ) esetében minimuma van: f ( 2, 4 ) ( ( )) 2 4 = + 2 = 10 4, 47. 5 5 5 5 5 (x 2, y 2 ) esetében maximuma van: f ( ) ( ( )) 2 4 2 4 5, = 5 + 2 5 = 10 4, 47. 5 5 13
3.1.3. Példa. Határozzuk meg az f(x, y) = xy függvény széls értékét a g(x, y) = 3x 2 + y 2 = 6 feltétel mellett. Ahogyan eddig, el ször a Lagrange-függvényt írjuk fel, majd kiszámoljuk a parciális deriváltakat: L(x, y) = xy + λ(3x 2 + y 2 6). (3.15) = y + λ6x = 0, x (3.16) = x + λ2y = 0. y (3.17) A (3.16) és a (3.17) egyenleteket rendezve kapjuk az alábbi összefüggést: y = λ6x, (3.18) x = λ2y. (3.19) Felhasználva a (3.19) formulát, y-ra a következ egyenl séget kapjuk: y = 12λ 2 y. (3.20) Ha y nulla, akkor a (3.19) miatt x-nek is nullának kell lennie, de ez nem teljesítené a feltételt, így y 0. Tehát a (3.20) egyenl ség csak akkor teljesülhet, ha 12λ 2 = 1. Helyettesítsük be a (3.18) egyenletet a feltételbe, majd hozzuk megfelel alakra: 3x 2 + ( λ6x) 2 = 6 3x 2 + 36λ 2 x 2 = 6, ami ekvivalens azzal, hogy 3x 2 + 3(12λ 2 )x 2 = 6. (3.21) Mivel 12λ 2 = 1, ezért (3.21) a következ t jelenti: 3x 2 + 3x 2 = 6. (3.22) (3.22)-ból következik, hogy x = ±1, y = ± 3. Az f(x, y) = xy függvény széls értékhelye és annak értéke a g(x, y) = 3x 2 +y 2 = 6 feltétel mellett a következ k: 14
f(1, 3) = 3, f(1, 3) = 3 f( 1, 3) = 3, f( 1, 3) = 3 Az (x, y) = (1, 3) és a (x, y) = ( 1, 3) pontokban maximuma, míg a (x, y) = (1, 3) és a (x, y) = ( 1, 3) pontokban pedig minimuma van. 3.1.4. Példa. Keressük meg az f(x, y, z) = x 2 y 2 széls értékét a g(x, y, z) = x 2 + 2y 2 + 3z 2 = 1 feltétel mellett. A Lagrange-függvény felírása után meghatározzuk a parciális deriváltakat: L(x, y, z) = x 2 y 2 + λ(x 2 + 2y 2 + 3z 2 1). = 2x + 2λx = 0, x (3.23) = 2y + 4λy = 0, y (3.24) = 6λz = 0. z (3.25) A (3.25) egyenlet csak akkor teljesülhet, ha λ = 0 vagy z = 0. 15
Els ként nézzük meg azt az esetet, amikor λ = 0. Ebben az esetben, a (3.23) és a (3.24) formulákból következik, hogy x = 0 és y = 0. Így a feltételb l azt kapjuk, hogy z = ± 1 3. ( (x 1, y 1, z 1 ) = 0, 0, (x 2, y 2, z 2 ) = 1 3 ), ( 0, 0, 1 3 ). Másodszor nézzük meg azt az esetet, amikor a λ 0. A (3.25) egyenletb l következik, hogy z = 0. Mivel a z változó csak a feltételben szerepel, így további esetszétválasztásra van szükségünk. 1. Ha x = 0. Ekkor a feltételb l következik, hogy y = ± 1 2, azaz ( (x 3, y 3, z 3 ) = 0, (x 4, y 4, z 4 ) = ) 1, 0, 2 ( 0, 1 2, 0 ). 1. Ha x 0. Ebben az esetben a (3.23) egyenl ség csak akkor teljesül, ha λ = 1. Ezzel együtt (3.24) csak akkor igaz, ha y = 0. Ezeket a feltételbe visszahelyettesítve megkapjuk az utolsó két széls értékhelyet: (x 5, y 5, z 5 ) = (1, 0, 0), (x 6, y 6, z 6 ) = ( 1, 0, 0). Végeredményben kapott széls értékhelyek, és ott a függvény értéke: ( ) ( 1 f 0, 0, = 0, f 0, 0, 1 ) = 0, ( ) 3 3 1 f 0, 0, = 1 (, f 0, 0, 1 ) = 1, 2 2 2 2 f(1, 0, 0) = 1, f( 1, 0, 0) = 1. 3.1.5. Példa. Határozzuk meg az f(x, y, z) = x + y + 2z függvény széls értékhelyét a g(x, y, z) = x 2 + y 2 + z 2 = 3 feltétel mellett. El ször felírjuk a Lagrange függvényt a λ 16
multiplikátor bevezetésével, majd meghatározzuk az x, y, és z szerinti parciális deriváltakat: L(x, y, z) = x + y + 2z + λ(x 2 + y 2 + z 2 3). (3.26) = 1 + 2xλ = 0, x (3.27) = 1 + 2yλ = 0, y (3.28) z = 2 + 2zλ = 0. (3.29) A (3.27), (3.28) és a (3.29) által alkotott egyenletrendszert elvégezve kapuk egy lehetséges (x, y, z) széls érték helyet, de ezek függnek λ-tól: x = 1 2λ, (3.30) y = 1 2λ, (3.31) z = 1 λ. (3.32) Ezeket a feltételbe visszahelyettesítve kapunk λ-ra két megfelel értéket: λ 1 = 1 2, (3.33) λ 2 = 1 2. (3.34) A (3.33) és (3.34) segítségével megkapjuk a feltételt kielégít széls értékhelyeket: 1. λ 1 = 1 2 esetén: 2. λ 2 = 1 2 esetén: (x 1, y 1, z 1 ) = (x 2, y 2, z 2 ) = ( ( 2 2 2, 2, ) 2. ) 2 2 2, 2, 2. 17
Ebben a két pontban a függvény értéke a következ : ( 2 2 f 2, 2, ) 2 2 2 = 2 + 2 + 2 2 = 3 2, ami a függvény maximuma, ( ) 2 2 2 2 f 2, 2, 2 = 2 2 2 2 = 3 2, ami pedig a függvény minimuma. 3.2. Háromváltozós függvény, két feltétel Olyan eset is adódhat, amikor két feltételt is gyelembe kell vennünk. Ekkor két λ multiplikátort is be kell vezetnünk. A következ példában egy ilyen esetet vizsgálunk. 3.2.1. Példa. Határozzuk meg az f(x, y, z) = x 2 + 3xy + 2y 2 + 4y + 0.5z 2 + 12 függvény széls értékét a g 1 (x, y, z) = x + y + z = 4 és a g 2 (x, y, z) = x z = 2 feltételek mellett. Els ként írjuk fel a Lagrange-függvényt, majd határozzuk meg az els rend parciális deriváltakat. L(x, y, z) = x 2 + 3xy + 2y 2 + 4x + 0.5z 2 + 12 + λ 1 (x + y + z 4) + λ 2 (x z 2). Az els rend parciális deriváltak, amiket egyenl vé teszünk nullával: x = 2x + 3y + 4 + λ 1 + λ 2 = 0, (3.35) y = 3x + 4y + λ 1 = 0, (3.36) z = z + λ 1 λ 2 = 0. (3.37) A (3.35), (3.36) és a (3.37) egyenletekb l lehetséges széls értékhelyeket kapunk, de ezek még függnek a bevezetett λ 1, λ 2 multiplikátoroktól: x = λ 1 + 4λ 2 + 16, y = λ 1 12 3λ 2, z = λ 1 + λ 2. 18
A fenti (x, y, z) értéket a g 1 és g 2 feltételekb l álló egyenletrendszerbe visszahelyettesítjük, és így kapunk λ 1 -re, és λ 2 -re megfelel eredményeket: λ 1 = 4, λ 2 = 2. A λ 1, és λ 2 értékeket, a (3.35), (3.36) és a (3.37) parciális deriváltakba behelyettesítve megkapjuk a feltételeknek eleget tev (x, y, z) megoldásokat: x = 4, y = 2, z = 2. Az f(x, y, z) függvény széls értékhelye a g 1 és a g 2 feltétel mellett az (x, y, z) = (4, 2, 2), az értéke pedig : 4 2 + 3 4 ( 2) + 2 ( 2) 2 + 4 4 + 0, 5 2 2 + 12 = 30. Ez az érték a függvény minimuma, mert a feltételt kielégít pontokat behelyettesítve nagyobb értéket kapunk, például az (x, y, z) = (2, 2, 0) pont esetén a függvény értéke : 2 2 + 3 2 2 + 2 2 2 + 4 2 + 0, 5 0 2 + 12 = 44. 3.3. Feltételek egyenl tlenségként Amikor a feltétel, vagy a feltételek nem egyenl ség, hanem egyenl tlenség formájában vannak megadva, a tartomány peremét, és a belsejét is külön-külön meg kell vizsgálni. Ennek oka, hogy a lehetséges széls értékek vagy a tartomány belsejében, vagy a peremen találhatók a 2.1.4 Tétel szerint. 3.3.1. Példa. Határozzuk meg az f(x, y) = (x 1) 2 +(y 3) 2 függvény széls értékhelyét a g 1 (x, y) = x + y 2 és a g 2 (x, y) = y x feltételek mellett. Ahogyan eddig, els ként felírjuk a Lagrange-függvényt, majd meghatározzuk az els rend parciális deriváltakat, majd ezeket egyenl vé tesszük nullával: L(x, y) = (x 1) 2 + (y 3) 2 + λ 1 (x + y 2) + λ 2 (x y). 19
x = 2(x 1) + λ 1 + λ 2 = 0, (3.38) y = 2(y 3) + λ 1 λ 2 = 0. (3.39) Azoknál a feladatoknál, ahol egyenl tlenséggel vannak megadva a feltételek, ott több esetet kell megvizsgálnunk. A lehetséges esetek a λ multiplikátorok és a feltételek alapján kerülnek szétválasztásra: λ 1 (x + y 2) = 0, λ 2 (x y) = 0. I. eset: amikor a tartomány belsejében nézzük meg a lehetséges széls értékeket. λ 1 = 0, λ 2 = 0: Mivel mindkét λ nulla, ezért a 2(x 1) = 0 és a 2(y 3) = 0 egyenleteket megoldva kapunk x-re, és y-ra lehetséges értéket: (x, y) = (1, 3). Ezt a pontot még ellen riznünk kell, hogy teljesítik-e a feltételeket: 1 + 3 = 4 2: nem teljesíti a feltételt, így ez a pont nem megfelel széls értékhely. II. eset: λ 1 = 0, λ 2 0: Mivel λ 2 0, ezért a második feltételb l képzett λ 2 (x y) = 0 akkor és csak akkor lehet 0, ha (x y) = 0, ami ekvivalens azzal, hogy x = y. Ezek alapján a 2(x 1) + λ 2 = 0, (y 3) λ 2 = 0. egyenletrendszert megoldva kapjuk, hogy λ 2 = 2, majd ezt felhasználva kapjuk a következ lehetséges széls értékhelyet: (x, y) = (2, 2), amit még ellen riznünk kell. A g 1 (x, y) = x + y 2 feltételbe visszahelyettesítve láthatjuk, hogy ezt a pont nem teljesíti, emiatt ez is hamis megoldás. III. eset: λ 1 0, λ 2 = 0: 20
Ennél az esetnél mivel λ 1 0, ezért a g 1 feltételb l indulunk ki. λ 1 (x + y 2) = 0 csak akkor lehet, ha (x + y 2) = 0, amib l következik, hogy x = 2 y. Hasonlóan a II. esethez megoldjuk a 2(x 1) + λ 1 = 0, (y 3) + λ 1 = 0 egyenletrendszert, ami után megkapjuk a λ 1 = 2 + 2y és az (x, y) = (0, 2) eredményt. Ez az (x, y) eredmény megfelel széls értékhely, mert a g 1 és a g 2 feltételt is teljesíti. Az f(x, y) = (x 1) 2 + (y 3) 2 függvénynek ebben a pontban az értéke: f(0, 2) = (0 1) 2 + (2 3) 2 = 2. IV. eset, amikor egyik λ érték sem nulla: λ 1 0, λ 2 0. Ekkor a λ 1 (x + y 2) = 0 és λ 2 (x y) = 0 egyenletekb l kiindulva kapunk x-re és y-ra megfelel értéket. Mivel egyik λ se nulla, ezért az x + y 2 = 0, x y = 0 egyenletrendszert kell megoldanunk, amib l következik, hogy x = 1, y = 1, λ 1 = 2, λ 2 = 2. A kapott (x, y) = (1, 1) értéket ellen riznünk kell. Visszahelyettesítjük a g 1 és a g 2 feltételbe, és láthatjuk, hogy mindkett t teljesíti, így az eredeti függvénynek az (1, 1) pontban is van széls értéke, aminek értéke: f(1, 1) = (1 1) 2 + (1 3) 2 = 4. Végeredményben a négy eset megvizsgálása után azt kaptuk eredményül, hogy az eredeti f(x, y) = (x 1) 2 + (y 3) 2 függvénynek a g 1 és a g 2 feltétel mellett maximuma van az (x, y) = (1, 1) pontban, értéke 4, és minimuma van az (x, y) = (0, 2) pontban, ahol az értéke 2. 21
4. fejezet További gyakorlati példák 4.1. Maximális terméshozam 4.1.1. Példa. Egy gazdaság A,B,C tábláján a talajtól függ en más-más fajta m trágyát használ. Megállapították, hogy az A táblán a holdankénti terméshozam és a m trágya mennyisége közötti kapcsolatot a 4+3x 2x 2, a B táblán a 4+5y y 2, a C táblán pedig a 2 + 6z 3z 2 formulák tükrözik. Az A, B, C táblák nagysága rendre: 500, 200, és 100 hold nagyságú. A különböz m trágyafajták milyen mennyisége mellett lesz a terméshozam maximális a 3 táblán együtt, azon feltétel mellett, hogy a m trágya beszerzésére 20000 Ft áll rendelkezésre, és a m trágyák egységára 40, 30, 20 Ft? Megoldás. A feladatban a maximális terméshozamot kell meghatározni úgy, hogy teljesüljön a feltétel az adott adatok mellett. A feltétel függvénye a következ lesz: g(x, y, z) = 500 40x + 200 30y + 100 20z = 20000x + 6000y + 2000z 20000 (4.1) ami a következ k alapján áll össze: Az A táblára az x fajta m trágya kell, aminek az egységára 40 Ft, a tábla nagysága 500 hold, ezért: A := 500 40x. 22
A másik kett, B és C táblákra vonatkozó összefüggésekre hasonlóan adódik, hogy: B := 200 30y, C := 100 20z. Ezek összege legfeljebb 20000, mert a beszerzésre ekkora keretösszeg áll rendelkezésre, továbbá x, y, z 0. (4.2) Amit pedig maximalizálnunk kell, az F (x, y, z) = 500(4 + 3x 2x 2 ) + 200(4 + 5y y 2 ) + 100(2 + 6z 3z 2 ). Ez a terméshozam és a m trágyák mennyisége közti kapcsolatot adja meg, gyelembe véve a táblák nagyságát. A (4.1) és a (4.2) feltételek egy tetraédert határoznak meg. Ebben az esetben a (2.1.4) Tétel szerint meg kell néznünk, hogy a célfüggvény a tartomány belsejében vagy a peremén veszi fel a széls értékét. Amennyiben a tartomány belsejében, úgy a 2.1.3. Tétel szerint teljesül a következ egyenletrendszer: F = 1500 2000x = 0, x (4.3) F = 1000 400y = 0, y (4.4) F z = 600 600z = 0. (4.5) A (4.3), (4.4) és a (4.5) egyenletekb l kapunk x, y, z-re lehetséges értékeket, amit le kell ellen riznünk, hogy teljesíti-e a feltételt. x = 1500 2000 = 3 4, y = 1000 400 = 2.5, z = 600 600 = 1. A feltételbe visszahelyettesítve kapjuk, hogy 23
20000 3 + 6000 2.5 + 2000 1 = 32000 20000, 4 ezért maximum csak a peremen lehet, ami azt jelenti, hogy a feltétel az alábbi lesz: g(x, y, z) = 500 40x + 200 30y + 100 20z = 20000x + 6000y + 2000z = 20000. (4.6) A maximalizálandó F függvény és a (4.6) feltételb l álló Lagrange-függvény a következ : L(x, y, z) = 500(4 + 3x 2x 2 ) + 200(4 + 5y y 2 ) + 100(2 + 6z 3z 2 )+ +λ(20000x + 6000y + 2000z 20000). Az x, y és z szerinti parciális deriváltak: = 500(3 4x) + 20000λ = 0, x (4.7) = 200(5 2y) + 6000λ = 0, y (4.8) z = 100(6 6z) + 2000λ = 0. (4.9) A (4.7), (4.8) és a (4.9) egyenletek megoldásaként kapjuk, hogy x = 3 + 10λ, (4.10) 4 y = 5 + 15λ, 2 (4.11) z = 1 + 10 λ. 3 (4.12) Ezek az (x, y, z) értékek még függnek λ-tól, de a feltételbe visszahelyettesítve kapunk λ-ra helyes értéket, amib l már következik a feladat megoldása: ( ) ( ) ( 3 5 20000 4 + 10λ + 6000 2 + 15λ + 2000 1 + 10 ) 3 λ = 20000. (4.13) A (4.13) egyenletb l ekvivalens átalakításokkal kapjuk λ-ra a következ értéket: λ = 18 445. 24
Ezt a λ-t felhasználva megkapjuk a helyes megoldást: x = 3 ( ) 18 4 + 10 = 123 0, 345, 445 356 y = 5 ( ) 18 2 + 15 = 337 1, 893, 445 178 z = 1 + 10 ( ) 18 = 77 0, 865. 3 445 89 A feladatban kért maximális terméshozam az (x, y, z) = (0.345, 1.893, 0.865) mennyiségek mellett teljesül. 4.2. Henger felületének minimalizálása 4.2.1. Példa. Határozzuk meg, hogy adott V térfogat esetén milyen sugár és magasság mellett lesz a henger felülete minimális. Kör alapú henger felülete: A = 2πr 2 + 2πrh, ahol r a sugár és h a magasság. A térfogat adott, ami legyen: V = πr 2 h. Ezek az adatok alapján fel tudjuk írni a Lagrange-függvényt, ahol A a minimalizálandó függvény, V pedig a feltétel: L(r, h) = 2πr 2 + 2πrh + λ(πr 2 h V ). Készítsük el a parciális deriváltakat, amiket egyenl vé teszünk nullával: r = 4πr + 2πh + λπrh = 0, (4.14) h = 2πr + λπr2 = 0. (4.15) Vegyük észre, hogy a (4.14) és a (4.15) formulákat átrendezve, fel tudjuk írni a kett egyenlet arányát, amib l kapunk h-ra és r-re egy helyes összefüggést: 4πr + 2πh = λπrh, 2πr = λπr 2. 25
Most vegyük ezek arányát, és hozzuk egyszer bb alakra: 4πr + 2πh 2πr = λπrh λπr 2, amib l következik, hogy 2r + h r = h r. (4.16) A (4.16) formulából ekvivalens átalakítással a következ összefüggést kapjuk: h = 2r. (4.17) Azaz a henger felülete minimális lesz (4.17) összefüggés esetén, ami azt jelenti, hogy a magasság kétszerese a sugárnak. Ezek után még vissza kell helyettesítünk a térfogatot meghatározó összefüggésbe, hogy r-re, és h-ra megkapjuk a megfelel értéket: V = πr 2 h = πr 2 2r. r = 3 V 2π, h = 2r = 2 3 V 2π. 4.3. Maximális entrópia számítása 4.3.1. Példa. Legyen X a természetes számokon értelmezett valószín ségi változó, melynek eloszlása P {X = i} = p i, i = 0, 1, 2,... Célunk az entrópia maximalizálása, az E{X} = 13.5 várható érték feltétel mellett, ahol az entrópia függvény az alábbi formulával adott: H(X) = p i log(pi). (4.18) Továbbá felhasználjuk az alábbi két feltételt: p i = 1, (4.19) 26
azaz, hogy {p i } i N eloszlás, illetve a várható értéke: E {X} = i p i = 13.5, (4.20) ahol p i az i-dik elemi esemény valószín sége. A (4.18), (4.19) és (4.20) formulák segítségével fel tudjuk írni a Lagrange függvényt a feladat megoldásához: (( L = p i log(pi) + λ 1 ) ) (( ) ) i p i 13.5 + λ 2 p i 1. Els ként megnézzük a Lagrange-függvény p i szerinti deriváltját: p i = log(p i ) 1 + λ 1 i + λ 2 = 0, ahol i = 0, 1, 2,... (4.21) A (4.21) egyenletb l ekvivalens átalakításokkal kifejezzük p i -t: log (p i ) = 1 + λ 1 i + λ 2 e log(pi) = e λ i i }{{} e} λ2 1 {{} α i β p i = α i β, i = 0, 1, 2,... (4.22) Ezzel beláttuk, hogy {p i : i = 0, 1, 2,...} egy mértani sor, ami az eloszlásparaméterek (α és β) meghatározásánál segítségünkre lesz, ugyanis fel tudjuk használni az alábbi, mértani sor összegképletére vonatkozó azonosságot: p i = 1 (1 p). Ez alapján tudjuk kiszámolni λ 2 -re vonatkozó összefüggést: p i = α i β = β α i = A (4.19) és (4.23) egyenletek alapján ki tudjuk fejezni β-t: β (1 α). (4.23) β = 1 α. 27
A α eloszlásparamétert a (4.20) és (4.22) azonosságok felhasználásával számolhatjuk ki: i p i = i α i β = β = β α ( ) i α i = β α i α (i 1) = β α α i = ( 1 1 α ) ( = β α 1 (1 α) 2 ). Mivel az el z lépésben kaptuk, hogy β = 1 α, ezért végeredményben: i p i = α 1 α, azaz E {X} = α 1 α = 13.5, amib l következik, hogy α = 13.5 14.5 és β = 2 29. Innen adódnak a Lagrange-multiplikátorok értékei: ( ) 13.5 λ 1 = log 2 (α) = log 2, ( 14.5) 2 λ 2 = log 2 (β) = log 2. 29 A fentiekben azt mutattuk meg, hogy a {p i : i = 0, 1, 2...} a feltételes entrópiafüggvény széls értékhelye, azt azonban nem tudjuk, hogy minimum, vagy maximum. Ezért legyen {p i } i N eloszlás a következ alakú 1, ha i = 13 vagy i = 14, p i = 2 0, egyébként Világos, hogy erre teljesülnek a (4.19) és (4.20) feltételek, azaz {p i } i N valóban valószín ségi eloszlás és a várható értéke 13,5. Az entrópia értéke: Mivel p i logp i = 1 (log(13) + log(14)) < 0. 2 2 29 ( ) ( i 13.5 2 log 14.5 29 ( ) ) i 13.5 > 0, 14.5 hiszen az összeg minden tagja negatív. Ezzel megmutattuk, hogy az entrópia függvénynek maximuma van a {p i : i = 0, 1, 2...} széls értékhelyen. 28
Irodalomjegyzék [1] Laczkovich Miklós - T. Sós Vera: Analízis II., Nemzeti Tankönyvkiadó, 2007 [2] Fekete Zoltán - Zalay Miklós: Többváltozós függvények analízise, M szaki Könyvkiadó, 2007 [3] Pang-Ning Tan, Michael Steinbach, Vipin Kumar: Bevezetés az adatbányászatba, Panem Kft, 2011 [4] http://www.uni-miskolc.hu/ matente/oktatasi%20tananyagok/ /FELTETELES_OPTIMALIZALAS.pdf [5] https://en.wikipedia.org/wiki/lagrange_multiplier 29
30