Egy vektorrendszert lineárisan függ nek nevezünk, ha nem lineárisan független.

GAZDASÁGI MATEMATIKA II DEFINÍCIÓK ÉS TÉTELEK A LINEÁRIS ALGEBRÁBÓL ÉS ANALÍZISBŽL A deniciókat (D) a tételeket (T) jelöli A fontosabb deníciókat és tételeket jelöli (D)k-dimenziós euklideszi tér: A k-dimenziós euklideszi tér nek nevezzük és R k val jelöljük a valós számokból alkotott k-tagú x = (x 1, x 2,, x k ) sorozatok halmazát, azaz 1 R k R 2 R= k := R { x = (x1, x 2,, x k ) : x i R (i = 1, 2,, k) } Az x = (x 1, x 2,, x k ) sorozatokat a tér pontjainak mondjuk, az x 1, x 2,, x k számok az x = (x 1, x 2,, x k ) pont koordinátái (D)vektorok összege és skalárral való szorzata: Az x = (x 1, x 2,, x k ), y = (y 1, y 2,, y k ) R k vektorok összegét és az x R k vektor λ R skalárral való szorzatát -val deniáljuk x + y : = (x 1 + y 1, x 2 + y 2,, x k + y k ) λx : = (λx 1, λx 2,, λx k ) (D) vektorok lineáris kombinációja: Az a 1, a 2,, a n R k vektorok λ 1, λ 2,, λ n R együtthatókkal képezett lineáris kombinációján a vektort értjük λ 1 a 1 + λ 2 a 2 + + λ n a n (D) vektorrendszer lineárisan függetlensége, függ sége: Az a 1,, a n R k vektorrendszert lineárisan függetlennek nevezzük, ha csak λ 1 = λ 2 = = λ n = 0 esetén áll fenn λ 1 a 1 + λ 2 a 2 + + λ n a n = 0 Egy vektorrendszert lineárisan függ nek nevezünk, ha nem lineárisan független A deníció alapján könnyen belátható, hogy lineárisan független vektorrendszer bármely részrendszere is lineárisan független, és lineárisan függ vektorrendszert további vektorokkal b vítve, a b vített rendszer is lineárisan függ (T)lineárisan függetlenség jellemzése: Az a 1,, a n R k vektorrendszer akkor és csakis akkor lineárisan független, ha b = λ 1 a 1 + + λ n a n, csak λ 1 = λ 1,, λ n = λ n esetén teljesül b = λ 1a 1 + + λ na n Megjegyzés Az R k vektortér k dimenziós a következ értelemben: van R k -ban k darab lineárisan független vektor, de bárhogyan is választunk k + 1 darab vektort R k -ból, azok lineárisan függ k (D) bázis: Az R k (k dimenziós) vektortér bármely k számú lineárisan független b 1,, b k vektorát a tér bázisának nevezzük (T)koordináták egy bázisra nézve: Ha b 1,, b k a (k dimenziós) R k vektortér egy bázisa, akkor a tér minden b vektora egyértelm en b = β 1 b 1 + β 2 b 2 + + β k b k 1

2 alakba írható Az itt szerepl β 1, β 2,, β k skalárokat a b vektor b 1,, b k bázisára vonatkozó koordinátáinak nevezzük (D) természetes bázis: Az e 1 = (1, 0,, 0), e 2 = (0, 1,, 0), e k = (0, 0,, 1) R k vektorok az R k tér egy bázisát alkotják, melyet természetes bázisnak nevezünk (D)altér: Az R k vektortér alterén R k olyan (nemüres) L részhalmazát értjük, mely zárt az összeadásra és a skalárral való szorzásra nézve, azaz a, b L, λ R esetén a + b L, λa L teljesül Az egész R k és a {0} alterek, melyeket triviális altereknek nevezünk Tetsz leges a 1, a 2,, a n vektorrendszer általában nem alkot alteret Van viszont olyan altér mely tartalmazza ezt a vektorrendszert, pl az egész vektortér (D)vektorrendszer által generált (vagy kifeszített) altér: Egy a 1, a 2,, a n vektorrendszert tartalmazó legsz kebb alteret a vektorrendszer által generált (vagy kifeszített) altérnek nevezzük, és L(a 1, a 2,, a n )-nel jelöljük Mivel alterek metszete is altér, így L(a 1, a 2,, a n ) éppen az a 1, a 2,, a n vektorrendszert tartalmazó összes alterek metszete Könny bebizonyítani, hogy ez a metszet (vagy a generált altér) azonos a vektorrendszer vektoraiból képezhet összes lineáris kombinációk halmazával, azaz L(a 1, a 2,, a n ) = { α 1 a 1 + + α n a n : α 1,, α n R } (D) vektorrendszer rangja: Az L(a 1, a 2,, a n ) generált altér dimenzióját az a 1, a 2,, a n vektorrendszer rangjának nevezzük, és rang(a 1, a 2,, a n )-nel jelöljük (T) vektorrendszer rangja és e vektorok lineáris függetlensége: Az a 1, a 2,, a n vektorrendszer rangja megegyezik e rendszerb l kiválasztható maximális számú, lineárisan független vektorok számával (T) vektorrendszer rangjának invarianciája: Az a 1, a 2,, a n vektorrendszer által generált altér nem változik meg, (és így a vektorrendszer rangja sem változik) ha megváltoztatjuk az vektorok sorrendjét, valamelyik vektort egy λ 0 skalárral megszorozzuk, valamely vektorához egy másik vektorát hozzáadjuk (D) k n típusú mátrix: Ha k n darab (valós) számot, az a ij (i = 1, 2,, k; j = 1, 2,, n) számokat, k sorban és n oszlopban helyezünk el (és zárójelbe teszünk) az alábbi módon: a 11 a 12 a 1n a 21 a 22 a 2n a k1 a k2 a kn akkor egy k n típusú (valós) mátrixot deniáltunk Az összes k n típusú mátrixok halmazát R k n -nel jelöljük A típus megadásánál mindig a sorok száma az els adat! Az el bbi mátrixot A-val jelölve, mondhatjuk, hogy a ij az A mátrix i-edik sorának j-edik eleme, vagy az A mátrix (i, j)-edik eleme Gyakran használjuk az A = (a ij ) tömör jelölést, ha ez nem okoz félreértést

3 (D) mátrix transzponáltja: Az A = (a ij ) R k n mátrix transzponáltján az A = (a ji ) R n k mátrixot, értjük (a mátrix sorait és oszlopait megcserélve kapjuk a mátrix transzponáltját) (D) mátrixok összege és skalárral való szorzása: Legyenek A = (a ij ), B = (b ij ) R k n azonos típusú mátrixok, és legyen λ R, akkor az A + B és λa mátrixokat -vel deniáljuk A + B := (a ij + b ij ), λa := (λa ij ) (T) mátixm veletek tulajdonságai: Az összes k n típusú valós mátrixok R k n halmaza k n dimenziós valós vektortér a fenti m veletekre nézve Továbbá bármely A, B R k n, λ R mellett (A + B) = A + B, (λa) = λa Két mátrix szorzata csak akkor értelmezett, ha az els tényez (mátrixnak) annyi oszlopa van, mint ahány sora van a második tényez (mátrixnak) (D) mátrixok szorzása: Az A = (a ij ) R k n és B = (b ij ) R n m mátrixok C = AB szorzatán azt a C = (c ij ) R k m mátrixot értjük melyre n c ij := a is b sj = a i1 b 1j + a i2 b 2j + + a in b nj (i = 1, 2,, k; j = 1, 2,, m) s=1 Ezt a szorzást röviden "sor-oszlop kombinációnak " mondjuk, mert a szorzatmátrix c ij eleme, éppen az A mátrix (els tényez ) i-edik sorvektorának és a B mátrix (második tényez ) j-edik oszlopvektorának a bels szorzata (mindkét vektor n dimenziós) (T) mátrixok szorzásának tulajdonságai: Mátrixok szorzására teljesülnek az A(BC) = (AB)C (A + B)C = AC + BC A(B + C) = AB + AC (AB) = B A azonosságok, ahol A, B, C tetsz leges mátrixok, melyekre a felírt m veleteknek van értelme Megjegyezzük, hogy a mátrixszorzás nem kommutatív, azaz általában AB BA, továbbá kvadratikus mátrixokra AE = EA = A, AO = OA = O (D) mátrix invertálhatósága és inverze: Egy A kvadratikus mátrixot invertálhatónak nevezünk, ha van olyan B (kvadratikus) mátrix melyre AB = BA = E teljesül Ezt a B mátrixot A inverzének nevezzük és A 1 -gyel jelöljük (D)permutáció: Az N n = {1, 2,, n} számok egy elrendezését (valamely sorrendben való felírását) ezen elemek egy permutációjának nevezzük Két permutációt akkor tekintünk különböz nek, ha azok legalább egy elem elhelyezésében különböznek N n összes permutációinak halmazát S n -nel jelöljük (D)inverzió: Legyen (a 1, a 2,, a i,, a j,, a n ) az 1, 2, 3,, n elemek egy permutációja Azt mondjuk, hogy e permutációban az a i és a j pár inverzióban áll, ha i < j és a i > a j

4 Aszerint, hogy az inverzióban álló párok száma páros vagy páratlan, szokás páros vagy páratlan permutációról beszélni (D) determináns deníciója: Legyen A = (a ij ) egy n-edrend kvadratikus mátrix determinánsán az A := Az A mátrix α S n ( 1) I(α) a 1α1 a 2α2 a nαn számot értjük, ahol az összegezés kiterjed az 1, 2,, n számok összes α = (α 1, α 2,, α n ) permutációjára, és I(α) az α permutáció inverzióinak számát (az inverzióban álló párok számát) jelöli Másod és harmadrend determinánsok kiszámítására vannak egyszer (és könnyen megjegyezhet képletek: a 11 a 12 a 21 a 22 = a 11a 22 a 12 a 21 a f átlóban lév elemek szorzatából kivonjuk a mellékátlóban lév elemek szorzatát a 11 a 12 a 13 a 21 a 22 a 23 a 31 a 32 a 33 = a 11a 22 a 33 + a 12 a 23 a 31 + a 13 a 21 a 32 a 13 a 22 a 31 a 11 a 23 a 32 a 12 a 21 a 33 Ez a Sarrus szabály, melyet úgy lehet megjegyezni, hogy a determináns els két oszlopát a determináns jobboldal hoz hozzáírva képzeljük, majd a mellékátlóban és vele párhuzamosan t le jobbra lév két másik átlóban lév elemeket összeszorozzuk, e szorzatokat összeadjuk, majd a mellékátlóban és vele párhuzamosan t le jobbra lév két másik átló elemeit összeszorozzuk, e szorzatokat kivonjuk az el z összegb l (T) a determináns alaptulajdonságai: (1) Ha egy determináns sorait és oszlopait felcseréljük, akkor a determináns értéke nem változik (vagy egy négyzetes mátrixnak és transzponáltjának determinánsa megegyezik) (2) Ha egy determináns valamely sorának minden eleme tartalmaz egy c faktort, akkor ez kiemelhet a determináns jele elé (3) Ha egy determináns két sorát felcseréljük akkor a determináns el jelet vált (4) Ha egy determináns két sora megegyezik, akkor a determináns értéke nulla (5) A determináns értéke nem változik, ha egy sorának elemeihez egy másik sor megfelel elemeinek c-szeresét hozzáadjuk (6) Ha egy determináns valamely sorának minden eleme két tag összegére bomlik, akkor a determináns felirható két olyan determináns összegeként melyeknek megfelel sorukban éppen az egyes összeadandók állnak (7) Ha egy determináns egy sorában csupa 0 áll, akkor a determináns értéke nulla (8) Ha egy determináns f átlójában minden elem 1 és a determináns többi eleme 0, akkor a determináns értéke 1 (T) a determinánsok szorzástétele: (Kvadratikus) mátrixok szorzatának determinánsa a tényez mátrixok determinánsainak szorzata, azaz ha A, B (azonos rend ) kvadratikus mátrixok, akkor AB = A B Következmény Egy (kvadratikus) mátrix akkor és csakis akkor invertálható, ha determinánsa nem nulla (D) adjungált aldetermináns: Egy n-edrend kvadratikus A = (a ij ) mátrixból, hagyjuk el az a ij elem sorát és oszlopát (azaz az i-edik sort és a j-edik oszlopot), a visszamaradó n 1-edrend kvadratikus mátrix determinánsát ( 1) i+j -vel megszorozva, a kapott számot az A mátrix a ij eleméhez tartozó adjungált aldeterminánsnak nevezzük, és A ij -vel jelöljük

5 Az adjungált aldetermináns tehát egy részmátrix determinánsa, vagy annak negatívja, attól függ en, hogy mi az elhagyott sor és oszlop indexe Az el jel megállapítására a sakktábla szabály szolgál: helyezzük el mátrixunkat egy képzeletbeli n n-es sakktáblán, de a mez ket színezés helyett + és jelekkel látjuk el, úgy, hogy a bal fels sarokban + jel van Ha egy mez ben + jel van akkor ( 1) i+j = 1, ha jel van, akkor ( 1) i+j = 1 (T) determinánsok kifejtési tétel: Legyen A egy n-edrend kvadratikus mátrix, akkor n { A ha i = i a ij A i j = 0 ha i i j=1 ez a sor szerinti kifejtés, továbbá n { A ha j = j a ij A ij = 0 ha j j ez az oszlop szerinti kifejtés i=1 (T) az inverz mátrix el állítása: Legyen A egy n-edrend invertálható mátrix (azaz legyen A 0, akkor az A 1 = (b ij ) inverz mátrix elemei b ij = A ji A (i, j = 1, 2,, n) alakúak (azaz A inverze az A adjungált aldeterminánsaiból alkotott mátrix transzponáltjának szorosa) 1 A - (D)mátrix rangja: Egy tetsz leges k n típusú mátrix rangján oszlopvektorainak rangját értjük (ami azonos a maximális lineárisan független oszlopvektorok számával) A rangját rang A-val jelöljük Legyen 1 l min{k, n}, akkor A egy l-edrend aldeterminánsát úgy kapjuk, hogy kiválasztjunk a mátrix l darab sorát és l darab oszlopát, és ezek metszetében lév elemekból alkotott l-edrend determinánst képezünk (T) rangszámtétel: Bármely (nemzérus) mátrix rangja megegyezik a maximális rend nullától különböz aldeterminánsainak rendjével A zérusmátrix rangja nulla (D) lineáris egyenletrendszer: Lineáris egyenletrendszernek nevezzük az a 11 x 1 + a 12 x 2 + + a 1n x n = b 1 a 21 x 1 + a 22 x 2 + + a 2n x n = b 2 a k1 x 1 + a k2 x 2 + + a kn x n = egyenletrendszert, ahol a ij, b i (i = 1,, k; j = 1,, n) adott valós számok, x i (i = 1,, n) ismeretlen valós (vagy komplex) számok Az a ij számokat a fenti egyenletrendszer együtthatóinak nevezzük (pontosabban a ij a rendszer i-edik egyenletében az x j ismeretlen együtthatója, a b i az i-edik egyenlet szabad tagja A fenti egyenletrendszert homogénnek nevezzük, ha b 1 = = b k = 0, ellenkez esetben inhomogénnek mondjuk Azt mondjuk, hogy a c 1,, c n számok az egyenletrendszer egy megoldását adják, ha az ismeretlenek helyére helyettesítve ket a rendszer minden egyes egyenletében egyenl ség áll A egyenletrendszert szabályosnak nevezzük, ha k = n, azaz ha az egyenletek és ismeretlenek száma egyenl b k

6 Bevezetve az együtthatómátrixot, és az a 11 a 12 a 1n a 21 a 22 a 2n A = a k1 a k2 a kn x = x 1 x 2 x n, b = oszlopmátrixokat (oszlopvektorokat) a rendszerünk tömören az alakba írható A x = b b 1 b 2 b k (D) egyenletrendszerek ekvivalenciája: Két egyenletrendszert ekvivalensnek nevezünk, ha megoldásaik halmaza egyenl Lineáris egyenletrendszerek esetén (nyilvánvaló módon) az alábbi átalakítások eredményeznek ekvivalens rendszereket (ezeket ekvivalens átalakítások nak mondjuk): az egyenletek sorrendjének megváltoztatása, az egyenletekben szerepl tagok sorrendjének megváltoztatása, a rendszer bármelyik egyenletének szorzása (minden tag szorzása) egy nemzérus számmal, a rendszer bármelyik egyenletének hozzáadása egy másik egyenletéhez A Gauss elimináció az ismeretlenek szukcesszív kiküszöbölése A Gauss elimináció lépései: Tegyük fel, hogy a 11 0 Az els egyenlet a i1 -szeresét az i-edik egyenlethez hozzáadva i = a 11 2, 3,, k esetén, az x 1 ismeretlen elt nik a második, harmadik, k-adik egyenletb l Ha a 11 = 0, akkor az els egyenletben keresünk egy ismeretlent melynek együtthatója 0 és ez veszi át x 1 szerepét Ezután a második egyenlet alkalmas konstanszorosainak a harmadik k-adik egyenlethez való hozzádásával kiküszöböljük a harmadik ismeretlent a negyedik, k-adik egyenletb l (T) általános lin egyenletrendszer megoldhatósága: Az a 11 x 1 + a 12 x 2 + + a 1n x n = b 1 a 21 x 1 + a 22 x 2 + + a 2n x n = b 2 a k1 x 1 + a k2 x 2 + + a kn x n = lineáris egyenletrendszer akkor is csakis akkor oldható meg, ha a rang A = rang (A b) rangfeltétel teljesül, ahol A a rendszer mátrixa, (A b) a b vített mátrix, melyet az A mátrixból úgy kapunk, hogy az A mátrixhoz n + 1-edik oszlopként hozzáírjuk a szabad tagok b oszlopvektorát (T) homogén lin egyenletrendszer nemtriviális megoldásának létezése: Ax = 0 (A R k n, x = (x 1,, x n ) R n 1 ) homogén lineáris egyenletrendszernek akkor is csakis akkor van triviálistól különböz megoldása, ha rang A < n b k Az

(azaz a rendszer A mátrixának rangja kisebb mint az ismeretlenek száma) Ha ez teljesül, akkor a homogén rendszer összes megoldásai R n -nek egy dimenziós alterét alkotják n rang A (T) lin egyrendszer megoldásának szerkezete: Az Ax = b (A R k n, x R n 1, b R k 1 ) inhomogén lineáris egyenletrendszer bármely x megoldása x = x + x h alakba írható, ahol x az inhomogén egyenlet egy rögzített (partikuláris) megoldása, x h pedig a megfelel homogén egyenlet egy tetsz leges megoldása megoldásalterének az x vektorral való eltoltja Ax = 0 (T) Cramer szabály: Legyen A egy n-edrend kvadratikus mátrix A Így a megoldások halmaza az utóbbi egyenletrendszer Ax = b (A R n n, x, b R n 1 ) (szabályos) lineáris egyenletrendszer akkor és csakis akkor határozott (egyértelm en megoldható), ha A 0 Ha ez teljesül akkor a rendszer egyetlen megoldása x i = A i A (i = 1, 2,, n) ahol A i az a mátrix melyet az A mátrixból úgy kapunk, hogy annak i-edik oszlopát a szabad tagok b (oszlop)vektorára cseréljük ki (T) szabályos homogén egyrendszer nemtriviális megoldásának létezése: Legyen A egy n-edrend kvadratikus mátrix A Ax = 0 (A R n n, x R n 1 ) (szabályos) homogén lineáris egyenletrendszernek akkor és csakis akkor van nemtriviális megoldása, ha A = 0 (D)lineáris leképezés: A ϕ : R n R n leképezést lineáris leképezésnek nevezzük, ha bármely x, y R n és bármely λ R esetén ϕ(x + y) = ϕ(x) + ϕ(y) (azaz ϕ additív), ϕ(λx) = λϕ(x) (azaz ϕ homogén) (D)lineáris leképezés mátrixa: A ϕ lineáris leképezés mátrixán azt az A ϕ = (a ij ) (n-edrend kvadratikus) mátrixot értjük, melynek j-edik oszlopában a ϕ(b j ) képvektornak a b 1,, b n bázisra vonatkozó koordinátái állnak Az összes ϕ : R n R n lineáris leképezések és a hozzájuk rendelt A ϕ R n n mátrixok közötti n ϕ A ϕ (A ϕ = (a ij ), ahol ϕ(b j ) = a ij b i ) leképezés bijektív, minden ϕ lineáris leképezéshez egyetlen n-edrend A ϕ mátrix tartozik, és minden ilyen mátrix egyetlen lineáris leképezést határoz meg S t, ez a bijektív leképezés meg rzi a mátrixm veleteket is i=1 7

8 Ha ϕ, ψ : R n R n lineáris leképezések, úgy összegüket, számszorosukat és kompoziciójukat az alábbi módon értelmezzük: (ϕ + ψ)(x) := ϕ(x) + ψ(x) (x R n ), (λϕ)(x) := λϕ(x) (λ R, x R n ), (ϕ ψ)(x) := ϕ(ψ(x)) (x R n ) (T) a lineáris leképezések és hozzájuk tartozó mátrixok kapcsolata: Rögzített bázis és tetsz leges ϕ, ψ : R n R n lineáris leképezések esetén A ϕ+ψ = A ϕ + A ψ a ϕ A ϕ leképezés megtartja az összeadást, A λϕ = λa ϕ a ϕ A ϕ leképezés megtartja az számmal való szorzást, A ϕ ψ = A ϕ A ψ a ϕ A ϕ leképezés a kompoziciót szorzatba viszi át Továbbá ϕ : R n R n akkor és csakis akkor bijektív, ha A ϕ invertálható (T): Legyen b 1,, b n és b 1,, b n az R n tér két bázisa, és A ϕ = (a ij ), ahol ϕ(b j ) = n a ij b i i=1 A ϕ = (a ij ), ahol ϕ(b j ) = n a ij b i i=1 a ϕ : R n R n lineáris leképezés mátrixai Akkor van olyan S = (s ij ) R n n invertálható mátrix, hogy A ϕ = S 1 A ϕ S (D) mátrix sajátértéke, sajátvektora: Legyen A egy n n-es mátrix A λ R számot A sajátértékének nevezzük, ha van olyan nullától különböz x R n vektor, melyre Ax = λx teljesül Az x vektort A (λ sajátértékhez tartozó) sajátvektorának nevezzük A sajátértékeket a A λe = 0 egyenletb l határozzuk meg, a sajátvektorokat pedig a lineáris homogén egyenletrendszerb l (A λe)x = 0 (D) mátrix diagonalizálhatósága: Egy n n-es A mátrixot diagonalizálhatónak nevezünk, ha van olyan invertálható n n-es S mátrix és egy D diagonális mátrix, melyekre teljesül S 1 AS = D Diagonális mátrixokra használni fogjuk a λ 1 0 0 0 λ 2 0 D = diag(λ 1, λ n ) := 0 0 λ n jelölést is (T)sajátérték invarianciája: Ha A, S n n-es mátrixok, S invertálható, akkor az A és S 1 AS mátrixok sajátértékei megegyeznek

(T) a diagonalizálhatóság kritériuma: Egy n n-es A mátrix akkor és csakis akkor diagonalizálható, ha van n lineárisan független sajátvektora, x 1,, x n Ekkor λ 1 0 0 S 1 0 λ 2 0 AS = diag(λ 1, λ n ) = 0 0 λ n ahol az S mátrix oszlopvektorai rendre x 1,, x n, a λ 1,, λ n sajátértékek 9 számok pedig a hozzájuk tartozó Nem minden mátrix diagonalizálható! Nincs a diagonalizálhatóságra könnyen ellen rizhet szükséges és elegend feltétel Ha az n n-es A mátrixnak n különböz sajátértéke van, akkor A diagonalizálható Ez elegend, de nem szükséges feltétel (D) szimmetrikus, ortogonális mátrixok: Egy n n-es A mátrixot szimmetrikusnak nevezünk, ha A = A, ortogonálisnak nevezünk, ha A A = E Egy mátrix akkor és csakis akkor szimmetrikus, ha elemei a f átlóra nézve szimmetrikusak (D) ortogonális vektorok: Két (R n -beli) vektort akkor mondunk ortogonálisnak, ha bels szorzatuk zérus (D) ortonormált bázis: Az R n tér egy bázisát ortonormált bázisnak nevezzük, ha vektorai páronként ortogonális egységvektorok Azaz a b 1,, b n bázis akkor és csakis akkor ortonormált ha { 1 ha i = j, b i, b j = (i, j = 1,, n) 0 ha i j, (T): Ha b 1,, b n és b 1,, b n az R n tér két ortonormált bázisa, ϕ : R n R n egy lineáris leképezésés A ϕ = (a ij ), A ϕ = (a ij ) e leképezés mátrixai a megfelel bázisokra nézve, akkor a A ϕ = S 1 A ϕ S transzformációs képletben szerepl S mátrix ortogonális (T) szimmetrikus mátrixok sajátértékei és sajátvektorai: Legyen A egy n n-es szimmetrikus mátrix, akkor A sajátértékei mind valós számok, A különböz sajátértékeihez tartozó sajátvektorok ortogonálisak (T) szimmetrikus mátrixok spektráltétele: Legyen A egy n n-es szimmetrikus mátrix, akkor létezik olyan ortogonális U mátrix, amelyre U 1 AU = diag(λ 1, λ n ) ahol λ 1,, λ n az A sajátértékei, az U mátrix i-edik oszlopa pedig a λ i -hez tartozó sajátvektora (i = 1,, n) (D) bilineáris, kvadratikus függvény: Legyen A = (a ij ) R n n, akkor a F (x, y) := Ax, y (x, y R n ) függvényt bilineáris függvénynek nevezzük, a Q(x) := Ax, x (x R n ) függvényt kvadratikus függvénynek nevezzük

10 Szokás Ax, y -t bilineáris formának, Ax, x -et kvadratikus formának nevezni Korábbi számításunkat felhasználva kapjuk, hogy Q(x) = Q(x 1,, x n ) = n i=1 j=1 Mivel x i x j = x j x i így feltehet, hogy A szimmetrikus mátrix n a ij x i x j, (D) pozitív, negatív denit, indenit kvadratikus függvények: Azt mondtuk, hogy a Q : R n R kvadratikus függvény pozitív denit, ha Q(x) > 0 minden x R n, x 0 esetén, a Q : R n R kvadratikus függvény negatív denit, ha Q(x) < 0 minden x R n, x 0 esetén, a Q : R n R kvadratikus függvény indenit, ha Q(x) felvesz pozitív és negatív értékeket is Hogyan lehet eldönteni azt hogy Q : R n R pozitív, negatív, vagy indenit? (T) kritérium kvadratikus függvény denitségére: A szimmetrikus A = (a ij ) R n n mátrixszal képezett Q(x) := Ax, x (x R n ) kvadratikus függvény akkor és csakis akkor pozitív denit, ha A összes sajátértéke pozitív, negatív denit, ha A összes sajátértéke negatív, indenit, ha A-nak van pozitív és negatív sajátértéke is (T) kritérium kvadratikus függvény denitségére: Legyen A = (a ij ) R n n szimmetrikus mátrix, és legyen k (k = 1,, n) az A mátrix bal fels k k-s sarokmátrixának determinánsa, azaz 1 = a 11, 2 = a 11 a 12 a 21 a 22, a 11 a 12 a 13 3 = a 21 a 22 a 23 n = A a 31 a 32 a 33 ( k -k az A mátrix sarokf minorjai), akkor Q(x) := Ax, x (x R n ) kvadratikus függvény akkor és csakis akkor pozitív denit, ha k > 0 ha k = 1,, n, negatív denit, ha ( 1) k k > 0 ha k = 1,, n (D) vektorok skaláris vagy bels szorzata: Az x = (x 1, x 2,, x k ), y = (y 1, y 2,, y k ) R k vektorok skaláris vagy bels szorzatát -val deniáljuk x, y := x 1 y 1 + x 2 y 2 + + x k y k Könny ellen rizni, hogy a skaláris szorzat teljesíti az alábbi tulajdonságokat Bármely x, y, z R k és bármely λ R esetén x + y, z = x, z + y, z, λx, y = λ x, y, x, y = y, x, x, x 0 és x, x = 0 akkor és csakis akkor, ha x = 0 Ez a 4 tulajdonság alkotja a skaláris szorzás axiómáit

11 (T): [Cauchy-Schwarz egyenl tlenség] Bármely két x, y R k vektor esetén érvényes a Cauchy-Schwarz egyenl tlenség: x, y x, x y, y (D) vektor hossza: Az x = x, x számot az x = (x 1, x 2,, x k ) R k vektor hosszának (vagy normájának ill abszolút értékének ) nevezzük A Cauchy-Schwarz egyenl tlenség felhasználásával könnyen igazolhatjuk a norma tulajdonságait: bármely x, y R k és bármely λ R esetén x 0 és x = 0 akkor és csakis akkor, ha x = 0 λx = λ x x + y x + y (D)távolság: Az x, y R k pontok távolságát -nal deniáljuk d(x, y) = x y (D)környezet: Egy a R k pont ε > 0 sugarú (nyílt) környezetén a halmazt értjük K(a, ε) := { x R k : d(x, a) = x a < ε } (D)sorozat: Egy a : N R k függvényt R k -beli sorozatnak nevezünk Jelölések a(n) = a n = (a n,1, a n,2,, a n,k ) (n N), a = (a n ) (D)konvergens, diveregens sorozat: Az (a n ) (R k -beli) sorozatot konvergensnek nevezzük, ha van olyan b R k, hogy bármely ε > 0-hoz létezik olyan N(ε) R szám, hogy a n b < ε ha b-t a sorozat határérték ének (limeszének) nevezzük és az n > N(ε) a n b (n ) vagy lim n a n = b jelölést használjuk N(ε)-t az ε-hoz tartozó küszöbszámnak nevezzük Egy R k -beli sorozatot divergensnek nevezünk, ha nem konvergens (T): [R k -beli sorozat koordinátánként konvergens] akkor és csakis akkor, ha a n = (a n,1, a n,2,, a n,k ) b = (b 1, b 2,, b k ) (n ) a n,i b i (n ) minden i = 1, 2,, k mellett Ez azt jelenti, hogy egy vektorsorozat akkor és csakis akkor konvergens, ha a sorozat minden koordinátája konvergens és határértéke a határvektor megfelel koordinátája (D)függvény határértéke: Legyen f : D R k R és legyen x 0 D (=D torlódási pontjainak halmaza) Azt mondjuk, hogy f-nek van (véges, vagy végtelen) határértéke az x 0 pontban, ha van olyan a R b b vített valós szám, hogy bármely olyan D-beli (x n ) n N sorozatra, melyre lim x n = x 0 és x n x 0, n teljesül a lim f(x n) = a egyenl ség a R b -t az f függvény x 0 pontbeli határértékének nevezzük n és lim f(x) = a-vel, vagy f(x) a (x x 0 )-vel jelöljük x x 0

12 Korábbi deníció: Legyen f : D R k R és legyen x 0 D (a D halmaz torlódási pontja) Azt mondjuk, hogy f-nek van (véges) határértéke az x 0 pontban, ha van olyan a R szám, hogy minden ɛ > 0-hoz van olyan δ(ɛ) > 0, hogy f(x) a < ɛ ha 0 < x x 0 < δ(ɛ) és x D teljesül Az a R számot az f függvény x 0 pontbeli határértékének nevezzük, és jelölésére az a = lim f(x) x x 0 vagy f(x) a ( ha x x 0 )-t használjuk (D) függvény folytonossága: Az f : D R R függvényt folytonosnak nevezzük az x 0 D pontban, ha bármely D-beli x 0 -hoz konvergáló D x n x 0 (n ) sorozat esetén a függvényértékek f(x n ) (n N) sorozata az x 0 pontbeli függvényértékhez tart, azaz lim n f(x n) = f(x 0 ) Korábbi deníció: Az f : D R k R függvényt értelmezési tartományának x 0 D pontjában folytonosnak nevezzük, ha bármely ɛ > 0-hoz van olyan δ(ɛ) > 0, hogy teljesül f(x) f(x 0 ) < ɛ ha x x 0 < δ(ɛ) és x D (D) függvény (totális) dierenciálhatósága, deriváltja: Az f : D R k R függvényt az x 0 D bels pontban (totálisan) dierenciálhatónak nevezzük, ha van olyan A R k vektor melyre f(x) f(x 0 ) A, x x 0 lim = 0 x x 0 x x 0 Az f (x 0 ):=A vektort az f függvény x 0 pontbeli deriváltjának nevezzük (D) függvény irány menti dierenciálhatósága, irány menti deriváltja: Az f : D R k R függvényt az x 0 D bels pontban az e (ahol e egy R k -beli egységvektor) irány mentén dierenciálhatónak nevezzük, ha létezik a f(x 0 + te) f(x 0 ) lim t 0 t (véges) határérték E határértéket D e f(x 0 )-lal jelöljük, és az f függvény e iránymenti deriváltjának nevezzük az x 0 pontban (D) függvény parciális deriváltja: Legyen e = u i = (0,, 0, 1, 0,, 0) az i-edik tengely irányába mutató egységvektor (az u i vektor i-edik koordinátája 1, a többi 0) akkor a D ui f(x 0 ) iránymenti deriváltat az f függvény i-edik változója szerinti parciális deriváltjának nevezzük az x 0 pontban Jelölésére az i f(x 0 ) szimbólumot használjuk Egyéb jelölések: xi f(x 0 ), f x i (x 0 ), f xi (x 0 ) (D) parciális dierenciálhatóság: Az f : D R k R függvényt az x 0 D bels pontban parciálisan dierenciálhatónak nevezzük, ha i f(x 0 ) minden i = 1,, n-re létezik (T) iránymenti derivált kiszámítása: Ha f : D R n R az x 0 D bels pontban (totálisan) dierenciálható, akkor bármely e = (e 1,, e k ) R k, e = e 2 1 + + e2 k = 1 irány mentén is dierenciálható x 0 -ban, és az iránymenti deriváltjára D e f(x 0 ) = A, e = A 1 e 1 + + A k e k

13 áll fenn, ahol A = f (x 0 ) (T) (totális) dierenciálhatóság folytonosság: (totálisan) dierenciálható, akkor f folytonos x 0 -ban Ha f : D R k R az x 0 D bels pontban (T) parc deriv folytonossága (totális) dierenciálhatóság : Ha az f : D R k R függvénynek az x 0 D bels pont egy környezetében folytonos parciális deriváltjai vannak (ekkor azt úgy mondjuk, hogy a függvény folytonosan parciálisan dierenciálhato e környezetben) akkor f az x 0 pontbanban (totális) dierenciálható, (így folytonos is) TÉTEL [láncszabály: összetett függvény dierenciálhatósága] Ha a g i : D R k R (i = 1, 2,, l) függvények dierenciálhatók az x 0 D bels pontban, és f : E R l R dierenciálható az y 0 = g(x 0 ) E bels pontban, ahol g(x) := (g 1 (x), g 2 (x),, g l (x)) (x D), akkor a h(x) := f(g(x)) összetett függvény (mely x 0 D egy környezetében biztosan értelmezve van) dierenciálható x 0 D-ben és l i h(x 0 ) = j f(g(x 0 )) i g j (x 0 ) (i = 1, 2,, k) j=1 Utóbbi képletet nevezzük láncszabálynak (D) magasabb rend parciális deriváltak: Tegyük fel, hogy az f : D R k R függvénynek az x 0 D bels pont egy környezetében létezik pl az i-edik változó szerinti i f parciális derivált Ha ez parciálisan dierenciálható pl az j-edik változó szerint, úgy a e deriválást elvégezve kapjuk a j i f(x 0 ) := j ( i f(x 0 )) második parciális deriváltját f-nek az x 0 pontban az i-edik és j-edik változók szerint (ebben a sorrendben) Hasonlóan ha a j i f(x) drivált létezik x 0 egy környezetében és ez parciálisan dierenciálható pl a l-edik változó szerint, úgy a e deriválást elvégezve kapjuk a l j i f(x 0 ) := l ( j i f(x 0 )) harmadik parciális deriváltat Hasonlóan értelmezhetjük a negyed- és magasabbrend parciális deriváltakat is (T) Young tétel: a vegyes parciális deriváltak függetlensége a deriválás sorrendjét l: Ha az f : D R k R függvénynek az x 0 D bels pont egy környezetében az összes m 2-edik parciális deriváltjai léteznek és folytonosak az x 0 pontban, akkor a függvény m-edik parciális deriváltjai az x 0 pontban a dierenciálás sorrendjét l függetlenek (D) maximum, minimum: Azt mondjuk, hogy az f : D R k R függvénynek lokális (helyi) maximuma (minimuma) van az x 0 D pontban, ha van olyan ε > 0 hogy f(x 0 ) f(x) (f(x 0 ) f(x)) teljesül minden x K(x 0, ε) D esetén Azt mondjuk, hogy az f : D R k R függvénynek szigorú lokális (helyi) maximuma (minimuma) van az x 0 D pontban, ha van olyan ε > 0 hogy f(x 0 ) > f(x) (f(x 0 ) < f(x)) teljesül minden x K(x 0, ε) D, x x 0 esetén Azt mondjuk, hogy az f : D R k R függvénynek globális (vagy abszolút) maximuma (minimuma) van az x 0 D pontban, ha esetén f(x 0 ) f(x) (f(x 0 ) f(x)) teljesül minden x D

14 Azt mondjuk, hogy az f : D R k R függvénynek szigorú globális (vagy abszolút) maximuma (minimuma) van az x 0 D pontban, ha esetén f(x 0 ) > f(x) (f(x 0 ) < f(x)) teljesül minden x D, x x 0 (T) a széls érték létezésének elegend feltétele: Korlátos zárt halmazon folytonos függvény felveszi a függvényértékek inmumát és supremumát függvényértékként, ami azt jelenti, hogy a függvénynek van minimuma és maximuma (az illet korlátos zárt halmazon) (T) a széls érték els rend szükséges feltétele: Ha f : D R k R f ggvénynek az x 0 D bels pontban lokális széls értéke van, és léteznek f els parciális deriváltjai x 0 -ban, akkor 1 f(x 0 ) = 2 f(x 0 ) = = k f(x 0 ) = 0 Az el z feltételnek elegettev x 0 pontokat az f függvény stacionárius pontjainak nevezzük (T) a széls érték másodrend elegend feltétele: Tegyük fel, hogy az f : D R k R összes második parciális deriváltjai folytonosak az x 0 D bels pont egy környezetében, továbbá azaz x 0 stacionárius pontja f-nek I Ha a 1 f(x 0 ) = 2 f(x 0 ) = = k f(x 0 ) = 0, Q(h) = Q(h 1,, h k ) := k j=1 i=1 k j i f(x 0 )h i h j kvadratikus függvény pozitív denit, azaz Q(h) > 0 minden h R k, h 0 esetén, akkor f-nek szigorú lokális minimuma van x 0 -ban, II ha a Q kvadratikus függvény negatív denit, azaz Q(h) < 0 minden h R k, h 0 esetén, akkor f-nek szigorú lokális maximuma van x 0 -ban, III ha a Q kvadratikus függvény indenit, azaz Q(h) felvesz pozitív és negatív értéket is, akkor f-nek nincs széls értéke x 0 -ban (T) a széls érték másodrend elegend feltétele determinánsok segítségével: Tegyük fel, hogy az f : D R k R összes második parciális deriváltjai folytonosak az x 0 D bels pont egy környezetében, továbbá 1 f(x 0 ) = 2 f(x 0 ) = = k f(x 0 ) = 0, azaz x 0 stacionárius pontja f-nek Legyen A = ( i j f(x 0 )) R k k az f függvény x 0 pontbeli második parciális deriváltjaiból álló mátrix, és legyen i (i = 1,, k) az A mátrix bal fels i i típusú sarokmátrixának determinánsa, azaz 1 : = 1 1 f(x 0 ) 2 : = 1 1 f(x 0 ) 1 2 f(x 0 ) 2 1 f(x 0 ) 2 2 f(x 0 ) 3 : = 1 1 f(x 0 ) 1 2 f(x 0 ) 1 3 f(x 0 ) 2 1 f(x 0 ) 2 2 f(x 0 ) 2 3 f(x 0 ) 3 1 f(x 0 ) 3 2 f(x 0 ) 3 3 f(x 0 ) k : = A I Ha 1 > 0, 2 > 0, 3 > 0,, k > 0 akkor f-nek szigorú lokális minimuma van x 0 -ban,

II ha 1 < 0, 2 > 0, 3 < 0,, ( 1) k k > 0 akkor f-nek szigorú lokális maximuma van x 0 -ban Két változós függvény esetén az el z tétel második része kissé b víthet : 15 I Ha 1 = 1 1 f(x 0 ) > 0, 2 = 1 1 f(x 0 ) 1 2 f(x 0 ) 1 2 f(x 0 ) 2 2 f(x 0 ) akkor f-nek szigorú lokális minimuma van x 0 -ban, II ha 1 = 1 1 f(x 0 ) < 0, 2 = 1 1 f(x 0 ) 1 2 f(x 0 ) 1 2 f(x 0 ) 2 2 f(x 0 ) akkor f-nek szigorú lokális maximuma van x 0 -ban III ha 2 = 1 1 f(x 0 ) 1 2 f(x 0 ) 1 2 f(x 0 ) 2 2 f(x 0 ) < 0 akkor f-nek nincs széls értéke x 0 -ban > 0 > 0 (D)lokális feltételes maximum (minimum): Legyenek f : D R k R, g i : D R k R i = 1,, l, l < k adott függvények Azt mondjuk, hogy az f függvénynek az x 0 D pontban a g 1 (x) = 0, g 2 (x) = 0,, g l (x) = 0 feltételek mellett lokális feltételes maximuma (minimuma) van, ha g 1 (x 0 ) = = g l (x 0 ) = 0, és van olyan ε > 0 hogy mellett, melyre f(x 0 ) f(x) (f(x 0 ) f(x)) teljesül minden x D K(x 0, ε) Ha g 1 (x 0 ) = = g l (x 0 ) = 0, és g 1 (x) = = g l (x) = 0 f(x 0 ) > f(x) (f(x 0 ) < f(x)) teljesül minden x 0 x D K(x 0, ε) mellett, melyre g 1 (x) = = g l (x) = 0, akkor szigorú lokális feltételes maximum (minimum)-ról beszélünk (T) a feltételes széls érték szükséges feltétele: Tegyük fel, hogy az f, g i : D R k R (i = 1,, l, l < k), az f függvénynek az els parciális deriváltjai folytonosak az x 0 D bels egy környezetében f-nek az x 0 D pontban a g 1 (x) = 0, g 2 (x) = 0,, g l (x) = 0 feltételek mellett lokális feltételes széls értéke van, a 1 g 1 (x 0 ) k g 1 (x 0 ) 1 g l (x 0 ) k g l (x 0 ) R l k mátrix rangja l (azaz van nemzérus l-edrend aldeterminánsa) Akkor vannak olyan λ 0 = (λ 01,, λ 0l ) R l valós számok, hogy az függvényre L(λ, x) := f(x) + λ 1 g 1 (x) + + λ l g l (x) (λ = (λ 1,, λ l ) R l, x D) 1 L(λ 0, x 0 ) = = l+k L(λ 0, x 0 ) = 0 A λ 1, λ l változókat Lagrange-féle multiplikátoroknak nevezzük, az L függvényt a feltételes széls érték probléma Lagrange-féle függvény ének nevezzük

16 A feltételes széls érték probléma megoldása úgy történik, hogy a 1 L(λ, x) = = l+k L(λ, x) = 0 l + k db egyenletb l álló egyenletrendszert megoldjuk a λ 1, λ l, x 1,, x k, ismeretlenekre, a kapott (λ 0, x 0 ) = (λ 01,, λ 0l, x 01,, x 0k ) R l D megoldások a Lagrange függvény stacionárius pontjai Ennek az x 0 = (x 01,, x 0k ) koordinátái a feltételes széls érték lehetséges helyei, λ 0 = (λ 01,, λ 0l ) a megfelel Lagrange multiplikátorok (T) a feltételes széls érték elegend feltétele: Tegyük fel, hogy az f, g i : D R k R (i = 1,, l, l < k), második parciális deriváltjai folytonosak az x 0 D bels pont egy környezetében, λ 0 R l, x 0 D, a 1 L(λ, x) = = l+k L(λ, x) = 0 k + l db egyenletb l álló rendszer megoldása, ahol L(λ, x) a probléma Lagrange függvénye, a 1 g 1 (x 0 ) k g 1 (x 0 ) R l k 1 g l (x 0 ) k g l (x 0 ) mátrix rangja l és rangmeghatározó determinánsa a mátrix jobboldali l l-es sarokdetermináns, azaz k l+1 g 1 (x 0 ) k g 1 (x 0 ) 0 k l+1 g l (x 0 ) k g l (x 0 ) (1) Ha a k k Q(h) = Q(h 1,, h k ) := i j L(λ 0, x 0 )h i h j j=1 i=1 kvadratikus függvény pozitív minden olyan h R k, h 0 esetén, melyre k j g i (x 0 )h j = 0 minden i = 1,, l mellett, akkor f-nek (szigorú) lokális feltételes minimuma van az x 0 pontban, (2) Ha a k k Q(h) = Q(h 1,, h k ) := i j L(λ 0, x 0 )h i h j j=1 i=1 kvadratikus függvény negatív minden olyan h R k, h 0 esetén, melyre j=1 k j g i (x 0 )h j = 0 minden i = 1,, l mellett, akkor f-nek (szigorú) lokális feltételes maximuma van az x 0 pontban (T) a feltételes széls érték elegend feltétele determinánsokkal: Tegyük fel, hogy az f, g i : D R k R (i = 1,, l, l < k), második parciális deriváltjai folytonosak az x 0 D bels pont egy környezetében, (λ 0, x 0 ) R l D a 1 L(λ, x) = = l+k L(λ, x) = 0 k + l db egyenletb l álló rendszer megoldása (azaz L stacionárius pontja), ahol L(λ, x) a probléma Lagrange függvénye, a 1 g 1 (x 0 ) k g 1 (x 0 ) 1 g l (x 0 ) k g l (x 0 ) R l k j=1

mátrix rangja l és rangmeghatározó determinánsa a jobboldali l l-es sarokdetermináns, azaz k l+1 g 1 (x 0 ) k g 1 (x 0 ) 0 k l+1 g l (x 0 ) k g l (x 0 ) Legyen j (j = 2l + 1, 2l + 2,, l + k) a 0 0 1 g 1 (x 0 ) k g 1 (x 0 ) 0 0 1 g l (x 0 ) k g l (x 0 ) 1 g 1 (x 0 ) 1 g l (x 0 ) l+1 l+1 L(λ 0, x 0 ) l+1 l+k L(λ 0, x 0 ) k g 1 (x 0 ) k g l (x 0 ) l+k l+1 L(λ 0, x 0 ) l+k l+k L(λ 0, x 0 ) szimmetrikus blokkmátrix bal fels j-edrend sarokdeterminánsá (1) Ha ( 1) l j > 0 (j = 2l + 1, 2l + 2,, l + k), akkor f-nek (szigorú) lokális feltételes minimuma van az x 0 pontban, (2) Ha ( 1) l+j j > 0 (j = 2l + 1, 2l + 2,, l + k), akkor f-nek (szigorú) lokális feltételes maximuma van az x 0 pontban Vegyük észre, hogy a blokkmátrix éppen a Lagrange függvény összes második parciális deriváltjaiból álló mátrix azaz ( i j L(λ 0, x 0 )) R (l+k) (l+k) 17