Miért működik A parciális törtekre bontás? Borbély Gábor 212 június 7 Tartalomjegyzék 1 Lineáris algebra formalizmus 2 2 A feladat kitűzése 3 3 A LER felépítése 5 4 A bizonyítás 6
1 Lineáris algebra formalizmus Ebben a fejezetben bevezetünk egy vektor-mátrix formalizmust a polinomok kezelésére Egy n-ed fokú p(x) polinom értékét felfoghatjuk két, R n+1 -beli vektor skalárszorzataként: p + p 1 x + p 2 x 2 + + p n x n = p(x) = p x n ) ( p p n, ( 1 x n ) (1) Ílymódon a polinomot egy p R n+1 vektor jellemez (x n egy szimbólum, nem adat, az indexe pedig a fokszámot jelöli) Egy vektor egyértelműen megad egy polinomot, de egy polinom nem határoz meg egyértelműen egy vektort, mert ízlés szerint koordinátákat fűzhetünk annak végére Mosttantól minden p(x) R n [x] polinomot együtt kezelünk a p R n+1 vektor megfelelőjével (feltesszük, hogy deg(p) teljes, vagyis nincs p végén elem) Két polinomot össszeadhatunk az őket reprezentáló vektorok segítségével: p(x) + q(x) = (p + q) x Ha nem egyenlő fokszámúak, akkor a rövidebbik vektor végére -kat fűzünk Polinomokat szorozni is tudunk Adott p(x) R n [x] polinomhoz definiálunk egy szorzó mátrixot, ami a p(x) polinommal való szorzást végzi el p(x) = p + p 1 x + p 2 x 2 + + p n x n p p 1 p p 1 D l (p) := p n p R (n+l+1) (l+1) (2) p n p1 p n } {{ } l+1 darab példánya p-nek 2
Így bármilyen b(x) R l [x] polinomot reprezentáló b R l+1 vektorra a D l (p) b R n+l+1 vektor a p(x) b(x) polinomot reprezentálja A D l (p) mátrix aljára tetszőleges számú sorokat fűzhetünk és annyiszor rakjuk bele a p vektort, amekkora polinomot akarunk szorozni vele Ugyanakkor egy szorzó mátrix első oszlopából kiolvasható, hogy milyen polinommal szoroz, így egy polinom egy mátrixszal is reprezentálható Mátrix formalizmussal: legyen N egy nagy természetes szám (aminél nagyobb fokú polinom biztosan nem fordul elő a számolásainkban) és R N [x] p(x) p R N+1 polinom legyen megfeleltetve D N (p) mátrixnak Lehet négyzetes mátrix-reprezentációt is adni, ezt N D(p)-vel jelöljük p p 1 p ND(p) := R (N+1) (N+1) p n p Így a N D(p) R (N+1) (N+1) mátrixok kommutatív gyűrűt alkotnak Ez nem más, mint az R N [x] egy bijektív reprezentációja Megjegyezzük azt is, hogy rank(d l (p)) = l+1 bármilyen nem polinomot is jelöl p, mivel az Im(D l (p)) képtér a p(x), x p(x), x l p(x) polinomok lineárisan generált terének felel meg Valamint N D(p), ha egy polinomot (mátrixot) balról szoroz, akkor nem csökkenti annak rangját, amennyiben az eredményül kapott polinom foka nem haladja meg az N-et 2 A feladat kitűzése Az algebra alaptételéből tudjuk, hogy minden (egy főegyütthatós) p(x) R N [x] polinom a következő alakban faktorizálható R felett: k p(x) = (x x i ) νi i=1 k j=k +1 ( (x xj ) 2 + c j ) νj (3) ahol ν i >, ν j >, x i R, x j R, N = k i=1 ν i + k j=k +1 2ν j, c j > és x i -k mind különböznek az első csoportban és (x j, c j )-k mind különböznek a má- 3
sodik csoportban Hogy értelme legyen parciális törtekre bontani, feltesszük k 2-t Kicsit egyszerüsítsünk a jelölésen k p(x) = p i (x) ν i (4) i=1 ahol p i -k R felett irreducibilis polinomok, mind páronként relatív prímek Használjuk azt a jelölést is, hogy ν i ha p i lineáris µ i =, (5) 2ν i ha p i másodfokú (nincs valós gyöke) így N = k i=1 µ i Továbbá legyen P i (x) := p i (x) ν i, ezzel k p(x) = P i (x) (6) i=1 ahol P i -k rendre µ i -ed fokú polinomok, és semelyik kettő sem tartalmaz közös faktorokat (és feltettük, hogy minden főegyüttható 1) A parciális törtekre bontást a közetkező alakban fogjuk keresni (azért, hogy egy általános racionális törtfüggvény primitív függvényét megkapjuk): 1 k p(x) = ν i i=1 ν=1 Lényegében egy a R N olvashatóak ki: a i ν p i (x) ν i ν+1 + lineáris tagok {}}{ a = a 1 1a 1 2 a 1 ν 1, a 2 1a 2 2 a 2 ν 2, a k ν, k } {{ } ν 1 darab k ν j j=k +1 µ=1 a j µ1 + a j µ2 x p j (x) ν j µ+1 (7) vektort keresünk, ahol a következő együtthatók } {{ } ν 2 darab másodfokú tagok {}}{, a j 11a j 12 a j ν j 1a j ν j 2, } {{ } 2 ν j darab Szorozzuk be (7)-t p(x)-el és használjuk hozzá a következő jelölést: p j (x) := i=1k P i (x) R N µj [x] (8) i j k ( ) ν i 1 ν k j 1 1 = p i (x) a i νp i (x) ν ( + p j (x) a j µ1 + a j µ2 x ) p j (x) µ (9) i=1 ν= j=k +1 µ=1 4
A fenti egyenlőség, már polinomok egyenlősége, ezt fogjuk a fenti formalizmussal egy lineáris egyenletrendszerré alakítani, majd együtthatómátrixszáról belátjuk, hogy invertálható 3 A LER felépítése Foglalkozzunk először egy darab (multiplicitásokkal rendelkező) faktorral, vagyis egy darab p i (x) hatványaival Tegyük fel, hogy p i lineáris, ekkor ν i 1 ν= a i νp i (x) ν nem más, mint az 1, p i (x), p i (x) 2,, p i (x) νi 1 polinomok egy lineáris kombinációja Mátrix formalizmussal: 1 p i p i 2 p i ν i 1 1 1 1 1 a i 1 a i 2 a i ν i A főátlóban ν i darab egyes áll, mert egy x x i alakú polinomnak a hatványai rendre, 1,, ν i 1 fokú, egy főegyütthatójú polinomok p i hatványai alatt a p i polinom hatványait reprezentáló vektorokat értjük, számolhatjuk a fent említett νi 1D(p i ) mátrix hatványozásával is Látható, hogy a fenti mátrix invertálható ν i ν i -es, ami egyben µ i µ i -es, mert p i első fokú volt, lásd (5) jelölést Lássuk most a másodfokúakat, a ν j 1 µ=1 ( a j µ1 + a j µ2 x ) p j (x) µ polinomot Ez nem más, mint az 1, x, p j (x), x p j (x), p j (x) 2, x p j (x) 2,, p j (x) ν i 1, x p j (x) ν i 1 polinomok egy lineáris kombinációja 5
1 x p j x p j p j ν j 1 x p j ν j 1 1 1 1 1 1 Itt a blokkok kettesével jönnek, mert a hatványozás során p j foka kettőt nő, de van közte egy x szorzó beiktatva Látható hogy a fenti mátrix invertálható 1 a j 11 a j 12 a j ν j 1 a j ν j 2 és (2ν j ) (2ν j )-s, ami µ j µ j -es, megint használva (5) jelölést Nevezzük el a fenti ábrákon látható mátrixokat: A i SL R (µ i ), i = 1 k, most már lineáris és másodfokú mind együtt van kezelve A i -ket még szorozni kell p i -vel, így adják ki a (9) képlet jobb oldalát: [D µ1 1(p 1 ) D µk 1(p k )] diag{a 1, A k } a = (1,, ) }{{}}{{}}{{} B A e egyenlet megoldását keressük Látható, hogy bármilyen e R N (1) vektort is írhatnánk a jobb oldalra, vagyis bármilyen q(x) R N 1 [x] polinom is lehetett volna 1 p(x) számlálójában Vizsgáljuk még (1) képletet D µi 1(p i ) R N µ i, mert p i fokszáma N µ i (elevenítsük fel (2) képletet) Ugyanakkor A i is µ i ν i -es, ezért szorozhatóak Az A mátrix blokk-felsőháromszög alakú, csupa egyessel a főátlóban, míg B egymás mellé rakott sáv szerkezetű mátrixokból áll, B R N (µ 1++µ k ) = R N N 4 A bizonyítás Eddig a (7) feladatot ekvivalensen megfogalmaztuk B A a = e alakban a fent megkonstruált mátrixok és vektorok segítéségvel A-ról triviálisan láttuk, hogy invertálható, nem maradt más hátra, mint hogy belássuk, det(b) rank(b) = N 6
A 1 A 2 Μ 1 Μ 2 Μ 3 p 2 p 1 p 2 p 3 p 1 p 3 p 1 p 2 p 2 N A 3 p 2 1 ábra A B A szorzat struktúrája 41 Tétel Ha egy p(x) R N [x] polinomot a (3) alakban faktorizálunk, majd a faktorokból megkonstruáljuk B mátrixot, akkor B determinánsa nem Következésképp (7) egyenletnek!a R N megoldása bármilyen q(x) R N 1 [x] számláló is álljon a bal oldalon Allításunk ekvivalens azzal, hogy p1 (x), x p 1 (x), x µ 1 1 p 1 (x), p k (x),, x µ k 1 p k (x) = R N 1 [x] Építsük fel B mátrixot lépésenként és lássuk, hogy a rang teljes marad B 2 := [D µ1 1(P 2 ) D µ2 1(P 1 )] Először lássuk, hogy B 2 teljes rangú (k 2 miatt B 2 értelmes) rank(b 2 ) µ 1, ezt D µ1 1(P 2 ) biztosítja 7
Teljes rang azt jelenti, hogy egyik oszlopa sem állítható elő a többi lineáris kombinációjával Először nézzük meg, hogy a µ 1 +1-edik oszlop előállítható-e a megelőzőekkel P2 (x), x P 2 (x), x µ 1 1 P 2 (x) = 1, x, x µ 1 1 P 2 (x) = (11) R µ1 1[x] P 2 (x) (12) de P 1 (x) R µ1 1[x] P 2 (x) (13) mert P 1 nem tartalmazza P 2 -t mint faktor és P 1 (x) R µ1 1[x] Tehát rank(b 2 ) µ 1 + 1 A többi oszlop előállíthatóságát is megvizsgáljuk Vegyük az oszlopokat l = 1 µ 2 -ig Tegyük fel indirekt, hogy x l 1 P 1 (x) = q µ1 1(x) P 2 (x) + q l 2 (x) P 1 (x) valamilyen q µ1 1 R µ1 1[x] ill q l 2 R l 2 [x] polinomokra (ez pont az 1 (µ 1 + l 1) oszlopok lineár kombinációja) x l 1 P 1 (x) = q µ1 1(x) P 2 (x) + q l 2 (x) P 1 (x) (14) ( x l 1 q l 2 (x) ) P 1 (x) = q µ1 1(x) P 2 (x) (15) }{{} R l 1 [x] R µ2 1[x] A két oldal nem lehet egyenlő, mert P 1 (x) és P 2 (x)-ben nincsenek közös faktorok és egy alacsonyabb fokú nem tud egy egyel magasabb fokút generálni Most úgy bővítjük B 2 -t, hogy [ ( n )] B n+1 := N 1D(P n+1 ) B n D µn+1 1 P i (x) i=1 (16) Magyarán mindent beszorzunk az új polinommal és mögé hozzávesszük az eddigiek szorzatát (az új nélkül) Ezzel pont B-t állítjuk elő: B n = D µ 1 1 ( P i (x)) D µ l 1 i=2n ahol n = 2 k és B k = B 8 i=1n i l P i (x) D µ n 1 i=1n 1 P i (x)
Lássuk, hogy a (16) konstrukcióval minden lépésben µ n+1 -el nő a rang Indirekt tegyük fel, hogy nem nő valahol a rang, vagyis az n + 1-edik blokk l- edik oszlopa előáll N 1 D(P n+1 ) B n oszlopainak és az n+1-edik blokk 1 (l 1) oszlopainak lineár kombinációjaként 9
Vagyis x l 1 i=1n P i (x) = q µ1 1(x) q µl 1(x) q µn 1(x) q l 2 (x) i=2n+1 i=1n+1 i l i=1n+1 i n i=1n P i (x) P i (x) + + P i (x) + + P i (x)+ valamilyen q R [x] polinomokra Vigyük át a jobb oldakról az utolsó tagot R l 1 [x] R µn+1 1[x] {}}{ ( x l 1 q l 2 (x) ) i=1n P i (x) = = P n+1 (x) q µ1 1(x) q µl 1(x) q µn 1(x) ( ) i=2n+1 i=1n+1 i l i=1n+1 i n P i (x) + + P i (x) + + P i (x) = A nagy zárójel belsejében nem jelenik meg a teljes i=1n P i(x) csak hiányos faktorokkal és az egyes tagokban amelyik faktor hiányzik, annál egyel alacsonyabb rendű q polinommal van szorozva Továbbra is kihasználjuk, hogy P i -k páronként relatív prímek, így ez az egyenlőség nem jöhet létre Egyben azt is beláttuk, hogy bármilyen P i (x) R µi [x], i = 1 k páronként relatív prím polinomokra, ahol µ i > és µ i = N: R µl 1[x] P i (x) = R N 1 [x] i l l=1k 1