Dinamikus rendszerek paramétereinek BAYES BECSLÉSE Hangos Katalin VE Számítástudomány Alkalmazása Tanszék 1
Bayes-becslések 1. A véletlen Bayes féle fogalma A "véletlen" Bayes féle értelmezése a megfigyelést (mérést vagy kísérletet) végző személy tudása szempontjából osztályozza a változókat. Bayes értelemben véletlen változónak tekintünk minden változót vagy akár paramétert is, amely nem ismert előttünk, mint megfigyelők előtt. Ilyen értelemben az ismeretlen θ rendszerparaméterek valószínűségi véltozóknak tekintendők. A Bayes formula Klasszikus eset Legyenek adva az alábbi B i események illetve P(B i ) valószínűségeik: B 1,B 2,...,B n B eseményalgebra, ahol B 1,B 2,...,B n teljes eseményrendszert alkot, azaz N i=1b i = Ω és B j B i = P(B i ) > 0 i = 1, 2,...,N P(B k A) = P(B k A) P(A) = P(A B k)p(b k ) N i=1 P(A B i)p(b i ) 2
Bayes-becslések 2. Bayes formula feltételes valószínűségi sűrűségfüggvényekre Jelölések: az a valószínűségi változó sűrűségfüggvénye: p(a) = f a (x), az a és b együttes sűrűségfüggvénye: p(a,b) = f ab (x 1,x 2 ), az a-nak a b-re vonatkozó feltételes s.f.-e: p(a b) = f (a b) (x) p(b a) = p(a,b) p(a) p(b a) = p(a,b) p(a), p(a) = p(a,b)db Ω b = p(a b)p(b) p(a,b)db ) ( P(B k A) = P(B k A) P(A) = P(A B k)p(b k ) N i=1 P(A B i)p(b i ) 3
Bayes-becslések 3. A Bayes formula több feltételes sűrűségfüggvényre A feltételes és együttes sűrűségfüggvényekre vonatkozó összefüggés: p(a, b c) = p(a b, c)p(b c), p(a, b c) = p(b a, c)p(a c) és p(b c) = p(a,b c)da Ω a Ekkor a Bayes formula: p(a b,c) = p(a,b c) p(b c) = p(a,b c) = p(a,b c)da p(b a,c)p(a c) p(b a,c)p(a c)da A láncszabály A láncszabály a feltételes és együttes sűrűségfüggvényekre vonatkozó p(a, b) = p(a b)p(b) összefüggés általánosítása több (N) valószínűségi változóra. A láncszabályt rekurzív módon vezethetjük le: p(x N,x N 1,...,x 1 ) = p(x N x N 1,...,x 1 )p(x N 1,x N 2,...,x 1 ) = p(x N x N 1,...,x 1 )p(x N 1 x N 2,...,x 1 )...p(x 1 ) = N = ( p(x k x k 1,...,x 1 ))p(x 1 ) k=2 4
Dinamikus rendszerek prediktív Bayes modellje Egyszerűség kedvéért: SISO eset. LTI rendszerek bemenet-kimenet modelljének Bayes féle alakja az alábbi feltételes sűrűségfüggvény: p(y(k) u(k),d k 1 ) (1) amely alkalmas előrebecslésre és szabályozótervezésre is, de nem szerepelnek benne a θ rendszerparaméterek. Parametrizált prediktív bemenet-kimenet modell Bayes-féle alakja: p(y(k) u(k),d k 1,θ) (2) Fontos, hogy a fenti parametrizált rendszermodellt, azaz a fenti feltételes sűrűségfüggvény alakját a Bayes paraméterbecslésnél adottnak tételezzük fel. A nem parametrizált bemenet-kimenet modell a parametrizált alakból az alábbi összefüggéssel kapható meg: p(y(k) u(k),d k 1 ) = p(y(k),θ u(k),d k 1 )dθ = p(y(k) θ,u(k),d k 1 )p(θ u(k),d k 1 )dθ (3) A θ paraméterek Bayes féle becslése a p(θ u(k),d k 1 ) feltételes sűrűségfüggvvény, amely azonban paraméterbecslés esetén nem függ u(k)-tól, mint feltételtől, hiszen az egy általunk beállított determinisztikus változó p(θ u(k),d k 1 ) = p(θ D k 1 ) (4) 5
Rekurziv paraméterbecslés a Bayes formulával 1. Egy rekurzív lépés A θ paréterek becslése Bayes értelemben a p(θ D k ) feltételes sűrűségfüggvény, amelynek feltételében szereplő adatsorozatot szétválasztjuk a jelen k időpillanat és a k 1 időpillanatig beérkezett adatokra: p(θ D k ) = p(θ y(k),u(k),d k 1 ) = p(θ y(k),d k 1 ) (5) Ezután a p(a b,c) = p(b a,c)p(a c) p(b a,c)p(a c)da feltételes sűrűségfüggvényekre vonatkozó Bayes formulát alkalmazzuk a b y(k), a θ, c D k 1 szereposztással és a következő rekurzív paraméterbecslési formulához jutunk: p(θ D k ) = p(y(k) Dk 1,θ)p(θ D k 1 ) p(y(k) D k 1,θ)p(θ D k 1 )dθ A formula jobboldalán szereplő, fizikai értelemmel is bíró részek: p(θ D k 1 ) az előző k 1 időpillanatbeli becslés, p(y(k) D k 1,θ) az adott parametrizált rendszermodell, a nevezőben pedig egy normalizálási tényező. 6
Rekurziv paraméterbecslés a Bayes formulával 1. Nem rekurzív Bayes paraméterbecslési formula Az egylépéses Bayes paraméterbecslő formulából a láncszabállyal: ahol p(θ D k ) = p(y(k) Dk 1,θ)p(θ D k 1 ) p(y(k) D k 1,θ)p(θ D k 1 )dθ p(θ D N ) = [ N ] k=1 p(y(k) Dk 1,θ) p 0 (θ) NORM p 0 (θ) = p(θ D 0 ) az úgynevezett prior vagy kezdeti becslés és NORM egy normalizáló tényező. 7
A Bayes paraméterbecslés tulajdonságai A Bayes paraméterbecslésnek az alábbi fontos, és a többi paraméterbecslési módszertől erősen különböző tulajdonságai vannak. 1. A becslési eljárás eredménye a p(θ D N ) feltételes valószínűségi sűrűségfüggvény. Ez a módszer elméleti ereje és alkalmazhatósági gyengesége egyben. Elméletileg a becsült θ paraméterekre vonatkozó teljes statisztika rendelkezésre áll, nemcsak aszimptotikusan, hanem véges esetben is, ehhez azonban egy függvényt kell(ene) minden lépésben kiszámítani. 2. A becslés maga a Bayes formulából adódóan természetében rekurzív, végrehajtásához a p(y(k) D k 1,θ) parametrizált rendszermodellen kívül a p 0 (θ) prior vagy kezdeti becslés is szükséges. A prior becsléssel a paraméterekről rendelkezésünkre álló technológiai, fizikai vagy üzemeltetői tudás építhető be a paraméterbecslésbe elméletileg tiszta, és jól követhető módon. 3. Belátható, hogy autoregressziós bemenet-kimenet modell és normális eloszlású becslési hiba, valamint normális eloszlású prior becslés mellett a Bayes becslés a standard rekurzív legkisebb négyzetes (LKN) becslésre vezet, tehát ilyen esetben jól számítható. 8
Maximum a posteriori becslés A nem rekurzív Bayes paraméterbecslő formula ML alakja ] p(θ D N k=1 p(y(k) Dk 1,θ) p 0 (θ) ) = NORM formula számlálójában a mért y(k),k = 1,...,N kimenetek p(y N θ) együttes sűrűségfüggvénye áll [ N p(y N θ) = N p(y(k) D k 1,θ) hiszen a Bayes becslésnél is a rendszer prediktív teljes valószínűségi modelljét használjuk fel. A maximum a posteriori becslés elve k=1 A maximum a posteriori becslés a Bayes becslésből származtatható úgy, hogy a becslés eredményeképpen kapott teljes p(θ D N ) valószínűségi sűrűségfüggvény helyett annak egy pontbecslését, méghozzá a maximum likelihood elve (legnagyobb valószínűség elve) alapján képezett pontbecslését használjuk. A maximum a posteriori becslés A Bayes paraméterbecslés nem rekurzív alakja a következő formában is felírható: p(θ y N ) = p(yn θ)p 0 (θ) p(y N ) f y (θ;y N )g θ (θ) Ebből a maximum likelihood elven képezett becslés a Maximum A Posteriori (MAP) becslés: [ ˆθ MAP (y N ) = arg max fy (θ;y N )g θ (θ) ] θ 9
A segédváltozók módszere Instrumental variable method 10
A segédváltozók módszere (Instrumental variable method) Alkalmazása: elsősorban korrelált mérési hibákkal terhelt esetekben legkisebb négyzetes módszernél nem garantálható a becslés aszimptotikus torzítatlansága Elve: a regresszor helyett vagy mellett a mért adatoktól függő alkalmas segédváltozókat vezetünk be. A predikciós hiba és a múltbeli adatok korreláltsága Ideális (fehérzajos) esetben a M(θ) : ŷ(k θ) = g(k,d k 1 ;θ) ε(k,θ) = y(k) ŷ(k θ) függetlenek, adott f ε (x;k;θ) sűrűségfüggvénnyel teljes valószínűségi modell garantálja a korrelálatlanságot. "jó" egy becslés, ha a becslési hiba független (korrelálatlan) a múltbeli mért adatoktól. Ha ez nem teljesül, akkor válasszunk egy másik, a múltbeli mért adatoktól függő {ζ(k)} vektort és egy, a predikciós hibára alkalmazott α transzformációt úgy, hogy a két sorozat korrelálatlan legyen, azaz 1 N N ζ(k)α(ε(k,θ)) = 0 k=1 empirikus keresztkorrelációs együtthatók nullák legyenek. Válasszuk meg a θ paraméter vektor becslését úgy, hogy ˆθ kielégítse a a fenti egyenletrendszert. 11
A segédváltozók és a becslés 1. Paraméterekben lineáris egybemenetű-egykimenetű modell esetén: ahol ϕ(.) az úgynevezett regresszor. Standard ARX eset: LKN módszere A rendszermodell: ahol ε(k) független ϕ(k)-tól. Ilyenkor nincs segédváltozóra szükség. ŷ(k θ) = ϕ T (k)θ y(k) = ϕ T (k)θ 0 + ε(k) A θ paraméter vektor LKN becslése az alábbi, a kvadratikus veszteségfüggvény minimalizálásából származó lineáris egyenletrendszer megoldásaként állítható elő: { } ˆθ N LKN 1 N = sol ϕ(k)[y(k) ϕ T (k)θ] = 0 N k=1 12
A segédváltozók és a becslés 2. Nem független predikciós hiba esete A rendszermodell: ahol most ν 0 (k) korrelált ϕ(k)-val. y(k) = ϕ T (k)θ 0 + ν 0 (k) Válasszunk a LKN egyenlet megoldásához a korrelált ϕ(k) regresszor helyett egy alkalmas nem-korrelált vektort, ζ(k)-t: elemei a segédváltozók. A segédváltozók módszere szerinti becslés: { ˆθ IV N = sol 1 N } N ζ(k)[y(k) ϕ T (k)θ] = 0 k=1 egyenletrendszer megoldásaként kapható meg. A becslés zárt alakban: ˆθ IV N = [ 1 N ] 1 N 1 ζ(k)ϕ T (k) N k=1 N ζ(k)y(k) k=1 13
A segédváltozók megválasztása Szükséges feltételek az aszimptotikus torzítatlansághoz Eζ(k)ϕ T (k) : nem szinguláris (6) Eζ(k)ν 0 (k) = 0 (7) Szavakban: a segédváltozóknak korrelálatlanoknak kell lenniük a predikciós hibával, de korreláltaknak kell lenniük a regresszorral. A segédváltozók megválasztása a modell alapján a segédváltozók ζ(k) vektorának mérete azonos kell legyen a ϕ(k) regresszor méretével (és egyben a becsülendő θ paraméterek számával): dim ζ(k) = dim ϕ(k) = dim θ A segédvektor fenti feltételeknek eleget tevő, de az adott alkalmazás igényeinek legjobban megfelelő megválasztására ugyanakkor nincs általános szabály: ezt mindenkor az adott feladatról rendelkezésünkre álló előzetes ismeretek és a mérnöki intuíció alapján végezzük. 14
Példa: ARMAX modellek paramétereinek becslése segédváltozókkal A egybemenetű-egykimenetű ARMAX modell prediktív alakja: y(k) = a 1 y(k 1)... a na y(k n a ) + +b 1 u(k 1) +... + b nb u(k n b ) + c 0 e(k) +... + c nc e(k n c ) ahol e(k),k = 1,...,N fehérzaj sorozat. A regresszor, a paramétervektor és a predikciós hiba: ϕ(k) = [ y(k 1)... y(k n a ) u(k 1)... u(k n b )] T, θ 0 = [a 1... a na b 1... b nb ] T, és a predikciós hiba korrelált a regreszorban lévő y(k i),i = 1,...,n a mért kimenetekkel. ν 0 (k) = c 0 e(k) +... + c nc e(k n c ) A segédváltozók megválasztása A regresszor vektorában csak a kimeneteknek megfelelelő elemeket cseréljük ki új segédváltozókra úgy, "hasonlítsanak" dinamikájukban a kimenetekre, de mégse legyenek korreláltak ν 0 (k)-val. ζ(k) = [ v(k 1)... v(k n a ) u(k 1)... u(k n b )] T, v(k) = K(q 1 )u(k) = E(q 1 ) F(q 1 ) u(k) ahol K(q 1 ) egy alkalmas lineáris időinvariáns (állandó együtthatós) szűrő, úgy hogy A szűrő optimális megválasztása pont a deg E(q 1 ) = deg B(q 1 ) = n b, deg F(q 1 ) = deg A(q 1 ) = n a K opt (q 1 ) = B(q 1 ) A(q 1 ) ha a valódi B(q 1 ) és A(q 1 ) rendszerpolinomokat ismernénk. 15