Dr. Jelasity Márk Mesterséges Intelligencia I. (I602, IB602)



Hasonló dokumentumok
Mesterséges Intelligencia MI

Mesterséges Intelligencia MI

ORVOSI STATISZTIKA. Az orvosi statisztika helye. Egyéb példák. Példa: test hőmérséklet. Lehet kérdés? Statisztika. Élettan Anatómia Kémia. Kérdések!

Hipotézis vizsgálatok. Egy példa. Hipotézisek. A megfigyelt változó eloszlása Kérdés: Hatásos a lázcsillapító gyógyszer?

Statisztikai próbák. Ugyanazon problémára sokszor megvan mindkét eljárás.

Bizonytalanságok melletti következtetés

s n s x A m és az átlag Standard hiba A m becslése Információ tartalom Átlag Konfidencia intervallum Pont becslés Intervallum becslés

Az entrópia statisztikus értelmezése

4 2 lapultsági együttható =

Bizonytalanság. Mesterséges intelligencia április 4.

IDA ELŐADÁS I. Bolgár Bence október 17.

Regresszió. Fő cél: jóslás Történhet:

KÖZELÍTŐ INFERENCIA II.

Valószínűségi változók. Várható érték és szórás

Mesterséges Intelligencia MI

Minősítéses mérőrendszerek képességvizsgálata

KÖZELÍTŐ INFERENCIA II.

20 PONT Aláírás:... A megoldások csak szöveges válaszokkal teljes értékőek!

Exact inference in general Bayesian networks

Valószínűségi hálók. Mesterséges Intelligencia - MI. Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs rendszerek Tanszék

METROLÓGIA ÉS HIBASZÁMíTÁS

Fuzzy rendszerek. A fuzzy halmaz és a fuzzy logika

A sokaság/minta eloszlásának jellemzése

biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás

Support Vector Machines

Algoritmusok és adatszerkezetek gyakorlat 09 Rendezések

VARIANCIAANALÍZIS (szóráselemzés, ANOVA)

Megerősítéses tanulás 7. előadás

Adatelemzés és adatbányászat MSc

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Véletlenszám generátorok. 6. előadás

Intelligens elosztott rendszerek

(eseményalgebra) (halmazalgebra) (kijelentéskalkulus)

Lineáris regresszió. Statisztika I., 4. alkalom

Szárítás során kialakuló hővezetés számítása Excel VBA makróval

10. Alakzatok és minták detektálása

Az elektromos kölcsönhatás

ALGORITMUSOK, ALGORITMUS-LEÍRÓ ESZKÖZÖK

KOMBINATORIKA ELŐADÁS osztatlan matematika tanár hallgatók számára. Szita formula

MEGBÍZHATÓSÁG-ELMÉLET

Kvantum-tömörítés II.

A multikritériumos elemzés célja, alkalmazási területe, adat-transzformációs eljárások, az osztályozási eljárások lényege

ORVOSI STATISZTIKA. Az orvosi statisztika helye. Egyéb példák. Példa: test hőmérséklet. Lehet kérdés? Statisztika. Élettan Anatómia Kémia. Kérdések!

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1

Tanult nem paraméteres próbák, és hogy milyen probléma megoldására szolgálnak.

d(f(x), f(y)) q d(x, y), ahol 0 q < 1.

Egy negyedrendű rekurzív sorozatcsaládról

Jövedelem és szubjektív jóllét: az elemzési módszer megválasztásának hatása a levonható következtetésekre

MATEMATIKAI STATISZTIKA KISFELADAT. Feladatlap

Összegezés a 92/2011.(XII.30.) NFM rendelet 9. melléklete alapján

Sztochasztikus folyamatok alapfogalmak

Elosztott rendszerek játékelméleti elemzése: tervezés és öszönzés. Toka László

Variancia-analízis (ANOVA) Mekkora a tévedés esélye? A tévedés esélye Miért nem csinálunk kétmintás t-próbákat?

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Műszaki folyamatok közgazdasági elemzése. Kevert stratégiák és evolúciós játékok

Békefi Zoltán. Közlekedési létesítmények élettartamra vonatkozó hatékonyság vizsgálati módszereinek fejlesztése. PhD Disszertáció

Die Sensation in der Damenhygiene Hasznos információk a tamponokról

Indirekt térfogat-vizualizáció. Fourier térfogat-vizualizáció. Tomográfiás rekonstrukció. Radon-transzformáció. A Fourier vetítő sík tétel

Teljes eseményrendszer. Valószínőségszámítás. Példák. Teljes valószínőség tétele. Példa. Bayes tétele

Példák ekvivalencia relációra (TÉTELként kell tudni ezeket zárthelyin, vizsgán):

ismertetem, hogy milyen probléma vizsgálatában jelent meg ez az eredmény. A kérdés a következő: Mikor mondhatjuk azt, hogy bizonyos események közül

,...,q 3N és 3N impulzuskoordinátával: p 1,

Eseményalgebra. Esemény: minden amirl a kísérlet elvégzése során eldönthet egyértelmen hogy a kísérlet során bekövetkezett-e vagy sem.

Philosophiae Doctores. A sorozatban megjelent kötetek listája a kötet végén található

Táblázatok 4/5. C: t-próbát alkalmazunk és mivel a t-statisztika értéke 3, ezért mind a 10%-os, mind. elutasítjuk a nullhipotézist.

[Biomatematika 2] Orvosi biometria

A maximum likelihood becslésről

Markov-láncok stacionárius eloszlása

[Biomatematika 2] Orvosi biometria

Relációk. Vázlat. Példák direkt szorzatra

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Biomatematika 2 Orvosi biometria

Készítette: Fegyverneki Sándor

Logika es sz am ıt aselm elet I. r esz Logika 1/36

Vázlat. Relációk. Példák direkt szorzatra

Legyen adott egy S diszkrét halmaz. Leggyakrabban S az egész számoknak egy halmaza, például S = {0, 1, 2,..., N}, {0, 1, 2,... }.

15. LINEÁRIS EGYENLETRENDSZEREK

8. Programozási tételek felsoroló típusokra

Néhány közelítő megoldás geometriai szemléltetése

Bevezetés a programozásba. 3. Előadás Algoritmusok, tételek

Algoritmusok és adatszerkezetek I. 10. előadás

The original laser distance meter. The original laser distance meter

A DÖNTÉSELMÉLET ALAPJAI

Tiszta és kevert stratégiák

Hely és elmozdulás - meghatározás távolságméréssel

Mechanizmus-tervezés: szociális jóléti függvény nem kooperatív (versengő) ágensek. A megegyezés keresése és elérése: Tárgyalás (Negotiation)

Számelmélet Megoldások

BAGME11NNF Munkavédelmi mérnökasszisztens Galla Jánosné, 2011.

Darupályák ellenőrző mérése

Adatbiztonság a gazdaságinformatikában ZH december 7. Név: Neptun kód:

Bevezetés a kémiai termodinamikába

M. 33. Határozza meg az összes olyan kétjegyű szám összegét, amelyek 4-gyel osztva maradékul 3-at adnak!

GVMST22GNC Statisztika II. Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet

Eseményvezérelt szimuláció

Gazdasági matematika II. vizsgadolgozat megoldása A csoport

VEZÉRIGAZGATÓI UTASÍTÁS

Összegzés a 92/2011.(XII.30.) NFM rendelet 9. melléklete alapján

KÖZBESZERZÉSI ADATBÁZIS

KOVÁCS BÉLA, MATEMATIKA I.

Átírás:

Dr. Jelasty Márk Mesterséges ntellgenca. (602, B602) kurzus nyolcadk előadásának jegyzete (2008. október 20-a) Készítette: Bóna Bence BOBNAAT.SZE NF-MAT V.

Bayes-áló Ebben a részben egy szsztematkus módszert vezet be a feltételes függetlenség kapcsolat reprezentálására, Bayes-áló fórmájában. Bayes-álónak nevezett adatstruktúrát a változók között függőség leírásáoz, bármely együttes valószínűség eloszlás függvény tömör megadásáoz. A Bayes-aló egy rányított gráf, amelyben mnden csomópontoz számszerű valószínűség nformácók vannak csatolva. Részletesen: 1, A áló csomópontjat valószínűség változók egy almaza alkotja. A változók leetnek dszkrétek vagy folytonosak. 2, rányított élek (nylak) egy almaza összeköt bzonyos csomópontokat. a létezk nyíl az X csomóponttól az Y csomópontg (X Y), azt mondjuk, ogy X szülője az Y-nak. 3, Mnden X csomópontoz tartozk egy P(X Szülők(X )) feltételes valószínűség eloszlás, am számszerűen megatározza a szülők atását a csomópont változóra. 4, A gráf nem tartalmaz rányított kört (azaz rányított, körmentes gráf Drected Acyclc Grap, DAG). A áló topológája csomópontok és élek almaza megatározza a feltételes függőség kapcsolatokat. Egy jól felépített gráfban X csomópont össze van kötve Y-nal, és a nyíl ntutív jelentése az, ogy X-től függ Y -értéke. Bayes-aló topológáját elkészítjük, már csak az egyes váltózók tartozó feltételes valószínűség-eloszlás kell megatároznunk. Ezek segítségével egyértelműen megadja (mplct módon) az összes változó felett együttes valószínűség-eloszlás függvényt. Most nézzünk egy példát a Bayes-álóra. dőjárás Lyuk Fogfájás Beakadás 1. ábra Bayes-aló

Ebben a példában leírt változók a következők: dőjárás, Lyuk, Fogfájás, Beakadás. Az dőjárás független a több változótól, továbbá a Fogfájás és a Beakadás feltételesen függetlenek a Lyuk smeretében. Szemléletesen, a áló az a tényt fejez k, ogy a Lyuk közvetlen oka a Fogfájás-nak és a Beakadás-nak, továbbá közvetlen okozat kapcsolata azonban nem létezk a Fogfájás és a Beakadás között. Most egy új példát tekntünk meg. P(B) P(F) Betörés 0,001 Földrengés 0,002 R F P(R) Rasztás 0,95 0,94 0,29 0,001 JánosfTelef. MáraTelef. R P(J) 0,90 0,05 2. ábra Bayes-áló R P(M) 0,70 0,01 A példánkban egy rasztót szemléltet. Ottonunkban egy új betörésjelzőt szereltek fel. Ez megbízatóan észlel betörést, és dőnként ksebb földrengéseket s jelz. Két szomszédunk s van. János és Mára, akk ígérték, ogy mndg ívnak, a megallják a rasztó angját. Tudnunk kell, ogy János mndg felív, a allja, de előfordul az s, ogy összekever a telefon csörgésével a rasztó csöngését. Mára szeret angosan allgatn a zenét, ezért nem mnden esetben allja meg a rasztó angját. Ezzel a Bayes-álóval tudjuk szemléltetn, ogy mekkora a valószínűség annak, ogy betörés történt. A betörés áló esetén a topológa azt mutatja, ogy a betörés és a földrengés közvetlenül befolyásolja a rasztó megszólalásnak valószínűségét, ellenben János és Mára ívásának bekövetkezése csak magán a rasztón múlk. A valószínűségek valójában a leetséges körülmények egy potencálsan végtelen almazát összegzk, amkor s a rasztó elmulaszt megszólaln, vagy János és Mára elmulaszt szóln. Az ábrán mnden eloszlás, mnt feltételes valószínűség táblázat FTV van feltüntetve. Az FTV táblázatban mnden sor az egyes csomópont értékek feltételes valószínűségét tartalmazza az adott soroz tartozó szülő feltétel esetén. Az egyes sorokban szereplő számok összegének 1-et kell adna, mvel az adott változó összes leetséges értéke szerepel a bejegyzésben. Az gaz érték valószínűsége p, akkor a ams érték valószínűsége 1-p. Az együttes valószínűség-eloszlás függvény leírása A Bayes-áló a tárgytartomány teljes leírását adja meg. A benne szereplő nformácók segítségével az együttes valószínűség-eloszlás függvény bármely bejegyzése kszámítató. Egy együttes valószínűség-eloszlás függvény egy általános bejegyzése egy teljes ozzárendelés konjunkcójának a valószínűsége, P(X 1 = x 1 X n = x n ). Amt a

továbbakban csak P(x 1,,x n ) jelöljük. Egy bejegyzés értékét a következő egyenlőtlenség adja meg: n P(x 1,,x n ) = P(x szülők(x )). = 1 Így az együttes valószínűség-eloszlás függvényt leíró táblázat mnden bejegyzése a Bayesálóban szereplő, feltételes valószínűség táblák megfelelő elemenek a szorzata. Most nézzük meg menny annak a valószínűsége, ogy a rasztó megszólal, de nem volt sem betörés sem földrengés, azonban János és Mára s telefonál. A kezdőbetűk jelöl a változókat: P(j m a b e ) = P(j a)p(m a)p(a b e)p( b)p( e) = 0,90 0,70 0,001 0,999 0,998 = 0,00062 Egy Bayes-áló konstruálása Elsőként írjuk fel az együttes valószínűség-eloszlás függvényt feltételes valószínűségek szorzataként, felasználva a szorzatszabályt. P(x 1,, x n ) = P(x n x n-1,, x 1 )P(x n-1,, x 1 ). Majd smételten alkalmazzuk ezt a lépést. Végezetül egyetlen osszú szorzatot kapunk: P(x 1,,x n ) = P(x n x n-1,, x 1 )P(x n-1 x n-2,, x 1 ) P(x 2 x 1 )P(x 1 ) n P(x x -1,, x 1 ) Összeasonlítva ezt a 1. ábrával egyenlettel látatjuk, ogy az együttes valószínűség eloszlás függvény megadása ekvvalens azzal az állítással, ogy a áló mnden X változójára P(X X -1,,X 1 ) = P(X Szülők(X )) feltéve, ogy Szülők(X ) {X-1,, X 1 }. A Bayes-áló csak abban az esetben leet elyes reprezentácója a tárgytartománynak, a az adott szülők mellett, mnden csomópont feltételesen független a csomópontot sorrendezésben őt megelőzőtől. Így a tárgytartomány struktúrájának megfelelő Bayes-áló Fontos megemlítünk, ogy függ a változók sorrendjétől: 1, más sorrendben leet teljesen más topológa. 2, vszont bármely sorrendre kjön egy Bayes-áló ok.- okozat nem tükröződk a Bayesálóban. = 1 Mára Telefoná János Telefoná Mára Telefoná János Telefoná Rasztás Rasztás Földrengés Betörés Földrengés Betörés (a) (b)

Az (a) ábrában az ok-okozat megfordul, neezen értelmezető. A (b) ábrán ebben a sorrendben nncs tömörítés. tt alkalmazató a teljes lánc szabály. De mndkét Bayes-áló ugyanazt a kódolja. Feltételes függetlenség relácók a Bayes-álókban Bayes-álókra egy numerkus szemantkát adtunk meg a teljes együttes eloszlás reprezentácójának a szempontjából. Ezt a szemantkát alkalmazva a Bayes-álók konstrukcós módszerenek a származtatásánál azt a következményt kaptunk, ogy egy csomópont feltételesen független az őt megelőzőktől, a csomópont szőlő adottak. Más módon s eljáratunk. Elndulatunk egy topológa szemantkától, am a gráf által kódolt feltételes függetlenség relácókat adja meg, és ezekből származtatjuk a numerkus szemantkát. 1, Egy csomópont feltételesen független a nem leszármazottatól, feltéve, ogy a szüle adottak. X j nem leszármazottja X -nek, akkor P(X Szülök(X ),X j ) = P(X Szülők(X )). 2, Egy csomópont feltételesen független az össze több csomóponttól a álózatban, a szüle, gyermeke és gyermeke szülenek az smeretében azaz a Markov-takarójának smeretében. a X j tetszőleges változó: P(X Markov takaró(x ),X j ) = P(X Markov takaró(x )). Markov takaró: Szülök Gyerekek Gyerekek szüle, teát az X csak a Markov takarótól függ. Feltételes eloszlások atékony Reprezentácója A szülők maxmáls száma, k megleetősen kcs s, egy csomópont feltételes valószínűség táblájának ktöltése akár O(2 k ) számú értéket és az összes leetséges esetet fgyelembe véve. Az egyk legrosszabb eset, amkor a kapcsolat a szülők és a gyermek között teljesen önkényes. Az lyen eloszlásokat kanonkus eloszlásokkal íratjuk le, am valamlyen szabály mntát követ. A legnépszerűbb példa a determnsztkus csomópontok reprezentálják. Az értéket a szülenek az értéke teljesen megatározza, mndenféle bzonytalanság nélkül. A relácó leet egy logka kapcsolat, vegyük például azt az esetet, amkor a szülőcsomópontok jelentése: Kanada, Egyesült Államokbel és Mexkó, a gyermekcsomópont pedg: Észak-Amerka, akkor a kapcsolat a szülők dszjunkcója. Bzonytalan relácókat gyakran jellemezetünk úgynevezett zajos logka relácókkal. A zajos vagy relácó a vagy relácó általánosítása. Ítéletlogkában kjelentető, ogy a Láz akkor és csak akkor gaz, a a Megfázás vagy az nfluenza vagy a Malára gaz. Ez a modell megenged bzonytalanságot, ogy az egyes szülők okozatják-e a gyermekek gaz értékét. A kapcsolat a szülő és a gyermek között gátolt leet, így előfordulat, ogy a pácens meg van fázva, de nem lázas. A modell két feltevésre épül. Elsőként feltételezetjük, ogy az összes leetséges ok fel van sorolva. Másodkként feltesz, ogy bármely szülő gátlása független a több szülő gátlásától: például akárm s gátolja, ogy a Malára lázat okozzon, ez független attól, ogy m gátolja az nfluenzát, ogy lázat okozzon. Ezek a feltevésekkel a Láz akkor és csak akkor ams, a az összes gaz értékű szülő gátolt, amnek a valószínűsége a gátlás valószínűségek szorzata. A gátlás valószínűségek a következők: P( láz megfázás, nfluenza, malára) = 0,6 P( láz megfázás, nfluenza, malára) = 0,2 P( láz megfázás, nfluenza, malára) = 0,1

Enny nformácóból és a zajos-vagy feltevésből a teljes FVT-t fel leet építen. Megfázás nfluenza Malára P(Láz) P( Láz) 0,0 0,9 0,8 0,98 0,4 0,94 0,88 0,988 1,0 0,1 0,2 0,2 = 0,2 1,0 0,6 0,06 = 0,6 0,1 0,12 = 0,6 0,2 0,012=0,6 0,2 0,1 Általánosságban, a zajos logka relácók, amelyekben egy változó k számú szülőtől függ. O(k) paraméterrel íratók le, a teljes feltételes valószínűség-eloszlás táblázatoz tartozó O(2 k ) elyett. Ez sokkal könnyebbé tesz a becslést. Bayes-álók folytonos változókkal. Defnícó szernt, a folytonos változóknak végtelen számú értéke leet, így leetetlen feltételes valószínűségeket megadn mnden egyes értékre. Egy leetséges módszer a folytonos változók kezelésére, a elkerüljük őket dszkretzálással azaz felosztjuk a leetséges értékeket ntervallumok adott almazára. Például, a őmérsékletet felosztjuk (<O o C),(0 o C-100 o C) és (>100 o C) ntervallumokra. A dszkretzálás néa adekvát megoldás, de gyakran eredményez a pontosság jelentős romlását. A másk megoldás, a a valószínűség sűrűségfüggvény elemeből választunk, amelyek véges számú paraméterrel megadató. Egy dszkrét és folytonos változókat s tartalmazó álót brd Bayes-álónak nevezzük. Egy brd áló megadásáoz két újfajta eloszlást kell megadnunk: feltételes eloszlást dszkrét változókoz dszkrét és/vagy folytonos szülők esetén: továbbá feltételes eloszlás dszkrét változókoz folytonos szülők esetén. Nézzük meg a következő példánkat: amelyben a vásárló valamlyen gyümölcsöt vásárol az ára függvényében, am vszont a termés mennységétől függ és attól, ogy éppen van-e állam támogatás. Az Ár változó folytonos, a szüle pedg folytonosak és dszkrétek: a Vásárol változó dszkrét, és van egy folytonos szüleje. Az Ár változóoz meg kell adnunk a P(Ár Termés, Támogatás) eloszlás. A dszkrét szülők explct felsorolással kezdjük azaz megadjuk mnd a P(Ár Termés, támogatás), mnd a P(Ár Termés, támogatás) valószínűségeket. A termés kezeléséez megadjuk, ogy a c ár felett eloszlás ogyan függ a t Termés folytonos értékétől. Támogatás Termés Ár Vásárlás

A leggyakorbb választás a lneárs Gauss-eloszlás, amelyben a gyermek a Gauss-eloszlású, aol a μ várató érték lneársan változk a szülő értékével, és aol δ szórás rögzített. Két eloszlásra van szükségünk, a támogatás és a támogatás esetére különböző paraméterekkel: P(Ár Termés, Támogatás) = N(a t+b,σ 2 )(c) P(P Termés, támogatás) = N (at+b, σ 2 )(c) Ebben a példában ekkor, az Ár feltételes eloszlást a lneárs normáls eloszlás kválasztásával és a a,b, σ,a,b ésσ paraméterekkel adatjuk meg. A lneárs normáls feltételes eloszlásnak vannak bzonyos specáls tulajdonsága. a dszkrét változók eloszlásával kezdünk foglakozn. Fontoljuk meg például a Vásárol csomópontot. Ésszerűnek tűnk azt feltételezn, ogy a vásárló vásárol, a az ár alacsony, nem vásárol, a magas, a vásárlás valószínűsége pedg folytonosan változk egy közbenső régóban. Másogy fogalmazva, a feltételes eloszlás asonló egy elmosódott küszöbfüggvényez. Ekkor a Vásárlás valószínűsége az Ár smeretében ez leet: P(vásárlás Ár = c) = φ ((-c+ μ )/σ ) am azt jelent, ogy az ár küszöbszám μ körül van, és a küszöbrégó szélessége arányos δ -val, lletve, ogy a vásárlás valószínűsége csökken, aogy az ár növekszk. Ezt a probt eloszlás azzal az érveléssel gazolató, ogy az alapul szolgáló döntés folyamatnál létezk egy pontos küszöb, de ennek pontos elyét egy véletlen normáls eloszlású zaj befolyásolja. A probt modell egy alternatívája a logt eloszlás, amely a szgmod függvényt asználja egy elmosódott küszöb előállításáoz. 1 P(vásárlás Ár = c) = c + μ 1+ exp( 2 ) σ A két eloszlás asonlóan néz k, de valójában a logt elyzetekez, de a logt eseteként matematkalag könnyebben kezelető, például széles körben asználatos. Következtetés felsorolással Bármely feltételes valószínűség kszámítató együttes eloszlás tagjanak összegzésével. Pontosabban P(X e) lekérdezés megválaszolató, amt a jobb követetőség kedvéért tt s megmutatjuk: P(X e) = α P(X e) = α P(X,e,y) y Továbbá, mnt smerjük a Bayes-áló a teljes együttes eloszlás egy teljes reprezentácója nyújtja. Az egyenlet azt mutatja, ogy az együttes eloszlás P(X,e,y) tagja felíratók a álóból származó feltételes eloszlás szorzataként. A lekérdezés megválaszolató a Bayes-áló felasználásával, kszámítva a álóból származó feltételes valószínűség szorzatanak összegeként. Vegyük a P(Betörés JánosTelefonál = gaz, MáraTelefonál = gaz) lekérdezést. A rejtett változók ennél a kérdésnél a Földrengés és a Rasztás. Az egyenletből ezt kapjuk P(B j,m) = α P(Bj,m) = α P(B,e,a,j,m) e a A Bayes-áló szemantkája pedg FVT-bejegyzések felasználásával egy kfejezést ad. P(b j,m) = α P(b)P(e)P(a b,e)p(j a)p(m a) e a

Ennél a kfejezésnél a kszámításáoz négy tagot kell összeadnunk, amelyek mnd egykét öt szám összeszorozásával kapjuk. Az algortmus komplextása egy n bnárs változós áló esetén O(n2 n ). A következő egyszerű lépéssel javításoz jutunk: a P(b) tag állandó és k leet venn az a és e felett összegzések elé, a P(e) tag pedg kvető az a felett összegzés elé. P(b j,m) = α P(b) P(e) P(a b,e)p(j a)p(m a). e a Felasználva a értékeket, azt kapjuk ogy P(b m,j) = α 0,00059224. A b-ez tartozó számítás átfutva az α 0,0014919 eredményez. Így P(B j,m) = α (0,00059224, 0,0014919) (0,284, 0,716). Azaz a betörés valószínűsége, a mndkét szomszédja telefonál körülbelül 28%. Sajnos az algortmus dő komplextása egy n bnárs változó O(n2 n ). A változó elmnácós algortmus A felsoroló algortmus lényegesen javítató smétlődő számítások kküszöbölésével. Az ötlet egyszerű: egyszerre végezzük el a számítást, és őrzzük meg az eredményeket később számításokra. Egyfajta dnamkus programozás. M most a változó elmnácós algortmust nézzük meg. A változó elmnálás az egyenlet típusú kfejezéseket jobbról balra sorrendben értékel k. A köztes eredményeket eltároljuk, és bármely változó felett összegzés a kfejezésnek csak azon része felett történk meg, amely függ ettől a változótól. Értékeljük k a következő kfejezést:p(b j,m) = α P(B) P(e) P(a b,e)p(j a)p(m a). Vegyük észre, ogy a kfejezés mnden részét megjelöljük a kapcsolódó változó nevével, ezeket a tényezőket nevezzük. Egzakt következtetés komplextása A betörés álója a álónak azon családjáoz tartozk, aol a áló bármely két csomópontja között legfeljebb egyetlen rányítatlan út létezk. Ezeket egyszeresen összekötött álónak vagy polfának nevezzük, amelyeknek van egy különösen kellemes tulajdonságuk, következtetés dő- és tárkomplextása a polfánkban a áló méretében lneárs. Abban az esetben, a mnden egyes csomópontok szülenek a száma egy konstanssal korlátozott, akkor a komplextás a csomópontok számában s lneárs. Többszörösen összekötött álóban a változó elmnálás legrosszabb esetben exponencáls dő- és tárkomplextású leet, még akkor s, a a csomópontonként szülők száma konstans. A Bayes-álóban való következtetés NP-neéz, mvel ez specáls alesetként tartalmazza az ítéletlogka következtetést s. Csoportosító algortmusok A változó elmnálás algortmusa egyszerű és atékony egyed lekérdezések megválaszolására. A áló összes változójának az a posteror eloszlást szeretnénk kszámítan, akkor kevésbé atékony. Például egy polfa álóban O(n) egyenként O(n) költségű lekérdezést kell kadn, összességben O(n 2 ) dőköltséggel. A csoportosítás alapötlete, ogy a áló önállóan csomópontjat egyesítjük, klasztercsomópontokat formálva úgy, ogy a kadódó áló egy polfa legyen. Példa: egy Locsolócső+Eső-nek nevezett klasztercsomópontba való összevonása. A két bnárs csomópontot egyetlen megacsomópont váltotta fel, amnek 4 értéke leet:,,,. A megacsomópontnak csak egy szülője van. Gondos nylvántartással ez az algortmus képes O(n) dőben aol n most a módosított áló mérete kszámoln a áló összes nem e a

bzonyíték csomópontjanak a posteror eloszlását. Azonban a probléma NP-neéz volta nem tűnt el: a a áló exponencáls dő- és tárgényű a változó elmnálás esetén, akkor a csoportosított álóoz tartozó FVT-k megkonstruálása exponencáls dő- és tárgényű. P(F) = 0,5 F P(l) 0,10 0,50 Felős F P(E) 0,20 0,80 Locsoló Eső L E P(E) Vzes Pázst 0,00 0,90 0,90 0,99 Közelítő Következtetés Bayes-álókban Az egzakt következtetés nagy, többszörösen összekötött álókban való kezeletetlensége matt, érdemes átgondoln a módszereket. Ebben a részben a véletlen mntavételezés, Monte Carlo-módszerével smerkedünk meg. A módszer pontossága a generált mnták számától függ. A Monte Carlo algortmus széles körben elterjedt olyan mennységek megbecslésére, amelyeket neéz egzakt módon kszámítan. Közvetlen mntavételezés módszerek Az alapelv mnták generálása egy smert valószínűség-eloszlásból. Példa: egy szabványos érme felfogató egy Érme valószínűség változónak (fej, írás) értékekkel és P(Érme) = (0,5,0,5) a pror eloszlással. A mntavétel ebből az eloszlásból pontosan megfelel egy érme feldobásának: 0,5 valószínűséggel fej-et ad, és 0,5 valószínűsséggel írás-t. Rendelkezésre áll a [0,1] tartományba eső véletlen számoknak egy forrása, akkor bármely egyváltozós eloszlásból egyszerű dolgok mntavételezn. A véletlen mntavételezés folyamat legegyszerűbb fajtája a Bayes-álók esetén a álóból generál olyan eseményeket, amelyekez nem kapcsolódk bzonyíték. Az ötlet az, ogy mntavételezzünk mnden változót egymás után, topológa sorrendben. 1. Soroljuk a P(Felős) = (0,5, 0,5) eloszlásból; tegyük fel, ogy gaz-at kapunk. 2. Soroljuk a P(Locsoló Felős = gaz) = (0,1, 0,9) eloszlásból; tegyük fel, ogy ams-at kapunk. 3. Soroljuk a P(Eső Felős = gaz) = (0,8, 0,2) eloszlásból; tegyük fel, ogy gaz-at kapunk. 4. Soroljuk a P(VzesPázst Locsoló = ams, Felős = gaz) = (0,9, 0,1) eloszlásból; tegyük fel, ogy gaz-at kapunk.

Ebben az esetben a PRPR-MNTA a következő eseményt adja [gaz, ams, gaz, gaz]. Bármlyen mntavétel algortmusban a válasz kszámítása a generálás során előálló mnták megszámlálása alapján történk. Vegyük azt az esetet, ogy N teljes mnták van, és jelölje N(x 1,,x n ) az x 1,,x n esemény gyakorságát. Azt várjuk, ogy ez a gyakorság atárértékben konvergáljon a várató értékéez a mntavétel valószínűség szernt: Nps(x1,..,xn) lm = Sps(x 1,,x n ) = P(x 1,,x n ) N N Például gondoljuk meg az előbb generált eseményt: [gaz, ams, gaz, gaz]. Ennek az eseménynek a mntavétel valószínűsége: Sps(gaz, ams, gaz, gaz) = 0,5 0,9 0,8 0,9 = 0,324 Így, N nagy értékenél azt várjuk, ogy a mnták 32,4%-a ez az esemény legyen. Az lyen becsléseket konzsztensnek nevezzük. Elutasító mntavételezés Bayes-álóban Elutasító mntavételezés (rejecton samplng) általános módszer mnták előállítására egy neezen mntavételező eloszlásból, felasználva egy könnyen mnta vételezető eloszlást. Legegyszerűbb formájában feltételes valószínűségek kszámítására azaz P(X e) megatározására asználják fel. Ebben a mntavételezésben először a áló által megadott pror eloszlásból generál mntákat, majd elutasítja azokat, amelyek nem lleszkednek a bzonyítékoz. Végül, a P (X = x e) becslés megkapató az X = x előfordulásnak megszámolásával a megmaradt mntában. Legyen most P (X e) az algortmus által kadott becslés eloszlás. A defnícója szernt fennáll, ogy P Nps(X,e) (X e) = α Nps(X,e) = ebből kapjuk P PXe (, ) (X e) = P(X e) Nps(e) Pe () Azaz az elutasító mntavétel az gaz valószínűség konzsztens becslést adja. Az elutasító mntavételezés legnagyobb bája, ogy nagyon sok mntát utasít el. Az e bzonyítékkal konzsztens mnták aránya exponencálsan egyre kevesebb, aogy a bzonyítékváltozók száma nő, így az eljárás egyszerűen asználatatlan komplex problémákra. Vegyük észre, ogy az elutasító mntavétel nagyon asonló a feltételes valószínűségek becsléséez. Valószínűség súlyozás A valószínűség súlyozás elkerül az elutasító mntavételezés gyengeségét azáltal, ogy csak e bzonyítékkal konzsztens eseményeket generál. A valószínűség-súlyozás rögzít az E bzonyítékváltozók értéket, és csak a maradék X és Y változókat mntavételez. Sajnos nem mnden esemény egyenlő. Melőtt megállapítanánk a számlálás eredményeket, mnden eseményt súlyozunk azzal a valószínűséggel, amely megadja, ogy az esemény mennyre van összangban a bzonyítékkal. Ezt, valószínűséget az egyes bzonyítékváltozók feltételes valószínűségenek a szorzatával mérjük, a szülök smeretében. A bzonyíték valószínűtlennek tűnk, ksebb súlyt kell adn. Alkalmazzuk az algortmust, a áló esetén P(Eső Locsoló = gaz, VzesPázst = gaz) kérdésre. A folyamat a következő: először a w súly 1,0-ra állítjuk. Azután generálunk egy eseményt: 1. Soroljuk a P(Felős) = (0,5, 0,5) eloszlásból; tegyük fel, ogy gaz-at kapunk. 2. A locsoló egy bzonyítékváltozó gaz értékkel. Ezért beállítjuk, ogy w w P(Locsoló = gaz Felős = gaz) = 0,1 3. Soroljunk a P(Eső Felős = gaz) = (0,8, 0,2) eloszlásból; tegyük fel, ogy gaz-at kapunk.

4. A VzesPázst egy bzonyítékváltozó gaz értékkel. Ezért beállítjuk, ogy w w P(VzesPázst = gaz Locsoló = gaz, Eső = gaz) = 0,099 tt a súlyozott-mnta az [gaz,gaz,gaz,gaz] eseményt adja k 0,099 súllyal, és ezt Eső = gaz esetnél vesszük számításba. A súly alacsony, mvel az esemény egy felős napot ír le, amkor a valószínűtlen, ogy a locsoló be van kapcsolva. Mvel a valószínűség súlyozás az összes generált mntát felasználja, sokkal atékonyabb leet, mnt az elutasító mntavétel. Azonban a teljesítmény leromlk, a a bzonyítékváltozók száma növekszk. Ez azért történk, mert elég sok mntánál nagyon kcs a súly. A probléma még erőt bzonyítékváltozók később fordulnak elő a változó sorrendben, mvel ekkor a mnták olyan szmulácók, amelyek kevés asonlóságot mutatnak a bzonyítékok által sugalmazott valóságoz. Következtetés a Markov-lánc szmulácóval Ebben a részben a Markov-lánc Monte Carlo (MCMC, Markov Can Monte Carlo) algortmust smertetjük, ogy Bayes-álókban következtetessünk. Az MCMC algortmus Az első két mntavételezés algortmustól eltérően, amelyek az egyes eseményeket a semmből generálják, az MCMC mnden eseményt az azt megelőző esemény véletlen módosításával generál. Úgy leet elképzeln ezt a álót, mnt amnek van konkrét jelenleg állapota, am mnden változóra megatároz egy változót. A következő állapot generálása egy X nem bzonyítékváltozóoz tartozó érték véletlenszerű mntavételezésével történk, az X Markov-takarójába tartozó változók jelenleg értékenek feltétele mellett. Az MCMC így véletlen bolyongást végez az állapottérben, egyszerre csak egy változót bllentve át, de rögzítetten tartva a bzonyítékváltozókat. Gondoljuk meg a P(Eső Locsoló = gaz, VzesPázst = gaz). A Locsoló és a VzesPázst bzonyítékváltozók rögzítettek a megfgyelt értékekre, míg a rejtett Felős és Eső változók véletlenszerűen ncalzáltak. Így a kezdet állapot [gaz,gaz,ams,gaz]. Ekkor a következő lépéseket ajtjuk végre smétlődően: 1. A Felős-t mntavételezzük a Markov-takarójába eső változók jelenleg értékenek smeretében: ebben az esetben a P(Felős Locsoló = gaz, Eső = ams) szernt mntavételezünk. Tegyük fel, ogy az eredmény Felős = ams. Ekkor az új állapot [ams, gaz, ams, gaz]. 2. Az Eső-t mntavételezzük a Markov-takarójába eső változók jelenleg értékenek smeretében: ebben az esetben P(Eső Felős = ams, Locsoló = gaz, VzesPázst = gaz) szernt mntavételezünk. Tegyük fel, ogy ennek eredménye Eső = gaz. Ekkor az új állapot [ams, gaz, gaz, gaz]. A folyamtat során meglátogatott mnden egyes állapot egy olyan mnta, am ozzájárul az Eső célváltozó megbecsléséez. a a folyamat 20 állapotot jár végg, aol az Eső gaz, és 61 állapotot, aol az Eső ams, akkor a kérdésre a választ a NORMALZÁL ( 20,60 ) = 0.25, 0,75 adja. Most nézzük meg, ogy a MCMC konzsztens becsléseket szolgáltat az a posteror valószínűségekre. Az alapállapot egyszerű: a mntavétel folyamat egy olyan dnamkus egyensúlyban állapodk meg, amelyben az egyes állapotokban töltött dő osszú távon számolt ányadosa pontosan az a posteror valószínűséggel arányos. Ez a tulajdonság, a specáls átmenet valószínűség matt áll fent, amely szernt a folyamat egyk állapotból a

máskba lép át, aogyan ezt a feltételes eloszlást a mntavételezett változó Markov-takarója megatározza. P(X Markov-takaró (x)) kszámítás módszere: Egy változó valószínűsége a Markov-takarójának smeretében arányos a változó szülevel vett feltételes valószínűségének és az egyes gyermekek azon szülevel vett feltételes valószínűségenek a szorzatával: P(X Markov-takaró(x)): α P ( X Szülők(x)) Y Gyermekek ( X ) P(Y Szülők(Y)). Így egy változó átlépéséez az x gyermekenek számával megegyező számú szorzás szükséges. Legáltalánosabb formájában a MCMC atékony módszer valószínűség modellekkel való számolására, és számos változatát fejlesztették k, közöttük a szmulált leűtés algortmust, a sztocasztkus kelégítetőség algortmust, és Metropols-astngs mntavételezőt.