Reiz Beáta. 2006 április



Hasonló dokumentumok
FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Sz ekelyhidi L aszl o Val osz ın us egsz am ıt as es matematikai statisztika *************** Budapest, 1998

A TANTÁRGY ADATLAPJA

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Fábián Zoltán Hálózatok elmélet

Illeszkedésvizsgálat

Elemi adatszerkezetek

Mágneses szuszceptibilitás vizsgálata

A fiatalok pénzügyi kultúrája Számít-e a gazdasági oktatás?

Kockázatkezelés és biztosítás

Azonosító jel: Matematika emelt szint

Javítóvizsga témakörei matematika tantárgyból

MATEMATIKA ÉRETTSÉGI TÍPUSFELADATOK MEGOLDÁSAI KÖZÉPSZINT Trigonometria

Épületvillamosság laboratórium. Villámvédelemi felfogó-rendszer hatásosságának vizsgálata

Mesterséges Intelligencia. Csató Lehel. Csató Lehel. Matematika-Informatika Tanszék Babeş Bolyai Tudományegyetem, Kolozsvár 2006/2007

Tolna Megyei Földmérők Napja Tolna megyei földmérők helyzete a szakmagyakorlási rendelet szerint Németh András TMMK GGT Szakcsoport elnök

Analízis elo adások. Vajda István október 3. Neumann János Informatika Kar Óbudai Egyetem. Vajda István (Óbudai Egyetem)

Elemi statisztika fizikusoknak

Kooperáció és intelligencia

MAGISTER GIMNÁZIUM TANMENET OSZTÁLY

Bevezetés a lágy számítás módszereibe

V. Kétszemélyes játékok

Dr. Kulcsár Gyula. Virtuális vállalat félév. Projektütemezés. Virtuális vállalat félév 5. gyakorlat Dr.

Gazdasági matematika II.

Kereséssel történő problémamegoldás. Ormándi Róbert

Párhuzamos programozás

Mesterséges Intelligencia. Csató Lehel. Csató Lehel. Matematika-Informatika Tanszék Babeş Bolyai Tudományegyetem, Kolozsvár 2010/2011 1/363

ONLINE VIDEÓ MÉRÉSE. a tévével együtt. GfK 2016 Online videó mérése tévével együtt Média Hungary Bacher János 1

A környezettan tantárgy intelligencia fejlesztő lehetőségei

TANTÁRGYI ÚTMUTATÓ. Gazdasági matematika II. tanulmányokhoz

Az MPM hálótechnika (I. előadás)

MATLAB. 4. gyakorlat. Lineáris egyenletrendszerek, leképezések

ELEKTRONIKAI ALAPISMERETEK

[MECHANIKA- HAJLÍTÁS]

Az aktiválódásoknak azonban itt még nincs vége, ugyanis az aktiválódások 30 évenként ismétlődnek!

JAVÍTÁSI-ÉRTÉKELÉSI ÚTMUTATÓ. Foglalkozásegészségügyi szakápoló szakképesítés Foglalkozásegészségügyi felmérés modul. 1.

Osztályozó és Javító vizsga témakörei matematikából 9. osztály 2. félév

2011. március 9. Dr. Vincze Szilvia

Digitális technika (VIMIAA01) Laboratórium 1

Jelek tanulmányozása

MATEMATIKA ÉRETTSÉGI TÍPUSFELADATOK KÖZÉPSZINT Függvények

xdsl Optika Kábelnet Mért érték (2012. II. félév): SL24: 79,12% SL72: 98,78%

B1: a tej pufferkapacitását B2: a tej fehérjéinek enzimatikus lebontását B3: a tej kalciumtartalmának meghatározását. B.Q1.A a víz ph-ja = [0,25 pont]

Vasúti menetrendek optimalizálása

Milyen segítséget tud nyújtani a döntéshozatalban a nem-hagyományos jelfeldolgozás?

Puskás Tivadar Távközlési Technikum

Az éves statisztikai összegezés STATISZTIKAI ÖSSZEGEZÉS AZ ÉVES KÖZBESZERZÉSEKRŐL A KLASSZIKUS AJÁNLATKÉRŐK VONATKOZÁSÁBAN

Halmazok és függvények

MATEMATIKA ÍRÁSBELI VIZSGA május 3.

Valószínűségi modellek

WALTER-LIETH LIETH DIAGRAM

ingyenes tanulmány GOOGLE INSIGHTS FOR SEARCH

3D - geometriai modellezés, alakzatrekonstrukció, nyomtatás

ELEKTRONIKAI ALAPISMERETEK

VASÚTI PÁLYA DINAMIKÁJA

Analízis előadások. Vajda István február 10. Neumann János Informatika Kar Óbudai Egyetem

Alagútépítés Ideiglenes megtámasztás tervezése Példafeladat TÓTH Ákos

Hőhidak meghatározásának bizonytalansága. Sólyomi Péter ÉMI Nonprofit Kft.

Mesterséges Intelligencia. Csató Lehel. Csató Lehel. Matematika-Informatika Tanszék Babeş Bolyai Tudományegyetem, Kolozsvár 2010/2011 1/363

A C programozási nyelv VI. Parancssori argumentumok File kezelés

Differenciál egyenletek

ELEKTRONIKAI ALAPISMERETEK

Programozás I gyakorlat

A TŰZVÉDELMI TERVEZÉS FOLYAMATA. Dr. Takács Lajos Gábor okl. építészmérnök BME Építészmérnöki Kar Épületszerkezettani Tanszék

Intézményi jelentés. Összefoglalás. Medgyessy Ferenc Gimnázium és Művészeti Szakközépiskola 4031 Debrecen, Holló László sétány 6 OM azonosító:

9. sz. melléklet Minőségi célértékek

V. Játékok. Kétszemélyes, teljes információjú, véges és determinisztikus, zéró összegű, játékok. Állapottér-reprezentáció. Grundy mama játéka

Gépi forgácsoló Gépi forgácsoló

Vezetőtárs értékelő kérdőív

Számítógép hálózatok gyakorlat

MOBIL CROWDSENSING ÉS BIG DATA TÁVKÖZLÉSI ÉS MÉDIAINFORMATIKAI TANSZÉK BUDAPESTI MŰSZAKI ÉS GAZDASÁGTUDOMÁNYI EGYETEM

A követelés-elengedés eredményeként az Ön tartozása <tartozás csökkenésének mértéke> forinttal csökken.

FIT-jelentés :: Kőbányai Keresztury Dezső Általános Iskola 1106 Budapest, Keresztúri út 7-9. OM azonosító: Intézményi jelentés

TRANZISZTOROS KAPCSOLÁSOK KÉZI SZÁMÍTÁSA

Minimálisan hormon érzékeny korai emlı daganatos betegcsoport összehasonlító vizsgálata

Khi-négyzet próbák. Szűcs Mónika SZTE ÁOK-TTIK Orvosi Fizikai és Orvosi Informatikai Intézet

Beszámoló: a kompetenciamérés eredményének javítását célzó intézkedési tervben foglaltak megvalósításáról. Őcsény, november 20.

Kombinatorika. 9. előadás. Farkas István. DE ATC Gazdaságelemzési és Statisztikai Tanszék. Kombinatorika p. 1/

SZAKÁLL SÁNDOR, ÁsVÁNY- És kőzettan ALAPJAI

Áramlástechnikai gépek soros és párhuzamos üzeme, grafikus és numerikus megoldási módszerek (13. fejezet)

Az ügyvédi titok védelmének egyes aktuális kérdései a cégek, mint megbízók szemszögébl

Üresként jelölt CRF visszaállítása

MIÉRT SIKERESEK A CSALÁDI VÁLLALKOZÁSOK?

KOVÁCS BÉLA, MATEMATIKA I.

ELEKTRONIKAI ALAPISMERETEK

A TANTÁRGY ADATLAPJA

E-ADÓ RENSZER HASZNÁLATI ÚTMUTATÓ

Dr. BALOGH ALBERT: AZ ÚJ STATISZTIKAI TERMINOLÓGIA

1. Írja fel prímszámok szorzataként a 420-at! 2. Bontsa fel a et két részre úgy, hogy a részek aránya 5 : 4 legyen!

Budapest, április A beutazó turizmus jellemzői és alakulása 2015-ben A KSH keresletfelmérésének adatai alapján

Mehet!...És működik! Non-szpot televíziós hirdetési megjelenések hatékonysági vizsgálata. Az r-time és a TNS Hoffmann által végzett kutatás

DLookup függvény 1. (5)

Fónai Mihály: Alumni: hallgatói elvárások és vélemények. Campus Lét a Debreceni Egyetemen: csoportok és csoportstruktúrák december 3.

A TANTÁRGY ADATLAPJA

Tanulmányi keretrendszer az APPI-ban

KÖZELÍTŐ INFERENCIA II.

Lineáris algebra jegyzet

3. Egy szabályos dobókockát kétszer feldobva mennyi annak a valószínűsége, hogy a dobott számok különbségének abszolutértéke nagyobb mint 4?

Algebra es sz amelm elet 3 el oad as Rel aci ok Waldhauser Tam as 2014 oszi f el ev

A jelenség magyarázata. Fényszórás mérése. A dipólus keletkezése. Oszcilláló dipólusok. A megfigyelhető jelenségek. A fény elektromágneses hullám.

Átírás:

Babes - Bolyai Tudomány Egyetem Matematika Informatika Kar Informatika Szak 2006 április

1 2

(GM) Definíció: olyan gráf, melynek csomópontjai valószínűségi változók élei ezen változók közti függőségi viszonyokat jellemzik a modell paraméterei a gráf csomópontjaihoz rendelt eloszlásfüggvények Osztályozás: irányított grafikus (Bayes ) alkalmazásai a mesterséges intelligencia területén fellelhetők irányítatlan grafikus (Markov ) alkalmazásai a fizika területén fellelhetők

(BN) irányított aciklikus gráf (DAG) paraméterei: feltételes valószínűségtáblák (Conditional Probability Table) az A B él azt jelenti, hogy a B változó értéke függ az A változó értékétől C P(R C) 0 0.2 1 0.8 Rain P(C) 0.5 Cloudy WetGrass Sprinkler

legegyszerűbb szabály: Egy csomópont minden más csomóponttól független, ha ismert a csomópont minden szülőjének értéke. Bayes labda szabály: Egy A csomópont független egy B csomóponttól, ha nem létezik A B út a következő megkötésekkel: Ha az út egy C csomópontjának értéke ismert, akkor C-ből csak az érkező éleken mehetünk tovább Ha az út egy C csomópontjának értéke ismeretlen, akkor C-ből csak a kimenő éleken mehetünk tovább

függetlenségi relációk meghatározására A B F D Ha ismerjük B és C értékét (szürke): C G független-e A és H? nem: A, B, E, H független-e D és G? igen E H

ban A Bayes háló egy teljes valószínűségtáblát határoz meg. X egy csomópont azonosítója a hálóból not(x) a háló X-től különböző csomópontjainak halmaza x a X csomópontban szereplő érték Kérdés: Mi a valószínűsége, hogy a X csomópontban szereplő érték x? P(X = x) = z P(X = x not(x) = z) P(not(X) = z)

P(C) 0.5 Cloudy C P(R C) 0 0.2 1 0.8 Rain WetGrass Sprinkler C P(S C) 0 0.5 1 0.1 S R P(W S,R) 0 0 0.0 0 1 0.90 1 0 0.90 1 1 0.99

a hálóban Mi a valószínűsége, hogy esett az eső, ha most vizes a fű? P(R = 1 W = 1) = P(R = 1, W = 1) P(W = 1) ahol P(W = 1) = c,s,r P(C = c, S = s, R = r, W = 1) P(C, S, R, W) = P(C) P(S C) P(R C, S) P(W C, S, R) A háló függőségi relációit felhasználva a következő kifejezést kapjuk: P(C, S, R, W) = P(C) P(S C) P(R C) P(W S, R)

Alkalmazásokban előforduló Hogyan építhető fel egy ilyen modell? Hogyan lehetne használni?

QMR háló Quick Medical Reference gyógyászatban alkalmazott diagnosztizáló rendszer 534 betegség 4040 lelet: orvosi vizsgálatok eredményei szimptómák laborvizsgálatok eredményei INTERNIST-I projekt: didaktikai célokra használt rendszer CPCS hálót használja Computer-based Patient Case Study a QMR háló része 448 csomópont, 908 él, kb. 600 valószínűség-értéket tárolnak

Háló paramétereinek Feladat: Adott: Lépések: a struktúrának megfelelő összes feltételes valószínűség meghatározása a tanuló adatok adattagok közötti direkt függőségek meghatározzuk az aktuális csomópont szüleit a szülők minden egyes értékkombinációja esetén meghatározzuk a szülők, illetve az aktuális csomópont és a szülők együttes előfordulásának gyakoriságát a kért feltételes valószínűség az aktuális csomópont és a szülők, illetve a szülők együttes valószínűségének aránya

Modell adatokra való illeszkedésének mérése : Egy távolság egy igaz (P) eloszlás és egy tetszőleges (Q) eloszlás között. ban az adatok modellje és az adatok feltételezett modellje között számítjuk ki. Diszkrét esetben a következő képlet segítségével számíthatjuk ki: D KL (P Q) = x Ω P(x) log P(x) Q(x) = P(x) log(p(x)) P(x) log(q(x)) x Ω x Ω

változása különböző hálók esetén 0.12 0.1 A B 0.08 0.06 0.04 0.02 C 0 0.02 0 100 200 300 400 500 600 D

Feladat: optimális szerkezet (gráf) megkeresése probléma: a keresési tér mérete exponenciális a gráf csomópontjainak száma szerint Módszerek: Empirikus penalizáló -vizsgálaton alapuló

Kiértékelő függvény meghatározása topológia esetén pontozzuk a hálót: a paraméterek illeszkedése szerint a gráf szerkezete szerint használt kiértékelőfüggvény a BICscore (Bayesian Information Criterion) BICscore(G D) = X i ahol X [log(q(x i )) card(q(x i ) D)] x i Ω log(n) df (G) 2 card(q(x i ) D) az x i értékkombináció előfordulásának száma az adatokban df (G) a hálóban található CPT-k sorainak száma

BICscore változása különböző hálók esetén 0.98 x 104 0.99 A B 1 1.01 1.02 1.03 1.04 1.05 0 100 200 300 400 500 600 C D

Topologikus Az algoritmus lépései: 1. modell init 2. cpt FeltValTablak(modell) 3. ertek BICpont(cpt) 4. ujmodell KovModell(modell) 5. ujcpt FeltValTablak(ujmodell) 6. ujertek BICpont(ujcpt) 7. mig ujertek > ertek megjegyezzuk a generalt modellt és visszalepunk 4.-re 8. return(cpt)

1 2 Mesterséges adatokból a eredményeként visszakapjuk-e az eredeti hálót?

adott háló alapján adott: a csomópontok száma a függőségi relációk a modell paraméterei az adattagok Bernoulli eloszlást követnek, a függőségi relációk figyelembevételével egyetlen adattag generálásának lépései: egy [0,1] intervallumba eső egyenletes eloszlású val. vált. generálása csomópont szülei értékének meghatározása az eloszlás paraméterének és a generált val.vált. értékének megfelelően a csomópont értékének meghatározása

Feltételes valószínűségtáblák meghatározása Adottak a gráf függőségi relációi. Lépések: 1. meghatározzuk az aktuális csomópont szüleit 2. kitöltjük a feltételes valószínűségtábla sorait: Legyen X az aktuális csomópont Pa(X) az aktuális csomópont szülei x a szülők egy értékkombinációja P(X = 1,Pa(X) = x) P(X = 1 Pa(X) = x) = P(Pa(X) = x) Az együttes valószínűségeket az adatokból számított relatív gyakoriságokkal helyettesítjük.

struktúra inicializálásának módszerei maximális élszámú gráf generálása generáljuk az élek számát majd az éleket a gráf üres lokálisan keresünk egy "jobb" hálót elveszünk egy élt a gráfból a már meglévő élekhez hozzáadunk még egyet

Program működése 1. Az adatokat a következő struktúra alapján generáltam: 1 4 2 6 5 8 7 3

Program működése 2. 1 2 4 5 6 7 1 2 4 6 7 3 8 3 5 8 1. 2 4 6 7 2. 2 4 6 7 1 5 3 8 1 5 3 8 3. 4.

Program működése 3. 2 1 4 6 7 3 8 2 4 1 6 7 8 3 5. 2 4 5 6 7 8 6. 5 1 5 3 7. 8.

Könyvészet 1. S. J. Russell, P. Norvig: Artificial Intelligence, Prentice Hall, 1995 2. Tom Mitchell: Machine Learning, McGraw-Hill, 1997 3. T. Jaakkola, M. Jordan: Variational probabilistic inference and the QMR database, 1998 4. Dimitris Margaritis: Learning Bayesian Network Model Structure from Data, 2003 5. Kevin Murphy s Bayes Net tutorial: www.cs.ubc.ca/ murphyk/bayes/bnintro.html 6. David Heckerman s list of publications: research.microsoft.com/ heckerman/

Köszönöm a figyelmet.