1. A szoftver funkcionalitásai: modellszerkesztés

Hasonló dokumentumok
Mesterséges Intelligencia MI

Új típusú döntési fa építés és annak alkalmazása többtényezős döntés területén

Logika es sz am ıt aselm elet I. r esz Logika 1/36

EGYSZERŰ, NEM IRÁNYÍTOTT (IRÁNYÍTATLAN) GRÁF

Bizonytalanságok melletti következtetés

Exact inference in general Bayesian networks

Diszkrét matematika 2. estis képzés

GráfRajz fejlesztői dokumentáció

Követelmény a 7. évfolyamon félévkor matematikából

Ellenőrző kérdések. 36. Ha t szintű indexet használunk, mennyi a keresési költség blokkműveletek számában mérve? (1 pont) log 2 (B(I (t) )) + t

Térinformatikai algoritmusok Elemi algoritmusok

Adatbázis rendszerek Definíciók:

Diszkrét matematika 2.C szakirány

1: Bevezetés: Internet, rétegmodell Alapok: aszimptótika, gráfok. HálózatokII, 2007

Regresszió. Csorba János. Nagyméretű adathalmazok kezelése március 31.

Parametrikus tervezés

Algoritmusok Tervezése. Fuzzy rendszerek Dr. Bécsi Tamás

Ellátási lánc optimalizálás P-gráf módszertan alkalmazásával mennyiségi és min ségi paraméterek gyelembevételével

Adatbázismodellek. 1. ábra Hierarchikus modell

Számítógép hálózatok, osztott rendszerek 2009

22. GRÁFOK ÁBRÁZOLÁSA

7. BINÁRIS FÁK 7.1. A bináris fa absztrakt adattípus 7.2. A bináris fa absztrakt adatszerkezet

Mesterséges Intelligencia. Csató Lehel. Csató Lehel. Matematika-Informatika Tanszék Babeş Bolyai Tudományegyetem, Kolozsvár 2007/2008

Struktúra nélküli adatszerkezetek

5. SOR. Üres: S Sorba: S E S Sorból: S S E Első: S E

Valószínűségi hálók. Mesterséges Intelligencia - MI. Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs rendszerek Tanszék

Operációs rendszerek. 3. gyakorlat. Jogosultságkezelés, linkelés, csővezeték UNIVERSITAS SCIENTIARUM SZEGEDIENSIS UNIVERSITY OF SZEGED

2. A példahalmazban n = 3 negatív és p = 3 pozitív példa van, azaz a példahalmazt képviselő döntési fa információtartalma: I = I(1/2, 1/2) = 1 bit.

6. Függvények. Legyen függvény és nem üreshalmaz. A függvényt az f K-ra való kiterjesztésének

Térinformatikai algoritmusok Elemi algoritmusok

Alapszintű formalizmusok

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1

Diszkrét matematika 2.C szakirány

Mindent olyan egyszerűvé kell tenni, amennyire csak lehet, de nem egyszerűbbé. (Albert Einstein) Halmazok 1

Mindent olyan egyszerűvé kell tenni, amennyire csak lehet, de nem egyszerűbbé.

Számítógépes képelemzés 7. előadás. Dr. Balázs Péter SZTE, Képfeldolgozás és Számítógépes Grafika Tanszék

(Independence, dependence, random variables)

30. ERŐSEN ÜSSZEFÜGGŐ KOMPONENSEK

Térképek jelentése és elemzése

Mesterséges Intelligencia MI

[1000 ; 0] 7 [1000 ; 3000]

Algoritmuselmélet. 2-3 fák. Katona Gyula Y. Számítástudományi és Információelméleti Tanszék Budapesti Műszaki és Gazdaságtudományi Egyetem. 8.

(Solid modeling, Geometric modeling) Testmodell: egy létező vagy elképzelt objektum digitális reprezentációja.

Matematikai alapok és valószínőségszámítás. Valószínőségi eloszlások Binomiális eloszlás

10. modul: FÜGGVÉNYEK, FÜGGVÉNYTULAJDONSÁGOK

Intelligens adatelemzés

Adatszerkezetek I. 7. előadás. (Horváth Gyula anyagai felhasználásával)

BayesCube felhasználói kézikönyv

Az informatika kulcsfogalmai

Termék modell. Definíció:

Előadó: Dr. Oniga István DIGITÁLIS TECHNIKA 3

MATEMATIKA EMELT SZINTŰ SZÓBELI VIZSGA TÉMAKÖREI (TÉTELEK) 2005

ADATBÁZIS-KEZELÉS. Modellek

Időjárási csúcsok. Bemenet. Kimenet. Példa. Korlátok. Nemes Tihamér Nemzetközi Informatikai Tanulmányi Verseny, 2-3. korcsoport

Táblázatok. Táblázatok beszúrása. Cellák kijelölése

BGF. 4. Mi tartozik az adatmodellek szerkezeti elemei

Matematikai geodéziai számítások 6.

Adatbázis, adatbázis-kezelő

Készítette: Fegyverneki Sándor

Algoritmusok Tervezése. 6. Előadás Algoritmusok 101 Dr. Bécsi Tamás

1. gyakorlat. Mesterséges Intelligencia 2.

Matematikai geodéziai számítások 6.

Algoritmusok és adatszerkezetek gyakorlat 07

III. Gráfok. 1. Irányítatlan gráfok:

Adatmodellezés. 1. Fogalmi modell

Kinek szól a könyv? A könyv témája A könyv felépítése Mire van szükség a könyv használatához? A könyvben használt jelölések. 1. Mi a programozás?

Az optimális megoldást adó algoritmusok

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Osztályozóvizsga követelményei

Ionogram releváns területeinek meghatározása és elemzésének automatikus megvalósítása

Mesterséges Intelligencia. Csató Lehel. Csató Lehel. Matematika-Informatika Tanszék Babeş Bolyai Tudományegyetem, Kolozsvár 2010/2011 1/363

Elemi adatszerkezetek

Logika es sz am ıt aselm elet I. r esz Logika Negyedik el oad as 1/26

MATEMATIKA EMELT SZINTŰ SZÓBELI VIZSGA TÉMAKÖREI (TÉTELEK) 2012

Az MS Excel táblázatkezelés modul részletes tematika listája

Számítógépes döntéstámogatás. Genetikus algoritmusok

Magas szintű adatmodellek Egyed/kapcsolat modell I.

Pásztor Attila. Algoritmizálás és programozás tankönyv az emeltszintű érettségihez

Duál Reklám weboldal Adminisztrátor kézikönyv

12. előadás. Egyenletrendszerek, mátrixok. Dr. Szörényi Miklós, Dr. Kallós Gábor

Számítógépes döntéstámogatás. Döntések fuzzy környezetben Közelítő következtetések

Algoritmuselmélet. Katona Gyula Y. Számítástudományi és Információelméleti Tanszék Budapesti Műszaki és Gazdaságtudományi Egyetem. 13.

Adatszerkezetek Adatszerkezet fogalma. Az értékhalmaz struktúrája

Adatszerkezetek 2. Dr. Iványi Péter

Kupac adatszerkezet. A[i] bal fia A[2i] A[i] jobb fia A[2i + 1]

Nagy Gábor compalg.inf.elte.hu/ nagy ősz

Az értékelés során következtetést fogalmazhatunk meg a

Hasonlósági keresés molekulagráfokon: legnagyobb közös részgráf keresése

Adatszerkezetek és algoritmusok

Osztályozó- és javítóvizsga témakörei MATEMATIKA tantárgyból 2016 / tanév

BŐVÍTMÉNYEK TELEPÍTÉSE ÉS SZERKESZTÉSE WORDPRESS-BEN

Automatikus tesztgenerálás modell ellenőrző segítségével

Követelmény az 5. évfolyamon félévkor matematikából

Mesterséges Intelligencia MI

Formális módszerek GM_IN003_1 Program verifikálás, formalizmusok

CAD-ART Kft Budapest, Fehérvári út 35.

ÁRAMKÖRÖK SZIMULÁCIÓJA

Elérhetőségi probléma egyszerűsítése: Állapottér és struktúra redukció Petri-háló alosztályok

11. modul: LINEÁRIS FÜGGVÉNYEK

Keresés képi jellemzők alapján. Dr. Balázs Péter SZTE, Képfeldolgozás és Számítógépes Grafika Tanszék

Átírás:

1. A szoftver funkcionalitásai: modellszerkesztés A BayesCube szoftver segítségével a felhasználó valószínűségi csomópontokból álló Bayes-hálókat, majd az akció- és hasznosságcsomópontok bevezetésével annak kiterjesztését jelentő döntési hálókat konstruálhat. A modellstruktúra szerkesztésekor a felhasználó a palettáról választhatja ki, majd húzhatja be a szerkesztővászonra a hozzáadni kívánt csomópontot. A csomópontok közé irányított éleket köthet, amelyek a háló értelmezési szintjétől függően a változók közötti feltételes függőségi vagy ok-okozati relációk reprezentációjaként értelmezhetők. A palettán a csomópontok típusuk szerint csoportosítva érhetők el. Az első csoportba a valószínűségi csomópontok kerültek. A valószínűségi csomópontok ellipszisekkel vannak jelölve. A Bayes-hálóban minden egyes valószínűségi csomópont saját CPD modellel, azaz lokális feltételes valószínűségi modellel rendelkezik, amely a reprezentált valószínűségi változó feltételes valószínűség-eloszlását adja meg. Egy Bayes-háló leírásához a topológiát leíró metadatok mellett a csomópontbeli CPD modellek paraméterezése szükséges. Többféle CPD modell létezik. A valószínűségi csomópontokat az alkalmazott CPD modelljük szerint tudjuk típusokba sorolni. A szoftver a lehetséges CPD modellek közül a táblázatos CPT-t, a kontextuális feltételes függetlenségeket reprezentáló lokális struktúrák közül a döntési fát és döntési gráfot implementálja. 1. A paletta A leggyakrabban használt modell a CPT, vagyis feltételes valószínűségi tábla, amely soraiban a szülők minden lehetséges érték-kombinációjához tartalmaz egy valószínűségi eloszlást.

2. Példa a feltételes valószínűségi táblára A döntési fa, - háló alapú valószínűségi csomópontokról alább részletesebben szólok. A palettán a valószínűségi csomópontok csoportja alatt az ún. akciócsomópont található. E téglalappal jelölt csomópontok azokat a döntési pontokat reprezentálják, ahol a döntéshozónak választani kell a lehetséges alternatívák közül. Az akciócsomópont alatt a hasznosságcsomópontok csoportja következik. A vizuálisan rombusszal ábrázolt hasznosságcsomópontok a döntéshozó hasznosságfüggvényét reprezentálják a szülőcsomópontokon definiált függvény segítségével. A szoftver jelenlegi verziójában a hasznosság megadhatók a "klasszikus", táblázatos formában, de emellett lehetőség van a hasznosságfüggvény döntési fás és - gráfos lokális függőségi modellel való kifejezésére is. 3. Példa egy hasznosságtáblázatra

Minden csomópont belsejében annak egyedi azonosító neve olvasható, felső régiójában pedig a csomópont altípusára utaló ikon látható. 2. Változótípusok A valószínűségi csomópontok a szoftver jelenlegi verziójában kizárólag véges értékkészletű, diszkrét valószínűségi változókat jelölnek. Lehetőség van a változótípusok egyedi azonosítójukkal, a felvehető értékek halmazának és azok valós intervallumainak megadásával történő definiálására, törlésére, módosítására. 4.Változótípus szerkesztésére szolgáló dialógusablak 3. Változócsoportok A modellben található csomópontok csoportokba szervezhetők, a csoportokhoz a csomópont háttérszínét meghatározó színt rendelhet a felhasználó.

5. Az egy változócsoportba tartozó csomópontok háttérszíne azonos 4. Annotációk A modellben magához a hálóhoz, a csomópontjaihoz, a változótípusokhoz és a változócsoportokhoz is rendelhetők kulcs-érték pár alakú szöveges annotációk. Az annotáció lényege, hogy egy modell különböző absztrakciós szintjén lévő elemeit kiegészítő információkkal gazdagítsuk. Az változókhoz, illetve változó csoportokhoz publikációs hivatkozást vagy akár adatbázis referenciát rendelhetünk, egyes kiemelten fontos elemekhez további részleteket fűzhetünk. De lehetővé válik korábbi eredmények adott elemhez való linkelése is. A cél az, hogy az elemzést elősegítse a rendszerezett addícionális információ. 5. Döntési fa szerkesztő A CPT mérete exponenciális nő a szülők számának és a változók értékkészletének növekedésével ami viszont problémát jelent a struktúra- és paramétertanulás során, mivel nagyszámú paramétert kell megbízhatóan megbecsülnünk, ami több adatot igényel. A paraméterszám csökkentésére kétféle lehetőségünk van: egyik megközelítés szerint egy korlátozottabb reprezentációs képességű modellosztályt alkalmazunk, mint pl. a lineáris paraméterszámmal leírható a noisy-or, vagy egy olyan modellosztályt keresünk, amely képes ábrázolni a kontextuális feltételes függetlenséggel kifejezhető összefüggéseket, nevezetesen amikor egy kontextusban, vagyis a szülőváltozók egy halmaza által felvett értékek mellett a változó feltételesen független egy szülőváltozójától. Ezzel a megközelítéssel nem csak tömörebb formában vagyunk képesek a feltételes valószínűség-eloszlást ábrázolni, hanem még a modell kifejezőképességéből sem veszítünk. Lokális struktúrák használatával főleg nagy méretű hálókban sokat javíthatunk a struktúratanulás és a következtetés gyorsaságán. Ilyen, a feltételes eloszlás leírásában a kontextuális feltételes függetlenséggel kifejezhető összefüggéseket ábrázolni képes lokális struktúra a döntési fa, amely felépítéséhez a vizsgált csomópont szüleit, mint tesztváltozókat használunk fel. A döntési fa belső, döntési csomópontjaihoz a változó egy szülőjét rendeljük, a döntési csomópontból kimenő élekhez az ennek a változónak egy értéke, a fa leveleihez pedig a változó egy eloszlása tartozik. A döntési csomópontnak annyi ága van ahány eltérő lehetséges értéket a vizsgált változó felvehet. A döntési csomópontokat ellipszisekkel, a leveleket téglalapokkal jelöljük, az irányított élek melletti címkéken az él kezdőpontjaként szolgáló döntési csomóponthoz rendelt változó egy felvehető értékét olvashatjuk. A fa gyökere az a csúcs,

amelynek nincs bemenő éle, minden más csomópontjának pontosan egy bemenő éle van. A döntési fa a faépítés kiinduló állapotában egyetlen levélből áll, ekkor ez egyúttal a fa gyökere is, más esetben a gyökér döntési csomópont típusú. A döntési csomópontoknak pontosan egy kimenő éle van, a leveleknek nincsen egy se. A kifejlesztett szoftver lehetővé teszi ilyen döntési fás lokális modellel rendelkező valószínűségi csomópontok felvételét. A felhasználó a döntési fa szerkesztőben új döntési csomópont felvételéhez a palettáról válogathat a változócsomópont szülei, mint a döntési fa attribútumai közül. Ha a felhasználó az új döntési csomópontot egy levél fölé húzza, a levél döntési csomópontra változik át és annyi belőle kiinduló irányított él kerül felvételre a végükön egy-egy új levéllel, amennyi a döntési csomóponthoz rendelt változó felvehető értékeinek a száma. Az élek melletti címkéken az él kezdőpontjaként szolgáló döntési csomóponthoz rendelt változó egy felvehető értékét olvashatjuk. 6. A döntési fa szerkesztő felülete Minden levélhez vezető irányított út mentén minden szülőváltozó maximum egyszer fordulhat elő. Ezen szabály érvényességét a program minden a gráf struktúráját érintő változáskor ellenőrzi, ha sérülne, a kurzor tiltó jelre vált, a művelet nem végrehajtható. A programban a felhasználónak lehetősége van döntési csomópont vagy egy egész belőle kiinduló részfa törlésére, a levélbeli eloszlások szerkesztésére, döntési csomópontból kiinduló részfa áthelyezésére vagy másolására egy másik levélbe. A döntési fa lokális modellel rendelkező valószínűségi változó csomópont eloszlását úgy tudjuk meghatározni, hogy a gyökérből indulva irányított úton haladunk egy levél felé, minden belső

csomópontnál azt a kimenő élt választjuk amelyikhez rendelt változóérték megegyezik az adott szülőváltozó értékével, egészen addig, amíg levélhez nem érünk. A levélhez tartozó eloszlás lesz a változó eloszlása. A döntési fa lokális modelles ábrázolás megfeleltethető egy CPT-nek is. A levélbe vezető utak mentén érintett szülőváltozó értékek egy vagy több sorát jelölik ki a feltétleles valószínűség táblának, amelyben a levélben megadott valószínűségi eloszlás érvényes lesz. A döntési fa felhasználja a kontextuális feltételes függetlenséget, hiszen a teljes fához képest kimetszett változók függetlenek az eredeti változótól a levélig vezető út által meghatározott szülői értékkonfiguráció kontextusában. 6. Döntési gráf szerkesztő A döntési fák bármilyen logikai függvényt képesek reprezentálni, de nem azonos hatékonysággal: míg a konjunkciókat (AND) hatékonyan képesek leírni, a diszjunkciók (OR) leírása nagy méretű fákat igényel. A döntési fával nehezen kifejezhető függvényre jó példa a 3 bemenetű XOR függvénykapcsolat: 7. 3 bemenetű XOR függvény kifejezése döntési fával A döntési gráf a döntési fa általánosítása, amelyben a döntési fáktól eltérően egy csomópontnak lehet több szülője is, ugyanabba a levélbe több irányított úton is eljuthatunk. A döntési fában minden a gyökértől levélbe vezető út egy az attribútumtesztekre vonatkozó konjunkciónak felel meg, a döntési gráfban viszont lehetőség van diszkjunkciókkal a levélbe vezető irányított utak összekapcsolására is. Ezzel a kiterjesztéssel a döntési fához hasonlóan könnyen értelmezhető, de mégtömörebb ábrázolást kapunk.

8. 3 bemenetű XOR függvény kifejezése döntési gráffal A szoftver döntési gráfos lokális modell-szerkesztő funkcionalitással is bír. A döntési fa szerkesztéséhez hasonlóan a felhasználó döntési csomópontokat hozhat létre a gráfban, csomópontot vagy belőle kiinduló egész irányított részgráfokat törölhet, áthelyezhet, másolhat. A döntési fa szerkesztőhöz képest új műveletként jelennek meg a két levél egyesítése, levél összevonása döntési csomóponttal, közös szülőből induló élek szétválasztása és az él leválasztása műveletek. 7. Részgráf duplikálás, copy/paste A program lehetővé teszi a kijelölt csomópontok által alkotott feszített részgráf duplikálását a bemenő élekkel együtt a másolt valószínűségi csomópontok lokális modellparaméterezésének megosztásával vagy anélkül. A kijelölt részgráfra elérhetőek a copy/paste parancsok is, amelyekkel a kijelölt struktúra másolható, beilleszthető ugyanazon háló egy kívánt pozíciójába vagy akár egy másik szerkesztőablakban megnyitott hálóba a kapcsolódó változótípusokkal együtt. 8. Noisy-OR CPD-jű valószínűségi változó csopópontok felvételének lehetősége a Bayes-háló modellbe A Bayes-háló szerkesztő palettáján új felvehető elemként megjelent a Noisy-OR CPD-jű valószínűségi csomópont.

Bizonyos esetekben a változó szüleitől, mint feltételektől függő feltételes eloszlását célszerűbb tömörebben, korlátozottabb ábrázolóképességű, de kevesebb paramétert igénylő modellosztállyal reprezentálni. Ilyen modellosztály kanonikus eloszlások osztálya. Ezek az eloszlások valamilyen szabályosságokat követnek, segítségükkel a teljes feltételes valószínűség tábla leírható a mintázat és esetleg néhány paraméter meghatározásával - sokkal könnyebben, mint exponenciális számú paraméter megadásával. A kanonikus modellek körébe tartozó egyik legismertebb modell a noisy-or, magyarul zajos-vagy kapu. Bináris szülők esetén a noisy-or kaput úgy értelmezhetjük, mint a szülőváltozók egymástól való független hatását a kérdéses változóra. Ez azt jelenti, hogy bármely szülőváltozó "igaz" értéke esetén a gyermek 1-p valószínűséggel lesz "igaz" értékű és p valószínűséggel "hamis". A gyakorlatban, szinte lehetetlen minden olyan lehetséges okot számításba venni, ami a modellünkben hathat. Ezért noisy- OR modellben bevezetésre került a leak probability (szivárgás valószínűség, lambda0) paraméter, ami lehetővé teszi az ilyen figyelembe nem vett tényezők modellezését is. A leak probability bevezetésével a "leaky noisy-or" kapu bemeneteinek hamis értékei esetén, a hamis kimenet valószínűsége nem 1.0, hanem a noise paraméter értéke lesz. Mivel a szülőváltozók függetlenül hatnak, a valószínűségek kiszámításának formulája: A szoftver a Noisy-OR CPD-jű változócsomópont szüleinek csak bináris változókat enged meg és magának a változónak is binárisnak kell lennie. A Noisy-OR CPD-jű változócsomópont paramétereinek megadására a csomópontra duplakattintás után megjelenő dialógusablakban van lehetőség:

9. Paramétermegosztás A hálóban használt paraméterek száma csökkenthető olymódon is, hogy egyes változók megosztják a modell paraméterezésüket, amit a háló más csomópontjai felhasználnak. Egy valószínűségi csomópont átveheti egy másik valószínűségi csomópont lokális modelljének paraméterezését, ha azonos típusúak lokális modellje paraméterezését nem ő is egy másik valószínűségi csomóponttól veszi azonos számú szülőjük van és a szülők felvehető értékeinek száma is megegyezik. 10. Temporális csoportok A programban a felhasználónak lehetősége van temporális csoportok létrehozására, a csoportok között időrendi sorrend megadása (a dialógus ablakbeli csoportsorrend), valószínűségi csomópontok temporális csoportokba sorolására. Az egy csoportba tartozó csomópontok ezután egyszerre kijelölhetők, a temporális csoportból a "következő" temporális csoport automatikusan létrehozható (a duplikálni kívánt csoport után legyen üres legalább egy temporális csoport, ajánlott az összes temporális csoportot létrehozni). Ekkor a temporális csoportba tartozó csomópontok által alkotott feszített részgráf kerül duplikálásra a bemenő élekkel együtt, miközben az újonnan létrejött csomópontok mindegyike a következő temporális csoportba lesz besorolva, lokális modelljük paramétei a másolt csomópontok lokális modelljének megosztott paraméterei lesznek.