Valószínűségi modellek



Hasonló dokumentumok
Mesterséges Intelligencia MI

Probabilisztikus modellek V: Struktúra tanulás. Nagy Dávid

Matematikai és matematikai statisztikai alapismeretek

matematikai statisztika október 24.

V. Bizonytalanságkezelés

MATEMATIKA I. RÉSZLETES ÉRETTSÉGI VIZSGAKÖVETELMÉNY A) KOMPETENCIÁK

Kockázati folyamatok. Sz cs Gábor. Szeged, szi félév. Szegedi Tudományegyetem, Bolyai Intézet

Mesterséges intelligencia, 7. előadás október 13. Készítette: Masa Tibor (KPM V.)

Bemenet modellezése II.

Probabilisztikus modellek. Nagy Dávid

Szepesvári Csaba ápr. 11

Bizonytalanság Valószín ség Bayes szabály. Bizonytalanság. November 5, Bizonytalanság

KÖZELÍTŐ INFERENCIA II.

A TANTÁRGY ADATLAPJA

Valószín ségelmélet házi feladatok

Nyugat-magyarországi Egyetem Geoinformatikai Kara. Prof. Dr. Závoti József. Matematika III. 6. MA3-6 modul. A statisztika alapfogalmai

Mesterséges Intelligencia MI

KÖZELÍTŐ INFERENCIA II.

T Ö. Irodalom V Á

Információelmélet Szemináriumi gyakorlatok

Az idegrendszeri memória modelljei

Készítette: Fegyverneki Sándor. Miskolci Egyetem, 2002.

Németh Renáta Grafikus modellek kategoriális adatokon társadalomtudományi alkalmazással

Probabilisztikus funkcionális modellek idegrendszeri adatok elemzésére

Funkcionális konnektivitás vizsgálata fmri-adatok alapján

Modellkiválasztás és struktúrák tanulása

Probabilisztikus modellek. Nagy Dávid

Mesterséges Intelligencia. Csató Lehel. Csató Lehel. Matematika-Informatika Tanszék Babeş Bolyai Tudományegyetem, Kolozsvár 2010/2011 1/363

XIII. Bolyai Konferencia Bodnár József Eötvös József Collegium, ELTE TTK, III. matematikus. A véletlen nyomában

Probabilisztikus modellek. Nagy Dávid

5.10. Exponenciális egyenletek A logaritmus függvény Logaritmusos egyenletek A szinusz függvény

Mit lássunk élnek? Hol van az él? Milyen vastag legyen? Hol

Összefoglaló valószínűségszámításból a Gépészmérnök Msc szak hallgatói számára

A médiatechnológia alapjai

Matematika. Specializáció évfolyam

Tartalomjegyzék. Typotex Kiadó III. Tartalomjegyzék

Inferencia valószínűségi modellekben

Helyi tanterv. Batthyány Kázmér Gimnázium Matematika emelt ( óra/hét) 9-12 évfolyam Készült: 2013 február

XII. LABOR - Fuzzy logika

Kódolás, hibajavítás. Tervezte és készítette Géczy LászlL. szló 2002

Általános statisztika II. Kriszt, Éva Varga, Edit Kenyeres, Erika Korpás, Attiláné Csernyák, László

Logika nyelvészeknek, 11. óra A kvantifikáció kezelése a klasszikus és az általánosított kvantifikációelméletben

Matematikai logika. Nagy Károly 2009

Matematikai logika 1 A MATEMATIKAI LOGIKA ALAPJAI. Pécsi Tudományegyetem, Bevezetés

Nemzeti alaptanterv 2012 MATEMATIKA

Dr. Jelasity Márk. Mesterséges Intelligencia I. Előadás Jegyzet (2008. október 6) Készítette: Filkus Dominik Martin

TARTALOM. Ismétlő tesztek ÚTMUTATÁSOK ÉS EREDMÉNYEK...255

Matematikai statisztikai elemzések 1.

Probabilisztikus modellek. Nagy Dávid

Biológiai rendszerek modellellenőrzése bayesi megközelítésben

AZ ÉPÍTÉSI MUNKÁK IDŐTERVEZÉSE

I. Gondolkodási módszerek: (6 óra) 1. Gondolkodási módszerek, a halmazelmélet elemei, a logika elemei. 1. Számfogalom, műveletek (4 óra)

BIZONYTALAN ADATOK KEZELÉSE: FUZZY SZAKÉRTŐI RENDSZEREK

Inferencia. ADOTTAK:! generatív modell: például: DAG + prior(ok) + likelihood(ok) P(X 1,X 2,,X n ) megfigyelések: D = {X i = x i, X j = x j, }

Least Squares becslés

hogy a megismert fogalmakat és tételeket változatos területeken használhatjuk Az adatok, táblázatok, grafikonok értelmezésének megismerése nagyban

Tanulás az idegrendszerben. Structure Dynamics Implementation Algorithm Computation - Function

Információelmélet. Informatikai rendszerek alapjai. Horváth Árpád október 29.

A digitális számítás elmélete

Statisztikus tanulás az idegrendszerben

A matematikai logika alapjai

Contents. 1 Bevezetés 11

Ittfoglalomösszea legfontosabbtudnivalókat, részleteka honlapon, illetvea gyakorlatvezetőtől is kaptok információkat.

Bayesi relevancia és hatáserősség mértékek. PhD tézisfüzet. Hullám Gábor. Dr. Strausz György, PhD (BME)

Probabilisztikus modellek II: Inferencia. Nagy Dávid

HELYI TANTERV MATEMATIKA tanításához Szakközépiskola évfolyam

MATEMATIKA Kiss Árpád Országos Közoktatási Szolgáltató Intézmény Vizsgafejlesztő Központ

Sztojka Miroszláv LINEÁRIS ALGEBRA Egyetemi jegyzet Ungvár 2013

Adatelemzés kommunikációs dosszié ADATELEMZÉS. ANYAGMÉRNŐK NAPPALI MSc KÉPZÉS TANTÁRGYI KOMMUNIKÁCIÓS DOSSZIÉ

Feladatok és megoldások a 6. heti eladshoz

D é n e s T a m á s matematikus-kriptográfus

Online tanulás nemstacionárius Markov döntési folyamatokban

Tantárgyi útmutató. 1. A tantárgy helye a szaki hálóban. 2. A tantárgyi program általános célja. Statisztika 1.

ÖNJAVÍTÓ AGGREGÁLÁS SZENZORHÁLÓZATOKBAN ÉS AGGREGÁTOR NODE VÁLASZTÁS. Schaffer Péter. Tézisfüzet. Konzulens: Buttyán Levente, Ph.D.

KIFEJEZÉSE: A GAMMA KOEFFICIENS. Csapó Benő Szegedi Tudományegyetem, Neveléstudományi Tanszék MTA-SZTE Képességkutató Csoport

Az információelmélet alapjai, biológiai alkalmazások. 1. A logaritmusfüggvény és azonosságai

JOGSZABÁLY. LI. ÉVFOLYAM, 15. SZÁM Ára: 693 Ft JÚNIUS 5. TARTALOM. 1. (1) A rendelet hatálya fenntartótól függetlenül

Mikroökonómia I. ELTE TáTK Közgazdaságtudományi Tanszék. 6. hét PREFERENCIÁK, HASZNOSSÁG 2. RÉSZ

Beadható feladatok december Add meg az alábbi probléma állapottér-reprezentációját!

A hierarchikus adatbázis struktúra jellemzői

Geoinformatika I. (vizsgakérdések)

konfidencia-intervallum Logikai vektorok az R-ben március 14.

MATEMATIKA 5 8. ALAPELVEK, CÉLOK

Halmazok. Halmazelméleti lapfogalmak, hatványhalmaz, halmazm veletek, halmazm veletek azonosságai.

Kulcskompetenciák fejlesztése az 1-4. évfolyamon

Mesterséges Intelligencia (Artificial Intelligence)

Biometria az orvosi gyakorlatban. Regresszió Túlélésanalízis

Valószínűségszámítás

Matematikai statisztikai elemzések 6.

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Matematikai statisztika. Mi a modell? Binomiális eloszlás sűrűségfüggvény. Binomiális eloszlás

Geometriai axiómarendszerek és modellek

Bevezetés a valószínűségszámításba és alkalmazásaiba: példákkal, szimulációkkal

Gyakorló feladatok a Közönséges dierenciálegyenletek kurzushoz

Vári Péter-Rábainé Szabó Annamária-Szepesi Ildikó-Szabó Vilmos-Takács Szabolcs KOMPETENCIAMÉRÉS 2004

Nemzeti versenyek évfolyam

Analízisfeladat-gyűjtemény IV.

A gyakorlatok HF-inak megoldása Az 1. gyakorlat HF-inak megoldása. 1. Tagadások:

Matematika emelt szintû érettségi témakörök Összeállította: Kovácsné Németh Sarolta (gimnáziumi tanár)

Osztályozóvizsga követelményei

Számsorozatok Sorozat fogalma, példák sorozatokra, rekurzív sorozatokra, sorozat megadása Számtani sorozat Mértani sorozat Kamatszámítás

Átírás:

Statisztikai tanulás az idegrendszerben, 2015. Valószínűségi modellek Bányai Mihály banyai.mihaly@wigner.mta.hu http://golab.wigner.mta.hu/people/mihaly-banyai/

Hogyan kezeljük formálisan a bizonytalan tudást? A valószínűségi kalkulus alapelemei Hogyan építsünk és kezeljünk modelleket? Egy eloszlás információtartalma He deals the cards to find the answer The sacred geometry of chance The hidden law of a probable outcome The numbers lead a dance Sting - Shape Of My Heart To understand God's thoughts we must study statistics, for these are the measure of His purpose. Florence Nightingale

Hogyan kezeljük formálisan a bizonytalan tudást? A valószínűségi kalkulus alapelemei Hogyan építsünk és kezeljünk modelleket? Egy eloszlás információtartalma

Tudás reprezentációja Az idegrendszer a környezetéről gyűjtött információkat mentális modellbe tömöríti A mentális modell leírásához formális tudásreprezentációra van szükség A reprezentációnak alkalmasnak kell lennie következtetésre és a környezet generatív modelljeként való használatra (elképzelt helyzetek) Szimbolikus rendszerek (klasszikus MI) rugalmas szintaxis egymásba ágyazható állítások Numerikus / statisztikai rendszerek (machine learning, data science) általánosítási képesség hatékony algoritmusok

Logikai rendszerek Formális nyelvek szintaxis: formai szabályok állítások létrehozására szemantika (igazságérték-szemantika): igaz-e egy állítás? például: elsőrendű logika vagy prédikátumkalkulus a világ objektumainak megfelelő értékű változók, amelyekhez igazságértéket prédikátumfüggvényekkel rendelhetünk jól formalizálhatók vele természetes nyelvi mondatok: Aki nem ismeri Jaynest, meg fog bukni. x: Diák(x) Ismer(x,JAYNES) Nagyobb(vizsgajegy(x),1)

A tudás reprezentációja logikában Axiómák (tudásbázis) - állítások halmaza, amiket szemantikailag igaznak tekintünk Egy állítás tétel (=igaz), ha logikai következménye az axiómáknak, és hamis, ha ellentmondást képez velük azaz helyes következtetési szabály alkalmazásával előállítható belőlük T = {Minden görög tógát hord. Szókratész görög.}, A = {Szókratész tógát hord.} ha egyik sem bizonyítható, nem mondhatunk semmit a logikai rendszeren belül mit mondhatunk intuitíve arról, hogy A = {Kovács Akhilleusz tógát hord.}? Hogyan befolyásolja ezt a tudásbázis bináris tartalma?

Kiterjesztés bizonytalanságra kvantifikáljuk, hogy mennyire tartjuk hihetőnek, hogy egy A állítás tétel egy T tudásbázis mellett, ha nem tudjuk se bizonyítani, se cáfolni: H(A T) Keynes, 1921, Cox, 1961, Jaynes, 2003, Dupré & Tipler, 2009 Kívánságlista valós számmal ábrázoljuk a hihetőséget konzisztencia: ugyanabból a rendelkezésre álló információból mindig ugyanaz a hihetőség jöjjön ki, akárhogy számolunk a változások iránya stimmeljen: ha H(A T ) nő, akkor H(A B T ) is nőjön, H( A T ) pedig csökkenjen Ha egy hihetőségi mérték megfelel ezeknek az elvárásoknak, akkor izomorf a feltételes valószínűségi mértékkel, H(A T) = Pr(A T), amit az összeg- és a szorzatszabály definiál Igazából a fenti feltételek technikailag kiegészítésre szorulnak, ez csak az intuíció

Összegszabály Úgy döntünk, hogy 0 legyen az ellentmondás, 1 a tétel valószínűsége Komplementer állítások valószínűsége egyre összegződik Pr(A T )+Pr( A T )=1 Például változók numerikus értékéről szóló állításokra (A: a=1, T ={}) Pr(a = 1) = X i Pr(a =1 b = i)

Szorzatszabály Pr(A, B T )=Pr(A B,T)Pr(B T ) Feltételes valószínűség definíciója Bayes-tétel Pr(A B) = Pr(B,A) Pr(B) Pr(A B) = Pr(B A)Pr(A) Pr(B)

Kolmogorov-axiómák Kell egy eseményalgebra kell egy mérték, ami az eseményalgebra elemein értelmezhető, ez lesz a valószínűség a valószínűségi mérték pozitív, egyre összegződik a teljes eseménytéren és egymást kölcsönösen kizáró események uniójának valószínűsége additív feltételes valószínűség definícióját fel kell venni axiómának Ekvivalens a logikai bevezetéssel

Valószínűség értelmezései Gyakoriság-alapú (frekventista) a valószínűség csak ismételt kísérletekben értelmezhető, az adott kimenetel összes próbálkozáson belüli relatív frekvenciájaként Információ-alapú (Bayesian, Laplacian) a valószínűség nem a vizsgált jelenség tulajdonsága, hanem arra jellemző, hogy egy megfigyelő milyen információkkal rendelkezik róla Szubjektív (de Finetti) a valószínűség egyéni hiedelmeket reprezentál Logikai (objektív)

Hogyan kezeljük formálisan a bizonytalan tudást? A valószínűségi kalkulus alapelemei Hogyan építsünk és kezeljünk modelleket? Egy eloszlás információtartalma

Diszkrét és folytonos valószínűségi változók Foglaljuk össze minden lehetséges érték valószínűségét egy függvényben Diszrét értékkészletű változók egyszerűen megadjuk az összes értéket valószínűségi tömegfüggvény (pr. mass function) Folytonos értékkészletű változók minden konkrét érték valószínűsége nulla intervallumoknak van pozitív valószínűsége sűrűségfüggvény (pr. density function) Pr(a <x<b)=

Együttes eloszlások valváltozó függvényének várható értéke: integrál a változó eloszlása szerint marginalizáció: f(.)=1 várható értéke a változók egy része szerint E(f(x)) = p(x) = Z 1 Z 1 1 1 f(x)p(x)dx p(x, y)dy kondicionálás: a változók egy részének fixáljuk az értékét megszabadulás a feltételben lévő változótól: a feltételes eloszlás várható értéke a kérdéses változó eloszlása szerint p(x z) = p(x z) = Z 1 Z 1 1 1 p(x, y z)dy p(x y, z)p(y z)dy

Mindent p-vel jelölünk Az események valószínűségét én itt most Pr-rel Az összes különböző eloszlásfüggvény és sűrűségfüggvényt p(x), p(y), p(x,y), p(x y), p(y x), igazából ezek teljesen különböző függvények, sokszor más az értelmezési tartományuk is Nagyon elvetemült emberek még mindenféle paramétereket is P-érték

Bayes-tétel sűrűségfüggvényekre likelihood prior posterior p(x y, z) = p(y x, z)p(x z) p(y z) evidence vagy marginal likelihood p(y z) = Z 1 1 p(y x, z)p(x z)dx

Függetlenség x?y p(x, y) =p(x)p(y) feltételes függetlenség x?y z p(x, y z) =p(x z)p(y z) nem implikálja egymást a marginális és feltételes függetlenség mikor ekvivalens a függetlenség azzal, hogy két valváltozó korrelációja nulla?

Parametrikus eloszláscsaládok Diszkrét értékű Bernoulli: pénzfeldobás - érme aszimmetriája - p(x) = Ber(x;β) multinomiális: kockadobás - cinkelés - Mult(x;β 1..β k-1 ) Folytonos értékű egyenletes - minimum, maximum - U(x;α,β) Gauss (normál): szimmetrikus - átlag, szórás (kovarianciamátrix) - N(x;μ,C) Gamma: pozitív - alak, skála - Gam(x;k,θ)

Hogyan kezeljük formálisan a bizonytalan tudást? A valószínűségi kalkulus alapelemei Hogyan építsünk és kezeljünk modelleket? Egy eloszlás információtartalma

Valószínűségi modell n - teszt nehézsége q - diák IQ-ja Együttes eloszlás faktorizációja f - felvételi pontszám s - teszten elért pontszám j - kapott jegy p(n, q, f, s, j) =p(n q, f, s, j)p(q f,s,j)p(f s, j)p(s j)p(j) p(n, q, f, s, j) =p(j n, q, f, s)p(s n, q, f)p(f n, q)p(n q)p(q) Függetlenség a változók között n?{q, f} s?f q j?{n, q, f} s p(n, q, f, s, j) =p(n s, j)p(q f,s)p(f s)p(s j)p(j) p(n, q, f, s, j) =p(j s)p(s n, q)p(f q)p(n)p(q)

Jelölés gráfokkal n - teszt nehézsége q - diák IQ-ja f - felvételi pontszám p(n, q, f, s, j) =p(j s)p(s n, q)p(f q)p(n)p(q) s - teszten elért pontszám j - kapott jegy Directed Acyclic Graph A faktorizációban szereplő n q n?{q, f} feltételes és marginális eloszlásokat kell megadni a s f s?f q modell teljes leírásához j j?{n, q, f} s Kauzalitás nincs

Megfigyelt és rejtett változók bizonyos változókról rendelkezünk adatokkal jelölés: sötét kör a többi csak a jelenség struktúrájáról alkotott feltételezéseinket reprezentálja μq látens, rejtett változók: üres kör n q Cq a prediktív eloszlás: a megfigyelt változók marginális eloszlása eloszláscsaládok determinisztikus paraméterei ugyanolyanok, mint a látens változók, csak nincs eloszlásuk, hanem egyetlen értékük eloszlások feltételében jelenhetnek csak meg kör nélküli betű s j f p(q) =N (q; µ q,c q )

Függetlenség grafikus modellben n - teszt nehézsége q - diák IQ-ja f - felvételi pontszám Egy változó megfigyelése megváltoztathatja más változók függetlenségét mivel a feltételes függetlenség nem ugyanaz, mint a marginális Explaining away: egy konkrét pontszám mellett, ha tudjuk, hogy a teszt nagyon nehéz volt, megnő a valószínűsége a magas IQ-nak Markov-takaró: azon változók halmaza, amelyekre kondicionálva az összes többitől független a csúcs s - teszten elért pontszám j - kapott jegy n q s f j minden megfigyeltségi állapot mellett szülők, gyerekek, házastársak

Valószínűségi hatás terjedése z-től x felé: z z z z z z y y y x z x x x x x x z x y z z nincs hatásterjedés z y y y x z x x x z x y

Minden eloszláshoz van gráf? Nem, tanulópárok problémája pl Ahol körkörös szimmetria van, ott a A B C D DAG felírásánál mindig ráerőltetünk egy irányítást, így nem lesz tökéletes a leképezés, elvesznek függetlenségi viszonyok A B D C Léteznek más, nem-dag grafikus nevezéktanok A?C {B,D}

Valószínűségi modellek az idegrendszerben vizuális rendszer működésének megértéséhez használhatók generatív képmodellek a kép pixelei egyszerű grafikai elemeket reprezentáló feature-vektorok lineáris kombinációja, plusz megfigyelési zaj a feature-ök koefficiensei a rejtett változók, a pixelek a megfigyeltek percepció mint következtetés a modell rejtett változóira a rejtett változók prediktálhatják neuronok elektromos aktivitását vizuális szabályosságok tanulása a modell építése 1 2 N First-order statistics (pixel histograms) u x p(x u) =N (x; f 1 u 1 + + f N u N, I) p(u) =?

Szintetikus adatok generálása Plate: ha egy változóból N darab i.i.d. példány van véletlenszámgenerálás feltételezzük, hogy van egyenletes eloszlású pszeudorandom számokat előállító algoritmusunk az egyenletes eloszlású véletlenszámokat transzformáljuk a kvánt eloszlásra ancestral sampling először a szülő nélküli változók prior (marginális ) eloszlásából veszünk mintát a fán lefelé lépkedve a feltételes eloszlásokból tudunk mintát venni minden változónak a marginális eloszlásából lesznek mintáink, így a prediktív eloszlásból is az álom funkciója, Crick & Mitchinson, 1983 y x N

Modellek építése Megfigyelés Modell Szintetikus adat μ C x N p(x) =N (x; µ, C) r z x N C1,2 μ1,2 p(x z) =N (x; µ z,c z ) p(z) =Mult(z; r) z=1, z=2

Hogyan kezeljük formálisan a bizonytalan tudást? A valószínűségi kalkulus alapelemei Hogyan építsünk és kezeljünk modelleket? Egy eloszlás információtartalma

Eloszlások információelméleti leírása Mennyire meglepő egy adott megfigyelés? I(x) = log p(x) mértékegység a bit vagy a nat a logaritmus bázisától függően Mennyi információt tartalmaz egy eloszlás az adott mennyiségről? H(x) = X i p(x i )I(x i ) Magas entrópia - keveset tudunk arról, hogy mik a jellemző értékek Alacsony entrópia - vannak jellemző régiók az értékkészletben

Maximális entrópiájú eloszlások A cél, hogy minimális pluszfeltételezést tegyünk a modellünkbe a matematikai formalizmus kedvéért a valószínűség logikai értelmezéséből adódik, hogy pontosan azokat az információkat szeretnénk reprezentálni az eloszlásunkkal, amik a tudásbázisunkban vannak, és lehetőleg semmi mást Különböző ismert tulajdonságok mellett különböző formájú eloszlások maximalizálják az entrópiát ha csak azt a véges intervallumot ismerjük, ahol pozitívak a valószínűségek egyenletes ha ismerjük az átlagot és a szórást, és a valós számokon van értelmezve az eloszlás Gauss

Sűrűségfüggvények távolsága Szeretnénk összehasonlítani a modelljeinket a megfigyelésekkel és egymással is a kérdés, hogy egy modell prediktív eloszlása mennyire különbözik a tapasztalati vagy a másik modell által leírt prediktív eloszlástól definiáljuk távolságmértéket eloszlások között azon keresztül, hogy ha p(x) eloszlást p (x) segítségével közelítjük, mennyi információt veszítünk el Kullback-Leibler divergencia D KL (p(x) p 0 (x)) = X i p(x i )ln p(x i) p 0 (x i ) Szimmetrizálással metrikát is képezhetünk: Jensen-Shannon metrika

Ajánlott források C. M. Bishop: Pattern Recognition and Machine learning, fejezetek: 2,8 D. Koller: Probabilistic Graphical Models, online kurzus E. T. Jaynes: Probability Theory, the Logic of Science

Házi feladat Készíts generatív valószínűségi modellt, ami autógyártók éves bevételének a predikciójára használható válaszd ki a fontos változókat a változók közötti függetlenségi viszonyok alapján rajzolj grafikus modellt válassz diszkrét vagy folytonos eloszlásokat a szükséges marginálisok és kondicionálisok formájául gondolkodj el rajta, hogy mik azok a feltételezések, amiket beleépítettél a modellbe, de sejthetően nem egyeznek a valósággal