Probabilisztikus modellek Nagy Dávid Statisztikai tanulás az idegrendszerben, 2016
valószínűségi kalkulus
jelölések
jelölések valószínűségi változók megfázás köhögés valószínűség 1 0 0.01 1 1 0.04 0 0 0.855 0 1 0.095 valószínűségi változók lehetséges értékei
jelölések M K P 1 0 0.01 1 1 0.04 0 0 0.855 0 1 0.095
jelölések M K P m k 0.01 m k 0.04 m k 0.855 m k 0.095
jelölések M K P m k 0.01 m k 0.04 m k 0.855 m k 0.095 P (m ^ k) =P (m, k) = 0.04 P (M,K) =
jelölések M K P P (M,K) = m k 0.01 m k 0.04 m k 0.855 m k 0.095 P (m ^ k) =P (m, k) = 0.04 P (M = m, K = k) =P (m, k) 6= P (M,K)
M K P m k 0.01 m k 0.04 m k 0.855 m k 0.095
P (M,K) m k m k m k m k
P (M,K) probability mass function az igazságtáblázatot függvényként reprezentáljuk m k m k m k m k
valószínűségszámítás ö összegszabály s szorzatszabály
összegszabály P (k) =P (k, m)+p (k, m) P( köhögök ) P( köhögök és meg vagyok fázva ) vagy P( köhögök és nem vagyok megfázva ) P (x) = X y 0 2Y P (x, y 0 ) marginális valószínűség, vagy -szabály
összegszabály M K P m k 0.01 m k 0.04 m k 0.855 m k 0.095 M P m 0.05 m 0.95
szorzatszabály P (m, k) =P (m)p (k m) P( meg vagyok fázva és köhögök ) P( meg vagyok fázva ) és P( köhögök ha meg vagyok fázva ) P (x, y) =P (x y)p (y) lánc-szabály, és -szabály
szorzatszabály P (m, k) = P (m))p (k m)
szorzatszabály P (m, k) P (m) = )P P (k m)
szorzatszabály P (m, k) P (m) = )P P (k m)
szorzatszabály P (m, k) P (m) = )P P (k m) M K P m k 0.01 m k 0.04 m k 0.855 m k 0.095 } X P ( ) =1 P (m, k)+p (m, k) const =1 const = P (m)
valószínűségszámítás P (X, Y ) probabilisztikus modell P (x) = X y 0 2Y P (x, y 0 ) P (x, y) =P (x y)p (y) feltételes valószínűség Bayes szabály P (x, y) P (y) P (y x)p (x) P (y) = P (x y) = P (x y)
valószínűségszámítás P (A, B, C, D, E, F, G, H, I) teljes modell P (D, G H, I) = = P (D, G, H, I) P (H, I) P P A,B,C,E,F A,B,C,E,F,D,G (feltételes valószínűség) P (A, B, C, D, E, F, G, H, I) P (A, B, C, D, E, F, G, H, I)
mintavételezés egy adott probabilisztikus modellhez készíthető* mintavételező gép kimenetei (minták) lehetséges világok a lehetséges világok relatív gyakoriságai tartanak a valószínűségeikhez különböző trükökkel lehet mintát venni külön a változókból (marginális eloszlásból) vagy a feltételes eloszlásokból is P (M,K) = M K P m k 0.01 m k 0.04 m k 0.855 m k 0.095 nem fázott meg és nem köhög nem fázott meg és nem köhög nem fázott meg és nem köhög nem fázott meg és köhög nem fázott meg és nem köhög nem fázott meg és nem köhög nem fázott meg és nem köhög nem fázott meg és nem köhög nem fázott meg és nem köhög nem fázott meg és nem köhög
probléma Mi a valószínűsége hogy egy véletlenszerűen választott ember pontosan 1.7 m magas? P (X =1.7) = 0 P (X =1.737894613982395) = 0 pmf(x) x
probléma Mi a valószínűsége hogy egy véletlenszerűen választott ember pontosan 1.7 m magas? P (X =1.7) = 0 P (X =1.737894613982395) = 0 pdf(x) probability density function Z b a pdf(x) dx = P (a <x<b) sűrűségfüggvény 1.5 2 x
mit jelölünk P-vel? Mindent. pmf pdf pdf(x) = X i pmf(x i ) (x x i )
valószínűségszámítás P (X, Y ) probabilisztikus modell P (x) = X y 0 2Y P (x, y 0 ) P (x, y) =P (x y)p (y)
valószínűségszámítás P (X, Y ) probabilisztikus modell P (x) = Z Y P (x, y) dy P (x, y) =P (x y)p (y) X! Z dy y
valószínűségszámítás P (X, Y ) probabilisztikus modell P (x) = Z Y P (x, y) dy P (x, y) =P (x y)p (y) feltételes valószínűség Bayes szabály P (x, y) P (y) P (y x)p (x) P (y) = P (x y) = P (x y)
összefoglalás ismerjük a valószínűségi kalkulus két szabályát, a szorzatszabályt és az összegszabályt tudjuk mit jelent mintákat venni egy eloszlásból ezeket ki tudjuk terjeszteni folytonosan sok értékű változókra a valószínűségszámításban már mindent* tudunk, most már csak kényelmi** fogalmakat vezetünk be * : azért nem mindent, mert ha (a valós számokhoz hasonlóan) más matematikai objektumokra is ki szeretnénk terjeszteni (pl val. változók amelyeknek a lehetséges értékei is valószínűségi eloszlások vagy végtelen sok val. változó), az nem mindig triviális. mértékelmélet ** : néha a kényelmi megoldások teszik lehetővé hogy praktikusan is ki lehessen számolni valamit, ne csak elméletben (exponenciális komplexitás)
függetlenség x? y p(x, y) =p(x)p(y) p(x y) =p(x) ha megtudjuk hogy y, az semmit nem változtat x valószínűségén az előbb 4-est dobtunk. Mit fogunk most dobni? P (d 1 d 2 )P (d 2 )=P (d 1 )P (d 2 ) az előbb 4-es dobtunk, most dobunk mégegyet, mi lesz a kettő összege? P (d 1 + d 2 d 2 )P (d 2 ) 6= P (d 1 + d 2 )P (d 2 )
feltételes függetlenség x? y z p(x, y z) =p(x z)p(y z) p(x y, z) =p(x z) ha már tudjuk hogy z, és megtudjuk hogy y, az semmit nem változtat x valószínűségén a kérdés hogy kapok-e vastapsot a koncert után. Ha tudjuk hogy jól zongorázom az változtat ezen a valószínűségen? z 6? t Ha tudjuk hogy jól sikerült a koncert, akkor számít hogy egyébként általában is jól zongorázom? z? t k a függetlenség és a feltételes függetlenség nem implikálják egymást, erre majd látunk több példát
irányított grafikus modellek
P (X 1,X 2,X 3,X 4 )= =P (X 1 X 2,X 3,X 4 ) P (X 2 X 3,X 4 ) P (X 3 X 4 ) P (X 4 ) X 3? X 4 X 2? X 4 X 3 X 1? X 3,X 4 X 2 = P (X 1 X 2 ) P (X 2 X 3 )P (X 3 )P (X 4 ) X4 X3 X2 P (X 1,X 2,...,X n )= ny i P (X i P arent(x i )) X1
grafikus modellek az eloszlás faktorizálódik a gráf szerint a gráf az eloszlás függetlenségi struktúráját kódolja a függetlenségi relációk leolvashatóak a gráfról hogyan? X4 X3 P (X 1,X 2,X 3,X 4 )= = P (X 1 X 2 ) P (X 2 X 3 )P (X 3 )P (X 4 ) X2 P (X 1,X 2,...,X n )= ny i P (X i P arent(x i )) X1
hatásterjedés Nehéz Intell. ZH pont Felv. pont ZH jegy
hatásterjedés Nehéz Intell. ZH pont Felv. pont tud terjedni hatás? ZH jegy
hatásterjedés Nehéz Intell. ZH pont Felv. pont ZH jegy
hatásterjedés Nehéz Intell. ZH pont Felv. pont tud terjedni hatás? ZH jegy
hatásterjedés Nehéz Intell. ZH pont Felv. pont ZH jegy
hatásterjedés Nehéz Intell. ZH pont Felv. pont tud terjedni hatás? megfigyelt változó ZH jegy
hatásterjedés Nehéz Intell. ZH pont Felv. pont megfigyelt változó ZH jegy
hatásterjedés Nehéz Intell. ZH pont Felv. pont? ZH jegy
hatásterjedés Nehéz Intell. ZH pont Felv. pont ZH jegy
hatásterjedés Nehéz Intell. ZH pont Felv. pont? ZH jegy
hatásterjedés Nehéz Intell. ZH pont Felv. pont ZH jegy
hatásterjedés Nehéz Intell. ZH pont Felv. pont? ZH jegy
hatásterjedés Nehéz Intell. ZH pont Felv. pont ZH jegy
hatásterjedés Nehéz Intell. ZH pont Felv. pont? ZH jegy
hatásterjedés Nehéz Intell. ZH pont Felv. pont ZH jegy
hatásterjedés Nehéz Intell. ZH pont Felv. pont? ZH jegy
hatásterjedés Nehéz Intell. ZH pont Felv. pont ZH jegy
tüdőrák T M megfázás K köhögés
explaining away tüdőrák T M megfázás K köhögés - köhögök, jaj, lehet hogy tüdőrákom van - köhögök, de mondjuk meg is vagyok fázva, tehát talán nincs tüdőrákom
explaining away {T=0,M=1,K=1} T M K T M P(T K,notM) P(T K) K P(T) P(T K,M)
d-szeparáció tétel az előbbi kis gráfokból összekombinálható az összes lehetséges függőségi reláció azt akarjuk leolvasni hogy u és v változók függetlenek-e különböző m megfigyelések mellett u és v között minden lehetséges útra ellenőrizzük hogy blokkolva van-e, feltéve hogy megfigyeljük m-et
v v u v m m m u u u m v d-szeparáció m u v u v m m u v d
v m u nem juthat át hatás
Markov takaró Y 8Y : X? Y MB(X) szülők X gyerekek gyerekek szülei
MB( ) =
MB( ) =
grafikus modell építés µ µ int int P (I) =N (I µ int, int) Nehéz Intell. P (N) =N (N µ, ) Z max ZH pont Felv. pont házi feladat P (Z) = Binomial(Z Z max, I N ) ZH jegy
irányítatlan grafikus modellek
összefoglalás tudjuk mit jelent a függetlenség probabilisztikus modellekben az irányított grafikus modellek az eloszlás függetlenségi struktúráját jelenítik meg a gráf a teljes eloszlás egy faktorizációját adja meg, amelynek segítségével kevesebb számmal is meg lehet adni az eloszlást ezt kihasználva hatékonyabb inferencia algoritmusokat lehet kitalálni a gráfról a függetlenségi relációkat a d-szeparáció tétel alapján le tudjuk olvasni a grafikus modell abban is segít hogy egy intuitívan ismert rendszerből probabilisztikus modellt tudjunk felírni
bayes-i inferencia
mi az amit megfigyelünk? inferencia fotonok becsapódása levegő gyors rezgései hőmérséklet ingadozása bizonyos molekulák mire vagyunk kíváncsiak? milyen tárgyak vannak körülöttem milyen messze kik vannak körülöttem mire gondolnak miért köhögök mik a fizika törvényei
f
f }generatív folyamat
f }generatív folyamat f
f } generatív folyamat inverz inferencia } f -1
P (o h) P (h o)
P (o h) ha ilyen lenne a világ akkor mit figyelnénk meg? P (h o)
P (o h) ha ilyen lenne a világ akkor mit figyelnénk meg? P (h o) ha ezt figyeljük meg akkor milyen a világ?
forward probability generatív irány prediktív irány szimulátor P (o h) ha ilyen lenne a világ akkor mit figyelnénk meg? P (h o) ha ezt figyeljük meg akkor milyen a világ?
forward probability generatív irány prediktív irány szimulátor P (o h) ha ilyen lenne a világ akkor mit figyelnénk meg? inverse probability Bayes-i inferencia modell inverzió P (h o) ha ezt figyeljük meg akkor milyen a világ?
P (o h) P (h o) = P (o h)p (h) P (o)
P (h o) = P (o h)p (h) P (o) } prior
P (h o) = P (o h)p (h) } } likelihood P (o) prior
}posterior P (h o) = P (o h)p (h) } } likelihood P (o) prior
}posterior P (h o) = P (o h)p (h) } } likelihood P (o) prior } evidence
}posterior P (h o) = } } likelihood prior P (o h)p (h) R P (o h)p (h)dh
posterior }prior P (h o) / P (o h)p (h) } } likelihood
megfordítottuk a generatív modellt posterior }prior P (h o) / P (o h)p (h) } } likelihood
megfordítottuk a generatív modellt posterior }prior P (h o) / P (o h)p (h) } } likelihood miért kell a prior?
betegség f tünet f -1 betegség
betegség f miért köhögök? tünet f -1 betegség
miért köhögök? P (illness symptom) / P (symptom illness)p (illness)
miért köhögök? megfázás tüdőrák kéztörés P (illness symptom) / P (symptom illness)p (illness)
megfázás tüdőrák kéztörés P (illness symptom) / P (symptom illness)p (illness) megfázás milyen gyakori a tüdőrák? kéztörés
megfázás tüdőrák kéztörés megfázás tüdőrák kéztörés P (illness symptom) / P (symptom illness)p (illness) megfázás ha tüdőrák kéztörés lenne a betegség attól köhögnék?
megfázás tüdőrák kéztörés megfázás tüdőrák kéztörés megfázás tüdőrák kéztörés P (illness symptom) / P (symptom illness)p (illness) valószínűleg megfáztam
f = b P XY Z Y X
f = b P XY nem injektív Z Y X
f = b P XY nem injektív f 1 nem egyértelmű Z Y X
hipotézis tér: minden lehetséges 3D drótváz
hipotézis tér: minden lehetséges 3D drótváz image data hipotézisek amelyekre magas a prior
hipotézis tér: minden lehetséges 3D drótváz image data hipotézisek amelyekre magas a prior hipotézisek amelyekre nem 0 a likelihood
hipotézis tér: minden lehetséges 3D drótváz image data posterior hipotézisek amelyekre magas a prior hipotézisek amelyekre nem 0 a likelihood
színek
szén v. hó hány foton?
megvilágítás elnyelési görbe (anyag) spektrális eloszlás
megvilágítás elnyelési görbe (anyag) látósejtek érzékenysége spektrális eloszlás 3 szám
megvilágítás elnyelési görbe (anyag) látósejtek érzékenysége spektrális eloszlás 3 szám anyag?
beszédfelismerés
mondatok értelmezése
történet 1 Egy férfi bement egy étterembe és rendelt egy hamburgert. Mikor a hamburgert kihozták, látta hogy szénné van égve. A férfi dühösen kirohant anélkül, hogy fizetett vagy borravalót hagyott volna.
történet 1 Egy férfi bement egy étterembe és rendelt egy hamburgert. Mikor a hamburgert kihozták, látta hogy szénné van égve. A férfi dühösen kirohant anélkül, hogy fizetett vagy borravalót hagyott volna. történet 2 Egy férfi bement egy étterembe és rendelt egy hamburgert. Mikor a hamburgert kihozták, nagyon elégedett volt vele és mielőtt elhagyta az éttermet nagy borravalót hagyott a pincérnek.
történet 1 Egy férfi bement egy étterembe és rendelt egy hamburgert. Mikor a hamburgert kihozták, látta hogy szénné van égve. A férfi dühösen kirohant anélkül, hogy fizetett vagy borravalót hagyott volna. történet 2 Egy férfi bement egy étterembe és rendelt egy hamburgert. Mikor a hamburgert kihozták, nagyon elégedett volt vele és mielőtt elhagyta az éttermet nagy borravalót hagyott a pincérnek. Megette a férfi a hamburgert?
- Elnézést, kártyával lehet fizetni? - Persze
- Elnézést, kártyával lehet fizetni? - Persze - Egy ászból és királyból tud visszaadni?
- Elnézést, kártyával lehet fizetni? - Persze - Egy ászból és királyból tud visszaadni? humor = téves inferencia felfedezése?
aszimptotikus bizonyosság a paraméter posterior végtelen adat esetén a valódi paraméterérték körüli delta eloszláshoz konvergál
aszimptotikus konszenzus a különböző priorokból induló posteriorok közötti különbség az adat növekedésével eltűnik
összefoglalás ami érdekel az általában közvetlenül nem megfigyelhető a rejtett állapotok kikövetkeztetésében segít a tapasztalatokat generáló folyamat ismerete ennek megfordítása a likelihood: melyek azok a rejtett állapotok amelyek összeegyeztethetőek a megfigyelésekkel? de ez még nem elég, kell prior is hogy feloldja az empirikus aluldetermináltság problémáját a kettő szorzata a posterior, ami megadja jelenlegi tudásunkat a nem megfigyelt változók értékeinek plauzibilitásáról
közelítő inferencia az adat és egy adott hipotézistér mellett a posterior eloszlások a legtöbb amit tudunk mondani viszont ezt sokszor nehéz vagy lehetetlen egzaktul kiszámolni, ezért közelítésekre kényszerülünk pontbecslések sztochasztikus közelítő módszerek mintavételezés aszimptotikusan (végtelen sok ideig futtatva) egzaktak determinisztikus közelítő módszerek pl: variációs Bayes nem kell végtelen sok idő, de sosem egzakt eredmény
pontbecslések eloszlás egy szám
MAP becslés posterior * 0.7 * 0.5
várható érték E[X] = Z X xp(x) dx
variancia Var[X] =E[(X E[X]) 2 ]
kovariancia Cov[X, Y ]=E[(X E[X])(Y E[Y ])]
korreláció Corr[X, Y ]= Cov[X, Y ] Var[X] Var[Y ]
házi feladat Készíts generatív valószínűségi modellt, ami autógyártók éves bevételének jóslására használható válaszd ki a fontos változókat a változók közötti függetlenségi viszonyok alapján rajzolj grafikus modellt válassz diszkrét vagy folytonos eloszlásokat a szükséges marginálisok és kondicionálisok formájául (https:// en.wikipedia.org/wiki/list_of_probability_distributions) gondolkodj el rajta, hogy mik azok a feltételezések, amiket beleépítettél a modellbe, de sejthetően nem egyeznek a valósággal