Biológiai rendszerek modellellenőrzése bayesi megközelítésben

Hasonló dokumentumok
Valószínűségi modellellenőrzés Markov döntési folyamatokkal

Least Squares becslés

A maximum likelihood becslésről

Sztochasztikus temporális logikák

Rendszermodellezés. Modellellenőrzés. Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs Rendszerek Tanszék

Probabilisztikus modellek II: Inferencia. Nagy Dávid

ALGORITMUSOK ÉS BONYOLULTSÁGELMÉLET Matematika MSc hallgatók számára. 11. Előadás

STATISZTIKA. Egymintás u-próba. H 0 : Kefir zsírtartalma 3% Próbafüggvény, alfa=0,05. Egymintás u-próba vagy z-próba

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1

Matematikai statisztika c. tárgy oktatásának célja és tematikája

Valószínűségi modellek

Valószínűségszámítás összefoglaló

Mesterséges Intelligencia MI

Mesterséges Intelligencia I.

Véletlenszám generátorok és tesztelésük HORVÁTH BÁLINT

Az idegrendszeri memória modelljei

x, x R, x rögzített esetén esemény. : ( ) x Valószínűségi Változó: Feltételes valószínűség: Teljes valószínűség Tétele: Bayes Tétel:

Mesterséges Intelligencia. Csató Lehel. Csató Lehel. Matematika-Informatika Tanszék Babeş Bolyai Tudományegyetem, Kolozsvár 2010/2011 1/363

Kettőnél több csoport vizsgálata. Makara B. Gábor MTA Kísérleti Orvostudományi Kutatóintézet

Bizonytalan tudás kezelése

Loss Distribution Approach

Gépi tanulás. Hány tanítómintára van szükség? VKH. Pataki Béla (Bolgár Bence)

e (t µ) 2 f (t) = 1 F (t) = 1 Normális eloszlás negyedik centrális momentuma:

Alap-ötlet: Karl Friedrich Gauss ( ) valószínűségszámítási háttér: Andrej Markov ( )

Intervenciós röntgen berendezés teljesítményszabályozójának automatizált tesztelése

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Szoftver-modellellenőrzés absztrakciós módszerekkel

Válogatott fejezetek a közlekedésgazdaságtanból

Statisztika I. 8. előadás. Előadó: Dr. Ertsey Imre

Hipotéziselmélet - paraméteres próbák. eloszlások. Matematikai statisztika Gazdaságinformatikus MSc szeptember 10. 1/58

Többváltozós lineáris regressziós modell feltételeinek

Kvantitatív módszerek

Elemi statisztika. >> =weiszd= << december 20. Szerintem nincs sok szükségünk erre... [visszajelzés esetén azt is belerakom] x x = n

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Bizonytalanság. Mesterséges intelligencia április 4.

Kauzális modellek. Randall Munroe

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Sztochasztikus folyamatok alapfogalmak

A Statisztika alapjai

A modellellenőrzés érdekes alkalmazása: Tesztgenerálás modellellenőrzővel

Területi sor Kárpát medence Magyarország Nyugat-Európa

Specifikáció. B logikai formula, a bemeneti feltétel, K logikai formula, a kimeneti feltétel, A az algoritmus, amelyre az állítás vonatkozik.

Matematikai alapok és valószínőségszámítás. Valószínőségi eloszlások Binomiális eloszlás

STATISZTIKA. A maradék független a kezelés és blokk hatástól. Maradékok leíró statisztikája. 4. A modell érvényességének ellenőrzése

BAGME11NNF Munkavédelmi mérnökasszisztens Galla Jánosné, 2011.

Megerősítéses tanulás

földtudományi BSc (geológus szakirány) Matematikai statisztika elıadás, 2014/ félév 6. elıadás

Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

Miskolci Egyetem Gépészmérnöki és Informatikai Kar Informatikai Intézet Alkalmazott Informatikai Intézeti Tanszék

Mesterséges intelligencia, 7. előadás október 13. Készítette: Masa Tibor (KPM V.)

Hidden Markov Model. March 12, 2013

Mesterséges Intelligencia MI

Bayesi relevancia és hatáserősség mértékek. PhD tézisfüzet. Hullám Gábor. Dr. Strausz György, PhD (BME)

biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás

Mesterséges Intelligencia MI

Bizonytalanságok melletti következtetés

Specifikáció. B logikai formula, a bemeneti feltétel, K logikai formula, a kimeneti feltétel, A az algoritmus, amelyre az állítás vonatkozik.

y ij = µ + α i + e ij

Osztályozás, regresszió. Nagyméretű adathalmazok kezelése Tatai Márton

A modellellenőrzés érdekes alkalmazása: Tesztgenerálás modellellenőrzővel

Az első számjegyek Benford törvénye

IBNR számítási módszerek áttekintése

Probabilisztikus funkcionális modellek idegrendszeri adatok elemzésére

Inferencia valószínűségi modellekben

Algoritmusok helyességének bizonyítása. A Floyd-módszer

Megoldások. ξ jelölje az első meghibásodásig eltelt időt. Akkor ξ N(6, 4; 2, 3) normális eloszlású P (ξ

Funkcionális konnektivitás vizsgálata fmri adatok alapján

Mesterséges Intelligencia. Csató Lehel. Csató Lehel. Matematika-Informatika Tanszék Babeş Bolyai Tudományegyetem, Kolozsvár 2010/2011 1/363

Társadalmi és gazdasági hálózatok modellezése

Mi az adat? Az adat elemi ismeret. Az adatokból információkat

Csapadékmaximum-függvények változása

Túlélés elemzés október 27.

Diszkrét idejű felújítási paradoxon

Valószínűségi változók. Várható érték és szórás

[Biomatematika 2] Orvosi biometria

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió

Markov-láncok stacionárius eloszlása

K oz ep ert ek es variancia azonoss ag anak pr ob ai: t-pr oba, F -pr oba m arcius 21.

Matematika A3 Valószínűségszámítás, 6. gyakorlat 2013/14. tavaszi félév

Információs rendszerek elméleti alapjai. Információelmélet

1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása

Statisztika Elıadások letölthetık a címrıl

Dinamikus rendszerek paramétereinek BAYES BECSLÉSE. Hangos Katalin VE Számítástudomány Alkalmazása Tanszék

Statisztikai módszerek a skálafüggetlen hálózatok

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Matematikai statisztika. Mi a modell? Binomiális eloszlás sűrűségfüggvény. Binomiális eloszlás

Korlátos modellellenőrzés. dr. Majzik István BME Méréstechnika és Információs Rendszerek Tanszék

Készítette: Fegyverneki Sándor

Asszociációs szabályok

Intelligens Rendszerek Elmélete. Párhuzamos keresés genetikus algoritmusokkal

V. Bizonytalanságkezelés

Sztochasztikus Petri-hálók

Balogh János gépészmérnök, műszaki menedzser MSc., vezető programkoordinációs szakértő 1

Kettőnél több csoport vizsgálata. Makara B. Gábor

Statisztika elméleti összefoglaló

Teszt generálás webes alkalmazásokhoz

: az i -ik esélyhányados, i = 2, 3,..I

Követelmények formalizálása: Temporális logikák. dr. Majzik István BME Méréstechnika és Információs Rendszerek Tanszék

Lineáris regressziós modellek 1

[Biomatematika 2] Orvosi biometria

A vérképző rendszerben ionizáló sugárzás által okozott mutációk kialakulásának numerikus modellezése

Átírás:

Biológiai rendszerek modellellenőrzése bayesi megközelítésben Gál Tamás Zoltán Szoftver verifikáció és validáció kiselőadás, 2013. ősz Forrás: Sumit K. Jha et al.: A Bayesian Approach to Model Checking Biological Systems

Biológiai folyamatok Sejtalkotók közötti kölcsönhatások Molekulák, fehérjék, gének, Tudományterület: rendszerbiológia Példa: (nem csak) fibroblaszt növekedési faktorok (Fibroblast Growth Factor) Fibroblaszt: kollagén kibocsátás, kötőszövet alkotója (extracelluláris mátrix) Osztódás (+differenciálódás, túlélés, migráció, stb.) elősegítése

FGF Embrionális fejlődés Érképződés Csont-, és porcképződés Sebgyógyulás Forrás: http://thenode.biologists.com/tag/fgf/

Modellezés Szeretnénk Okokat feltárni, ellenőrizni, jósolni Kérdések: (Mennyi idő alatt gyógyul be a seb?) Nagyobb lesz-e 0,5-nél a valószínűsége annak, hogy Grb2 20 időegységen belül hozzákapcsolódik FRS2-höz?

FGF PRISM modellje Forrás: J. Heath et al.: Probabilistic model checking of complex biological pathways, Theoretical Computer Science 391 (2008) 239 257

Milyen modell? Determinisztikus: biológiai folyamatok nem ilyenek Sztochasztikus: Probabilistic Model Checking (PMC)

PMC probléma M: sztochasztikus modell adott S: állapotok halmaza adott s 0 : kezdőállapot adott Φ: temporális logikai kifejezés vizsgált tulajdonság Θ [0,1]: valószínűségi határérték elfogadás e fölött M, s 0 P Θ (Φ)?

Temporális logika M, s 0 P Θ (Φ)? BLTL: Bounded Linear Temporal Logic SV: modell állapotváltozóinak halmaza Relációkifejezés: x~v: ~,, = ; x SV; v R R.kif.-ek között:,, Temporális operátorok: U t, F t,g t Φ: BLTL-lel megfogalmazott formula Bejárás (M egy futtatása): σ = (s 0, t 0 ), (s 1, t 1 ), Erre értelmezhető: σ Φ?

PBLTL M, s 0 P Θ (Φ)? Ha veszünk egy bejárást, erre már meg lehet kérdezni, hogy σ Φ? PBLTL: egy P Θ (Φ) formula, amely akkor igaz, ha a fenti kérdés bekövetkezésének a valószínűsége nagyobb, vagy egyenlő, mint Θ Innentől vizsgálható, hogy M kielégíti-e ezt a formulát

Milyen modell? Numerikus, egzakt: kis rendszerekre alkalmas csak Közelítő Valószínűségek becslése Hipotézis tesztelés PMC

Hipotézis tesztelés Kérdés: M, s 0 P Θ (Φ)? Hipotézisek: H 0 : P Θ (Φ) H 1 : P <Θ (Φ) Itt csak azt kell eldönteni, hogy a két hipotézis közül melyik valószínűbb Hatékonyabb a becslésnél, ha Θ lényegesen különbözik a valódi (ismeretlen) küszöbértéktől (p)

Hipotézis tesztelős PMC-k 1. Wald SPRT módszere frekventista szemlélet Θ 0 < Θ 1 2. PRISM: fix mintaszám #σ SAT / #σ 3. bayesi H 0 Θ 0 i=1 kevesebb mintaadatot igényel a priori tudással feljavítható k p1 (X i ) p 0 (X i ) Θ 1 H 1

Bayes-féle megközelítés Legyen p "σ Φ? " valószínűsége. (Ismeretlen!) Ekkor a PMC probléma: H 0 : p Φ H 1 : p Φ σ i : Több független, azonos eloszlású bejárás X i = 1, ha σ i Φ, amúgy pedig X i = 0 p-ről lehet a priori tudásunk, amelyet g( ) prior eloszlás határoz meg

Bayes-féle megközelítés Adottak X 1,, X n bejárási kimenetek, ezek halmaza legyen d. prior 1 posterior P H 0 d = P(d H 0)P(H 0 ) P(d) prior 2 Modell ok Futtatások okozatok

Bayes-féle megközelítés Ily módon kifejezzük H 0 és H 1 posterior értékeit, elosztva őket egymással kapjuk: P H 0 d P H 1 d = P(d H 0)P(H 0 ) P(d H 1 )P(H 1 ) = B P(H 0) P(H 1 ) B: Bayes-faktor -> H 0 és H 1 posteriorok közötti relatív konfidencia mértéke (fix priorok mellett)

Bayes-féle megközelítés T: szabadon választott küszöb (Jeffreys: T := 100, mi: T:=10000) Döntés: B > T --> H 0, B < 1/T --> H 1 Bayes-faktor a mintaadatokból (d) kiszámítható, a hipotézis modellek prior értékének felhasználásával

Bayes-faktor d = (X 1,, X n ) bejárás-megfigyelések Együttes eloszlás sűrűségfüggvénye: f(d ) i.i.d. f d = f X 1 f X n Prior eloszlás sűrűségfüggvénye: g B = P(X 1 1,, X n H 0 ) f X1 P(X 1,, X n H 1 ) = Θ u f X n u g u du Θ f X1 u f X n u g u du 0

Algoritmus n := 0 //eddigi bejárások száma x := 0 //Φ-t kielégítő eddigi bejárások repeat σ := futtass_egy_bejarast(m) n++ σ.satisfies(φ)? x++ : pass B := Bayes_faktor(n,x) until (B>T or B<1/T) B>T? return H0_accepted : return H1_accepted

Kiegészítések Tétel 1: Az algoritmus 1 valószínűséggel véget ér ún. Béta-priorokkal és i.i.d. bejárásokkal Tétel 2: A hibázás valószínűsége elég kicsi (nem rosszabb korábbi módszerekénél) Bármilyen prior közelíthető Béta-priorokkal Nem nagy baj, ha rossz (nem informatív, félrevezető) a prior, az algoritmus akkor is lefut, csak több lépésben, és kevésbé éles

Példa: FGF modell Nagyobb lesz-e 0,5-nél a valószínűsége annak, hogy Grb2 20 időegységen belül hozzákapcsolódik FRS2-höz? H 0 : M P Θ [F 20 FRS2 GRB2 > 0 ] T = 10000; egzakt módszer nem működik

Thomas Bayes (1701-1761) Köszönöm a figyelmet!