Biotechnológia és bioinformatika formai ajánlások
|
|
- Marcell Tóth
- 6 évvel ezelőtt
- Látták:
Átírás
1 Biotechnológia és bioinformatika formai ajánlások
2 Sorozatoldal
3 Címoldal
4 Copyright-oldal szerző(k) lektor kulcsszó 10 soros összefoglaló
5 Tartalomjegyzék 0.1. Szekvenciális döntési folyamatok Optimális döntés Szekvenciális döntés Az információ értéke Megállási feladatok Titkárnő probléma A Googol játék Odds algoritmus Az odds algoritmus egy folytonos kiterjesztése Többkarú rabló feladatok Alkalmazási területek Az optimális megoldás, előrefele következtetés Gittins index Szekvenciális döntési folyamatok Optimális döntés Egy döntési helyzetben tipikus feladat a rendelkezésre álló információ alapján egy, vagy több kritériumnak megfelelően a legjobb lehetőség kiválasztása a felmerülő opciók közül. Ilyen egyszerű helyzet lehet egy üdülés célpontjának kiválasztása, miközben adott a költségkeret vagy a kiindulási hely, és vannak bizonyos preferenciáink (például tengerpart, pálmafák). Egy döntéselméleti helyzet leírásához definiálni kell egy rendszer állapotait (s S, states), az egyes állapotokban elérhető lépéseket (a A, actions), és meg kell határozni az egyes állapotok hasznosságát (U(s), utility). Egyes állapotokból a megfelelő lépés kiválasztásával lehetséges az átlépés más állapotokba. A hasznosságfüggvény az állapotok felett definiált valós függvény, amely teljesíti a racionális döntéshozóra vonatkozó hasznossági axiómákat. A hasznosságfüggvény valós függvény, ezért az axiómák többségét a definícióból fakadóan kielégíti. Ezek az axiómák a sorrendezhetőség, a tranzitivitás, a folytonosság, a monotonitás. A döntéselméleti helyzeteket sztohasztikus jellegük miatt szokás szerencsejátéknak is nevez. A szerencsejátékokra vonatkozó további axiómák a következőek:
6 6 A mű címe Helyettesíthetőség - Ha egy olyan szerencsejátékot játszunk, amelyben p valószínűséggel az egyik, 1 p valószínűséggel a másik állapotba jutunk, és van két állapot, melynek hasznossága azonos (s i, s j ), akkor azok a szerencsejátékban felcserélhetőek: U(s i ) = U(s j ) p[p, s i ; 1 p, s k ] [p, s j ; 1 p, s k ]. Felbonthatóság Ha egy olyan összetett szerencsejátékot játszunk, amelyben az első szerencsejáték egyik kimenete egy másik szerencsejáték, akkor az ekvivalens egy három kimenetű összetett szerencsejátékkal, függetlenül az állapotok hasznosságától, illetve p és q értékétől: [p, s i ; 1 p, [q, s j ; 1 q, s k ]] [p, s i ; (1 p)q, s j ; (1 p)(1 q), s k ] Legegyszerűbb esetben a lépések eredménye determinisztikus (1 ábra), így az optimális döntés minden s állapotban az az a lépés, amely az elérhető legnagyobb hasznosságú állapothoz vezet (1 egyenlet). U(a s) = max a A U(a s). (1) Abban az esetben viszont, amikor a rendszer valamilyen bizonytalanságot tartalmaz, a lépések kimenetele nemdeterminisztikus (1 ábra), így egy eloszlást definiálhatunk a lépések kimenete felett: s i állapotban, a lépés mellett annak valószínűsége, hogy s j állapotba jutunk P (s j a, s i ). 1. ábra. Bal oldal: Determinisztikus döntési helyzetben a i választása mellett s i állapotba jutunk. Jobb oldal: Nemdeterminisztikus döntési helyzetben a választása mellett P (s i a, s) valószínűséggel s i állapotba jutunk. A racionális döntéshozóra vonatkozó axiómákból következik, hogy nemdeterminisztikus esetben az optimális döntés mindig azt az a lépést jelenti, amely maximalizálja a várható hasznosságot (maximal expected utility, MEU): MEU(a s). = max a A EU(a s) = max a A U(s i )P (s i a, s), s S. (2) s i S
7 Tartalomjegyzék Szekvenciális döntés Az előző fejezetben az egylépéses(myopic) esetet vizsgáltuk, bizonyos esetekben azonban előfordulhatnak szekvenciális döntési helyzetek (2 ábra). Például egy körutazás esetén minden érintett helyhez rendelhetünk hasznosságot, a pillanatnyi tartózkodási helytől pedig függ a másnap elérhető helyek halmaza. A bizonytalanságot a rendszerben a megbízhatatlan idegenvezető jelentheti. Egylépéses esetben egy állapot hasznosságát definíció szerint az U(s) hasznosságfüggvény határozta meg. Szekvenciális esetben azonban egy állapot hasznosságát befolyásolja a belőle elérhető további állapotok hasznossága is. Az egyes állapotokra vonatkozó U(s) hasznosságfüggvények felhasználásával a t diszkrét időpontban s állapot hasznossága rekurzív képlettel írható le: U t (s) = U(s) + s i S U t+1 (s i )P (s i a, s). (3) Tehát U(s) az a hasznosság, amelyet s meglátogatása ér, U t (s) jelenti azt a hasznosságot, amely figyelembe veszi az s állapotból elérhető teljes döntési gráfot és az abból számolt várhatóértéket. Az egyenlet második tagja egy várhatóérték az s állapotból elérhető állapotok hasznossága felett. A várható maximális hasznosság ennek megfelelően módosul: MEU(a s) = max a A U t (s i )P (s i a, s), s S. (4) s i S 2. ábra. Szekvenciális döntés Feltételezve, hogy minden állapot elérhető minden állapotból, és egy állapotban többször is tartózkodhatunk, a 3 egyenlet számítása n véges lépést feltételezve dinamikus programozással O(n A S ) ideig tart. Az utolsó lépésben egyszerűen adódik, mekkora az egyes állapotok hasznossága (U(s)), majd az n 1 lépésben a hasznosságok már a 3 képlettel kiszámolhatóak, egészen a kezdő lépésig. Természetesen ez a módszer nem alkalmazható végtelen számú lépés esetén.
8 8 A mű címe Végtelen lépésszám esetén (n ) a 4 egyenlet nem alkalmazható, mert a nyelő csomópontoktól eltekintve a maximális várható hasznosság minden állapotra végtelennek adódik. Egy lehetséges megoldás a jövőbeni jutalmak leszámítolt értékével történő számítás, ekkor a jövőbeni jutalom egy 0 < γ 1 együtthatóval megszorzott értékével számolunk: MEU (a s) = max a A γu t (s i )P (s i a, s), s S. (5) s i S Az 5 egyenletet lépésenként kibontva [a 0, a 1,..., a i,...] optimális akciók egy sorozatát hajtjuk végre. Ha feltételezzük, hogy egy állapotból maximum k másik állapotba lehet eljutni, γ < 1, az állapotváltások valószínűségének maximuma P max és az U(s) függvény maximuma U max, akkor a következő kifejezésre jutunk: MEU (a 0, a 1,..., a i,... s) U(s) + γku max P max + γ 2 ku max P max γ i ku max P max +... = U(s) + ku max P max γ i (6) = U(s) + ku maxp max. 1 γ A 6 egyenletből látszik, hogy a γ < 1 feltétel, és a leszámítolt számítás esetén a maximális várható hasznosság felülről becsülhető. i=0 Markov döntési folyamatok Az előzőekben bevezetett döntéselméleti formalizmus meghatározó jellemzője a Markovtulajdonság: annak valószínűsége, hogy a folyamat t időpillanatban s i állapotba kerül, csak a folyamat t 1 időpillanatban felvett s állapottól függ, ha az ismert (P (s i a, s)). Tehát s állapot ismeretében a korábbi állapotok ismerete nem szükséges az állapotátmenetek valószínűségének meghatározásához. A Markov döntési folyamat az eddigiektől kicsit eltérő, azonban azokkal teljesen ekvivalens, szekvenciális döntési folyamatokat leíró igen elterjedt formalizmus. A Markov döntési folyamat definiálja az S 0 kezdőállapotot, a T (s, a, s ) állapotátmenet modellt (transition) és az R(s) jutalomfüggvényt (reward). A T (s, a, s ) állapotátmenet függvény ekvivalens a korábban definiált P (s i a, s) feltételes valószínűséggel, míg az R(s) jutalomfüggvénynek az U(s) hasznosságfüggvény felel meg. Markov döntési folyamatokkal kapcsolatban szokás beszélni az úgynevezett eljárásmódról (policy), mely a döntéshozónak minden állapotra meghatározza, hogy adott állapotban melyik lépést válassza. Optimális eljárásmódnak (optimal policy) nevezzük azt az eljárásmódot, amely a maximális várhatóértékű lépést adja. A korábban bevezetett fogalmakkal az optimális eljárásmód azt jelenti, hogy a döntéshozó minden lépésben az a lépést választja (véges lépésszám esetén a 4, végtelen lépésszám esetén a 6 egyenlet alapján).
9 Tartalomjegyzék Az információ értéke Az előzőekben a szekvenciális döntéseket úgy modelleztük, hogy minden döntési lépés után a rendszer állapotot vált. Azonban sok esetben döntési opció a szekvenciális döntési sorozatból történő kilépés, a megállás. Ebben az esetben természetesen merül fel az igény a jövőben rendelkezésünkre álló adat értékének ismeretére. Ezt írja le a tökéletes információ értéke (value of perfect information, VPI), nagyon hasonlóan a 2 egyenlethez (lásd 3 ábra): MEU(a d) = max a A EU(a d) = max a A U(d i )P (d i a, d), d D, (7) ahol d a rendelkezésre álló adatot jelenti, D minden lehetséges adathalmaz összessége, míg d i az az adat, amelyhez akkor jutunk, ha az a lépést választjuk és ezzel például folytatjuk az adatgyűjtést. A 7 egyenlet valójában csak annyiban tér el a 2 egyenlettől, hogy az s-t a d helyettesíti, vagyis jelenleg a rendszer állapotát (a világról gyűjtött információt) a rendelkezésre álló adattal írjuk le. Fontos megjegyezni, hogy d d i. Ha rendelkezésre állna d i információ, akkor a várható hasznosság a következőképpen alakulna: d i D MEU(a d i ) = max EU(a d i) = max U(d j )P (d j a, d i ), d i D. (8) a A a A d j D 3. ábra. Az információ értéke A 7 és a 8 kifejezések által definiált értékek eltérése adná meg a kívánt mennyiséget, vagyis annak a plusz információnak a hasznosságát, amelyet d i \d ismerete jelent. Azonban d i nem áll rendelkezésünkre, ezért jelölje D a jövőbeli adatot reprezentáló valószínűségi változót, így VPI a MEU jövőbeli várhatóértékének és a MEU-nak a különbsége: [ ] V P I d (D j ) = P (D j = d ij d)meu(a D j,d D j = d ij, d) MEU(a d d), (9) i ahol a d a d adat ismeretében a legjobb döntés (lépés).
10 10 A mű címe A VPI tulajdonságai 1. A V P I nem vehet fel negatív értéket, V P I d (D i ) 0, szemléletesen azért, mert az újonnan megszerzett információtól mindig el lehet tekinteni. A MEU érték maximum képzés eredménye, ezért ha bármely újabb d i információ mellett a MEU kisebb értéket venne fel, a maximum képzés miatt d i -t üres adatnak kell feltételezni, hogy a legjobb eredményt kapjuk. Így a V P I d érték nullának adódik. 2. Könnyen belátható, hogy az információ értéke az adatok beérkezésének sorrendjétől független. Az információ értéke számolható a következőképpen: V P I d (D i, D j ) = V P I d (D i ) + V P I d,di (D j ) = V P I d (D j ) + V P I d,dj (D i ). (10) 3. Nem igaz azonban, hogy az információ értékének képzése additív V P I d (D i, D j ) V P I d (D i ) + V P I d (D j ), hiszen például abban az esetben, ha a D i és D j valószínűségi változók azonos eloszlásúak V P I d (D i, D j ) = V P I d (D i ) = V P I d (D j ). Az információ értékének közelítése több megfigyelés esetén Az információ értékével kapcsolatban eddig egy olyan esetet vizsgáltunk, amikor minden lépést megelőzően egyetlen valószínűségi változó jövőbeli várhatóértékét számítottuk ki. A gyakorlati esetek többségében a VPI számításához a fejezetben tárgyalt egyváltozós módszert használják. Előfordulhat azonban olyan eset, amikor a döntési lépést megelőzően több valószínűségi változó értékét is meg kell becsülni. A 9 és a 10 egyenletekből könnyen levezethető, hogy a VPI kiszámításához szükséges idő több D i valószínűségi változó esetében azok n számával exponenciálisan arányos. Ebben a fejezetben több megfigyelés együttes információértékét becsüljük az eddig ismertetettektől eltérő döntéselméleti modell mellett (4 ábra). Tegyük fel, hogy a D i, i = 1,..., n valószínűségi változók függetlenek, és a döntési lépést egy A bináris valószínűségi változóval modellezünk. Tegyük fel továbbá, hogy egy ismert eloszlású, bináris H valószínűségi változóval magasabb szinten tudjuk leírni a rendelkezésünkre álló D i, i = 1,..., n adatot, vagyis ismertek a P (D i H) feltételes eloszlások. Az A lépés és a H hipotézis közös hasznosságfüggvénye U(A, H). Ezzel a modellel közelítő becslés adható a rendelkezésre álló változóhalmaz információértékére vonatkozóan lineáris időben. Látni fogjuk, hogy a bizonyítás során nagyban kihasználjuk azokat az egyszerűsítéseket, amelyeket az A változó bináris volta és a szintén bináris H hipotézis változó jelent.
11 Tartalomjegyzék 11 Az utóbbi felfogható úgy, mint a rendelkezésre álló D i adatok egy absztrakt, egyszerűsített leírása. Ez az egyszerűsített modell a többszörös megfigyelés információértékének lineáris időben történő kiszámításához szükséges, mégsem valóságtól elrugaszkodott példa: képzeljük el, hogy a D i változók egy beteg különböző leleteit reprezentálják, míg a H változó azt a feltételezést, hogy a beteg a leletek alapján súlyos betegségben szenved. Ha az A döntés a műtét elrendelését jelenti, akkor az U(A, H) hasznosság azt jellemzi, hogy a betegség esetleges megléte mellett mennyire kockázatos vagy hasznos a műtét, illetve annak elkerülése. 4. ábra. Információ értékének becslése több megfigyelés esetén Ha felírjuk a H hipotézisre vonatkozó feltételes valószínűségek hányadosát (odds), akkor az a Bayes-szabálynak és a D i valószínűségi változók függetlenségének köszönhetően átalakítható a következőképpen: ahol λ i = P (E i H) P (E i H) O(H D 1,..., D n ) = P (H D 1,..., D n ) P ( H D 1,..., D n ) = P (D 1 H) P (D 1 H)... P (D n H) P (H) P (D n H) P ( H) n = O(H) λ i, (11) és O(H) = P (H) P ( H). Legyen p a H hipotézis bekövetkezésének valószínűsége, amikor is indifferens a döntéshozó számára, hogy mely lépést választja, formálisan: i=1 p U(H, A) + (1 p )U( H, A) = p U(H, A) + (1 p )U( H, A). (12) A 12 egyenletet átrendezve a p valószínűségre a következő érték adódik a hasznosságok ismeretében:
12 12 A mű címe p = U( H, A) U( H, A) U( H, A) U( H, A) + U(H, A) U(H, A). (13) Mivel p valószínűség a döntési küszöb, a döntéshozó akkor választja A-t A-val szemben, ha Ezt átírva a következőt kapjuk: P (H D 1,..., D n ) > p. (14) O(H D 1,..., D n ) > A 11 egyenlet alapján a 15 kifejezés átírható n λ i > i=1 p 1 p. (15) p /O(H). (16) 1 p Ha a 16 mindkét oldalának természetes alapú logaritmusát vesszük, akkor n w i > ln p lno(h), (17) 1 p i=1 ahol w i = lnλ i, így a W valószínűségi változó, mint w i változók összege definiálható: W és felírható a W változóhoz tartozó döntési küszöbérték: p n w i, (18) i=1 vagyis a döntéshozó akkor dönt A lépés mellett, ha W ln lno(h), (19) 1 p W > W. (20) W valószínűségi változó a w i független valószínűségi változók összege, ezért a centrális határeloszlás tétele alapján eloszlása normális és várhatóértéke a w i változók várhatóértékének összege, míg szórása a w i változók szórásának összege, így: p(w H) N(E(W H), V ar(w H)). (21) A 21 egyenlet alapján kiszámítható, hogy mi annak valószínűsége, hogy a W valószínűségi változó a küszöbérték felett lesz: p(w > W H) = 1 σ 2π e (t µ) 2 W 2σ dt. (22)
13 Tartalomjegyzék Megállási feladatok Ahogy azt az előző fejezetben említettük, szekvenciális döntési helyzetben lehetséges lépés a leállás. Minden olyan esetben, amikor a továbblépés költséggel jár, bármely lépésben optimális döntés lehet a megállás. Szekvenciális kiválasztási probléma esetében a döntéshozónak egy n hosszú, szekvenciálisan érkező X 1,..., X n változó sorozatból ki kell választania a legnagyobbat úgy, hogy a be nem érkezett változókról semmilyen információja nincs, korlátozottan választhat a már beérkezettek közül, és a játék bizonyos variációiban n végtelen, vagy nincs róla információ. Az egyik legegyszerűbb megállási probléma az ún. Titkárnő probléma Titkárnő probléma A megállási problémák alapfeladata a titkárnő probléma, amikor a munkáltatónak a legmegfelelőbb munkaerőt kell kiválasztania a pozícióra. A feladat a következő szabályokkal definiálható: 1. Csak egyetlen szabad állás van. 2. A jelentkezők száma, n, előre ismert. 3. Az interjúkat egymás után, egyesével bonyolítják le. 4. A jelentkezők meghallgatása véletlenszerű sorrendben történik, minden sorrend egyformán valószínű. 5. Az addig meghallgatott jelentkezők minden interjú után alkalmasságuk szerint egyértelműen rendezhetők. 6. Minden interjú után el kell dönteni, hogy a jelentkezőt felveszik-e, vagy sem. Ha egy jelentkezőt nem vesznek fel, nem lehet őt többé visszahívni. 7. A munkáltatónak csak a legalkalmasabb jelölt felel meg, minden más jelölt azonos mértékben alkalmatlan. A döntéshozó igen nehéz helyzetben van, mert bár van információja a már elküldött jelentkezőkről, nem tudja őket visszahívni, azokról a jelentkezőkről pedig, akik még nem voltak interjún semmilyen információja nincs. A probléma megoldása a következő felismerésből adódik: a döntéshozó minden esetben csak a már meglévő információ alapján dönthet, vagyis érdemes megfelelő mennyiségű információt begyűjteni, hogy aztán ezek alapján a lehető legnagyobb valószínűséggel el lehessen dönteni egy jelentkezőről, hogy az a legjobb-e. A megoldásként adódó algoritmus: 1. Az első r 1 jelentkező meghallgatása után, 2. azt a jelentkezőt kell választani, amelyik jobb, mint az első r 1 jelentkező bármelyike.
14 14 A mű címe 5. ábra. Titkárnő probléma Annak valószínűsége, hogy adott r mellett a fenti algoritmussal a legjobb jelentkezőt választjuk: P opt (r) = P (r mellett a legjobbat választjuk) = n i=r 1 r 1 n i 1, (23) mivel az r 1 hányados annak a feltételes valószínűségét adja, hogy ha i a legjobb jelölt, i 1 akkor az előző i 1 jelentkező közül a legjobb az első r 1 jelentkező között van. Minden esetben a 23 kifejezést maximalizáló r-t kell választani. Bizonyítható, hogy n növekedtével az optimális r tart n/e -hez, és annak a valószínűsége, hogy az algoritmus a legjobb jelentkezőt választja tart 1/e-hez, ahol e az Euler-féle szám. Vagyis annak a valószínűsége, hogy megtaláljuk a legjobb jelöltet megközelítőleg 0, 368. Az állítás bizonyításához először átalakítjuk a 23 kifejezést, majd belátjuk, hogy n esetén P opt (r) xln(x), amelynek szélsőértéke könnyen meghatározható. Az első lépés a P opt (r) átalakítása: P opt (r) = n i=r = r 1 n = r 1 n 1 r 1 n i 1 n i=r i=r 1 i 1 (24) n n 1 i 1 n. (25) Egy tetszőleges f( ) függvény bal oldali Riemann összege az [a, b] intervallumon: x(f(a) + f(a + x) + f(a + 2 x) f(b x)) = f(a + i x) x. (26) b a x i=0
15 Tartalomjegyzék 15 A fenti egyenlet f(t) = 1/t függvény esetén x = 1/n lépésközzel, ahol a = r 1 n b = 1: és b a x f(a + i x) x = i=0 = n r+1 i=0 n i=r 1 n 1 (r 1 + i) n n 1 i 1 n. (27) Tehát a 27 n esetén lim n n i=r 1 n 1 i 1 n = 1 A 28 határértéket visszaírva a 24 egyenletbe az x = r 1 n r 1 lim n n i=1 r 1 n n n 1 i 1 n = x 1 dt. (28) t 1 x helyettesítéssel: 1 t dt = xln(x). (29) Mivel xln(x) dx dt az eredeti állítást. = 1+ln(x), ami az x = 1/e helyen veszi fel a 0 értéket, bizonyítottuk A Googol játék A Googol játék a megállási problémák egyik első verziója, amelyet Martin Gardner publikált 1960-ban. A Googol játékban ketten vesznek részt. Az egyik szereplő előre meghatározott n számú lapra felír általa választott, különböző egész számokat. A másik szereplő az eddigi döntéshozó helyzetében van: a lefordított lapok közül addig húz, amíg úgy nem gondolja, hogy a legnagyobb számot tartalmazó lapot tartja a kezében. Ez a feladatkiírás annyiban tér el a korábbitól a döntéshozó szemszögéből, hogy nem feltételezheti az egymás után érkező elemek függetlenségét. Ha elfogadjuk a feltételezést, hogy az előre kiválasztott n szám együttes eloszlása leírható egy egyváltozós sűrűségfüggvénnyel, melynek egyetlen argumentuma az n szám maximuma p(x 1,..., x n ) = g(max{x 1,..., x 2 }), (30) vagyis ha az egyenlet által meghatározott értelemben az {X 1,..., X n } számsorozat felcserélhető, akkor bizonyítható, hogy n > 2 esetén a Googol játék esetén r a következőképpen adódik:
16 16 A mű címe 1 r + 1 r n 1 < 1 < 1 r r n 1. (31) Az is belátható, hogy a Googol játékot játszó személy számára a következő két eset ekvivalens: 1. Nem tud semmit a lapokon található számokról (akár determinisztikusak is lehetnek) 2. A számok egyenletes eloszlásúak a (0, β) intervallumon, ahol β ismeretlen Odds algoritmus Az odds algoritmus több megállási probléma megoldását adja meg azáltal, hogy egy általánosabban megfogalmazott feladatot old meg: adott I 1,..., I n indikátorváltozó sorozat, ahol I j változó A j esemény bekövetkezését mutatja. Az események egymás után, egyesével következnek be. A cél egy olyan módszert megadni, amely biztosítja, hogy a döntéshozó a legnagyobb valószínűséggel álljon meg az utolsó bekövetkező eseménynél. A max t {P (I t = 1, I t 1 = 0,..., I 1 = 0)} kifejezést maximalizáló index a τ leállási idő. Belátható, hogy ha I j bekövetkezésének valószínűsége p j és o j = p j /(1 p j ) (odds, arány), akkor τ az első olyan index, amelyre I τ = 1, τ > r n és r n = max{1, max{1 k n : n o i 1}}. (32) Vagyis az r index pontosan akkor optimális, ahonnan kezdődően a hátralévő odds-ok összege először nagyobb, mint 1, vagy ha nincs ilyen index, akkor az r = 1 érték. Annak valószínűsége, hogy az eljárással az első sikeres eseménynél állunk meg: ( n ) ( n ) P (I τ = 1, I t 1 = 0,..., I 1 = 0) = (1 p j ) o j. (33) Az odds algoritmussal megoldható a titkárnő probléma, ha az eredeti feladatot átfogalmazzuk a következőképpen: I k = 1, ha a k sorszámú jelentkező jobb, mint a korábbiak (X k > X i, i < k), így P (I k ) = 1/k, o k = 1/(k 1). Tehát az az optimális r, emylnél az R = 1/(n 1) + 1/(n 2) /(r 1) összeg nagyobb lesz, mint 1. Ha n, akkor R 1/e, ahogy korábban is láttuk Az odds algoritmus egy folytonos kiterjesztése Időben többször bekövetkező független események között eltelt idő modellezésére használt valószínűségi változó eloszlása folytonos esetben exponenciális eloszlású, mivel a folytonos eloszlások közül ez az egyetlen örökifjú tulajdonságú j=r j=k P (X T > x s + x t X T > x s ) = P (X T > x t ), x s, x t > 0. (34) j=r
17 Tartalomjegyzék 17 A 34 egyenlet szemléletesen annyit jelent, hogy ha egy teremben x s ideje várakozunk, annak valószínűsége, hogy a további x t időintervallumban nem fog villanykörte kiégni, nem függ x s -től, vagyis nem függ attól, mennyi ideje várunk. Ha a villanykörték kiégését független eseményként kezeljük, akkor az utolsó villanykörte kiégése semmilyen hatással nincs a következő körte kiégésének bekövetkeztére, ezért a teremben a körték kiégése között eltelt idő exponenciális eloszlású valószínűségi változóval írható le. További példa lehet ilyen folyamatokra egy kevésbé forgalmas úton közlekedő autók közti távolság, vagy a beérkező telefonhívások közt eltelt idő. Ha az események között eltelt idő λ paraméterű exponenciális eloszlású, f(x; λ) = { λe λx ha x > 0, 0 egyébként, akkor annak valószínűsége, hogy τ időintervallumban az adott esemény k alkalommal fordul elő, λ paraméterű homogén Poisson-eloszlást követ: P [(N(t + τ) N(t)) = k] = e λτ (λτ) k k! } (35) k = 0, 1,..., (36) ahol N(t) a t időpillanatig bekövetkezett események száma. Ha a λ intenzitás paraméter időben változhat, azaz λ(t), akkor inhomogén Poisson-beszélünk. Ha a λ(t) paraméterű Poisson eloszlású valószínűségi változók sikerességét a h(t) sűrűségfüggvény írja le, akkor a megállási probléma a következőképpen módosul: állítsuk meg a játékot a [0, T ] időintervallumban az utolsó sikeres eseménynél. A folytonos feladat a következőképpen oldható meg: a [0, T ] időintervallumot m részre osztva, annak valószínűsége, hogy a k sorszámú intervallumban legalább egy sikeres esemény következik be p k = λ(t k )h(t k )(t k t k 1 ) + o(t k t k 1 ). Ha az intervallumok számát növelve, azok mérete tart a nullához, (t k t k 1 ), akkor az intervallumban a bekövetkezés valószínűsége tart az intenzitás és a sikeresség valószínűségének szorzatához, p k λ(t k )h(t k ). Ezek alapján a diszkrét esethez nagyon hasonló a megoldás: { { T }} τ = sup 0, sup 0 t T : λ(u)h(u)du 1 t 0.3. Többkarú rabló feladatok A többkarú rabló probléma (multi-armed bandit problem, MAB) erőforrás allokációs probléma. Alapfeladata megfeleltethető a szerencsejátékos problémájának: a játékos k ún. félkarú rablóval (egy bizonyos fajta szerencsejáték-automatával) játszva szeretné maximalizálni a várható nyereményét. A játékos minden lépésben választ egy játékautomatát, melynek meghúzza a karját. Az a gép, amelyiknek meghúzza a karját, a gépre és annak pillanatnyi állapotára jellemző valószínűségi eloszlás szerint fizet jutalmat. A valós helyzettől a többkarú rabló alapprobléma annyiban tér el, hogy a gépek működtetésének nincs költsége. A cél minden esetben az erőforrások optimális kihasználása: véges horizonton a (37)
18 18 A mű címe begyűjtött jutalmak összegének maximalizálása, végtelen horizonton adott diszkontrátával vagy végtelen horizonton átlagban. A többkarú rabló probléma k független karból/folyamatból/gépből és egy kontroller folyamatból áll. (E három fogalmat: kar, folyamat, gép a fejezetben mostantól felváltva használjuk.) Minden karhoz két véletlen folyamat tartozik (X(0), X(1),...,, R(X(0)), R(X(1)),...,), ahol az X(n) a kar állapota azután, hogy a kart n-szer működtettük, R(X(n)) pedig az X(N) állapotért kapott jutalom. Egy gép állapota a következőképpen változik: X(n) = f n 1 (X(0),..., X(n 1), W (n 1)), ahol f( ) adott és W (n) egy ismert eloszlású, valós-értékű, független, azonos eloszlású valószínűségi változó sorozat, mely független X(0)-tól. Mivel az f( ) függvény determinisztikus, a W (n) valószínűségi változó jelenti a véletlen faktort a gép működésében. A k-karú rabló probléma k karja független egymástól, a karokat egy kontroller/processzor folyamat működteti, minden diszkrét időpillanatban egy és csak egy kart választva ki. A kiválasztott folyamat állapotot vált, a többi folyamat állapota változatlan marad. A cél a várható jutalom maximalizálása. A többkarú rabló feladatok alkalmazásait és lehetséges medolgásait a következő alfejezetekben tárgyaljuk Alkalmazási területek 1. Szenzor menedzsment - egy egyszerűsített példa azt szemlélteti, hogy egy szenzorral hogyan keresünk egy célpontot, mely k lehetséges dobozok egyikében van. A szenzorunk képes érzékelni a célpontot, de csak bizonyos bizonytalansággal. Célunk egy előre meghatározott küszöbnél nagyobb bizonyosság elérése. Minden lépésben választhatunk, hogy melyik doboz által kibocsátott jelet mérjük meg a szenzor segítségével. A jutalom szerepét a szenzor által mutatott jelszint tölti be. A jelszint arányos annak valószínűségével, hogy a célpont az aktuális dobozban található. Azzal tehát, hogy a várható jutalmat növeljük, a célpontot keressük. 2. Online hírdetések kiválasztása - a hírdetést megjelenítő tartalomszolgáltató (például weboldal, mobilos alkalmazás) minden oldalmegjelenéskor kiválaszthatja a hírdetők által felkínált reklámok közül azokat, amelyek kikerülnek a felületre. A tartalomszolgáltató akkor jut bevételhez, ha az olvasó a hírdetésre kattint, ezért minden oldalmegjelenéskor azt a reklámot választja, amelyre a legnagyobb valószínűséggel kattintanak. A tartalomszolgáltató rendelkezésére állnak az eddigi megjelenések és kattintások, így minden oldalmegjelenéskor egy valószínűségi változó írja le annak esélyét, hogy megjelnésekor egy reklámra kattintanak. A reklámok közül történő sorozatos választás egy többkarú rabló feladattal modellezhető. 3. Sorbanállási és ütemezési feladatok - a MAB-feladat felfogható egy egyetlen processzorból, és k feladatból álló rendszernek, amelyben minden egyes lépésben el kell dönteni, hogy a processzor mely feladatot hajtsa végre. Minden feladat végrehajtásáért jár egy jutalom, amely például a feladat sürgősségét tükrözi.
19 Tartalomjegyzék Klinikai kísérlettervezés - a gyógyszerkísérletekben a gyógyszerek hatóanyagainak megválasztása szintén megfeleltethető a MAB problémának. Itt az egyes karokat a hatóanyagok jelentik, míg a jutalmat a betegek állapota, esetleg túlélési rátája. A legnagyobb várható jutalomtól a legjobb hatóanyag kiválasztását reméljük Az optimális megoldás, előrefele következtetés A MAB-probléma esetében a visszafele következtetés (backward induction) minden esetben optimális megoldást ad, viszont rendkívül számításigényes, ezért a gyakorlatban igen ritkán alkalmazzák. Az előrefele következtetés legegyszerűbb formája az egylépéses (myopic) előretekintés, amely egyetlen lépésre előre maximalizálja a jutalmat. Ez a megoldás általában nem vezet optimális megoldáshoz. Az előrefele következtetés bonyolultabb típusa T lépésre előre számítja a várható jutalmat és ezt az értéket próbálja maximalizálni. Ezzel a megoldással az esetek nagy részében csupán szuboptimális megoldáshoz jutunk. A T lépéses előretekintés kiterjesztésének esetében feltételezzük, hogy egy végrehajtási stratégia adott. Ezen ismert végrehajtási stratégia függvényében határozunk meg egy τ leállási időt, melyre a végrehajtási folyamat a maximális várható jutalmat adja. A végrehajtást csak a meghatározott leállási időpillanatig folytatjuk, az optimalizációt csupán erre kell végrehajtani. Az előrefele következtetés a τ leállási idő számításával a következőképpen alakul: 1. Ki kell választani egy stratégiát. A stratégia ebben az esetben egyetlen gép működtetését jelenti. 2. Ki kell számítani egy τ leállási időt 3. A τ leállási időig követjük az 1. pontban választott stratégiát. τ után újból az 1. lépéssel folytatjuk. Általános esetben a fent leírt stratégia sem vezet optimális megoldáshoz, azonban az alábbi feltételek mellett az algoritmus optimális a MAB problémára: 1. A kontroller folyamat egy időben csak egyetlen gépet üzemeltet; az üzemeltetett gép állapota nem befolyásolható, csak ki- és bekapcsolni lehet a gépet. 2. A nem működtetett gép nem vált állapotot. 3. A gépek függetlenek egymástól 4. A nem működtetett gépek nem adnak jutalmat. A fent ismertetett algoritmus optimalitását, a megadott feltételek mellett szemléletesen úgy láthatjuk be, hogy minden alkalommal, amikor kiválasztunk egy gépet, majd azt τ-ig működtetjük, nem hozunk visszafordíthatatlan döntést. A többi gép állapota nem változik, vagyis nincs olyan jutalom, melyet hosszútávon az algoritmus ne tudna megszerezni, így az előrefele következtetés optimális megoldáshoz vezet.
20 20 A mű címe Gittins index Nem biztos, hogy egy folyamat t időpillanatig t-szer vált állapotot (hiszen üzemeltethetjük a többi folyamatot is), ezért i folyamat állapotát t-ben N i (t)-vel jelöljük. Egy folyamatot az állapot és a jutalom sorozata írja le: (X i (N i (t)), R i (N i (t))); N i (t) = 1, 2,..., t; t = 1, 2,... és i = 1, 2,..., k. U(t) vektor jelöli, hogy t időpillanatban melyik folyamatot üzemelteti a kontroll folyamat. U(t) = (U 1 (t),..., U k (t)), U(t) minden időpillanatban egyetlen komponensében sem nulla. A komponens indexe az adott pillanatban üzemeltetett folyamat indexét jelöli. A MAB alapfeladata, hogy maximalizálja a következő kifejezést: [ ] k J = E β t R i [X i (N i (t), U i (t)) X 1 (N 1 (0)),..., X k (N k (0))], (38) t=0 i=1 ahol 0 < β < 1, vagyis a jutalom várható jelenértékét maximalizáljuk. A Gittins-index a következő kifejezést takarja: E [ τ 1 t=0 v xi (x i (0)) = max βτ R i (X i (t) x i (0)) ] 0<τ E [ τ 1 t=0 βτ x i (0)) ], (39) vagyis a Gittins-index azt jelenti, hogy minden egyes karra meghatározunk egy olyan τ megállási időt, amelyre nézve a fenti hányados maximális. Így a már tárgyalt előrefele következtetés algoritmusa a következőképpen alakul: 1. Minden folyamatra kiszámítjuk a Gittins-indexet, ezzel együtt minden folyamatra meghatározunk egy τ leállási időt. 2. Kiválasztjuk a maximális indexszel rendelkező folyamatot, majd az indexhez tartozó leállási ideig működtetjük. Leálláskor az 1. ponttal folytatjuk. A fenti algoritmus markovi feltételezés mellett optimális megoldáshoz vezet.
Biotechnológia és bioinformatika formai ajánlások
Biotechnológia és bioinformatika formai ajánlások Sorozatoldal Címoldal Copyright-oldal szerz (k) lektor 10-15 kulcsszó 10 soros összefoglaló Tartalomjegyzék 0.1. Szekvenciális döntési folyamatok........................
e (t µ) 2 f (t) = 1 F (t) = 1 Normális eloszlás negyedik centrális momentuma:
Normális eloszlás ξ valószínűségi változó normális eloszlású. ξ N ( µ, σ 2) Paraméterei: µ: várható érték, σ 2 : szórásnégyzet (µ tetszőleges, σ 2 tetszőleges pozitív valós szám) Normális eloszlás sűrűségfüggvénye:
Eseményalgebra. Esemény: minden amirl a kísérlet elvégzése során eldönthet egyértelmen hogy a kísérlet során bekövetkezett-e vagy sem.
Eseményalgebra. Esemény: minden amirl a kísérlet elvégzése során eldönthet egyértelmen hogy a kísérlet során bekövetkezett-e vagy sem. Elemi esemény: a kísérlet egyes lehetséges egyes lehetséges kimenetelei.
FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI
FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 3 III. VÉLETLEN VEKTOROK 1. A KÉTDIMENZIÓs VÉLETLEN VEKTOR Definíció: Az leképezést (kétdimenziós) véletlen vektornak nevezzük, ha Definíció:
A maximum likelihood becslésről
A maximum likelihood becslésről Definíció Parametrikus becsléssel foglalkozunk. Adott egy modell, mellyel elképzeléseink szerint jól leírható a meghatározni kívánt rendszer. (A modell típusának és rendszámának
Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1
Statisztika - bevezetés 00.04.05. Méréselmélet PE MIK MI_BSc VI_BSc Bevezetés Véletlen jelenség fogalma jelenséget okok bizonyos rendszere hozza létre ha mindegyik figyelembe vehető egyértelmű leírás általában
BIOMATEMATIKA ELŐADÁS
BIOMATEMATIKA ELŐADÁS 9. Együttes eloszlás, kovarianca, nevezetes eloszlások Debreceni Egyetem, 2015 Dr. Bérczes Attila, Bertók Csanád A diasor tartalma 1 Bevezetés, definíciók Együttes eloszlás Függetlenség
A következő feladat célja az, hogy egyszerű módon konstruáljunk Poisson folyamatokat.
Poisson folyamatok, exponenciális eloszlások Azt mondjuk, hogy a ξ valószínűségi változó Poisson eloszlású λ, 0 < λ
x, x R, x rögzített esetén esemény. : ( ) x Valószínűségi Változó: Feltételes valószínűség: Teljes valószínűség Tétele: Bayes Tétel:
Feltételes valószínűség: Teljes valószínűség Tétele: Bayes Tétel: Valószínűségi változó általános fogalma: A : R leképezést valószínűségi változónak nevezzük, ha : ( ) x, x R, x rögzített esetén esemény.
előadás Diszkrét idejű tömegkiszolgálási modellek Poisson-folyamat Folytonos idejű Markov-láncok Folytonos idejű sorbanállás
13-14. előadás Diszkrét idejű tömegkiszolgálási modellek Poisson-folyamat Folytonos idejű Markov-láncok Folytonos idejű sorbanállás 2016. november 28. és december 5. 13-14. előadás 1 / 35 Bevezetés A diszkrét
Matematika A3 Valószínűségszámítás, 5. gyakorlat 2013/14. tavaszi félév
Matematika A3 Valószínűségszámítás, 5. gyakorlat 013/14. tavaszi félév 1. Folytonos eloszlások Eloszlásfüggvény és sűrűségfüggvény Egy valószínűségi változó, illetve egy eloszlás eloszlásfüggvényének egy
Least Squares becslés
Least Squares becslés A négyzetes hibafüggvény: i d i ( ) φx i A négyzetes hibafüggvény mellett a minimumot biztosító megoldás W=( d LS becslés A gradiens számítása és nullává tétele eredményeképp A megoldás
1. Példa. A gamma függvény és a Fubini-tétel.
. Példa. A gamma függvény és a Fubini-tétel.. Az x exp x + t )) függvény az x, t tartományon folytonos, és nem negatív, ezért alkalmazható rá a Fubini-tétel. I x exp x + t )) dxdt + t dt π 4. [ exp x +
FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI
FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 10 X. SZIMULÁCIÓ 1. VÉLETLEN számok A véletlen számok fontos szerepet játszanak a véletlen helyzetek generálásában (pénzérme, dobókocka,
Nagy számok törvényei Statisztikai mintavétel Várható érték becslése. Dr. Berta Miklós Fizika és Kémia Tanszék Széchenyi István Egyetem
agy számok törvényei Statisztikai mintavétel Várható érték becslése Dr. Berta Miklós Fizika és Kémia Tanszék Széchenyi István Egyetem A mérés mint statisztikai mintavétel A méréssel az eloszlásfüggvénnyel
Megoldások. ξ jelölje az első meghibásodásig eltelt időt. Akkor ξ N(6, 4; 2, 3) normális eloszlású P (ξ
Megoldások Harmadik fejezet gyakorlatai 3.. gyakorlat megoldása ξ jelölje az első meghibásodásig eltelt időt. Akkor ξ N(6, 4;, 3 normális eloszlású P (ξ 8 ξ 5 feltételes valószínűségét (.3. alapján számoljuk.
Gazdasági matematika II. vizsgadolgozat megoldása, június 10
Gazdasági matematika II. vizsgadolgozat megoldása, 204. június 0 A dolgozatírásnál íróeszközön kívül más segédeszköz nem használható. A dolgozat időtartama: 90 perc. Ha a dolgozat első részéből szerzett
[Biomatematika 2] Orvosi biometria
[Biomatematika 2] Orvosi biometria 2016.02.22. Valószínűségi változó Véletlentől függő számértékeket (értékek sokasága) felvevő változókat valószínűségi változóknak nevezzük(jelölés: ξ, η, x). (pl. x =
Mesterséges Intelligencia MI
Mesterséges Intelligencia MI Racionalitás: a hasznosság és a döntés Dobrowiecki Tadeusz Eredics Péter, és mások BME I.E. 437, 463-28-99 dobrowiecki@mit.bme.hu, http://www.mit.bme.hu/general/staff/tade
minden x D esetén, akkor x 0 -at a függvény maximumhelyének mondjuk, f(x 0 )-at pedig az (abszolút) maximumértékének.
Függvények határértéke és folytonossága Egy f: D R R függvényt korlátosnak nevezünk, ha a függvényértékek halmaza korlátos. Ha f(x) f(x 0 ) teljesül minden x D esetén, akkor x 0 -at a függvény maximumhelyének
Sorozatok, sorok, függvények határértéke és folytonossága Leindler Schipp - Analízis I. könyve + jegyzetek, kidolgozások alapján
Sorozatok, sorok, függvények határértéke és folytonossága Leindler Schipp - Analízis I. könyve + jegyzetek, kidolgozások alapján Számsorozatok, vektorsorozatok konvergenciája Def.: Számsorozatok értelmezése:
FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI
FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 8 VIII. REGREssZIÓ 1. A REGREssZIÓs EGYENEs Két valószínűségi változó kapcsolatának leírására az eddigiek alapján vagy egy numerikus
Készítette: Fegyverneki Sándor
VALÓSZÍNŰSÉGSZÁMÍTÁS Összefoglaló segédlet Készítette: Fegyverneki Sándor Miskolci Egyetem, 2001. i JELÖLÉSEK: N a természetes számok halmaza (pozitív egészek) R a valós számok halmaza R 2 {(x, y) x, y
egyenletesen, és c olyan színű golyót teszünk az urnába, amilyen színűt húztunk. Bizonyítsuk
Valószínűségszámítás 8. feladatsor 2015. november 26. 1. Bizonyítsuk be, hogy az alábbi folyamatok mindegyike martingál. a S n, Sn 2 n, Y n = t n 1+ 1 t 2 Sn, t Fn = σ S 1,..., S n, 0 < t < 1 rögzített,
Az optimális megoldást adó algoritmusok
Az optimális megoldást adó algoritmusok shop ütemezés esetén Ebben a fejezetben olyan modellekkel foglalkozunk, amelyekben a munkák több műveletből állnak. Speciálisan shop ütemezési problémákat vizsgálunk.
4. Az A és B események egymást kizáró eseményeknek vagy idegen (diszjunkt)eseményeknek nevezzük, ha AB=O
1. Mit nevezünk elemi eseménynek és eseménytérnek? A kísérlet lehetséges kimeneteleit elemi eseményeknek nevezzük. Az adott kísélethez tartozó elemi események halmazát eseménytérnek nevezzük, jele: X 2.
Kabos: Statisztika II. t-próba 9.1. Ha ismert a doboz szórása de nem ismerjük a
Kabos: Statisztika II. t-próba 9.1 Egymintás z-próba Ha ismert a doboz szórása de nem ismerjük a doboz várhatóértékét, akkor a H 0 : a doboz várhatóértéke = egy rögzített érték hipotézisről úgy döntünk,
Elméleti összefoglaló a Valószín ségszámítás kurzushoz
Elméleti összefoglaló a Valószín ségszámítás kurzushoz Véletlen kísérletek, események valószín sége Deníció. Egy véletlen kísérlet lehetséges eredményeit kimeneteleknek nevezzük. A kísérlet kimeneteleinek
Gazdasági matematika II. vizsgadolgozat megoldása A csoport
Gazdasági matematika II. vizsgadolgozat megoldása A csoport Definiálja az alábbi fogalmakat!. Egy eseménynek egy másik eseményre vonatkozó feltételes valószínűsége. ( pont) Az A esemény feltételes valószínűsége
Sztochasztikus folyamatok alapfogalmak
Matematikai Modellalkotás Szeminárium 2012. szeptember 4. 1 Folytonos idejű Markov láncok 2 3 4 1 Folytonos idejű Markov láncok 2 3 4 Folytonos idejű Markov láncok I Adott egy G = (V, E) gráf Folytonos
FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI
FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 4 IV. MINTA, ALAPsTATIsZTIKÁK 1. MATEMATIKAI statisztika A matematikai statisztika alapfeladatát nagy általánosságban a következőképpen
Markov-láncok stacionárius eloszlása
Markov-láncok stacionárius eloszlása Adatbányászat és Keresés Csoport, MTA SZTAKI dms.sztaki.hu Kiss Tamás 2013. április 11. Tartalom Markov láncok definíciója, jellemzése Visszatérési idők Stacionárius
12. előadás - Markov-láncok I.
12. előadás - Markov-láncok I. 2016. november 21. 12. előadás 1 / 15 Markov-lánc - definíció Az X n, n N valószínűségi változók sorozatát diszkrét idejű sztochasztikus folyamatnak nevezzük. Legyen S R
Abszolút folytonos valószín ségi változó (4. el adás)
Abszolút folytonos valószín ségi változó (4. el adás) Deníció (Abszolút folytonosság és s r ségfüggvény) Az X valószín ségi változó abszolút folytonos, ha van olyan f : R R függvény, melyre P(X t) = t
Biomatematika 2 Orvosi biometria
Biomatematika 2 Orvosi biometria 2017.02.13. Populáció és minta jellemző adatai Hibaszámítás Valószínűség 1 Esemény Egy kísérlet vagy megfigyelés (vagy mérés) lehetséges eredményeinek összessége (halmaza)
Gauss-Seidel iteráció
Közelítő és szimbolikus számítások 5. gyakorlat Iterációs módszerek: Jacobi és Gauss-Seidel iteráció Készítette: Gelle Kitti Csendes Tibor Somogyi Viktor London András Deák Gábor jegyzetei alapján 1 ITERÁCIÓS
Gauss-Jordan módszer Legkisebb négyzetek módszere, egyenes LNM, polinom LNM, függvény. Lineáris algebra numerikus módszerei
A Gauss-Jordan elimináció, mátrixinvertálás Gauss-Jordan módszer Ugyanazzal a technikával, mint ahogy a k-adik oszlopban az a kk alatti elemeket kinulláztuk, a fölötte lévő elemeket is zérussá lehet tenni.
Matematika A3 Valószínűségszámítás, 6. gyakorlat 2013/14. tavaszi félév
Matematika A3 Valószínűségszámítás, 6. gyakorlat 2013/14. tavaszi félév 1. A várható érték és a szórás transzformációja 1. Ha egy valószínűségi változóhoz hozzáadunk ötöt, mínusz ötöt, egy b konstanst,
Differenciálegyenletek december 13.
Differenciálegyenletek 2018. december 13. Elsőrendű DE Definíció. Az elsőrendű differenciálegyenlet általános alakja y = f (x, y), ahol f (x, y) adott kétváltozós függvény. Minden y = y(x) függvény, amire
Lineáris algebra numerikus módszerei
Hermite interpoláció Tegyük fel, hogy az x 0, x 1,..., x k [a, b] különböző alappontok (k n), továbbá m 0, m 1,..., m k N multiplicitások úgy, hogy Legyenek adottak k m i = n + 1. i=0 f (j) (x i ) = y
Véletlenszám generátorok és tesztelésük. Tossenberger Tamás
Véletlenszám generátorok és tesztelésük Tossenberger Tamás Érdekességek Pénzérme feldobó gép: $0,25-os érme 1/6000 valószínűséggel esik az élére 51% eséllyel érkezik a felfelé mutató oldalára Pörgetésnél
Alap-ötlet: Karl Friedrich Gauss ( ) valószínűségszámítási háttér: Andrej Markov ( )
Budapesti Műszaki és Gazdaságtudományi Egyetem Gépészmérnöki Kar Hidrodinamikai Rendszerek Tanszék, Budapest, Műegyetem rkp. 3. D ép. 334. Tel: 463-6-80 Fa: 463-30-9 http://www.vizgep.bme.hu Alap-ötlet:
Matematika A2 vizsga mgeoldása június 4.
Matematika A vizsga mgeoldása 03. június.. (a (3 pont Definiálja az f(x, y függvény határértékét az (x 0, y 0 helyen! Megoldás: Legyen D R, f : D R. Legyen az f(x, y függvény értelmezve az (x 0, y 0 pont
Valószínűségszámítás összefoglaló
Statisztikai módszerek BMEGEVGAT Készítette: Halász Gábor Budapesti Műszaki és Gazdaságtudományi Egyetem Gépészmérnöki Kar Hidrodinamikai Rendszerek Tanszék, Budapest, Műegyetem rkp. 3. D ép. 334. Tel:
A mérési eredmény megadása
A mérési eredmény megadása A mérés során kapott értékek eltérnek a mérendő fizikai mennyiség valódi értékétől. Alapvetően kétféle mérési hibát különböztetünk meg: a determinisztikus és a véletlenszerű
Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János
Szent István Egyetem Állatorvos-tudományi Kar Biomatematikai és Számítástechnikai Tanszék Biomatematika 12. Regresszió- és korrelációanaĺızis Fodor János Copyright c Fodor.Janos@aotk.szie.hu Last Revision
f(x) vagy f(x) a (x x 0 )-t használjuk. lim melyekre Mivel itt ɛ > 0 tetszőlegesen kicsi, így a a = 0, a = a, ami ellentmondás, bizonyítva
6. FÜGGVÉNYEK HATÁRÉRTÉKE ÉS FOLYTONOSSÁGA 6.1 Függvény határértéke Egy D R halmaz torlódási pontjainak halmazát D -vel fogjuk jelölni. Definíció. Legyen f : D R R és legyen x 0 D (a D halmaz torlódási
[Biomatematika 2] Orvosi biometria
[Biomatematika 2] Orvosi biometria 2016.02.15. Esemény Egy kísérlet vagy megfigyelés (vagy mérés) lehetséges eredményeinek összessége (halmaza) alkotja az eseményteret. Esemény: az eseménytér részhalmazai.
E.4 Markov-láncok E.4 Markov-láncok. Sok sorbanállási hálózat viselkedése leírható "folytonos idejű Markovláncok " segítségével.
E.4 Markov-láncok Sok sorbanállási hálózat viselkedése leírható "folytonos idejű Markovláncok " segítségével. Egy Markov-láncot (MC) meghatároznak az alapját adó sorbanállási hálózat állapotai és az ezek
Hidden Markov Model. March 12, 2013
Hidden Markov Model Göbölös-Szabó Julianna March 12, 2013 Outline 1 Egy példa 2 Feladat formalizálása 3 Forward-algoritmus 4 Backward-algoritmus 5 Baum-Welch algoritmus 6 Skálázás 7 Egyéb apróságok 8 Alkalmazás
[Biomatematika 2] Orvosi biometria
[Biomatematika 2] Orvosi biometria 2016.02.29. A statisztika típusai Leíró jellegű statisztika: összegzi egy adathalmaz jellemzőit. A középértéket jelemzi (medián, módus, átlag) Az adatok változékonyságát
3. Lineáris differenciálegyenletek
3. Lineáris differenciálegyenletek A közönséges differenciálegyenletek két nagy csoportba oszthatók lineáris és nemlineáris egyenletek csoportjába. Ez a felbontás kicsit önkényesnek tűnhet, a megoldásra
Valószínűségi változók. Várható érték és szórás
Matematikai statisztika gyakorlat Valószínűségi változók. Várható érték és szórás Valószínűségi változók 2016. március 7-11. 1 / 13 Valószínűségi változók Legyen a (Ω, A, P) valószínűségi mező. Egy X :
(Independence, dependence, random variables)
Két valószínűségi változó együttes vizsgálata Feltételes eloszlások Két diszkrét változó együttes eloszlása a lehetséges értékpárok és a hozzájuk tartozó valószínűségek (táblázat) Példa: Egy urna 3 fehér,
10. Előadás. 1. Feltétel nélküli optimalizálás: Az eljárás alapjai
Optimalizálási eljárások MSc hallgatók számára 10. Előadás Előadó: Hajnal Péter Jegyzetelő: T. Szabó Tamás 2011. április 20. 1. Feltétel nélküli optimalizálás: Az eljárás alapjai A feltétel nélküli optimalizálásnál
Biometria az orvosi gyakorlatban. Regresszió Túlélésanalízis
SZDT-09 p. 1/36 Biometria az orvosi gyakorlatban Regresszió Túlélésanalízis Werner Ágnes Villamosmérnöki és Információs Rendszerek Tanszék e-mail: werner.agnes@virt.uni-pannon.hu Logisztikus regresszió
3. Fuzzy aritmetika. Gépi intelligencia I. Fodor János NIMGI1MIEM BMF NIK IMRI
3. Fuzzy aritmetika Gépi intelligencia I. Fodor János BMF NIK IMRI NIMGI1MIEM Tartalomjegyzék I 1 Intervallum-aritmetika 2 Fuzzy intervallumok és fuzzy számok Fuzzy intervallumok LR fuzzy intervallumok
A lineáris programozás alapfeladata Standard alak Az LP feladat megoldása Az LP megoldása: a szimplex algoritmus 2018/
Operációkutatás I. 2018/2019-2. Szegedi Tudományegyetem Informatika Intézet Számítógépes Optimalizálás Tanszék 2. Előadás LP alapfeladat A lineáris programozás (LP) alapfeladata standard formában Max c
A lineáris programozás alapfeladata Standard alak Az LP feladat megoldása Az LP megoldása: a szimplex algoritmus 2017/
Operációkutatás I. 2017/2018-2. Szegedi Tudományegyetem Informatika Intézet Számítógépes Optimalizálás Tanszék 2. Előadás LP alapfeladat A lineáris programozás (LP) alapfeladata standard formában Max c
Numerikus módszerek 1.
Numerikus módszerek 1. 6. előadás: Vektor- és mátrixnormák Lócsi Levente ELTE IK 2013. október 14. Tartalomjegyzék 1 Vektornormák 2 Mátrixnormák 3 Természetes mátrixnormák, avagy indukált normák 4 Mátrixnormák
1. feladatsor: Vektorterek, lineáris kombináció, mátrixok, determináns (megoldás)
Matematika A2c gyakorlat Vegyészmérnöki, Biomérnöki, Környezetmérnöki szakok, 2017/18 ősz 1. feladatsor: Vektorterek, lineáris kombináció, mátrixok, determináns (megoldás) 1. Valós vektorterek-e a következő
Biometria az orvosi gyakorlatban. Számítógépes döntéstámogatás
SZDT-01 p. 1/23 Biometria az orvosi gyakorlatban Számítógépes döntéstámogatás Werner Ágnes Villamosmérnöki és Információs Rendszerek Tanszék e-mail: werner.agnes@virt.uni-pannon.hu Gyakorlat SZDT-01 p.
A fontosabb definíciók
A legfontosabb definíciókat jelöli. A fontosabb definíciók [Descartes szorzat] Az A és B halmazok Descartes szorzatán az A és B elemeiből képezett összes (a, b) a A, b B rendezett párok halmazát értjük,
Megoldott feladatok november 30. n+3 szigorúan monoton csökken, 5. n+3. lim a n = lim. n+3 = 2n+3 n+4 2n+1
Megoldott feladatok 00. november 0.. Feladat: Vizsgáljuk az a n = n+ n+ sorozat monotonitását, korlátosságát és konvergenciáját. Konvergencia esetén számítsuk ki a határértéket! : a n = n+ n+ = n+ n+ =
Differenciálegyenletek megoldása próbafüggvény-módszerrel
Differenciálegyenletek megoldása próbafüggvény-módszerrel Ez még nem a végleges változat, utoljára módosítva: 2012. április 9.19:38. Elsőrendű egyenletek Legyen adott egy elsőrendű lineáris állandó együtthatós
Programozási módszertan. Mohó algoritmusok
PM-08 p. 1/17 Programozási módszertan Mohó algoritmusok Werner Ágnes Villamosmérnöki és Információs Rendszerek Tanszék e-mail: werner.agnes@virt.uni-pannon.hu PM-08 p. 2/17 Bevezetés Dinamikus programozás
Megerősítéses tanulási módszerek és alkalmazásaik
MISKOLCI EGYETEM GÉPÉSZMÉRNÖKI ÉS INFORMATIKAI KAR Megerősítéses tanulási módszerek és alkalmazásaik Tompa Tamás tanársegéd Általános Informatikai Intézeti Tanszék Miskolc, 2017. szeptember 15. Tartalom
KÖZELÍTŐ INFERENCIA II.
STATISZTIKAI TANULÁS AZ IDEGRENDSZERBEN KÖZELÍTŐ INFERENCIA II. MONTE CARLO MÓDSZEREK ISMÉTLÉS Egy valószínűségi modellben a következtetéseinket a látensek vagy a paraméterek fölötti poszterior írja le.
11. Előadás. 11. előadás Bevezetés a lineáris programozásba
11. Előadás Gondolkodnivalók Sajátérték, Kvadratikus alak 1. Gondolkodnivaló Adjuk meg, hogy az alábbi A mátrixnak mely α értékekre lesz sajátértéke a 5. Ezen α-ák esetén határozzuk meg a 5 sajátértékhez
KÖZELÍTŐ INFERENCIA II.
STATISZTIKAI TANULÁS AZ IDEGRENDSZERBEN KÖZELÍTŐ INFERENCIA II. MONTE CARLO MÓDSZEREK ISMÉTLÉS Egy valószínűségi modellben a következtetéseinket a látensek vagy a paraméterek fölötti poszterior írja le.
Feladatok és megoldások a 13. hétre
Feladatok és megoldások a. hétre Építőkari Matematika A. Az alábbi függvények melyike lehet eloszlásfüggvény? + e x, ha x >, (a F(x =, ha x, (b F(x = x + e x, ha x, (c F(x =, ha x, x (d F(x = (4 x, ha
KOVÁCS BÉLA, MATEMATIKA I.
KOVÁCS BÉLA MATEmATIkA I 6 VI KOmPLEX SZÁmOk 1 A komplex SZÁmOk HALmAZA A komplex számok olyan halmazt alkotnak amelyekben elvégezhető az összeadás és a szorzás azaz két komplex szám összege és szorzata
15. LINEÁRIS EGYENLETRENDSZEREK
15 LINEÁRIS EGYENLETRENDSZEREK 151 Lineáris egyenletrendszer, Gauss elimináció 1 Definíció Lineáris egyenletrendszernek nevezzük az (1) a 11 x 1 + a 12 x 2 + + a 1n x n = b 1 a 21 x 1 + a 22 x 2 + + a
1000 forintos adósságunkat, de csak 600 forintunk van. Egyetlen lehetőségünk, hogy a
A merész játékok stratégiája A következő problémával foglalkozunk: Tegyük fel, hogy feltétlenül ki kell fizetnünk 000 forintos adósságunkat, de csak 600 forintunk van. Egyetlen lehetőségünk, hogy a még
Diverzifikáció Markowitz-modell MAD modell CAPM modell 2017/ Szegedi Tudományegyetem Informatikai Intézet
Operációkutatás I. 2017/2018-2. Szegedi Tudományegyetem Informatikai Intézet Számítógépes Optimalizálás Tanszék 11. Előadás Portfólió probléma Portfólió probléma Portfólió probléma Adott részvények (kötvények,tevékenységek,
Matematika I. NÉV:... FELADATOK: 2. Határozzuk meg az f(x) = 2x 3 + 2x 2 2x + 1 függvény szélsőértékeit a [ 2, 2] halmazon.
215.12.8. Matematika I. NÉV:... 1. Lineáris transzformációk segítségével ábrázoljuk az f(x) = ln(2 3x) függvényt. 7pt 2. Határozzuk meg az f(x) = 2x 3 + 2x 2 2x + 1 függvény szélsőértékeit a [ 2, 2] halmazon.
GPK M1 (BME) Interpoláció / 16
Interpoláció Matematika M1 gépészmérnököknek 2017. március 13. GPK M1 (BME) Interpoláció 2017 1 / 16 Az interpoláció alapfeladata - Példa Tegyük fel, hogy egy ipari termék - pl. autó - előzetes konstrukciójának
A valószínűségszámítás elemei
A valószínűségszámítás elemei Kísérletsorozatban az esemény relatív gyakorisága: k/n, ahol k az esemény bekövetkezésének abszolút gyakorisága, n a kísérletek száma. Pl. Jelenség: kockadobás Megfigyelés:
Függvények növekedési korlátainak jellemzése
17 Függvények növekedési korlátainak jellemzése A jellemzés jól bevált eszközei az Ω, O, Θ, o és ω jelölések. Mivel az igények általában nemnegatívak, ezért az alábbi meghatározásokban mindenütt feltesszük,
A kockázat fogalma. A kockázat fogalma. Fejezetek a környezeti kockázatok menedzsmentjéből 2 Bezegh András
Fejezetek a környezeti kockázatok menedzsmentjéből 2 Bezegh András A kockázat fogalma A kockázat (def:) annak kifejezése, hogy valami nem kívánt hatással lesz a valaki/k értékeire, célkitűzésekre. A kockázat
Kísérlettervezés alapfogalmak
Kísérlettervezés alapfogalmak Rendszermodellezés Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs Rendszerek Tanszék Kísérlettervezés Cél: a modell paraméterezése a valóság alapján
A legjobb közeĺıtés itt most azt jelentette, hogy a lineáris
Többváltozós függvények differenciálhatósága f(x) f(x Az egyváltozós függvények differenciálhatóságát a lim 0 ) x x0 x x 0 függvényhatárértékkel definiáltuk, s szemléletes jelentése abban mutatkozott meg,
Jármőtervezés és vizsgálat I. VALÓSZÍNŐSÉGSZÁMÍTÁSI ALAPFOGALMAK Dr. Márialigeti János
BUDAPESTI MŐSZAKI ÉS GAZDASÁGTUDOMÁNYI EGYETEM KÖZLEKEDÉSMÉRNÖKI KAR JÁRMŐELEMEK ÉS HAJTÁSOK TANSZÉK Jármőtervezés és vizsgálat I. VALÓSZÍNŐSÉGSZÁMÍTÁSI ALAPFOGALMAK Dr. Márialigeti János Budapest 2008
Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus.
Valószín ségelméleti és matematikai statisztikai alapfogalmak összefoglalása (Kemény Sándor - Deák András: Mérések tervezése és eredményeik értékelése, kivonat) Véletlen jelenség: okok rendszere hozza
Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió
SZDT-08 p. 1/31 Biometria az orvosi gyakorlatban Korrelációszámítás, regresszió Werner Ágnes Villamosmérnöki és Információs Rendszerek Tanszék e-mail: werner.agnes@virt.uni-pannon.hu Korrelációszámítás
A sorozat fogalma. függvényeket sorozatoknak nevezzük. Amennyiben az értékkészlet. az értékkészlet a komplex számok halmaza, akkor komplex
A sorozat fogalma Definíció. A természetes számok N halmazán értelmezett függvényeket sorozatoknak nevezzük. Amennyiben az értékkészlet a valós számok halmaza, valós számsorozatról beszélünk, mígha az
Funkcionálanalízis. n=1. n=1. x n y n. n=1
Funkcionálanalízis 2011/12 tavaszi félév - 2. előadás 1.4. Lényeges alap-terek, példák Sorozat terek (Folytatás.) C: konvergens sorozatok tere. A tér pontjai sorozatok: x = (x n ). Ezen belül C 0 a nullsorozatok
Statisztika I. 8. előadás. Előadó: Dr. Ertsey Imre
Statisztika I. 8. előadás Előadó: Dr. Ertsey Imre Minták alapján történő értékelések A statisztika foglalkozik. a tömegjelenségek vizsgálatával Bizonyos esetekben lehetetlen illetve célszerűtlen a teljes
LNM folytonos Az interpoláció Lagrange interpoláció. Lineáris algebra numerikus módszerei
Legkisebb négyzetek módszere, folytonos eset Folytonos eset Legyen f C[a, b]és h(x) = a 1 φ 1 (x) + a 2 φ 2 (x) +... + a n φ n (x). Ekkor tehát az n 2 F (a 1,..., a n ) = f a i φ i = = b a i=1 f (x) 2
i p i p 0 p 1 p 2... i p i
. vizsga, 06--9, Feladatok és megoldások. (a) Adja meg az diszkrét eloszlás várható értékének a definícióját! i 0... p i p 0 p p... i p i (b) Tegyük fel, hogy a rigófészkekben található tojások X száma
Centrális határeloszlás-tétel
13. fejezet Centrális határeloszlás-tétel A valószínűségszámítás legfontosabb állításai azok, amelyek független valószínűségi változók normalizált összegeire vonatkoznak. A legfontosabb ilyen tételek a
Számelméleti alapfogalmak
1 Számelméleti alapfogalmak 1 Definíció Az a IN szám osztója a b IN számnak ha létezik c IN melyre a c = b Jelölése: a b 2 Példa a 0 bármely a számra teljesül, mivel c = 0 univerzálisan megfelel: a 0 =
Diszkrét matematika II., 8. előadás. Vektorterek
1 Diszkrét matematika II., 8. előadás Vektorterek Dr. Takách Géza NyME FMK Informatikai Intézet takach@inf.nyme.hu http://inf.nyme.hu/ takach/ 2007.??? Vektorterek Legyen T egy test (pl. R, Q, F p ). Definíció.
6. Függvények. Legyen függvény és nem üreshalmaz. A függvényt az f K-ra való kiterjesztésének
6. Függvények I. Elméleti összefoglaló A függvény fogalma, értelmezési tartomány, képhalmaz, értékkészlet Legyen az A és B halmaz egyike sem üreshalmaz. Ha az A halmaz minden egyes eleméhez hozzárendeljük
Gyakorló feladatok I.
Gyakorló feladatok I. a Matematika Aa Vektorüggvények tárgyhoz (D D5 kurzusok) Összeállította: Szili László Ajánlott irodalmak:. G.B. Thomas, M.D. Weir, J. Hass, F.R. Giordano: Thomas-féle KALKULUS I.,
Hadamard-mátrixok Előadó: Hajnal Péter február 23.
Szimmetrikus kombinatorikus struktúrák MSc hallgatók számára Hadamard-mátrixok Előadó: Hajnal Péter 2012. február 23. 1. Hadamard-mátrixok Ezen az előadáson látásra a blokkrendszerektől független kombinatorikus
Mátrixjátékok tiszta nyeregponttal
1 Mátrixjátékok tiszta nyeregponttal 1. Példa. Két játékos Aladár és Bendegúz rendelkeznek egy-egy tetraéderrel, melyek lapjaira rendre az 1, 2, 3, 4 számokat írták. Egy megadott jelre egyszerre felmutatják
Formális nyelvek - 9.
Formális nyelvek - 9. Csuhaj Varjú Erzsébet Algoritmusok és Alkalmazásaik Tanszék Informatikai Kar Eötvös Loránd Tudományegyetem H-1117 Budapest Pázmány Péter sétány 1/c E-mail: csuhaj@inf.elte.hu 1 Véges
DIFFERENCIAEGYENLETEK
DIFFERENCIAEGYENLETEK Példa: elsőrendű állandó e.h. lineáris differenciaegyenlet Ennek megoldása: Kezdeti feltétellel: Kezdeti feltétel nélkül ha 1 és a végtelen összeg (abszolút) konvergens: / 1 Minden
Analízis I. beugró vizsgakérdések
Analízis I. beugró vizsgakérdések Programtervező Informatikus szak 2008-2009. 2. félév Készítette: Szabó Zoltán SZZNACI.ELTE zotyo@bolyaimk.hu v1.7 Forrás: Dr. Weisz Ferenc: Prog. Mat. 2006-2007 definíciók