BIOMATEMATIKA ELŐADÁS 7. Bevezetés a valószínűségszámításba Debreceni Egyetem, 2015 Dr. Bérczes Attila, Bertók Csanád
A diasor tartalma 1 Bevezetés 2 Definíciók, tulajdonságok Példák Valószínűségi mező Véges valószínűségi mezők 3 Feltételes valószínűség Teljes valószínűség tétele, Bayes tétele 4 Biológiai példák
Bevezetés MI A KÍSÉRLET? Kísérlet alatt ellenőrzött feltételek alatt történő, ismételhető vizsgálatot értünk. Természetes elvárás, hogy ha bármilyen kutatólaborban ugyanazt a vizsgálatot végzik el, akkor ugyanolyan eredményt kell kapjanak. A biológiában azonban tökéletes kísérlet nincs, gyakran megjelennek a vizsgálat során nem reprodukálható eredmények, reakciók is (pl. az etológiában ez igen gyakori jelenség). A megfigyelés és a megfigyelt tulajdonság, egyed, populáció, stb. viselkedését, reakcióit véletlen, előre nem látható tényezők befolyásolják. Ezek vizsgálatával a matematikai statisztika, illetve a valószínűségszámítás foglalkozik.
Bevezetés Mennyi az esélye, hogy egy szabályos pénzérmét feldobva fejet kapunk? A józan ész és a tapasztalat azt sugallja, hogy 50%. Ez durván annyit jelent, hogy a dobások fele fej, fele írás. Értelmes ember játszaná-e a következő játékot? Vagyonát három egyenlő részre osztaná, az 1 / 3 -át feltenné fej-írás játékra. Ha nyer, abbahagyná a játékot, ha veszít, akkor feltenné a maradék 2 / 3 részt is. Ha a fele fej, fele írás törvényszerűség "pontosan" érvényesülne, akkor az 1 / 3 részt mindig megnyerné, hiszen vagy az első dobásra nyerne 1 / 3 részt, vagy ha elsőre veszít 1 / 3 részt, akkor a második dobásra nyerne 2 / 3 részt. Természetesen józan ember nem játszaná ezt a játékot, hiszen az "50% fej" törvényszerűség csak igen sok dobás esetén, "átlagosan" érvényesül. Az ilyen törvényszerűségeket nevezzük statisztikai törvényszerűségeknek.
Bevezetés Mennyi a valószínűsége, hogy két hónapon belül házasságot kötök (feltéve, hogy még nem tettem meg)? A kérdés értelmes ugyan, mégsem szoktuk feltenni. Ha ugyanis a dolog úgy áll, hogy már kitűzték az esküvő napját, akkor az esély 100%. Ha pedig még a láthatáron sincs menyasszony/vőlegény, akkor 0%. De a kérdés feltevése nem ezért helytelen. Hanem azért, mert ritkán szoktam házasságot kötni. A valószínűségszámítási, statisztikai törvényszerűségek csak nagy számban végbemenő jelenségekre vonatkoztathatók. Tehát a kérdést úgy érdemes feltenni, hogy mennyi az esélye annak, hogy egy x éves férfi/nő két hónapon belül házasságot köt valakivel. Ez már tekinthető tömegjelenségnek, hiszen elég sokan vannak várólistán (ha mondjuk 18 < x < 20). Mennyi a valószínűsége, hogy holnap felkel a nap? Józan emberek ezt a kérdést sem teszik fel túl gyakran. És nem azért, mert a jelenség nem történne meg kellően sokszor, hanem azért, mert nem tekinthető véletlennek.
Bevezetés Tehát körülírhatjuk a valószínűségszámítás témáját: a véletlen tömegjelenségekre vonatkozó törvényszerűségek megállapítása. Véletlen jelenség az, aminek a kimenetelét a tekintetbe vett (rendelkezésre álló) feltételek nem határozzák meg egyértelműen. Tömegjelenségen pedig olyan jelenséget értünk, amely nagy számban megy végbe egyszerre (pl. populációk elvándorlása), vagy sokszor megismételhető (pl. szerencsejátékok). A levonható törvényszerűségek statisztikai jellegűek, azaz nagy számú végrehajtás során átlagosan érvényes törvények. A véletlen jelenségek leírására sztochasztikus modelleket használunk. Ilyen modellek esetén az adott feltételrendszer nem határozza meg egyértelműen, hogy egy esemény bekövetkezik-e, vagy sem. Ezzel ellentétben, az ún. determinisztikus modellek esetén a tekintetbe vett feltételrendszer egyértelműen meghatározza, hogy egy adott esemény bekövetkezik-e, vagy sem. A jelenségek különböző aspektusból más és más (determinisztikus, illetve sztochasztikus) modellel is leírhatóak.
Definíciók, tulajdonságok Definíció Egy adott kísérlet lehetséges kimeneteleit elemi eseményeknek nevezzük és ω 1,ω 2,...-el jelöljük. Az elemi események csak egyféleképp következhetnek be (pl. egy kockával egyféleképp dobhatunk 6-ost). Az adott kísérlethez tartozó összes elemi események halmazát eseménytérnek nevezzük és Ω-val jelöljük. Az elemi eseményekből álló halmazokat eseményeknek nevezzük (pl. 3-ast, vagy 4-est dobunk a kockával. Vagy két kockával dobva az összeg 10). Az eseményeket rendszerint A,B,C,...-vel, míg az összes események halmazát F -el jelöljük. Műveletek események között Események összege: Az A és B események összegén azt az A + B eseményt értjük, amely akkor következik be, ha vagy A, vagy B, vagy mindkettő bekövetkezik. Nyilván A + B = A B a halmazelméleti unió műveletét használva. Tetszőleges (véges, vagy végtelen) sok esemény összege olyan esemény, mely akkor következik be, ha az összeadandóknak legalább az egyike bekövetkezik.
Definíciók, tulajdonságok Műveletek események között Események szorzata: Az A és B események szorzatán azt az A B eseményt értjük, mely akkor következik be, ha mind A, mind B bekövetkezik. Nyilván A B = A B. Tetszőleges sok esemény szorzata az az esemény, amely akkor következik be, ha a tényezők mindegyike bekövetkezik. Esemény ellentettje: Az A esemény ellentettjén azt az A eseményt értjük, mely akkor következik be, ha A nem következik be. A nyilván A-nak Ω-ra vonatkozó komplementere. Események különbsége: Az A B akkor következik be, ha A bekövetkezik, de B nem. Események szimmetrikus differenciája: A B akkor következik be, ha A és B közül pontosan egy következik be.
Definíciók, tulajdonságok - Példa 1 Dobókocka feldobásánál 6 lehetséges kimenetelünk van, így az elemi események: ω 1 = 1,ω 2 = 2,...,ω 6 = 6. Az eseménytér így: Ω = {1,2,3,4,5,6}. Legyen A az az esemény, hogy páros számot dobunk, B pedig azt, hogy 3-nál nagyobbat. Ekkor: A = {2,4,6}, B = {4,5,6}. 2 Húzzunk 32 lapos "Magyar-kártya" pakliból egy lapot. Ekkor Ω egy 32 elemű halmaz. Legyen A az az esemény, hogy pirosat húztunk, B pedig azt, hogy 7-est. Ekkor: A = {p 7,p 8,p 9,p 10,p A,p F,p K,p Á }, B = {p 7,t 7,m 7,z 7 }. 3 Dobjunk fel egy érmét kétszer egymás után! Itt Ω = {FF,II,FI,IF}, ahol például IF =elsőre írást dobtunk, másodjára fejet.
Definíciók, tulajdonságok - Példa 4 Dobjunk egy pontot véletlenszerűen a [0,1] intervallumra! Ekkor Ω = [0,1]. Jelölje A azt, hogy a pont a [0, 1 / 2 ]-re esik. Ekkor A = [0, 1 / 2 ]. 5 Dobjunk fel egy érmét annyiszor, amíg fejet nem kapunk! Ekkor Ω = {ω 1,ω 2,...,ω }, ahol ω 1 = F,ω 2 = IF,ω 3 = IIF,... Ekkor ω azt a lehetséges kimenetelt jelenti, amikor végtelen sok írást dobunk egymás után. Jelölje A n azt az eseményt, hogy a kísérlet legfeljebb n dobásig tart. Ekkor A = {ω 1,ω 2,...,ω n }. Statisztikai megvilágítás Dobjunk fel egy pénzérmét "sokszor" és írjuk fel, hogy milyen sorozatot kaptunk (pl. FIIFIFFF...). Ha n dobásból k fejet kapunk, akkor k-t a fej dobások gyakoriságának, míg k n-et a fej dobások relatív gyakoriságának nevezzük. Például az FIIFIFFF... sorozat esetén a relatív gyakoriságok sorozata: 1 1, 1 2, 1 3, 2 4, 2 5, 3 6, 4 7, 5 8,...
Definíciók, tulajdonságok - Példa Az így kapott sorozat nem "szabályos" sorozat, a hagyományos matematikai értelemben (egyelőre) nem állíthatjuk róla, hogy konvergens. Csupán annyi látható, hogy "szabálytalan, véletlen ingadozásokat" mutató sorozat, és a kísérlet újabb végrehajtásakor másik "szabálytalan" sorozat jön ki. Csupán annyit remélhetünk, hogy valamilyen (homályos) értelemben 1 2 körül ingadozik (mivel az érme szabályos). A jelenségek egy részénél a relatív gyakoriság stabilitást mutat. Pontosabban fogalmazva, tekintsünk egy kísérletet és ehhez kapcsolódva egy A eseményt. Hajtsuk végre a kísérletet n-szer, egymástól függetlenül, azonos körülmények között. Jelölje k A az A bekövetkezései számát. Ha a k A n relatív gyakoriság nagy n esetén egy fix szám körül ingadozik, akkor ezt az A-ra jellemző számot P(A)-val jelöljük és A valószínűségének nevezzük. Ez a gondolatmenet azonban távol áll egy pontos matematikai definíciótól.
Definíciók, tulajdonságok Definíció Az (Ω,F,P) hármast valószínűségi mezőnek nevezzük, ha Ω az eseménytér, F az események halmaza és P : F R egy olyan függvény, melyre P(A) 0 (bármely esemény legalább 0% eséllyel előfordul). P(Ω) = 1 (az eseménytérből valami 100% eséllyel elő fog fordulni). P(A 1 + A 2 +...) = P(A 1 ) + P(A 2 ) +..., ha A i Ω, i = 1,2,... és A i A j = /0, ha i j (ha az események egymást kizárják, akkor az egyes valószínűségek összeadódnak. Pl. annak az esélye, hogy egy kockával 3-ast, vagy 5-öst dobunk egyenlő annak az esélyével, hogy 3-ast plusz annak az esélyével, hogy 5-öst). A P függvényt valószínűségnek nevezzük, a fenti három tulajdonságot pedig a valószínűségfüggvény axiómáinak nevezzük.
Definíciók, tulajdonságok Tétel - A valószínűség tulajdonságai P(/0) = 0 (annak az esélye, hogy nem következik be semmi 0). P(A B) = P(A) P(A B) (az A eseményből kivonjuk az A és B események metszetét). P(A + B) = P(A) + P(B) P(A B) (szita-formula). P(A) = 1 P(A) (ha pl. 80% eséllyel esik ma az eső, akkor 100% 80% = 20% eséllyel nem). Ha B A, akkor P(B) P(A) (a valószínűség monoton). Definíció Azt mondjuk, hogy az A és B események függetlenek, ha együttes bekövetkezésük esélye ugyanannyi, mint a külön-külön történő bekövetkezésük esélyének szorzata, azaz ha P(A B) = P(A) P(B).
Véges valószínűségi mezők Tegyük fel, hogy egy kísérlet kimenetelei (az elemi események száma) N, azaz Ω = {ω 1,...,ω N }. Jelölje p i az ω i elemi esemény valószínűségét: p i = P(ω i ), i = 1,2,...,N. Mivel a valószínűség additív, így N N i P(ω i ) = P(Ω) = 1. i=1p i=1 Tehát a p i számok összege 1. Továbbá ( ) P(A) = P ω i A = p i. ω i A
Véges valószínűségi mezők - klasszikus valószínűségi mező Azaz egy A esemény valószínűségét úgy számítjuk ki, hogy az A-t alkotó elemi események valószínűségeit összeadjuk. Megfordítva, legyen N pozitív egész, és legyen adott N db nemnegatív, 1 összegű szám: p 1,p 2,...,p N. Ekkor van olyan véges valószínűségi mező, hogy ezen p 1,p 2,...,p N számok éppen az elemi események valószínűségei. Legyen ugyanis Ω = {ω 1,...,ω N } tetszőleges N elemű halmaz és legyen P(A) = p i, ha A Ω. Ez a ω i A P függvény nyilván teljesíti a valószínűségfüggvény axiómáit. Olyan kísérleteknél, ahol a lehetséges kimenetelek száma véges és egyforma eséllyel fordulnak elő az elemi események valószínűségei: p i = 1 N, i = 1,2,...,N. Így P(A) = k N = kedvező esetek száma összes esetek száma. Ez a valószínűség klasszikus kiszámítási módja.
Véges valószínűségi mezők - klasszikus valószínűségi mező A fenti képlet persze nem állja meg a helyét a valószínűség definíciójaként (bár kezdetben arra használták), hiszen egyrészt nem minden kísérlet írható le klasszikus valószínűségi mezővel, másrészt a fenti képlet során feltételeztük az "egyforma valószínűségeket", így a definícióhoz már eleve felhasználnánk a valószínűség fogalmát. Példák - folytatás 1 Szabályos kocka feldobásakor az elemi események valószínűsége 1 6. A páros dobás valószínűsége: P(A) = 3 6 = 1 2. 2 Egy kártya kihúzásának valószínűsége 1 32. Piros húzás esélye: P(A) = 8 32 = 1 4. 3 Két érme feldobásakor minden elemi esemény 1 4 valószínűségű (IF FI, így hibás "egy fej, egy írásként" gondolni erre a két esetre). 4 Egy pont [0,1]-re való dobása nem írható le véges valószínűségi mezővel.
Véges valószínűségi mezők - klasszikus valószínűségi mező 5 Ha nézzük a szabályos érme N-szer történő feldobását, úgy látható, hogy ez a kísérlet nem írható le egyetlen valószínűségi mezővel (jelenlegi tudásunk alapján). Nézzük meg, hogy az egyes ω i, i = 1,2,... elemi események mekkora eséllyel fordulnak elő: P(ω 1 ) = 1 / 2, hisz annak az esélye, hogy egyből fejet dobunk 50%. P(ω 2 ) = 1 / 4, az írás, majd fej dobás esélye 1 / 2 1/ 2.... P(ω N ) = (1 / 2 ) N, hisz a pénzérme minden dobásakor 1 / 2 eséllyel jön ki írás és fej is. Így ha az A n valószínűségét keressük, akkor a tanult képlet alapján: P(A n ) = 1 / 2 + 1 / 4 + 1 / 8 +... + (1 / 2 ) n, ami nem más, mint 1 (1 / 2 ) n. Így, ha n-el végtelenbe tartunk, akkor a korábban tanultak alapján tényleg kijön a szükséges 1 valószínűség, mint határérték.
Feltételes valószínűség Definíció Legyen A és B két esemény, P(B) > 0. Ekkor az A esemény B-re vonatkozó feltételes valószínűsége alatt a értéket értjük. P(A B) = P(A B) P(B) Példa Lényegében az egész eseménytér egy részére szűkítjük csak le a vizsgálatainkat. Tekintsünk egy 10000 fős gorillapopulációt, amiben 5050 nőstény és 4950 hím egyed van. A nőstények között 100, a hímek között 900 180 kg-nál nehezebb található. Ha véletlenszerűen kiválasztunk egy egyedet a populációból, akkor annak a valószínűsége, hogy 180 kg-nál nehezebb 0,1. Ha a nőstények közül választunk ki, akkor ez 100/5050 = 0, 0198.
Feltételes valószínűség Ugyanez képlettel számolva: ha A jelöli azt az eseményt, hogy az egyed 180 kg-nál nehezebb és B azt, hogy az egyed nőstény, akkor P(A B) = P(A B) P(B) = 100 / 10000 5050 / 10000 = 100 5050 = 0,0198. Azaz először kiszámoltuk azt, hogy mekkora valószínűséggel lesz az adott egyed nőstény és 180 kb-nál nehezebb is. Ez nem más, mint: P(A B) = 100 10000, hisz a teljes populációban összesen 100 megfelelő súlyú nőstény egyed van. Majd kiszámoltuk annak az esélyét, hogy az egyed nőstény: P(B) = 5050 10000 (itt most nem volt semmi feltevésünk a tömegre vonatkozóan, csak arra voltunk kíváncsiak, hogy mekkora eséllyel választunk nőstényt). Végül a két számot elosztottuk egymással és megkaptuk a végeredményt.
Feltételes valószínűség Definíció Események egy A 1,A 2,... sorozatát teljes eseményrendszernek nevezzük, ha egymást páronként teljesen kizárják és összegük az egész eseménytér. Tétel - A teljes valószínűség tétele Legyen A 1,A 2,... egy pozitív valószínűségű eseményekből álló teljes eseményrendszer. Ekkor bármely B eseményre Tétel - Bayes tétele P(B) = P(B A 1 )P(A 1 ) + P(B A 2 )P(A 2 ) +... Legyen A 1,A 2,... egy pozitív valószínűségű eseményekből álló teljes eseményrendszer. Ekkor bármely A pozitív valószínűségű esemény esetén P(A i B) = P(B A i)p(a i ) j=1 P(B A j )P(A j ).
Biológiai példák Egy házaspár egyik tagja 40% eséllyel BB-s és 60% eséllyel B0-s vércsoportú, míg a másik tagja 30% eséllyel AA-s és 70% eséllyel A0-s. Mekkora valószínűséggel lesz a gyermekük 0-s vércsoportú? Az öröklődés jobb megértéséhez elkészítjük a B0 és A0 esetben az ún. B 0 Punett táblázatot: A AB A0 0 B0 00 Látható, hogy ebben az esetben a születendő utód 25% eséllyel lesz 0-s vércsoportú. Hasonlóan gondolkozva, íme a lehetséges párosítások a megfelelő valószínűségekkel: AA + BB 0%. AA + B0 0%. A0 + BB 0%. A0 + B0 25%.
Biológiai példák Következő lépésben meg kell néznünk, hogy az egyes szülői párosítások mekkora eséllyel fordulnak elő: AA + BB 0,3 0,4 = 0,12 = 12%. AA + B0 0,3 0,6 = 0,18 = 18%. A0 + BB 0,7 0,4 = 0,28 = 28%. A0 + B0 0,7 0,6 = 0,42 = 42%. (Látható, hogy összeadva tényleg kiadják a 100%-ot). Így annak az esélye, hogy a gyermek 0-s vércsoportú lesz: 0,12 0 + 0,18 0 + 0,28 0 + 0,42 0,25 = 0,105 = 10,5%
Biológiai példák Radioaktív sugárzás hatását vizsgáljuk egy sejttenyészetre. Egy adott α részecske valamely sejtet 25% eséllyel károsítja, 50% eséllyel el is pusztítja, míg 25% eséllyel nem találja el. Két részecske által okozott találat viszont mindenképp a sejt pusztulását okozza. Mekkora eséllyel fog 4 adagnyi besugárzás során a sejt elpusztulni? Legyen az az esemény, hogy a részecske elpusztítja a sejtet A, az, hogy károsítja B, az pedig, hogy nem találja el C. Ekkor P(A) = 0,5, P(B) = 0,25, P(C) = 0,25. Tekintsük az X 1 X 2 X 3 X 4 eseménysorozatot, ahol X i {A,B,C}. A sejt pusztulása akkor következik be, ha a sorozatban van A, vagy ha nincs, akkor legalább két B van benne. Annak a valószínűsége, hogy egy részecske sem pusztítja el közvetlenül a sejtet (azaz A) 0,5 4. Így annak az esélye, hogy lesz közte A: 1 0,5 4.
Biológiai példák Annak a valószínűsége, hogy legalább 2 darab B jelenik meg és 0 darab A: [( ) ( ) ( )] 4 4 4 0,25 4 + + = 11 0,25 4, 2 3 4 hiszen pl. az első esetben annak az esélye, hogy 2 darab B éri majd 0,25 2, míg, hogy 2 darab "nem talált", ismét 0,25 2. De meg is kell mondani, hogy a 4 besugárzásból melyik 2-nél érte B, ami ( ) 4 2 féleképp lehetséges (a második esetben 3 darab B éri 0,25 3 eséllyel és egy darab C 0,25 eséllyel, stb.) Így annak az esélye, hogy a sejt elpusztul: (1 0,5 4 ) + 11 0,25 4 = 0,9805 = 98,05%.