FELTÉTELES VALÓSZÍNŰSÉG, TELJES VALÓSZÍNŰSÉG TÉTELE, BAYES TÉTELE 1. Egy alkalmassági vizsgálat adatai szerint a vizsgált személyeken 0,05 valószínűséggel mozgásszervi és 0,03 valószínűséggel érzékszervi rendellenesség figyelhető meg. Az együttes előfordulás valószínűsége 0,01. a) Mennyi a valószínűsége annak, hogy egy találomra kiválasztott személyen egyik rendellenesség sem figyelhető meg? b) Mekkora lenne az együttes előfordulás valószínűsége, ha a két rendellenesség előfordulása független lenne? c) Mekkora valószínűséggel találunk érzékszervi rendellenességet a mozgásszervi rendelleneséggel rendelkező egyéneknél és fordítva: mekkora a mozgásszervi rendellenesség valószínűsége feltéve, hogy az egyén rendelkezik érzékszervi rendellenességgel?. Az I. kontingenciatáblázat a tüdőrák és a dohányzás, mint rizikófaktor kapcsolatát leíró vizsgálat adatait tartalmazza. Tekintsük az események (közelítő) valószínűségeinek megfelelő relatív gyakoriságokat. a) Fejezzük ki ennek megfelelően esetszámokkal a P(C S) és P(C S ) feltételes valószínűségeket, illetve a P(C S) hányadosként definiált relatív kockázatot. b) Mennyi lenne a relatív P(C S) kockázat, ha a tüdőrák a dohányzástól függetlenül alakulna ki? c) Milyen esetben lenne a relatív kockázat kisebb egynél? S S C 1350 7 C 196 61 I. kontingenciatáblázat S: dohányos C: tüdőrákos A A B B 9 10 II. kontingenciatáblázat A: a vizsgált személy A vércsoportú B: a vizsgált személy férfi 3. A II. kontingenciatáblázat hiányos. Egészítsük ki úgy, hogy a relatív gyakoriságok a vércsoport és a nem függetlenségét tükrözzék!. A III. kontingenciatáblázat egy új gyógyszer bevezetésével kapcsolatos vizsgálatok eredményeit tartalmazza. A betegek egy része az új gyógyszert kapta, másik része placebót. a) Mi a valószínűsége (a relatív gyakoriságokkal a valószínűségeket egyenlőnek tekintve), hogy valaki meggyógyul, ha gyógyszert illetve ha placebót kap? b) Mekkora a gyógyulás valószínűsége az egész betegmintában? c) Egy véletlenszerűen kiválasztott gyógyult beteg milyen valószínűséggel volt a placebóval illetve az új gyógyszerrel kezelt csoportban? K K G 7 31 G 58 9 III. kontingenciatáblázat K: új gyógyszert kapott K: placebót kapott G: gyógyult F 1 F F 3 F össz. 100 1000 100 100 H 71 63 3 9 M 3 IV. táblázat össz: a csoport összlétszáma H: gyógyultak száma M: mellékhatás jelentkezett 1
5. Készíts egy kontingenciatáblázatot, ami a kezelés hatástalanságát tükrözi! 100 emberből 80-at egy új gyógyszerrel, 0-at placebóval kezeltek, mindkét csoportban 30% gyógyult. 6. Az előbbihez hasonló vizsgálatban csopotra osztották a betegeket: régi gyógyszert (F 1 ), új gyógyszert (F ), placebót (F 3 ), illetve semmit sem (F ) kaptak. A kísérlet célja a kezelés hatásosságának (H) és egy lehetséges mellékhatás (M) veszélyének a vizsgálata. (Hasonló jellegű, kezeletlen kontrollt is figyelembe vevő hosszútávú vizsgálatot végeznek az USA-ban az idős nők csontritkulás elleni hormonkezelése és a mellrák, mint lehetséges mellékhatás összefüggéseinek vizsgálatára. Az itt felhasznált adatok fiktívek.).a IV. táblázat adatai alapján becsüljük meg a következő valószínűségeket: P(H F 1), P(H F ), P(H F 3), P(H F ), P(F 1 H), P(F H), P(F M), P(F M)! Abból, hogy P(F1 H) < P(F H) következik-e, hogy az új gyógyszer jobb mint a régi? Az új gyógyszer használata tényleg növeli a káros mellékhatásként feltételezett jelenség (pl. mellrák) kialakulásának esélyét? 7. A feniltiokarbamid keserű ízének érzékelését a T, t betűkkel jelzett allélpár határozza meg: a TT és Tt genotípusú egyének a vegyület keserű ízét érzik, a tt genotípusúak nem. Egy nem ízérző egyén szülei ízérzők, testvérének felesége pedig nem ízérző. a) Mekkora a valószínűsége annak, hogy a testvér illetve annak gyermeke ízérző? b) Az először említett egyén egy másik tesvérének férje ízérző. Ennek a férjnek a szüleiről nem tudunk semmit, de tudjuk, hogy a populációban 19% TT, 50% Tt és 31 % tt. Ennek a másik testvérnek és férjének gyermeke milyen valószínűséggel lesz ízérző? 8. A vérzékenység X kromoszómához kötött recesszív betegség. X + és X v legyen a vad és a mutáns típusú allélt hordozó X kromoszómák jele. Vérzékenyek tehát az X v X v és X v Y genotípusú egyének. Egy családban a feleség anyai nagyapja vérzékeny volt, más senki. a)milyen valószínűséggel lesz ennek az asszonynak az első gyermeke vérzékeny? Ha tudjuk, hogy ennek az asszonynak az első gyermeke vérzékeny fiú, milyen valószínűséggel lesz a második gyermek vérzékeny? b)egy másik családban a feleség apai nagyapja vérzékeny, más nem. Válaszoljunk ugyanarra a két kérdésre, figyelembe véve, hogy X v gyakorisága a populációban 0,001. 9. Recesszív autószómás betegségben szenvednek az I. pedigrén sötéttel jelölt egyének. a) 7. és 8. egyének tervezett gyermeke(10.) milyen valószínűséggel lesz beteg illetve hordozó? b) Mi a valószínűsége, hogy a. egyén hordozó annak ismeretében, hogy egyrészt a populációban a káros allél gyakorisága 0,053, másrészt született két egészséges gyermeke (mint a pedigrén jelöltük).változik-e ez a valószínűség, ha születik még egy egészséges fenotípusú gyermeke (amely a pedigrén nincs feltüntetve)? (Hardy-Weinberg egyensúlyt feltételezünk.) 1 3 AB 0 AA A0 AB A? 1 3 1 5 6 7 8 9 10? 5 6? AB 7 B AB? 3 5 6 B I. pedigré II. pedigré III. pedigré
10. a) Milyen valószínűséggel lesz a II. pedigrén látható 6. egyén AA illetve A0 vércsoportú? b) Hogyan változik meg ez a valószínűség, ha a 6. egyénnek születik még két AB-s gyermeke (akik a pedigrén nincsenek feltüntetve), illetve, ha összesen 10 AB-s gyermeke lesz? c) És mit mondhatunk, ha ezek után a házaspár tizenegyedik gyermeke B vércsoportú lesz? (A feladat megoldása során gondoljuk meg, hogy mit is jelent az, hogy változik a 6. egyén AA vércsoportba tartozásának valószínűsége, miközben több gyermeke születik - végül is az egyén és vércsoportja változatlan marad?) 11. Milyen lehet a III. pedigrén található. egyén vércsoportja és milyen valószínűségekkel? 1. Az anya kék szemű (ez a recesszív jelleg), az apa barna. Milyen valószínűséggel tarthatjuk az apát homozigótának a szemszínre nézve, ha a) 1 barna szemű gyermekük születik, illetve b) ha 3 barna szemű gyermekük születik? A populációban a domináns, barna szemszínt okozó allél gyakorisága 0,6. 13. Az orvosi diagnosztikában használatos két feltételes valószínűséggel definiált fogalom:szenzitivitásnak nevezik annak a valószínűségét, hogy pozitív vizsgálati anyag esetén az eredmény is pozitív (tbc-s mintára tényleg tbc-t jelez); a specificitás annak a valószínűsége, hogy az adott vizsgálat negatív minta esetén negatív eredményt ad (az egészséges mintára egészségest jelez). Tüdőszűrés alkalmával a betegek 90%-ánál a vizsgálat kimutatja a betegséget. Egészséges embernél - hamisan - 1% gyakorisággal beteget jelez. a) Mennyi a szenzitivitás és a specificitás? b) A szűrésre kerülők között a tbc gyakorisága 5/10 000.Mennyi a valószínűsége annak, hogy valakit véletlenszerűen kiválasztva betegséget állapítunk meg és az illető valóban beteg? Mi a valószínűsége, hogy a vizsgált személy valóban tbc-s, ha betegséget állapítottak meg? 1. A tüdőrák gyakorisága az 50 éven felüli korosztályban egy felmérés szerint: a nem-dohányzók közt 5%, a passzív dohányosok között 17% és az aktív dohányosok között 8%. A városban az aktív, a passzív és a nem-dohányzók aránya 1/3, 1/3 és 1/3; B városban az intenzív propagandának köszönhetően 0,05, 0,05 és 0,9. a) Mekkora a valószínűsége, hogy egy véletlenszerűen kiválasztott egyén tüdőrákos A ill. B városban? b) Mekkora a valószínűsége, hogy egy tüdőrákos egyén az aktív, a passzív ill. a nem-dohányzók csoportjába tartozik A ill. B városban? 15. Mi a valószínűsége, hogy az emberi sejt meiózisa során az egyik haploid utódsejtbe csak anyai eredetű kromoszómák kerülnek, ill. hogy 7 anyai és 16 apai? Megoldások: 1. a) 0,93 b) 0,0015 c )0,, 1/3.. a) ((1350/66)/(7/68))=,96. b) 1. c) ha a nem dohányosok kapnának nagy eséllyel tüdőrákot vagy pl. ha S jelentése: tiszta levegőjű helyen lakik. 3. 3,6-nek adódna, de egy konkrét vizsgálatnál egész számnak kell lennie, 3 vagy, sok ilyen vizsgálat átlagában 3,6.. a) 0,93 ill. 0,39. b) 0,88 c) 0,0 ill. 0,96. 5. A táblázatba a következő esetszám kerül:, 56, 6, 1. 6. 0,71, 0,63, 0,3, 0,09, 0,097, 0,86, 0,73, 0,06. Nem, az új gyógyszer rosszabb ( P H F ) ( 1 és P H F ) viszonya számít). Az adatok alapján nem valószínű, hogy az új gyógyszer növeli ( a mellékhatás kockázatát, hiszen a placebós csoportban nagyobb a mellékhatás gyakorisága. (Természetesen több adatra és statisztikai próbára van szükség a pontos válaszhoz.) 3
7. a) 0,75 ill. 0,5 b) Számítsuk ki annak a valószínűségét, hogy nem ízérző, vagyis mindkét szülőtől t allélt kap! 1/ a valószínűsége, hogy anyjától t allélt kap, hiszen anyai nagyszülei mindketten Tt genotípusúak és e négy nagyszülői allél közül mindegyiket egyforma valószínűséggel kaphatta az anyja által. Az apja 50/69 valószínűséggel Tt (és 19/69 valószínűséggel TT), tehát a gyerek 1/ * 50/69 * 1/ = 0,18 valószínűséggel tt. 8. a) A feleség anyja biztosan X v X +, mert apjától örökölte a mutáns allélt, de maga nem beteg, a feleség apja pedig X + Y (egészséges). A feleség tehát 1/ valószínűséggel hordozó, vagyis 1/ a valószínűsége, hogy mutáns allélt örökít. Ha fia születik, 1/ valószínűséggel lesz vérzékeny, ha lánya, 1/ valószínűséggel lesz hordozó (a lánygyerek nem lehet vérzékeny mert a férj egészséges). Ha tudjuk, hogy az asszonynak már született vérzékeny fia, akkor az asszony biztosan X v X +, tehát további fiai 1/ valószínűséggel lesznek vérzékenyek, további lányai 1/ valószínűséggel hordozók.b) Az apai nagyapja nem örökíthette a feleségre a mutáns allélt, azért a feleség csak 0,001 valószínűséggel hordozó, (hiszen anyjától kapott allélje ismeretlen, apjától pedig vad típusú allélt örökölt). Első fia tehát 0,0005 valószínűséggel lesz vérzékeny. Viszont ha már van vérzékeny gyermeke, akkor ugyanúgy mint az a) pontnál a feleség biztosan X v X +, stb. 9. a) 7. egyén szülei hordozók, tehát ő /3 valószínűséggel hordozó (Aa), 1/3 valószínűséggel AA, 8. egyén biztosan Aa. A teljes val. tétele alapján 10. egyén aa genotípusú (beteg) 1/ * /3 + 0 * 1/3 = 1/6 valószínűséggel és hordozó 1/ * /3 + 1/ * 1/3 = 1/ valószínűséggel. b) A. egyén lehet AA illetve Aa; ezen események a priori valószínűségeit az allélgyakoriság alapján számítjuk. Genotípusgyakoriságok a populációban: AA: 0,897, Aa: 0,100; annak a valószínűsége, hogy egy egészséges fenotípusú egyén AA: P(F 1 ) = 0,897/(0,897+0,100) = 0,900, ill. Aa P(F ) = 0,100 valószínűséggel. Tudjuk még. egyénről, hogy gyermekeinek kétszer adott A allélt (E esemény); ez P(E F 1 ) = 1 valószínűséggel következik be ha a. egyén AA, és P(E F ) = 1/ valószínűségű ha ő Aa. Így Bayes tétele alapján annak a valószínűsége, hogy a. egyén hordozó: P(F E) = 1/ * 0,1 / (1 * 0,9 + 1/ * 0,1) = 1/37. Ha még egy egészséges gyermeke van P(E F ) = 1/8-ra változik, tehát P(F E) = 1/8 * 0,1 / (1 * 0,9 + 1/8 * 0,1) = 1/73. 10. Az 5. egyén B0 genotípusú, tehát 7. az A allélt csak 6.-tól kaphatta. a) Az előző feladathoz hasonlóan: szülei alapján 6. AA genotípusú P(F 1 ) = 1/ valószínűséggel illetve A0 P(F ) = 1/ valószínűséggel. E = gyermekének egyszer A allélt ad, P(E F 1 ) = 1, és P(E F ) = 1/. P(F 1 E) = 1* 1/ / (1 * 1/ + 1/ * 1/) = /3 valószínűségű, hogy 6. egyed AA, P(F E)=.1/3. b) P(F 1 E) = 8/9 ill. 10/105. c) Csak úgy lehet, ha 6. egyén 0-s allélt adott, tehát ő biztosan A0. A 6. egyén genotípusára vonatkozó valószínűségeket a következőképpen kell érteni: ha nagyon sok olyan családot megvizsgálnánk mint a II. pedigrén látható, akkor /3 részükben a 6. egyénnek megfelelő személy AA vércsoportú lenne, 1/3 részükben pedig A0. Ha sok olyan családot megvizsgálnánk ami a b) pontban van leírva, (tehát 3 ill. 10 AB-s gyerekük van) akkor csak 1/9 ill. 1/10 részükben találnánk azt, hogy a 6. egyénnek megfelelő személy A0. 11. Mivel a. egyén csak A0 lehet,. egyén szülei alapján 1/-1/ valószínűséggel lehet AA (F 1 ), A0 (F ), AB (F 3 ), B0 (F ). Tudjuk, hogy gyermekének A allélt adott (E), ennek feltételes valószínűségei: P(E F 1 ) = 1, P(E F ) = 1/, P(E F 3 ) = 1/, P(E F ) = 0. Bayes tételével: P(F 1 E) = 1* 1/ / (1 * 1/ + 1/ * 1/ + 1/ * 1/ + 0 * 1/) = 1/, P(F E) = 1/, P(F 3 E) = 1/, P(F E) = 0. 1.a) Bayes tételével: P(F 1 E) = 1* 0,3 / (1 * 0,3 + 1/ * 0,57) = 0,6. b) 0,86. 13. a) 0,9 és 0,99. b) Legyen F 1 : egy vizsgált szemály tbc-s, F : egészséges; E 1 : a vizsgálat eredménye pozitív, E : negatív. P(E 1 F 1 ) = P(E 1 F 1 )*P(F 1 ) = 0,0005; P(F 1 E 1 ) = 0,9*0,0005 / (0,9*0,0005 + 0,01*0,9995) = 0,03, tehát a pozítív eredményt kézhez kapó vizsgált személyeknek csak,3%-a beteg. 1. a) teljes val. tételével 1/3*0,05 + 1/3*0,17 + 1/3*0,8 = 0,167 ill. 0,0675 b) A városban:0,56, 0,3 és 0,1; B városban 0,1, 0,1 és 0,67.
DISZKRÉT ELOSZLÁSOK I. BINOMIÁLIS ELOSZLÁS. Egy kísérlet egyszeri végrehajtásakor az A esemény bekövetkezésének valószínűsége q. Ha a kísérletet egymás után n-szer függetlenül elvégezzük, mi a valószínűsége, hogy A éppen k-szor következik be? Urnamodell: visszatevéses mintavétel. n k n k P( ζ = k) = pk = q ( 1 q), E( ζ ) = nq, V ( ζ ) = nq(1 q) k 1. Homozigóta gömbölyű és szögletes borsót kereszteztünk, az F nemzedéket képviselő borsókat egy urnába helyezzük. Véletlenszerűen 6 borsót kihúzunk, mindig visszatéve a kihúzott szemet az újabb húzás előtt. Mi a valószínűsége, hogy éppen gömbölyű lesz köztük? Minden egyes sorrend valószínűsége: 1 3 3 3 1 3 3 1 Hányféle sorrend lehetséges? 3 1 1 3 3 3 6 Tehát annak a valószínűsége, hogy 6 kihúzott borsó között éppen kerek: 6 3 1 Mi a valószínűsége annak, hogy 0 gömbölyű lesz; annak, hogy 1 gömbölyű,,...ill. 6? Mennyi a gömbölyűek számának várható értéke és varianciája? = p0 p = 1 p = p p p p = 0, 13 = 0, 97 = 0, 356 = 0, 178 3 5 6. A férj apja és a feleség anyja ugyanabban a recesszív autószómás betegségben szenved, ők maguk és más nem érintett a családban. 6 gyermeket szeretnének. Mi a valószínűsége, hogy egy sem lesz beteg, hogy legfeljebb beteg lesz, hogy legalább 3 egészséges lesz, ill. hogy legalább egészséges lesz? Mennyi a betegek számának várható értéke és varianciája? II. POISSON ELOSZLÁS. Tudjuk, hogy a pillanatszerű A esemény egységnyi időtartam alatt átlagosan λ-szor fordul elő (egy pontszerű objektum egységnyi területen átlagosan λ-szor fordul elő). Mi a valószínűsége, hogy egy konkrét esetben éppen k- szor következik be? (A Poisson eloszlást akkor használhatjuk, ha az esemény 5
pillanatszerű, tehát az egységnyi időtartam alatt az átlagnál sokkal többször is bekövetkezhet, persze kis valószínűséggel; azonkívül egymástól függetlenek a bekövetkezések. ) k λ λ P ( ζ = k) = pk = e E( ζ) = λ, V ( ζ) = λ. k! 3. Az előző feladatban említett betegség gyakorisága a népességben 5/10 000. Mi a valószínűsége, hogy egy 5000 lélekszámú faluban több mint 3 beteg lakik? Mennyi a betegek számának várható értéke és varianciája?. Salvadore Luria és Max Delbrück 193-ban végezték el híres kísérletüket, melyben igazolták, hogy az E. coli-ban kialakuló T1 fág elleni rezisztencia nem fiziológiai változás hanem mutáció eredménye és a mutációs rátát is meghatározták. Ez utóbbi kiszámításakor T1 szenzitív baktériumokat szaporítottak *10 7 db/kémcső sűrűségig, majd a baktériumot tartalmazó szuszpenziót T1 fággal kevert táptalajon növesztve megszámlálták a kinövő rezisztens (mutáns) baktériumtelepeket. A problámát az jelenti, hogy ha találunk pl. 156 rezisztens kolóniát, nem tudhatjuk, hogy ezek hány mutációs esemény eredményeként keletkeztek, lehet hogy csak egy mutáció történt, de azóta 7-8 sejtosztódási ciklus során elszaporodtak a mutáns utódai. Mivel a mutációk átlagos száma kémcsövenként jóval kisebb mint az elvileg lehetséges (*10 7 ) és az egyes mutációk egymástól függetlenül történnek joggal mondhatjuk a mutációk (de nem a mutáns baktériumok!) kémcsövenkénti számát Poisson eloszlásúnak. (Binomiálissal is számolhatunk, csak kissé fáradtságos...). Luria és Delbrück 0 kémcsövet vizsgáltak meg és ezek közül 11-ben nem történt mutáció (nem nőtt ki rezisztens telep), 9 kémcső tartalma változó számú rezisztens telepet eredményezett, de mint fent említettük, a telepek számából nem következtethetünk a mutációs események számára. Szerencsére azonban a mutánst nem tartalmazó kémcsövek aránya már elegendő a Poisson eloszlás átlagának meghatározásához, abból pedig könnyen kiszámítható a sejtosztódásonkénti mutációs ráta. Hogyan? III. HIPERGEOMETRIKUS ELOSZLÁS. Urnamodell: visszatevés nélküli mintavétel. Egy urnában összesen m db golyó van: ebből s piros és m-s fehér. Mi a annak a valószínűsége, hogy n db-ot kihúzva visszatevés nélkül, éppen k db lesz piros? összesen m golyó: s piros m-s fehér Az összesen s pirosból ennyiféleképpen lehet éppen k-t húzni Az összesen m-s pirosból ennyiféleképpen lehet éppen n-k-t húzni k piros kihúzunk n-et: n-k fehér s s s n 1 E( ζ ) = n, V ( ζ ) = n 1 1 m m m m 1 P(ζ = k) = p k s m s k n k = m n kedvező esetek száma (éppen k db pirosat húztunk) összes lehetséges húzások sz. 5. 1 borsószem van egy urnában: 9 gömbölyű és 3 szögletes. Véletlenszerűen 6-ot húzok visszatevés nélkül. a)mi a valószínűsége, hogy mind gömbölyű, hogy legfeljebb szögletes, hogy legalább 3 illetve legalább gömbölyű? Mennyi a gömbölyűek számának várható értéke és varianciája? b) Hogyan változnak ezek az eredmények, ha 60 borsó van az urnában: 5 gömbölyű és 15 szögletes (szintén 6-ot húzunk)? 6
VEGYES FELADATOK. 6. A 0 éves anyák között kb. 1/100 a Down-kóros gyermek szülésének esélye. 100 ilyen gyermek között mekkora valószínűséggel találunk több mint Down-kórost? Oldjuk meg binomiális eloszlást használva és Poisson közelítéssel is. 7. A spórák eloszlása a talajban véletlenszerű (Poisson eloszlású). A minták 1/3 részében egyáltalán nem találtak spórát. Mennyi a spórák átlagos száma mintánként, és mekkora valószínűséggel találunk egy mintában legalább spórát? 8. Egy bizonyos betegség a szokásos gyógykezeléssel az esetek egynegyed részében gyógyul. Új kezelést szeretnének bevezetni, amelyet előzőleg 10 betegen próbálnak ki. Ha közülük legalább 7 meggyógyul, akkor az új kezelést bevezetik, ha legfeljebb 3 gyógyul meg, akkor nem. Ha, 5 vagy 6 beteg gyógyul meg, akkor a kezelést további vizsgálatnak vetik alá. Mi a három eset valószínűsége, ha az új kezelés hatásossága megegyezik a régiével? 9. Egy Rh- nő 3 gyermeket szeretne. Férje Rh+, akinek anyja Rh-. Mi a valószínűsége, hogy a 3 közül legfeljebb 1 lesz Rh+? 10. Tbc szűrővizsgálaton 100 ember kap pozitív eredményről szóló papírt, de a vizsgálat specificitása kicsi, ezért közülük valójában csak 5-en betegek. 10-en mennek vissza, hogy megismételtessék a vizsgálatot egy nagy specificitású módszerrel. Mi a valószínűsége, hogy a 10 közül egyiknél sem jelez tbc-t a nagy specificitású vizsgálat? 11. Egy szűrővizsgálatra 0-an várakoznak, közülük 3-an valóban rákosok. Nyolcan mennek be először; mi a valószínűsége, hogy közülük a) legfeljebb 1 rákos, b) legalább 1 rákos? 1. Egy kórházba naponta átlagosan,5 embert hoznak be infarktussal, ezek száma Poisson eloszlású. Mekkora a valószínűsége, hogy 3-nál több érkezik egy nap? 13. Egy kutyafajtánál bizonyos anyagcsere-rendellenesség megjelenésének valószínűsége 0,1. Mi a valószínűsége, hogy 10 kölyök közül legfeljebb egynél lép fel a rendellenesség? Milyen közelítéseket alkalmazhatunk? 1. A Poisson eloszlással kapcsolatban tudománytörténeti jelentőségűek a következő adatok. Az 1800-as évek végén 00 megfigyelést végeztek a lórúgástól elhunytak hadtestenkénti számáról. 109 esetben nem halt meg senki lórúgástól, 65 esetben egy, esetben, 3 esetben 3 és egy esetben katona halt meg hadtestenként és évenként lórúgástól. Számítsuk ki a halálesetek átlagos számát/év/hadtest és vessük össze az ehhez tartozó Poisson eloszlás értékeit a konkrét adatokkal! 15. Egy növény magjainak száma Poisson eloszlású a talajban, átlag = 3/ / m. Mekkora az esély, hogy m -en egyet sem találunk? MEGOLDÁSOK: 1. p 0 =,*10 -, p 1 =,39*10-3, p =,*10 -, p 3 = 0,13, E =,5, V = 1,15.. A beteg gyermekek száma binomiális eloszlású, q = 0,75, n = 6, tehát eloszlása megegyezik az 1. feladatbeli eloszlással. P(egy sem beteg) = p 6 = 0,178, P(legfeljebb beteg) = P(legalább egészséges) = p +p 5 + p 6 = 0,831, P(legalább 3 egészséges) = p 3 +p +p 5 + p 6 = 0,963, E = 1,5, V = 1,15. 3. Poisson eloszlást használunk, λ = E = V =,5, P(ζ > 3) = 1-P(ζ 3) = 1-p 0 - p 1 -p -p 3 = 1-0,08-0,05-0,57-0,1 = 0,.. p 0 =11/0 = e -λ λ = 0,6/*10 7 sejtosztódás, tehát µ = 3*10-8 /sejtosztódás. 5. a) P(mind gömbölyű) = p 6 = 0,091, P(legfeljebb szögletes) = P(legalább gömbölyű) = p +p 5 + p 6 = 0,09+0,09+0,091 = 0,909, P(legalább 3 gömbölyű) = p 3 +p +p 5 + p 6 = 1 (3-nál kevesebb gömbölyűt nem lehetséges húzni). E =,5, V = 0,61. b) P(mind gömbölyű) = p 6 = 0,163, P(legfeljebb szögletes) = P(legalább gömbölyű) = p +p 5 + p 6 = 7
0,31+0,366+0,163= 0,81, P(legalább 3 gömbölyű) = p 3 +p +p 5 + p 6 = 0,19 + 0,31+0,366+0,163 = 0,970, 6. P(ζ > ) = 1-P(ζ ) = 1-p 0 - p 1 -p - p 3 -p. Poisson: λ = 1, P(ζ > ) =1-0,368-0,368-0,18-0,061-0,015 = 0,00, E = V = 1. Binomiális: p=0,01, P(ζ > ) = 1-0,366-0,370-0,185-0,061-0,015 = 0,003. E = 1, V = 0,99. 7. λ = 1,1 P(legalább spóra) = 1- p 0 - p 1 = 1-1/3-0,366 = 0,301. 8. Binomiális eloszlás, n = 10, q = 0,5; p 7 +p 8 +p 9 + p 610 = 0,0035, p 0 +p 1 +p + p 3 = 0,7759, p +p 5 + p 6 = 0,06. 9. Binomiális n = 3, q = 0,5; p 0 +p 1 = 1/8+3/8 = 0,5. 10. Hipergeometrikus, m = 100, s = 5, n = 10; p 0 = 0,58. 11. Hipergeometrikus, m = 0, s = 3, n = 10; a) p 0 +p 1 = 0,193 + 0,63 = 0,656 b) 1- p 0 = 0,807. 1.1 - p 0 +p 1 +p + p 3 = 1-0,08 + 0,05 + 0,57 + 0,1 = 0,. 13. Binomiális n = 10, q = 0,1; p 0 +p 1 = 0,39 + 0,387 = 0,736. Poisson λ = 1; p 0 +p 1 = 0,368+0,368 = 0,736. 1. λ = 0,61 haláleset/év/hadtest. x 0 = 108,7 x 1 = 66,3 x = 0, x 3 =,1 x =0,6 lenne az olyan hadtestek száma melyben 0,1,,3 ill. lórúgásos haláleset történt, ha a a lórúgások száma pontosan Poisson eloszlású lenne. Ezek az elméleti értékek jól egyeznek az adatokkal. 15. Átszámítjuk az átlagos magszámot m -re (ezt vesszük egységnyinek), ekkor λ = 3, p 0 = e -3 = 0,05. (Másképpen, ha 1 m -t vesszük egységnyinek, p 0 = (e -3/ ) = 0,05. - ez a megoldás csak p 0 keresése esetén alkalmazható, különben hibás eredméynt ad.) A következő ábrákon az figyelhető meg, hogy az egyes diszkrét eloszlások milyen körülmények között hasonlítanak egymásra. Hipergeometrikus m=1, s=9, n=6 0. 0 1 3 5 6 0. Binom n=6, q=0.75 0. Hipergeometrikus m=60, s=5, n=6 0 1 3 5 6 0 1 3 5 6 8
0 0 0 60 80 100 5 5 Binom n=10, q=5 Poisson λ =.5 5 5 0 6 8 10 a val. vált. legnagyobb lehetséges értéke 10 0 6 8 10 végtelenig tart igazából, vagyis a val. változó akármilyen nagy értékeket is felvehet, de nagyon kis valószínûséggel 0.08 0.08 0.06 Binom n=100, q=5 0.06 Poisson λ = 5 0.0 0.0 0.0 0.0 a val. vált. legnagyobb lehetséges értéke 100 0 0 0 60 80 100 végtelenig tart igazából, vagyis a val. változó elvben akármilyen nagy értékeket is felvehet, de nagyon kis valószínûséggel 0. 0. 5 5 5 5 Binom n=100, q=0.01 Poisson λ = 1 5 5 0 6 8 10 a val. vált. legnagyobb lehetséges értéke 100, de itt csak 10-ig ábrázoltuk 0 6 8 10 végtelenig tart igazából, vagyis a val. változó elvben akármilyen nagy értékeket is felvehet, de nagyon kis valószínûséggel 0. 5 5 Binom n=10, q= 5 0 6 8 10 a val. vált. legnagyobb lehetséges értéke 10 9
FOLYTONOS ELOSZLÁSOK I. NORMÁLIS ELOSZLÁS: A természetben gyakran fordul elő, ha egy jelenséget (méretet) sok egyszerű alternatíva dönt el (sok kis hatású gén, sokféle környezeti hatás), illetve ha csak pontatlanul, zajosan tudunk mérni. Tipikusan ilyenek az ún. poligénes vagy kvantitatív jellegek: testméretek, tejtermelés, terméshozam. Ezeket 10-100 kisgén határozza meg + ill. - allélekkel. Genetikai egyensúlyban a + allélek száma binomiális eloszlású, de a mért értékek normális eloszlásúak, mert a környezeti variancia illetve a mérési hiba miatt folytonossá válik az eloszlás. A normális eloszlás sűrűségfüggvénye: f ( x) ( x m) 1 σ = e, M(ξ) = m, V(ξ) = σ. πσ Bármilyen normális eloszlás levezethetõ a 0 várható értékû és 1 szórású standard normális eloszlásból. Az eloszlásfüggvény: x m F ( x) = Φ σ Illetve igaz, hogy Φ ( x) = 1 Φ( x) 1. Egy tehén napi tejhozama normális eloszlású valószínűségi változó, m =,1 liter, σ = 1,5 liter. a) Határozzuk meg annak a valószínűségét, hogy egy adott napon a tejhozam nagyobb mint 5 liter, b) a tejhozam 0 és 1 liter közé esik, c) átlagosnál kisebb tejhozam esetén 0 és 1 liter közé esik. (Ld. ábra.). Egy másik tehén szeszélyesebb: ugyanúgy m =.1 liter, de σ = 3 liter. Válaszoljunk ugyanazokra a kérdésekre! (Ld. ábra.) 3. Milyen valószínűséggel esik m+σ és m-σ közé a tejtermelés az 1. ill. feladatbeli tehénnél? 5 norm. elo. sûr.fv. m=.1, σ =1.5 0. standard normális eloszlás sûr. fv. m = 0, σ = 1 5 15 0 5 30 - - 0 x 1 =0 x =1 (x 1 -m)/σ = -1, (x -m)/σ = -0,73 5 5 norm. elo. sûr.fv. m=.1, σ =3 Áttérés standard normális eloszlásra: F(x 1 ), annak a valószínûsége, hogy egy tetszõleges norm. elo.-ú val. vált értéke kisebb mint x 1, egyenlõ azzal, hogy a st. norm elo.-ú val. vált. értéke kisebb mint (x 1 -m)/σ, ez pedig Φ((x 1 -m)/σ) 15 0 5 30 10
. Egy populációban a testsúlyt m = 60,38 kg, σ = 5,7 kg paraméterű normális eloszlású val. vált.-nak tekintjük. Az egyéneket testsúly szerint osztályba szeretnénk sorolni, úgy, hogy várhatóan minden osztályba egyenlő számú egyén kerüljön. Jelöljük ki az osztályközöket (osztópontokat)! 5. Egy szántóföldön a búza termésátlaga 60 q/hektár, a szórás 15 q/hektár. Mi a valószínűsége, hogy egy adott évben a) a termés meghaladja a 38 q/hektárt? b) 80 és 90 q/hektár közé esik? 6. Egy nagy mikroorganizmus-tenyészetben a két sejtosztódás közötti nyugalmi fázis időtartama normális eloszlású, órákban mérve m = 160, σ = 0. Mi annak a valószínűsége, hogy egy egyedből álló randomizáltan kiválasztott mintában egyetlen egyed nyugalmi fázisa sem lesz kisebb 180 óránál? 0.07 0.06 norm. elo. sûr.fv. m=68, =5.7 σ 0.07 0.06 norm. elo. sûr.fv. m=60, =15 σ 0.0 0.0 0.03 0.03 0.0 0.0 0.01 0.01 0 0 0 60 80 100 0 0 0 60 80 100 II. LOGNORMÁLIS ELOSZLÁSÚ egy ξ val. vált., ha lnξ normális eloszlású m és σ paraméterekkel. Ekkor M(ξ) = e m+ σ m+ σ σ, V(ξ) =e ( e 1). 7. Bizonyos sejtpopulációban a sejtmag átmérője lognormális eloszlású, átlaga 8 mikrométer, szórása 1,1 mikrokéter. Mennyi a valószínűsége annak, hogy a sejtmagátmérő 7 és 9 mikrométer közé esik? III. EXPONENCIÁLIS ELOSZLÁS gyakran lép fel várakozási időtartamokkal, objektumok életidejével kapcsolatban. Pontosabban ha egy adott esemény többször bekövetkezik és az egyes bekövetkezések egymástól függetlenek, akkor a bekövetkezések között eltelt idő exponenciális eloszlású. (Időegység alatt a bekövetkezések száma ekkor Poisson eloszlású - a függetlenség a kritérium). Észre kell azonban venni, hogy sokszor egyes események ismételt bekövetkezései nem függetlenek, ekkor nem exponenciális eloszlású a várakozási idő. Örökifjú objektumok élettartama is exponenciális eloszlású, az ilyen élőlény azonban ritka, ugyanis ez azt jelentené, hogy a jövőbeni kilátások függetlenek a pillanatnyi kortól (nem öregszik); jó közelítéssel ilyenek a korallpolipok, ld. a köv. feladatot. λx 1 e,ha x (0, ) exp elo. val. vált. elo. fv-e: F( x) = 0, ha x (,0] λx λe, ha x (0, ) sűr. fv.-e: f ( x) =, M(ξ) = 1/λ, V(ξ) = 1/λ 0, ha x (,0]. 8. Egy korallfaj polipjainak élettartama exponenciális eloszlású, átlagos életidejük 3,0 év. a) Az egyedek hány százaléka éri meg a 3 évet? b) Az egyedek hány százaléka éri meg a évet? c) A két éves egyedek hány százaléka éri meg a évet? d) 0 éves egyedekből kiindulva várhatóan hány év múlva következik be az, hogy éppen a fele van életben? 11
9. Egy forrásért való küzdelemben az állatok sok fajnál harc nélkül, de pózolva várakoznak, hátha a másik hamarabb megunja. A várakozási idő exponenciális eloszlású átlagát a forrás értéke szabja meg. Egy csontért átlagosan 10 percig várakoznak a kutyák, a)mi a valószínűsége, hogy egy adott kutya ennél tovább vicsorog a csont mellett? b) mekkora egy másik csont értéke, melynél ugyanakkora valószínűséggel éppen 50 percig várakoznak a kutyák? c) mi a valószínűsége, hogy az első csontért a várakozási idő 5 és 8 perc közé esik? exp.elo. sûr.fv. λ = exp.elo. sûr.fv. λ = 1/3 MEGOLDÁSOK: 1. a) P(ξ>5) = 1-P(ξ<5) = 1-F(5) = 1 - Φ((5-.1)/1.5) = 1 - Φ(1,93) = 0,07. b) P(0<ξ<1) = F(1) - F(0) = Φ((1-.1)/1.5) - Φ((0-.1)/1.5) = Φ(-0,73) - Φ(-1,) = 1 - Φ(0,73) - (1 - Φ(1,)) = 0,15. c) P(0<ξ<1 ξ<,1) = P(0<ξ<1)/P(ξ<,1) = 0,15/0,5 = 0,30.. Az 1. feladathoz hasonlóan: a)0,167, b) 0,115 c) 0,30. (extrapolálástól függően) 3. mindkét esetben P(m-σ <ξ< m+σ) = F(m+σ) - F(m-σ) = Φ( m+σ -m)/σ) - Φ( m-σ -m)/σ) = Φ( 1) - Φ( -1) = Φ( 1) - 1 = 0,683.. Legyen a három osztópont x 1, x és x 3. Nyilván x = m. Φ(( x 3-60,38)/5,7)) = 0,75. Innen (x 3-60,38)/5,7 = 0,675 tehát x 3 = 6,3. Φ(( x 1-60,38)/5,7)) = 0,5, mivel csak 0,5-nél nagyobb Φ(x) értékeket találunk a táblázatban: Φ(( 60,38- x 1 )/5,7)) = 1-0,5, innen x 1 = 56,53. x 1 -et egyszerűen az eloszlás szimmetrikus volta alapján is kiszámíthatjuk: x 1 = m - (x 3 - m). 5. a) ) P(ξ>38) = 1-P(ξ<38) = 1-F(38) = 1 - Φ((38-60)/15) = 1-1 + Φ(1,7) = 0,99 b) P(80<ξ<90) = F(90) - F(80) = Φ((90-60)/15) - Φ((80-60)/15) = Φ() - Φ(1,33) = 0,977-0,908 = 0,069 6. P(ξ>180) = (1 - Φ((180-160)/0)) = (1- Φ(1)) = 0,1587 = 0,0006. 7. e m+ σ m+ σ σ = 8 és e ( e 1) = 1.1, innen a lognormális eloszláshoz tartozó normál eloszlás paraméterei: m =,070 és σ = 0,137. P(7<ξ<9) = P(ln7<lnξ<ln9), mivel lnξ normális eloszlású P(1,96<lnξ<,197), = Φ((,197-,070)/0,137) - Φ((1,96-,070)/0,137) = 0,6. 8. a) λ = 1/3, P(ξ>3) = 1- F(3) = 1- (1-e -3*1/3 ) = e -1 = 0,37. b) P(ξ>) = 1- F() = 1- (1-e -*1/3 ) = 0,6. c) P(ξ> ξ>) = P(ξ> és ξ> ) / P(ξ>) = 0,6/0,513 = 0,513 = P(ξ>), éppen ez jelenti az örökifjúságot. 1 λ 1 d)f( t ) e t t 1 1 / 3 1 / = 1 =, P( fele _ él) = 1 1 1 / =, e ahol t 1/ a keresett év; innen t 1/ = - ln(1/) / λ =,08 év. 9. ) λ = 0,1, a) P(ξ>10) = 1- F(10) = 1- (1-e -10*0,1 ) = e -1 = 0,37. b) e -1 = P(ξ>50) = 1- F(50) = 1- (1-e -50*λ ), λ = 1/50, a forrás értéke ekkor 50, vagyis átlagosan 50 percig várakoznak. c) P(5<ξ<8) = F(8) -F(5) = 1-e -8/10 - (1-e -5/10 ) = 0,16. 1