Valószínűségszámítás és matematikai statisztika 2003. május 23.
ii
Tartalomjegyzék I. Valószínűségszámítás 1 1. Véletlen jelenségek matematikai modellje 3 1.1. Valószínűségi mező.............................. 3 1.2. Nevezetes véletlen kísérletek......................... 7 1.3. Feladatok................................... 12 2. Feltételes valószínűség, függetlenség 13 2.1. A függetlenség tulajdonságai......................... 14 2.2. A feltételes valószínűség tulajdonságai................... 17 2.3. Bayes döntés................................. 18 2.4. Feladatok................................... 19 3. Valószínűségi változók 21 3.1. Valószínűségi változóval kapcsolatos események.............. 21 3.2. Valószínűségi változók struktúrája...................... 23 3.3. Valószínűségi változók eloszlása....................... 24 3.4. Nevezetes eloszlású valószínűségi változók................. 29 3.5. Feladatok................................... 33 4. Várható érték, szórás 35 4.1. Várható érték................................. 35 4.2. Szórás..................................... 39 4.3. Nevezetes eloszlások várható értéke, szórása................ 40 4.4. Momentumok, kovariancia.......................... 43 4.5. Feladatok................................... 45 5. Nagy számok törvénye 47 5.1. Nevezetes egyenlőtlenségek.......................... 47 5.2. Nagy számok törvényei............................ 49 5.3. Feladatok................................... 50 6. Karakterisztikus függvény 53 6.1. Határeloszlások................................ 57 6.2. Véletlen tagszámú összeg........................... 62 6.3. Feladatok................................... 63 iii
iv TARTALOMJEGYZÉK 7. Vektor valószínűségi változók jellemzői 67 7.1. Jelölések, elnevezések............................. 67 7.1.1. Várható érték, kovariancia mátrix.................. 68 7.1.2. Karakterisztikus függvény...................... 69 7.2. Vektor valószínűségi változó főkomponensei................. 70 7.3. Normális eloszlású vektor valószínűségi változó............... 73 7.4. Feladatok................................... 76 8. Nevezetes eloszlások 79 8.1. χ 2 eloszlás................................... 79 8.2. T és F-eloszlás................................. 85 8.3. Feladatok................................... 86 9. Regresszió analízis 87 9.1. Többváltozós lineáris regresszió....................... 87 9.2. Elméleti regresszió, feltételes várható érték................. 90 9.3. A Bayes döntés................................ 99 9.4. Feladatok................................... 100 10.Sztochasztikus folyamatok 103 10.1. Véletlen eseményfolyamat, Poisson folyamat................ 105 10.2. Brown-mozgás, Wiener folyamat....................... 110 10.3. Független és stacionárius növekményű folyamatok............. 114 10.4. Stacionárius folyamatok........................... 118 10.5. Feladatok................................... 127 II. Matematikai statisztika 131 11.A matematikai statisztika alapfogalmai 133 11.1. Statisztikai mező............................... 133 11.2. Statisztikák.................................. 136 11.3. Paraméterek.................................. 138 11.4. Likelihood függvény.............................. 139 11.5. Feladatok................................... 143 12.Paraméterbecslés 145 12.1. Pontbecslés.................................. 145 12.2. Becslések hatékonysága............................ 151 12.2.1. Maximum likelihood becslés..................... 151 12.2.2. Hatékonyabb becslés mint az elégséges statsiztika függvénye............................... 152 12.2.3. A hatékonyság információs határa.................. 153 12.3. Intervallum becslések............................. 154 12.4. Feladatok................................... 159
TARTALOMJEGYZÉK v 13.Hipotézis vizsgálat 161 13.1. Alapfogalmak................................. 161 13.2. Valószínűséghányados próba......................... 163 13.2.1. Bartlett próba............................. 164 13.2.2. Valószínűség próbája, (n;c) terv................... 166 13.3. Normális eloszlás paramétereinek próbái.................. 168 13.4. Feladatok................................... 172 14.Lineáris függőségi kapcsolat 175 14.1. Egyenlő mértékű, független megfigyelési hiba................ 175 14.2. Korrelált megfigyelési hibák......................... 182 14.3. Ridge becslés................................. 184 14.4. Nemlineáris regressziós függvények..................... 185 14.5. Fealadatok................................... 187 15.Szórásanalízis 189 15.1. Rögzített hatások modellje.......................... 190 15.2. Véletlen hatások modellje.......................... 194 15.3. Feladatok:................................... 195 16.Nem paraméteres próbák 197 16.1. Illeszkedés vizsgálat.............................. 197 16.2. Függetlenség vizsgálat............................ 201 16.3. Homogenitás vizsgálat............................ 202 16.4. Feladatok................................... 205 A. Mérték és integrál 207 A.1. Mérték..................................... 207 A.2. Mérhető függvény............................... 212 A.3. Integrál.................................... 213 B. Táblázatok 217 C. Képletek 227 Kézirat, módosítva: 2003. május 23.
vi TARTALOMJEGYZÉK
I. rész Valószínűségszámítás 1
1. fejezet Véletlen jelenségek matematikai modellje 1.1. Valószínűségi mező Véletlen jelenségek körének meghatározása hasonló nehézségekkel jár, mint más természettudományok esetén a vizsgálatok tárgyának megadása. Azt azonban elfogadhatjuk, és mindennapi szóhasználatunk is ezt jelzi, hogy vannak olyan jelenségek, történések, melyek lejátszódásával kapcsolatos bizonytalanságunkat úgy fejezzük ki, hogy a véletlenül, találomra, stb. kifejezéseket használjuk. Ilyen jelenségek például egy kocka dobása, vagy egy adott helyen és időpontban mérhető időjárási elem (pl. hőmérséklet). Ezen jelenségekről bőséges tapasztalat szerezhető ismételt megfigyelésükkel. Ilyen tapasztalat, hogy szabályos kockát dobva minden eredmény hasonló gyakorisággal következik be, vagy másképp fogalmazva, egyforma esélyű, illetve januárban kevésbé valószínű a 20C feletti hőmérséklet, mint a fagypont alatti, vagy általában a gyakrabban bekövetkező dolgokat, éppen gyakoriságuknak megfelelően, valószínűbbnek mondjuk. Foglaljuk most össze az ilyen, un. véletlen kísérletek közös vonásait: a véletlen kísérletnek jól meghatározható kimenetelei vannak; bizonyos kimenetelek bekövetkezésének eseményéről beszélhetünk; az ilyen események bekövetkezési esélye mennyiségi formában megadható; Célunk olyan modell megfogalmazása, ahol mindezeknek matematikai fogalmakat feleltetünk meg, és matematikai módszerekkel olyan eredményeket nyerhetünk, amelyek segítenek ezen jelenségek megértésében, illetve a tapasztalat által is megerősíthető törvényszerűségeket tudunk bizonyítani. 3
4 1. FEJEZET. VÉLETLEN JELENSÉGEK MATEMATIKAI MODELLJE 1.1. Definíció. Valószínűségi mezőnek nevezzük az (Ω, A, P ) hármast, ahol Ω az elemi események halmaza, eseménytér; A az eseménytér részeinek σ-algebrája, az eseményalgebra, azaz teljesülnek: A1 Ω A ; A2 ha A, B A akkor A \ B A ; A3 ha A n A n = 1, 2,... akkor n=1 A n A ; P az eseményalgebrán értelmezett függvény, a valószínűségi mérték, azaz teljesülnek: P1 P (Ω) = 1 ; P2 ha A A akkor P (A) 0 ; P3 ha A n A n = 1, 2,... és A k A l = k l = 1, 2,... akkor ( ) P A n = P (A n ) ; n=1 Tehát a valószínűségi mező egy mértéktér véges mértékkel (lásd A. Függelék). A továbbiakban minden esetben egy ilyen modellt tételezünk fel, és ha külön nem is említjük, fogalmaink egy (Ω, A, P ) valószínűségi mezővel lesznek kapcsolatosak. Az alábbiakban felsorolunk néhány egyszerűen következő tulajdonságot, és itt használatos elnevezést, kifejezést. 1. Az A eseményalgebra elemei az események, Ω A a biztos esemény. 2. Mivel = Ω \ Ω A, az üres halmazt lehetetlen eseménynek nevezzük. 3. Az eseményalgebra zárt a szokásos müveletekre: ha A, B A akkor A c = Ω \ A A A B = A B... A A B = (A c B c ) c A 4. A lehetetlen esemény valószínűsége 0, mivel n=1 P ( ) = P (... ) = P ( ) + P ( ) + P ( ) +... ami csak úgy teljesülhet, ha P ( ) = 0.
1.1. VALÓSZÍNŰSÉGI MEZŐ 5 5. A valószínűségi mérték végesen additív: ha A, B A és A B = vagyis A és B kizárják egymást, akkor kizáró események egyesítése, és így A B = A B... P (A B) = P (A) + P (B) + 0 + 0 +... = P (A) + P (B). 6. Néhány további számolási szabály : ha A, B A akkor mivel Ω = A A c kizáró események úniója, így P (A c ) = 1 P (A) ; mivel A = (A B) (A \ B) kizáró események úniója, így P (A \ B) = P (A) P (A B) ; ha teljesül még A B, vagyis B bekövetkezése maga után vonja A bekövetkezését, akkor P (A) P (B) és P (A \ B) = P (A) P (B) ; mivel A B = A (B \ A) kizáró események úniója, használva az előző eredményt, kapjuk P (A B) = P (A) + P (B) P (A B) ; az előző eredményből kapjuk a valószínűség un. szubadditív tulajdonságát: P (A B) P (A) + P (B) ami véges vagy megszámlálható únióra is következik. 7. A valószínűségi mérték folytonossága: ha A 1 A 2... A, akkor B 0 =, B 1 = A 1, B 2 = A 2 \ A 1, B 3 = A 3 \ A 2,... páronként kizáró események, és egyesítésük B n = A n, n=0 n=1 amiből kapjuk ( ) P A n = 0 + P (A 1 ) + (P (A 2 P (A 1 )) + (P (A 3 P (A 2 )) +... = lim P (A n ). n n=1 Hasonlóan teljesül A 1 A 2... A esetén ( ) P A n = lim P (A n ). n n=1 Kézirat, módosítva: 2003. május 23.
6 1. FEJEZET. VÉLETLEN JELENSÉGEK MATEMATIKAI MODELLJE A továbbiakban néhány tipikus, véletlen jelenségek modellezésére jól használható példát adunk valószínűségi mezők megadására. 1. Kombinatórikus valószínűségszámítási problémák Véges sok, egyformán valószínű kimenetellel rendelkező véletlen kísérlet modellje. Ω = {ω 1, ω 2,..., ω n } 2. Diszkrét valószínűségi mező A = 2 Ω P (A) = < A elemeinek száma > < Ω elemeinek száma > A Ω Véges vagy megszámlálhatóan végtelen sok kimenetelű véletlen kísérlet modellje, ahol a kimenetelek valószínűségei egy (p n ) n=1,2,... diszkrét valószínűségeloszlással adottak. Ω = {ω 1, ω 2,..., ω n,... } A = 2 Ω P (A) = ω n A ahol (p n ) n=1,2,... egy diszkrét valószínűségeloszlás, azaz p n 0 n = 1, 2,... és p n = 1. 3. Geometriai valószínűségszámítási problémák p n R n valamely véges, pozitív mértékű részhalmazát kitöltő kimenetelekkel rendelkező véletlen kísérlet modellje, ahol egy résztartomány bekövetkezési valószínűsége arányos annak mértékével. Ω R n A = {Ω B B B n } P (A) = < A mértéke > < Ω mértéke > A A ahol B n jelöli az R n intervallumait tartalmazó legszűkebb σ-algebrát. 4. Folytonos valószínűségi mező A véletlen kísérlet kimenetelei R n (vagy valamely mérhető részének) pontjaival azonosíthatók, és egy x R n pont kis környezetébe esés valószínűsége arányos egy valószínűségi sűrűségfüggvény f(x) értékével. Ω = R n n A = B n P (A) = f A A A
1.2. NEVEZETES VÉLETLEN KÍSÉRLETEK 7 ahol az f : R n R egy valószínűségi sűrűségfüggvény, azaz f(x) 0 x R n és f = 1. R n A fenti példákban a 1.1 definíciónak megfelelő hármast adtunk meg, ami a 2. példa kapcsán egyszerűen ellenőrízhető, az 1. példa pedig ennek speciális esete a p k = 1 n k = 1, 2,... n valószínűségeloszlással. A 4. példa az A. függelék egyik példája mérték megadására, és a 3. példa lényegében az előbbi speciális esete az { 1 ha x Ω f(x) = <Ω mértéke> 0 egyébként valószínűségi sűrűségfüggvény választásával. 1.2. Nevezetes véletlen kísérletek Az alábbiakban felsorolunk néhány nevezetes véletlen jelenséget, és megfogalmazzuk a velük kapcsolatos valószínűségi modellt és megadjuk események valószínűségeit. Ezek a valószínűségi mezők a fenti példák konkrét esetei lesznek, ezért mindíg csak az Ω eseményteret és a megfelelő diszkrét valószínűségeloszlást, illetve valószínűségi sűrűségfüggvényt adjuk meg. (1) Visszatevés nélküli mintavétel Egy N N + elemszámú halmaz elemei között M N számú megjelölt van. Véletlenszerűen kiválasztva n N számút, mennyi annak valószínűsége, hogy k számú megjelölt van a kiválasztottak között, azaz a mintában? Legyenek Ω az N elem n-ed osztályú ismétlés nélküli kombinációinak C n N = ( N n) elemszámú halmaza, minden kombináció egyformán valószínű, A k esemény (azon kombinációk halmaza) amikor a kiválasztottak között k-számú megjelölt van, k = 0, 1, 2,... n. Használjuk a továbbiakban az ( ) a = 0 b ha a < b N Kézirat, módosítva: 2003. május 23.
8 1. FEJEZET. VÉLETLEN JELENSÉGEK MATEMATIKAI MODELLJE értelmezést, amivel A k elemszáma ( ) M k tehát ( ) N M, n k ( M ) ( k N M ) n k P (A k ) = ( N k = 0, 1, 2,... n. (1.1) n) Mivel az A k k = 0, 1, 2,... n események páronként kizáróak, és Ω = n k=1 A k, teljesül n P (A k ) = 1 k=0 vagyis (1.1) egy diszkrét valószínűségeloszlás, amit hipergeometriai eloszlásnak nevezünk. (2) Visszatevéses mintavétel Egy N N + elemszámú halmaz elemei között M N számú megjelölt van. Véletlenszerűen kiválasztva n N számút egymás után a kiválasztottak visszatevésével, mennyi annak valószínűsége, hogy k számú megjelölt van a mintában? Legyenek Ω az N elem n-ed osztályú ismétléses variációinak V n,i N = N n elemszámú halmaza, minden variáció egyformán valószínű, A k esemény (azon variációk halmaza), amikor a választottak között k-számú megjelölt van, k = 0, 1, 2,... n. Mivel A k elemszáma ( ) n M k (N M) n k, k a p = M N jelölést bevezetve kapjuk: ( ) n P (A k ) = p k (1 p) n k k k = 0, 1, 2,... n. (1.2) Az A k k = 0, 1, 2,... n események most is páronként kizáróak, és Ω = n k=1 A k, tehát n P (A k ) = 1 k=0 vagyis (1.2) egy diszkrét valószínűségeloszlás, amit binomiális eloszlásnak nevezünk.
1.2. NEVEZETES VÉLETLEN KÍSÉRLETEK 9 (3) Bernoulli kísérlet Egy p [0; 1] valószínűségű esemény n-ismételt megfigyelése esetén mennyi annak valószínűsége, hogy a figyelt esemény k-szor következik be? Vegyük észre, hogy a visszatevéses mintavételtben egy p = M valószínűségű eseményt N figyelünk meg n-szer, és A k éppen azt jelenti, hogy k-szor következik be a figyelt esemény, azaz a megjelölt választása. Tehát választhatjuk Ω = {0, 1, 2,..., n} p k = ( n k) pk (1 p) n k k = 0, 1, 2,... n. Ezek a példák a véletlen jelenségekről szerezhető tapasztalatok leggyakoribb forrásait modellezik. Az ismételt megfigyelésből szerezhető tapasztalataink szerint egy esemény bekövetkezéseinek relatív gyakorisága a vélelmezett valószínűség egyfajta közelítése. Mindezt igazolni látszik az a könnyen ellenőrízhető körülmény is, hogy a hipergeometriai és binomiális eloszlások legnagyobb valószínűségei az np értékhez legközelebbi egészek egyike lesz. Tehát az np érték mintegy átlagos illetve legvalószínűbb gyakoriság értelmezhető. Ezzel a fogalommal lehetővé válik olyan jelenségek modellezése, ahol a megfigyelések n száma igen nagy és a p bekövetkezési valószínűség nagyon kicsi, de az átlagos gyakoriság megadható mint egy 0 < λ mennyiség. Létezik ugyanis a következő határérték és lim n np=λ ( ) n p (1 p) n k = λk k k! e λ k = 0, 1, 2,... (1.3) k=0 λ k k! e λ = 1, tehát (1.3) egy diszkrét valószínűségeloszlást, az un. Poisson eloszlást határoz meg, amivel megfogalmazhatjuk a következő véletlen kísérletet. (4) Véletlen eseményszám Egy átlagosan λ-szor bekövetkező esemény véletlen számú bekövetkezésének megfigyelése. Legyenek Ω = N p k = λk k! e λ k N. Ha ez utóbbi kísérletet olyan esetben fogalmazzuk meg, amikor egy esemény bekövetkezése egy berendezés meghibásodását jelenti, és λ az időegységre jutó meghibásodások átlagos száma, akkor t-időtartamú meghibásodás mentes működés valószínűsége: p 0 = e λt = t λ e λt dt, Kézirat, módosítva: 2003. május 23.
10 1. FEJEZET. VÉLETLEN JELENSÉGEK MATEMATIKAI MODELLJE ahol f(t) = { λ e λt ha 0 t 0 egyébként egy un. exponenciális valószínűségi sűrűségfüggvény. Megfogalmazhatjuk tehát a következő véletlen kísérletet, melynek modellje egy folytonos valószínűségi mező. (6) Véletlen időtartam Egy átlagosan T = 1 idejű véletlen időtartam megfigyelése esetén, adjuk meg egy λ t-nél hosszabb időtartam bekövetkezésének valószínűségét! Legyenek Ω = R + f(t) = λ e λt t R + [t; + [ 0 < t-nél hosszabb időtartam megfigyelésének eseménye, akkor P ([t; + [) = e λt = t λ e λt dt t > 0. (1.4) Vizsgáljuk a következő kísérletet: egy lejtőn az alábbi módon helyezünk el ékeket 2n számú sorban, és egy golyót legurítunk úgy, hogy az minden soron áthaladva, és egy éknél véletlenszerűen irányt változtatva érkezik le a k = n, (n 1),..., 1, 0, 1,..., (n 1), n helyek valamelyikére. 1.sor 2.sor 3.sor..... 2n.sor n 0 n érkezési helyek A k helyre érkezés pontosan akkor következik be, ha a golyó 2n számú ütközésből n k számúszór fog jobbra gurulni, és feltehetjük a jobbra és balra haladás egyforma valószínűségét. Tehát a Bernoulli késérlet szerint a k helyre érkezés valószínűsége: p k = ( 2n n k ) 1 2 2n k = 0, ±1, ±2,..., ±n. Ha a sorok számát növeljük, de egyben a méretek csökkentésével elérjük, hogy a leérkezési helyek egymás közti távolsága csökkenjen, és éppen 1 n legyen, az x = k n rögzített helyre érkezés valószínűségére nyerjük a következő határértéket: lim n pk = 1 e x2 x R. (1.5) π n n x= k
1.2. NEVEZETES VÉLETLEN KÍSÉRLETEK 11 Ezt felhasználva, elég nagy tábla esetén, két x 1 = l 1 n < x 2 = l 2 n hely közé érkezés A [x1 ;x 2 ] eseményének valószínűségére kapjuk: P ( ) l 2 A [x1 ;x 2 ] = p k k=l 1 l 2 k=l 1 1 π e x2 k 1 x2 1 π e x2 dx n x 1 ahol x k = k n k = l 1,, l 2. Tehát egy folytonos valószínűségi modellt kapunk az f(x) = 1 π e x2 x R sűrűségfüggvénnyel. Ennek egyszerű transzformáltjaként kapható f(x) = 1 π σ e (x m)2 2σ 2 x R (1.6) az un. Gauss, vagy normális valószínűségi sűrűségfüggvény, ahol m R és σ > 0. Mindezek alapján megfogalmazhatjuk sok véletlen eltérés összegének, mint pl. egy mérés véletlen eredményének modelljét. (6) Mérési eredmény Sok kicsiny eltérés összegeként nyerhető véletlen érték megfigyelése. Legyenek Ω = R f(x) = 1 π σ e (x m)2 2σ 2 x R ahol az f normális sűrűségfüggvény alakja miatt, m a hiba mentes, igazi érték, σ > 0 pedig a pontosság egyfajta mértékeként értékelhető. Egy [x 1 ; x 2 ] intervallumba eső érték megfigyelésének valószínűsége (7) Véletlen pont választása P ([x 1 ; x 2 ]) = x2 e (x m)2 2σ π σ 2 dx. (1.7) x 1 1 Egy [a; b] R intervallumban válasszunk találomra egy számot, adjuk meg annak valószínűségét, hogy a pont egy [x; y] [a; b] részintervallumba esik! Legyenek Ω = [a; b] f(x) = 1 b a x [a; b], akkor egy [x 1 ; x 2 ] [a; b] intervallumba eső érték választásának valószínűsége P ([x 1 ; x 2 ]) = x2 1 dx. (1.8) x 1 b a Kézirat, módosítva: 2003. május 23.
12 1. FEJEZET. VÉLETLEN JELENSÉGEK MATEMATIKAI MODELLJE 1.3. Feladatok 1. Legyenek A 1, A 2,..., A n páronként diszjukt halmazok, és Ω = n k=1 A k. Adjuk meg az ezeket tartalmazó legszűkebb eseményalgebrát, és az ezen értelmezhető valósznínűségi mértékeket mi határozza meg? 2. Legyenk A 1, A 2,..., A n halmazok, és Ω = n k=1 A k, továbbá teljesüljön A 1 A 2... A n ahol A k vagy az A k halmaz, vagy A c k = Ω \ A k. Adjuk meg az ezeket tartalmazó legszűkebb eseményalgebrát, és mutassuk meg, hogy pontosan egy olyan valószínűségi mérték adható meg ezen, hogy teljesüljenek P (A k ) = p k [0; 1] k = 1, 2,... n P (A 1 A 2... A n ) = P (A 1 ) P (A 2 )... P (A n ). 3. Adjuk meg a hipergeometriai, binomiális és Poisson eloszlás legnagyobb valószínűségét! 4. Igazoljuk az (1.5) határértéket az n! = α n 2πn n n e n ahol lim α n = 1 n Stirling formula segítségével! 5. Vizsgáljuk az (1.6) függvény menetét, és mutassuk meg, hogy valószínűségi sűrűségfüggvény! 6. Számítsuk ki a LOTTO jéték kapcsán a különböző nyerő osztályok valószínűségeit! 7. Egy jegypénztárban 500Ft-ért lehet egy jegyet vásárolni. Ha 100 sorbanálló mindegyike egy jegyet vásárol, és negyvenen ezressel, hatvanan pedig ötszázassal akarnak fizetni, mennyi annak valószínűsége, hogy a nyitáskor üres pénztár ellenére nem lesz fennakadás? 8. Mi valószínűbb: (a) egy kockával 4 dobásból legalább egyszer hatost dobni? (b) két kockával 24 dobásból legalább egyszer dupla hatost dobni? 9. n 1 számú 1-est és n 2 számú 0-át véletlenszerűen elrendezve, adjunk rekurzív formulát annak valószínűségére, hogy a véletlen sorrendben az egyeseket összesen k = 0, 1,..., n 1 n 2 számú nulla előzi meg! 10. Egy síklapon egymástól d távolságra párhuzamos vonalak vannak, és egy l < d hosszúságú tűt ejtünk találomra a síkra. Mennyi annak valószínűsége, hogy valamelyik vonalat metszi a tű? 11. Egy r sugarú körben találomra választott húr milyen valószínűséggel lesz r-nél rövidebb?
2. fejezet Feltételes valószínűség, függetlenség Véletlen jelenségek kapcsán megfogalmazott valamely esemény bekövetkezése esetén, más események bekövetkezésének esélyét sok esetben újra értékeljük, és kevésbé vagy még inkább valószínűnek véljük mint korábban. Mindezt annak megfelelően tesszük, hogy a vizsgált eseményt alkotó kimenetelek milyen mértékben töltik ki a bekövetkezett eseményt. 2.1. Definíció. Legyenek A, B A események, és P (B) > 0. Az A esemény B-re vonatkozó feltételes valószínűségének nevezzük: P (A B) = P (A B) P (B) Az így definiált feltételes valószínűséget az A esemény (feltétel nélküli, abszulut, teljes) valószínűségével összehasonlítva, mondhatjuk: P (A B) > P (A) B bekövetkezése esetén az A esemény bekövetkezése valószínűbb. P (A B) < P (A) B bekövetkezése esetén az A esemény bekövetkezése kevésbé valószínű. P (A B) = P (A) B bekövetkezése nem befolyásolja az A esemény bekövetkezési esélyét, és ilyenkor ha még P (A) > 0 is teljesül, kapjuk P (B A) = P (B) és P (A B) = P (A) P (B). Tehát ez utóbbi esetben A bekövetkezése sem befolyásolja a B esemény bekövetkezési esélyét, amit függetlenségnek nevezünk. 2.2. Definíció. i) Az A, B A eseményeket függetleneknek nevezzük, ha teljesül P (A B) = P (A) P (B). 13
14 2. FEJEZET. FELTÉTELES VALÓSZÍNŰSÉG, FÜGGETLENSÉG ii) Az A 1, A 2,... A eseményhalmazokat, vagy másképpen eseményrendszereket páronként függetleneknek nevezzük, ha A A k éés B A l függetlenek k l = 1, 2,.... iii) Az A 1, A 2,... A eseményrendszereket teljesen függetleneknek nevezzük, ha esetén teljesül A ki A ki {k 1, k 2,..., k n } N + n N + P (A k1 A k2... A kn ) = P (A k1 ) P (A k2 )... P (A kn ). 2.1. A függetlenség tulajdonságai A 2.2 definícióból következik néhány egyszerű állítás, megjegyzés: 1. Ha az eseményrendszerek egyetlen eseményből állnak, az eseményeket mondjuk páronként illetve teljesen függetleneknek. 2. Ha eseményrendszerek teljesen függetlenek, akkor páronként is függetlenek, és az A k1 A k2... A kn A l1 A l2... A lm események függetlenek, ahol A kı A kı {k 1, k 2,..., k n } N + n N + A lı A lı {l 1, l 2,..., l m } N + m N + = {k 1, k 2,..., k n } {l 1, l 2,..., l m }. A páronkénti függetlenségből nem következik a teljesen függetlenség (lásd 1. feladat). 3. A lehetetlen illetve biztos esemény minden eseménytől független, mivel A A esetén P (A ) = 0 = P (A) 0, 4. Ha A és B független események, akkor függetlenek, mert pl. P (A Ω) = P (A) = P (A) 1. A c éés B, Aéés B c, A c éés B c P (A c B) = P (B \ A) = P (B) P (A) P (B) = P (A c ) P (B). Következmény: Független eseményrendszerek bővíthetők az események komplementereivel, a páronkénti illetve teljesen függetlenség megtartásával.
2.1. A FÜGGETLENSÉG TULAJDONSÁGAI 15 5. Véletlen kísérletek függetlenségét modellezhetjük valószínűségi mezők szorzat mértékterével. Legyen (Ω 1, A 1, P 1 ) és (Ω 2, A 2, P 2 ) két valószínűségi mező, akkor az (Ω, A, P ) szorzat mértéktér (lásd A. Függelék) egy valószínűségi mező, ahol és ebben az Ω = Ω 1 Ω 2 A = σ {A B A A 1, B A 2 } P (A B) = P 1 (A) P 2 (B) A A 1, B A 2, Ã 1 = {A Ω 2 A A 1 } A Ã 2 = {Ω 1 B B A 2 } A eseményrendszerek függetlenek. Hasonlóan kapjuk több véletlen kísérlet teljesen független beágyazását a szorzat modellbe. A függetlenség fogalmával a korábban már említett Bernoulli kísérlet újra megfogalmazható, és újabb nevezetes véletlen kísérleteket vizsgálhatunk. (3) Bernoulli kísérlet Egy p [0; 1] valószínűségű eseményt n-szer megfigyelve, mennyi annak valószínűsége, hogy k-szor következik be? Legyenek a B 1, B 2,..., B n események teljesen függetlenek, és P (B i ) = p i = 1, 2,..., n. Jelölje továbbá A k esemény k-számú bekövetkezését a B 1, B 2,..., B n események közül. Akkor az A k = ( B 1 B 2... B k B c k+1... Bc n)... események valószínűségeire kapjuk ( ) n P (A k ) = p k (1 p) n k k = 0, 1, 2,... n. k (7) Több kimenetelű kísérlet ismételt megfigyelése Egy r kimenetelű kísérletet n-szer megismételve, adjuk meg annak valószínűségét, hogy az egyes kimenetelek k 1, k 2,... k r -szer következnek be, ha az egyes kimenetelek valószínűségei a p 1, p 2,..., p r diszkrét valószínűségeloszlással adottak! Legyenek a {B i1, B i2,..., B ir } A i = 1, 2,..., n Kézirat, módosítva: 2003. május 23.
16 2. FEJEZET. FELTÉTELES VALÓSZÍNŰSÉG, FÜGGETLENSÉG teljes eseményrendszerek teljesen függetlenek, és P (B ij ) = p i i = 1, 2,..., r, j = 1, 2,..., n. Ekkor a vizsgált A k1,k 2,...,k r = ( n ) B iji i=1 esemény egy pontosan n! k 1! k 2!... k r! tagú diszjunkt únió, ahol j 1, j 2,..., j n egy ismétléses permutáció k 1 számú 1-essel, k 2 számú 2-essel, és k r számú r-essel, így a függetlenséget is használva, kapjuk P (A k1,k 2,...,k r ) = n! k 1! k 2!... k r! pk 1 1 p k 2 2... p kr r (2.1) r ha k j N j = 1, 2,..., néés k j = n. Mivel (2.1) valószínűségeinek összege (a polinomiális tétel szerint is) 1, ezt a valószínűségeloszlást polinomiális eloszlásnak nevezzük. (8) Esemény megfigyelése az első bekövetkezésig Egy p ]0; 1[ valószínűségű eseményt figyelünk meg az első bekövetkezésig, adjuk meg annak valószínűségét, hogy ez a k-adik kisérletben történik meg! Legyenek a B 1, B 2,... események teljesen függetlenek, és P (B i ) = p i = 1, 2,.... Jelölje továbbá a vizsgálandó eseményt akkor a függetlenségből kapjuk: A k = B c 1 B c 2... B c k 1 B k k = 1, 2,... j= P (A k ) = p (1 p) k 1 k = 1, 2,... ami az un. diszkrét geometriai eloszlás, ugyanis p (1 p) k 1 = 1. k=1 Ez egyben azt is jelenti, hogy az A = B c 1 B c 2... = (A 1 A 2... ) c esemény valószínűsége P (A ) = 0.
2.2. A FELTÉTELES VALÓSZÍNŰSÉG TULAJDONSÁGAI 17 2.2. A feltételes valószínűség tulajdonságai Az alábiakban felsoroljuk a feltételes valószínűség néhány fontos tulajdonságát, melyek indokolják a fogalom értelmezését, és módszereket adnak bizonyos típusú problémák megoldásához. 1. Ha B A A, és P (B) > 0, akkor P (A B) = 1, tehát ha B maga után vonja az A eseményt, annak erre vonatkozó valószínűsége 1, ha pedig A, B A kizáróak, akkor P (A B) = 0. 2. Ha B A egy rögzített esemény, és P (B) > 0, akkor valószínűségi mérték A-n. P ( B) : A R A P (A B) Következmény: A valószínűségggel kapcsolatos számolási szabályokat a feltételes valószínűségre is alkalmazhatjuk, mint pl. P (A c B) = 1 P (A B) P (A 1 \ A 2 B) = P (A 1 B) P (A 1 A 2 B) P (A 1 A 2 B) = P (A 1 B) + P (A 2 B) P (A 1 A 2 B). 3. Szorzási szabály Legyenek A 1, A 2,..., A n A események olyanok, hogy P (A 1 A 2... A n ) > 0, akkor P (A 1 A 2... A n ) = P (A 1 ) P (A 2 A 1 ) P (A 3 A 1 A 2 )... P (A n A 1 A 2... A n ). 4. Teljes valószínűség tétel Legyenek B 1, B 2,..., B n A, B k B l = ha k l = 1, 2,..., n és n k=1 B k = Ω, vagyis egy un. teljes esményrendszer, továbbá A A, akkor n P (A) = P (A B k ) P (B k ). 5. Bayes tétel k=1 Legyen B 1, B 2,..., B n A egy teljes eseményrendszer, A A és P (A) > 0, akkor P (B l A) = P (A B l ) P (B l ) n k=1 P (A B k) P (B k ) l = 1, 2,..., n. Kézirat, módosítva: 2003. május 23.
18 2. FEJEZET. FELTÉTELES VALÓSZÍNŰSÉG, FÜGGETLENSÉG 2.3. Bayes döntés A feltételes valószínűség segítségével megadhatjuk a következő, un. döntési feladat megoldását. Legyenek (A i ) n i=1 és (B j) m j=1 teljes eseményrendszerek, és P (B j) > 0 j = 1, 2,... m. Keressük azt a un. döntés függvényt, mellyel a d : {1, 2,..., m} {1, 2,..., n} H d = m ( ) A c d(j) B j j=1 döntési hiba valószínűsége a legkisebb. A döntési hiba valószínűségét átalakítva kapjuk: P (H d ) = 1 m P ( ) m A d(j) B j = 1 P ( ) A d(j) B j P (Bj ). j=1 Ez pedig akkor maximális, ha azt a d döntésfüggvényt választjuk, melyre teljesül P (A d (j) B j ) P (A i B j ) i = 1, 2,..., n j = 1, 2,..., m, amit Bayes döntésnek nevezünk. Természetesen d nem egyértelműen adott, de minden Bayes döntés hibavalószínűsége ugyanaz. Egy másik lehetséges döntésfüggvény az a konstans d max, melyre teljesül amivel a döntés hibája j=1 P (A dmax ) = max {P (A 1 ), P (A 2 ),..., P (A n )} P (H dmax ) = 1 P (A dmax ) P (H d ). Ha a két teljes eseményrendszer független, akkor d = d max. Egy másik szélsőséges eset, amikor minden B j -hez van olyan A ı esemény, hogy B j A i, vagyis az Ω eseménytér (B j ) m j=1 feloszása finomabb, mint az (A i) n i=1 felosztás, másképpen fogalmazva minden B j esemény maga után vonja egy A i esemény bekövetkezését. Ekkor d (j) = i ha B j A i amiből következik, hogy ilyenkorp (H d ) = 0.
2.4. FELADATOK 19 2.4. Feladatok 1. Válasszunk egy origó középpontú r sugarú körben találomra egy pontot, és jelölje A a pont az x tengely fölötti félkörbe esik; B a pont az y tengelytől jobbra eső félkörbe esik; C a pont az első, vagy a harmadik síknegyedbe esik; Mutassuk meg, hogy az A, B és C események páronként függetlenek, de nem teljesen! 2. Mutassuk meg, hogy ha Ω = I 0 J 0 R 2 intervallum, és a geometriai valószínűségszámítás modelljét használjuk, akkor az és eseményrendszerek függetlenek. I x = {I J 0 I I 0 intervallum} J y = {I 0 J J J 0 intervallum} 3. Bizonyítsuk a feltételes valószínűség tulajdonságait! 4. Két céllövő felváltva lő, és az nyer, aki először eltalálja a célt. Ha feltesszük, hogy a cél eltalálásának eseményei az egymást követő lövések során teljesen függetlenek, és az elsőnek lövő esetén 0.6, illetve a másodiknál 0.8 a találati valószínűség, adjuk meg annak valószínűségét, hogy az első, illetve a második lövő nyer! 5. Egy kosárlabda játékos egymás után végez büntető dobásokat. Az elsőt bedobja, a másodikat nem, és minden további dobása akkora valószínűséggel lesz sikeres, mint amennyi a megelőző dobásokban a kosarak relatív gyakorisága. Mennyi annak valószínűsége, hogy 100 dobásból pontosan 50 kosarat fog dobni? 6. Egy kosárlabda játékos egymás után végez büntető dobásokat. Az elsőt bedobja, a másodikat nem, és minden további dobása akkora valószínűséggel lesz sikeres, mint amennyi a megelőző dobásokban a bedobott kosarak relatív gyakorisága. Mennyi annak valószínűsége, hogy 100 dobásból pontosan 50 kosarat fog dobni? 7. Szinbád, a szultánnak tett szolgálataiért, választhat egyet a N számú háremhölgy közül úgy, hogy az egyenként előtte elvonuló hölgyek valamelyikére rámutat. Tegyük fel, hogy a háremhölgyek szépségük szerint egyértelműen sorrendbe állíthatóak, és Szinbád taktikája a következő: az első n számú hölgy szemrevétele után azt választja, aki szebb minden korábban látottnál. Mennyi annak valószínűsége, hogy Szinbád a legszebb háremhölgyet választja? Hogyan kell az N értékét megválasztani n elég nagy N esetén, hogy ez a valószínűség a legnagyobb legyen? Kézirat, módosítva: 2003. május 23.
20 2. FEJEZET. FELTÉTELES VALÓSZÍNŰSÉG, FÜGGETLENSÉG 8. Két város közötti távíró összeköttetés olyan, hogy a leadott távíró jelek közül a pontok 2 -e vonallá torzul, a vonalak 1 -a pedig ponttá. A leadott jelek közül a 5 3 pontok és vonalak aránya 5 : 3. Adjunk döntési szabályt a vevő számára, mennyi a hibás dekódolás valószínűsége?
3. fejezet Valószínűségi változók Egy véletlen kísérlet eredményéhez sok esetben természetes módon tartozik egy vagy több (véletlen) mennyiség. A matematikai modellben ennek megfelellő fogalom definíciója: 3.1. Definíció. i) Skalár valószínűségi változónak (röviden v.v.) nevezzük a ξ : Ω R függvényt, ha x R esetén {ξ < x} = {ω Ω ξ(ω) < x} = ξ 1 (], x[) A ; ii) Vektor valószínűségi változónak (röviden v.v.v.) nevezzük a ξ = (ξ 1, ξ 2,..., ξ n ) : Ω R n függvényt, ha a ξ i : Ω R i = 1, 2,..., n komponensek skalár valószínűségi változók. A továbbiakban a skalár ill. vektor jelzőket csak akkor használjuk, ha azt hangsúlyozni kívánjuk, egyébként egyszerűen valószínűségi változóról, röviden (v.)v.v.-ról beszélünk. 3.1. Valószínűségi változóval kapcsolatos események Jelöljön a továbbiakban ξ egy skalár v.v.-t, ekkor a vele kapcsolatos események az alábbiak: 1. A definíció szerint x R esetén {ξ < x} = {ω Ω ξ(ω) < x} = ξ 1 (], x[) A ; 2. Az eseményalgebra tulajdonságaiból következnek x y R esetén {ξ x} = {ω Ω ξ(ω) x} = ξ 1 ([x, + [) = {ξ < x} c A ; {x ξ < y} = {ω Ω x ξ(ω) < y} = ξ 1 ([x, y[) = {ξ < y} \ {ξ < x} A ; { {ξ = x} = {ω Ω ξ(ω) = x} = ξ 1 ({x}) = x ξ < x + 1 } A ; n n=1 {x ξ y} = {ω Ω x ξ(ω) y} = ξ 1 ([x, y]) = = {x ξ < y} {ξ = y} A ;. 21
22 3. FEJEZET. VALÓSZÍNŰSÉGI VÁLTOZÓK tehát általában I R intervallum esetén {ξ I} = {ω Ω ξ(ω) I} = ξ 1 (I) A. Hasonlóan ellenőrízhető, hogy egy ξ = (ξ 1, ξ 2,..., ξ n ) : Ω R n v.v.v. esetén például {x 1 ξ 1 < y 1, x 2 ξ 2 < y 2,..., x n ξ n < y n } = vagy általában {ω Ω x ı ξ ı (ω) < y ı i = 1, 2,..., n} A x ı y ı R i = 1, 2,..., n, {ξ I} = {ω Ω ξ(ω) I} = ξ 1 (I) A I R n intervallum. Mindezekből (lásd : A. függelék) következnek az alábbiak: 3.2. Következmény. i) Egy ξ : Ω R n függvény pontosan akkor (v.)v.v., ha mérhető az intervallumokat tartalmazó legszűkebb B n σ-algebrára, azaz ii) {ξ B} = {ω Ω ξ(ω) B} = ξ 1 (B) A B B n. A ξ = ξ 1 (B n ) = { ξ 1 (B) B B n } A egy eseményalgebra, amit a ξ (v.)v.v.-val kapcsolatos események rendszerének is nevezünk. iii) A ξ (v.)v.v. egy valószínűségi mértéket generál. P ξ : B n [0; 1] B P (ξ B) Ennek megfelelően, valószínűségi változókat akkor fogunk (páronként, teljesen) függetleneknek nevezni, ha a velük kapcsolatos eseményrendszerek (eseményalgebrák) függetlenek. Ezzel kapcsolatos a következő tétel. 3.3. Tétel. A ξ : Ω R p és η : Ω R q (v.)v.v.-k pontosan akkor függetlenek, ha P ({ξ I} {η J}) = P (ξ I) P (η J) I R p, J R q intervallumok. (3.1) Bizonyítás. Az egyik irány nyilvánvaló, tehát tegyük fel, hogy 3.1 teljesül. Ekkor a B p+q -n (ξ, η)-által generált P (ξ,η) mértékre P (ξ,η) (I J) = P ξ (I) P η (J) I ı p, J ı q, tehát megegyezik a szorzatmértékkel az I p+q félgyűrűn, de akkor az egyértelmű kiterjesztés miatt P (ξ,η) a szorzatmérték (lásd: A. függelék), vagyis P (ξ,η) (A B) = P ({ξ A} {η B}) = P (ξ A) P (η B) A B p, B B q, amit bizonyítani kellett.
3.2. VALÓSZÍNŰSÉGI VÁLTOZÓK STRUKTÚRÁJA 23 3.2. Valószínűségi változók struktúrája Az alábbiakban összefoglaljuk a skalár v.v.-k (mérhető függvények, lásd: A függelék) tulajdonságait. 1. Egy A A esemény indikátora 1 A (ω) = { 1 ha ω A 0 ha ω A c valószínűségi változó. Speciálisan az 1 Ω 1 iletve 1 0 konstans függvények v.v.-k. 2. A skalár v.v.-k L halmaza vektorháló, azaz ξ L, c R c ξ L ξ, η L ξ + η L max{ξ, η} min{ξ, η} L, amiből következik, hogy egy ξ v.v. pozitív és negatív része, és ξ + = max{0, ξ} ξ = min{0, ξ} ξ = ξ + ξ abszolút értéke is valószínűségi változó, továbbá egy véges értékkészletű ξ : Ω R függvény pontosan akkor v.v., ha és ekkor a {ξ = x} A x im(ξ), ξ = x im(ξ) valószínűségi változót egyszerűnek nevezzük. x 1 {ξ=x} 3. A skalár v.v.-k L halmaza zárt a pontonkénti limeszre, azaz ha ξ n L n = 1, 2,... és akkor ξ valószínűségi változó. lim ξ n = ξ : Ω R, n 4. Ha 0 ξ v.v., akkor megadható egyszerű v.v.-k (ξ n ) n=1 monoton nem csökkenő sorozata, hogy A ξn A ξ n = 1, 2,... és lim ξ n = ξ. (3.2) n 5. Valószínűségi változó mérhető függvénye is valószínűségi változó, tehát ha ξ : Ω R n (v.)v.v. és h : R n R mérhető, akkor h ξ : Ω R valószínűségi változó. Speciálisan, ha h folytonos függvény, akkor h ξ valószínűségi változó. Kézirat, módosítva: 2003. május 23.
24 3. FEJEZET. VALÓSZÍNŰSÉGI VÁLTOZÓK 3.3. Valószínűségi változók eloszlása Egy ξ : Ω R n (v.)v.v. mindíg generál egy (R n, B n, P ξ ) valószínűségi mezőt, ahol a P ξ (B) = P ( ξ 1 (B) ) B B n valószínűségi mértéket (vagy a generált valószínűségi mezőt), amely az egységnyi valószínűséget szétosztja R n mérhető halmazain, a ξ v.v. eloszlásának nevezzük. A ξ-t diszkrét eloszlásúnak nevezzük, ha ez a mérték egy diszkrét valószínűségeloszlással adott, vagyis P ξ (B) = x B P (ξ = x) B B n, ahol a P (ξ = x) x R n valószínűségek közül csak véges, vagy megszámlálhatóan végtelen sok különbözik nullától, és azok összege x R n P (ξ = x) = 1. A ξ-t folytonos eloszlásúnak nevezzük, ha ez a mérték egy valószínűségi sűrűségfüggvénnyel adott, vagyis P ξ (B) = f B B n, B ahol f : R n R + 0 valószínűségi sűrűségfüggvény, azaz R n f = 1. Ilyenkor f nulla mértékű halmazon történő megváltoztatása azonos eloszlást eredményez, tehát f megadása nulla mértékű halmaztól eltekintve egyértelmű. Mint később látni fogjuk, a P ξ mértéket, vagy ξ eloszlását egyértelműen meghatározza a következő fogalom. 3.4. Definíció. A ξ = (ξ 1, ξ 2,..., ξ n ) : Ω R n (v.)v.v. eloszlásfüggvényének nevezzük az F (x 1, x 2,..., x n ) = P (ξ 1 < x 1, ξ 2 < x 2,..., ξ n < x n ) (x 1, x 2,..., x n ) R n függvényt. A definícióból és a valószínűségi mérték tulajdonságaiból egyszerűen következnek az alábbiak.
3.3. VALÓSZÍNŰSÉGI VÁLTOZÓK ELOSZLÁSA 25 Az eloszlásfüggvény tulajdonságai: 1. A ξ (v.)v.v. F eloszlásfüggvénye korlátos, im (F ) [0; 1]. 2. Legyen a ξ v.v.v. eloszlásfüggvénye F, akkor rögzített (x 1,..., x k 1, x k+1,..., x n ) R n 1 esetén az parciális függvény F (k) = F (x 1,..., x k 1,, x k+1,..., x n ) : R [0; 1] x F (x 1,..., x k 1, x, x k+1,..., x n ) (a) monoton nem csökkenő, balról mindenütt folytonos; (b) határértéke a végtelenben: és lim F (k)(x) = 0 x lim F (k)(x) = P ( ) ξ 1 < x 1, ξ 2 < x 2,..., ξ k 1 < x k 1, ξ k+1 < x k+1,... ξ n < x n x + vagyis F (k) (+ ) a ( ξ 1, ξ 2,..., ξ k 1, ξ k+1,... ξ n ) n 1 dimenziós un. perem eloszlásfüggvénye az (x 1,..., x k 1, x k+1,..., x n ) R n 1 helyen. Ha ξ skalár v.v., F monoton nem csökkenő, balról folytonos, és lim F (x) = 0 x lim F (x) = 1. x + 3. Legyen ξ skalár v.v., akkor a ξ-vel kapcsolatos események valószínűségei x y R esetén: ahol P (ξ < x) = F (x) P (ξ x) = 1 F (x) P (x ξ < y) = F (y) F (x) P (ξ = x) = F (x + 0) F (x) P (x ξ y) = F (y + 0) F (x) P (x < ξ y) = F (y + 0) F (x + 0) P (x < ξ < y) = F (y) F (x + 0) F (x + 0) = lim t x+ F (t), vagy általában jelöljük mindezt az alábbi módon: P (ξ I) = [F ] I I R intervallum. Ha ξ vektor valószínűségi változó, hasonlóan írhatjuk P (ξ I) = [F ] I I R n intervallum, tehát P ξ -t, illetve ξ-eloszlását meghatározza eloszlásfüggvénye. Kézirat, módosítva: 2003. május 23.
26 3. FEJEZET. VALÓSZÍNŰSÉGI VÁLTOZÓK A továbbiakban felsorolunk néhány egyszerűen ellenőrízhető, feladatokban gyakran használt következményt. Következmények: 1. Legyen a ξ : Ω R skalár v.v. (a) diszkrét eloszlású, akkor a diszkrét eloszlás valószínűségei és az eloszlásfüggvény P (ξ = x) = F (x + 0) F (x) x R, F (x) = t<x P (ξ = t) x R. Egy I R intervallum esetén P (ξ I) = x I P (ξ = x). (b) folytonos eloszlású, akkor valószínűségi sűrűségfüggvénye f(x) = F (x) x R ahol f folytonos, és az eloszlásfüggvény F (x) = x f(t)dt x R. Egy I R intervallum esetén, ha belseje ]a; b[ P (ξ I) = f(t)dt = [F ] I = F (b) F (a). I Mindez ξ : Ω R n v.v.v. esetén az alábbi összefüggéseket jelenti: illetve f(x 1, x 2,..., x n ) = n x1 x2... xn F (x 1, x 2,..., x n ) (x 1, x 2,..., x n ) R n ahol f folytonos, F (x 1, x 2,..., x n ) = x 1 x2... x n f(t 1, t 2,..., t n )dt 1 dt 2... dt n (x 1, x 2,..., x n ) R n, és egy I R n intervallum esetén, P (ξ I) = I f = [F ] I. Megjegyzés. Egy ξ skalár v.v. eloszlásának folytonosága egyszerűen következik, ha teljesül az alábbi két feltétel:
3.3. VALÓSZÍNŰSÉGI VÁLTOZÓK ELOSZLÁSA 27 F folytonos függvény; F folytonosan differenciálható az ]a n ; b n [ n = 1, 2,..., N nyílt intervallumokon, ahol a 1 =, a 2 = b 1, a 3 = b 2, a N = +. 2. Legyen a (ξ, η) : Ω R p+q v.v.v. (a) diszkrét eloszlású, akkor ξ illetve η diszkrét eloszlásúak, és P (ξ = x) = y P (η = y) = x P (ξ = x, η = y) x R p ; P (ξ = x, η = y) y R q ; (b) folytonos eloszlású f : R p+q R + 0 sűrűségfüggvénnyel, akkor ξ illetve η folytonos eloszlásúak, és sűrűségfüggvényeik f ξ (x) = f(x, y)dy x R p ; R q f η (y) = f(x, y)dx y R q ; R p 3. A (ξ, η) : Ω R p+q v.v.v. ξ : Ω R p és η : Ω R q peremei pontosan akkor függetlenek, ha a megfelelő eloszlásfüggvényekre teljesül F (ξ,η) (x, y) = F ξ (x) F η (y) x R p y R q. Ha (ξ, η) diszkrét eloszlású, ez a feltétel ekvivalens a P (ξ = x, η = y) = P (ξ = x) P (η = y) x R p y R q teljesülésével, és ha (ξ, η) folytonos eloszlású, a feltétel f(x, y) = f ξ (x) f η (y) x R p y R q alakban írható a megfelelő sűrűségfüggvények alkalmas választásával. 4. Valószínűségi változó megadása adott eloszlással: (a) Legyen (p n ) n=1,2,... egy diszkrét valószínűségeloszlás, és {x 1, x 2,... } R p, akkor az Ω = R p A = B p P (B) = x n B p n B A valószínűségi mezőn értelmezett ξ = id R p v.v. diszkrét eloszlású, és eloszlása: { pn ha x = x P (ξ = x) = n n = 1, 2,.... 0 egyébként Kézirat, módosítva: 2003. május 23.
28 3. FEJEZET. VALÓSZÍNŰSÉGI VÁLTOZÓK (b) Legyen f : R p R egy valószínűségi sűrűségfüggvény, akkor az Ω = R p A = B p P (B) = f B B A valószínűségi mezőn értelmezett ξ = id R p v.v. folytonos eloszlású, és sűrűségfüggvénye: f : R p R. 5. Valószínűségi változó függvényének eloszlása: Legyen ξ : Ω R p v.v.v. (a) diszkrét eloszlású, és h : R p R q, akkor η = h ξ : Ω R q diszkrét eloszlású v.v., és P (η = y) = P (ξ = x) y R q. (3.3) {x R p h(x)=y} (b) folytonos eloszlású f : R p R sűrűségfüggvénnyel, h : R p R p invertálható, és h 1 folytonosan differenciálható függvény, akkor η = h ξ : Ω R p v.v.v. eloszlása folytonos, és sűrűségfüggvénye ( ) f η (y) = det y h 1 (y) f ( h 1 (y) ) y R p. (3.4) Következmény: Ha a (ξ, η) : Ω R valószínűségi változó (a) diszkrét eloszlású, akkor ξ + η eloszlása is diszkrét, és P (ξ + η = x) = z P (ξ = x z, η = z) = z és ha még függetlenek is, akkor P (ξ + η = x) = z P (ξ = x z) P (η = z) = z P (ξ = z, η = x z) x R, P (ξ = z) P (η = x z) x R. (b) folytonos eloszlású f : R 2 R sűrűségfüggvénnyel, akkor ξ + η eloszlása is folytonos, és sűrűségfüggvénye f ξ+η (x) = + és ha még függetlenek is, akkor f ξ+η (x) = + f(x z, z)dz = f ξ (x z) f η (z)dz = + + ahol f ξ és f η a megfelelő peremek sűrűségfüggvényei. f(z, x z)dz x R, f ξ (z) f η (x z)dz x R,
3.4. NEVEZETES ELOSZLÁSÚ VALÓSZÍNŰSÉGI VÁLTOZÓK 29 3.4. Nevezetes eloszlású valószínűségi változók A továbbiakban röviden összefoglaljuk a már korábban felsorolt, nevezetes véletlen kísérletek kapcsán megfogalmazható valószínűségi változók jellemzőit, és néhány könnyen ellenőrízhető tulajdonságát. Az egyszerűbb jelölés érdekében, diszkrét eloszlások esetén csak a pozitív valószínűségeket soroljuk fel a megfelelő értékekkel, továbbá folytonos eloszlás sűrűségfüggvényét csak ott adjuk meg, ahol pozitív értéket vesz fel. Tehetjük mindezt azért is, mert 0 vallószínűségű eseményen egy v.v. tetszőlegesen megváltoztatható az eloszlás változatlansága mellett. (1) Visszatevés nélküli mintavétel Egy N N + elemszámú halmaz elemei között M N számú megjelölt van. Véletlenszerűen kiválasztva n N számút, jelölje ξ a megjelöltek számát a mintában. Ekkor ξ diszkrét eloszlású, eloszlása hipergeometrikus (lásd: 1.1): ( M ) ( k N M ) n k P (ξ = k) = ( N k = 0, 1, 2,... n, n) jelölése ξ Hyp(N, M, n). Vezessük be továbbá a következő eseményeket A k a k-adik kiválasztott a megjelöltek közül való k = 1, 2,..., n; akkor ξ = 1 A1 + 1 A2 +... + 1 An (3.5) ahol P (A k ) = M N = p P (A k A l ) = M(M 1) N(N 1) k l = 1, 2,..., n. Tulajdonsága: Ha ξ N Hyp(N, M, n) és p = M N lim P (ξ N N = k) = p= M N (2,3) Visszatevéses mintavétel, Bernoulli kísérlet állandó, akkor ( ) n p (1 p) n k k = 0, 1, 2,... n. k Egy p [0; 1] valószínűségű esemény n-ismételt megfigyelése esetén jelölje a ξ v.v. a bekövetkezések számát. Ekkor ξ diszkrét eloszlású, eloszlása n-edrendű p-paraméterű binomiális eloszlás (lásd: 1.2): ( ) n P (ξ = k) = p (1 p) n k k = 0, 1, 2,... n, k Kézirat, módosítva: 2003. május 23.
30 3. FEJEZET. VALÓSZÍNŰSÉGI VÁLTOZÓK jelölése ξ Bin(n; p). Vezessük be továbbá a következő (teljesen) független eseményeket A k a k-adik megfigyelésben bekövetkezik a figyelt esemény k = 1, 2,..., n; akkor ahol Tulajdonságok: ξ = 1 A1 + 1 A2 +... + 1 An (3.6) P (A k ) = p k = 1, 2,..., n. (a) Ha ξ 1 Bin(n 1 ; p) és ξ 2 Bin(n 2 ; p) függetlenek, akkor ξ 1 + ξ 2 Bin(n 1 + n 2 ; p). (b) Ha ξ n Bin(n; p) és np = λ állandó, akkor (4) Véletlen eseményszám lim P (ξ n n = k) = λk k! e λ k = 0, 1, 2,.... np=λ Egy átlagosan λ-szor bekövetkező esemény bekövetkezéseinek számát jelölje a ξ v.v. Ekkor ξ diszkrét eloszlású, eloszlása λ-paraméterű Poisson eloszlás (lásd: 1.3): jelölése ξ Po(λ). P (ξ = k) = λk k! e λ k N, Tulajdonsága: Ha ξ 1 Po(λ) és ξ 2 Po(µ) függetlenek, akkor (5) Véletlen időtartam Egy átlagosan T = 1 λ változó. ξ 1 + ξ 2 Po(λ + µ) idejű véletlen időtartam értéke legyen a ξ valószínűségi Ekkor ξ folytonos eloszlású, eloszlása λ-paraméterű exponenciális eloszlás (lásd: 1.4), sűrűségfüggvénye eloszlásfüggvénye jelölése ξ Exp(λ). Tulajdonságok: f(t) = λ e λt dt t > 0, { F (t) = 0 ha t 0 1 e λt ha 0 < t,
3.4. NEVEZETES ELOSZLÁSÚ VALÓSZÍNŰSÉGI VÁLTOZÓK 31 (a) Egy folytonos eloszlásfüggvényű ξ : Ω R + 0 v.v. akkor és csak akkor exponenciális eloszlású, ha x, y > 0 esetén teljesül: P (ξ > x + y ξ > y) = P (ξ > x). (b) Ha ξ Exp(λ), és c R +, akkor c ξ Exp( λ c ). (6) Mérési eredmény Sok kicsiny eltérés összegeként nyerhető véletlen értéket jelölje a ξ valószínűségi változó. Ekkor ξ folytonos eloszlású, eloszlása m R és σ > 0 paraméterű normális (vagy Gauss) eloszlás (lásd: 1.7), sűrűségfüggvénye f(x) = 1 2π σ e (x m)2 2σ 2 x R, eloszlásfüggvénye jelölése ξ N (m; σ). Tulajdonságok: F (x) = x f(t)dt x R, (a) Ha m = 0 és σ = 1, standard normális eloszlásról beszélünk, aminek sűrűségfüggvénye eloszlásfüggvénye pedig ϕ(x) = 1 2π e x2 2 x R, Φ(x) = x ϕ(t)dt x R, amit táblázat segítségével használhatunk (lásd: B. függelék). Mivel ϕ páros függvény, teljesül Φ( x) = 1 Φ(x) x R, ezért a táblázatok általában csak 0 x helyeken adják meg az eloszlásfüggvényt. (b) Ha ξ N (m; σ), és a 0, b R, akkor a ξ + b N (a m + b; a σ), tehát a lineáris transzformáció nem változtat az eloszlás normális voltán. Speciálisan a ξ u.n. standardizáltja ξ m σ N (0; 1). Kézirat, módosítva: 2003. május 23.
32 3. FEJEZET. VALÓSZÍNŰSÉGI VÁLTOZÓK (c) Ha ξ N (m; σ), akkor sürűségfüggvénye f(x) = 1 ( ) x m σ ϕ σ x R, eloszlásfüggvénye ( ) x m F (x) = Φ σ x R. (d) Ha ξ 1 N (m 1 ; σ 1 ) és ξ 2 N (m 2 ; σ 2 ) függetlenek, akkor ξ 1 + ξ 2 N ( ) m 1 + m 2 ; σ 2 1 + σ 2 2 (7) Véletlen pont választása Egy [a; b] R intervallumban válasszunk találomra egy számot, jelölje ezt a ξ valószínűségi változó. Ekkor ξ folytonos eloszlású, az [a; b] intervallumon egyenletes eloszálsú v.v. (lásd: 1.8), sűrűségfüggvénye f(x) = 1 b a a < x < b, eloszlásfüggvénye jelölése ξ U(a; b). Tulajdonságok: F (x) = 0 ha x a ha a < x b 1 ha b < x x a b a, (a) Ha ξ U(a; b) és 0 α, β R akkor α ξ + β U ( α a + b + β α b a 2 2 ; α a + b + β + α b a ) 2 2. (b) Ha a ξ skalár v.v. F eloszlásfüggvénye folytonos, akor F (ξ) U(0; 1). (3.7) (c) Ha F egy eloszlásfüggvény, mely folytonos és invertálható, τ U(0; 1), akkor az F 1 (τ) v.v. eloszlásfüggvénye F.
3.5. FELADATOK 33 3.5. Feladatok 1. Mutassuk meg, hogy egy ξ skalár v.v. eloszlásfüggvénye legfeljebb megszámlálhatóan sok pont kivételével folytonos! 2. Kockát dobunk kétszer, és jelölje ξ az eredmények minimumát, η az eredmények maximumát. Adjuk meg ξ, η és (ξ, η) eloszlását! Függetlenek-e ξ és η? 3. Válasszunk két véletlen pontot a [0; 1] intervallumban, jelölje ezeket ξ 1 és ξ 2. Adjuk meg ξ 1, ξ 2 és (ξ 1, ξ 2 ) eloszlását! Legyen továbbá η = max{ξ 1, ξ 2 }, adjuk meg (ξ 1, η) eloszlását! Függetlenek-e ξ 1 és ξ 2, illetve ξ 1 és η? 4. Egy egységnyi sugarú körben találomra választunk egy pontot. Jelölje a pont polárkoordinátáit (ρ, ϕ), függetlenek-e a ρ és ϕ v.v.-k? 5. Egy dobozban 5 db cédula van, az 1,2,3,4 és 5 számokkal. Találomra kiválsztunk (visszatevés nélkül) hármat, és jelölje a ξ v.v. a három kiválsztott közül a legkisebbet. Adjuk meg ξ eloszlását, számítsuk ki a P (2 ξ 4) valószínűséget! 6. Legyen a ξ v.v. sűrűségfüggvénye f(x) = { c cos(x) ha 0 x π 2 0 egyébként. Adjuk meg ξ eloszlásfüggvényét, és a P (ξ 2 > 1) valószínűséget! 7. Legyenek ξ 1, ξ 2 N (0, 1) független valószínűségi változók, adjuk meg η 1 = ξ 2 1 és η 2 = ξ 2 1 + ξ 2 2 eloszlását!. 8. Legyenek ξ, η N (0, 1) független valószínűségi változók, adjuk meg eloszlását! η = ξ η 9. Legyen τ U(0; 1), és λ > 0, adjuk meg 1 ln(τ) eloszlását! λ 10. Legyenek ξ k U(a; b), η k U(c; d) k = 1, 2,... függetlenek, f : [a; b] [c; d] egy valószínűségi sűrűségfüggvény, és a ζ v.v. olyan hogy ζ = ξ n ha f(ξ n ) η n és f(ξ k ) < η k k = 1, 2,..., n 1. Adjuk meg ζ eloszlását! 11. Legyenek a ξ és η független skalár valószínűségi változók, és eloszlásfüggvényeik folytonosak. Mutassuk meg, hogy P (ξ = η) = 0. Kézirat, módosítva: 2003. május 23.
34 3. FEJEZET. VALÓSZÍNŰSÉGI VÁLTOZÓK
4. fejezet Várható érték, szórás Véletlen mennyiségek megfigyelésével kapcsolatos tapasztalat, hogy a megfigyelt véletlen értékek egy közép-érték körül ingadoznak valamilyen mértékben. A továbbiakban egy ξ skalár v.v.-val kapcsolatban, ennek megfelelő fogalmakat vezetünk be a matematikai modellünkben. 4.1. Várható érték 4.1. Definíció. i) A ξ 0 egyszerű v.v., várható értékének nevezzük az E(ξ) = x R x P (ξ = x) összeget, ahol az összegzés a véges sok pozitív tagra vonatkozik. ii) A ξ 0 v.v. várható értékének nevezzük az véges határértéket, ha (ξ n ) n=1 sorozata, és lim n ξ n = ξ. E(ξ) = lim n E(ξ n ) nemnegatív egyszerű v.v.-k monoton nem csökkenő iii) A ξ skalár v.v. várható értékének nevezzük az E(ξ) = E(ξ + ) E(ξ ) különbséget, ha a ξ + = max{0, ξ} és ξ = max{0, ξ} nemnegatív v.v.-k várható értéke definiált. A definíció egyértelműen meghatározott, mivel egy ξ v.v. várható értéke a P valószínűségi mérték szerinti integrálja, ha az véges érték (lásd: A függelék). Tehát ha a ξ v.v.-nak definiált (létezik) a várható értéke, azt E(ξ) vagy ξ L 1 jelöli a továbbiakban. A várható érték (mint egy véges mérték szerinti integrál), teljesíti az alábbi tulajdonságokat. 35
36 4. FEJEZET. VÁRHATÓ ÉRTÉK, SZÓRÁS 1. Indikátor v.v. várható értéke: Legyen A A, akkor E(1 A ) = P (A). Speciálisan az 1 Ω 1 illetve 1 0 konstansok várható értéke 2. Nemnegatív tulajdonság: Ha ξ 0 és E(ξ), akkor 3. Homogén és additív tulajdonság: E(1 Ω ) = E(1) = 1 E(1 ) = E(0) = 0. E(ξ) 0 és E(ξ) = 0 P (ξ = 0) = 1. Ha ξ, η v.v.-k várható értéke létezik, és c R, akkor E(c ξ), E(ξ + η) és Következmények: E(c ξ) = c E(ξ) E(ξ + η) = E(ξ) + E(η). (a) (Monoton) Ha ξ η v.v.-k várható értéke létezik, akkor E(ξ) E(η) és E(ξ) = E(η) P (ξ = η) = 1. (b) (Konvex) Ha h : I R konvex függvény az I R intervallumon, és ξ : Ω I v.v., továbbá létezik az E(h(ξ)), E(ξ) várható érték, akkor h (E(ξ)) E(h(ξ)). (c) A ξ v.v. várható értéke akkor és csak akkor létezik, ha E( ξ ), és ekkor E(ξ) E( ξ ). (d) A ξ v.v. várható értéke akkor és csak akkor létezik, ha η L 1 és ξ η, és ekkor 4. Monoton konvergencia tulajdonság: E(ξ) E( ξ ) E(η). Ha ξ n L 1 n = 1, 2,... v.v.-k monoton nem csökkenő sorozata, ξ = lim n ξ n : Ω R, és (E(ξ n )) n=1 korlátos sorozat, akkor létezik a ξ v.v. várható értéke, és E(ξ) = lim n E(ξ n ).