Valószín ségszámítás



Hasonló dokumentumok
ELEMI VALÓSZÍNŰSÉGSZÁMÍTÁS és STATISZTIKAI MÓDSZEREK A FIZIKÁBAN

Biomatematika 2 Orvosi biometria

Elméleti összefoglaló a Valószín ségszámítás kurzushoz

Eseményalgebra. Esemény: minden amirl a kísérlet elvégzése során eldönthet egyértelmen hogy a kísérlet során bekövetkezett-e vagy sem.

[Biomatematika 2] Orvosi biometria

Feladatok 2. zh-ra. 1. Eseményalgebra április Feladat. Az A és B eseményekr l tudjuk, hogy P (A) = 0, 6, P (B) = 0, 7 és

Valószín ségszámítás és statisztika

Valószín ségszámítás és statisztika

2. A ξ valószín ségi változó eloszlásfüggvénye a következ : x 4 81 F (x) = x 4 ha 3 < x 0 különben

36 0,3. Mo.: 36 0,19. Mo.: 36 0,14. Mo.: 32 = 0, = 0, = 0, Mo.: 32 = 0,25

Gazdasági matematika II. tanmenet

Készítette: Fegyverneki Sándor

Ismétlés nélküli permutáció

Ismétlés nélküli kombináció

1. A kísérlet naiv fogalma. melyek közül a kísérlet minden végrehajtásakor pontosan egy következik be.

Abszolút folytonos valószín ségi változó (4. el adás)

Klasszikus valószínűségszámítás

Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus.

A valószínűségszámítás elemei

Azaz 56 7 = 49 darab 8 jegyű szám készíthető a megadott számjegyekből.

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

VALÓSZÍNŰSÉG, STATISZTIKA TANÍTÁSA

Elméleti összefoglaló a Sztochasztika alapjai kurzushoz

Diszkrét matematika 1.

AGRÁRMÉRNÖK SZAK Alkalmazott matematika, II. félév Összefoglaló feladatok A síkban 16 db általános helyzetű pont hány egyenest határoz meg?

3. Egy szabályos dobókockával háromszor dobunk egymás után. Legyen A az az esemény, hogy

7! (7 2)! = 7! 5! = 7 6 5! 5 = = ből 4 elem A lehetőségek száma megegyezik az 5 elem negyedosztályú variációjának számával:

Diszkrét matematika 1.

Gyakorló feladatok. Az alábbi feladatokon kívül a félév szemináriumi anyagát is nézzék át. Jó munkát! Gaál László

Gazdasági matematika II. vizsgadolgozat megoldása A csoport

Környezet statisztika

1. tétel. Valószínűségszámítás vizsga Frissült: január 19. Valószínűségi mező, véletlen tömegjelenség.

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1

Gyakorló feladatok a 2. dolgozathoz

Valószínűségi változók. Várható érték és szórás

Kombinatorika - kidolgozott típuspéldák

Matematika A3 Valószínűségszámítás, 0. és 1. gyakorlat 2013/14. tavaszi félév

Számelmélet Megoldások

Kombinatorika gyakorló feladatok

Tantárgy kódja Meghirdetés féléve 3 Kreditpont 4 Összóraszám (elm+gyak) 2+2

A valószínűségszámítás elemei

1. Kombinatorikai bevezetés

Kombinatorika. I. típus: Hányféleképpen lehet sorba rendezni n különböző elemet úgy, hogy a sorrend számít? (Ismétlés nélküli permutáció)

Matematikai alapok és valószínőségszámítás. Valószínőségi eloszlások Binomiális eloszlás

Villamosmérnök A4 4. gyakorlat ( ) Várható érték, szórás, módusz

Valószínűségszámítás összefoglaló

Matematika III. 4. A valószínűségi változó és jellemzői Prof. Dr. Závoti, József

a megoldásra ajánlott feladatokat jelöli, a nehezebb feladatokat jelöli

Gazdasági matematika 2

Valószínűség számítás

Való szí nű sé gi va ltózó, sű rű sé gfű ggvé ny, élószla sfű ggvé ny

K O M B I N A T O R I K A P e r m u t á c i ó k, k o m b i n á c i ó k, v a r i á c i ó k

2. A ξ valószín ségi változó s r ségfüggvénye a következ : c f(x) =

[Biomatematika 2] Orvosi biometria

e (t µ) 2 f (t) = 1 F (t) = 1 Normális eloszlás negyedik centrális momentuma:

Tananyag: Kiss Béla - Krebsz Anna: Lineáris algebra, többváltozós függvények, valószínűségszámítás,

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Nyugat-magyarországi Egyetem Geoinformatikai Kara. Prof. Dr. Závoti József. Matematika III. 4. MA3-4 modul. A valószínűségi változó és jellemzői

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Nyugat-magyarországi Egyetem Geoinformatikai Kara. Prof. Dr. Závoti József. Matematika III. 1. MA3-1 modul. Kombinatorika

x, x R, x rögzített esetén esemény. : ( ) x Valószínűségi Változó: Feltételes valószínűség: Teljes valószínűség Tétele: Bayes Tétel:

Biometria az orvosi gyakorlatban. Számítógépes döntéstámogatás

Matematika A3 Valószínűségszámítás, 6. gyakorlat 2013/14. tavaszi félév

Nyugat-magyarországi Egyetem Geoinformatikai Kara. Prof. Dr. Závoti József. Matematika III. 3. MA3-3 modul. A valószínűségszámítás elemei

Matematika III. 3. A valószínűségszámítás elemei Prof. Dr. Závoti, József

Matematika A4 I. gyakorlat megoldás

Szerencsejátékok. Elméleti háttér

Klasszikus valószínűségi mező megoldás

Nagy Gábor compalg.inf.elte.hu/ nagy ősz

VALÓSZÍN SÉG-SZÁMÍTÁS

VALÓSZÍNŰSÉGSZÁMÍTÁS. MSc. Órai Feladatok

Valószín ségszámítás. Survey statisztika mesterszak és földtudomány alapszak Backhausz Ágnes 2018/2019.

Gyakorló feladatok valószínűségszámításból végeredményekkel. a megoldásra ajánlott feladatokat jelöli, a nehezebb feladatokat jelöli

Statisztika I. 4. előadás Mintavétel. Kóczy Á. László KGK-VMI. Minta Mintavétel Feladatok.

Feladatok és megoldások az 1. sorozat Építőkari Matematika A3

Valószínűségszámítás feladatgyűjtemény

Házi feladatok. Valószín ségszámítás és statisztika programtervez informatikusoknak, 2015 sz

Nagy számok törvényei Statisztikai mintavétel Várható érték becslése. Dr. Berta Miklós Fizika és Kémia Tanszék Széchenyi István Egyetem

4.4. Egy úton hetente átlag 3 baleset történik. Mi a valószínűsége, hogy egy adott héten 2?

Feladatok és megoldások a 8. hétre Építőkari Matematika A3

Statisztika I. 4. előadás Mintavétel. Kóczy Á. László KGK-VMI. Minta Mintavétel Feladatok.

Matematikai és matematikai statisztikai alapismeretek

Brósch Zoltán (Debreceni Egyetem Kossuth Lajos Gyakorló Gimnáziuma) Kombinatorika

1. Hányféle sorrendben vonulhat ki a pályára egy focimeccsen a tizenegy kezdő játékos?

Tananyag: Kiss Béla - Krebsz Anna: Lineáris algebra, többváltozós függvények, valószínűségszámítás,

Matematikai alapok és valószínőségszámítás. Statisztikai becslés Statisztikák eloszlása

Valószínűségszámítás

Véletlen bolyongás. Márkus László március 17. Márkus László Véletlen bolyongás március / 31

Bodó Beáta - MATEMATIKA II 1

Az ész természetéhez tartozik, hogy a dolgokat nem mint véletleneket, hanem mint szükségszerűeket szemléli (Spinoza: Etika, II. rész, 44.

Matematika III. 2. Eseményalgebra Prof. Dr. Závoti, József

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Matematikai statisztika. Mi a modell? Binomiális eloszlás sűrűségfüggvény. Binomiális eloszlás

Matematikai alapok és valószínőségszámítás. Valószínőségszámítási alapok

1. Név:... Neptun Kód:... Feladat: Egy összeszerel½o üzemben 3 szalag van. Mindehárom szalagon ugyanazt

MATEMATIKA ÉRETTSÉGI TÍPUSFELADATOK MEGOLDÁSAI KÖZÉP SZINT Számelmélet

Mi az adat? Az adat elemi ismeret. Az adatokból információkat

P (A) = i. P (A B i )P (B i ) P (B k A) = P (A B k)p (B k ) P (A) i P (A B i)p (B i )

0,9268. Valószín ségszámítás és matematikai statisztika NGB_MA001_3, NGB_MA002_3 zárthelyi dolgozat

(6/1) Valószínűségszámítás

1. Példa. A gamma függvény és a Fubini-tétel.

Átírás:

Sinkovicz Péter Valószín ségszámítás IV ÉVES FIZIKUS HALLGATÓK RÉSZÉRE Sinkovicz Péter Budapest, 2012

Tartalomjegyzék Valószín ségszámítás Kombinatorika 1 1.1 Klasszikus valószín ségi összefoglaló......................... 1 1.2 Kombinatorika..................................... 2 1.21. Ismétlés nélküli és ismétléses permutációk.................. 2 1.22. Ismétlés nélküli és ismétléses kombinációk.................. 2 1.23. Ismétlés nélküli és ismétléses variációk.................... 2 1.24. Kidolgozott feladatok............................. 4 1.25. Gyakorló feladatok............................... 9 Valószín ségszámítás Valószín ségek alapvet összefüggései, valószín ségi változók, nevezetes eloszlások 11 2.1 Valószín ségek alapvet összefüggései......................... 11 2.11. Feltételes valószín ség............................. 11 2.12. Teljes valószín ség tétele............................ 12 2.13. Események függetlensége............................ 13 2.14. Gyakorló feladatok............................... 14 2.2 Valószín ségi változók................................. 16 2.21. Diszkrét valószín ségi változó......................... 16 2.22. Folytonos valószín ségi változó........................ 19 2.23. Markov- és Csebisev-egyenl tlenség...................... 21 2.24. Gyakorló feladatok............................... 22 2.3 Nevezetes eloszlások.................................. 23 2.31. Diszkrét-eloszlások............................... 23 2.32. Folytonos-eloszlások.............................. 25 2.33. Gyakorló feladatok............................... 27 Statisztikai becslések, hipotézis vizsgálat 28 3.1 Bevezet......................................... 28 3.11. Empirikus adatok................................ 28 3.12. Becslések tulajdonságai............................ 29 3.13. Kismintás becslések kritériumai........................ 29 3.14. Nagymintás becslési kritériumok....................... 30 3.15. Gyakorló feladatok............................... 31 3.2 Statisztikai becslések.................................. 32 3.21. Pontbecslés módszerei............................. 32 3.22. Intervallumbecslés............................... 33 3.23. Gyakorló feladatok............................... 37 3.3 Statisztikai próbák................................... 38 3.31. Egymintás próbák............................... 38 3.32. Gyakorló feladatok............................... 40 I

sinkovicz.peter@wigner.mta.hu TARTALOMJEGYZÉK II Függelék: Nevezetes eloszlások 41 4.1 Diszkrét eloszlások................................... 41 4.11. Geometriai eloszlás............................... 41 4.12. Binominális eloszlás.............................. 42 4.13. Poisson eloszlás................................. 44 4.2 Folytonos eloszlások.................................. 45 4.21. Exponenciális eloszlás............................. 45 4.22. Normális eloszlás................................ 46 4.23. Lognormális eloszlás.............................. 47 Irodalomjegyzék 48

1. Valószín ségszámítás Kombinatorika 1.1 Klasszikus valószín ségi összefoglaló Ha egy véletlen kísérletet elvégzünk, melynek több lehetséges kimenetele van, akkor a kísérlet kimenetére semmilyen biztos jóslatunk sincs. Azonban ha az el bb említett kísérletet többször és egymástól függetlenül elvégezzük, akkor szabályosságot gyelhetünk meg az egyes események gyakoriságai 1 között. Ha az adott kísérlet sorozatban a kísérletek számát minden határon túl növeljük ( (# kísérletek 1), akkor az események gyakoriságaiból képzett hányadosok k A /k B, ahol k A(B) az A(B) esemény gyakorisága ) egy meghatározható számértékhez tart. Tehát az egyes események meghatározott relatív súllyal következnek be. Ekkor az A esemény relatív gyakoriságának bevezetésével (k A /n, ahol n = # kísérletek ) és az egyes gyakoriságok ismeretével becslést adhatunk a többi esemény gyakoriságára. Az A esemény relatív gyakorisága határesetben az A esemény P (A) valószín ségével egyezik meg 2 k A lim n n P (A) Így egy klasszikus valószín ségi mez n (véges elemszámú és minden elemi esemény egyenl en valószín ) felett értelmezett valószín ségi függvényt a következ képen adhatunk meg: P (A Ω klassz. ) := k A n kedvez elemi esetek száma lehetséges elemi esetek száma A kedvez, illetve lehetséges esetek számát a kombinatorika eszközeivel (permutációk, variációk, kombinációk) határozhatjuk meg. 1 a esemény gyakorisága: annak a száma ahányszor az a esemény bekövetkezett a kísérletsorozatban 2 hiszen minden olyan P (A) függvényt valószín ségnek nevezünk amelyet az Ω alaphalmazon értelmezünk és tudja a következ három feltételt: i) 0 P (A Ω) 1 ii) P (Ω) = 1 iii) Egymást páronként kizáró események valószín ségei összeadódnak

sinkovicz.peter@wigner.mta.hu 1.2. KOMBINATORIKA 2 1.2 Kombinatorika A kombinatorika (kapcsolástan) az Ω alaphalmaz elemeinek bizonyos szabályok szerinti csoportosításával foglalkozik, illetve a lehetséges csoportok számának meghatározásával. 1.21. Ismétlés nélküli és ismétléses permutációk Ha adott n elem minden lehetséges sorrendben elrendezzük, akkor az adott elemeket permutáljuk, az egyes elrendezéseket pedig az adott elemek permutációinak nevezzük. Ha az elrendezend elemek mind különböz ek akkor ismétlés nélküli permutációról beszélünk, ellenkez esetben pedig ismétléses permutációról. Jelöljük n különböz elem összes permutációinak számát P n -nel ekkor P n = n!, ahol n! szimbólumot n faktoriálisnak nevezünk és az els n természetes szám szorzatát jelöli, megállapodás szerint 0! = 1 = 1!. Jelöljük n elem permutációjának számát P k 1,k 2,...,k l n -lel melyben k 1, k 2,..., k l számú egymással megegyez elem található, ekkor P k 1,k 2,...,k l n = n! k 1!k 2! k l!. 1.22. Ismétlés nélküli és ismétléses kombinációk Ha adott n különböz elemb l k (k n) elemb l álló csoportokat készítünk minden lehetséges módon, úgy hogy a kiválasztott elemek sorrendje nem számít akkor n elem k-ad osztályú kombinációjáról beszélünk, a kiválasztás lehet visszatevéses és visszatevés nélküli. Jelöljük Cn-val k az n elem alapsokaságból visszatevés nélkül kiválasztott k elem kombinációjának számát, ekkor ( ) Cn k n! n = k!(n k)! := k ( ) n ahol szimbólumot "n alatt a k"-nak olvassuk és a fenti denícióból könnyen belátható, k ( ) ( ) n n hogy = egyenl ség fennáll. k n k Jelöljük Cn k,i -val az n elem k-adosztályú ismétléses (visszatevéses) kombinációjának számát, ekkor ( ) Cn k,i n + k 1 = k 1.23. Ismétlés nélküli és ismétléses variációk Ha adott n különböz elemb l kiválasztunk k (k n) elemet kiválasztunk egy meghatározott sorrendbe, akkor n elem egy k-ad osztályú variációjáról beszélünk, mely lehet ismétléses és

sinkovicz.peter@wigner.mta.hu 1.2. KOMBINATORIKA 3 ismétlés nélküli. Jelöljük n egymástól különböz elem összes k-ad osztályú variációjának számát V k n -val, ekkor V k n = n! = n(n 1) (n k + 1) (n k)! Feltéve, ha a kiválasztott sorba rendezett elemeket minden húzás el tt vissza tehetjük, akkor ismétléses variációról beszélünk. Jelöljük n egymástól különböz elem összes k-ad osztályú ismétléses (visszatevéses) variációjának számát Vn k,i -val, ekkor = n k V k,i n

sinkovicz.peter@wigner.mta.hu 1.2. KOMBINATORIKA 4 1.24. Kidolgozott feladatok Ismétlés nélküli permutáció 1. Az A,B,C,D,E,F bet k hány komplexió képezhet? Az els helyen 6 féle bet állhat, majd a második helyre már csak 5-b l választhatunk,... Tehát mind a 6 hely 6! = 720 féleképpen tölthet fel. 2. Hány olyan hétjegy telefonszám képezhet az 1,2,3,4,5,6,7 számok felhasználásával, melyben a harmadik számjegy 3-as? Egy számjegy xen van tartva, ezzel már csak 6 szabad helyünk és 6 szabad számjegyünk maradt, melyekkel az el z példában leírtak alapján bánhatunk el: 6! = 720 3. Hány hétjegy szám állítható el a 0,2,3,5,7,8,9 számjegyekb l? Mivel 0-val nem kezd dhet szám, így a 7 számjegyünket nem kezelhetjük azonosan... a) megoldás: els jegy hat féle lehet, a további jegyekre az els feladatban leírtakhoz hasonlóan válogathatunk a maradék 6 számból: 6 6! = 4.320 b) megoldás: Összes lehetségesen képezhet számból levonhatjuk azokat az eseteket mikor a 0 xen rögzítve van az els helyen: 7! 6! = 7 6! 6! = 6 6! = 4.320 4. Egy körasztalhoz hányféleképpen ülhet le egy 9 tagú család? 9 ember 9! féleképpen állítható sorba, azonban mivel az asztal körszimmetrikus ezért mindegy hogy hol kezdjük a családtagok leültetését (a leültetés helyét 9 féleképpen választhatjuk ki): 9! = 8! = 5.760 9 5. Hányféleképpen mehet be egy ajtón 10 n és 5 fér, ha a n k mennek be els nek? 10 n 10! féleképpen és 5 fér 5! féleképpen állítható sorba, mivel a két sorba állítás független, így a lehetséges események számát összeszorozzuk: 10! 5! = 435.456.000 Ismétléses permutáció 1. Hány különböz 9 jegy szám képezhet a 1,1,1,2,2,2,3,3,3 számjegyekb l? n = 9, k 1 = k 2 = k 3 = 3, így az ismétléses permutáció képlete alapján: 9! 3!3!3! = 1.680

sinkovicz.peter@wigner.mta.hu 1.2. KOMBINATORIKA 5 2. Hányféleképpen f zhet fel 10 piros és 5 kék golyó egy lineáris láncra? n = 15, k 1 = 10, k 2 = 5, így az ismétléses permutáció képlete alapján: 15! 5!10! = 3.003 3. Hányféleképpen tölthetünk ki egy 13 mérk zéses totót, úgy hogy 3db 1-es, 5db x és 5db 2-es legyen rajta? n = 13, k 1 = 3, k 2 = k 3 = 5, így az ismétléses permutáció képlete alapján: 13! 3!5!5! = 72.072 4. Egy csiga mászik ki a kútból minden "lépésben"/csúszásban egy egységet halad/esik vissza hányféleképpen mászhat fel 3 egységet, 15 lépés alatt? El ször határozzuk meg hogy összesen hány haladás és hány csúszás történt! Jelöljük x- szel a haladások számát és y-nal a csúszásokét! Ekkor a következ egyenletrendszert kell megoldanunk: x + y = 15 x y = 3 melynek megoldásából adódik, hogy: x = 9 és y = 6, most azonosítjuk be az ismétléses permutáció képletének elemeit: n = 15, k 1 = 9, k 2 = 6, így: 15! 9!6! = 5.005 5. Az A,A,B,B,C,D,E,E,E,F bet k egyszeri felhasználásával hány komplexió képezhet? n = 10, k 1 = k 2 = 2, k 3 = 3, így az ismétléses permutáció képlete alapján: 10 2!2!3! = 151.200 Ismétlés nélküli kombináció 1. Egy 20 f s osztályból hányféleképpen választható ki 3 felel? n = 20, k = 3, az ismétlés nélküli kombináció képlete alapján: 20 3!17! = 1.140 2. Egy részeg postás gyelmetlenül oszt szét öt levelet azok címzettjeinek. Hányféleképpen teheti ezt meg úgy, hogy senki se a sajátját kapja meg és egy ládába legfeljebb egy levél kerülhet? És úgy, hogy pontosan 1, 2, 3, 4 ill. 5 címzett kapja meg a saját levelét? a) feladat: pontosan 5db levelet csak egyféleképpen vihet ki jó címre b) feladat: pontosan 4db levelet nem vihet ki, mert akkor az ötödik is jó helyre kerül c) feladat: pontosan 3db levelet úgy vihet ki hogy kett t összecserél, ezeket: ( 5 2 ) = 10

sinkovicz.peter@wigner.mta.hu 1.2. KOMBINATORIKA 6 féleképpen teheti meg. d) feladat: pontosan 2db levelet úgy vihet ki, hogy a maradék 3 levelet ciklikusan permutálja, tehát kiválaszt hármat majd ezeket ciklikusan permutálja: ( 5 3 ) 3! 3 = 20 e) feladat: pontosan 1db levelet úgy vihet ki, hogy kiválaszt egy pontos címet, majd a maradékot ciklikusan permutálja, vagy párokat cserél: ( ) ( ) 5 4! 1 4 + 3 = 45 f) feladat: pontosan 0db levelet úgy vihet ki, hogy az 5 levelet ciklikusan permutálja, vagy egy párt megcserél és a többi ciklikusan permutálja: ( ) 5 2 5! 5 + 3! 3 = 44 3. Egy 90 számból álló lottón 5 számot húznak ki hány szelvényt kell kitölteni a biztos nyeréshez? n = 90, k = 5, tehát az ismétlés nélküli kombináció képlete alapján: 90! 5!85! = 43.949.268 4. Tombolán 200 jegyet adtak el, ebb l el ször kihúznak 20 szelvényt, melyeknek a tulajdonosai kisebb érték nyereményt kapnak, majd a megmaradt szelvények közül még kihúznak 5-öt, melynek a tulajdonosai nagyobb jutalmat kapnak, végezetül a maradék jegyb l kihúzzák a f nyereményt kapó játékost. Hányféleképpen alakulhat a végeredmény? El ször 20 ember választunk ki, majd a maradékból 5-öt és végül 1-et: ( 200 20 ) ( 180 5 ) ( 175 1 ) = h.f. 5. Egy francia kártyából kiosztunk minden játékosnak 13 lapot, hány esetben lesz egy kézben mind a négy ász? Kiválasztjuk a 4db ászt, és még választunk hozzá 13 4 lapot, valamint bármelyik égtájon lehet a négy ász: ( 4 4 ) ( 52 4 13 4 ) 4 = 7 mrd Ismétléses kombináció 1. 7 versenyz hányféleképpen vihet el 5 díjat egy öttusabajnokságon (egy versenyz több versenyszámot is megnyerhet)? n = 7, k = 5, az ismétléses kombináció képlete alapján: ( ) 7 + 5 1 = 462 5

sinkovicz.peter@wigner.mta.hu 1.2. KOMBINATORIKA 7 2. Hányféleképpen helyezhetünk el 5 szórólapot 16 rekeszbe, ha a papírok között nem teszünk különbséget és egy rekeszbe több is tehetünk? n = 16, k = 5, az ismétléses kombináció képlete alapján: ( ) 16 + 5 1 = 15.504 5 3. Egy kertészeti újságban ötféle növényt kínálnak akciós áron, petúniát, muskátlit, rózsát, szarkalábat, levendulát. Eszter 12 növényt rendel. Hányféleképpen teheti ezt meg, ha egy növényb l többet is rendelhet? n = 12, k = 5, az ismétléses kombináció képlete alapján: ( ) 12 + 5 1 = h.f. 5 4. Hány tagból áll a (a + 3b + 7c) n kifejezés a hatványozás elvégzése után ha minden bet höz azonos mértékegységet rendelünk, akkor láthatjuk hogy a m velet elvégzése után minden tag n dimenziós lesz, ami 3 különböz bet b l tev dhet össze ( ) n + 3 1 n 5. Hányféle számkombináció jöhetne ki az ötös lottón, ha visszatevéses módszerrel sorsolnák a számokat? n = 90 k = 5, az ismétléses kombináció képlete alapján: ( ) 90 + 5 1 = h.f. 5 Ismétlés nélküli variáció 1. Egy urnában van 6 golyó az 1, 2, 3, 4, 5, 6 számokkal megjelölve. Négy golyót kihúzunk. Hányféle sorrend fordulhat el? n = 6, k = 4, az ismétlés nélküli variáció képlete alapján: 6! (6 4)! = h.f. 2. Hány négyjegy szám írható fel a 0,1,2,3,4,5,6,7 számokkal anélkül, hogy lenne két azonos számjegy? A nulla megint nem állhat legelöl, így az ismétlés nélküli permutáció 3. feladatának b) megoldásában bemutatottakat átültetve ide: 8! (8 4)! 7! (7 3)! = h.f. 3. Kilenc különböz színb l hány háromszín zászló készíthet (minden szín különböz )? n = 9, k = 3, az ismétlés nélküli variáció képlete alapján: 9! (9 3)! = h.f.

sinkovicz.peter@wigner.mta.hu 1.2. KOMBINATORIKA 8 4. Egy 200 f s matekversenyen hányféle képen alakulhat az els három helyezett? n = 6, k = 4, az ismétlés nélküli variáció képlete alapján: 200! (200 3)! = h.f. 5. Hány olyan négyjegy szám van amely különböz számjegyekb l áll? a fejezet 2. feladata alapján n = 10, k = 4 (nagyobb a számjegy paletta): 10! (10 4)! 9! (9 3)! = h.f. Ismétléses variáció 1. A totóban a biztos 13 találat eltalálásához hány szelvényt kell kitölteni? n = 3, k = 13 3 13 2. Hány négyjegy szám írható fel a 0,1,2,3,4,5,6,7 számokkal úgy, hogy lehetnek azonos számjegyek is? A 0 nem állhat el l, így az összes - kedvez tlen számolás módján meghatározhatjuk: 8 4 7 8 3 3. Hány különböz rendszám adható ki, amely három bet b l és azt követ három számból áll (az ábécé 26 bet jét használjuk)? Függetlenül választhatjuk a bet ket és a számokat, így: 26 3 10 3 4. Hány darab ötjegy öttel osztható szám képezhet az 1, 3, 5 számjegyekb l? Az utolsó helyen lév számjegy (5-ös) rögzítve van, a maradék négy helyet kell feltölteni 3 4 = 81 5. Az 1, 2, 3, 4, 5 számjegyek felhasználásával hány olyan háromjegy szám készíthet, amelyben az 5-ös el fordul? Összes (minden számjegy el fordulhat) - kedvez tlen (mely nem tartalmaz 5-öst) számolás módján meghatározhatjuk: 5 3 4 3

sinkovicz.peter@wigner.mta.hu 1.2. KOMBINATORIKA 9 1.25. Gyakorló feladatok 1. Egy ballagó osztályban mindenki megajándékozta minden osztálytársát a saját fényképével, mennyi volt az osztály létszám ha 1056 fénykép cserélt gazdát? 2. Egy csomag magyar kártyából kihúzunk 10 lapot. Hány esetben lesz a kihúzott lapok között legalább 7 zöld? 3. Hányféleképpen rakható ki a magyar kártyából 8 piros és 8 zöld lap, ha egymás után különböz szín lapoknak kell szerepelnie? 4. 500 játékkockából 40 selejt. Ha az 500 kockából kiveszünk 20-t, akkor hány esetben lesz köztük legfeljebb 2 selejt? 5. Ha adott elemek számát 2-vel csökkentjük, akkor a lehetséges permutációk száma 1/12 részére csökken. Mennyi volt az eredeti elemszám? 6. Hány szótárt kell kiadnunk, hogy közvetlenül tudjunk fordítani 10 különböz nyelv közül bármelyikr l bármelyik másikra? 7. A 0,1,2,3,4,5,6,7,8,9 számokat sorba rendezzük. Hány esetben lehet, hogy az 1,2,3 számok csökken sorrendben kerülnek egymás mellé? 8. Egy pénzérmét 10-szer feldobunk, hány olyan dobássorozat lesz, melyben 6 fej és 4 írás lesz? 9. Hány olyan hétjegy szám van, amelynek számjegyei növekv sorrendben következnek egymás után, egyenl számjegyeket nem engedve meg 10. Mennyi az 1,2 3,4 számjegyek ismétlés nélküli permutációjával képezhet négyjegy számok összege? 11. Hány olyan 3-mal osztható nyolcjegy szám van, amely csak 1-es és 2-es számjegyekb l áll? 12. Egy urnában 20 cédula van 1-20-ig megszámozva. Kihúzunk 5 cédulát úgy, hogy minden húzás után a kihúzott cédulát visszatesszük. Hány esetben lesz a kihúzott legkisebb szám nagyobb 6-nál? 13. Hány 5 jegy szám képezhet, a 1,2,3,4 számjegyek felhasználásával, úgy hogy mindegyiket legalább egyszer tartalmazza? 14. Egy részeg postás gyelmetlenül oszt szét öt levelet azok címzettjeinek. Hányféleképpen teheti ezt meg úgy, hogy senki se a sajátját kapja meg és egy ládába több levél is kerülhet? És úgy, hogy pontosan 1, 2, 3, 4 ill. 5 címzett kapja meg a saját levelét? 15. Mi lesz x 18 együtthatója az (1 + x 3 x 4 ) 12 polinomban a hatványozás elvégzése után? 16. Az iskolai büfében már csak 7 különböz fajta sütemény maradt. Alex, Bogi, Tomi, Dzsenifer és Roland egyet-egyet választ ezek közül. Hányféleképpen választhatnak? 17. Hány öttel osztható négyjegy számot lehet készíteni az 1, 2, 3, 4, 5, 6, 7, 8, 9 számjegyek felhasználásával, ha mindegyik számjegyet csak egyszer használhatjuk fel? 18. 8 lányból és 10 úból hányféleképpen lehet összeállítani a lehet legtöbb egyszerre táncoló vegyes párt? 19. Egy n elem halmaznak hány részhalmaza van? 20. n elem harmadosztályú ismétléses és ismétlés nélküli variációi számának a különbsége 65. Határozzuk meg n értékét! 21. Ötször feldobva egy érmét, hányféle fej-írás sorozat jöhet létre? 22. Egy osztályból 17 ú 2 napos túrára megy. Éjszakára a turistaházban 1 darab 8 ágyas, 1 darab 4 ágyas, 1 darab 3 ágyas és 1 darab 2 ágyas szobában kapnak szállást. Hányféleképpen helyezkedhetnek el a szobákban, ha az egy szobában lév fekv helyek között nem teszünk különbséget? 23. Hány különböz 5-tel osztható nyolcjegy számot lehet készíteni a 0,1,2,2,2,3,3,5 számjegyekb l? 24. Egy madárfaj egyedei 3-féle téli stratégia közül szoktak választani: Magyarországon

sinkovicz.peter@wigner.mta.hu 1.2. KOMBINATORIKA 10 telelnek vagy a Földközi-tenger északi partján telelnek vagy átrepülik a tengert és Afrikában telelnek. Tíz egyed esetében összesen hányféle stratégia-konguráció létezik? 25. Egy 8x8-as sakktábla bal fels mez jéb l indulva hány különböz úton juthatunk el a jobb alsó sarokba, ha minden lépésben egy mez t jobbra, vagy egy mez t lefelé lépünk? 26. Hányféleképpen szállhat le 3 rhajó 5 bolygóra? 27. Hányféleképpen oszthatunk szét egy pakli francia kártyát (52 lapos) 4 játékosnak úgy, hogy mindegyikük 13-13 lapot kapjon? 28. Béla ír 5 levelet 5 különböz barátjának. A borítékokat is megcímezi, azonban este sötétbe tölti fel a borítékokat a levelekkel véletlenszer en. Hány különböz módon tudja úgy borítékolni a leveleket, hogy egyik se menjen jó címre? 29. Négy egyforma kockát feldobunk, hányféleképpen alakulhat a végs eredmény? 30. A 2006-os németországi futball-világbajnokságon 31 csapat vett részt. Az els négy helyezést a csapatok elméletileg hányféle módon nyerhették volna el?

2. Valószín ségszámítás Valószín ségek alapvet összefüggései, valószín ségi változók, nevezetes eloszlások 2.1 Valószín ségek alapvet összefüggései A valószín ségszámításhoz, mint szinte minden matematikai tudományághoz, mindenekel tt egy matematikai struktúra szükségeltetik. A valószín ségszámítás esetében ez a struktúra egy ún. eseményalgebra. Ebben a fejezetben az eseményalgebrából következ néhány alap összefüggést nézünk meg. 2.11. Feltételes valószín ség Legyen A és B két esemény, az utóbbiról feltételezzük, hogy valószín sége nem 0 (azaz P (B) > 0). Az A esemény B feltételes valószín ségén a P (A B) = P (A B) P (B) számot értjük, ahol P (A B) annak a valószín sége hogy mindkét esemény bekövetkezik. Ez a szám azt mutatja, hogy A hányadrészben következik be a B bekövetkezéseinek esetei közül. 1. Feladat: Dobjunk fel két szabályos kockát. A B esemény legyen az, hogy két kockával 6-ot dobunk, azaz B = {(1, 5); (2, 4); (3, 3); (4, 2); (5, 1)} az A esemény pedig az legyen, hogy legalább az egyik kockával 2-est dobunk. Számítjuk ki a P (A B) feltételes valószín séget, azaz határozzuk meg annak a valószín ségét hogy a kockák összeg 6, úgy hogy legalább az egyik kockával 2-est dobtunk! megoldás: Az Ω eseménytér elemeinek a száma 6 6 = 36, az A elemeinek a száma pedig: A = {(2, 1); (2, 2); (2, 3); (2, 4); (2, 5); (2, 6);...(6, 2)} azaz 11, és A B = {(2, 4); (4, 2)} ezért P (A B) = P (A B) P (B) = 2 36 36 5 = 2 5 2. Feladat: Egy urnában van 4 fehér és 6 fekete golyó. Egymás után kett t kihúzunk. Mennyi annak a valószín sége, hogy a második golyó fehér, ha az els golyó fekete volt? megoldás: Jelöljük P (A) az els re fekete golyó húzásának a valószín ségét és P (B)-vel a másodjára fehér golyó kihúzását. Összesen 10 9 esemény van, mivel számít a sorrend. Ezek közül, azok száma melyekben az els golyó fekete és a második fehér: P (A B) = 6 4 90 = 24 90

sinkovicz.peter@wigner.mta.hu 2.1. VALÓSZÍN SÉGEK ALAPVETŽ ÖSSZEFÜGGÉSEI 12 Most határozzuk meg a B esemény valószín ségét, azaz azoknak a húzásoknak a számát, ahol az els golyó fekete a második tetsz leges. Tehát 24-hez hozzá kell adnunk azokat az eseteket mikor az els és második golyó is fekete: P (B) = 6 4 + 6 5 90 Tehát a keresett feltételes valószín ség = 54 90 P (A B) = P (A B) P (B) = 24 54 Szorzási-tétel A feltételes valószín ség fontos következménye a szorzási-tétel, mely a következ : P (B A) = P (B) P (A B) ezzel a tétellel két tetsz leges esemény együttes bekövetkezésének a valószín ségét tudjuk kiszámítani. Az el z összefüggést általánosíthatjuk több eseményre is, jelöljük A 1, A 2,..., A n -vel n darab tetsz leges eseményt, ekkor: P (A 1 A 2... A n ) = P (A 1 )P (A 2 A 1 )P (A 3 A 1 A 2 )... P (A n A 1 A 2... A n 1 ) 1. Feladat: Egy izzógyárban 1.000 izzóból 4 hibás, mennyi annak a valószín sége, hogy ha hármat találomra kiveszünk akkor mind hibátlan? megoldás:az els hibátlan izzó kivételének a valószín sége: 1.000 4 1.000 = 996 1.000 ha hibátlant vettünk ki akkor most 999-b l 995 hibátlan,... Tehát a szorzási tétel alapján: 2.12. Teljes valószín ség tétele P (A 1 A 2 A 3 ) = 996 1.000 995 999 994 = 0, 988 998 A teljes valószín ség tétele alapján ha a B 1, B 2,..., B n események teljes eseményrendszert alkotnak, továbbá egyik se lehetetlen esemény és A egy tetsz leges esemény, akkor: n P (A) = P (A B i )P (B i ) i=1 1. Feladat: Egy egyetemi évfolyam matematika szakos hallgatóinak 90%-a, zika szakos hallgatóinak 70%-a sikeresen vizsgázott valószín ségszámításból. A zika szakosok az évfolyam 18%-át teszik ki. Mennyi a valószín sége annak, hogy egy véletlenül kiválasztott hallgató a sikeres vizsgázottak között lesz? megoldás: Legyen B a kérdéses esemény. Az A 1 esemény jelentse azt hogy a kiválasztott hallgató matematikus, és A 2 pedig azt hogy zikus, ekkor a következ ket tudjuk: P (A 1 ) = 82 100 P (A 2 ) = 18 100 P (B A 1 ) = 90 100 P (B A 2 ) = 70 100

sinkovicz.peter@wigner.mta.hu 2.1. VALÓSZÍN SÉGEK ALAPVETŽ ÖSSZEFÜGGÉSEI 13 Ekkor a teljes valószín ség tétele alapján a keresett valószín ség: Bayes-tétel P (B) = P (B A 1 )P (A 1 ) + P (B A 2 )P (A 2 ) = 90 100 82 100 + 70 100 18 = 0, 86 100 A feltételes valószín ség tételét további módon is átrendezhetjük, és fordított kérdésre is kaphatunk választ. A Bayes-tétel arra ad választ, hogy ha B i esemény bekövetkezik, akkor mi annak a valószín sége, hogy ez pontosan az eseményrendszer A i eseményének bekövetkezésével együtt valósul meg: P (A i B) = P (A i B) P (B) A teljes valószín ség tétele alapján ezt tovább alakíthatjuk, ha a P (A i B) kifejezést kifejezzük a feltételes valószín ségek segítségével: P (A i B) = P (A i)p (B A i ) n P (A k )P (B A k ) k=1 1. Feladat: Egy m helyben gyártott összes alkatrész 50%-át az egyik gép 3%-os selejttel, a 30%-át a második gép 4%-os selejttel, a 20%-át pedig a harmadik gép 5%-os selejttel gyártja. a) Mi annak a valószín sége, hogy egy kiemelt alkatrész selejtes? b) Ha a véletlenül kiemelt alkatrész selejtes, akkor mi annak a valószín sége hogy azaz els gép terméke? megoldás:a selejtes alkatrész választásának eseményét jelölje P (S) és P (i) annak a valószín ségét, hogy az i. gép gyártotta a terméket, akkor a teljes valószín ség tétele alapján P (S) = n P (A B i )P (B i ) = P (1)P (S 1) + P (2)P (S 2) + P (3)P (S 3) = i=1 = 0, 50 0, 03 + 0, 30 0, 04 + 0, 20 0, 05 = 0, 037 Annak a valószín sége, hogy a selejtes alkatrészt az els gép gyártotta a Bayes-tétele alapján a következ képpen számíthatjuk ki: P (1 S) = P (1)P (S 1) n P (A B i )P (B i ) i=1 = 0, 50 0, 03 0, 037 = 0, 41 2.13. Események függetlensége Az A esemény a B eseményt l független, ha P (A B) = P (A). A feltételes valószín ség alapján P (A B) = P (A)P (B) ebb l pedig adódik a P (B A) = P (B) összefüggés is. Tehát ha A esemény független B-t l, akkor B is független A-tól, így a függetlenséget a következ képpen szokás deniálni: Az A és B esemény független, ha P (A B) = P (A)P (B) Ha több eseményre akarjuk deniálni a függetlenséget, akkor nem elég hogy páronként megköveteljük az el z kritériumot, hanem annál szorosabb megkötésre van szükségünk (lsd. gyakorlaton megbeszélt példa). n eseményt függetlennek nevezünk, ha akárhányat kiválasztva

sinkovicz.peter@wigner.mta.hu 2.1. VALÓSZÍN SÉGEK ALAPVETŽ ÖSSZEFÜGGÉSEI 14 közülük, azok együttes bekövetkezésének valószín sége egyenl a valószín ségek szorzataival. Tehát n esemény esetén 2 n n 1 feltételnek (a ( 1) az üres esemény és a ( n) az egy eseményt tartalmazó valószín ségek kizárása miatt kell) kell teljesülnie a függetlenséghez. Tehát az A 1, A 2,..., A n események függetlenek, ha bárhogyan kiválasztva közülük A i1, A i2,..., A ik eseményeket teljesül rájuk a egyenl ség. 2.14. Gyakorló feladatok P (A i1 A i2... A ik ) = P (A i1 )P (A i2 )...P (A ik ) 1. Dobjunk fel két szabályos ( független) kockát. Mi annak a valószín sége, hogy az együttes pontszám 10 vagy 10-nél nagyobb, ha a) az els kockával 5-öst dobunk b) legalább az egyik kockával 5-öst dobunk 2. Az 1, 2,..., 9 számjegyek közül véletlenül válasszunk ki két számjegyet. Ha a két számjegy összege páros, mi annak a valószín sége, hogy mindkét számjegy páratlan volt? 3. Bence a jól megkevert 52 lapos bridzs kártyacsomagból négy lapot kapott. Ha a négy lap mindegyike pikk, akkor mi a valószín sége annak, hogy a következ három lap között is lesz legalább egy pikk? 4. Egy dobozban 7 hibátlan és 3 hibás alkatrész van. Ha egymás után három alkatrészt kiveszünk a dobozból, mi a valószín sége annak, hogy az els kett hibátlan, a harmadik pedig hibás lesz? 5. Bence a jól megkevert 32 lapos magyar kártyacsomagból 5 lapot kapott. Mi annak a valószín sége, hogy mindegyik lap zöld? 6. Számítsuk ki az A eseményeknek a B-re vonatkozó, valamint a B eseménynek az A-ra vonatkozó feltételes valószín ségét, ha 7. Határozzátok meg az a) P (A B) b) P (B A) c) P (A B) d) P (A B) e) P (B A) valószín ségek, ha P (A) = 3 8, P (B) = 5 8 és P (A B) = 3 4. P (A) = 1 2, P (B) = 1 3 és P (A B) = 1 4 8. Egy évfolyam hallgatóinak a 25%-a matematikából, 15%-a zikából és 10%-a matematikából és zikából is elégtelenre vizsgázott. Válasszunk ki egy hallgatót az évfolyamból, és mi annak a valószín sége, hogy: a) matematikából elégtelen az osztályzata, ha zikából elégtelen? b) zikából elégtelen az osztályzata, ha matematikából elégtelen? c) matematikából vagy zikából elégtelen az osztályzata?

sinkovicz.peter@wigner.mta.hu 2.1. VALÓSZÍN SÉGEK ALAPVETŽ ÖSSZEFÜGGÉSEI 15 9. Egy id s házaspárnál annak a valószín sége, hogy a fér még 10 évet él 1 4, annak a valószín sége, hogy a n még 10 évet él 1 3. Mi annak a valószín sége: a) mindketten élnek még 10 évet? b) legalább az egyik él még 10 évet? c) egyikük sem él még 10 évet? d) csak a n él még 10 évet? 1 10. Alice, Bob, Chris egy céltáblára l nek. A találat valószín sége rendre: 6, 1 4, 1 3. Mindegyikük egy lövés ad le. Mi annak a valószín sége, hogy: a) közülük csak egy talál a célba? b) ha egy találat van, akkor azt a lövést Alice adta le?

sinkovicz.peter@wigner.mta.hu 2.2. VALÓSZÍN SÉGI VÁLTOZÓK 16 2.2 Valószín ségi változók Valószín ségi változónak egy, az elemi események Ω halmazán értelmezett tetsz leges függvényt nevezünk. Nyilván egy problémához több valószín ségi változó is válaszható, azonban célszer mindig a problémához legjobban illeszked t választani. Példa: Dobjunk fel két kockát, ekkor egy elemi eseménynek nevezzük az (i, k) számpárt, ahol i az els, k a második kockával dobott szám. Tehát 36db elemi eseményünk van, azonban ha a dobott számok összegét vizsgáljuk, akkor az (i, k) elemi események ξ ξ((i, k)) := i + k függvényével foglalkozunk, mely csak 11 különböz értéket vehet fel. Mivel pl. az (1, 3), (2, 2), (3, 1) elemi eseményekhez egyaránt a 4 érték tartozik. Az említett kockadobás problémájánál a η = i k és ζ = i k függvények is valószín ségi változók lennének. 2.21. Diszkrét valószín ségi változó Egy valószín ségi változót diszkrétnek nevezzük, ha csak megszámlálhatóan sok értéket vehet fel. Példa: két kocka dobásának összege esetén a valószín ségi változó a következ értékeket veheti fel: ξ = {ξ 1, ξ 2,..., ξ 11 } = {2, 3,..., 12} tehát diszkrét eloszlás követ. A ξ i (i = 1, 2,..., n) pontokhoz rendelt p i valószín ségek összességét valószín ségi mez nek hívjuk. Példa: Az el z példa valószín ségi mezeje a következ halmaz: A ξ 1 p 1 = 1 36, ξ 2 p 2 = 2 36,..., ξ 11 p 11 = 1 36 { 1 {p 1, p 2,..., p 11 } = 36, 2 36 36},..., 1 v(ξ i ) = p i (= P (ξ = ξ i )) képlettel megadott v függvényt, a ξ változó eloszlásának, vagy diszkrét eloszlásfüggvénynek nevezzük, mely a következ tulajdonságokkal rendelkezik: a) v(x i ) 0 b) n v(x i ) = 1 i=1

sinkovicz.peter@wigner.mta.hu 2.2. VALÓSZÍN SÉGI VÁLTOZÓK 17 Hisztogram A diszkrét valószín ségi eloszlásokat vonaldiagram, vagy hisztogrammal szemléltethetjük, mindkét esetben a ξ i függvényében a v(ξ i )-t ábrázoljuk. Példa: Két kocka dobásának az összegéhez tartozó hisztogram: g. 2.1. ábra: Példa hisztogramja Várható érték Egy kísérlet várható értéke az a számérték, amelyhez a kísérlet egymás utáni végrehajtása során kapott értékek számtani átlaga konvergál, ha a kísérletek száma minden határon túl növeljük. Tehát a kísérlet < ξ > várhatóértékét a n ξ = ξ i p i i=1 összefüggés alapján határozhatjuk meg. Könnyen belátható, hogy a várható érték a következ tulajdonságokkal bír: a) a ξ = a ξ b) ξ + a = ξ + a c) ξ 1 + ξ 2 + + ξ n = ξ 1 + ξ 2 +... + ξ n ahol ξ valószín ségi változó és a pedig egy tetsz leges való szám. Példa: Két kocka dobásának az összegének a várható értéke a következ : ξ = 1 2 36 + 3 2 36 + 4 3 36 + 5 4 36 + 6 5 36 + 7 6 36 + 8 5 36 + 9 4 36 + + 3 10 36 + 11 2 36 + 12 1 36 = 7 ami nem meglep, mert az egy kockával való dobás várható értéke 3, 5.

sinkovicz.peter@wigner.mta.hu 2.2. VALÓSZÍN SÉGI VÁLTOZÓK 18 Szórásnégyzet és a szórás A várható érték csak els rendben jellemzi az eloszlásunkat, mivel az csak a ξ valószín ségi változónak a bizonyos értelemben vett centrumát adja meg. Az eloszlás jellemzését következ rendben annak szórásával jellemezhetjük, mely a centrum körüli szóródást méri. Deníció szerint a szórásnégyzetet a következ képpen határozhatjuk meg: n s 2 (ξ) = (ξ i ξ i ) 2 p i i=1 ξ ξ 2 = ξ 2 2 ξ ξ + ξ 2 = ξ 2 ξ 2 melyb l ha pozitív gyököt vonunk akkor megkapjuk a valószín ségi változó szórását, más néven standard eltérést, ami: s(ξ) = s 2 (ξ) = ξ 2 ξ 2 = n ( ξi 2p n i i=1 ) 2 ξ i p i i=1 Könnyen belátható, hogy a szórás és a szórásnégyzet a következ tulajdonságokkal bír: a) s 2 (ξ + a) = s 2 (ξ) b) s 2 (a ξ + b) = a 2 s 2 (ξ) c) s(ξ + a) = s(ξ) c) s(a ξ + b) = a s(ξ) ahol ξ valószín ségi változó és a, b pedig egy tetsz leges való szám. Gyakran a számítások egyszer bbek, ha a ξ valószín ségi változó helyett a ξ = ξ ξ s(ξ) normált valószín ségi változóra térünk át, mert ennek a várható értéke ξ = 0 és szórásnégyzete s 2 (ξ ) = 1. Példa: Két kockával való dobás szórásnégyzete és szórása: s 2 (ξ) = s(ξ) = ( n n ) ξi 2 2 p i ξ i p i = 65, 9 49 = 16, 9 i=1 i=1 n ( n ) ξi 2p 2 i ξ i p i = 4, 1 i=1 i=1 Kvantilisek, medián, módusz Az adathalmazok jellemzésére a következ mennyiségeket használhatjuk: kvantilisek: A p-ed rend kvantilis az eloszlást p,(1-p) arányba osztja ketté, speciális kvantilis a medián. jele Q p medián: a medián a középs érték, ha az adatokat növekv vagy csökken sorrendbe rendezzük. Páratlan számú adatok esetén a középs adat, páros számú adat esetén a középs kett adat számtani közepe. jele: ξ Q 1 2 módusz: a módusz a leggyakrabban el kerül adat(ok). jele: M Ezeknek a meghatározásával megállapíthatjuk, hogy az eloszlásunk milyen irányba ferdül, illetve szimmetrikus-e. A 2.2. ábra ábrán látható, hogy szimmetrikus eloszlás esetén a három mennyiség egybe esik, balra ferdült eloszlás esetén várhatóérték, medián, módusz, míg jobbra ferdült eloszlás esetén módusz, medián, várhatóérték sorrendbe követik egymást.

sinkovicz.peter@wigner.mta.hu 2.2. VALÓSZÍN SÉGI VÁLTOZÓK 19 g. 2.2. ábra: mode = módusz, mean = várhatóérték, median = medián (en.wikipedia.org) Momentumok Az eloszlás pontosabb leírását a magasabb momentumok megadásával tehetjük meg. Egy ξ valószín ségi változó különféle momentumait az alábbi egyenl ségekkel deniáljuk: k-adik momentum α k := ξ k k-adik centrális momentum αk c := (ξ ξ ) k k-adik abszolút momentum β k := ξ k k-adik centrális abszolút momentum βk c := ξ ξ k 2.22. Folytonos valószín ségi változó Egy valószín ségi változót diszkrétnek nevezzük, ha kontinuum sok értéket vehet fel. Példa: Tekintsünk egy egységnyi sugarú kör alakú céltáblát, melyre a lövést a lövész leadja, és feltesszük, hogy a céltáblát biztosan eltalálja. Az elemi események a céltábla összes pontjai, tehát mindazok az (x, y) párok, amelyekre teljesül, hogy x 2 + y 2 1 Egy valószín ségi változó lehet pl. az a függvény, mely a céltábla minden (x, y) pontjához a céltábla középpontjától vett távolságot rendeli hozzá. Tehát ha a céltábla közepe az origóban van, akkor az így megadott valószín ségi változó a következ : r := x 2 + y 2 Ekkor a valószín ségi változó a ξ [0, 1] értékeket veheti fel, tehát folytonos eloszlás követ. Valószín ségi változó eloszlása Folytonos eloszlás esetében a diszkrét eloszláshoz hasonlóan deniálhatjuk a ξ valószín ségi változó eloszlását: v(ξ) = P (ξ)

sinkovicz.peter@wigner.mta.hu 2.2. VALÓSZÍN SÉGI VÁLTOZÓK 20 Valószín ségi változó eloszlásfüggvénye Azonban célszer bb a ξ valószín ségi változó eloszlásfüggvényét használni, melyet a következ képpen deniálunk 3 : F (x) := P (ξ < x) Az eloszlás függvény a következ tulajdonságokkal rendelkezik: a) Mivel a ξ < x 1 esemény maga után vonja a ξ < x 2 eseményt, ha x 1 < x 2, így F (x 1 ) F (x 2 ) ha x 1 < x 2 b) az eloszlásfüggvény két határértéke minden eloszlás esetén: c) Továbbá: lim x = 0 lim x = 1 P (x 1 ξ x 2 ) = F (x 2 ) F (x 1 ) Példa: A céltáblás példa esetén a v(ξ) = 0 ξ [0, 1], azonban az eloszlásfüggvény: S r ségfüggvény F (r) := P (ξ < r) = 0, ha r < 0 r 2 π 1 2 π = r2, ha r [0, 1] 1, ha r > 1 Ha a ξ valószín ségi változó F (x) eloszlásfüggvénye folytonos, és véges számú pont kivételével létezik az F (x), akkor a deriváltfüggvényt a ξ s r ségfüggvényének nevezzük és f(x)-szel jelöljük, azaz: x F (x) = f(x) és F (x) = f(x )dx A s r ségfüggvény a következ tulajdonságokkal rendelkezik: a) f(x) 0 b) f(x)dx = 1 c) x 2 x 1 f(x)dx = P (x 1 x < x 2 ) Példa: A céltáblás példa esetén a s r ségfüggvény: Várható érték f(r) := F (r) = 0, ha r < 0 2r, ha r [0, 1] 0, ha r > 1 A kísérlet < ξ > várhatóértékét folytonos eloszlás esetén a ξ = 3 az eloszlásfüggvény diszkrét esetre is értelmezhet xf(x)dx

sinkovicz.peter@wigner.mta.hu 2.2. VALÓSZÍN SÉGI VÁLTOZÓK 21 összefüggés alapján határozhatjuk meg. Könnyen belátható, hogy a várható érték a diszkrét esettel megegyez tulajdonságokkal rendelkezik: a) a ξ = a ξ b) ξ + a = ξ + a c) ξ 1 + ξ 2 + + ξ n = ξ 1 + ξ 2 +... + ξ n ahol ξ valószín ségi változó és a pedig egy tetsz leges való szám. Példa: A céltáblás példa esetén a nyílvessz nek a középpontól vett távolságának a várható érték: 0 r = r f(r ) dr = 1 r 0 dr + 0 r 2r dr + 1 r 0 dr = 2 3 Szórásnégyzet és a szórás Deníció szerint a szórásnégyzetet a következ képpen határozhatjuk meg: s 2 (ξ) := (ξ ξ ) 2 ξ 2 ξ 2 melyb l ha pozitív gyököt vonunk akkor megkapjuk a valószín ségi változó szórását, más néven standard eltérést, ami: s(ξ) := s 2 (ξ) ξ 2 ξ 2 Könnyen belátható, hogy a szórás és a szórásnégyzet a diszkrét eloszlással analóg módon a következ tulajdonságokkal bír: a) s 2 (ξ + a) = s 2 (ξ) b) s 2 (a ξ + b) = a 2 s 2 (ξ) c) s(ξ + a) = s(ξ) c) s(a ξ + b) = a s(ξ) ahol ξ a valószín ségi változó és a, b pedig egy tetsz leges való szám. Példa: A céltáblás példa esetén a nyílvessz nek a középpontól vett távolságának a szórása: s 2 (r) = s(r) = r 2 r 2 = s 2 (r) 0, 2357 2.23. Markov- és Csebisev-egyenl tlenség ( ) 2 2 r 2 f(r ) dr = 2 1 3 4 4 9 = 1 18 A Markov-féle egyenl tlenség az mondja, ha ξ nem negatív, véges várható érték valószín ségi változó, akkor tetsz leges ε > 0 esetén igaz a következ egyenl tlenség: Példa: A céltáblás feladatnál ε = 0.2 mellett: P (ξ ε) ξ ε P (r ε) = 1 F (ε) = 1 ε 2 = 1 0, 04 = 0, 96 r ε Tehát teljesül az egyenl tlenség (0, 96 3, 33): = 2 3 = 3, 3 (2.1.) 0, 2

sinkovicz.peter@wigner.mta.hu 2.2. VALÓSZÍN SÉGI VÁLTOZÓK 22 A Csebisev-féle egyenl tlenség az mondja, ha ξ szórása létezik, és ξ tetsz leges pozitív szám, akkor a következ egyenl tlenség áll fent: Példa: A céltáblás feladatnál ε = 0.2 mellett: P ( ξ ξ ε) s2 (ξ) ε 2 P ( r r ) = P (r r ε) + P ( r r ε) = P (r ε + r ) + P (r r ε) = s 2 (r) ε 2 = = 1 2ε = 0, 6 1 18 = 1, 39 0, 22 Tehát ebben az esetben igaz az egyenl tlenség. 2.24. Gyakorló feladatok 1. Egy szabályos pénzérmét 4-szer feldobunk, határozzuk meg ξ valószín ségi változó eloszlását, várható értékét szórását, ha a) ξ = a 4 dobásban lév fejek száma; b) ξ = a 4 dobásban lév fejek sorozatának maximális hossza (pl.: F IF F ξ = 2)! 2. Egy szerencsejáték 3 szabályos pénzérme feldobásából áll. A játékos 3 fej dobásakor 5 forintot, 2 fej dobásakor 3 forintot, 1 fej dobásakor 1 forintot kap, egyébként pedig 15 forintot zet a banknak. Állapítsuk meg, hogy a játékos számára kedvez, vagy kedvez tlen a játék! 3. Legyen a ξ folytonos valószín ségi változó eloszlásfüggvénye: { f(x) = 1 6x + b, ha 0 x 3 a) számítsuk ki a b értékét; b) számítsuk ki a P (1 x 2) értékét! 4. Tegyük fel, hogy egy villanyég meghibásodásának id pontja 0 és 1000 óra között van, de ezen intervallumon minden id pillanatban azonos valószín séggel ég ki. a) Határozzuk meg a jelenség eloszlásfüggvényét! b) Határozzuk meg a P (30óra x < 100óra) értékét! c) Határozzuk meg az ég m ködésének várhatóértékét! d) Határozzuk meg a (c) pontban kapott várhatóérték körüli szórást!

sinkovicz.peter@wigner.mta.hu 2.3. NEVEZETES ELOSZLÁSOK 23 2.3 Nevezetes eloszlások Különböz jelenségeket csoportosíthatunk az eloszlásaik alapján, így lehet ségünk nyílik arra, hogy azonos módszerrel tárgyaljuk ket. Néhány eloszlásra szorítkozva a következ fejezetekben megvizsgáljuk, hogy két probléma milyen tulajdonságok esetén sorolhatóak azonos eloszlási csoportba. A matematikusok számára egy valószín ségieloszlás akkor is létezik, ha azt csak gondolatban alkották meg, és nem gyakorlati problémával került el. Ilyen értelemben tehát annyi folytonos eloszlás létezik, mint ahány f(x) 0 van, melynek az egész számegyenesen vett integrálja 1. Ugyanígy, annyi diszkrételoszlás van, mint ahány különböz {x i } sorozatot és hozzájuk tartozó 1 összeget adó {p i } nem negatív számokat konstruálhatunk. 2.31. Diszkrét-eloszlások Gyakorlati alkalmazásaik szerint kit ntetett szerepet játszanak az olyan folyamatok, ahol valamilyen értelemben egy A esemény bekövetkezését vizsgáljuk, ezekre fogunk most példákat nézni. Geometriai-eloszlás Adott valószín ségi kísérlet A eseményének valószínûsége legyen p, komplementerének valószínûsége (annak a valószín sége, hogy A nem következik be) így q = 1 p. A kísérleteket addig végezzük, amíg A esemény be nem következik. A valószín ségi változó legyen az, hogy az A esemény hányadikra következett be. Tehát a valószín ségi változó lehetséges értéke: ξ i = {1, 2, 3,...}. Ekkor az eloszlás p paraméterrel jellemezhet és a következ : G(p) : P (ξ i = k) = p k = q k 1 p az eloszlás várhatóértéke ξ = 1/p és szórásnégyzete s 2 (ξ) = q/p 2. 1. Feladat: p = 0, 2 valószín séggel tönkremegy az izzólámpa, minden egyes bekapcsolásánál. Várhatóan hanyadik bekapcsolásnál fog elpattanni az izzószál? megoldás: A valószín ségi kísérlet a lámpa felkapcsolása, az A esemény: "kiég". Valószín sége p = 0, 02, a komplementer eseményé 1 p = 0, 98. A ξ valószín ségi változó azt jelöli, hogy hanyadikra felkapcsolásra ég ki a lámpa. Felhasználva a geometriai eloszlást a kísérlet várhatóértéke és szórásnégyzete: Binomiális-eloszlás ξ = 1 0, 02 = 50 1 0, 02 s2 (ξ) = 0, 02 2 = 2450 Adott valószín ségi kísérlet egy eseménye A, aminek valószín sége legyen p. Ekkor A komplementerének valószín sége q = 1 p. A kísérletet végezzük el n-szer és számoljuk meg, hány esetben következett be A. Az ezt mutató ξ valószínûségi változó lehetséges értékei ξ = {0, 1, 2,..., n}. Ekkor az eloszlás p, n paraméterrel jellemezhet és a következ : ( ) n B(p, n) : = P (ξ = k) = p k = p k q n k k az eloszlás várhatóértéke ξ = np és szórásnégyzete s 2 (ξ) = npq.

sinkovicz.peter@wigner.mta.hu 2.3. NEVEZETES ELOSZLÁSOK 24 1. Feladat: Mennyi annak a valószín sége, hogy egy házaspár 6 születend gyermeke közül a úk száma kevesebb lesz, mint a lányok száma, ha a úk születésének valószín sége 0,5. megoldás: Jelen esetben n = 6 és p = q = 0, 5, ha a úk száma: 0,1,2, akkor kevesebb mint a lányoké, 3x alkalmazva a binomiális-eloszlás képletét, a következ t kapjuk: ( ) ( ) 1 6 (1 6 1 ( ) ( ) 1 5 (1 6 2 ( ) 1 4 P (0) + P (1) + P (2) = + + = 0, 34 2 1 2) 2 2 2) 2 2. Feladat: Egy 32 f s osztályról tudjuk, hogy 24-en folyamatosan készülnek történelembõl. Ha a történelemtanár egy hónap alatt 10 f t feleltet, várhatóan hány szép feleletet fog hallani ebben a hónapban? (Természetesen egy tanuló többször is felelhet a hónap során.) megoldás: A valószín ségi kísérlet a feleltetés. Az A esemény: "a felelõ tudja a történelmet". Az A valószínûsége p = 24/32 = 0, 75. A komplementer esemény valószínûsége 1 p = 0, 25. A valószínûségi változó lehetséges értékei azt mutatják, hogy a 10 feleletbõl mennyi volt jó: ξ = {0, 1, 2,..., 10}. Felhasználva a binomiális eloszlást a kísérlet várhatóértéke és szórásnégyzete: ξ = 10 0, 75 = 7, 5 s 2 (ξ) = 10 0, 75 0, 25 = 1, 875 Poisson-eloszlás Véletlen pontelhelyezkedések leírására használhatjuk a Poisson-eloszlást 4. Típus példája: Mi a valószín sége annak, hogy egy sajtóhibákat tartalmazó könyv véletlenül kinyitott oldalán van sajtóhiba? A valószínûségi változó lehetséges értékei ξ = 0, 1, 2, 3,.... Poisson-eloszlásról beszélhetünk, ha a valószínûségi változó k értéket a következõ valószín séggel veszi fel: P (λ = np) : P (ξ = k) = p k (λ) = λk k! e k az eloszlás várhatóértéke ξ = λ és szórásnégyzete s 2 (ξ) = λ. A Poisson-eloszlás a binominális eloszlásból is származtatható, annak n szerinti határértéke ként, úgy hogy közben λ = np-t állandónak tartjuk. 1. Feladat: Tegyük fel, hogy egy 500 oldalas könyvben véletlen eloszlásban 300 sajtóhiba van. Számítsuk ki annak a valószín ségét, hogy egy adott oldalon pontosan 2 sajtóhiba van. megoldás: Ha azt vizsgáljuk, hogy oldalanként hány sajtóhiba van, akkor az egy n = 300 és p = 1/500 paraméter binomiális eloszlás. Mivel p elég kicsi és n elég nagy, a binomiáliseloszlást poisson-eloszlással közelíthetjük λ = np = 0, 6 paraméter mellett, ekkor: p 2 (0, 6) = 0, 62 e 0,6 = 0, 0988 2! 1. Feladat:Egy városban egy mobilszolgáltatónak 800 elõzet je van, akik Internet-elérésre is használják a telefonjukat GPRS-n keresztül. A tapasztalatok szerint az ügyfelek 9 és 11 óra között 0,01 valószín séggel akarnak csatlakozni a hálózatra. A rendszer azonban csak 5 ügyfelet tud egyszerre a körzetben kiszolgálni úgy, hogy ne romoljon az átvitel min sége. Mekkora valószínûséggel lesznek elégedettek az ügyfelek a szolgáltatóval? 4 Poisson-eloszlás fontos a diszkrét véletlen folyamatoknál lsd.: Prékopa András Valószín ség elmélet

sinkovicz.peter@wigner.mta.hu 2.3. NEVEZETES ELOSZLÁSOK 25 megoldás: Az adatok lehetõvé teszik a Poisson-eloszlás alkalmazását n=800, p=0,01 értékekkel, np = 8. Az ügyfelek akkor elégedettek, ha 0, 1, 2, 3, 4 vagy 5 ügyfél internetezik a megadott id ben. Azaz: 2.32. Folytonos-eloszlások Egyenletes-eloszlás 5 p k (8) = 0, 2 k=0 A ξ valószín ségi változót egyenletes eloszlásúnak nevezünk, az (a, b] (balról nyílt, jobbról zárt) intervallumon, ha a sz r ségfüggvény: f(x) = { 1 b a, ha a < x b 0 egyébként A s r ség függvény deníciójából következik, hogy az egyenletes eloszlású ξ változó eloszlásfüggvénye: x a x b a, ha a < x b F (x) = P (ξ < x) = f(x)dx = 0, ha x a 1, ha x > b várhatóértéke ξ = a+b 2 és szórásnégyzete s 2 (ξ) = (b a)2 12. 1. Feladat: Egy üzemi telefonközpont telefonhívásainál azt tapasztaljuk, hogy a tárcsázást követ kapcsolásig terjed id tartam 10mp-t l 100mp-ig terjedhet. Az eltelt id legyen a ξ egyenletes eloszlású valószín ségi változó. Határozzuk meg a ξ várható értékét, szórásnégyzetét, valamint annak a valószín ségét, hogy legalább 50mp-ig kell várni. megoldás: A ξ egyenletes eloszlású valószín ségi változó várható értéke ξ = a + b = 55mp 2 és szórása s 2 (b a)2 (ξ) = = 675mp 2 12 Annak a valószín sége, hogy legalább 50mp-et kell várnunk a kapcsolásra: Exponenciális-eloszlás P (x < 50) = 1 F (x = 50) = 100 50 = 0, 56 100 10 Típus példája: Mi annak a valószín sége, hogy egy alkatrész pl.: 2000 órán belül nem hibásodik meg? A ξ folytonos valószín ségi változót λ paraméter exponenciális eloszlásnak nevezzük, ha a sz r ségfüggvénye: { 0, ha x 0 f(x) = λe λx, ha x > 0 ahol λ tetsz leges pozitív szám. A s r ség függvény deníciójából következik, hogy az exponenciális-eloszlású ξ változó eloszlásfüggvénye: F (x) = P (ξ < x) = { 0, ha x 0 1 e λx, ha x > 0

sinkovicz.peter@wigner.mta.hu 2.3. NEVEZETES ELOSZLÁSOK 26 várhatóértéke ξ = 1/λ és szórásnégyzete s 2 (ξ) = 1/λ 2. 1. Feladat: Legyen a ξ valószín ségi változó bizonyos típusú rádióaktív részecske élettartama, melynek várható értéke 500 óra. Tudjuk, hogy ξ exponenciális eloszlású (exponenciális bomlástörvény), határozzuk meg annak a valószín ségét, hogy a kiszemelt részecske 2.000 óra múlva még életben lesz. megoldás: Annak a valószín sége, hogy 2000 óráig nem bomlik el: ) P (ξ 2.000) = 1 F (2.000) = 1 (1 e 2.000 500 = 0, 02 2. Feladat: Határozzuk meg az el z feladatban szerepl részecske felezési idejét. megoldás: Az exponenciális bomlástörvény alapján a még nem elbomlott részecskék száma: N(t) = N 0 e λt Ahol λ a részecskék várható élettartama. A felezési id deníciójából következ leg a felezési id : N N 0 = e λt 1/2 = 1 2 t 1/2 = ln 2 λ = ln 2 = 0.0006óra = 2mp 500 Tehát a kiszemelt részecske lehet radon. Normális-eloszlás A valószín ségelméletben és a matematikai statisztikában egyik leggyakoribb és legnagyobb jelent ség eloszlás normális-eloszlás (vagy Gauss-eloszlás). Gyakori el fordulását a centrális határeloszlás tétele tétele indokolja. Egy valószín ségi változót normálisnak nevezzük, ha a s r ségfüggvénye a következ alakú: f(x) = 1 s (x m) 2 2π e 2s 2 ha ( < x < ) Ehhez a s r ségfüggvényhez tartozó eloszlás függvény: F (x) = P (ξ < x) = 1 x s 2π e (t m)2 2s 2 dt Várható értéke ξ = m és szórásnégyzete s 2 (ξ) = s 2. A normális eloszlást követ valószín ségi változók az m és s paraméterekben térnek el egymástól, így az m várható értékkel és s szórású normális eloszlás szokásos jele: N(m, s). Standard normális eloszlásnak nevezzük a N(0, 1) eloszlást. A normális-eloszlás s r ségfüggvénye szimmetrikus a várható értéke körül.

sinkovicz.peter@wigner.mta.hu 2.3. NEVEZETES ELOSZLÁSOK 27 2.33. Gyakorló feladatok 1. Bizonyítsuk be, hogy a f(x) = 1 s (x m) 2 2π e 2s 2 ha ( < x < ) s r ségfüggvény valóban statisztikai értelemben vett s r ségfüggvény. 2. Nummerikus számolás segítségével határozzuk meg a normális eloszlást leíró: F (x) = 1 2π x e t2 2 dt függvény értékeit 5 x = [0 : 4] intervallumon, majd ábrázoljuk. 3. Határozzuk meg a f(x) = 1 s (ln x m) 2 2π e 2s 2 ha ( < ln x < ) s r ségfüggvénnyel jellemzet folyamatok: a)* várhatóértékét; b) móduszát; 5 Numerikus integrálok meghatározásához legcélszer bb a Romberg módszert használni

3. Statisztikai becslések, hipotézis vizsgálat 3.1 Bevezet A statisztikának 3 f feladata lehet: 1) leírás: minta rendezése, áttekintése (ezzel ismerkedtünk meg a múlt gyakorlaton) 2) analízis: sokaság eloszlását szeretné meghatározni 3) jóslat: valamilyen valószín ségi változó egyenl re ismeretlen tulajdonságára hajt Statisztikai analízis, jóslatok során azt t zzük ki célul, hogy a teljes statisztikai populáció egyes tulajdonságaira próbálunk meg becsülni egy véges elemszámú minta alapján. Tehát az eddigiek megfordítottja a feladatunk, azaz az adatokból a valószín ségekre és az eloszlás tulajdonágaira vissza következtetni. Mégpedig úgy, hogy egy N elem populáció egy egyedének a kiválasztásához az 1/N valószín séget rendeljük és az egyedet jellemz szám lesz a ξ valószín ségi változónk. Ami ekvivalens azzal, hogy ha a sokaság egyedeinek a száma N és a sokaság A részhalmaza k számú egyedet tartalmaz, akkor k/n annak a valószín sége, hogy az A részhalmazából választottunk. Tehát valószín ségi mez vé alakítottuk a sokaságunk. A minta nem más mint a populáció n elemének véletlenszer véges kiválasztottja, melyet a következ képpen jelölhetünk: x 1, x 2,..., x n x i X, ahol X a teljes populáció. A kiválasztás lehet visszatevéssel, vagy visszatevés nélkül, függetleneknek tekintjük a választásokat, ha - ha az visszatevéssel történt (hiszen ekkor minden "húzás" független az el z t l) - visszatevés nélkül "húztunk", azonban a populáció gyakorlatilag végtelennek tekinthet 6 Belátható, hogy ha minden mintavétel azonos elven történik, akkor a kiválasztott elemekb l képzett statisztikai változók azonos eloszlást követnek, mint a teljes populáció valószín ségi változója. Ezentúl N elem mintának tekintem azt a {x 1, x 2,..., x n } halmazt melyeket egymástól függetlenül választottuk ki és a bel lük számolt statisztikai változók a populációval megegyez eloszlást követnek. Mint már említettem; a feladatunk az, hogy véges számú mintából a populációra tegyünk állításokat, azonban ezek az állítások csak bizonyos valószín ségekkel igazak. 3 dolognak kell egyensúlyt tartania: minta elemszáma, becslés igazságának esélye, állítás értékessége. 3.11. Empirikus adatok Ebben a fejezetben összegzem, hogy jelent tudásunk szerint mi t nik kézenfekv választásnak a paraméterek becslésére, majd a kés bbi fejezetben látjuk, hogy ezek nem is lesznek olyan rossz becsl függvények. 6 Ezt kés bb pontosítom

sinkovicz.peter@wigner.mta.hu 3.1. BEVEZETŽ 29 Empirikus várhatóérték: Empirikus szórásnégyzet: Empirikus k-ik momentum: x := 1 n (x 1 + x 2 +... + x n ) = 1 n n x i i=1 s 2 := 1 [ n (x1 x) 2 + (x 2 x) 2 +... + (x n x) 2] = 1 n n (x i x) 2 i=1 x k := 1 n n x k i=1 A torzítatlan becsléseknél látni fogjuk, hogy az empirikus szórásnégyzet helyett érdemes bevezetni a korrigált szórásnégyzetet: korrigált szórásnégyzet: s 2 := n n 1 s2 3.12. Becslések tulajdonságai Tegyük fel, hogy ismerjük a statisztikai sokaság eloszlásának a típusát, de nem ismerjük az eloszlás analitikus kifejezésében szerepl paraméterek konkrét értékeit. Ezeket a paramétereket egy n elem minta alapján közelíthetjük, becsülhetjük. Tehát F (x, a) ismert, ahol az a paraméter valódi értékének becslésére az â = â(x 1, x 2,..., x n ) függvényt használjuk. Ez a függvény nem lehet tetsz leges ahhoz, hogy jól becsülhessünk vele. Ezeket a tulajdonságokat fogjuk most végig járni. 3.13. Kismintás becslések kritériumai Torzítatlan becslés Az a paraméter â becslést torzítatlanak nevezzük, ha â várható értéke a-val egyenl : â = a Két becsl függvény közül (ha más kritériumot nem veszünk gyelembe) a torzítatlant részesítjük el nybe, vagy azt amelyiknek kisebb a Bs(â) := a â torzítása, tehát két torzított becsl függvény közül jobbnak tekintjük azt, melyiknél a torzítás abszolút értéke kisebb, azaz Bs(â 1 ) < Bs(â 2 ) Példa: Egy kisvállalkozásnak négy tagja van, ezek bevallott havi nettó átlagjövedelme 60,30,12 és 10 eft (tehát a populáció keresetének várható értéke a = 28eFt). Becsüljük meg a vállalkozások átlagjövedelmét véletlen minta alapján, mégpedig több különféle becsl függvény segítségével! Megoldás: Használjunk négy becsl függvényt, ezek rendre a mintaátlaga, a minta mediánja, a minimális és maximális mintaelem átlaga azaz a terjedelem közép, valamint egy küls szakért i becslés, amely szerint a tagok havi átlagjövedelme 40eFt. Vegyünk egy 3 elem mintát (n=3), ekkor a lehetséges kiválasztások és az így kapott becslések Sorszám Elemek Átlag Medián Terjedelem c = 40 1. 10,12,30 17,33 12 20 40 2. 10,12,60 27,33 12 35 40 3. 10,30,60 33,33 30 35 40 4. 12,30,60 34,00 30 36 40

sinkovicz.peter@wigner.mta.hu 3.1. BEVEZETŽ 30 Az egyes becslések várható értéke most úgy kapható meg, hogy az összes lehetséges mintán (4db) felvett értéket átlagoljuk: 17, 33 + 27, 33 + 33, 33 + 34, 00 Pl.: â 1 = = 28 Ft 4 a többi becsléseknél rendre: 21eFt,31, 5eFt és 40eFt. Tehát látható, hogy a legkisebb torzítás az empirikus várhatóérték esetén van, a legnagyobb pedig a szakért iben: Bs(â 4 ) = a â 1 = 28 40 = 12eFt Hasonlóképpen belátható, hogy a korrigált empirikus szórásnégyzettel becsülhetjük torzítatlanul a minta szórásnégyzetét. Hatásfok, hatásosság Tegyük fel, hogy a becslésünk torzítatlan, további elvárás a becslésekre, hogy az a kedvez bb amelyiknek a szórásnégyzete kisebb. Tehát deniáljuk az â 2 becslés â 1 becsléshez viszonyított relatív hatásfokát a következ képpen: η 1,2 = s2 (â 1 ) s 2 (â 2 ) és hatásosabbnak nevezzük az â 1 becslést, mint az â 2 -t ha a következ teljesül: s 2 (â 1 ) < s 2 (â 2 ) Mse kritérium Az el z két szempontot kell megfelel súllyal venni, hogy eldönthessük, hogy melyik becslés a jobb, ehhez vezessük be az átlagos négyzetes hiba (Mse) fogalmát: Mse(â) = s 2 (â) + Bs 2 (â) ezzel a denícióval azt a becslést fogadjuk el, amelynek az MSe-e kisebb. Példa: Nézzük meg, az el z példában, hogy melyik becslést fogadhatjuk el a legjobbnak. Ehhez határozzuk meg a becslések Mse-t: Mse(â 1 ) = 44, 67 + 0 2 = 44, 67eFt Mse(â 2 ) = 81, 0 + 7 2 = 130, 00eFt Mse(â 3 ) = 44, 25 + ( 3, 5) 2 = 56, 50eFt Mse(â 4 ) = 0 + 12 2 = 144eFt Az így számított Mse mutatók már összevethet ek egymással: és az els becsl függvény ( â 1 = x = a) Mse a legkisebb, így a négy közül t válasszuk. 3.14. Nagymintás becslési kritériumok Ebben a fejezetben felteszem, hogy a megállapítások csak az n határesetben igazak és valójában pedig elegend en nagy minta esetén közelít leg érvényesek. Aszimptotikus torzítatlanság Egy â becsl függvényt aszimptotikusan torzítatlannak nevezünk, ha lim Bs(â(n)) = 0 n

sinkovicz.peter@wigner.mta.hu 3.1. BEVEZETŽ 31 Aszimptotikus hatásosság és konzisztencia Az aszimptotikus torzítatlansághoz hasonlóan értelmezhetjük az aszimptotikus hatásosságot, ami a két becsl függvény nagymintás varianciáinak viszonyát jelenti. Amelyik becsl függvények kisebb ez a varianciája, az aszimptotikusan hatásosabb. A konzisztencia a torzítatlanság mellett megköveteli azt is, hogy a variancia a mintanagyság növelésével tetszés szerint kicsivé váljék. Tehát konzisztens becsl függvénynek nevezzük azt ami a következ tulajdonságokkal bír: 3.15. Gyakorló feladatok lim â(n) = a és lim n n s2 (â(n)) = s 2 (a) 1. Mutassuk meg, hogy a gyakorlaton bemutatott példa esetén a korrigált szórásnégyzet valóban torzítatlan becslést ad. 2. Egy x várhatóérték és s 2 szórásnégyzet sokaságból 4 elem mintát véve becsüljük a várhatóértéket a következ képpen: â 1 = x 1 + x 2 + x 3 + x 4 4 hasonlítsuk össze a két becsl függvény hatásosságát. = x s â 2 = x 1 + 2x 2 + 2x 3 + x 4 6

sinkovicz.peter@wigner.mta.hu 3.2. STATISZTIKAI BECSLÉSEK 32 3.2 Statisztikai becslések Ha valamelyik ismeretlen paramétert egyetlen számértékkel becsüljük, akkor pontbecslésr l beszélünk, ha pedig egy olyan intervallumot, amely el re megadott valószín séggel tartalmazza az ismeretlen paramétert, akkor intervallumbecslésr l beszélünk. 3.21. Pontbecslés módszerei Eddig a becsl függvényeket csak ösztönösen használtuk (lsd. empirikus becsl függvények) pontbecslések céljára, azonban léteznek olyan általános elvek, módszerek, amelyek segítségével olyan esetekben is tudunk becsl függvényeket készíteni, amikor a megérzés vagy az analógia már nem segít. Most nézzünk olyan elveket, megfontolásokat, melyek segítségével becsl függvényeket készíthetünk (persze ezeket az el z kritériumok alapján le kell vizsgáztatnunk). Legkisebb négyzetek módszere Az alapgondolat az, hogy létezik valamilyen összefüggés, törvényszer ség, amely feltételezésünk szerint a meggyelési adatokat el állította. Tehát van egy modellünk a folyamatról. Ekkor a legkisebb négyzetek módszerével ennek a modellnek a paramétereit határozhatjuk meg úgy, hogy a ténylege és a becsült paraméterrel illesztett modellek négyzetes eltérése minimális legyen. Példa: Legyen x 1, x 2,..., x n mintánk és keressük azt µ középértéket amelyt l a mintaelemek átlagosan a legkisebb távolságra vannak, azaz keressük a középérték legkisebb négyzetekkel történ becslését. Ekkor a hiba függvény amit minimalizálni szeretnénk melynek széls értéke van, a kívánt pontban: 0 = g(x, ˆµ) ˆµ n g(x, ˆµ) = (x i ˆµ) 2 i=1 [ n n = 2 (x i µ) = 2 ˆµ=µ i=1 nµ i=1 átrendezés után n x i i=1 µ = = x n látható, hogy az ismeretlen eloszlású minta várható értéke legkisebb négyzetekkel történ becsl függvénye a minta átlaga. Ha konkrét feltevésünk van arra, hogy milyen eloszlásból számoljuk a várható értéket akkor a minimalizálni kívánt függvénybe az eloszlásból számolt várható értéket kell beírnunk (annak paramétereinek függvényében) majd minden paraméter szerint minimalizálunk (nem nehéz tehát folytonos eloszlásra is értelmezni a legkisebb négyzetek módszerét). A maximum likelihood módszere Ez a módszer azon alapszik, hogy felírja annak a valószín ségét, hogy a mintából való becslés eredményeképpen éppen a szóban forgó populáció valódi értékét kaptuk meg, ismert sokasági eloszlástípus feltételezése mellet. ]

sinkovicz.peter@wigner.mta.hu 3.2. STATISZTIKAI BECSLÉSEK 33 Tehát tegyük fel, hogy a diszkrét sokaságunk egy ismert p(x i, a) eloszlásból következik, mely tartalmaz egy â paramétert. Deniáljuk egy n-elem minta esetén a Likelihood-függvényt L n (â) := p(x 1, â)p(x 2, â) p(x n, â) mely az a = â(x 1, x 2,..., x n ) helyen felveszi a maximumát (általában az egyenl ség nem áll fent, csak tökéletes becsl függvény esetén). Folytonos eloszlásra is értelmezhetjük, ha p f helyettesítést elvégezzük. A paraméter beállításához, tehát a következ egyenleteknek kell teljesülniük: L â=a = 0 â 2 L 2 < 0 â â=a Belátható, hogy ha létezik az a paraméternek egy â minimális szórású (hatásos) becslése, akkor a likelihood egyenletnek egy megoldása van. Példa: Határozzuk meg a p(x, â) = ( N x ) â x (1 â) N x ahol x = 0, 1,..., N binomiális eloszlás â (0 < â < 1) paraméterének maximum likelihood becslését. A likelihoodfüggvény jelen esetben: â=a = [ n ln a i=1 n = i=1 ( ) N N L = â x i (1 â) N x i x i=1 i melynek az els deriváltjából következik (vehetjük a logaritmusát, mivel az ln sig. mon.) ( ) ] ln L N n ( xi + x â x i ln a + (N x i ) ln(1 a) = a N x ) i 1 a (1 a)x i a(n x i ) a(1 a) = 1 a(1 a) n (x i an) i=1 Tehát a széls érték feltételéb l a következ teljesül (â 0 és â 1 mert akkor L = 0) 3.22. Intervallumbecslés â = x 1 + x 2 +... + x n nn A pontbecslések során eltudtuk dönteni, hogy melyik becslés a jobb, azonban nem tudtunk jóslatot adni arra, hogy milyen valószín séggel jó a becslésünk. Azonban a becslés és az elméleti érték között általában van egy véletlen jelleg eltérés, melynek nagyságára valamit mondanunk kell. Legtöbb esetben az x 1, x 2,..., x n mintára támaszkodva lehet ségünk van egy â 1 és â 2 statisztikák konstruálására, melyre teljesül a következ : P ( ɛ a â ɛ) = P (â ɛ a â + ɛ) = P (â 1 a â 2 ) = 1 p ekkor azt mondhatjuk, hogy (â 1, â 2 ) az a paraméternek a kondencia-intervalluma 1 p megbízhatósági szinttel. Nyilván p minél kisebb annál nagyobb az (â 1, â 2 ) intervallum, tehát az állítás annál semmitmondóbb lesz. Ha pedig az (â 1, â 2 ) intervallumot csökkentjük akkor a p kezd el megn ni, tehát egyre bizonytalanabbak leszünk. i=1

sinkovicz.peter@wigner.mta.hu 3.2. STATISZTIKAI BECSLÉSEK 34 Kondencia-intervallum a sokaság m várhatóértékére N(m, σ) normál-eloszlás mellett és ismert σ esetén Legyen ξ egy normális eloszlású valószín ségi változó σ szórással és ismeretlen m várhatóértékkel, ekkor P (ξ < x) = F (x; ˆm) = 1 2πσ x (t ˆm)2 dte 2σ 2 Ha az m várhatóértéket az ξ = ξ 1+ξ 2 +...+ξ n n számtani átlaggal becsüljük, akkor megmutatható, hogy az ξ is normális eloszlást követ, melynek várható értéke ξ = m és szórása s(ξ) = σ n, áttranszformálva az eredeti várható értéket: u := ξ m n σ a várható érték becslése már egy szimmetrikus standard normális eloszlású valószín ségi változó lesz. Válasszuk a kondencia-intervallumot tehát a nullára szimmetrikusan, azaz ( u p, u p ) mely értékét a következ egyenlet rögzíti: P ( u u p ) = 2 u p 2π 0 dxe x2 2 = 1 p Tehát 1 p = Φ(u p ) (1 Φ(u p )) Φ(u p ) = 1 p 2 és így az 1 p 2 ismeretében az u p táblázatból olvasható. Mivel 1 p valószín séggel igazak a következ egyenl tlenségek: u p ξ m n < up σ ξ u p σ n < m ξ + u p σ n ezért az m várható értékre az ( ξ u p σ n ; ξ + u p σ n ] intervallum egy 100(1 p)% szint kondencia-intervallum Példa:Valamilyen szerves vegyület oxigéntartalmát határozzuk meg, az ismert szórás σ = 0, 30%. 12 mérésb l az ξ = 3, 25% átlagot kaptuk. A 95%-os megbízhatósági határok a következ k: 0, 30 ξ u 0,05 = 3, 25 1, 96 = 3, 08% 12 0, 30 ξ + u 0,05 = 3, 25 + 1, 96 = 3, 42% 12 Tehát 95% valószín séggel tartalmaz a vegyület (3, 08; 3, 42] százalék oxigént. Ha el írt megbízhatósági szinthez megadjuk, hogy a kondencia-intervallum félhossza legfeljebb ɛ lehet, akkor az σ n ɛ egyenl tlenségb l következik a minta szükséges elemszámának a nagysága u p n u 2 p σ 2 ɛ 2

sinkovicz.peter@wigner.mta.hu 3.2. STATISZTIKAI BECSLÉSEK 35 Kondencia-intervallum a sokaság m várhatóértékére N(m, σ) normál-eloszlás mellett és ismeretlen σ esetén Az el z pontnál gyakoribb mikor a σ paraméter is ismeretlen. Végezzük most a következ helyettesítést: t := n ξ m s = n 1 ξ m n 1 σ / s n σ mely abban a különbözik az el bb leírt u változójától, hogy most s is szerepel. A számlálóban a már deniált u fedezhet fel, amir l tudjuk, hogy N(0, 1) eloszlású valószín ségi változó, a nevez ben szerepl valószín ségi változóról belátható, hogy egy χ 2 -eloszlású valószín ségi változó 7. Továbbá az is belátható hogy ξ és s függetlenek, így a számláló és a nevez is független eloszlású. Belátható továbbá, hogy t egy n 1 szabadsági fokú, student-eloszlású valószín ségi változó 8. röviden a következ két megállapítás igaz: n számú független, N(0, 1) eloszlású valószín ségi változó négyzetösszegének eloszlását n-szabadsági fokú χ 2 eloszlásnak nevezzük. Ha ξ i független valószín ségi változók N(0, 1) eloszlást követnek, akkor n-szabadsági fokú Student-, vagy t-eloszlásnak nevezzük a tη t = ξ1 2 + ξ2 2 +... + ξ2 n valószín ségi változó eloszlását. Az el z ekhez hasonló módon a Student eloszlás táblázatból adott p-hez meghatározható az a t p szám, melyre teljesül a s P ( t t p ) = P (ξ s ) t p m ξ + t p = S n 1 (t p ) = 1 p n n egyenl ség. Ezek alapján az (1 p)100%-os kondencia szint esetén a kondencia-intervallum: s [ξ s ] t p ; ξ + t p n n (jelen esetben /mivel s is valószín ségi változó/ a kondencia-intervallum mérete is valószín ségi változó) Példa:Villanyég k vizsgálatánál egy adott tételb l 15db-nak mérték meg az égési id tartamát, mely közelít leg normális eloszlású volt. Az empirikus várható értékre és a korrigált empirikus szórásra az ξ = 1200óra, s = 186órának adódott. A szabadsági fokok száma tehát 14, a 99%- os megbízhatósági határok a következ ek: ξ t 0,01 s n = 1200 2.977 186 15 = 1057ra ξ + t 0,01 s n = 1200 + 2.977 186 15 = 1343ra Tehát az ég 99%-kal a [1057, 1343]óra üzemid vel égnek ki. 7 B vebben: Prékopa András - Valószín ség elmélet: 10.7. Az x és s 2 eloszlása normális eloszlású sokaság esetén 8 B vebben: Prékopa András - Valószín ség elmélet: 7.5. A Student- és a Cauchy-eloszlás

sinkovicz.peter@wigner.mta.hu 3.2. STATISZTIKAI BECSLÉSEK 36 Kondencia-intervallum a sokaság σ szórására N(m, σ) normál-eloszlás esetén Az n elem ξ i független, standard normális eloszlású valószín ségi változók négyzetösszegének eloszlása a már említettek alapján egy n szabadsági fokú χ 2 -eloszlást követnek 9. Belátható, hogy a w = ns2 σ 2 valószín ségi változó egy n 1 szabadsági fokú χ 2 eloszlásnak tesz eleget. Olyan intervallumot, amelybe az 1-p valószín séggel esik, végtelen sok van. Ugyanez igaz volt az u és t változóknál is, de ott szimmetrikus volt az eloszlás függvény, így ennek megfelel en választottuk a kívánt intervallumot. Most azonban χ 2 nem szimmetrikus, így az intervallumot is válasszuk meg kicsit másképpen: legyen az intervallum két határa a w p/2 és w 1 p/2, amikre teljesül a következ feltétel: P ( ns 2 P σ 2 ( ns 2 > w 1 p/2 σ 2 > w p/2 ) ) = 1 p 2 = p 2 E két határ meghatározás után leolvashatjuk a következ t: ( ) ( P w 1 p/2 ns2 ns 2 σ 2 w p/2 = P σ 2 w p/2 ) ns2 = 1 p w 1 p/2 melyb l a kondencia-intervallum: ( ) ns ns ; wp/2 w1 p/2 a sokaság szórására. Példa:Egyik automata gép által készített alkatrészek közül 10-et kiválasztva, az alábbi eredményeket kaptuk: 2, 18, 2, 14, 2, 17, 2, 13, 2, 21, 2, 12, 2, 15, 2, 14, 2, 10, 2, 14 Ennek alapján ξ = 2, 148 és s = 0, 030. A σ-ra vonatkozó 95%-os kondencia-intervallum határok a következ k: ns wp/2 = 0.022 ns w1 p/2 = 0.058 Példa:18 doboz mérlegelése alapján a töltési súly szórása s = 12g értéket kaptuk. Határozzuk meg a szórásra a 95%-os megbízhatósági intervallumot. Megint p = 0.05 és 17 szabadsági fokú az eloszlás. Táblázatból meghatározva: w p/2 = 30, 191 w 1 p/2 = 7, 564 Melyb l az intervallum a következ nek adódik a szórásra: [9, 27; 18, 51] 9 B vebben: Prékopa András - Valószín ség elmélet: 7.4. A χ 2 és a χ-eloszlás

sinkovicz.peter@wigner.mta.hu 3.2. STATISZTIKAI BECSLÉSEK 37 3.23. Gyakorló feladatok 1. Határozzuk meg egy normális eloszlású sokaság m várhatóértékét és σ 2 szórásnégyzetének egyidej maximum-likelihood becsléseit. A s r ségfüggvény a következ : f(x, m, σ 2 ) = 1 (x m)2 e 2σ 2 2πσ 2 2. A zikában kiterjedten használják a Maxwell-eloszlást, melynek s r ségfüggvény f(x) = 1 Θ 3 2 π x2 e x2 2Θ 2 y 0 Θ 0 Becsüljük meg n elem mintából maximum likelihood módszerrel az eloszlás Θ paraméterét, és fejezzük ki a becsl függvényt valamely mintamomentum segítségével. 3. Valamely azonnal oldódó kávékivonatot automata tölti az üvegekbe. El z felmérésekb l ismeretes, hogy a gép által töltött súly normális eloszlású valószín ségi változó, 1g szórással. A gép pontosságának ellen rzésére 16 elem mintát vettünk a következ értékeket kaptuk (g-ban): 55, 54, 54, 56, 57, 56, 55, 57, 54, 56, 55, 54, 57, 54, 56, 50 Készítsetek 95%-os megbízhatósági intervallumbecslést a várható átlagos tölt súlyra. 4. Egy gép 1000g-os konzerveket tölt. Min ség-ellen rzés során 9 elem véletlen mintát vettek a termelésb l és az alábbi nettó súlyokat mérték (g-ban) 992, 1001, 995, 1000, 998, 1004, 999, 1002, 1000 Határozzátok meg 98%-os megbízhatósági szinttel, hogy mennyi a készült termékek átlagos súlya. 5. Legkisebb négyzetek módszerével illesszünk egyenest a következ pontokra: x 0 5 10 15 20 22,5 25 26 y 0 0,0143 0,0276 0,0426 0,0572 0,0648 0,0725 0,0758 6. Egy hajóra szerelt kotrógép egy adott id szakban 5000 kanál kavicsot emel ki. Egy kanalának átlagos töltési súlya, 100 mérlegelés alapján 705kg. Legyen a töltési súly normális eloszlású σ = 50kg szórással. a) Határozzuk meg a 90, 95, 99%-os megbízhatósági szinteknek megfelel kondenciaintervallumokat a töltési súly várható értékére. b) 5000 markolás közül hányat kell lemérni ahhoz, hogy a kondencia-intervallum félhossza 95%-os szint mellett 7 legye? c) Oldjuk meg az a) pontot úgy, hogy 5000 markolás közül csak 30-at mérünk meg és nem ismerjük a σ-t d) Oldjuk meg az a) pontot, úgy ha az ott közölt adatok közül a σ szórást 100 mérlegelés alapján számított s = 51 korrigált tapasztalati szórással helyettesítjük. 7. Egy homokozó lapátnál véletlenszer en 16-szor lemértük a kiásási homok mennyiségét. A mérések alapján a kiemelt homok súlyának a szórása s = 15g-nak adódott. Határozzuk meg a szórás 90%-os kondencia intervallumát.

sinkovicz.peter@wigner.mta.hu 3.3. STATISZTIKAI PRÓBÁK 38 3.3 Statisztikai próbák Az sokaságra kapott sejtésünket (hipotézisünket) tesztelni kell, ezt úgy tehetjük meg, hogy mintavétel alapján megnézzük hogy egy adott valószín séggel igaz lehet-e az állítás. A különböz hipotézisek vizsgálatára szolgáló eljárásokat próbáknak hívjuk. Tehát egy próba során megvizsgáljuk, hogy mennyire hihet az adott állítás. A hipotézis vizsgálat során egyszerre két hipotézist nullhipotézist és egy azzal szemben álló másik állítást úgynevezett alternatív hipotézist versenyeztetünk és a végén azt fogadjuk el, amelyik "hihet bb". Null hipotézisnek szokás a vizsgálni kívánt feltevést nevezni. A vizsgálni kívánt hipotézisek felírása után következ feladat a mintaelemek egy olyan T ({x i }) függvényének keresése, amelynek valószín ségi eloszlása a nullhipotézis igazságát feltételezve ismert. Ezt a függvényt nevezzük próbafüggvénynek (szokás a becsl függvényekb l választani, hisz azok eloszlásait ismerjük). A próbafüggvény lehetséges értékeit 3 részre oszthatjuk: elfogadási tartomány, kritikus tartomány és visszautasítási tartomány. A kritikus tartományba esés α valószín séget szignikancia szintnek nevezzük. 3.31. Egymintás próbák Egymintás próbák során az adott sokaság valamely jellemz jére vagy valamely változó szerinti eloszlására vonatkozó feltevések helyességének ellen rzése szolgálnak. u-próba (σ adott és m tesztelése) Tegyük fel, hogy adott egy sokaság, ami N(m, σ) normális eloszlású és σ ismert, azonban m nem. Ellen rizni szeretnénk, hogy a sokaság várható értéke egyenl -e egy adott m 0 számmal. Egy n elem minta ξ átlaga általában nem lesz pontosan m 0, de feltehetjük azt a kérdést, hogy a mintaátlag mekkora eltérése esetén feltételezhetjük, hogy a várható érték m 0? Legyen a nullhipotézisünk H 0 : ξ = m 0, az ellenhipotézis pedig az, hogy H 1 : ξ m 0, vezessük be a már ismert u = n ξ m 0 σ valószín ségi változót (próbafüggvényt), mely N(0, 1) standard normális eloszlást követ. Ekkor az u 1 p-hez tartozó kondencia-intervalluma megadható a már ismert módon: P ( u p n ξ m 0 σ u p ) = 1 p átrendezés során a Φ(u p ) = 1 p 2 összefüggésb l meghatározhatjuk adott p-hez az u p értékét. Így az u értéke nagy valószín séggel (1 p) esik az [ u p ; u p ] elfogadási tartományba és kis valószín séggel (p/2) esik a kritikus tartományba. Azt mondhatjuk, hogy 100(1 p)% valószín séggel elfogadjuk a nullhipotézist, ha ellenkez esetben elvetjük a nullhipotézist. ξ m 0 n σ u p Példa:Egy automata gép 200mm-es hosszúságú pálcikák el állítására van beállítva. Vajon a gép által gyártott pálcikák hossza megfelel-e az el írt méreteknek? El zetes adatfelvételekb l

sinkovicz.peter@wigner.mta.hu 3.3. STATISZTIKAI PRÓBÁK 39 tudjuk, hogy a gép által gyártott pálcikák hossza normál eloszlású valószín ségi változó, σ = 3mm szórással. Az n = 16 elem minta elemeinek hosszmérete: 193, 195, 201, 204, 198, 196, 196, 196, 203, 199, 193, 198, 191, 191, 198, 200 Elfogadható-e tehát 99,9%-os szignikancia szint mellett hogy m 0 = 200mm? megoldás:mivel a változó normál eloszlású, a minta átlaga ξ = 197mm m 0 = 200mm σ = 3mm n = 4 ezért az u-próba alkalmazásával dönthetünk, ekkor: ξ m 0 u = n = 4 σ A p = 0, 001 értékhez tartozó u p táblázatbeli értéke: 3.29 (mivel 1 p/2 = 0.9995), melynek 3, 27 és 3, 32 közti intervallumon bármelyik értéke megfelel. Azonban u = 4 > u p, így az m 0 feltevésünket el kell vetni 99, 9%-os szignikancia szinten. t-próba (σ és ξ ismeretlen) Feltesszük, hogy a sokaság normális eloszlású, azonban sem a sokaság várható értéke, sem a szórása nem ismert. Azonban ellen rizni akarjuk az m = m 0 hipotézist. A már látottak alapján t = n ξ m 0 s valószín ségi változó n 1 szabadsági fokú Student-eloszlást követ. Az adott p-hez tartozó t p táblázat alapján meghatározható, melyre igaz hogy: P ( t > t p ) = p Tehát ha a mintából számolt t érték nagyobb, mint a t p, akkor m = m 0 hipotézist elvetjük. Ellenkez esetben nincs ellentmondás. Példa: A sörösüvegekben található sör várható értéke 33cl ami 100%-nak fele meg. Egy 10 elem mintából a következ ket mérték: 98, 5, 99, 6, 100, 2, 99, 3, 100, 4, 100, 3, 99, 4, 98, 7, 99, 1, 98, 5 melyb l a következ ket határozhatjuk meg: tehát ξ = 99, 4% n = 10 s = 0.2285% t = n ξ 100% = 2.63 n s t 0,05 = 2, 262 95% os szinten elfogadhatjuk a feltevést t 0,01 = 3, 250 99% os szinten nem fogadhatjuk el a feltevést

sinkovicz.peter@wigner.mta.hu 3.3. STATISZTIKAI PRÓBÁK 40 χ 2 -próba (szórásnégyzetre irányuló próba) Most a sokaság szórásnégyzetére szeretnék nullhipotézist feltenni, majd ezt tesztelni. Legyen H : σ 2 = σ 2 0, a minta amit vizsgálunk ismeretlen várható érték normál eloszlás. Ekkor a w = (n 1)s2 σ 2 0 próbafüggvény egy n 1 szabadsági fokú χ 2 eloszlást követ majd. Három fajta ellenhipotézist vizsgálhatunk: a) H 1 : σ < σ 0 ekkor az intervallum alja: w p b) H 1 : σ > σ 0 ekkor az intervallum teteje: w 1 p c) H 1 : σ σ 0 ekkor az intervallum alja: w p /2 és a teteje w 1 p/2 A továbbiakban legyen az ellenhipotézis a c) pontban ismertetett H 1, ekkor szimmetrikusan vesszük fel a kondencia-intervallumot, az alsó értékét w p/2 -vel rögzítettük, a fels részét pedig w 1 p/2 -vel. Tehát ha a w beleesik a [w p/2, w 1 p/2 ] intervallumba akkor elfogadjuk a feltevést, ellenkez esetben elvetjük. Példa: Legyen a nullhipotézisünk σ 0 = 4 a 10 elem mintából pedig tegyük fel, hogy s = 4, 508 adódott. Ekkor 5%-os szignikancia szint mellett elfogadhatjuk-e a feltevésünk? w = 9 4, 5082 4 2 = 11, 431 Most egy n 1 = 9 szabadsági fokú rendszerhez van szerencsénk, melynek 5%-os szignikancia szinthez tartozó kritikus értékei: w p/2 = 2, 70 és w 1 p/2 = 19, 0. Mivel a kapott érték bele esik ebbe az intervallumba, így elfogadhatjuk a feltevésünket. 3.32. Gyakorló feladatok 1. Egy csokoládégyár speciális 14 dekagrammos csokoládé szeleteket gyárt, a gyártás szórása σ = 2dkg. Véletlenszer en kiválasztunk 25 darabos mintát, melynek átlaga ξ = 14.8dkgnak adódott. Feltételezhet -e az eltérés véletlenszer sége (p=5% mellett)? 2. Egy csomagoló gép által készített bálákat vizsgálunk. 100 bála mérlegelése alapján azt kaptuk, hogy a bálák átlagos tömege 705kg. Legyen a bálák tömege normális eloszlású, σ = 50kg szórással. Van-e szignikáns eltérés 95%-os megbízhatósági szinten az el írt 700kg-hoz képest? 3. Nézzetek utána a "Homogenitás vizsgálat"-nak, írjatok róla egy rövid elméleti összefoglalót, majd mutassátok be egy szabadon választott példán. 4. Nézzetek utána a "Függetlenség vizsgálat"-nak, írjatok róla egy rövid elméleti összefoglalót, majd mutassátok be egy szabadon választott példán. 5. χ 2 próbával igazoljátok 99%-os megbízhatósági szint mellett hogy a 3.2.3.5-as feladatában végzett illesztés jóságát, ha a kapott meredekség és tengelymetszet értékeket század pontosan veszitek gyelembe.

sinkovicz.peter@wigner.mta.hu 4.1. DISZKRÉT ELOSZLÁSOK 41 Függelék: Nevezetes eloszlások 4.1 Diszkrét eloszlások 4.11. Geometriai eloszlás Geometriai eloszlás: P (ξ = k) = p k = q k 1 p Várható értéke k = 1/p és szórásnégyzete s 2 = q/p 2 (a) p = 0, 1 (b) p = 0, 3 g. 4.3. ábra: Geometriai eloszlás (a) p = 0, 5 (b) p = 0, 7 g. 4.4. ábra: Geometriai eloszlás

sinkovicz.peter@wigner.mta.hu 4.1. DISZKRÉT ELOSZLÁSOK 42 4.12. Binominális eloszlás Binominális eloszlás: P (ξ = k) = p k = Várható értéke k = np és szórásnégyzete s 2 = npq ( n k ) p k q n k (a) n = 5, p = 0, 5 (b) n = 10, p = 0, 5 g. 4.5. ábra: Binominális eloszlás (a) n = 20, p = 0, 5 (b) n = 30, p = 0, 5 g. 4.6. ábra: Binominális eloszlás

sinkovicz.peter@wigner.mta.hu 4.1. DISZKRÉT ELOSZLÁSOK 43 (a) n = 5, p = 0, 7 (b) n = 10, p = 0, 7 g. 4.7. ábra: Binominális eloszlás (a) n = 20, p = 0, 7 (b) n = 30, p = 0, 7 g. 4.8. ábra: Binominális eloszlás

sinkovicz.peter@wigner.mta.hu 4.1. DISZKRÉT ELOSZLÁSOK 44 4.13. Poisson eloszlás Poisson eloszlás: P (ξ = k) = p k = λk k! e λ Várható értéke k = λ és szórásnégyzete s 2 = λ (a) λ = 10 (b) λ = 15 g. 4.9. ábra: Poisson eloszlás (a) λ = 21 (b) λ = 30 g. 4.10. ábra: Poisson eloszlás

sinkovicz.peter@wigner.mta.hu 4.2. FOLYTONOS ELOSZLÁSOK 45 4.2 Folytonos eloszlások 4.21. Exponenciális eloszlás Exponenciális eloszlás: f(x) = { 0, ha x 0 λe λx, ha x > 0 Várható értéke x = 1/λ és szórásnégyzete s 2 = 1/λ 2 (a) λ = 0, 2 (b) λ = 0, 3 g. 4.11. ábra: Exponenciális (a) λ = 0, 5 g. 4.12. ábra: Exponenciális

sinkovicz.peter@wigner.mta.hu 4.2. FOLYTONOS ELOSZLÁSOK 46 4.22. Normális eloszlás Normális eloszlás: f(x) = 1 s (x m) 2 2π e 2s 2 Várható értéke x = m és szórásnégyzete s 2 = s 2 ha < x < (a) m = 10, s = 2 (b) m = 10, s = 3 g. 4.13. ábra: Normális (a) m = 10, s = 5 (b) m = 0, s = 1 g. 4.14. ábra: Normális

sinkovicz.peter@wigner.mta.hu 4.2. FOLYTONOS ELOSZLÁSOK 47 4.23. Lognormális eloszlás Lognormális eloszlás: Várható értéke és szórásnégyzete f(x) = 1 (ln x m) 2 s 2π e x = e m+s2 /2 0, ha x 0 2s 2, ha x > 0 s 2 = e 2m+s2 (e s2 1) (a) m = 0, 3, s = 1 g. 4.15. ábra: Lognormális