Matematikai statisztika példák Matematikai statisztika példák Normális eloszlás 1. A skót bakák mellkas körmérete N(88, 10). A skót bakák mekkora hányada fér bele egy 84-es zubbonyba? 2. Majmok ébredését figyeltük meg. Azt tapasztaltuk, hogy 10%-uk 4 30 előtt mászott le a fáról, 20%-uk 9 15 után. Feltételezve, hogy az ébredési idejük normális eloszlást követ, mennyi a valószínűsége, hogy reggel 7-ig felkel a kedvenc majmunk? 3. A házimacskák testsúlya jó közelítéssel normális eloszlást követ: a macskák 10%-a könnyebb, mint 1, 5 kg és 20%-a nehezebb, mint 7 kg. Mekkora a 6 kg-nál nehezebb házimacskák aránya? 4. A programozó hallgatók valószínűségszámítás-gyakorlaton szerzett pontszáma közelítőleg normális eloszlású: 8%-uk szerzett kevesebb, mint 50 pontot és 12%-uk szerzett több, mint 86 pontot. Mekkora hányaduk szerzett 51 és 61, illetve 62 és 73 közötti pontszámot? 5. A 200 gramm névleges tömegű Tibi csokoládé tényleges tömege 200 gramm várható értékű, normális eloszlású v.v.: a csokoládék 80%-ának a tömege 195 és 205 gramm közé esik. Mekkora hányaduk könnyebb, mint 190 gramm? 6. Szegednél a Tisza vízszint ingadozása normális eloszlást követ. Ha a 402 m-es vízszintnek a várható értéktől való eltérése a szórásnégyzet háromszorosa, és ennél alacsonyabb vízszint az esetek 67%-ában mérhető, akkor mekkora µ és σ? 7. Egy üzemben egy folyékony termék töltését két automata végzi. Az üvegekbe töltött mennyiség átlagosan 2 dl és normális eloszlású mindkét gép esetében. A betöltött mennyiség szórása az első gépnél 0, 14 dl, a másodiknál pedig 0, 08 dl. Az üvegek 60%-át az első gép tölti, a többit a második. Mi a valószínűsége, hogy egy üveget véletlenszerűen kivéve a napi készletből, abban a betöltött folyadék mennyisége a várható értéktől 0, 1 dl-nél kevesebbel tér el? de Moivre-Laplace-tétel, Centrális határeloszlás tétel 8. Százszor feldobunk egy ferde forintos érmét. Mennyi a valószínűsége annak, hogy az írást eredményező dobások száma 40 és 60 közé esik? 9. Egy szabályos dobókockát 600-szor feldobunk: írjuk fel annak a pontos valószínűségét, hogy a dobbott 6-osok száma 100 és 105 közé esik, és közelítsük ezt a valószínűséget a de Moivre-Laplace-tétel segítségével! 10. Egy célpontra 200 lövést adnak le. A találatok valószínűsége minden lövésnél 0, 4. Adjon meg olyan felső korlátot, amelyet a találatok száma 90% eséllyel nem halad meg! 11. Budapesten meg akarják állapítani, hogy a dohányosok milyen p arányban fordulnak 1
elő. Ehhez n embert kiválasztanak, úgy hogy minden választásnál mindenki ugyanolyan valószínűséggel kerülhet kiválasztásra és csak ezek között nézik meg a dohányosok k számát. Milyen nagyra kell az n-et választani, hogy legalább 95% valószínűséggel a mintából kapott k/n arány legfeljebb 0, 005 hibával megközelítse a dohányosok valódi p arányát ( bármi is legyen p, 0 < p < 1)? 12. Egy pakli magyar kártyát jól összekeverünk, majd kihúzunk egy kártyát. Ezt 150-szer megismételjük. Mennyi a valószínűsége, hogy a kihúzott királyok száma 35 és 62 közé esik? 13. Ketten játszanak egy játékot. András 37/72 valószínűséggel, Béla 35/72 valószínűséggel nyer meg egy játékot. A játék 200 játszmából áll, minden játszmánál 10 dollár a tét, vagyis ha András nyer, Béla ad neki 10 dollárt és fordítva. Mennyi a valószínűsége, hogy András nyereménye 50 és 100 dollár között lesz! 14. 1000 esetből kb. 300-szor fordul elő, hogy egy doboz málna nettó súlya több, mint 35 dkg. Becsüljük meg normális eloszlás táblázat segítségével, hogy hány szem málna van egy dobozban, ha az egyes málanszemek súlya 2 g körül ingadozik, 0, 25 g szórással! 15. X 1,..., X 1000 független, külön-külön [0, 1]-en egyenletes eloszlású véletlen változók. Normális eloszlás táblázat segítségével határozzuk meg a P ( 1000 i=1 X2 i 350) valószínűség közelítő értékét! 16. Egy adott repülőgép esetén a két meghibásodás között eltelt időtartam exponenciális eloszlást követ, 30 nap várható értékkel. A repülőt 100 meghibásodás után kivonják a forgalomból. Mennyi a valószínűsége, hogy 3600 napnál tovább üzemelhet? 17. Véletlenországban egy bank pénztáránál az egyik napon előreláthatóan 60 ügyfél vesz ki pénzt. A pénztárnál az átlagos kifizetés ügyfelenként 50 tallér, 20 tallér szórással. Mennyi pénzt tartson a kasszájában a pénztáros, ha 0, 95 valószínűséggel, minden fennakadás nélkül tudja teljesíteni a kifizetéseket? 18. Egy útvonalon két légitársaság indít járatokat: a két társaság szolgáltatási színvonala és jegyek ára azonos, a járatok azonos időben indulnak, feltehető, hogy az utasok teljesen véletlenszerűen és azonos valószínűséggel döntenek egyik vagy másik légitársaság mellett. Az adott viszonylatban 200-an akarnak utazni: hány férőhelyes gépekre van szüksége a légitársaságoknak, ha azt akarják, hogy legfeljebb 1% legyen annak a valószínűsége, hogy egy utast amiatt kelljen elutasítani, mert már nincs szabad hely a gépen? Empirikus eloszlásfüggvény, empirikus várható érték és empirikus szórás 19. A következő adatokat kapták a heti tv-nézési időre, órában mérve, egy 14 diákkal végzett felmérésnél: 3, 6, 14, 21, 4, 15, 20, 28, 45, 20, 5, 4, 4, 35. Határozzuk meg az adatok empirikus eloszlásfüggvényét, empirikus várható értékét és empirikus szórását! 20. Egy gyermek játékszer fizikai terhelhetőségére elvégzett próbatesztek a következő mérési eredményekre vezettek: 40, 45, 39, 42, 37 (kg). (a) Határozzuk meg az adatok empirikus eloszlásfüggvényét, empirikus várható értékét oszi 2
Matematikai statisztika példák és empirikus szórását! Ezután tegyük fel, hogy a terhelhetőség normális eloszlású a becslésből adódó szórással és várható értékkel. (b) Mi a valószínűsége, hogy egy játékszer terhelhetősége 15 és 28 kg közzé esik? (c) Mi a valószínűsége, hogy egy játékszer terhelhetősége nem éri el a 13 kg-ot? (d) Mi a valószínűsége, hogy egy játékszer terhelhetősége eléri a 46 kg-ot? (e) Adjunk meg egy olyan intervallumot, amelybe egy találomra kiválasztott játékszer terhelhetősége 0.9 valószínűséggel esik bele! ( a (b),(c),(d),(e) feladatoknál az elméleti értékeket kell meghatározni!) 21. 7 számítógép életkora (X) és karbantarásukra elköltött pénz mennyisége (Y ) a következő volt: Számítógép Életkor(X) Költség(Y ) (év) (eft) 1. 10 50 2. 15 60 3. 12 57 4. 18 60 5. 08 45 6. 11 53 7. 10 52 Jellemezzük az X és Y mutatók közötti kapcsolat szorosságát! 22. Egy város egyik piacán 10 egyást követő napon megfigyelést végeztek a nyári alma felhozatalára és egységárának alakulására vonatkozóan. Az adatokat a következő táblázat tartalmazza: Sorszám Felhozatal Egységár (q) (Ft/kg) 1. 0.4 85 2. 0.7 90 3. 0.9 86 4. 1.2 80 5. 1.2 78 6. 1.1 75 7. 1.4 69 8. 1.5 65 9. 1.5 66 10. 1.3 65 Számítsuk ki a felhozatalra és az egységárra vonatkozó empirikus korrelációs együtthatót! Maximum likelihood becslés 3
23. A gyártót és a kereskedőt egyaránt érdekli, hogy egy adott árúkészletben hány darab selejtes van. Tegyük fel, hogy az árúkészlet N darabból áll. Válasszunk ebből véletlenszerűen egy n-elemű (1 n < N) mintát. Ez azt jelenti, hogy bármely n 1 darabos kollekciót egyenlő, tehát ( ) valószínűséggel választunk ki. Megszámoljuk N n hány selejtes van a mintában. Legyen m a mintabeli selejtes darabok száma. Adjunk maximum likelihood becslést a teljes készletben lévő selejtesek számára! Konkrét példaként tekintsük azt az esetet, amikor a készlet 2000 darabból áll és 20- elemű mintát veszünk. 24. A kékbálnaállomány becslésére a következőmódszert alkalmazták. Néhány napon át kb. 30 cm hosszú fémhengereket lőttek be a bálnák zsírpárnájába, közvetlenűl a bör alá. Feljegyezték, hogy hány bálnát jelöltek meg (M). Ezután felszólították a bálnahalászhajókat, hogy adják meg, hány bálnát fogtak (n), s azok közt hány volt megjelőlve (k). Adjunk maximum likelihood becslést a bálnák N számára! 25. Egy céllövő egy számára ismeretlen puskával először n 1 lövést ad le egy célpontra, minden egyes lövés találati valószínűsége p. Ezután ujra lő, ezúttal n 2 lövést ad le és αp a lövések találati valószínűsége. Jelöljük a találatok számát az egyes sorozatokban x 1 -el és x 2 -vel. (a) A p paramétert ismertnek tételezve, adjunk maximum likelihood becslést a α-ra. (b) Tegyük fel, hogy p is ismeretlen és becsüljük mindkét paramétert. (c) Adjuk meg a konkrét becsléseket az (a) illetve (b) esetekben, ha n 1 = 15, n 2 = 10, x 1 = 9, x 2 = 8. 26. Egy tóban a halakat betegség támadta meg, mely az egyes egyedeket ismert p (0 < p < 1) valószínűséggel pusztítja el. (a) A kifogott haltetemek k számából adjunk maximum likelihood becslést a betegség előtt a tóban élt halak számára. (b) Mennyiben változik a becslésünk, ha a mintában megkülönböztetjük a hím és nőstény egyedeket és feltételezzük, hogy mindkét nemet ugyanolyan arányban érinti, valamint a tóban ugyanannyi nőstény és hím van? (c) Adjuk meg a konkrét becslést az (a) esetben, ha k = 100 és p = 0.05. 27. Tegyük fel, hogy egy almáskertben véletlenszerűen, egymástól függetlenül találhatók fertőzött fák, melyek száma Poisson eloszlást követ. Tíz egyforma nagy, egyenként három sorból álló ültetvényben rendre 0, 3, 0, 1, 0, 0, 2, 1, 1, 2 beteg fát találtak. Adjunk maximum likelihood becslést az egy sorban található fertőzött fák számának várható értékére. 28. A színvakság gyakorisága egy populációban genetikai tényezők miatt p a férfiaknál és p 2 a nőknél. Adjuk meg a p maximum likelihood becslését az alapján, hogy M férfiből m és N nőből n volt színvak. oszi 4
Matematikai statisztika példák 29. Egy városban a gépkocsik rendszámai egyszerű számok, 1-től kezdődően. Adjunk maximum likelihood becslést a városban található gépkocsik számára n megfigyelés alapján ( jelölje pl. x 1, x 2,..., x n a megfigyelet n rendszámot). Adjuk meg a konkrét becslést, ha az 5, 8100, 76, 77073 és a 125916 rendszámokat figyeltük meg. 30. Egy alkatrészekből álló sokaság 6 mintapéldánynak következő volt a teljes élettartama: 39, 45, 67, 50, 50, 60 (hónap). Tegyük fel, hogy az élettartam exponenciális eloszlású egy ismeretlen λ paraméterrel. (a) Számoljuk ki a λ paraméter maximum likelihood becslést! Ezután tegyük fel, hogy az élettartam várható értéke a mintaelemek átlaga. (b) Mi a valószínűsége, hogy egy alkatrész élettartama a várható értékre szimmetrikus 20 hónap hosszú intervallumba esik? (c) Milyen T időtartamot ér meg az alkatrészek 10%-a? (d) Milyen T időtartamot nem ér meg az alkatrészek 85%-a? (e) Mi a valószínűsége, hogy egy alkatrész 35 hónapnál rövidebb ideig tart ki? (f) Mi a valószínűsége, hogy egy alkatrész legalább 70 hónapig müködik? ( a (b),(c),(d),(e),(f) feladatoknál az elméleti értékeket kell meghatározni!) 31. Határozzuk meg egy ismeretlen helyzetű 1 hosszúságú intervallum felezőpontjának maximum likelihood becslést! Adjuk konkrét becslést, ha a következő minta áll rendelkezésünkre: 1.1, 1.9, 1.3, 1.5, 1.7, 1.99. 32. Egy laborban a mérést általában az (ismert) σ szórású műszeren végzik. n ilyen mérés elvégzése után (a független, azonos N(µ, σ) eloszlású adatok: x 1,..., x n ) elromlott a készülék és csak a régi, kσ (szintén ismert) szórású műszert lehetett használni. Ezzel a műszerrel az y 1,..., y m adatokhoz jutottunk (µ változatlan). Adjunk maximum likelihood becslést µ-re. Adjuk meg a konkrét becslést, ha a következő minta áll rendelkezésünkre: 1.1, 1.9, 1.3, 1.5, 1.7, 1.99 és 1.1, 0.9, 1.3, 1.5, 1.7, 1.99, 2.1, 1.9, 2.3 a régi műszerrel mért minta (σ = 0.2, k = 1.2). 33. Egy alkatrész élettartama exponenciális eloszlású η/t, ha t hőmérsékleten működtetjük. (a) Hogyan függ a várható élettartam a t hőmérséklettől? (b) Tegyük fel, hogy n megfigyelést különböző t 1, t 2,..., t n hőmérsékleten végeztünk és x 1, x 2,..., x n élettartamot figyeltünk meg. Adjunk maximum likelihood becslést η-ra! (c) Adjunk meg konkrét becslést η-ra, ha a következő megfigyelések adódtak: Megfigyelés Élettartam Hőmérséklet x(év) t( o C) 1. 2.3 20 5
oszi 2. 9.8 25 3. 0.8 17 4. 10.2 26 5. 8.1 23 6. 7.7 22.5 7. 1.2 19 Konfidencia intervallum, tesztek 34. Egy város energiafogyasztása normális eloszlású ismeretlen µ várható értékkel és a korábbi tapasztalatok alapján ismert σ szórással. n napon át végeztünk méréseket x 1,..., x n eredménnyel, majd n + 1. naptól m napon át csak a város egyik kerületéből érkeztek adatok, ahol a fogyasztás várható értéke az egész városénak a fele: y 1,..., y m a kapott adatsor (tételezzük fel, hogy a szórás itt is σ). Adjunk maximum likelihood becslést µ-re. 35. Legyen X 1, X 2,..., X n mintánk az f(x) = 3x 2 2η, ha η x η 0, különben (η > 0) sűrűségfüggvényű eloszlásból. Adjunk maximum likelihood becslést az ismeretlen η parameterre. 36. Legyen X 1, X 2,..., X n az 2α x(1 x 2 ) α 1, ha0 < x < 1 f(x) = 0, különben sűrűségfüggvényű eloszlásból vett minta. Adjunk maximum likelihood becslést az ismeretlen α > 0 parameterre. 37. Egy gyermek játékszer fizikai terhelhetőségére elvégzett próbatesztek a következő mérési eredményekre vezettek: 40, 45, 39, 42, 37 (kg). Tegyük fel, hogy a terhelhetőség normális eloszlású a becslésből adódó szórással. (a) Adjunk meg egy olyan intervallumot, amely a terhelhetőség várható értékét 0.9 valószínűséggel tartalmazza! (b) Teszteljük azt a nullhipotézist 1, 5, 10% szignifikancia szinten, hogy a terhelhetőség várható értéke 40 kg-mal egyezik meg! 38. Adott gépen gyártott gyűrűk külső átmérője, mint véletlen változó, normális eloszlást követ. Tegyük fel, hogy a szórás ismert: σ = 0.12. Teszteljük azt a nullhipotézist 1, 5, 10% szignifikancia szinten, hogy a külső átmérő várható értéke 16.8 mm-rel egyezik meg,ha 5 darabot lemérve: 16.7, 16.9, 16.3, 17.1, 17.2! 39. Egy laborban a mérést egy ismeretlen σ szórású műszeren végzik. Egy mérést 6- szor megismételve a ( független, azonos N(µ, σ 2 ) eloszlású) következő adatokat kaptuk: 1.1, 1.9, 1.3, 1.5, 1.7, 1.99. Adjunk meg a egy olyan intervallumot, amely a szórás négyzetet 90% valószínűséggel tartalmazza! 6
Matematikai statisztika példák 40. 5 egyén testmagasságára a következő mérések adódtak: 171, 177, 183, 169, 172(cm). Az adatok szórása ismeretlen. (a) Adjunk meg egy olyan intervallumot, amely a várható magasságot 95% valószínűséggel tartalmazza! (b) 1, 5, 10% szignifikancia szinten teszteljük azt a nullhipotézist, hogy a várható magasság 178 cm! 41. Jancsi bácsi tüzifát fűrészel, szándéka szerint 10 cm-es darabokra. Mivel a reggeli első fél decijén már túl van, a levágott darabok hossza közelítőleg normális eloszlást követ, ismeretlen szórással. Elfogadjuk-e 10%-os szignifikancia szinten, hogy a tüzifák várható értéke 10 cm, ha 5 darabot lemérve: 8.7, 6.9, 10.3, 8.1, 7.9? 42. Az alábbi két minta 5-egyforma képességünek feltételezett- sportoló súlylökésben elért adatait tartalmazza ( tegyük fel, hogy az adatok normális eloszlásból származnak). Az első dobás előtt az edző büszkén állította, hogy tanítványai átlagosan legalább 17m-t dobnak, amit a klubb igazgatója kétségbe vont. Úgy döntött, hogy csak akkor hosszabbítja meg az edző szerződését, ha a H 0 : µ = 17 hipotézis α = 0.05 elsőfajú hibavalószínűség mellett elfogadható! (a) Hogyan döntött az igazgató, ha a korábbi tapasztalataik alapján a dobások szórását 2-nek tekintették? (b) Változott volna-e a helyzet, ha nem tekintik a szórást ismertnek? (c) Az előzőek alapján az igazgató végül is még egy esélyt adott az edzőnek. Ő az első kisérlet után mindenkinek elmagyarázta, hogy mire kellene odafigyelnie a jobb eredmény érdekében. Segített-e az edzés? (d) Végül is mi legyen az edző sorsa? Sportoló 1. 2. 3. 4. 5. 1. dobás 14.8 12.2 16.8 17.1 16.1 2. dobás 18.0 12.1 17.2 17.7 17.0 43. Az alábbi két minta 5 autó fogyasztási adatait tartalmazza. Az első sorban a szerviz előtti, a másodikban a szerviz utáni értékek találhatóak. Csökkentette-e a szerviz a fogyasztást? Autó 1. 2. 3. 4. 5. szerviz előtt 7.9 8.1 8.8 7.2 6.0 szerviz után 7.5 7.5 8.1 7.2 5.7 44. 1000 embert megkérdeztünk dohányzik-e, 386 mondta magát dohányosnak. Adjunk 0, 9 megbízhatósági szintű konfidencia intervallumot arra a valószínűségre, hogy valaki dohányzik! 45. Állítólag Szegeden a fehér autók aránya 30%. Egy forgalmas útkereszteződésben 100 autó haladt keresztűl: ezek közzül 35 volt fehér. 7
(a) Adjunk 99%-os megbízhatósági szintű konfidencia intervallumot a fehér autók arányára! (b) α = 0, 01 szinten elfogadjuk-e H 0 : p = 0, 3 nullhipotézist? 46. Legyen A egy esemény ismeretlen P (A) = p valószínűséggel. A de Moivre-Laplace tértel felhasználásával konstruáljunk tesztet a következő nullhipotézis ellenőrzésére: H 0 : p = p 0 (l.a. centrális határeloszlás tételen alapuló próbákat!) Végezzük el a tesztet 1% szignifikancia szint mellett annak ellenőrzésére, hogy az A esemény valószínűsége 0.9, ha azt figyeltük meg, hogy 100 esetből 86 esetben következett be A. 47. A Szerencsejáték felügyelet kaszinót ellenőriz, arra kiváncsiak szabályos-e a dobókockájuk. Azt tapasztalják, hogy száz dobásból 1 2 3 4 5 6 15 19 20 17 18 11 Elfogadjuk-e α = 0.05 megbízhatósági szinten hogy szabályos a kocka? oszi 8