6. feladatsor Statisztika 200. december 6. és 8.. Egy = 0 szervert tartalmazó kiszolgáló mide szervere mide pillaatba 0 < p < valószíűséggel foglalt, a foglaltságok szerverekét függetleek. Tehát a foglaltak száma Biom(, p) eloszlásúak tekithető. A p-t szereték meghatározi, ehhez 0 mérést végeztük: 2,3,2,5,4,6,3,,0,. A mita alapjá határozzuk meg p legvalószíűbb értékét, azaz adjuk meg a p maimum likelihood becslését általába Biom(, p) (fi eseté), majd a kokrét példába. Megoldás: Általába Biom(, p) eloszlás és N elemű, k = (k,..., k N ) mita megvalósulás eseté a likelihood függvéy: L p ( N ( ) k) = p ki ( p) ki, k i p függvéyébe keressük a globális maimumhelyet. A példába = N = 0 és a k,..., k 0 értékek adottak. Tudjuk, hogy a maimum felvétetik valamely 0 p -re, biztosa em p = 0 vagy eseté, és L p deriválható, így a maimumhelye L p = 0. Köyebb a likelihood függvéy logaritmusát deriváli, mert akkor függvéyek összegét deriváljuk, amely köyebb feladat, mit szorzatot deriváli. Tehát a loglikelihood-függvéy: l p ( k) = log L p ( ( ) k) = log + k i log p + ( k i )log( p). Eek deriváltja egyelő 0-val (lok. szélsőérték helyek meghatározása) Átredezéssel a maimum hely µ: p l p ( k) = k i µ = k N i p N k i N. k i p = 0. A kokrét példába p = 0, 27. (Sokszor igaz, hogy ha csak egy helye 0 a derivált, akkor az automatikusa maimumhely.) 2. Adjuk meg az (a) epoeciális, (b) Poisso, (c) geometriai eloszlásból vett miták maimum likelihood becslését. Megoldás: (a) Ha X,...,X Ep(λ) függetleek, akkor λ maimum likelihood becslése λ = / X i/. (b) Ha X,..., X Poi(λ) függetleek, akkor λ maimum likelihood becslése λ = X i/. (C) Ha X,..., X Geom(p) függetleek, akkor p maimum likelihood becslése p = / X i. 3. Tegyük fel, hogy egy kérdőívvel a megkérdezettek jövedelmi viszoyait akarják felderítei. A korábbi tapasztalatok szerit a magas jövedelműek 0,2 valószíűséggel alacsoy jövedelműek vallják magukat. Az alacsoy jövedelműek csupá 0, valószíűséggel állítják, hogy ők a magas jövedelműek. Adjuk maimum likelihood becslést a téyleges θ aráyra az alapjá, hogy a beérkezett kérdőívek közül szólt magas, pedig alacsoy jövedelemről. Megoldás: Ha a magas jövedelműek valódi aráya θ, akkor egy megkérdezett ember p = 0, ( θ) + 0, 8 θ = 0, + 0, 7θ
2 valószíűséggel vallja magát magas jövedelműek, és p valószíűséggel alacsoy jövedelműek. A likelihood függvéy: ( ) ( ) L θ (, ) = p ( p) = (0, + 0, 7θ) (0, 9 0, 7θ). A log-likelihood függvéy deriváltja 0-val egyelő a következő helye: θ = 0, 0, 7. 4. A családok jövedelmét egy olya skálá mérjük, ahol X = a létmiimumak felel meg. Feltételezzük, hogy a jövedelem eloszlása az f() = θ ( ) sűrűségfüggvéyel adható meg. (Ez az úgyevezett Paretoeloszlás). Adjuk maimum likelihood becslést a θ-ra, ha 0 véletleszerűe választott család jövedelme θ+ alapjá:,53, 2,76, 9,65, 4,6, 7,3,,2, 254,2, 5,45,,2,,63. Megoldás: Folytoos esetbe a likelihood-függvéybe a sűrűségfüggvéyek szorzata szerepel, a MLbecslést ilyekor is deriválással kaphatjuk meg. A ML becslés θ = /( lx i), ahol = 0 és az X,...,X 0 értékek a jövedelmek. A kokrét példába θ = 0, 63. 5. Egy alkatrész élettartama epoeciális eloszlású θ/t várható értékkel, ha t hőmérséklete működtetjük. Tegyük fel, hogy az megfigyelést a külöböző t,...,t hőmérséklete végeztük és,..., élettartamokat figyeltük meg. Adjuk maimum likelihood becslést θ-ra. Megoldás: Ha egy epoeciális eloszlás várható értéke θ/t, akkor paramétere t/θ. Tehát sűrűségfüggvéye: f θ () = t θ e t θ, if 0. Ha (, t ), ( 2, t 2 ),..., (, t ) a mért élettartam adat az adott hőmérséklete, akkor a likelihood függvéy: Eek logaritmusa: θ-szertiti deriváltja egyelő 0-val: Ie átredezéssel a ML becslés: l θ (, t) = L θ (, t) = log(t i ) θ + θ = t t iθ θ e i log(θ) i t i θ 2 = 0. it i 6. Egy város eergiafogyasztása ormális eloszlású ismeretle µ várható értékkel és a korábbi tapasztalatok alapjá ismert σ szórással. apo keresztül végeztük méréseket,..., eredméyel, majd az (+)- edik aptól m apo keresztül át csak a város egyik kerületéből érkeztek adatok, ahol a fogyasztás várható értéke az egész város fogyasztásáak a fele: y,...,y m a kapott adatsor. Tételezzük fel, hogy a szórás itt is σ. Adjuk maimum likelihood becslést µ-re. i t i θ Megoldás: Legye X,..., X N(µ, σ) eloszlású mita. A mért megvalósulás: = (,..., ). Legye Y,..., Y m N ( µ 2, σ) eloszlású mita. A mért megvalósulás: y = (y,...,y m ). A σ paraméter ismert. A likelihood függvéy (ahogy általába) az X,...,X, Y,..., Y m együttes sűrűségfüggvéye: L µ (, y) = e ( i µ) 2 m 2σ 2 e (y j µ/2) 2 2σ 2. 2πσ 2πσ Eek logaritmusa: l µ (, y) = log 2πσ Eek µ-szeriti deriváltja 0-val egyelő: µ l µ (, y) = ( i µ) 2 2σ 2 + 2( i µ) 2σ 2 + log 2πσ 2 2 (y j µ/2) 2σ 2 = 0. (y j µ/2) 2 2σ 2.
3 Ie átredezéssek kapjuk a ML becslést: µ = 4 i + 2 m y j 4 + m 7. Egy cukorgyárba a cukrot 000 gramm évértékű zacskókba csomagolják. A gyártási techológiából eredőe az egy zacskóba kerülő cukor szórása 50 gramm, a várható értéke azoba ismeretle, jelölje m gramm. Megvizsgáluk 25 zacskót, és azt tapasztaljuk, hogy a beük lévő cukor meyisége átlagosa 986 gramm. Elfogadjuk-e 95%-os szite az m = 000 hipotézist az m 000 hipotézis elleébe? Mi lee a helyzet, ha a szórás csak 20 gramm lee? Megoldás: A várható értékre tesztelük, és a szórás ismert, tehát u-próbát alkalmazuk. Mivel a H 0 : m = 000 ullhipotézist a H : m 000 elleébe teszteljük, ezért a próba kétoldali. A mita mérete = 25, a ullhipotézisre µ 0 = 000. A próbastatisztika a következő: a ormális eloszlás megfelelő kvatilis pedig u(x) = µ 0 986 000 = 25 =, 4, σ 50 u 0,025 = Φ (0.975) =, 96. Mivel, 96 <, 4 <, 96, így a ullhipotézist elfogadjuk. Ha azoba σ = 20, akkor u(x) = 3, 5 >, 96, így ebbe az esetbe az m 000 hipotézist fogadjuk el. 8. Egy oldat sótartalmát mérjük laborba. 5 mérést végzük, melyek sorá a sótartalomra redre a következő értékek adódtak (gramm/liter): 7.7, 8., 7.7, 7.5, 7.0. Az oldatról előzetese azt állították, sótartalma 7 g/l. Elfogadjuk-e ezt 95%-os szite azo hipotézis elleébe, hogy a sótartalom em 7 g/l? Megoldás: A várható értékre tesztelük, és a szórás ismeretle, tehát t-próbát alkalmazuk. Szükség va az átlagra és a szóráségyzetre: = 7, 6, σ5 µ0 = 0, 36. A statisztika t(x) = s = 3, 75, ezt hasolítjuk össze a t-eloszlás kétoldali 95%-os kvatilisével, amelyek értéke t 0,05 = 2, 78. 3, 75 > 2, 78 miatt 95%-os szite elutasítjuk a µ 0 = 7 ullhipotézist. 9. Megvizsgálták, hogy 0 ember mekkora távot tudott 5 perc alatt lefuti. Ezutá mideki 3 apot diétázott, és így is megmérték a futásteljesítméyt. Azt szereték kiderítei, hogy a diéta befolyásolta-e a futásteljesítméyt. Bizoyítható-e 95%-os szite, hogy a diéta javított a teljesítméye? Diéta előtt 520 830 620 740 970 230 90 2000 980 900 Diéta utá 630 80 700 800 930 200 960 260 2040 970 Megoldás: Két adatsor va, de ugyaazokra az alayokra voatkozik, így egymitás t-próbát alkalmazuk az eltérésekre. Az eltérések: 0-20 80 60-40 -30 50 60 60 70 Itt = 50 és s = 60, 5. A H 0 : µ 0 = 0 hipotézist teszteljük a H : µ 0 > 0 elleébe, így a próba egyoldali. A statisztika t(x) = µ0 s = 50 0 60,5 0 = 2, 6 Ezt hasolítjuk össze az = 9 szabadsági fokú t-eloszlás egyoldali 0, 05-kvatilisével: t 0,05 (9) =, 83. Mivel 2, 6 >, 83, ezért a ullhipotézist elutasítjuk, így 95%-os szite állítható, hogy a diéta javít a futásteljesítméye. 0. Egy gyárba azt vizsgálják, milye módo lehete öveli a mukások termelékeységét. Kétféle módot tesztelek: (A) fizetésemelés, (B) mukakörülméyek javítása. Két külö csoporto tesztelek. Az alábbi két táblázat tartalmazza a termelékeység változását. (A) mukás 2 3 4 5 6 változás. 0.2-0. 2.2.3.3 (B) mukás 2 3 4 5 6 7 8 9 0 változás.3 2.5.2 0.8 0.3.9 3.2 2.4 2.2 3.2 (a) Fogadjuk el vagy utasítsuk el 95%-os szite azt a ullhipotézist, hogy a fizetésemelés em változtatja a termelékeységet.
4 (b) Fogadjuk el vagy utasítsuk el 95%-os szite azt a ullhipotézist, hogy a mukakörülméyek javítása em változtatja a termelékeységet. (c) Fogadjuk el vagy utasítsuk el 95%-os szite azt a ullhipotézist, hogy a mukakörülméyek javítása em öveli jobba a termelékeységet, mit a fizetésemelés. Megoldás: (a) Egymitás, kétoldali t-próbát alkalmazuk. =, s = 0, 72, t(x) = 4, 4 > t 0.05 (5) = 2, 57, így a fizetésemelés szigifikása megváltoztatja a termelékeységet. (b) y =, 9, s y = 0, 93, t(y ) = 6, 4 > t 0.05(9) = 2, 262, így a mukakörülméyek javítása szigifikása megváltoztatja a termelékeységet. (c) Két külöböző csoportról va szó, ezért kétmitás, egyoldali t-próbát alkalmazuk. Az előzőleg kiszámolt értékek alapjá a statisztika ( = 6, 2 = 0): y t(x, Y ) = ( )s 2 + ( 2 )s 2 y 2 ( + 2 2) + 2 = 0, 54, ami kisebb, mit az + 2 2 szabadsági fokú egyoldali kvatilis, melyek értéke t 0,05 (4) =, 78, így a mukakörülméyek javítása em öveli jobba a termelékeységet, mit a fizetésemelés.. Kétféle tápot tesztelek, az egyiket 6 csirké, a másikat pedig 8 (az előzőektől külöböző) csirké. A tesztelésél azt vizsgálják, mekkora a testsúlyövekedés a tápszer élküli állapothoz képest. Az eredméy: A típusú táp csirke 2 3 4 5 6 övekedés 2..2.4 2.2 0.4.7 B típusú táp csirke 2 3 4 5 6 7 8 övekedés.7 2.2..8 2.5 0.9.6.7 Dötsük el kétmitás t-próba segítségével, hogy a két táp hatása egyformáak tekithető-e 95%-os szite. Megoldás: =.5, s = 0.6, y =.69, s y =.38. t(x, Y ) = y ( )s 2 + ( 2 )s 2 y így a két táp hatása egyformáak tekithető. 2 ( + 2 2) + 2 = 0.34 < t 0,05 (6 + 8 2) = 2.8, 2. Amikor az embereket megkérdezik, hogy mekkora a tömegük, gyakra modaak a valóságosál kisebb értékeket. Szereték eldötei az alábbi adathalmazról, hogy igazi mérésből származik, vagy az emberek megkérdezéséből yerték. Azt a téyt fogjuk haszáli, hogy mérés eseté az utolsó számjegyek eloszlásáak egyeletesek kell leie a {0,, 2, 3, 4, 5, 6, 7, 8, 9} halmazo. Dötsük 0, 95 szite arról a hipotézisről, hogy mérésből származak az adatok..) Határozzuk meg H 0 és H hipotéziseket. utolsó számjegy 0 2 3 4 5 6 7 8 9 mérések száma 35 4 4 3 4 24 2 4 8 2 2.) Határozzuk meg a próbastatisztika értékét. Mekkora a szabadságfoka a próbastatisztikáak? 3.) Határozzuk meg a 0,95 szigifikaciaszithez tartozó kritikus értéket a χ 2 eloszlás táblázatából. 4.) Hasolítsuk össze a kritikus értéket és a próbastatisztika értékét, majd dötsük arról, hogy elvetjük-e H 0 -t, vagy em. Megoldás: Illeszkedésviszgálatot végzük. H 0 : a számjegyek eloszlása egyeletes a 0,,...,9 értékek között, H : em egyeletes. = 90 elemű a mita, r = 0 kategória va; a ullhipotézis feállása eseté az egyes kategóriák valószíűsége p = p 2 =... p 0 = /0.
5 Illeszkedésvizsgálathoz a próbastatisztika értéke r (ν i p i ) 2 = 4, 6 p i míg a kritikus érték az r = 9 szabadsági fokú χ 2 -eloszlás 0, 05-kvatilise, ami 6, 7. 4, 6 > 6, 7 miatt elutasítjuk H 0 -t. Tehát 95%-os szite beláttuk, hogy emberek megkérdezéséből jöttek az adatok. 3. Egy tóba háromféle hal él: amur, makréla és poty. Ottó bácsi, az öreg horgász azt súgja ekük, hogy a tóba kétszer ayi a poty, mit a makréla vagy az amur. Kifogtuk 60 halat; dötsük el ez alapjá 95%-os szite, hallgathatuk-e Ottó bácsira. amúr makréla poty 4 35 Megoldás: Illeszkedésvizsgálatot végzük. Ha Ottó bácsiak igaza va, akkor az egyes halak aráya a tóba: p = /4 amur, p 2 = /4 makréla és p 3 = 0, 5 poty. A következő statisztikát számítjuk ki: r (ν i p i ) 2, p i ahol r = 3 a fajták (kategóriák) száma, ν =, ν 2 = 4, ν 3 = 35 az egyes fajtákból kifogott halak száma, = 60 pedig az összes kifogott hal száma. A kokrét számokat behelyettesítve a statisztika értéke, 97, ezt kell tesztelük az r = 2 szabadsági fokú χ 2 eloszlás 95%-os kvatilise elle, amelyek értéke 5, 99. Mivel, 97 < 5, 99, így H 0 -at elfogadjuk, azaz hallgathatuk Ottó bácsira. 4. Azt szereték megtudi, hogy a bukósisak szíe és a baleseti sérülések típusa között va-e összefüggés. Az utóbbi éháy év adatai alapjá a következő táblázatot kaphatjuk: fekete fehér sárga/aracs Kotroll (em sérült) 49 377 3 Balesetes (sérült vagy meghalt) 23 2 8 ε = 0, 05 elsőfajú hibavalószíűséggel dötsük arról a hipotézisről, hogy a csoport (kotroll vagy balesetes) függetle a bukósisak szíétől. Megoldás: Homogeitásvizsgálatot végzük, azaz arra vagyuk kívácsiak, hogy a sérült illetve a em sérült sisakok esetébe ugyaaz-e a szíek eloszlása. A megfelelő statisztika r (ν i / µ i /m) 2 m, ν i + µ i ahol r = 3 a kategóriák száma, ν = 49, ν 2 = 377, ν 3 = 3 illetve µ = 23, µ 2 = 2, µ 3 = 8 az egyes kategóriákba eső megfigyelések száma és = 49 + 377 + 3 = 899 és m = 23 + 2 + 8 = 333 az összes megfigyelések száma. A kokrét példába a statisztika értéke 8, 77, ezt teszteljük az r = 2 szabadsági fokú χ 2 eloszlás 95%-os kvatilise elle, amelyek értéke 5, 99. Mivel 8, 77 > 5, 99, ezért elutasítjuk a ullhipotézist, és a külöböző szíű sisakok em ugyaayira védeek. 5. Egy csavar lehet hibás méret illetve szilárdság alapjá is. Megvizsgáltuk 460 darab csavart. jó méret rossz méret jó szilárdság 46 6 rossz szilárdság 23 5 Dötsük el 95%-os szigifikaciaszite, hogy az, hogy egy csavarak megfelelő-e a szilárdsága illetve a mérete, függetle-e. Megoldás: Függetleségvizsgálatot végzük. A táblázat megfelelő eleme legye ν ij. Ki kell számoluk a peremeloszlásokat: 46 6 432 23 5 28 439 2 = 460 A peremeloszlások: p = 432/460, p 2 = 28/460 illetve q = 439/460, q 2 = 2/460. A statisztika: 2 2 (ν ij p i q j ) 2 = 2, 09, p i q j amit össze kell hasolítauk az (r )(s ) = (r és s az egyik változó, illetve a másik változó kategóriáiak száma, r = 2, s = 2) szabadsági fokú χ 2 eloszlás 95%-os kvatilisével, amelyek értéke 3, 84. Mivel 2, 09 > 3, 84, ezért elutasítjuk a ullhipotézist, azaz a szilárdság illetve a méret em függetleek.