Statisztika. zárthelyi dolgozat 009. március 8.. Ismeretle m várható értékű, szórású ormális eloszlásból a következő hatelemű mitát kaptuk:, 48 3, 3, 83 0,, 3, 97 a) Számítsuk ki a mitaközepet és a tapasztalati szóráségyzetet! 8 pot) b) Tegyük fel, hogy X ormális eloszlású valószíűségi változó, melyek várható értéke az a) feladatba meghatározott mitaközép, szóráségyzete pedig. Határozzuk meg aak valószíűségét, hogy X < 3! 6 pot). Ismeretle b > 0 paraméterű Poisso-eloszlásból származó függetle X, X,..., X mita eseté jelölje X a mitaközepet, s pedig a korrigált tapasztalati szóráségyzetet. Milye 0 < r < számokra igaz, hogy T X, X,..., X ) r X + r) s torzítatla becslése a b paraméterek? pot) 3. Legye X, X,..., X függetle mita a következő diszkrét eloszlásból: P X i ) b, P X i ) 3b, P X i 4) + b, i,,...,, ahol 0 b 6 módszerrel! az ismeretle paraméter. Adjuk becslést a b paraméterre mometum- pot) 4. a > 0 eseté legye az f a x) sűrűségfüggvéy a következő: { a x e ax ha x > 0, f a x) 0 külöbe. Legye X, X,..., X függetle mita az f a x) sűrűségfüggvéyhez tartozó eloszlásból, ahol a > 0 ismeretle paraméter. Határozzuk meg az a paraméter maximum likelihood becslését! pot) Beadható feladat: Legye X, X,... függetle mita az [ a, ] 3a itervallumo egyeletes eloszlásból, ahol a > 0 ismeretle paraméter. Igaz-e, hogy a mitaközép kozisztes becslése az a paraméterek? A megoldásokat idokoli kell, a teljes potszámhoz jó végeredméy és helyes idoklás szükséges. Összese 50 potot lehet eléri, az egyes feladatokért kapható potszámok a feladat szövege mellett szerepelek. A várható pothatárok: 40, 6, 7, 83. Az elégséges határa 0 pot, aki ezt em éri el vagy a dolgozatot em írja meg, szorgalmi időszak utolsó hetébe vagy a vizsgaidőszak első hetébe pótolhatja a dolgozatot. Az eredméyek az ETR ifosheet rovatába leszek elérhetők, a megoldásokat pedig a http://www.cs.elte.hu/ ages/gyak címe lehet majd megtaláli.
Mitaközép/tapasztalati közép: X X + X +... + X ) Tapasztalati szóráségyzet: s Xi X ) Xi X Tapasztalati szórás: s Korrigált tapasztalati szóráségyzet: Szórási együttható: Tapasztalati eloszlásfüggvéy: s Xi X ) Xi X [ ) ] Xi X c s X ˆF t) I X i < t) {i : X i < t} Ha X, X,..., X függetle mita valamely véges szórású eloszlásból, akkor: E X ) EX, D X ) D X ), és E s ) D X ). a > 0 paraméterű expoeciális eloszlás eloszlásfüggvéye: F t) e at, ha t 0, külöbe 0; sűrűségfüggvéye: f t) ae at, ha t 0, külöbe 0; várható értéke: a ; szóráségyzete: a. b > 0 paraméterű Poisso-eloszlás: p k bk k! e b ; várható értéke: b; szóráségyzete: b. [a, b] itervallumo egyeletes eloszlás eloszlásfüggvéye: F t) t a, ha a t b, 0, ha t a, külöbe; b a sűrűségfüggvéye: f t) b a)., ha a t b, 0 külöbe; várható értéke: a+b ; szóráségyzete: b a Biomiális eloszlás és 0 < p < paraméterekkel: p k k) p k p) k ; várható értéke: p; szóráségyzete: p p). N m, σ ) ormális eloszlás sűrűségfüggvéye: f x) πσ exp ); x m) σ várható értéke: m, szóráségyzete: σ. Eloszlásfüggvéy táblázata a lap másik oldalá. 0 < p < paraméterű geometriai eloszlás: p k p) k p; várható értéke: p, szóráségyzete:. p p
Megoldások. a) Legye a mita X, X,..., X 6, ekkor a mitaközép: X 6 X + X +... + X 6 ), 48 + 3, 3 +, 83 + 0, +, 3 +, 97). 6 A tapasztalati szóráségyzet: s 6 6 Xi X, 48 + 3, 3 +, 83 + 0, +, 3 +, 97 ), 604. 6 b) Az előző szerit tehát X N, ), azaz X ormális eloszlású várható értékkel és szórással. Ekkor az X valószíűségi változó ormális eloszlású 0 várható értékkel és szórással, azaz eloszlása stadard ormális, így P X < 3) P X < ) Φ ) 0, 843 a stadard ormális eloszlásfüggvéy táblázata alapjá.. Gyakorlato szerepelt, hogy tetszőleges véges szórású eloszlásból származó X,..., X függetle mita eseté a mitaközép várható értéke E X ), a korrigált tapasztalati szóráségyzet várható értéke pedig D X ). A Poisso-eloszlás tetszőleges b > 0 paraméter mellett véges szórású, így alkalmazhatjuk ezeket az összefüggéseket. Felhaszálva még a várható érték liearitását, azt kapjuk, hogy mide b > 0-ra E b r X + r) s ) ) ) r Eb X + r) Eb s r Eb X ) + r) Db X ). b paraméterű Poisso-eloszlás várható értéke és szóráségyzete is b, tehát a b paraméter mellett X várható értéke és szóráségyzete is b. Azaz E b T X,..., X )) r E b X ) + r) Db X ) r b + r) b b. ) Tehát mide 0 < r < számra mide b > 0 paraméterre E b r X + r) s b, azaz mide 0 < r < számra r X + r) s torzítatla becslése a b paraméterek. 3. Egyetle paramétert kell becsülük, így haszáljuk az első mometumot, a várható értéket. A várható érték defiíciója szerit tetszőleges i,,..., -re E X i ) P X i ) + P X i ) + 4 P X i 4) ) ) b + 3b + 4 + b b + 6b + + 8b 3 + 3b. A tapasztalati eloszlás várható értéke a mitaközép. Tehát a b paraméter mometum-módszerrel kapott becslése az a b szám lesz, melyre Átredezve adódik a b becslése: X E X ) 3 + 3b. X 3 ˆb. 3 4. Mivel adott a sűrűségfüggvéy, folytoos eloszlások családjáról va szó, így a likelihood-függvéyt úgy kapjuk, hogy az egyes mitaelemeket behelyettesítjük az adott paraméterhez tartozó sűrűségfüggvéybe, és ezeket összeszorozzuk. A paraméter mide értékére a egatív számoko a sűrűségfüggvéy ulla, így valószíűséggel mide mitaelem pozitív, vagyis: f a) f a X i ) a X i e ax ) i.
A maximum likelihood becslés az az a > 0 szám lesz, melyre f a) maximális. f a) mide a-ra pozitív, és a logaritmusfüggvéy mooto övő, így elég a log-likelihood függvéyt maximalizáli. A log-likelihood függvéy a likelihood függvéy logaritmusa, szorzat logaritmusa pedig a logaritmusok összege: l a) log a X i e ax ) i log a ) + log X i ax i log a + log X i a X i. Ez a-ak folytoosa differeciálható függvéye. Ha a 0+, akkor az első tag -hez tart, a második kostas, a harmadik ullához tart, azaz ilyekor l a). Ha a, akkor az első tag végtelehez tart logaritmikusa, a második tag kostas, a harmadik tag -hez tart lieárisa, így ilyekor l a). Midezekből következik, hogy l a)-ak va maximuma, és ott a deriváltja ulla. Tekitsük tehát a log-likelihood egyeletet: l a) 0, azaz a X i 0. P X i Eek egyetle megoldása va, amit átredezéssel kaphatuk meg: a. Tehát ez az X a maximalizálja a log-likelihood és likelihood függvéyeket, azaz a maximum likelihood becslése: â X i X.
Statisztika. zárthelyi dolgozat 8) 009. május 6.. A strado figyeljük, hogy ki meyi időt tölt a tóba fürdéssel, és feltételezzük, hogy az egyes emberek vízbe töltött ideje egymástól függetle, eloszlásuk pedig a következő sűrűségfüggvéyel adható meg: f x) a3 x e ax, ha x > 0, és 0 külöbe, ahol a > 0 ismeretle paraméter. Számítsuk ki ember vízbe töltött idejéek megfigyeléséből adódó Fisher-iformációt. Ehhez felhaszálhatjuk, hogy a fet megadott eloszlás várható értéke 3, szóráségyzete 3. 9 pot) a a. Az Esterházy-kastélyba piheő vedégek szokásait szereték feltérképezi. Feltételezésük, hogy a vedégek egymástól függetleül p /4 valószíűséggel töltik alvással a délutát. Megkérdezük 0 véletleszerűe kiválasztott vedéget, és ha közülük legalább 9-e szoktak délutá aludi, akkor elvetjük a ullhipotézisüket, külöbe elfogadjuk. Számítsuk ki az elsőfajú hiba valószíűségét! 9 pot) 3. A közeli település híres picéiek egyikébe szürkebarát és olaszrizlig borokat vizsgáltak. Midkét fajtából 7-7 pohárba megmérték a cukortartalmat, g/l-be kifejezve a következő értékek adódtak: szürkebarát 3,,5 3,0 4,0 3,5,6 3,4 olaszrizlig 3,6,7,3,9 3,4,8,0 Legye ullhipotézisük az, hogy a kétféle bor átlagos cukortartalma megegyezik, ellehipotézisük az, hogy a szürkebaráté agyobb. Ezt a feladatot vizsgálva α 0, 03 terjedelem mellett dötsük arról a feltételezésről, hogy az olaszrizlig em édesebb a szürkebarátál! 9 pot) 4. A parto a ádas átlagos magasságát vizsgálták. 5 szálat véletleszerűe kiválasztottak, ezek vízszit feletti magassága méterbe:,43,55,58,64,44 α 0, 05 terjedelem mellett elfogadható-e az a feltételezés, hogy az átlagos magasság legfeljebb másfél méter? 9 pot) 5. A XIII. századba alapított vár köveit vizsgálták szíük és állapotuk szerit. Világos kőből 05-t, sötétből 9-t találtak. A világosak közül 6, a sötétek közül 48 volt ép, a többi sérült. a) α 0, 0 terjedelem mellett elfogadható-e, hogy a szí és az állapot egymástól függetle? b) α 0, 0 terjedelem mellett elfogadható-e a következő feltételezés: a szí és az állapot egymástól függetle, mide kő / / valószíűséggel sötét vagy világos, és szité / / valószíűséggel ép vagy sérült? 4 pot) A megoldásokat idokoli kell, a teljes potszámhoz jó végeredméy és helyes idoklás szükséges. Összese 50 potot lehet eléri, az egyes feladatokért kapható potszámok a feladat szövege mellett szerepelek. A várható pothatárok: 40, 6, 7, 83. Az elégséges határa 0 pot, aki ezt em éri el vagy a dolgozatot em írja meg, szorgalmi időszak utolsó hetébe vagy a vizsgaidőszak első hetébe pótolhatja a dolgozatot, eek időpotját később egyeztetjük, erről a kurzusfórumba lehet elolvasi. Az eredméyek és a megajálott jegyek az ETR ifosheet rovatába leszek elérhetők, a megoldásokat pedig a http://www.cs.elte.hu/ ages/gyak címe lehet majd megtaláli.
Statisztika. zárthelyi dolgozat, megoldások 009. május 6.. A megfigyeléseket jelölje X,..., X, ezek tehát függetle, azoos eloszlású valószíűségi változók a megadott sűrűségfüggvéyel. Folytoos eloszlásokról va szó, hisze létezik sűrűségfüggvéy, így elemű mitából számolva a likelihood-függvéy: f a) f X i ) [ ] a3 Xi e ax i Eek logaritmusa a log-likelihood függvéy: l a) log Az a paraméter szerit deriválva: ) + 3 log a + log ) a 3 d da l a) 3 a X i. X i ) a X i ) X i. e P ax i. A Fisher-iformációt megkaphatjuk úgy, hogy eek a meyiségek kiszámítjuk a szóráségyzetét az a paraméterhez tartozó sűrűségfüggvéyel kapható mitából. Az első tag kostas, véletletől em függ, így levova a szóráségyzet em változik. -gyel szorozva sem változik a szóráségyzet. Tehát függetle valószíűségi változók összegéek szóráségyzete jeleik meg, ez a szóráségyzetek összege, most D X ) -szerese, hisze azoos eloszlású valószíűségi változókról va szó. A feladatba szerepel, hogy az a-hoz tartozó eloszlás szóráségyzete 3/a, így ez lesz X szóráségyzete is. Összefoglalva: I a) D a ) d da l a) Da 3 ) ) a X i Da X i Da X i ) Da X ) 3 a.. Nullhipotézisük, hogy mide vedég egymástól függetleül p valószíűséggel alszik délutá. Az elsőfajú hiba a ullhipotézis melletti valószíűsége aak, hogy hibás dötést hozuk, azaz elvetjük a ullhipotézist. A ullhipotézist akkor vetjük el, ha a tíz megkérdezett ember közül leglább kilece alszaak délutá. Az elsőfajú hiba valószíűsége tehát aak valószíűsége, hogy tíz ember közül legalább kilece alszaak délutá, feltételezve, hogy mideki egymástól függetleül p valószíűséggel alszik délutá. A biomiális eloszlás megfelelő tagjaiból adódik eek értéke: p 0 + 0 p 9 p). Az első tag ugyais aak valószíűsége, hogy mid a tíze alszaak, a második aak, hogy potosa kilece alszaak, tehát az összeg adja az elsőfajú hiba valószíűségét. p /3-ra ez körülbelül 3, 56 0 4, p /4-re körülbelül, 96 0 5. 3. Feltételezzük, hogy az egyes borok cukortartalma ormális eloszlású, és a szórások megegyezek. A szürkebarát cukortartalmáak eloszlása N m, σ), az olaszrizligéek pedig N m, σ). Ezekkel a jelölésekkel: H 0 : m m H : m > m
Tehát a hipotézisvizsgálati feladat ormális eloszlások várható értékéek összehasolításáról szól, a szórások em ismertek, de egyelőek feltételezhetők, továbbá feltételezhetjük, hogy két függetle mitával va dolguk. Ezért kétmitás t-próbát végzük. Kiszámítjuk a próbastatisztikát: m m + ) X Y t m + ) s X) + m ) s m Y ). Eek értéke a külöböző adatsorokra külöböző. A próbastatisztika eloszlása H 0 mellett +m szabadságfokú t-eloszlás, ahol és m az egyes miták elemszáma, azaz m 7, a szabadságfok pedig. Tehát a kritikus érték szabadságfokú t-eloszláshoz és α 0, 05 terjedelemhez tartozó egyoldali kritikus érték: c krit, 78. Tehát a próbák a következő: Ha t, 78, akkor elfogadjuk H 0 -t, és ezt úgy értelmezzük, hogy vagy az olaszrizlig legalább olya édes, mit a szürkebarát, vagy ics elég adatuk ahhoz, hogy ezt megcáfoljuk. Ha t >, 78, akkor elvetjük H 0 -t, és ezt úgy értelmezzük, hogy statisztikai bizoyítékot yertük arra, hogy a szürkebarát édesebb az olaszrizligél. 4. Feltételezzük, hogy a ádszálak magassága N m, σ) eloszlású. A következő feladatot vizsgáljuk: H 0 : m, 5 H : m >, 5 Normális eloszlás várható értékről szól a hipotézisvizsgálati feladat, és a szórás em ismert, ezért egymitás t-próbát végzük. Kiszámítjuk a próbastatisztikát: t X m 0. s H 0 mellett a próbastatisztika szabadságfokú t-eloszlás, ahol a mita elemszáma, azaz 5. Egyoldali ellehipotéziük va, ezért a kritikus érték a 4 szabadságfokú t-eloszláshoz és α 0, 05 terjedelmhez tartozó egyoldali kritikus érték: c krit, 3. A próbák a következő: Ha t, 3, akkor elfogadjuk H 0 -t, azaz elfogadható az a feltételezés, hogy a ádas átlagos magassága legfeljebb másfél méter. Ha t >, 3, akkor elvetjük H 0 -t, és statisztikai bizoyítékuk va arra, hogy a ádas átlagos magassága több másfél méterél, a feltételezés em fogadható el. 5. a) Az adatokat az alábbi táblázatba foglalhatjuk össze: ép sérült összese világos 6 44 05 sötét 48 43 9 összese 09 87 96 Függetleségvizsgálatot végzük, a ullhipotézis az, hogy a két szempot szeriti osztályozás egymástól függetle, ellehipotézis, hogy em függetle. Végezhetük χ -próbát osztályok összevoása élkül, mert mide osztályba esik legalább 5 megfigyelés. Midkét
szempot szerit két osztály va, r s, és így a próbastatisztika az órá haszált jelölésekkel: ν ν ν ν ) 6 43 44 48) 96 0, 565. ν ν ν ν 05 9 09 87 A kritikus érték az szabadságfokú χ -próbához tartozó kritikus érték, α 0, terjedelem mellett,7, α 0, 05 terjedelem mellett 3,84, végül α 0, 0 terjedelem mellett 6,63. Midhárom esetbe χ < c krit, ezért elfogadjuk a ullhipotézist, azaz elfogadható az a feltételezés, hogy a szí és állapot szeriti osztályozás egymástól függetle, az adatok ezt em cáfolják. b) A köveket égy osztályba sorolták: ép és világos ép és sötét sérült és világos sérült és sötét darab 6 48 44 43 A következő feltételezést vizsgáljuk: a szí és az állapot egymástól függetle, mide kő / / valószíűséggel sötét vagy világos, és szité / / valószíűséggel ép vagy sérült. Ezek együttese azt jeletik, hogy mide kő a égy osztály midegyikébe /4 /4 valószíűséggel esik, tehát illeszkedésvizsgálatot végzük, a ullhipotézis, hogy mide osztályba /4 valószíűséggel esek a kövek, az ellehipotézis, hogy az eloszlás ettől külöböző. Most sem kell osztályokat összevoi. A próbastatisztika: r ν i p i ) p i 6 49) 49 + 48 49) 49 + 44 49) 49 + 43 49) 49, 05. r az osztályok száma, azaz 4, így az r 3 szabadságfokú χ -eloszlás kritikus értékét kell megkeresük. α 0, terjedelem mellett 6,5, α 0, 05 terjedelem mellett 7,8, végül α 0, 0 terjedelem mellett,3. Midhárom esetbe χ < c krit, ezért elfogadjuk a ullhipotézist, azaz elfogadható a feti feltételezés, az adatok ezt em cáfolják.
Mitaközép/tapasztalati közép: X X + X +... + X ) Tapasztalati szóráségyzet: s Xi X ) Xi X Tapasztalati szórás: s Korrigált tapasztalati szóráségyzet: s Xi X ) Xi X [ ) ] Xi X X,..., X függetle mita eseté a likelihood-függvéy: f θ) f θ X i ), ha a mita folytoos eloszlásból származik, és f θ x) a θ paraméterhez tartozó sűrűségfüggvéy; f θ) P θ ξ X i ), ha a mita diszkrét eloszlásból származik, ahol ξ eloszlása megegyzik X eloszlásával, és függetle a mitától. A log-likelihood függvéy: l θ) log f θ). [ ] A mita Fisher-iformációja: I θ) E d θ l θ)) D d dθ θ l θ)) megfelelő feltételek mellett. dθ Megfelelő regularitási feltételek mellett elemű függetle mita Fisher-iformációja az egyelemű mita Fisher-iformációjáak -szerese. N m, σ) ormális eloszlásból származó X,..., X függetle mita eseté legye u y olya, hogy Φ u y ) y. Ekkor ) σ σ P X u α m X + u α α. X, X,..., X, Y, Y,..., Y m függetle ormális eloszlású miták u-próba Egymitás esetbe H 0 : m m 0 ullhipotézis mellett u X m 0 σ Kétmitás esetbe H 0 : m m ullhipotézis mellett t-próba u X Y σ + σ m Egymitás esetbe H 0 : m m 0 ullhipotézis mellett t X m 0 s N 0, ). N 0, ). t. Kétmitás esetbe H 0 : m m ullhipotézis mellett m m + ) X Y t m + ) s X) + m ) s m Y ) t +m.
F -próba H 0 : σ σ ullhipotézis mellett χ -próbák Illeszkedésvizsgálat F s X) s m Y ) F,m. A, A,..., A r teljes eseméyredszer, p i adott számok, ν i az A i gyakorisága elemű mitából H 0 : mide i-re P A i ) p i Ekkor H 0 mellett r ν i p i ) Becsléses illeszkedésvizsgálat H 0 mellett r ν i ˆp i ) ahol s a becsült paraméterek száma Homogeitásvizsgálat p i χ r eloszlásba, ha. ˆp i χ r s eloszlásba, ha, ν i illetve µ i az i. osztály gyakorisága az egyes mitákba. H 0 mellett m r ν i / µ i /m) ν i + µ i χ r eloszlásba, ha. Függetleségvizsgálat H 0 mellett i,j νij ν ) i ν j χ r )s ) eloszlásba, ha. ν i ν j r s -re A χ -próba kritikus értékei ν ν ν ν ) ν ν ν ν χ f 0, 0,05 0,0,7 3,84 6,63 4,6 5,99 9, 3 6,5 7,8,3 4 7,78 9,49 3,3 5 9,4, 5, 6 0,6,6 6,8 7,0 4, 8,5 8 3,4 5,5 0, 9 4,7 6,9,7