Matematikai statisztika elıadás, földtudományi BSc (geológus szakirány) 2014/2015 2. félév 6. elıadás
Konfidencia intervallum Def.: 1-α megbízhatóságú konfidencia intervallum: Olyan intervallum, mely legalább 1-α valószínőséggel tartalmazza a keresett paramétert. P ( T ( ) T ( )) 1, < < Θ ξ ξ ϑ α ϑ ϑ 1 2
Példa (normális eloszlás) A Gyorskenyér Kft automata kenyérsütı készülékei egyszerre 100 kenyeret sütnek ki. Ezek tömegei grammban mérve N(m,10 2 ) eloszlással közelíthetıek, ahol m a kezelı beállításától függ. Egy ellenırzésnél megmérték mind a 100 kenyér tömegét. Az átlag 990 g volt. Készítsünk 95%-os megbízhatóságú konfidencia intervallumot m-re!
Konfidencia intervallum normális eloszlás várható értékére (ismert szórás esetén) ξ ξ σ σ 1 2,..., ~ N ( m, ), ismert, Φ ( u ) = y n y σ σ P ξ u < m < ξ + u 1 α, 1 α 1 α = 2 n 2 n σ ξ α P m > u = 1, 1 α n σ P m < ξ + u = 1 α 1 α n
Konfidencia intervallum várható értékre (ismert szórás esetén) ξ 2 2 1,..., ξ n, E ξ i = m, D ξ i = σ, σ ismert 1 σ 1 σ P ξ < m < ξ + 1 α. α n α n α 1 u 1 α 2 α 10% 1,64 3,16 5% 1,96 4,47 2,50% 2,24 6,32 1% 2,58 10,00
Konfidencia intervallum sok megfigyelés esetén ξ ξ ξ = σ 1 2 2,..., n, D i ismert σ σ P ξ u m u ~ 1. 1 α < < ξ + α 1 α 2 n 2 n
Példák (milyen valószínőséggel születik fiúgyermek?) Svájcban 1871 és 1900 között a 2.644.757 megszületett gyermekbıl 1.359.671 fiú és 1.285.086 lány volt. Fiúk relatív gyakorisága így 0,5141. 1 p (1 p ) 4 u u P ξ < p < ξ + ~ 2 Φ ( u ) 1 2 n 2 n Esetünkben 0,9973 valószínőséggel 0,5132 p 0,5150
Konfidencia intervallum normális eloszlás várható értékére (ismeretlen szórás esetén) Ha a szórás nem ismert, becsüljük Tétel (biz. nélkül): normális eloszlású minta esetén a mintaátlag és a tapasztalati szórás független n-1 szabadságfokú t (Student) eloszlás: X 0, X X X n ( ) X +... + X 2 2 1 1,..., 0 független n / n ~ t n N (01),
Konfidencia intervallum normális eloszlás várható értékére (ismeretlen szórás esetén) (folyt.) 2 2 1 1 ( ξ ) n 1 n 1, y ( ( ) 2 ( ) 2 ) ξ,..., ξ ~ N ( m, σ ), ɶ σ = ξ ξ +... + ξ ξ / ( n 1) n n n m ~ t 2 n 1 ɶ σ P ( t < t ) = y ɶ σ ɶ σ P ξ t m t 1, n 1,1 α < < ξ + n 1,1 α α = 2 n 2 n ɶ σ P m > ξ t n 1,1 α = 1 α, n ɶ σ P m < ξ + t n 1,1 α = 1 α n
Példa (kenyér. folyt.) Tegyük fel most, hogy nem ismerjük Gyorskenyér Kft kenyereinek szórását. Az átlag 990 g volt. Ismert 10 szórásnál 991,6 g volt a 95%- os megbízhatóságú felsı konfidencia határ. Amennyiben a korrigált tapasztalati szórás is 10, akkor ez a határ csak kis mértékben változik (991,8 g). Azonban 50-es korrigált tapasztalati szórásnál ez az érték 999 g-ra változik.
u és t együtthatók összehasonlítása 1 5% 1,64 ( (1,64) 95%) u = Φ = n t n 1,1 5% 2 6,31 3 2,92 4 2,35 5 2,13 10 1,83 20 1,73 50 1,68 100 1,66 1000 1,65
Mindenhol azt olvasni, hogy a napi/heti/havi bad beat nem számít, sokkal fontosabb a hosszútáv, amikor a matematikai esély érvényesül. Jelenlegi eredményeink mennyire reálisak? Mikor ésszerőbb inkább felhagyni a pókerrel? Mikor lehetünk optimisták? Mekkora játékszám szükséges ennek megállapítására? Most bemutatok egy idevágó táblázatot, amely 95% pontossággal megadja a jelenlegi játékszámod és nyerési %-od alapján, hogy a jelen eredményeid mennyire lehetnek valósak. (Pl. Ha 60%-os vagy 100 játék után, akkor a valós nyerési százalékod igen nagy (95%-os) valószínőséggel 50,4-69,6% között van.) Igaz, csak három - 50-55- 60 %-os - mutatóval dolgozik, de attól még igencsak hasznos a jövıbeni tervek megalapozottságához. http://www.pokerakademia.com/poker_blogok/hideyoshi/mi_szamit_hosszutavnak_a_hu_sng_ban/ A táblázat helyességét nem ellenıriztem! /AM/
After polling 1000 eligible voters, the Star-Tribune Newspaper reported that 55% of Americans would vote for James Bean and 45% for John F Daniels +/- 3%.
Hipotézisvizsgálat H 0 nullhipotézis (jelezni akarjuk, ha nem igaz) H 1 ellenhipotézis Gyakran paraméterekkel fogalmazzuk meg: H : ϑ Θ 0 0 H : ϑ Θ 1 1 Θ Θ = Θ 0 1
Példák Igaz-e, hogy 0,5 valószínőséggel születik fiúgyermek? H 0 : 0,5 valószínőséggel születik fiúgyermek H 1 : nem 0,5 valószínőséggel születik fiúgyermek H : p = 0,5 0 H : p 0,5 1
Kárszám Vezetık száma Példák (folyt.) Mi lehet egy vezetı által okozott károk számának eloszlása? H 0 : a kárszám Poisson eloszlású H 1 : a kárszám nem Poisson eloszlású 0 1 2 3 4 5 6 7 >7 Összesen 129524 16267 1966 211 31 5 1 1 0 148006
Ki tanul jobban? 2009. január 5-ei vizsga H 0 : A nık jobban tanulnak Jegy Férfi Nı Összesen 1 47 4 51 2 11 1 12 3 11 2 13 4 9 2 11 5 8 2 10 Összesen 86 11 97 Átlag 2,1 2,7 2,1
Lehetséges hibák Elsıfajú hiba: H 0 igaz, de elutasítjuk Másodfajú hiba: H 0 hamis, de elfogadjuk Döntésünknek a megfigyelésektıl kell függnie. Mintateret 2 részre osztjuk: elfogadási és elutasítási tartományra.
Alapfogalmak Emlékeztetı: mintatér: a minta lehetséges értékeinek halmaza. X e U X k X k : azon lehetséges értékek halmaza, amelyek megfigyelése esetén elutasítjuk a nullhipotézist. Gyakran statisztika segítségével határozzuk meg: T ( x ) = 1, 0, x X x X k k
Döntés: Lehetséges hibák Elsıfajú hiba: H 0 igaz, de elutasítjuk Másodfajú hiba: H 0 hamis, de elfogadjuk Aktuális helyzet A nullhipotézis igaz A nullhipotézis hamis Elfogadjuk a nullhipotézist Helyes döntés Másodfajú hiba Elutasítjuk a nullhipotézist Elsıfajú hiba Helyes döntés
Alapfogalmak Emlékeztetı: X mintatér: a minta lehetséges értékeinek halmaza. X = X e U X k X k : azon lehetséges értékek halmaza, amelyek megfigyelése esetén elutasítjuk a nullhipotézist. Gyakran statisztika segítségével határozzuk meg: T ( x ) = 1, 0, x X x X k k
Elsıfajú hiba valószínősége α a próba terjedelme, ha minden ϑ Θ -ra P ϑ ( ) 0 X α a próba szignifikanciaszintje (másképp: a próba pontos terjedelme), sup P ξ X = ϑ Θ ξ ϑ k α ( ) k α 0
Példa (egyetlen megfigyelés) H 0 : a megfigyelés N(4,1) eloszlású
Példa (sörök megkülönböztetése) Ki tudják-e választani a különbözı sört? 24 emberen kísérleteztek. H : p = 1, H : p > 1 0 3 1 3
Az eloszlás H 0 esetén
Kritikus tartomány megválasztása
Másodfajú hiba valószínősége ( ξ X ), Θ e 1 P ϑ ϑ
Példa (sörös) p=0.5 esetén a másodfajú hiba valószínősége
Erıfüggvény A próba erıfüggvénye β ( ϑ )= P ϑ ξ X = 1- P ϑ ξ X, ϑ Θ ( ) ( ) k e 1
U-próba ξ 1 ξ n N m σ m σ H : m = m 2,..., ~ (, ), ismeretlen, ismert. 0 0 H : m m (kétoldali ellenhipotézis) 1 0 H ': m < m (egyoldali ellenhipotézis) 1 0 H '': m > m (egyoldali ellenhipotézis) 1 0 0 U = n σ H U ~ N (0,1) 0 ξ m m m 0 H 1 U ~ N n,1 σ
U próba (kétoldali ellenhipotézis) Φ ( u ) = y y x m 0 x n u 1 α σ 2 X k = : ( ) ( ) ( ) ( ) ξ X 1 1 α 1 α 1 α P = P U u = Φ u + Φ u = m k m 0 0 ( ) ( ) α α α = 1 1 + 1 1 =. 2 2 2 2 2 ( ) ( ) ξ 1 α β ( m ) = P X = P U u = m k m ( ) 2 ξ m m m 0 1 P m u 1 1 α < U < u P 1 α = m u n n u 1 α < + < 1 α = 2 2 2 σ σ 2 m m 0 ξ m m m 0 1 P m u 1 α n < n < u n 1 α = 2 2 σ σ σ 1 m m 0 m m 0 Φ u n u n 1, m m 1 α + Φ 2 1 α 2 n σ σ 0