u- t- Matematikai statisztika Gazdaságinformatikus MSc 2. előadás 2018. szeptember 10. 1/58
u- t- 2/58
eloszlás eloszlás m várható értékkel, σ szórással N(m, σ) Sűrűségfüggvénye: f (x) = 1 e (x m)2 2σ 2 2πσ u- t- 3/58
χ 2 -eloszlás u- t- X 1,..., X n standard normális (N(0, 1)), teljesen független valváltozók. Ekkor n i=1 X 2 i n szabadságfokú χ 2 n eloszlást követ. χ 2 n sűrűségfüggvénye: f (x) = 1 2 n 2 Γ( n 2 )e x 2 x n 2 1, x > 0, ahol Γ(s) = 0 e t t s 1 dt az ún. gamma-függvény. 4/58
χ 2 -eloszlás - eloszlás- és sűrűségfgv. u- t- 5/58
χ 2 -eloszlás u- t- Ha V = (V 1, V 2,..., V r ) T egy n, p 1, p 2,..., p r paraméterű polinomiális eloszlású valószínűségi vektorváltozó, akkor r i=1 V i np i np i e χ 2 r 1 (n ) Ezen alapulnak a χ 2 - (köv. előadás). 6/58
Student-(vagy t-)eloszlás u- t- X 1,..., X n és Y standard normális, teljesen független valváltozók. Ekkor Y n X 2 i=1 i n n szabadságfokú Student vagy t n -eloszlást követ. (ún. Lukács tétel következménye.) Sűrűségfüggvénye: f (x) = n+1 Γ( 2 ) Ç å n+1 1 1 2 n Γ( 1 2 )Γ( n 2 ), x R 1 + x 2 n 7/58
Student eloszlás u- t- 8/58
Eloszlások - F-eloszlás u- t- Ha X χ 2 n-eloszlású és Y tőle független χ 2 k-eloszlás, akkor Z = X n Y k n, k paraméterű F n,k -(Fisher)-eloszlás. Sűrűségfüggvénye: f (x) = Γ( n+k 2 ) Γ(n)Γ(k) x k 2 1 (k + nx) k+n 2, x > 0 9/58
F-eloszlás u- t- 10/58
Intervallumbecslés u- t- Legyen X 1,..., X n statisztikai minta az ismeretlen várható értékű (m) és ismeretlen szórású (σ) normális eloszlás várható értékére. X n m n tn 1 sn Legyen t krit a ε szignifikanciaszinthez tartozó kritikus érték, azaz P( t n 1 t krit ) = 1 ε. Tehát P( t krit X n m n tkrit sn ) = P(X n t kritsn n m X n + t kritsn ) n T 1 = X n t krits n n, T 2 = X n + t krits n n 11/58
u- t- 12/58
Bevezető példa u- t- Feladat. Egy autógyár azt álĺıtja, hogy egyik modelljének a fogyasztása városban 5, 4 l 100 kilométerként, 0, 2 l szórással. Ám fölmerült a gyanú, hogy ez nincs így és ezért a vásárlók panaszt tettek. Az egyik vásárló a bírósághoz fordult az ügy tisztázásának érdekében, és azzal vádolja az autógyárat, hogy hamis adatokat tüntettek fel a modellek leírásban. A bíróság elrendeli, hogy egy független szakértői csoport mérje meg a kocsik fogyasztását egy 150 elemű statisztikai mintán. Tudjuk, hogy a fogyasztási adatok az átlag körül fognak normális eloszlással elhelyezkedni. (Nagy mintánál ez nagyjából igaz, még ha az eloszlás nem normális, akkor is.) 13/58
Bevezető példa u- t- Fogyasztó: Ha a mérési eredmények átlagai olyan (5,4 l-re szimmetrikus) tartományba esnek, ahova az 5,4 l várható értékű, 0,2 l szórással rendelkező modellek fogyasztása esik 0,9 valószínűséggel, akkor elfogadom, hogy helyesek az autógyár adatai. (Így 0,1 valószínűséggel történhet meg, hogy igazak az adatok, mégis eĺıtélik az autógyárat.) Autógyár: Szerintem ez túl magas (a 0,1), válasszunk úgy tartományt, hogy az igazságtalan eĺıtélés valószínűségét csökkentsük le 0,01-re! 14/58
Bevezető példa u- t- Fogyasztó: De ebben az esetben megnő annak a valószínűsége, hogy rossz fogyasztási adatok esetén is felmentik az autógyárat! Bíróság: Legyen 0,05! Mi lett a vége?? FONTOS. Itt nem arról van szó, hogy a begyűjtött minták alapján akarjuk a paramétert becsülni, hanem tesztelni akarunk egy hipotézist. 15/58
Általános bevezető - matematikai modell u- t- Vannak eloszlásaink, amiket θ konkretizál: {F (x, θ) : θ Θ}. Θ = Θ 0 Θ 1 (Θ 0 Θ 1 = ) H 0 : θ Θ 0 nullhipotézis H 1 : θ Θ 0 Döntési eljárást dolgozunk ki annak eldöntésére, hogy a nullhipotézis igaz-e. Ha úgy kell döntenünk, hogy a nullhipotézis nem igaz, automatikusan az alternatív hipotézist fogjuk elfogadni. A döntésünkhöz szignifikancia szintet fogunk rendelni, amivel jellemezzük, hogy a nullhipotézisünk melletti döntés milyen erős. 16/58
Általános bevezető - megoldás leírása u- t- X 1,..., X n statisztikai minta Legyen T n (X 1,..., X n ) próbastatisztika, hogy minden ε > 0-hoz megadhatóak K 1 (ε) és K 2 (ε) számok, hogy minden θ Θ 0 esetén P(K 1 (ε) < T n < K 2 (ε)) > 1 ε. 17/58
Általános bevezető u- t- Legyen x a mintarealizáció. Elfogadási tartomány. (ε szignifikanciaszinten): X elf = {x R n : K 1 (ε) < T n (x) < K 2 (ε)} Kritikus tartomány. X krit = R n \ X elf DÖNTÉS. Ha x X elf, akkor elfogadjuk H 0 -t az ε szignifikanciaszinten. 18/58
Általános bevezető - konkrét lépések u- t- 0. Van egy feladat, amihez tartozik egy próbastatisztika. 1. Megválasztom a szignifikanciaszintet. 2. Táblázatból kikeresem a szignifikanciaszinthez tartozó kritikus értékeket. 3. Kiszámolom a próbastatisztikát a mintára. 4. Összehasonĺıtom a próbastatisztika értékét a kritikus értékével és döntök. 19/58
Általános bevezető - elkövethető hibák H 0 -t elfogadjuk H 0 -t elvetjük u- t- H 0 igaz Helyes döntés Elsőfajú hiba H 0 nem igaz Másodfajú hiba Helyes döntés Elsőfajű hiba valószínűsége: p 1 (n, ε, θ) ez mi álĺıtjuk be. Másodfajú hiba valószínűsége: p 2 (n, ε, θ) ez nehezebben meghatározható. 20/58
Általános bevezető u- t- 21/58
Általános bevezető u- t- 22/58
Általános bevezető u- t- 23/58
Általános bevezető u- t- az elsőfajú hibát 5-10%-ra választjuk az a jó, ha a másodfajú hiba valószínűsége max. 20% (kísérlettervező felelőssége) 24/58
u- t-. A ban közös lesz, hogy az elemzett minta eloszlása normális eloszlást követ. A hipotézisek, amiket vizsgálunk a normális eloszlás paramétereivel kapcsolatosak. eloszlás várható értékéről: egy/kétmintás u-próba egy/két/párosmintás t-próba Welch-próba eloszlás szórásáról: F-próba 25/58
Egymintás u-próba - kétoldali ellenhipotézis u- t- Probléma: X 1,..., X n normális eloszlású mintának ismerjük a szórását (σ 0 ). H 0 : m X = m 0. H 1 : m X m 0 Próbastatisztika. u = X n m 0 n σ 0 26/58
Egymintás u-próba - kétoldali ellenhipotézis esetén u- t- Ha H 0 igaz, akkor X n m 0 σ 0 n N(0, 1). Legyen u krit olyan, hogy P( N(0, 1) < u krit ) = 1 ε. P( N(0, 1) < u krit ) = P( u krit < N(0, 1) < u krit ) = Φ(u krit ) Φ( u krit ) = 2Φ(u krit ) 1 = 1 ε. Tehát Φ(u krit ) = 1 ε 2. DÖNTÉS: Ha u proba u krit elfogadjuk H 0 -t ε szignifikanciaszinten. 27/58
Egymintás u-próba - Kritikus értékek u- t- 0,1 szignifikanciaszint: Φ(1,28) = 0,9; Φ(1,64) = 0,95 0,05 szignifikanciaszint: Φ(1,64) = 0,95; Φ(1,96) = 0,975 28/58
Egymintás u-próba - első- és másodfajú hiba p 1 (ε, n) = P m0 ( u(x) u krit ) = 1 P m0 ( u krit u(x) u krit ) = 1 (Φ(u krit ) Φ( u krit )) = 2 Φ(u krit ) = ε. u- t- p 2 (ε, n, m) = P m ( u krit u(x) u krit ) = P m ( u krit Xn m0 σ 0 n ukrit ) = P m ( u krit m m0 σ 0 n X n m σ 0 n ukrit m m0 σ 0 n) = Φ( u krit m m0 σ 0 n) Φ(ukrit m m0 σ 0 n). Ugyanis most Xn m σ 0 N(0, 1) 29/58
Egymintás u-próba - Erőfüggvény, tulajdonságok u- t- Egy próba erőfüggvénye= 1 p 2 (ε, n, m) = 1 Φ( u krit m m 0 n) + Φ(ukrit m m 0 n). σ 0 σ 0 a próbastatisztika torzítatlan és konzisztens. 30/58
Egymintás u-próba - Egyoldali ellenpróba u- t- Probléma: X 1,..., X n normális eloszlású mintának ismerjük a szórását (σ 0 ). H 0 : m X m 0 (baloldali), m X m 0 (jobboldali) H 1 : m X < m 0 (baloldali ellenhip.), m X > m 0 (jobboldali ellenhipotézis) Próbastatisztika ugyanaz, de a Döntés: (baloldali) Ha u proba u ε, akkor elfogadjuk a H 0 -t ε szignifikanciaszinten. (jobboldali) Ha u proba u ε, akkor elfogadjuk a H 0 -t ε szignifikanciaszinten. 31/58
Egymintás u-próba - Megjegyzés u- t- A gyakorlatban akkor is alkalmazzák az u-próbát, amikor a minta nem normális eloszlású, de a mintaelemszám nagy. Az alkalmazás jogosságát a centrális határeloszlás-tétellel lehet indokolni. Ugyanis a próbastatisztika normális eloszlású lesz aszimptotikusan, mivel a CHT szerint a mintaátlag már közel normális eloszlású! 32/58
Feladat u- t- 33/58
Megoldás u- t- 34/58
Feladat u- t- Magyarországon egy teljes körű felmérés szerint az elsőéves egyetemisták hetente 7,5 órát töltenek bulizással. Az adatok szórása 7 óra. Egy egyetem rektora gyanakodik, hogy náluk a hallgatók nem buliznak ennyit, ezért 100 fős véletlen mintát vesz az egyetemének elsőévesei közül (kb. 3000 elsős van). A mintavétel eredménye 6,6 órás átlag. Kimutatható-e szignifikáns eltérés a populációs átlagtól? (m = 7, 5, X 100 = 6, 6, σ = 7, n = 100) (u = 1, 29) 35/58
Kétmintás u-próba - Kétoldali u- t- Adottak egymástól független X 1,..., X n és Y 1,..., Y m statisztikai minták. A minták normális eloszlásúak és a szórásaik ismertek. H 0 : m X = m Y H 1 : m X m Y Próbastatisztika. X n Y m σ 2 X n + σ2 Y m 36/58
Kétmintás u-próba - Kétoldali, háttér u- t- H 0 esetén: X n m X σ X n N(0, 1) & Y m m Y σ Y n N(0, 1) X n Y m N(m X m Y, σ 2 X n + σ2 Y m ) X n Y m σ 2 X n + σ2 Y m N(0, 1) DÖNTÉS. H 0 -t elfogadjuk ε szignifikanciaszinten, ha X n Y n σ 2 X n + σ2 Y m < u ε 2. 37/58
Kétmintás u-próba - Egyoldali u- t- H 0 : m X m Y (baloldali), m X m Y (jobboldali) H 1 : m X < m Y (baloldali eh), m X > m Y (jobboldali eh) DÖNTÉS. Elfogadjuk H 0 -t ε szignifikanciaszinten, ha (baloldali) u ε < u proba esetén elfogadjuk H 0 -t (jobboldali) u proba < u ε esetén elfogadjuk H 0 -t 38/58
Feladat u- t- 39/58
Megoldás u- t- 40/58
Egymintás t-próba - Kétoldali u- t- Van egy normális eloszlású X 1,..., X n statisztikai mintám, de nem ismerem a szórást. H 0 : m X = m 0 H 1 : m X m 0 Próbastatisztika X n m 0 n sn 41/58
Egymintás t-próba - Kétoldali, háttér u- t- X n m 0 n tn 1 sn DÖNTÉS. Legyen t krit az n 1 szabadságfokú Student eloszláshoz tartozó kritikus érték. t proba t krit, akkor elfogadjuk H 0 -t, egyébként elvetjük. 42/58
Egymintás t-próba - Egyoldali u- t- Probléma: X 1,..., X n normális eloszlású mintának nem ismerjük a szórását. H 0 : m X m 0 (baloldali), m X m 0 (jobboldali) H 1 : m X < m 0 (baloldali ellenhip.), m X > m 0 (jobboldali ellenhipotézis) Próbastatisztika ugyanaz, de a Döntés: (baloldali) Ha t proba t ε, akkor elfogadjuk a H 0 -t ε szignifikanciaszinten. (jobboldali) Ha t proba t ε, akkor elfogadjuk a H 0 -t ε szignifikanciaszinten. 43/58
Feladat u- t- 44/58
Megoldás u- t- 45/58
Kétmintás t-próba u- t- Van két statisztikai mintám X 1,..., X n és Y 1,..., Y m, melyek várható értékei és szórásai ismeretlenek. (a szórások egyenlőeknek tekintendőek, ellenőrzés: F-próbával (később)) H 0 : m X = m Y H 1 : m X m Y Próbastatisztika. t = X n Y m» (n 1)(s X,n ) 2 + (m 1)(s Y,m )2 nm(n + m 2) n + m 46/58
Kétmintás t-próba u- t- H 0 esetén t = X n Y» m nm(n + m 2) t n+m 2 (n 1)(s X,n ) 2 + (m 1)(sY,m )2 n + m DÖNTÉS. Legyen t krit az n + m 2 szabadságfokú Student eloszláshoz tartozó kritikus érték. t proba < t krit, akkor elfogadjuk H 0 -t, egyébként elvetjük 47/58
Kétmintás t-próba - Egyoldali u- t- Van két statisztikai mintám X 1,..., X n és Y 1,..., Y m, melyek várható értékei és szórásai ismeretlenek (de σ X = σ Y ). H 0 : m X m Y (baloldali), m X m Y (jobboldali) H 1 : m X < m Y (baloldali eh), m X > m Y (jobboldali eh) Próbastatisztika. ugyanaz. DÖNTÉS. Legyen t krit az n + m 2 szabadságfokú Student eloszláshoz tartozó kritikus érték. (baloldali) Ha t proba t ε, akkor elfogadjuk a H 0 -t ε szignifikanciaszinten. (jobboldali) Ha t proba t ε, akkor elfogadjuk a H 0 -t ε szignifikanciaszinten. 48/58
Páros t-próba u- t- Legyenek (X 1, Y 1 ),..., (X n, Y n ) statisztikai minta X i N(m X, σ X ), Y i N(m Y, σ Y ). (a szórások egyenlőeknek tekintendőek, ellenőrzés: F-próbával (később)) H 0 : m X = m Y H 1 : m X m Y Próbastatisztika. X n Y n» (s X,n ) 2 + (s Y,n )2 n tn 1 49/58
Kétmintás, páros t-próba u- t- Mikor? Ha pl egy kezelés előtt és után a testsúly (azaz ugyanazon populáción paraméterek), akkor páros. 50/58
F-próba u- t- Legyenek X 1,..., X n N(m X, σ X ) eloszlású és Y 1,..., Y m N(m Y, σ Y ) független statisztikai minták, melyek várható értéke és szórása is ismeretlen. H 0 : σ X = σ Y H 1 : σ X σ Y Próbastatisztika. Ha s X,n > s Y,m (s X,n )2 (s Y,m )2 51/58
F-próba u- t- Ha H 0 igaz, akkor s X,n s Y,m F n 1,m 1 DÖNTÉS. Ha F krit az F n 1,m 1 eloszláshoz tartozó kritikus érték F proba < F krit, akkor elfogadjuk H 0 -t, egyébként elvetjük 52/58
Feladat u- t- 53/58
Megoldás u- t- 54/58
Megoldás u- t- 55/58
Welch-próba 1. u- t- Ha az F-próbát el kell vetnünk, nem alkalmazható a két független mintás t-próba a két minta várható értékei egyezésének ellenőrzésére. Erre az esetre dolgozta ki Welch a következő próbát. Feladat. Legyenek X 1,..., X n N(m X, σ X ) eloszlású és Y 1,..., Y m N(m Y, σ Y ) független statisztikai minták, melyek várható értéke és szórása is ismeretlen. H 0 : m X = m Y H 1 : m X m Y Próbastatisztika. W n,m = X n Y m s 2 X,n n + s2 Y,m m 56/58
Welch-próba 2. H 0 esetén W n,m Student eloszlású [f ] szabadsági fokkal, ahol u- t- 1 f = c2 m 1 + 1 c2 n 1 és c = s 2 Y,m m s 2 X,n n + s2 Y,m m DÖNTÉS. Legyen t krit az [f ] szabadságfokú Student eloszláshoz tartozó kritikus érték. t proba < t krit, akkor elfogadjuk H 0 -t, egyébként elvetjük 57/58
u- t- Folyt. köv. 58/58