Egymintás u-próba STATISZTIKA 2. Előadás Középérték-összehasonlító tesztek Tesztelhetjük, hogy a valószínűségi változónk értéke megegyezik-e egy konkrét értékkel. Megválaszthatjuk a konfidencia intervallum nagyságát is. H 0 : 1 = 0 Feltétel: Skála típusú adat Normális eloszlású populáció szigma ismeret n>30? Egymintás u-próba vagy z-próba Próbastatisztika: standard normáleloszlás, DF = n-1 H 0 : Kefir zsírtartalma 3% szignifikancia szint=5% n=30 átlag= 3,2% szigma=0,5% H a : nem egyenlő Próbafüggvény, alfa=0,05 2,1978 H 0 : Őszi búza hektolitertömege 80 kg n=30 átlag=75 kg szigma= 15 kg H a : nem egyenlő 0,014 1
Próbafüggvény, alfa=0,05-1,8248 Egymintás t-próba Tesztelhetjük, hogy a valószínűségi változónk értéke megegyezik-e egy konkrét értékkel. Megválaszthatjuk a konfidencia intervallum nagyságát is. H 0 : 1 = 1 0,034 Feltétel: Skála típusú adat Normális eloszlású populáció A szórást a mintából becsüljük Egymintás t-próba Próbastatisztika: t-eloszlás, DF = n-1 H 0 : Kefir zsírtartalma 3% szignifikancia szint=5% n=30 átlag= 3,2% s=0,5% H a : nem egyenlő Próbafüggvény, alfa=0,05; DF=29 2
H 0 : Őszi búza hektolitertömege 80 kg n=30 átlag=75 kg s = 15 kg H a : nem egyenlő Próbafüggvény, alfa=0,05; DF=29 Próbafüggvény, alfa=0,05; DF=29 Két középérték különbségének tesztelése Feltételek: Független minták Normális eloszlásúak Azonos szórás 3
Két normál eloszlású, független minta különbség várható értékének szórása Két középérték különbségének tesztelése Kétmintás z-próba vagy u-próba Kétmintás t-próba egyenlő szórásnégyezeteknél Kétmintás t-próba nem egyenlő szórásnégyzeteknél Kétmintás párosított t-próba Kétmintás z-próba vagy u-próba H 0 : A Milli és Danone kefir fogyasztói ára megegyezik n 1 =n 2 =120 σ 1 =5 Ft σ 2 =5 Ft z-próba statisztikája Származhat-e a két független megfigyelés, minta azonos középértékű populációból? H 0 : 1 = 2 Próbastatisztika: z-eloszlás, DF = n 1 + n 2 2 Nincs különbség Nincs különbség 4
Excel kétmintás z-próba Excel kétmintás z-próba Eszközök, Adatelemzés Excel kétmintás z-próba eredménye Kétmintás t-teszt (szórás azonos) Kétmintás t-teszt (szórás azonos) Származhat-e a két független megfigyelés, minta azonos középértékű populációból? H 0 : 1 = 2 Próbastatisztika: t-eloszlás, DF = n 1 + n 2 2 5
Kétmintás t-teszt (szórás azonos) n 1 =n 2 = 4 X 1 várható értéke = 6 000 kg/ha X 2 várható értéke = 7 500 kg/ha a szórás mindkét esetben 780 kg/ha Nincs különbség a különbség várható értékének szórása: 552 kg/ha Nincs különbség Valódi különbség A várható érték 1 500kg/ha, a szórás 552kg/ha Kétmintás F-próba a szórásnégyzetre F=var 1 /var 2 vagy F=var 2 /var 1 6
F-érték nagyobb, mint 1,00 Valószínűség 1-alfa Szabadságfokok: DF 1 =6 DF 2 =6 F=143,67/89,29=1,61 Kétmintás F-próba a szórásnégyzetre F-érték kisebb, mint 1,00 Valószínűség alfa Szabadságfokok: DF 1 =6 DF 2 =6 F=89,29/143,67=0,62 Kétmintás F-próba a szórásnégyzetre 7
Kétmintás t-teszt (nem azonos szórás) Ha a két csoport szórása szignifikánsan különbözik, ilyenkor a két összehasonlítandó csoport varianciáját súlyozni kell a variancia becsléséhez (separate variancia). A próbastatisztika: Kétmintás t-teszt szabadságfoka (nem azonos szórás) A próba valószínűségi változója ebben az esetben nem t-eloszlású, ezért nem a t-táblázatot, hanem a Bonferroni-módosított szignifikancia értékeket kell használni a középértékek különbözőségének elbírálásakor Excel kétmintás t-próba nem egyenlő szórásnégyzeteknél Excel kétmintás t-próba nem egyenlő szórásnégyzeteknél Párosított t-próba Két összefüggő minta középértékének összehasonlítására szolgál H 0 : d átlag = 0 Próbastatisztika: (DF = n 1 1) Fogyókúra Egy fogyókúra kísérletben 100 hölgy vett részt. s d a párosított minták különbségének szórása, becslése a minta alapján 8
Excel kétmintás párosított t-próba a várható értékre Excel kétmintás párosított t-próba a várható értékre Párosított t-próba eredmény táblázata Helytelen módszer alkalmazása Párosított t-próba helyett független kétmintás t-próba használata Eredmény Helytelen eredmény A t-próba ereje A valódi különbség kimutatásának valószínűsége. Mi befolyásolja? Minta elemszáma A különbség nagysága Szignifikancia-szint, alfa A t-próba típusa (egy, két, páros) Alternatív hipotézis (egy vagy kétoldali) 9
Minimális mintaelemszám középérték-különbséghez Példa Alfa=0,05 z α =1,96 Béta=0,2 z β =0,84 S= 2 Delta=1 H 0 : A banán átlagos eladási ára 300 Ft/kg Összefoglalás Feladatok szignifikancia szint=5% n=77 átlag= 298,49 Ft/kg s=46,26 Ft/kg H a : nem egyenlő Próbafüggvény, alfa=0,05; DF=76 Excel INVERZ.T függvény INVERZ.T(alfa; szabadságfok) alfa = elsőfajú hiba szignifikancia szint Szabadságfok = n-1 INVERZ.T(0,05; 76)=1,99 Kétoldali szimmetrikus feltétel esetén 10
Excel T.ELOSZLÁS függvény T.ELOSZLÁS(x; szabadságfok; szél) x = érték, ahol a t-eloszlás valószínűségét keressük szint szabadságfok = n-1 szél = 1 egyoldali, 2 kétoldali T.ELOSZLÁS(1,99; 76; 2)=0,05 Kétoldali szimmetrikus feltétel esetén H 0 : A szendvics sonka átlagos eladási ára 900 Ft/kg n=77 átlag=865,82 Ft/kg szórás=84,47 Ft/kg H a : nem egyenlő Próbafüggvény, alfa=0,05; DF=76 Próbafüggvény, alfa=0,05; DF=76 11
Kétmintás z-próba vagy u-próba H 0 : A banán átlagos fogyasztói ára megegyezik az Észak-Alföldi és Közép- Magyarországi régióban n 1 =n 2 =11 σ 1 =50 Ft σ 2 =50 Ft Excel kétmintás z-próba Eszközök, Adatelemzés Nincs különbség Excel kétmintás z-próba Excel kétmintás z-próba eredménye 12
Kétmintás t-teszt (szórás azonos) Kétmintás t-teszt (szórás azonos) Származhat-e a két független megfigyelés, minta azonos középértékű populációból? H 0 : 1 = 2 Próbastatisztika: t-eloszlás, DF = n 1 + n 2 2 H 0 : A banán átlagos eladási ára megegyezik 2005. és 2010. évben szignifikancia szint=5% n 1 =n 2 =7 átlag 2005 = 291 Ft/kg átlag 2010 = 374,43 Ft/kg s 2005 =11,99 Ft/kg s 2010 = 9,45 Ft/kg Kétmintás t-teszt (szórás azonos) Összevont szórás: H a : nem egyenlő 13
Nincs különbség Excel kétmintás t-próba egyenlő szórásnégyzeteknél Eszközök, Adatelemzés Excel kétmintás t-próba egyenlő szórásnégyzeteknél Excel kétmintás t-próba egyenlő szórásnégyzeteknél eredmény 14