STATISZTIKA 1. Előadás Hipotézisvizsgálatok Tematika 1. Hipotézis vizsgálatok 2. t-próbák 3. Variancia-analízis 4. A variancia-analízis validálása, erőfüggvény 5. Korreláció számítás 6. Kétváltozós lineáris regresszió 7. Többváltozós lineáris illetve nem lineáris regresszió analízis 8. A jó modell kritériumai és mérése 9. Idősorok analízise, trendszámítás 10. Idősorok analízise, szezonalitás mérése Hipotézis Tudományos hipotézis Nullhipotézis felállítása (H 0 ): Munkahipotézis (H a ) Kétmintás hipotézisek > 1
Nullhipotézis (H 0 ) Többmintás hipotézisek = µ 1 = µ 2 = µ 3 = = µ k Statisztikai próba Az olyan eljárást, amelyik a minták alapján dönt, statisztikai próbának nevezik Modell választás vagy alkotás Próbafüggvény előállítása Próbafüggvény A próbafüggvény kiszámított értékéhez megadható egy P, valószínűségi érték. Ez megadja, hogy milyen valószínűséggel várható a próbafüggvénynek a kiszámítottal azonos vagy annál nagyobb értéke, ha a nullhipotézis igaz, azaz μ 1 = μ 2 A statisztikai próba menete 1. A statisztikai próba menete 2. A munka-hipotézisek (H a ) nem igazolhatók közvetlen úton Ellenhipotézis, nullhipotézis felállítása (H 0 ): μ 1 = μ 2, vagy μ 1 - μ 2 =0 Elsőfajú hiba megválasztása, ALFA A minta a nullhipotézist alátámasztja-e? A munka-hipotézist indirekt módon bizonyíthatjuk 2
Elsőfajú hiba Kétoldali, szimmetrikus, alfa=5% (H 0 ): μ 1 = μ 2, vagy μ 1 - μ 2 =0 igaz A minta alapján elvetjük a nullhipotézist, tévesen valódi különbséget állapítunk meg ELUTASÍTÁSI ELFOGADÁSI TARTOMÁNY ELUTASÍTÁSI Mi ennek a valószínűsége? α (alfa), melyet a statisztikai próba elvégzése előtt kell megválasztani, szignifikancia-szint Szokásos értékei: 10; 5; 1; ritkán 0,1% Egyoldali, aszimmetrikus, alfa=5% Egyoldali vagy kétoldali? ELFOGADÁSI TARTOMÁNY ELUTASÍTÁSI KRITIKUS ÉRTÉK Alternatív hipotézisre vonatkozik Egyoldali, ha előzetes információnk van arról, hogy az egyik csak nagyobb lehet, mint a másik. Kétoldali, nincs információnk az összehasonlításról. A kétoldali a gyakoribb Az egy- és kétoldali próba A null-hipotézis (H 0 ) mindig egyenlőség hibák 1. Ha az alternatív hipotézis (H 1 ) nem egyenlő kétoldali próba nagyobb jobboldali próba kisebb baloldali próba 3
hibák 2. hibák 3. hibák 4. hibák összefoglalása Másodfajú hiba μ 1 nem egyenlő μ 2, vagy μ 1 - μ 2 nem nulla, H a igaz A minta alapján megtartjuk a nullhipotézist, tévesen egyformaságot állapítunk meg Mi ennek a valószínűsége? β (béta), melynek értékét csak a statisztikai próba elvégzése után lehet meghatározni A statisztikai próba ereje A valódi különbség kimutatásának valószínűsége P=1- β Gyakorlatilag egy igaz munkahipotézis vagy alternatív hipotézis elfogadásának valószínűsége Minél kisebb az α, annál ritkább, hogy H 0 -t tévesen elutasítjuk, de annál gyakoribb, hogy H 0 -t tévesen elfogadjuk (másodfajú hiba) 4
Az első- és másodfajú hiba csökkentése Minta elemszámának növelése Pontosabb mintavételezés (szórás csökken) Lehet-e az első- és másodfajú hibát nullára csökkenteni? Elsőfajú és másodfajú hiba közötti összefüggés Fordított De nem lineáris! NEM A véletlen hatásokat nem tudjuk kiiktatni 29,5% 6,2% 1,96 Alfa és béta hiba Statisztikai próbák 1. 95% Eloszlásra vonatkozó Normális eloszlás Binomiális Egyenletes Kolmogorov-Smirnov teszt -4-2 0 2 4 6 8 10 Statisztikai próbák 2. Az eloszlás valamelyik paraméterére Medián Átlag Szórás Nem paraméteres statisztikai próbák Khi-négyzet teszt, illeszkedés vizsgálat Binomiális teszt a relatív gyakoriságra Független kétmintás teszt, pl. Mann- Whitney-u próba Páronként összetartozó minták tesztje, pl. Wilcoxon-teszt Független többmintás teszt, pl. Kruskal- Walis H próba k számú összetartozó minta tesztje, pl. Friedman-teszt 5
Khi-négyzet tesztek Statisztika I. Illeszkedés vizsgálat Függetlenség vizsgálat Homogenitás vizsgálat Binomiális teszt Igaz-e a nemeknél az 50:50%-s arány? Mann-Whitney-u próba Két független minta medián egyezésének igazolására való eljárás A H 0, hogy a két sokaság ugyanabba az eloszlásba tartozik Ordinális típusú adatoknál használható, vagy skála típusú adatoknál, ahol nem feltétel a normáleloszlás Csak az egyezésre ad elfogadható, megbízható eredményt. Ha ettől eltérő eredményt kapunk, nem tudhatjuk biztosan, hogy mi a valóság Wilcoxon-teszt Két eloszlás egyezésének vizsgálatára alkalmas A két minta elemei páronként összefüggnek n 1 +n 2 elemű mintából egyetlen rangsort képeznek A nullhipotézis: a páronkénti különbségek a nulla körül szimmetrikusan helyezkednek el Kruskal-Walis H próba Rendezett mintán alapuló, több mintás hipotézis vizsgálat Nullhipotézis: minden minta azonos eloszlású sokaságból származik A próba segítségével h darab nh elemszámú mintát vizsgálhatunk Friedman teszt Több eloszlás egyezésének vizsgálatára alkalmas A k számú minta elemei összefüggnek n 1 +n 2 n K elemű mintából egyetlen rangsort képeznek A nullhipotézis: a különbségek a nulla körül szimmetrikusan helyezkednek el 6
Paraméteres próbák Feltétel a normális eloszlás A teszt irányulhat várható értékre szórásra Paraméteres próbák a várható értékre Ismert szórás Egymintás z-próba Független kétmintás z-próba Párosított z-próba A szórás nem ismert, mintából becsült Egymintás t-próba Független kétmintás t-próba Párosított t-próba Paraméteres próbák nem paraméteres alternatívái Minimális mintaelemszám becslése Független kétmintás t-próba --- Mann- Whitney u-próba Párosított t-próba --- Wilcoxon-teszt Variancia-analízis --- Kruskal-Walis H-próba Ismételt méréses variancia-analízis --- Friedman teszt Minimális mintaelemszám számtani átlaghoz Példa 7
Öreg vagy fiatal? 8