Statisztika, próbák Mérési hiba
ÁTLAG SZÓRÁS KICSI, NAGY MIN, MAX LIN.ILL LOG.ILL MEREDEKSÉG METSZ T.PROBA TREND NÖV Statisztikai függvények
Statisztikailag fontos értékek Számtani átlag: ŷ= i y i /n Medián: : a mintaintervallum közepe Módusz: : a sűrűség függvény maximumának helye Szórás (standard deviatió, SD): s= { i (y i -ŷ) 2 /(n-1) 1)} ½ = ={[ i (y i ) 2 - ( i y i ) 2 /n)]/(n-1) 1)} ½ = ={[n i (y i ) 2 - ( i y i ) 2 ]/n/(n-1) 1)} ½ Variancia: : V=s 2 = i (y i -ŷ) 2 /(n-1) Relatív szórás: : 100s/ŷ Középérték szórás (Standard Error {SE}): s ŷ =s/n ½
1. feladat 1., Számoljuk ki a hiányzó cellák értékét képlettel! 2., Készítsünk grafikont, amely szemlélteti az adott időszakban a kamionok számának alakulását! 3., Szemléltessük a 10 és 12 óra közötti forgalom megoszlását típusonként!
Statisztikai próbák, hipotézisvizsgálat Valószínűségi változók (mérési adatok, eredmények) eloszlására, egymással való kapcsolatára tett hipotézisek statisztikai vizsgálata. Kiindulásul vett hipotézis: nullhipotézis Ennek megtartásáról vagy elvetéséről statisztikai próbák segítségével döntünk. Statisztikai függvényre alapozzuk, amelynek eloszlása ismert.
Egy (kis) α val.séghez meghatározunk egy számhalmazt, amelybe a stat.. függvény értéke α valószínűséggel esik, ha a hipotézis igaz. Elsőfajú hiba: elvetjük a hipotézist, holott igaz. α Másodfajú hiba: Megtartjuk., holott nem igaz. t-eloszlást különböző szabadsági fokok esetén
Gyakran használt próbák Egymintás t-próbat próba: : várható értékre vonatkozó hipotézis (nem szerepel az Excel-ben ben) Páros kétmintás t-próbat egymintás t-próbat Kétmintás t-próba: t 2 valószínűségi változó várható értéke megegyezik F-próba: 2 valószínűségi változó szórása megegyezik
Páros t-próbat Azonos számú elemből álló minták várható értékét hasonlítja össze, és azt vizsgálja, hogy a minták várható értékei különböznek-e egymástól. Pl. amikor egy mintacsoportot kétszer vizsgálnak: a kísérlet előtt és után.
2. feladat Két fájdalomcsillapító (A és B) hatását vizsgáljuk 8 betegen, mérve a fájdalom szűnéséig eltelt időt. Van-e e szignifikáns különbség a két gyógyszer hatása között? Betegek 1 2 3 4 5 6 7 8 A 3,2 1,6 5,7 2,8 5,5 1,2 6,1 2,9 B 3,8 1 8,4 3,6 5 3,5 7,3 4,8
1. Megközelítés Nullhipotézis: : A két minta várható értéke egyenlő. 0,04514 P számított <α elvetjük a hipotézist
2. Megközelítés Eszközök -> > Adatelemzés menüpont t számított > t α A nullhipotézist elvetjük
Kétmintás t-próbat Egyenlő szórásnégyzeteknél Abból indul ki, hogy mindkét adathalmaz szórásnégyzete egyenlő,, ezért homoszcedasztikus t-próbának is szokták nevezni. Ezt a módszert akkor használhatjuk, ha meg szeretnénk állapítani, hogy két minta várható értéke egyenlő-e. e.
s 1 =s 2 esetén H 0 : m 1 =m 2 α=0,05 x1 x2 t = 1 1 + n n 1 Kétmintás t-próbat 2 n 1 + n ( ) 2 n ( ) 2 1 1 s1 + n2 1 s2 tα (n1 + n 2 2) ha t t α (n 1) akkor H 0 hamis emp Ha t emp < t α (n 1) akkor H 0 igaz 2 2
Kétmintás t-próbat Nem egyenlő szórásnégyzeteknél Azt feltételezi, hogy két adathalmaz szórásnégyzete nem egyenlő, ezért heteroszcedasztikus t-próbának is szokták nevezni. A t-próbákat t akkor használhatjuk, ha meg szeretnénk állapítani, hogy két minta várható értéke egyenlő-e. e. Ezt a próbát akkor alkalmazzuk, ha a vizsgált csoportok különböznek.
s 1 s 2 esetén H 0 : m 1 =m 2 α=0,05 x1 x2 t = 2 2 s1 s2 + n n 1 2 ( n -1) t ( n -1) + ( n 1) t ( n 1) 1 α1 1 t (n + 2) = α 1 n2 n1 + n ha t t α (n 1) akkor H 0 hamis emp Kétmintás t-próbat Ha t emp < t α (n 1) akkor H 0 igaz 2 2 2 α 2 2
F-próba Az egyenlő szórásnégyzetek ellenőrzésére Két csoport teljesítménye azonos átlag esetén is különbözhet a különböző szórás miatt. Az F próba arra ad választ, hogy ez az eltérés szignifikánse. f(x) s1 s2 x
A vizsgálat menete: (Fisher-Snedecor eljárás) 1. H0: s1=s2 a két minta azonos szórású 2. A próbamutató meghatározása 3. Szignifikancia szint megállapítása Didaktikai vizsgálatokban szokásos α=0,05 F = emp s 2 nagyobb s 2 kisebb 4. Táblázatból Fα/2(m1;m2) kikeresése m1=n1-1 és m2=n2-1 szabadsági fokok 5. Döntés Ha F emp Fα/2(m1,m2) akkor H0: hamis Ha F emp < Fα/2(m1,m2) akkor H0: p valószínűséggel igaz
Feladat Egy kísérleti telepen 2 tápszert próbáltak ki. Vizsgálták az adott időintervallumbeli súlygyarapodást. 1. tápszer 31 34 29 26 32 35 38 34 30 29 32 31 2. tápszer 26 24 28 29 30 29 32 26 31 29 32 28 Vizsgáljuk meg t-próbával, hogy szignifikáns-e az eltérés a 2 szer okozta súlygyarapodás között α=0,05 szinten!
Eldönteni F-próbával, F hogy egyenlők-e e a szórásnégyzetek? Beszúrás -> > Függvény Statisztikai fgv-ek : F.PRÓBA P számított > α Elfogadjuk a nullipotézist
Másik lehetőség: Eszközök -> > Adatelemzés Kétmintás F-próba F szórásnégyzetre F számított < F α A nullhipotézist megtartjuk
Kétmintás T-próba egyenlő szórásnégyzeteknél t számított > t α P számított < α A nullhipotézist elvetjük
Feladat Egy emlősökben nem lévő steroid hormon adása patkányoknál módosítja-e e a mellékvese tömegét? 1., Határozzuk meg a kontroll és a kezelt emlősökben a mellékvese tömegének átlagát és szórását! 2., Döntsük el, hogy szignifikáns-e a szteroid hatása? (kétmintás t-próba)
F-próba a szórásnégyzetek ellenőrzésére Vigyázat! A nagyobb szórásnégyzetű az első változó! (ez kerül a számlálóba) Kétmintás F-próba a szórásnégyzetre Ebben az esetben a Kezelt csoport! Várható F számított érték < F α A nullhipotézist Variancia megtartjuk Változó 1 22,20833333 16,95471014 Megfigyelések 24 Változó 2 17,86666667 14,6952381 15 df 23 14 F 1,153755389 P(F<=f) egyszélű F kritikus egyszélű 0,400033257 2,357303686
Kétmintás T-próba Kiindulási hipotézis: A mellékvese tömege mindkét esetben azonos. P számított < α Elvetjük a nullipotézist t számított > t α A nullhipotézist elvetjük
Feladat Az alábbi adatok a Daphnia longispina (vízibolhafaj) két rasszát (A és B) reprezentáló 7-7 klón napokban kifejezett átlagos élettartamára vonatkoznak. A 7.2 7.1 9.1 7.2 7.3 7.2 7.5 B 8.8 7.5 7.7 Vizsgáljuk meg t-próbával, hogy szignifikáns-e az eltérés a 2 rassz élettartama között α=0,05 szinten! 7.6 7.4 6.7 Kétmintás F-próba a szórásnégyzetre Várható érték Variancia Megfigyelések 7.2 F számított < F α A nullhipotézist megtartjuk Változó 1 7,514285714 0,504761905 7 Változó 2 7,557142857 0,40952381 7 df 6 6 Először T-próba a szórásnégyzetekre! F P(F<=f) egyszélű F kritikus egyszélű 1,23255814 0,403047876 4,283862154
Kétmintás t-próba egyenlő szórásnégyzeteknél Nullhipotézis: a két rassz átlagos élettartama megegyezik Kétmintás t-próba egyenlő szórásnégyzeteknél Várható érték Variancia Megfigyelések Súlyozott variancia Feltételezett átlagos eltérés df t érték P(T<=t) egyszélű t kritikus egyszélű P(T<=t) kétszélű t kritikus kétszélű Változó 1 7.514285714 0.504761905 7 0.457142857 0 12-0.118585412 0.453782897 1.782286745 0.907565793 2.178812792 Változó 2 7.557142857 0.40952381 7 t számított < t α P számított > α A nullhipotézist megtartjuk
Varianciaanalízis (ANOVA) Ha kettőnél több minta várható értékeit kínánjuk összehasonlítani. Nullhipotézis: az adott valószínűségi változó várható értéke mindegyik mintacsoportban egyforma.
Az előző feladatban egy harmadik rassz élettartamát is vizsgáljuk: A 7,2 7,1 9,1 7,2 7,3 7,2 7,5 B 8,8 7,5 7,7 7,6 7,4 6,7 7,2 C 7,3 7 8,9 Vizsgáljuk meg, hogy van-e eltérés a várható átlagos élettartamok között! Varianciaanalízist alkalmazunk. Eszközök -> Adatelemzés -> Egytényezős varianciaanalízis F < F krit. A nullhipotézist megtartjuk 7,4 7,3 7,5 7,1
Az előző feladatban a hímek mellett nőstényeket is vizsgáltak. hím hím A 7,2 7,1 B 8,8 7,5 C 7,3 7 Van-e eltérés bármely csoprt várható élettartama között? hím hím hím 9,1 7,2 7,3 7,7 7,6 7,4 8,9 7,4 7,3 Varianciaanalízist végzünk, de itt Kéttényezős varianciaanalízist ismétlesekkel. hím hím nőstény nőstény nőstény 7,2 7,5 7,3 7 8,9 6,7 7,2 7,2 7,1 9,1 7,5 7,1 8,8 7,5 7,7 nőstény 7,4 7,2 7,6 nőstény 7,3 7,3 7,4 nőstény 7,5 7,2 6,7 nőstény 7,1 7,5 7,2
1 2 3 4 5 6 7 8 9 10 11 12 Feladat Egy fiú és egy lány hajának hossznövekedését mérték egy éven keresztül. Fiú (mm) 2,5 4,4 7,8 9,5 11,9 15 16,6 19,8 23 24,1 27,5 29,6 Lány (mm) 3,1 5,7 8,5 11,3 13,5 16,2 18,9 20,6 24,5 27,8 31 32,5 1., Illesszünk egyenest a két függvényre! Adjuk meg a meredekség és az y-tengelymetszet értékét! 2., Számoljuk ki, hogy mennyi lenne a hossznövekedés 18 ill. 24 hónap múlva a két esetben!
Fiú Lány m 2,492657 2,713986 b -0,22727 0,159091