Bevezetés a hipotézisvizsgálatokba Nullhipotézis: pl. az átlag egy adott µ becslése : M ( x -µ ) = 0 Alternatív hipotézis: : M ( x -µ ) 0 Szignifikancia: - teljes bizonyosság csak teljes enumerációra - hipotézisünk a mintán alapszik, elvetését arra az esetre is megengedjük, amikor igaz: ez α valószínűségű. -Van egy statisztikánk, pl. az átlag. Ennek eloszlása: 100 (1-α) % 100 α/2 % 100 α/2 % α a szignifikancia szint Krit. Tart. Elfogadási régió Krit. Tart. H 0 A statisztika innen származik! vö. Bartlett paradoxon Hibalehetőségek: 1) "Elsőfajú" hiba (Type I error): -t elvetjük, holott igaz. Mértéke α (hiszen éppen igaz volta esetén ilyen a statisztika eloszlása: csak α valószínűséggel esik a kritikus tartományba). α/2 α/2
2) "Másodfajú" hiba (Type II error): Elfogadjuk -t, holott nem igaz! Ennek meghatározása csak az alternatív eloszlás ismeretében lehetséges. Valószínűségét jelöljük β-val. Stat. eloszlása Alternatív eloszlás β Ha az alternatív hipotézisben megjelölt várható érték közel van a -ban megjelölt várható értékhez, akkor nagy az átfedés, nagy β. Ha az alternatív hipotézisben megjelölt várható érték távolabb esik a -ban megjelölt várható értéktől, akkor kicsi az átfedés, kicsi β. A mintaelemszám növelése csökkenti a β-t Példa: : p=q, : p = 2q. Vegyünk 17 elemű mintákat: (p+q) 17 α=0,01 β= 0,87. Tehát n=17 kevés volt a hipotézis eldöntésére.
Összesítve: elfogadjuk -t elvetjük igaz helyes I. hiba hamis II. hiba helyes α és β összefüggése: Minél kisebb α, annál nagyobb β. Kétoldalú próbák: Az eltérés mindkét irányban érdekes 100 α/2 % 100 (1-α) % 100 α/2 % Krit. Tart. Elfogadási régió Krit. Tart. Egyoldalú próbák: Az eltérés csak egy irányban érdekes H 0 : az átlag nem nőtt : az átlag nőtt 100 (1-α) % 100 α % Elfogadási régió Krit. Tart.
A t-eloszlás Konfidencia-intervallum α=0.05 mellett: L 1, L 2 = x ± 1.96 σ / n ahol σ / n= σ x Ez a példa így eléggé mesterkélt: a várható értéket nem ismerjük, a szórást igen. Valójában mindkettőt becsüljük ugyanabból a mintából. A normális eloszlás tehát nem használható az átlag eloszlására, a szórást is becsülve már a t-eloszlást kell alkalmazni. L 1, L 2 = x ± t α,n-1 s / n ahol s / n=s x Student féle t-eloszlás n = 30 W. Gosset n = 2 Tulajdonságai: 1. Várható értéke 0 2. Szimmetrikus 3. A variancia >1, határértékben 1-hez közelít 4. Ért. tart.: -, 5. Eloszlás-család, n-1 a szabadsági fok 6. Ha n, akkor a normális eloszláshoz közelít. Általában n>30 esetre a norm. eloszlás táblázata használható. Egyébként pedig: L 1, L 2 = x ± t α,n-1 s / n ahol s / n=s x 0
Egymintás t-próba Egymintás t próbát alkalmazunk annak megállapítására, hogy egy minta átlaga becslése-e egy előre adott várható értéknek, Mivel a populáció szórása nem ismert, az átlag szórását is becsüljük. (Feltétel: a változó legyen normális eloszlású.) : a mintából kapott átlag µ becslése : M (x- µ ) = 0 (x nem tér el szignifikánsan µ-től) : az átlag nem a µ becslése : M (x- µ ) 0 Mivel a populáció szórása nem ismert, ezt is becsülnünk kell, vagyis t-eloszlással számolunk. tˆ = α adott (5%), szabadsági fok= n-1 x s µ n 2.5% 2.5% -t crit t crit Egyszerű példa: Kísérleti személyek egy tárgyat 20 cm-re elmozdítanak, először jelzik nekik a távolságot, másodszor viszont anélkül, becsukott szemmel. Kérdés: van-e távolságérzékelés?? Adatok: 22,1 20,1 20,5 16,6 22,2 18,7 20,6 20,6 n = 8, x = 20,225 s = 1,89 H 0 = a második kísérletben is 20 a becsült várható érték = a második kísérletben már nem 20 Számítás: t = x µ = s / n 20.225 20 1.89 / 8 = 0.225 0.668 = 0.336 d.f. = n-1 = 7, legyen α = 0.05, s ekkor t crit =2.365. α=0.025-nél nézzük!
Bevezetés a hipotézisvizsgálatokba Nullhipotézis: pl. az átlag egy adott µ becslése : M ( x Alternatív hipotézis: : M ( -µ ) = 0 x -µ ) 0 Szignifikancia: - teljes bizonyosság csak teljes enumerációra -hipotézisünk a mintán alapszik, elvetését arra az esetre is megengedjük, amikor igaz: ez α valószínűségű. -(A elvetése és elfogadása közti határt α-tól függően állítjuk be. Általában α kis valószínűség, pl. 5%. -Ez azt jelenti, hogy úgy határozzuk meg az elfogadási régió és a kritikus tartomány közti határt, hogy -csak 5%-ban forduljon az elő, hogy ( x -µ)/ sx ennél nagyobb, abban az esetben amikor igaz, vagyis az x átlagú minta egy µ várható értékű alapsokaságból származott.)