Nemparaméteres próbák Budapesti Mőszaki és Gazdaságtudományi Egyetem Gépészmérnöki Kar Hidrodinamikai Rendszerek Tanszék 1111, Budapest, Mőegyetem rkp. 3. D ép. 334. Tel: 463-16-80 Fax: 463-30-91 http://www.vizgep.bme.hu
Nemparaméteres próbák: Nem egyetlen paraméter, hanem Illeszkedés, homogenitás, függetlenség vizsgálata χ próba Wilcoxon próba
Illeszkedés vizsgálat: χ próba Alkalmazás Kérdés: szabályos-e a dobókocka? (minden lapjára azonos valószínőséggel esik-e?) Elmélet Adott r számú esemény A 1, A,, A r Egymást kizáró események: r i= 1 A i = I H o : P(A i )=p i i=1,,,r p i adott r i= 1 p = 1 i
Illeszkedés vizsgálat: χ próba Legyen N számú kísérlet, A 1 ν 1 -szer, A ν -ször,, A r ν r -szer következik be. (gyakoriságok) Statisztika: r χ = i= 1 ( ν Np ) i Np i i khi-négyzet
Illeszkedés vizsgálat: χ próba r ( ν Np ) i i χ = i= 1 Magyarázat: Np ν i binomiális eloszlású, Np i a várható értéke. Ha H o igaz, akkor a ( ) ne vesz fel túl nagy értéket, Bizonyítható, hogy a szumma χ eloszlású valószínőségi változó, (r-1) paraméterrel. i
Illeszkedés vizsgálat: χ próba χ eloszlás táblázatából: ( ) χ = χ ε 1, r 1 krit 1-ε szignifikancia szint r az események száma A próba: Kiszámítjuk χ aktuális értékét. H o hipotézist elfogadjuk, ha χ χ akt krit
Illeszkedés vizsgálat: χ próba Alkalmazás Szabályos-e a dobókocka? A 1 =1, A =,,A 6 =6 Elmélet Adott r számú esemény A 1, A,, A r Egymást kizáró események: r i= 1 A i = I H o : P(A i )=1/6 i=1,,,6 H o : P(A i )=p i i=1,,,r
Illeszkedés vizsgálat: χ próba H o : P(A i )=1/6 i=1,,,6 H o : P(A i )=p i i=1,,,r 6 i= 1 1 = 1 6 r i= 1 p = 1 i N=840 kísérlet
Illeszkedés vizsgálat: χ próba Dobási eredmények: ν 1 =14 ν =15 ν 3 =130 ν 4 =148 ν 5 =15 ν 6 =134 N=840 χ akt=5.9 H 0 : p 1 =1/6 p =1/6 p 3 =1/6 p 4 =1/6 p 5 =1/6 p 6 =1/6 Npi=140 Legyen N számú kísérlet, A 1 ν 1 -szer, A ν -ször,, A r ν r -szer következik be. (gyakoriságok) Statisztika: r χ = akt i= 1 ( ν Np ) i Np i i
Illeszkedés vizsgálat: χ próba Legyen p=95% r=6 χ krit(95%, 5)=11.1 χ χ akt krit Ho (95%) χ = χ ε, ( ) krit 1 r 1 1-ε szignifikancia szint r az események száma A próba: Kiszámítjuk χ aktuális értékét. H o hipotézist elfogadjuk, ha χ χ akt krit
Illeszkedés vizsgálat: χ próba Megjegyzés: Az (r-1) paraméterő χ eloszlás várható értéke (r-1). H 0 fennállása esetén a próba-statisztika eredménye megnyugtató, ha χ aktuális értéke közel van a várhatóértékhez. Másként: rendszeresen ismételve a próbát, χ aktuális értéke a várhatóérték körül ingadozik
Kérdések: χ próba folytonos változó esetén Adott F(x)-hez való illeszkedést vizgáljuk (pl. normalitás vizsgálat) Ha F(x) teljesen ismert (várhatóérték és szórás adott) akkor tiszta illeszkedésvizsgálat Ha a mintából becsüljük a paramétereket: becsléses illeszkedésvizsgálat Hogyan definiáljuk az eseményeket? Hogyan határozzuk meg az eseményekhez tartozó valószínőségeket?
χ próba folytonos változó esetén Események és valószínőségek definiálása 1. ξ 1, ξ, ξ n mintából kiválasztani a legkisebb és legnagyobb elemet: ξ min =min(ξ 1, ξ, ξn ) ξ max =max(ξ 1, ξ, ξ n ). részintervallumokra bontani a [ξ min, ξ max ] intervallumot (mint a tapasztalati sőrőségfüggvény szerkesztésnél). Az intervallumok száma legyen r. Az intervallum-határok: x 0, x 1, x,,x r Esemény: az intervallumba esés
χ próba folytonos változó esetén 3. Meghatározni az egyes rész-intervallumokba esés gyakoriságát: ν 1, ν,,ν r 4. Meghatározni az egyes rész-intervallumokba esés valószínőségét: p 1, p,,p r H 0 : a minta F(x) eloszlásból származik. A valószínőségek: p 1 =F(x 1 )-F(x 0 ) p =F(x )-F(x 1 )... p r =F(x r )-F(x r-1 )
χ próba folytonos változó esetén Normalitás vizsgálatnál: standard normálisra transzformáljuk, hogy a táblázatot használhassuk. Pl. becsléses esetben: p j x j ξ x j 1 ξ = Φ Φ * * s s Mert: ( ) p = P x ξ x = j j 1 j P x ξ ξ ξ x ξ s s s j 1 j = = * * * N(0,1)
χ próba folytonos változó esetén x ξ ξ ξ x ξ s s s j 1 j = P = * * * x ξ x ξ s s j j 1 = Φ Φ = * * p j ν j és p j ismeretében a próba végrehajtása ugyan úgy történik mint diszkrét változó esetében
χ próba: alkalmazás Daraboló gépen 105 mm hosszú darabokat állítanak elı N=170 darab alkatrész hosszméretének megmérése után a hosszméret eloszlásának normalitását vizsgáljuk. Átlagot és tapasztalati szórást számolunk (becsléses illeszkedés-vizsgálat): * ξ = 1 0 6. 8 7 m m s = 3. 9 m m
χ próba: alkalmazás Részintervallumok határai: x 0 =-, x 1 =10.5 mm, x =104.5 mm,, x 7 =11.5 mm, x 8 =+
χ próba: alkalmazás Intervallumok x j -x j-1 v j Z j (Z j ) p j K j 10.5 10.5-104.5 104.51-105.5 105.51-106.5... 110.51-11.5 11.5 -
χ próba: alkalmazás Intervallumok x j -x j-1 v j Z j (Z j ) p j K j - - 10.5 10.5-104.5 104.51-105.5 14 7 gyakoriság 105.51-106.5 0... 110.51-11.5 18 11.5-9
χ próba: alkalmazás Intervallumok x j -x j-1 v j Z j (Z j ) p j K j - -10.5 14-1.38 10.5-104.5 7-0.70 104.51-105.5 105.51-106.5 0-0.416-0.11 z j x ξ x 106. 87 j = = * s 3. 9 j... 110.51-11.5 18 1.711 11.5-9
χ próba: alkalmazás Intervallumok x j -x j-1 v j Z j (Z j ) p j K j - -10.5 14-1.38 0.091 10.5-104.5 7-0.70 0.358 104.51-105.5 105.51-106.5. 0-0.416-0.11 0.3387 A standard normális eloszlás táblázatából.. 110.51-11.5 18 1.711 0.9565 11.5-9 1
χ próba: alkalmazás Intervallumok x j -x j-1 v j Z j (Z j ) p j K j - -10.5 14-1.38 0.091 0.091 10.5-104.5 7-0.70 0.358 0.1437 104.51-105.5-0.416 0.3387 0.109 105.51-106.5. 0 ( ) Φ( ) p = Φ Z Z j j j 1-0.11.. 110.51-11.5 18 1.711 0.9565 0.0915 11.5-9 1 0.0435
χ próba: alkalmazás Intervallumok x j -x j-1 v j Z j (Z j ) p j K j - -10.5 14-1.38 0.091 0.091 0.185 10.5-104.5 7-0.70 0.358 0.1437 0.77 104.51-105.5-0.416 0.3387 0.109 1.157 105.51-106.5. K j 0-0.11 ( ν Np i i ) ( ν 170p i i ) = = Np i 170p i.. 110.51-11.5 18 1.711 0.9565 0.0915 0.369 11.5-9 1 0.0435 0.346
χ próba: alkalmazás Intervallumok x j -x j-1 v j Z j (Z j ) p j K j - -10.5 14-1.38 0.091 0.091 0.185 10.5-104.5 7-0.70 0.358 0.1437 0.77 104.51-105.5-0.416 0.3387 0.109 1.157 105.51-106.5 0-0.11... 110.51-11.5 18 1.711 0.9565 0.0915 0.369 11.5-9 1 0.0435 0.346 3.88
χ próba: alkalmazás χ akt=3.88 χ eloszlás paramétere: (r-1-becsült paraméterek száma)=8-1-=5 χ krit(95%, 5)=11.1 Ho (95%)
Grafikus illeszkedés-vizsgálat Minta alapján tapasztalati eloszlásfüggvény szerkesztés Közös grafikonba rajzolni a tapasztalati eloszlásfüggvényt és a hipotézisként feltett eloszlásfüggvényt. Vizuálisan mérlegelni, hogy illeszkednek, vagy sem. A döntést segíti, ha a hipotézisként feltett eloszlásfüggvényt olyan koordinátarendszerben ábrázolom, ahol egyenesnek látszik. Normalitás vizsgálat esetén ez a Gauss papír
Adott a minta: ξ 1, ξ, ξ n Intervallumhatárok z i - = z 0 < z 1 < < z r-1 < z r = Gyakoriságok Tapasztalati eloszlásfüggvény
Példa: Duna maximális vízhozama az évek folyamán év Q max (m 3 /s) 1901 * 4750 értékköz GYAKORISAG Rel.gyak * 190 5806 tol 3900-ig 8 0.15 * * 1934 * 713 min 4300-ig 4600-ig 10 8 0.81 0.406 * 5000-ig 8 0.531 1956 * 951 max 500-ig 9 0.67 * 1964 444 5700-ig 9 0.81 s = / Q 3 997 m s 3 Q = 4900 m / s 6000-ig végig 6 6 0.906 1
Példa: tapasztalati eloszlásfüggvény gyakoriság 1 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0. 0.1 0 Nehéz megítélni, hogy illeszkedik-e a normális eloszlásfüggvényhez, vagy nem 0 000 4000 6000 8000 10000 1000 vízhozam m 3 /s
Gauss- papír Koordinálta transzformáció melynek lényege, hogy Φ(x) egyenes legyen 0,9 0,7 Φ(x) 0.9 0.7 y 70 0,5 0.5 y 90 Vízszintesen a skála lineáris marad Függıleges skála
Gauss-papír
Homogenitás-vizsgálat χ próbával Kérdés: két valószínőségi változó azonos eloszlású-e? Legyen: ξ eloszlásfüggvénye F(x) η eloszlásfüggvénye G(x) H 0 : F(x)=G(x) Adott a két minta: ξ 1, ξ,,ξ n, η 1, η,, η m Részintervallumokat képezek, az intervallum-határok: - =x 0 <x 1 < x < < x r =
Homogenitás-vizsgálat χ próbával Az i-edik részintervallum: (x i -x i-1 ) Ebben a ξ gyakorisága ν i az η gyakorisága µ i Statisztika: χ = akt nm r i= 1 ν i µ i n m ν + µ i i (r-1) paraméterő χ eloszlású valószínőségi változó
Homogenitás-vizsgálat χ próbával A próba végrehajtása: p szinten a H 0 hipotézist elfogadom, ha χ χ akt krit
Alkalmazás: Nappali és éjszakai mőszakban készült alkatrészek törıszilárdságát kívánom összehasonlítani: σ törı 10 3 N/m 10-15 16-18 19-1 -5 6-9 30- ν i (nappal) 36 41 8 11 3 1 n=10 µ i (éjszaka) 8 36 8 4 m=100
Alkalmazás: Behelyettesítve: ν i µ i r 10 100 χ = 10* 100* = 1. 19 akt i= 1 ν + µ A kritikus értékek táblázatából: χ = ( ) krit 5, 95% 11. 1 95%-os szinten elfogadom a két eloszlás azonosságát i i
Függetlenség-vizsgálat χ próbával Kérdés: két valószínőségi változó független-e? (Pl.: egy alkatrész hossza és átmérıje, két gazdasági mutató, stb. ) Adott a megfigyelés-sorozat (minta): {ξ 1, η 1 } {ξ, η } {ξ N η N } A két változó függetlenségét akarom vizsgálni: H o : P({ξ < x, η < y) = P({ξ < x)p( η < y) (Megjegyzés: ez a függetlenség definíciója)
Függetlenség-vizsgálat χ próbával A ξ értékeinek megfelelıen felosztást készítünk: (- =) x 0 <x 1 < x < < x r (= ) Az η értékeinek megfelelıen felosztást készítünk: (- =) y 0 <y 1 < y < < y s (= ) A i esemény: x i-1 < ξ < x i B j esemény: y j-1 <η<y j
Függetlenség-vizsgálat χ próbával Kontingencia táblázat: B 1 B B j B s A 1 ν 11 ν 1 ν 1s ν 1 A ν 1 ν ν s ν A i ν ij ν i A r ν r1 ν r ν rs ν r ν 1 ν ν j ν s N
Függetlenség-vizsgálat χ próbával Becsléses függetlenség-vizsgálat: P( B ) j = q A statisztika: j ν j N P A ν N i ( ) = p i i χ = akt N s r j= 1 i= 1 ν µ νij N ν µ i j i j A szabadságfok: (r-1)(s-1)
Alkalmazás Forgácsoló automatán hengeres darabot gyártunk. Kérdés, hogy az átmérı és hossz (mint valószínőségi változó) független-e egymástól? Névleges érték: d=7 mm. L=10 mm Hossz átmérı 0.05 ig 0.06-0.1 0.11-0.15 0.16-0. 0.1+ összesen,db -0.07 ig 1 14 13 0 17 76-0.06 tól- 0.05 ig 7 18 34 18 8 85-0.03 tól- 0.01 ig 13 43 41 4 13 134-0.00 tól 11 35 34 17 99 összesen,db 43 110 1 79 40 394
Alkalmazás χ = akt N s r j= 1 i= 1 ν µ νij N ν µ i j i j 43* 76 1 394 394 43* 76 0.0040 0.0063 0.01197 0.00378 0.0835 0.001418 0.00351 0.005688 0.00014 0.0001 0.0004579 0.001 1.48E-05 0.00078 6.8E-05 8.9719E-06 0.00497 0.00096 0.00104 0.01637 0.0060868 0.01684 0.018595 0.00573 0.04491 36.31 χ akt
Alkalmazás Számítás: r=4, s=5 (r-1)(s-1)=1 χ krit=1 χ akt> χ krit Nullhipotézist elutasítom
Wilcoxon próba Kérdés: két valószínőségi változó azonos eloszlású-e? Legyen: ξ eloszlásfüggvénye F(x) η eloszlásfüggvénye G(x) H 0 : F(x)=G(x) Adott a két minta: ξ 1, ξ,,ξ n, η 1, η,, η m
Wilcoxon próba Rendezett mintát készítek: ξ ξ... ξ... ξ * * * * 1 i n η η... η * * * 1 m Közös rendezett mintát készítek, a közös mintában : ξ ξ az r -edik helyen szerepel (rangszáma r ) * 1 1 az r -edik helyen szerepel (rangszáma r ) * 1 ξ * i * n általában ξ az r -edik helyen szerepel (rangszáma r ) i n az r -edik helyen szerepel (rangszáma r ) i n
Statisztika: Wilcoxon próba n n i i= 1 i= 1 U = ( r i) = r i n n + 1 ( ) min U=0 ha r 1 =1, r =, r n =n max U=nm ha r 1 =m+1, r =m+, r n =m+n Bizonyították, hogy az eloszlás szimmetrikus M(U)-ra ( ) M U = nm
Wilcoxon próba ( ) M U nm U = 0 U = mn = U ε / U * ε / Az U ε / kritikus értékek a Wilcoxon táblázatból vehetık Próba: kiszámítom U akt értéket esetben H 0 -t elfogadom Uε U U * / / akt ε
Wilcoxon próba Megjegyzés: A táblázatában csak Uε/ található. Ha ( ) M U = nm U = 0 U = mn 0 U akt nm U ε / U * ε / Elfogadom H 0 -t, ha U ε / Uakt nm
Wilcoxon próba Ha nm U akt nm Akkor kiszámolom az * akt U nm U akt A nullhipotézist elfogadom, ha * Uakt Uε / nm Elıny : nem kell ismerni az eloszlást, csak az a feltétel, hogy azonosak legyenek!
Wilcoxon próba (alkalmazás) Alkalmazás Hidraulika olaj habzása káros, mérni kell a habzási hajlamot. Az olajat lapátos habverıbe teszik, adott ideig habosítják, majd mérik a a hab eltőnési idejét az olaj felszínérıl. Ez a jellemzı szám. Két olajat hasonlítunk össze, 7 kísérletet végzünk:
Wilcoxon próba (alkalmazás) i 1 3 4 5 6 7 A olaj ξ [sec] i 337 358 354 358 303 348 39 B olaj η i [sec] 35 338 380 355 365 360 370
Wilcoxon próba (alkalmazás) ξ vagyη érték r i ξ * 5 354 7 ξ * 1 303 1 η * 3 355 ξ * 39 ξ * 6 358 9 ξ * 3 337 3 ξ * 7 358 10 η * 1 338 η * 4 360 ξ * 4 348 5 η * 5 365 η * 35 η * 6 370
Wilcoxon próba (alkalmazás) Behelyettesítünk: U akt n r i i= 1 = n n + 1 ( ) 7* 8 = 37 = 9 nm 7* 7 nm = = 4. 5 ezért: U akt ( ) (,, % =, ) ε / ε / U 7 7 95 8 H 0 hipotézist p szinten elfogadjuk U 7 7 U akt