8. GYAKORLAT STATISZTIKAI PRÓBÁK ISMÉTLÉS: Tanult nem paraméteres próbák, és hogy mlyen probléma megoldására szolgálnak. Név Illeszkedésvzsgálat Χ próbával Illeszkedésvzsgálat grafkus úton Gauss papírral Homogentás-vzsgálat Χ próbával Homogentás-vzsgálat Wlcoxon próbával Mre szolgál? A val.- vált. eloszlása egy adott eloszlást követ-e? A val.- vált. eloszlása normáls eloszlást követ-e? Két val.- vált. eloszlása megegyezk-e? Két val.- vált. eloszlása megegyezk-e? FELADATOK A feladatokhoz töltsük le a mnta adatokat tartalmazó xls fájl a tanszék honlapról: www.hds.bme.hu/mota/sm/nempar_prob_mnta.xls F.1. Egy cég három különböző méretű konzervdobozba csomagolja termékét, a három csomagolást különböző technológa folyamattal állítják elő. A gyártás folyamat célja természetesen jó, azonos mnőségű dohozok előállítása. Egy mnőségellenőrzés mérnök a következő okat azonosította annak, hogy konzervdobozok nem megfelelőek: 1. rongálódás a dobozon,. repedés a dobozon, 3. a nytófül nem megfelelő helyen van, 4. a nytófül hányzk, 5. egyéb. Mndhárom gyártás eljárással készült, hbás termékhalmazból mntát vettek, és megállapították, hogy a mnőségellenőrzésen mért nem felelt meg az adott doboz. gyártás eljárás Hba ok rongálódás repedés fül rossz helyen fül egyéb hányzk 1 34 65 17 1 13 150 3 5 5 19 6 15 3 3 8 16 14 10 100 összesen 89 145 58 54 9 375 mnta elemszám Kjelenthető-e 95%-os valószínűséggel a mérés adatok alapján, hogy a különböző hbák százalékos előfordulása megegyezk a három gyártás eljárásnál? Megoldás: Homogentás vzsgálat Χ próbával Nullhpotézs: H 0 : A hbák százalékos előfordulása ugyanolyan eloszlást követ a különböző gyártás eljárások esetén. (Ezt vzsgáljuk meg páronként.)
3 3 Χ Χ Χ = n m = n k = k m ν µ n m ν + µ ν κ n k ν + κ µ κ m k κ + µ Írjuk be a C15, C16 és C17 cellákba sorban, hogy 1- ; 1-3 és -3. A D15-H15-g számoljuk k a fent képlet Σ jelen belül értéket: D15:= =(D9/$I$9-D10/$I$10)^/(D9+D10) és ezt húzzuk végg H-g. Majd a J15-ben számoljuk k a Χ értékét: J15:= =I9*I10*SZUM(D15:H15). Tegyük meg ugyanezt a 16 és 17-dk sorban s. 1-: Χ = 5.54 1-3: Χ = 6.88-3: Χ = 9.75 Krtkus érték: krt ( p, r 1) = krt ( 0.95,4) Számoljuk k Χ krt értékét: J19:= =nverz.kh(1-0.95;darab(d9:h9)-1) Χ krt = 9.48 Vzsgálat: 3 3 krt krt krt Következtetés: A -es és 3-as gyártás eljárásban a hbák százalékos előfordulása nem ugyanolyan eloszlású. F.. Egy gyerekszékeket gyártó cég olyan tervezés rányelvet akar követn, amelyben feltételez, hogy a) az adott korú (10-1 éves) gyermekek magassága normáls eloszlást követ (p=95%), és b) a lányok és fúk átlagos magassága között nncs lényeges eltérés (p=98%). Egy kutató cég 40 fút és 40 lányt vzsgált meg a célcsoportból, a vzsgálat eredménye az xls fájlban látható. Alátámasztják-e a vzsgálat eredménye a cég feltételezéset? Megoldás: a) Az egész mnta normaltás vzsgálata Χ próbával
Nullhpotézs: H 0 : A magasság normáls eloszlást követ. ( N p ) r υ = = 1 N p A mntafájl tartalmazza a mérés adatok táblázatos összefoglalóját: a mért magasságokat 9 ntervallumba osztották, megadták az egyes ntervallumokba esés gyakorságát (ν ). Az adatsor tartalmazza még a mért értékek átlagát és korrgált tapasztalat szórását. Írjuk fel a következő fejléceket: F7:= z G7:= Φ(z) H7:= p I7:= kh négyzet H17:= uáls H19:= krtkus Számítás: Létre kell hoznunk egy st.norm. eloszlású valószínűség változót a mérés eredményekből, vagys az ntervallumok felső határának értéket tartalmazó változót standardzáljuk: F8:= =(D8-$C$18)/$C$19 ; ezt húzzuk végg az oszlopon F16-g Így már a st.norm. eloszlás eloszlásfüggvénye adja meg, az adott érték alá esés valószínűségét: G8:= =STNORMELOSZL(F8) ; ezt húzzuk végg az oszlopon G16-g Két szomszédos valószínűség különbsége adja az adott ntervallumba esés valószínűségét, am képletünkben p : H8:= =H8 H9:= =G9-G8 ; ezt húzzuk végg az oszlopon H16-g Χ értékéhez a Σ-án belül lévő tag számítása kerül az I oszlopba. Ehhez szükséges a megfgyelések száma: N; ezt számoljuk k E17-ben: E17:= =SZUM(E8:E16). I8:= =(E8-$E$17*H8)^/($E$17*H8) ; ezt húzzuk végg az oszlopon I16-g. Χ értéke az utolsó oszlop összege: I17:= =SZUM(I8:I16). Χ = 10.8 Krtkus érték: krt ( p, r 1) Kh-négyzet eloszlás eloszlásfüggvényéből I19:= =nverz.kh(1-0.95;darab(b8:b16)-1) Χ = 15.51 Vzsgálat: krt Következtetés: A H 0 hpotézst elfogadjuk, vagys a gyerekek magassága 95%-os valószínűség sznten normáls eloszlást követ.
b) A fú és lány mnta várható értékének vzsgálata kétmntás U próbával (Fgyelem, ez paraméteres próba!) Nullhpotézs: H 0 : a 1 = a A fúk és a lányok magasságának várható értéke megegyezk. u = ς η σ n 1 1 σ + n Egy üres cellában a megadott adatokból számoljuk k u értékét. u = 1.36 p + 1 u krt A st.norm. eloszlás eloszlásfüggvényének nverze segítségével (p+1)/-höz számoljunk krtkus értéket. u krt =.3 1 1 Krtkus érték: ( p) = Φ = Φ ( 0.99) Vzsgálat: Következtetés: u u krt A H 0 hpotézst elfogadjuk, vagys a lányok és fúk magasságának várható értéke 98 %-os valószínűséggel megegyezk. F.3. Egy cég beszállító versengenek egymással. A cég arra kíváncs, hogy a beszállított alkatrészek tönkremenetel hajlama megegyezk-e, ezért mndkét beszállítótól vett mntát, és megvzsgálta, menny az alkatrészek tönkremenetel deje. Ezt tartalmazza a mnta xls fájl. Megegyezk-e 99%-os valószínűséggel a két gyártó által gyártott alkatrészek tönkremenetel hajlama? Megoldás: Homogentás-vzsgálat Wlcoxon próbával Nullhpotézs: H 0 : A két val.- változó eloszlásfüggvénye megegyezk. (A kétféle alkatrész tönkremenetel hajlama megegyezk.) u r = r = 1 n ( n + 1) A képletben szereplő r értékek a két mnta sorba rendezése után a kválasztott változó közös mntabel sorszáma: rangsorszámok, ezeket kell meghatározn. Hozzuk létre a következő fejléceket: G10:= közös sorszám H10:= közös mnta I10:= beszállító sorszáma J10:= rendezett mnta
K10:= rendezett mnta L10:= rangszámok Adatok előkészítése: Az 1. beszállító alkatrészenek cellát színezzük át valamlyen színre. Ez a Formátum Cellák Mntázat paranccsal érhető el. Másoljuk egymás után az 1. majd a. adatokat a H oszlopba. (Az 1. értékek cellá tt s színesek lesznek.) A G oszlopban a szokásos módon hozzuk létre a közös mnta sorszámat. Az 1. beszállító adata mellé az I oszlopba tegyünk 1-et: I11:= =1 és húzzuk végg I5-g; a. beszállító adata mellé -t: I1:= = és húzzuk végg az oszlopon. Az I11:I5 tartományt szntén színezzük k ugyanolyan színnel az átláthatóság kedvéért. Rangszámok megállapítása: Együtt jelöljük k a H11:I45 tartományt (két oszlop), majd másoljuk a J11:K45 tartományba. Most az új tartományt együtt kjelölve rendezzük sorba a mntát. Ehhez használjuk az Adatok Sorba rendezés menüpontot. A rendezett mnta oszlopot emelkedő sorrendbe választva láthatjuk, hogy az élettartam adatok szernt készül el a rendezés, a beszállító sorszámát hozzárendelve az élettartamokhoz. Ezután válasszuk k valamelyk beszállítót (a választás mndegy), most legyen a választott az 1. Nézzük meg a közös lstában hányadk helyen szerepelnek az 1. jelű, tehát színezett mezők. Ehhez: L11:= =HA(K11=1;G11;0), am egy olyan logka parancs, am ha a K11-es mező értéke 1. beírja a G11 értékét a cellába, különben pedg 0-t ír bele. Vagys ha az a sor az 1. beszállítóhoz tartozk, akkor beírja a cellába közös lstabel sorszámát az alkatrésznek, ezek a képletben szereplő rangszámok, r-ek. L46:= =SZUM(L11:L45) K47:= uáls L47:= =L56-(DARAB(C11:C30)*(DARAB(C11:C30)+1)/) ; és ezzel meg s van u. u = 138 Krtkus érték: n m M ( u) = u ( n, m, p) = u ε / ε / (15,0,0.99) K49:= közép L49:= =DARAB(C11:C30)*DARAB(E11:E30)/ ; ez M(u) értéke. M(u)=150 K60:= u ε/ L60:= =73 ; ehhez nyssuk meg a www.hds.bme.hu/mota/sm/wlcoxon.pdf fájlt és olvassuk k a megfelelő értéket.
Vzsgálat: u ε / u n m Következtetés: A H 0 hpotézst elfogadjuk, vagys a kétféle alkatrész tönkremenetel hajlama 99 %-os valószínűséggel megegyezk. A GYAKORLATON RÉSZLETEZETT STATISZTIKAI FOGALMAK: Illeszkedésvzsgálat Homogentás-vzsgálat MEGJEGYZÉS A kék szegéllyel kjelölt bekezdések olyan nformácókat, programkezelés technkákat tartalmaznak, amknek smerete feltétlenül szükséges a program használatához!