9. GYAKORLAT STATISZTIKAI PRÓBÁK SPSS-BE FELADATOK A feladatokhoz mentük aját gépünkre a példa adatokat tartalmazó fájlokat a tanzéki honlapról: www.hd.bme.hu/mota/m/p1.av www.hd.bme.hu/mota/m/p2.av www.hd.bme.hu/mota/m/p3.av www.hd.bme.hu/mota/m/p4.av F.1. A biztonágo munkahelyi környezet egyik elengedhetetlen feltétele, hogy a dolgozóknak ne kelljen olyan munkafolyamatot végezni, ami meghaladja képeégeiket. A percenkénti négy emelét megkövetelı fizikai munka megengedett úlyainak nagyága a dolgozó életkorának függvényébenmeghatározott. ( The Effect of Speed, Frequency, and Load on Meaured Hand Force for a Floor-to Knuckle Lifting Tak, Ergonomic, 1992: 833-843.) Egy cég arra kívánci, hogy a cége munkahelyi átlag megfelel-e a 18-30 éve dolgozókra meghatározott 25 kg-o megengedett emeléi tömegnek. Vizgálatuk orán 5 ilyen munkafolyamatot végzı munkáuk a következı tömegeket emelte átlagoan: 25.8 36.6 26.3 21.8 27.2 Adjon módzert az elemzé elvégzéére, é végezze el a vizgálatot! Mivel mot a zórá nem imert egymintá T-próbát alkalmazunk Indítuk el az SPSS 14.0 for Window programot a gépen, majd válazuk a type in data opciót. Ekkor az SPSS Data Editor panelje jelenik meg elıttünk, ami egy felı menüort é két fület tartalmaz: 1. Egy táblázato formájú Data View fület 2. Egy zintén táblázato (de adott fejlécekkel ellátott) Variable View fület. Írjuk be az elı ozlopba egymá alá a munkáok orzámát: 1, 2 5 A máodik ozlopba írjuk be a mért értékeket, vagyi orrendben a fenti táblázatban található tömegeket. Mot nézzük meg a Variable view fület. Itt megjelent a két ozlopnak megfelelıen két or. Itt adhatjuk meg azt, hogy ezeket milyen adatként kezelje. Sorrendben: az ozlop neve ---- ide írjuk be az elı orba, hogy orzám, a máodikba, hogy tömeg az adott változó típua, a karakterek max. hoza, a kiírt tizedejegyek záma ---- mivel az elı ozlopban a orzámok vannak, itt állítuk ezt a zámot 0-ra, a máodik ozlopban pedig 1-re, mivel tized kg pontoan voltak megadva a méréeink az ozlop címkéje ---- ide írjuk be az elı orba, hogy a Dolgozó orzáma, a máodik orba, hogy Emelt tömeg [kg] tb.
Váltunk viza a Data View nézetre. Látzik, hogy ozlopainknak már van neve, é megváltozott a zámok formátuma i a tizedejegyeket tekintve. Miután megvan az adathalmaz, nekikezdhetünk a próba elvégzéének. ullhiptézi: A mért tömegek várható értéke 95 %-o valózínőégi zinten 25 kg. Válazuk a felı menüorból az Analyze Compare Mean One-Sample T Tet parancot (vagyi a várható értékre egymintá T próbát alkalmazunk). A megjelenı panelban válazuk ki, hogy a mért tömegekre zeretnénk a vizgálatot elvégezni: jelöljük ki a bal oldalon a megfelelı adathalmazt, é a nyíllal adjuk hozzá a Tet Variable panelhez. Az aló Tet Value mezıben adjuk meg, milyen konkrét várható értékre akarjuk a vizgálatot elvégezni, írjuk be: 25. Az Option gombot megnyomva beállíthatjuk a zignifikancia zintet, írjuk be a Confidence interval-hoz, hogy 95 %, majd nyomjuk meg a folytatá gombot. A beállítáok után nyomjuk meg az OK gombot. Az SPSS program egy ú.n. Output View ablakot hoz létre nekünk, ebben adva meg az elvégzett vizgálat eredményét, de termézeteen értékelét nem ad hozzá, ez mindig a felhaználó feladata. Az Output View két táblázatot tartalmaz: 1. a minta tatiztikáit tartalmazó táblázat --- orrendben itt a minta elemzám (), átlag ( x ), korr. tap. zórá () é az átlag zóráa ( ) zerepel benne 2. a vizgálat eredményeit tartalmazó táblázat --- orrendben a t próba aktuáli értéke (takt), a zabadágfok (df=-1), Sig. (ezzel egyelıre nem foglalkozunk), az átlag é a teztelt érték közötti különbég ( x a0 ), é a kereett konfidencia intervallum aló (CIlower) é felı határa (CIupper) zerepel benne Alakítuk át az általunk haznált próba ériumot egy kicit. Ha H0 igaz: CI lower t akt t a0 x a0 0 CI t x t ( a x) t ( a x) 0 upper 0 0 A program a próba eredményeinek utoló két ozlopában e két utoló zámot adja meg, egy konfidencia intervallum (Confidence Intervall) aló é felı határt.
Vagyi a levezeté utoló ora alapján, ha az ott látható feltétel igaz, vagyi a program által zámolt intervallum aló határa negatív, a felı határa pedig pozitív, akkor a H0-t az adott zignifikancia zinten elfogadjuk. Eetünkben: -4.253 < 0 < 9.33 igaz, a H0 hipotézit elfogadjuk, vagyi a dolgozók által átlagoan emelt úlyok tömege 95 %-o valózínőéggel 25 kg, a munkahely megfelel a zabványnak. F.2. A következı adatok hegeztéel ill. hegezté nélkül kézült polimer cövek húzófezültégét mutatják. ( Effect of Welding on High-Denity Polyethylene Liner, J. of Material in Civil. Eng., 1996: 94-100) Hegezté nélkül [10^7 Pa] 1.89 2.09 1.86 2.31 1.83 2.32 1.95 2.27 1.73 2.15 2.17 2.01 2.25 1.99 2.22 2.00 2.22 1.90 Hegeztve [10^7 Pa] Egyetért-e a kutatókkal, akik azt állítják, hogy a cövek húzófezültégén az új technológia nem változtatott? Megoldá Mivel a zórá nem imert, é a változók függetlenek független kétmintá T-próbát alkalmazunk Elıkézíté: yiuk meg az p1.av állományt a File Open Data menüpont haználatával. Ebben a 18 vizgált cı orzáma, é mint mért adat: azok húzófezültége található az elı két ozlopban. A vizgálathoz termézeteen el kell különítenünk a kül. technológiával kézített cöveket, ezért a harmadik ozlopban az elı 10 adat mellé írjuk 0-t, a maradék nyolc mellé pedig 1-et. evezzük el (a Variable View-t haználva) az ozlopot technológia azonoítónak, állítuk át tizedejegy nélkülivé az ozlopot, é adjuk értelmet a két zámnak: a Value ozlopban megjelenı zürke négyzetre kattintva töltük ki a Value Lable panelt. Írjuk be a Value-hoz hogy 0, a Value label-hez, hogy hegezté nélkül, majd nyomjuk meg az Add gombot, írjuk be az 1- et, a hegeztve címkét é adjuk ezt i hozzá. yomjuk meg az OK gombot. ullhipotézi: H0: A hegezté nélküli é hegeztett cövek húzófezültége megegyezik.
Válazuk a felı menüorból az Analyze Compare Mean Independent Sample T Tet parancot. (A független kétmintá T próbát válaztjuk, a két valózínőégi változó egymától független, hizen két teljeen különbözı mintát válaztottunk a két technológiával kézült cövek halmazából!) A vizgálni kívánt változó a húzófezültég, azt adjuk a Tet Variable panelhez. A érium, ami zerint a minta két rézre van oztva a technológia, ezt adjuk a Grouping Variable panelhez. A Define Group gombnál tudjuk megadni, hogy milyen értékek tartoznak az egye coportokba: írjuk a Group1 mellé, hogy 0, a Group2 mellé, hogy 1. yomjuk meg a folytatá gombot. Az Option-ban állítuk be a zignifikancia zintet 95%-ra. A beállítáok után nyomjuk meg az OK gombot. Az Output view megint két táblázatot tartalmaz: 1. a minta két coportjának tatiztikáit tartalmazó táblázat 2. a vizgálat eredményeit tartalmazó táblázat --- a táblázat elı felében a Levene féle próba; a máodik felében a Student féle T próba eredményei láthatók (mi ez utóbbit tárgyaljuk cak!). Az eredmények értelmezééhez az elızı próbánál leírtak zerint kell a kétmintá T próba megvizgálandó relációját átalakítani. Ebbıl levezethetı, hogy ugyanúgy CI 0 CI vizgálandó. Mivel -0.31 < 0 < 0.032, a nullhipotézit elfogadjuk, a hegeztett é hegezté nélküli cövek húzófezültége megegyezik. F. 3. A mozgázervi nyak-váll problémák igen gyakoriak azon munkavégzık eetében, akik imétlézerő, vizuáli kijelzı kezelıi munkát végeznek. Az Upper-Arm Elevation During Office Work c. cikk (Ergonomic, 1996: 1121-1230) egy 16 egyénen végzett kíérlet eredményeit imerteti. A kíérletben kétzer figyelték meg a dolgozókat, az elı alkalommal úgy, hogy a kézmozgára max. 30 -o zögben volt lehetıégük, a máodik eetben -18 hónappal kéıbb- úgy, hogy közben javítottak a munkakörnyezeten, é így a dolgozóknak nagyobb tartományban é változatoágban volt lehetıégük karjukat mozogatni. A munkavégzé hatékonyágát úgy mérték le, hogy egy adott munkafolyamatot kellett a dolgozóknak elvégezni egy adott limitidı alatt, é azt nézték, hogy a limitidı hány zázalékát haználták fel a feladatmegoldára. Elı alkalommal korlátozott kézmozgáal, majd máodik alkalommal kiterjeztett kézmozgáal, vagyi jobb körülmények mellett. A 16 dolgozó két alkalommal mért eredményei vannak az p2.av állományban. Alátámaztják-e az adatok a kijelentét, mizerint a nagyobb mozgátér biztoítáa nem változtatott a munkavégzé hatékonyágán? Mivel a zórá nem imert, a változók özefüggnek, páro kétmintá T-próbát alkalmazunk ullhipotézi: H0: A munkavégzé hatékonyága nem változott (a munkavégzére fordított idı nem változott). lower upper
Válazuk a felı menüorból az Analyze Compare Mean Paired Sample T Tet parancot. (Itt a páro kétmintá T próbát válaztjuk, a két valózínőégi változó ugyani nem független, hizen a vizgált alanyok a két mérénél ugyanazok voltak!) A vizgálni kívánt két változót a Shiftet lenyomva tartva együtt jelöljük ki, é adjuk a Paired Variable panelhez. Az Option-ban állítuk be a zignifikancia zintet 95%-ra. A beállítáok után nyomjuk meg az OK gombot. Az Output View mot három táblázatot tartalmaz: 1. a minta két coportjának tatiztikáit tartalmazó táblázat 2. a két minta korreláció vizgálatra vonatkozó táblázatát 3. a vizgálat eredményeit tartalmazó táblázat Az elızıekhez haonlóan CI lower 0 CI vizgálandó. upper Mivel 2.362 < 0 < 11.138 nem igaz, a nullhipotézit elutaítjuk, a munkavégzé hatékonyága változott. Megjegyzé: A vizgálat elvégezhetı a 7. gyakorlaton megimert módon i, ekkor a munkavégzére fordított idık közti különbég várható értékét hogy az nulla-e kell vizgálni egymintá T próbával. F.4. Elızı óránkon Χ 2 próbával megállapítottuk, hogy egy kutató cég által megvizgált 40 fiú é 40 lány magaága normáli elozlát követ (p=95%). Rajzoljuk meg a minta őrőégfüggvényét, é haonlítuk öze a normáli elozlá őrőégfüggvényével! A vizgálat eredménye az p3.av fájlban látható. A 40 lány é 40 fiú adatait együtt zeretnénk vizgálni, ezért a 4. ozlopba Ctrl+c é Ctrl+v haználatával máoljuk egymá alá a két mintát. evezzük el az ozlopot: Gyerekek; ne legyenek tizedejegyek; é a címke legyen a 10-12 éve gyermekek magaága. Válazuk a menübıl a Graph Hitogram parancot. Válazuk ki Variable-nek a 10-12 éve gyermekek magaágát, é pipáljuk ki a Diplay normal curve mezıt. Ezzel a őrőégfüggvényre a normáli elozlá őrőégfüggvényét i rárajzolja a zoftver. yomjuk meg az OK-t. Az Output Viewban meg i jelenik a hiztogram, amely mellett a minta legfontoabb tulajdonágai: átlaga, zóráa é elemzáma i megjelenik, é a normáli elozlának megfelelı görbével a hiztogramunk özevethetı. F.5. Egy internete áruház promócióinak bevezetée elıtt meg akarja vizgálni (98%-o valózínőégi zinten), hogy oldaluk látogatottága egyenlete-e a hét folyamán. A megfigyelt idızak alatt az p4.av állományban található látogatottágokat mérték. Megvizgáljuk, hogy a minta egyenlete elozlából zármazik-e: Χ 2 próba
ullhipotézi: H0: A minta egyenlete elozláú Elızör rendeljük hozzá a hét napjainak orzámához az adott napi látogatók zámát: válazuk a felı menüorból az Data Weight Cae parancot. Állítuk aktívra a Weight cae by opciót, legyen a Frequency Variable a látogatók záma, majd OK. Mot jöhet a próba: Analyze onparametric Tet Chi-Square paranc. Mivel az imént a napokhoz hozzárendeltük a látogatók zámát, így mot a ap orzámát adjuk a panelhez, mint teztelni kívánt változó. Az aló beállítáok maradnak az alapbeállítáon, nyomjuk meg az OK-t. Az Output view mot két táblázatot tartalmaz: 1. az intervallumok adatait --- a valódi intervallumba eét (Oberved, eddig nálunkυ i ), az egyenlete elozlának megfelelı intervallumba eét (Expected, nálunk ), é az elıbbi kettı különbégét ( υ p ) 2. a próba tatiztikáit --- Χ 2 akt értékét ( χ i i ( p ) r 2 υi akt = i= 1 i 2 pi ); a zabadágfokot pi (r-1); azt a becült valózínőéget (Aympthotic Significance), ahol a iku érték nagyobb lez, mint az aktuáli, é így a nullhipotézi igaz (1-p) A Χ 2 2 2 próba értékelée: ha χ akt χ ( p, r 1), a nullhipotézit elfogadjuk. A zoftver nekünk ebbıl (1-p)-t adja meg. Így az értékelé a következı: ha Aymp. Sig ( 1 p), a nullhipotézit az adott zinten elfogadjuk. Mivel eetünkben 0.003 1 0.98 = 0. 02 nem igaz, a nullhipotézit elutaítjuk, a hét napjain a látogatottág nem egyenlete. F.6. Vizgáljuk meg ugyanezt cak a hét munkanapjait figyelembe véve. Lád elızı feladat ullhipotézi: H0: A minta a munkanapokon egyenlete elozláú A vizgálat teljeen haonló az elızıhöz: Váltunk viza a Data View-ra (az Output fájlt nem kell bezárni). Analyze onparametric Tet Chi-Square paranc. Az elızıhöz képet cak az aló beállítáok változnak: az Expedted range legyen Ue pecified, aló határnak írjunk be 1-et, felınek 5-öt. Ezzel beállítottuk, hogy az intervallumok közül cak az 1 é 5 közötti orzámúakat vizgálja, vagyi hétfıtıl péntekig. yomjuk meg az OK-t.
Az Output Viewban az elızı eredmények alá kerülnek az új táblázatok. Mot 0.703 1 0.98 = 0. 02 igaz, a nullhipotézit nem utaíthatjuk el, a hét munkanapjain az oldal látogatottága egyenlete. A GYAKORLATO RÉSZLETEZETT STATISZTIKAI FOGALMAK: SPSS alkalmazáok T próba (egymintá, kétmintá független é özefüggı) Hiztogram zerkezté Χ 2 próba