SPSS ALAPISMERETEK T. Parázsó Lenke
2 Statistical Package for Social Scienses Statisztikai programcsomag a szociológiai tudományok számára 1968-ban Norman H. Nie, C.Handlai Hull és Dale H. Bent alkották meg az SPSS alapjait, 70-es években továbbfejlesztették a Chicagói Egyetemen. 1992-ben megjelent a Windows alatt futó változata, ez averzió vált elterjedtebbé a felhasználók körében. 1997 2003 vállalati alkalmazások elterjedése 2004 Predectiv elemzések ideje 2007 Java alkalmazások 2009 SPSS PASW
SPSS munkaterületei 3 MS Windows család tagja, minták statisztikai elemzését végezhetjük el segítségével. A programot kizárólag a megnevezett intézmények oktatói és tanulói használhatják: kutatás, egyetemi oktatás és fejlesztés céljára. Munkaterületei: Data adatmátrix Output eredmények Chart diagram ablak
Változók 4
Az SPSS beköszöntő oldala 5 Már mentett adatbázis megnyitása Tárgyszavas és címszavas megnyitás, keresése Új adat beírása Meglévő könyvtárak és fájlok megnyitása Adatbázis konvertáló megnyitása
Az SPSS beköszöntő oldala 6
7 Különböző kiterjesztésű adatok konvertálása
Az adatbázis 8 Az oszlopok, más szóval mezők vagy változók, a kérdőív kérdéseinek, a sorok, vagy rekordok illetve elemek, a válaszadóknak felelnek meg.
Az adatbázis definiálása 9
Adat 10 Az oszlopok, más szóval mezők vagy változók, a kérdőív kérdéseinek, a sorok, vagy rekordok illetve elemek, a válaszadóknak felelnek meg.
Az adat jellemzői_1 11 VARIABLE NAME a kijelölt oszlopba feltüntetett változók megnevezését határozzuk meg. TYPE LABELS MISSING VALUES COLUMN FORMAT a változó típusát jelöljük meg a változó címkéjét definiáljuk az adathiány kódja, ahol a hiányzó adatokat kódolhatjuk a cella formázása
Adat típusa 12
A File menű 13
14 Define Labels a változók definiálása A változók neveit Value - cimkékkel látjuk el Value label a változók magyarázatai
15 Define Missing Values- az adathiány ellenőrzése Ha a feldolgozás során nem kell számolni adathiánnyal, akkor a legfelső, No missing values pontot jelöljük meg. Abban az esetben, ha hibás értékekkel is számolni kell, az alábbi 3 beállítási lehetőségünk van:
Define Missing Values- Hiba 16
17 Hibás értékek adathiány ellenőrzése
18 Hibás értékek adathiány ellenőrzése_2 File Display Data Info
Keretrendszer kialakítása 19
Oszlop formázás 20 A lehulló ablak az oszlop szélességének és a beleírt szöveg igazítására ad lehetőséget.
SPSS adatfelvitel 21
Sor és oszlop beszúrás 22
Az adatbázis 23 az oszlopok, más szóval mezők vagy változók, a kérdőív kérdéseinek, a sorok, vagy rekordok illetve elemek, a válaszadóknak felelnek Médiainformatikai meg. Intézet
Adatfelvitel 24
Grafikai ábrázolás 25 kördiagram
Hisztogram 26
Halmozott oszlopdiagram 27
Tő és levél (Steam snd leaf plot) 28
Boksz-Plot ábra 29
Pókháló, sugár 30
Adatfájlok statisztikai elemzése 31 OLAP
A középérték mérőszámai 32
Statisztikai jellemzők 33
Gyakoriság 34
Gyakoriság_2 35
Eredmény 36
Kovarancia Két adathalmaz adatpárjai közötti eltérések szorzatának átlagát számolja megadja két egymástól különböző változó együttmozgását. n számú x, y értékpár esetében a minta kovarianciája az alábbi képlettel határozható meg: n ( x i i x) ( yi y) n 37 37
Korrelációs együttható 38 A korrelációszámítást többdimenziós minták vizsgálatakor, a minta elemeihez rendelt adatok közötti összefüggés feltárását szolgálja. A korrelációs együttes szignifikancia vizsgálata megmutatja, hogy egy adott, többdimenziós minta esetén a változók között talált összefüggés mekkora valószínűséggel valódi és nem a véletlen műve. r xy r táblázat r xy r táblázat a két minta korrelációs összefüggése az oszlopnak megfelelő valószínűséggel nem a véletlen műv, vagyis általánosítható a korrelációs összefüggés mértékét nem lehet áltatlánosítani, vagyis a mintában észlelt kapcsolat a véletlen műve
A korrelációs együttható 39 szignifikanciája A korrelációs együttes szignifikancia vizsgálata megmutatja, hogy egy adott, többdimenziós minta esetén a változók között talált összefüggés mekkora valószínűséggel valódi és nem a véletlen műve. A mintához tartozó elemek szabadságfoka: szf=n-2
40 Az eredmény általánosíthatósága a populációra A feltételezett összefüggés általánosításához az szükséges, hogy a korrelációs együttható abszolút értéke nagyobb legyen, mint a 95%-os valószínűségi szinthez (adott szabadságfokon) tartozó érték. Abban az estben, ha 99% vagy 99,9%-os értéken végezzük az összevetést, a felfedett kapcsolat még nagyobb valószínűséggel általánosítható.
Kereszttáblák 41 Az ilyen csoportosítások megjelenítésére és a szempontok közötti összefüggések vizsgálatára alkalmasak a kontingenciatáblák vagy kereszttáblák. A kereszttáblákat két változó összefüggésének vizsgálatához használjuk.
Chi-négyzet 42 (Kereszttáblák) Ezt a statisztikát arra használjuk, hogy azt a hipotézist, miszerint a sor és oszlopváltozók függetlenek, ellenôrizhessük. Nem jól használható, ha bármelyik cellában a peremeloszlások alapján várható érték (expected value) kisebb 1-nél, vagy a cellák több mint 20%-ban ez az érték kisebb mint 5.
Chi-négyzet 43 (Kereszttáblák) A Pearson chi-négyzet a legelterjedtebb forma, a likelihoodratio chi-négyzet a max. likelihood elméleten alapszik.
Kereszttáblák alkalmazása 44
Kereszttáblák alkalmazása 45 Display clustered bar charts: olyan oszlopdiagramot közöl, amely a kereszttábla egyes celláihoz tartozók elemszámát mutatja Suppress tables: a kereszttáblát nem, csak a statisztikákat közli A Format gomb lenyomása után megjelenô dialógus dobozban a táblázat formátumát adhatjuk meg. A Crosstabs ablakon belül lehetőségünk van arra, hogy beállítsuk, milyen adatokat akarunk a cellákban megjeleníteni: Cells
Kereszttáblák alkalmazása 46
Kereszttáblák alkalmazása 47 Counts Observed: a megfigyelt gyakoriságok Expected: a várt gyakoriságok, az adott cellába eső megfigyelések száma a sor- és az oszlopváltozó függetlensége esetén Percentages Row (sor): sorszázalék Column (oszlop): oszlopszázalék Total (teljes): totálszázalék. Az adott cellába eső esetek aránya az összes megfigyelthez képest.
Beállítás: Statistics 48 Chi-square: azt a nullhipotézist teszteli, anélkül, hogy számot adna kapcsolatuk irányáról és erősségéről. Correlation: Pearson's R: két, legalább intervallum szintű, változó lineáris összefüggésének mérésére alkalmas mérőszám. Értéke a -1; 1 zárt intervallumba esik. A negatív értékek negatív (az egyik változó értékének emelkedésével a másik értéke csökken), a pozitívak pozitív összefüggést jelentenek (az egyik változó értékének emelkedésével a másik értéke is nő), ahol a 1 és 1 a teljes lineáris meghatározottságot a 0 pedig azt jelenti, hogy a két változó között nincs lineáris összefüggés vagy más szavakkal a két változó korrelálatlan.
Beállítás: Statistics 49 Nominal Data: (nominális adatok) Phi and Cramer s V: 2 alapú asszociációs mérőszám. Értéke 0; 1 között mozoghat, ahol a 0 érték azt jelenti, hogy egyáltalán nincs kapcsolat a két változó között, míg az 1 érték tökéletes statisztikai együttjárást jelez. 2 2-s táblánál Phi-t használunk, nagyobbra Cramer s V-t.
Beállítás: Statistics 50 Lambda: asszociációs mérőszám, amelynek segítségével azt vizsgáljuk, hogy az egyik változó értékeinek megtippelésekor mekkora aránylagos hibacsökkenést okoz a másik változó ismerete. Értéke 0; 1 között mozoghat, ahol 1 jelzi a tökéletes statisztikai együttjárást. Gamma: asszociációs mérőszám. A lambdához hasonlóan ez is azon alapul, hogy mennyire segíti az egyik változó ismerete a másik értékének előrejelzését. De a gammánál nem a pontos értékére tippelünk, hanem az értékek ordinális elrendezésére, nagyságviszonyára. Értéke -1; 1 közé eshet és így a kapcsolat nagyságán kívül annak irányára is utal.
Beállítás: Cell Display 51
Eredmények_1 52
Eredmények_2 53
Eredmények_3 54
Eredmények_4 55
Parancsbeállító menűsor -OLAP 56 OLAP - az adatok középérték mérőszámait állítja elő
57 Statisztikai jellemző beállítás - OLAP
OLAP eredményeket bemutató 58 tábla OLAP Cubes sorszám: Total Sum N Mean Std. Deviation % of Total N feladat_1 39 17 2,29 1,312 100,0% feladat_2 27 17 1,59 1,543 100,0% feladat_3 18 17 1,06 1,478 100,0% feladat_4 33 17 1,94 1,478 100,0% feladat_5 45 17 2,65,996 100,0% feladat_6 30 17 1,76 1,522 100,0% feladat_7 24 17 1,41 1,543 100,0% feladat_8 45 17 2,65,996 100,0%