SPSS ALAPISMERETEK. T. Parázsó Lenke

Hasonló dokumentumok
A statisztika alapjai - Bevezetés az SPSS-be -

Bevezetés az SPSS program használatába

A KUTATÁSMÓDSZERTAN MATEMATIKAI ALAPJAI MA. T.P.Lenke

Dr. Szőke Szilvia Dr. Balogh Péter: Nemparaméteres eljárások

Statisztikai hipotézisvizsgálatok. Paraméteres statisztikai próbák

Sztochasztikus kapcsolatok

A statisztika alapjai - Bevezetés az SPSS-be -

Segítség az outputok értelmezéséhez

[Biomatematika 2] Orvosi biometria

Hipotézis, sejtés STATISZTIKA. Kétmintás hipotézisek. Tudományos hipotézis. Munkahipotézis (H a ) Nullhipotézis (H 0 ) 11. Előadás

Dr. Nagy Zita Barbara igazgatóhelyettes KÖVET Egyesület a Fenntartható Gazdaságért november 15.

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió

Statisztika I. 11. előadás. Előadó: Dr. Ertsey Imre

Khi-négyzet eloszlás. Statisztika II., 3. alkalom

(Independence, dependence, random variables)

Adatelemzés SAS Enterprise Guide használatával. Soltész Gábor solteszgabee[at]gmail.com

Az első lépések SPSS-ben.

Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

Matematikai alapok és valószínőségszámítás. Középértékek és szóródási mutatók

Mintavétel fogalmai STATISZTIKA, BIOMETRIA. Mintavételi hiba. Statisztikai adatgyűjtés. Nem véletlenen alapuló kiválasztás

Microsoft Excel Gyakoriság

STATISZTIKA. A maradék független a kezelés és blokk hatástól. Maradékok leíró statisztikája. 4. A modell érvényességének ellenőrzése

SZÁMÍTÓGÉPES ADATFELDOLGOZÁS

Korrelációs kapcsolatok elemzése

Tárgy- és névmutató. C Cox & Snell R négyzet 357 Cramer-V 139, , 151, 155, 159 csoportok közötti korrelációs mátrix 342 csúcsosság 93 95, 102

Kvantitatív statisztikai módszerek

Hipotézis vizsgálatok

Korreláció és lineáris regresszió

MARKETINGKUTATÁS II. Oktatási segédanyag. Budapest, február

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Matematikai statisztika c. tárgy oktatásának célja és tematikája

Leíró statisztika. Adatok beolvasása az R-be és ezek mentése

Két diszkrét változó függetlenségének vizsgálata, illeszkedésvizsgálat

Kutatásmódszertan és prezentációkészítés

STATISZTIKA. András hármas. Éva ötös. Nóri négyes. 5 4,5 4 3,5 3 2,5 2 1,5 ANNA BÉLA CILI 0,5 MAGY. MAT. TÖRT. KÉM.

Varianciaanalízis 4/24/12

Esetelemzések az SPSS használatával

Korreláció számítás az SPSSben

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Az MS Excel táblázatkezelés modul részletes tematika listája

Az első számjegyek Benford törvénye

Statisztika I. 9. előadás. Előadó: Dr. Ertsey Imre

A leíró statisztikák

III. Kvantitatív változók kapcsolata (korreláció, regresszió)

Elemi statisztika. >> =weiszd= << december 20. Szerintem nincs sok szükségünk erre... [visszajelzés esetén azt is belerakom] x x = n

Adatok statisztikai értékelésének főbb lehetőségei

V. Gyakorisági táblázatok elemzése

Függetlenségvizsgálat, Illeszkedésvizsgálat

Bevezetés a hipotézisvizsgálatokba

Statisztika I. 10. előadás. Előadó: Dr. Ertsey Imre

Többváltozós lineáris regressziós modell feltételeinek tesztelése I.

Bevezetés a Korreláció &

Az OECD PISA adatbázis elemzése

Matematikai geodéziai számítások 6.

Centura Szövegértés Teszt

Korrel aci os egy utthat ok febru ar 29.

Microsoft Excel 2010

Számítógépes döntéstámogatás OPTIMALIZÁLÁSI FELADATOK A SOLVER HASZNÁLATA

Adatmanipuláció, transzformáció, szelekció SPSS-ben

Eloszlás-független módszerek (folytatás) 14. elıadás ( lecke) 27. lecke khí-négyzet eloszlású statisztikák esetszámtáblázatok

Statisztikai táblázatok, kimutatások (Pivot) készítése

Táblázatkezelés Excel XP-vel. Tanmenet

1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása

Algoritmus terv 3. Fejezet: Folyamatok meghatározása

Hogyan lehet Pivot tábla segítségével komplex adatokat elemezni és bemutatni?

[Biomatematika 2] Orvosi biometria

STATISZTIKA. Egymintás u-próba. H 0 : Kefir zsírtartalma 3% Próbafüggvény, alfa=0,05. Egymintás u-próba vagy z-próba

Táblázatok. Táblázatok beszúrása. Cellák kijelölése

Elemi statisztika fizikusoknak

Biostatisztika VIII. Mátyus László. 19 October

Teljesítményprognosztizáló program FELHASZNÁLÓI KÉZIKÖNYV

biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás

A telefonnal való ellátottság kapcsolata a rádió és televízió műsorszórás használatával a 14 éves és idősebb lakosság körében

Többváltozós lineáris regressziós modell feltételeinek

Biomatematika 2 Orvosi biometria

Statisztikai programcsomagok

Eloszlás-független módszerek 13. elıadás ( lecke)

Kiválasztás. A változó szerint. Rangok. Nem-paraméteres eljárások. Rang: Egy valamilyen szabály szerint felállított sorban elfoglalt hely.

MÉRÉSKIÉRTÉKELÉS ÚTMUTATÓ A PSPP PROGRAM HASZNÁLATÁHOZ. PMMK Környezetmérnöki Tanszék Összeállította: dr. Vétek Lajos

Matematikai alapok és valószínőségszámítás. Statisztikai változók Adatok megtekintése

REL REL. Histogramok A második kép anormál eloszlással összevetve. minden változó értéket külön-külön vesz figyelembe

Q1 = 1575 eft Me = 2027,7778 eft Q3 = 2526,3158 eft

Virág Katalin. Szegedi Tudományegyetem, Bolyai Intézet

Matematikai geodéziai számítások 6.

Biostatisztika Összefoglalás

Avery Design Pro 4.0

EuroOffice Modeller felhasználói útmutató

Statisztika elméleti összefoglaló

KÖZPONTI STATISZTIKAI HIVATAL. Szóbeli vizsgatevékenység

[Biomatematika 2] Orvosi biometria. Visegrády Balázs

y ij = µ + α i + e ij

Hipotézis vizsgálatok

PEDAGÓGIAI KUTATÁS KVANTITATÍV MÓDSZEREI. T. Parázsó Lenke

Korreláció és Regresszió

Táblázatkezelés Excel XP-vel. Tanmenet

Erőforrások hozzárendelése tevékenységekhez

Esetelemzés az SPSS használatával

Rácsvonalak parancsot. Válasszuk az Elsődleges függőleges rácsvonalak parancs Segédrácsok parancsát!

Biomatematika 13. Varianciaanaĺızis (ANOVA)

Statisztikai szoftverek esszé

Átírás:

SPSS ALAPISMERETEK T. Parázsó Lenke

2 Statistical Package for Social Scienses Statisztikai programcsomag a szociológiai tudományok számára 1968-ban Norman H. Nie, C.Handlai Hull és Dale H. Bent alkották meg az SPSS alapjait, 70-es években továbbfejlesztették a Chicagói Egyetemen. 1992-ben megjelent a Windows alatt futó változata, ez averzió vált elterjedtebbé a felhasználók körében. 1997 2003 vállalati alkalmazások elterjedése 2004 Predectiv elemzések ideje 2007 Java alkalmazások 2009 SPSS PASW

SPSS munkaterületei 3 MS Windows család tagja, minták statisztikai elemzését végezhetjük el segítségével. A programot kizárólag a megnevezett intézmények oktatói és tanulói használhatják: kutatás, egyetemi oktatás és fejlesztés céljára. Munkaterületei: Data adatmátrix Output eredmények Chart diagram ablak

Változók 4

Az SPSS beköszöntő oldala 5 Már mentett adatbázis megnyitása Tárgyszavas és címszavas megnyitás, keresése Új adat beírása Meglévő könyvtárak és fájlok megnyitása Adatbázis konvertáló megnyitása

Az SPSS beköszöntő oldala 6

7 Különböző kiterjesztésű adatok konvertálása

Az adatbázis 8 Az oszlopok, más szóval mezők vagy változók, a kérdőív kérdéseinek, a sorok, vagy rekordok illetve elemek, a válaszadóknak felelnek meg.

Az adatbázis definiálása 9

Adat 10 Az oszlopok, más szóval mezők vagy változók, a kérdőív kérdéseinek, a sorok, vagy rekordok illetve elemek, a válaszadóknak felelnek meg.

Az adat jellemzői_1 11 VARIABLE NAME a kijelölt oszlopba feltüntetett változók megnevezését határozzuk meg. TYPE LABELS MISSING VALUES COLUMN FORMAT a változó típusát jelöljük meg a változó címkéjét definiáljuk az adathiány kódja, ahol a hiányzó adatokat kódolhatjuk a cella formázása

Adat típusa 12

A File menű 13

14 Define Labels a változók definiálása A változók neveit Value - cimkékkel látjuk el Value label a változók magyarázatai

15 Define Missing Values- az adathiány ellenőrzése Ha a feldolgozás során nem kell számolni adathiánnyal, akkor a legfelső, No missing values pontot jelöljük meg. Abban az esetben, ha hibás értékekkel is számolni kell, az alábbi 3 beállítási lehetőségünk van:

Define Missing Values- Hiba 16

17 Hibás értékek adathiány ellenőrzése

18 Hibás értékek adathiány ellenőrzése_2 File Display Data Info

Keretrendszer kialakítása 19

Oszlop formázás 20 A lehulló ablak az oszlop szélességének és a beleírt szöveg igazítására ad lehetőséget.

SPSS adatfelvitel 21

Sor és oszlop beszúrás 22

Az adatbázis 23 az oszlopok, más szóval mezők vagy változók, a kérdőív kérdéseinek, a sorok, vagy rekordok illetve elemek, a válaszadóknak felelnek Médiainformatikai meg. Intézet

Adatfelvitel 24

Grafikai ábrázolás 25 kördiagram

Hisztogram 26

Halmozott oszlopdiagram 27

Tő és levél (Steam snd leaf plot) 28

Boksz-Plot ábra 29

Pókháló, sugár 30

Adatfájlok statisztikai elemzése 31 OLAP

A középérték mérőszámai 32

Statisztikai jellemzők 33

Gyakoriság 34

Gyakoriság_2 35

Eredmény 36

Kovarancia Két adathalmaz adatpárjai közötti eltérések szorzatának átlagát számolja megadja két egymástól különböző változó együttmozgását. n számú x, y értékpár esetében a minta kovarianciája az alábbi képlettel határozható meg: n ( x i i x) ( yi y) n 37 37

Korrelációs együttható 38 A korrelációszámítást többdimenziós minták vizsgálatakor, a minta elemeihez rendelt adatok közötti összefüggés feltárását szolgálja. A korrelációs együttes szignifikancia vizsgálata megmutatja, hogy egy adott, többdimenziós minta esetén a változók között talált összefüggés mekkora valószínűséggel valódi és nem a véletlen műve. r xy r táblázat r xy r táblázat a két minta korrelációs összefüggése az oszlopnak megfelelő valószínűséggel nem a véletlen műv, vagyis általánosítható a korrelációs összefüggés mértékét nem lehet áltatlánosítani, vagyis a mintában észlelt kapcsolat a véletlen műve

A korrelációs együttható 39 szignifikanciája A korrelációs együttes szignifikancia vizsgálata megmutatja, hogy egy adott, többdimenziós minta esetén a változók között talált összefüggés mekkora valószínűséggel valódi és nem a véletlen műve. A mintához tartozó elemek szabadságfoka: szf=n-2

40 Az eredmény általánosíthatósága a populációra A feltételezett összefüggés általánosításához az szükséges, hogy a korrelációs együttható abszolút értéke nagyobb legyen, mint a 95%-os valószínűségi szinthez (adott szabadságfokon) tartozó érték. Abban az estben, ha 99% vagy 99,9%-os értéken végezzük az összevetést, a felfedett kapcsolat még nagyobb valószínűséggel általánosítható.

Kereszttáblák 41 Az ilyen csoportosítások megjelenítésére és a szempontok közötti összefüggések vizsgálatára alkalmasak a kontingenciatáblák vagy kereszttáblák. A kereszttáblákat két változó összefüggésének vizsgálatához használjuk.

Chi-négyzet 42 (Kereszttáblák) Ezt a statisztikát arra használjuk, hogy azt a hipotézist, miszerint a sor és oszlopváltozók függetlenek, ellenôrizhessük. Nem jól használható, ha bármelyik cellában a peremeloszlások alapján várható érték (expected value) kisebb 1-nél, vagy a cellák több mint 20%-ban ez az érték kisebb mint 5.

Chi-négyzet 43 (Kereszttáblák) A Pearson chi-négyzet a legelterjedtebb forma, a likelihoodratio chi-négyzet a max. likelihood elméleten alapszik.

Kereszttáblák alkalmazása 44

Kereszttáblák alkalmazása 45 Display clustered bar charts: olyan oszlopdiagramot közöl, amely a kereszttábla egyes celláihoz tartozók elemszámát mutatja Suppress tables: a kereszttáblát nem, csak a statisztikákat közli A Format gomb lenyomása után megjelenô dialógus dobozban a táblázat formátumát adhatjuk meg. A Crosstabs ablakon belül lehetőségünk van arra, hogy beállítsuk, milyen adatokat akarunk a cellákban megjeleníteni: Cells

Kereszttáblák alkalmazása 46

Kereszttáblák alkalmazása 47 Counts Observed: a megfigyelt gyakoriságok Expected: a várt gyakoriságok, az adott cellába eső megfigyelések száma a sor- és az oszlopváltozó függetlensége esetén Percentages Row (sor): sorszázalék Column (oszlop): oszlopszázalék Total (teljes): totálszázalék. Az adott cellába eső esetek aránya az összes megfigyelthez képest.

Beállítás: Statistics 48 Chi-square: azt a nullhipotézist teszteli, anélkül, hogy számot adna kapcsolatuk irányáról és erősségéről. Correlation: Pearson's R: két, legalább intervallum szintű, változó lineáris összefüggésének mérésére alkalmas mérőszám. Értéke a -1; 1 zárt intervallumba esik. A negatív értékek negatív (az egyik változó értékének emelkedésével a másik értéke csökken), a pozitívak pozitív összefüggést jelentenek (az egyik változó értékének emelkedésével a másik értéke is nő), ahol a 1 és 1 a teljes lineáris meghatározottságot a 0 pedig azt jelenti, hogy a két változó között nincs lineáris összefüggés vagy más szavakkal a két változó korrelálatlan.

Beállítás: Statistics 49 Nominal Data: (nominális adatok) Phi and Cramer s V: 2 alapú asszociációs mérőszám. Értéke 0; 1 között mozoghat, ahol a 0 érték azt jelenti, hogy egyáltalán nincs kapcsolat a két változó között, míg az 1 érték tökéletes statisztikai együttjárást jelez. 2 2-s táblánál Phi-t használunk, nagyobbra Cramer s V-t.

Beállítás: Statistics 50 Lambda: asszociációs mérőszám, amelynek segítségével azt vizsgáljuk, hogy az egyik változó értékeinek megtippelésekor mekkora aránylagos hibacsökkenést okoz a másik változó ismerete. Értéke 0; 1 között mozoghat, ahol 1 jelzi a tökéletes statisztikai együttjárást. Gamma: asszociációs mérőszám. A lambdához hasonlóan ez is azon alapul, hogy mennyire segíti az egyik változó ismerete a másik értékének előrejelzését. De a gammánál nem a pontos értékére tippelünk, hanem az értékek ordinális elrendezésére, nagyságviszonyára. Értéke -1; 1 közé eshet és így a kapcsolat nagyságán kívül annak irányára is utal.

Beállítás: Cell Display 51

Eredmények_1 52

Eredmények_2 53

Eredmények_3 54

Eredmények_4 55

Parancsbeállító menűsor -OLAP 56 OLAP - az adatok középérték mérőszámait állítja elő

57 Statisztikai jellemző beállítás - OLAP

OLAP eredményeket bemutató 58 tábla OLAP Cubes sorszám: Total Sum N Mean Std. Deviation % of Total N feladat_1 39 17 2,29 1,312 100,0% feladat_2 27 17 1,59 1,543 100,0% feladat_3 18 17 1,06 1,478 100,0% feladat_4 33 17 1,94 1,478 100,0% feladat_5 45 17 2,65,996 100,0% feladat_6 30 17 1,76 1,522 100,0% feladat_7 24 17 1,41 1,543 100,0% feladat_8 45 17 2,65,996 100,0%