1. BEVEZETÉS A TÁRSADALOMSTATSZTIKÁBA

Hasonló dokumentumok

A statisztika alapjai - Bevezetés az SPSS-be -

Bevezetés az SPSS program használatába

A statisztika alapjai - Bevezetés az SPSS-be -

Statisztikai programcsomagok gyakorlat Pót zárthelyi dolgozat megoldás

Bevezető Mi a statisztika? Mérés Csoportosítás

Sta t ti t s i zt z i t k i a 1. előadás

Statisztikai alapfogalmak

[GVMGS11MNC] Gazdaságstatisztika

Sta t ti t s i zt z i t k i a 3. előadás

Matematikai alapok és valószínőségszámítás. Középértékek és szóródási mutatók

Adatmanipuláció, transzformáció, szelekció SPSS-ben

Orvosi szociológia (1. szeminárium) KUTATÁSMÓDSZERTAN

Statisztikai hipotézisvizsgálatok. Paraméteres statisztikai próbák

A mérés problémája a pedagógiában. Dr. Nyéki Lajos 2015

Bevezető Adatok rendezése Adatok jellemzése Időbeli elemzés. Gazdaságstatisztika KGK VMI

2. előadás. Viszonyszámok típusai

Adatelemzés SAS Enterprise Guide használatával. Soltész Gábor solteszgabee[at]gmail.com

Mintavétel fogalmai STATISZTIKA, BIOMETRIA. Mintavételi hiba. Statisztikai adatgyűjtés. Nem véletlenen alapuló kiválasztás

Matematika feladatbank I. Statisztika. és feladatgyűjtemény középiskolásoknak

Eseményalgebra. Esemény: minden amirl a kísérlet elvégzése során eldönthet egyértelmen hogy a kísérlet során bekövetkezett-e vagy sem.

y ij = µ + α i + e ij

Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus.

Microsoft Excel Gyakoriság

Dr. Szőke Szilvia Dr. Balogh Péter: Nemparaméteres eljárások

SPSS ALAPISMERETEK. T. Parázsó Lenke

Bevezető Adatok rendezése Adatok jellemzése Időbeli elemzés

KÖZPONTI STATISZTIKAI HIVATAL. Szóbeli vizsgatevékenység

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

matematikai statisztika

MS ACCESS 2010 ADATBÁZIS-KEZELÉS ELMÉLET SZE INFORMATIKAI KÉPZÉS 1

Az első lépések SPSS-ben.

Megoldások. Az ismérv megnevezése közös megkülönböztető szeptember 10-én Cégbejegyzés időpontja

6. Előadás. Vereb György, DE OEC BSI, október 12.

Feladatok: pontdiagram és dobozdiagram. Hogyan csináltuk?

18. modul: STATISZTIKA

Excel. Nem összefügg tartomány kijelölése: miután a tartomány els részét kijelöltük, lenyomjuk és nyomva tartjuk a CTRL gombot.

Kutatásmódszertan és prezentációkészítés

Keresés a MarketLine Advantage adatbázisban

Tantárgyfelosztás. I. Ellenőrzés. Mielőtt hozzákezd a tantárgyfelosztás tervezéséhez, ellenőrizze le, illetve állítsa be a következőket:

Matematikai alapok és valószínőségszámítás. Statisztikai változók Adatok megtekintése

STATISZTIKA I. A változók mérési szintjei. Nominális változók. Alacsony és magas mérési szint. Nominális változó ábrázolása

Statisztikai táblázatok, kimutatások (Pivot) készítése

VRV Xpressz Használati Útmutató

Tárgy- és névmutató. C Cox & Snell R négyzet 357 Cramer-V 139, , 151, 155, 159 csoportok közötti korrelációs mátrix 342 csúcsosság 93 95, 102

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió

Statisztika I. 1. előadás. Előadó: Dr. Ertsey Imre

TÍPUSDOKUMENTUMOK KÉSZÍTÉSE

Táblázatkezelés 5. - Függvények

Függetlenségvizsgálat, Illeszkedésvizsgálat

Microsoft Excel 2010

Biomatematika 2 Orvosi biometria

y ij = µ + α i + e ij STATISZTIKA Sir Ronald Aylmer Fisher Példa Elmélet A variancia-analízis alkalmazásának feltételei Lineáris modell

Órarendkészítő szoftver

Kérem, ismerkedjen meg a DigitAudit program AuditTeszt moduljának Adatok tesztelése menüpontjával.

Viszonyszám A B. Viszonyszám: két, egymással kapcsolatban álló statisztikai adat hányadosa, ahol A: a. viszonyítadóadat

ELTE TáTK Közgazdaságtudományi Tanszék GAZDASÁGSTATISZTIKA. Készítette: Bíró Anikó. Szakmai felelős: Bíró Anikó június

Adatok statisztikai értékelésének főbb lehetőségei

Dr. Nagy Zita Barbara igazgatóhelyettes KÖVET Egyesület a Fenntartható Gazdaságért november 15.

Statisztika I. 8. előadás. Előadó: Dr. Ertsey Imre

Áruforgalom tervezése. 1. óra A gazdasági statisztika alapjai Alapfogalmak, viszonyszámok

Statisztika I. 11. előadás. Előadó: Dr. Ertsey Imre

TÁMOP-4.2.2/B-10/ Tantárgyi program (rövidített)

SZÁMÍTÓGÉPES ADATFELDOLGOZÁS

Az importálás folyamata Felhasználói dokumentáció verzió 2.1.

MATEMATIKA ÉRETTSÉGI TÍPUSFELADATOK EMELT SZINT Statisztika

Diagram létrehozása. 1. ábra Minta a diagramkészítéshez

Az MS Excel táblázatkezelés modul részletes tematika listája

Matematikai alapok és valószínőségszámítás. Normál eloszlás

Eloszlás-független módszerek (folytatás) 14. elıadás ( lecke) 27. lecke khí-négyzet eloszlású statisztikák esetszámtáblázatok

QGIS gyakorló. --tulajdonságok--stílus fül--széthúzás a terjedelemre).

Statisztika 2. Dr Gősi Zsuzsanna Egyetemi adjunktus

5. Előadás. Grafikus ábrázolás Koncentráció elemzése

Statisztikai szoftverek esszé

A d m i n i s z t r á c i ó s f e l a d a t o k a I n t e g r á l t K ö n y v t á r i R e n d s z e r b e n

Számítógépes döntéstámogatás OPTIMALIZÁLÁSI FELADATOK A SOLVER HASZNÁLATA

STATISZTIKA. András hármas. Éva ötös. Nóri négyes. 5 4,5 4 3,5 3 2,5 2 1,5 ANNA BÉLA CILI 0,5 MAGY. MAT. TÖRT. KÉM.

Bevezetés a biometriába Dr. Dinya Elek egyetemi tanár. PhD kurzus

STATISZTIKA I. Változékonyság (szóródás) A szóródás mutatószámai. Terjedelem. Forgalom terjedelem. Excel függvények. Függvénykategória: Statisztikai

Két diszkrét változó függetlenségének vizsgálata, illeszkedésvizsgálat

Statisztikai alapok. Leíró statisztika Lineáris módszerek a statisztikában

Általános statisztika II. Kriszt, Éva Varga, Edit Kenyeres, Erika Korpás, Attiláné Csernyák, László

Mveletek a relációs modellben. A felhasználónak szinte állandó jelleggel szüksége van az adatbázisban eltárolt adatok egy részére.

Segítség az outputok értelmezéséhez

Választó lekérdezés létrehozása

biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás

A leíró statisztikák

Statisztikai alapfogalmak

Mi az adat? Az adat elemi ismeret. Az adatokból információkat

TÁRKI ADATFELVÉTELI ÉS ADATBANK OSZTÁLYA. Változás SPSS állomány neve: Budapest, 2002.

Az Éves adóbevallás 2005 modul ismertetése

Az értékelés során következtetést fogalmazhatunk meg a

Erőforrások hozzárendelése tevékenységekhez

3. Ezután a jobb oldali képernyő részen megjelenik az adatbázistábla, melynek először a rövid nevét adjuk meg, pl.: demo_tabla

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1

Brósch Zoltán (Debreceni Egyetem Kossuth Lajos Gyakorló Gimnáziuma) Megoldások

Táblázatok. Táblázatok beszúrása. Cellák kijelölése

Táblázatkezelés 2. - Adatbevitel, szerkesztés, formázás ADATBEVITEL. a., Begépelés

[Biomatematika 2] Orvosi biometria

Csoport(Cluster) analízis SPSS-el: K-alapú csoport Analízis

M-Fájlok létrehozása MATLAB-ban

Átírás:

Tartalomjegyzék. BEVEZETÉS A TÁRSADALOMSTATSZTIKÁBA..... Mi a statisztika?..... Alapfogalmak... 4.3. Mérési szintek... 7.4. Adatbázisok létrehozása, címkézés... 9.5. Az SPSS által kezelt adatállományok, adatbázisok összekapcsolása, esetek leválogatása... 3.6. Változók átalakítása... 8. EGYVÁLTOZÓS ELEMZÉSEK... 5.. Statisztikai alapmveletek, egyszer elemzések: gyakorisági eloszlások, rangsorok.. 5.. Gyakorisági eloszlások... 8.3. A centrális tendenciák mutatói: átlag, medián, módusz... 35.4. Szórás és szóródás... 45.5. Momentumok, ferdeség és csúcsosság... 53 3. MINTAVÉTEL... 60 3.. Elemi valószínségelmélet. Várható érték... 60 3.. Elemi mintavételi elmélet. Standard hiba... 64 4. KÉTVÁLTOZÓS ELEMZÉSEK... 7 4.. Változók közötti kapcsolatok... 7 4.. Minségi változók közötti kapcsolat... 75 4.3. Vegyes kapcsolat... 9 4.4. Két mennyiségi változó közötti kapcsolat: korreláció... 99 5. TÖBBVÁLTOZÓS ELEMZÉSEK... 08 5.. A többváltozós elemzések fajtái... 08 5.. A faktorelemzés... 3 5.3. A klaszterelemzés... 35 MELLÉKLETEK... 46 A χ -eloszlás táblázata (p0.05, P0,0 és p0,00)... 46 A t -eloszlás táblázata (p0.05, P0,0 és p0,00)... 47 Az SPSS 9.0 program menüsor parancsainak rövid leírása... 48 BIBLIOGRÁFIA... 58

. BEVEZETÉS A TÁRSADALOMSTATSZTIKÁBA.. Mi a statisztika? A statisztika (általános statisztika, matematikai statisztika) a valóság számszer információinak megfigyelésére, összegzésére, elemzésére és modellezésére irányuló gyakorlati tevékenység és tudomány. A statisztika tömegjelenségekkel foglalkozik. Tehát módszeresen megfigyeli a tömegjelenségek tulajdonságait, begyjti a jellemz információkat és feldolgozza, értékeli, elemzi. A statisztika legfbb érdeme, hogy: - információt szolgáltat a megfigyelt jelenségekrl - lehetséget ad a tudományos elemzésekhez - tájékoztat a fontosabb társadalmi-gazdasági folyamatokról (legfontosabb az állami vagy hivatalos statisztika). A statisztika fogalmán az általános és az alkalmazási területhez kötd módszertannak, valamint a gyakorlati tevékenységnek a szorosan összefügg egységét értjük. A statisztika arra szolgál, hogy a valóság tényeinek valamely adott körét tömören, a számok nyelvén jellemezze. A statisztika történeti kialakulása és fejldése A statisztika elször mint gyakorlati, számbavételi tevékenység jelent meg az ókorban. A legkorábbi statisztikai adatok az ókori államokban végrehajtott népszámlálásból származnak. A középkorban a hbérurak földbirtokával összefügg leltározó jelleg összeírásokat végeztek, késbb, a polgári társadalmak kialakulásával pedig egyre ntt az érdekldés a különböz országok földrajzi, politikai és gazdasági viszonyai iránt. Mindezek az úgynevezett német leíró iskola kifejldéséhez vezettek. Maga a statisztika szó is ebbl az idbl származik, a státus (állam) szóból ered. A polgári társadalmak fejldésével a leíró jelleg információk köre bvült, a közöttük lév számszer összefüggések ismeretének igénye pedig kikényszerítette az elemzések módszertani fejlesztését is. Ebben az idben az államszámtant átnevezték politikai aritmetikának ez lett a tudományos elemz statisztika alapja. A legnagyobb elrelépést az a tény képezte, hogy a XVIII-XIX. században meghatározták a valószínség számítás tételeit és ezen tudományág fejldésének hatására alakult ki a mai matematikai statisztika.

A statisztika ágazatai és kapcsolata más tudományokkal Miként ez köztudott, a statisztikának a matematikához való kötdése a legersebb, hiszen a matematika elmélete (fként a valószínség számítás elmélete, lásd III. Fejezet) a szakmai összefüggések leírására megfelel módszertani tárházat nyújt. A statisztika a matematika eredményeit (amelyek alkalmasak a tömegjelenségekben rejl törvényszerségek feltárására) és a szakmai jelenség természetét ismerve alakítja ki módszereit. A statisztikai tevékenység sok irányba ágazik szét, így alakulnak ki a szakstatisztikák. A szakstatisztikák egy-egy terület szakmai összetevit ismerve olyan matematikai módszert választanak, amely az ott elforduló jelenségeket szakmai szempontból is helyesen írja le. A szakstatisztika nem más, mint a társadalmi-gazdasági élet egy-egy területének statisztikai módszerekkel való vizsgálata (pl. gazdaságstatisztika, népességstatisztika stb.). A szakstatisztikán belül is további differenciálódás következik be, de egy szakterületen belül egységes alapelvek érvényesülnek. A társadalomstatisztika A társadalomstatisztika az általános statisztika egy sajátos változata. A társadalomstatisztika is az általános statisztikán alapul, de a vizsgált változók, mutatók és eljárások a társadalmi viszonyok sajátos mérési módjához vannak igazítva, így egyes számítások matematikai értelemben vett pontossága magyarázatra szorul (Mezei-Veres, 00). A mérési szint meghatározása, a mérési hibák befolyása sajátos jelleggel bír a társadalomtudományokban. Megtörténik, hogy egy módszert olyan adatokra is alkalmaznak, amelyek nincsenek kell pontossággal mérve (pl. faktorelemzést alkalmaznak ordinális mérési szint változókon). A társadalomstatisztika ezekkel a problémákkal is meg kell birkózzon. A társadalomtudományi kutatás lépései: Kutatási kérdés Hipotézis készítés ELMÉLET Hipotézis tesztelés Adatelemzés Adatgyjtés A statisztikai elemzés leginkább az Adatelemzés lépcsjéhez köthet. De a kutatás minden lépését a mögöttes elmélet határozza meg, és fordítva, minden lépés eredménye hatással lehet az elméletre. 3

Ebbl következnek a társadalomstatisztika legfontosabb korlátai: - az elemzések eredménye ersen függ a vizsgálatba bevont szempontoktól, változóktól (elméleti kerettl) - a bevont szempontok kiválasztásának mindig szakmai döntésre kell támaszkodnia minden szakmailag releváns szempontot be kell vonni az elemzésbe - a matematikai eszközök mechanikusan nem alkalmazhatók, szükség van szaktudásra (társadalomtudományi ismeretekre). Tehát a statisztikai módszerekkel kapott eredményeket csak megfelel szakmai ismerettel lehet hatékonyan felhasználni, ugyanakkor a korszer társadalomtudományi szakismeret elképzelhetetlen a mennyiségi összefüggések ismerete nélkül. Az eddigi átfogó értékelés helyett a különböz szakterületek igénye az értékelés mélysége fele mutat, amely a módszertani apparátus ismeretén túl igényesebbek a vizsgált szakterület ismeretét (elméleti vonatkozásait) illeten. A statisztikai ismeretek megértésének talán legjelentsebb összetevje a módszerek alkalmazásának gyakorlása. Az elméleti ismeretek segítik a gyakorlást, ám a készségek effektív munka során alakíthatók ki (ez utóbbi jelentsen visszahat az elméleti ismeretek elmélyítésére is), amelyben nagy segítséget nyújtanak a számítógépes programcsomagok. A statisztikai programcsomagok közül a szociológusok által leginkább használt SPSS (Statistical Package for the Social Sciences) Windows alatt futó programjának 9.00-ás alkalmazását ismertetem... Alapfogalmak A szociológiában a társadalmi valóság tömör, számszer jellemzéséhez az operacionalizálás révén jutunk el. Mindezt megelzi a vizsgált területre vonatkozó szakismeret áttekintése, a kutatási kérdések és hipotézisek megfogalmazása és konceptualizálása (lásd Társadalomtudományi kutatási módszerek és technikák tárgy). Ezeket a fázisokat követi maga az operacionalizálás, ami nem más, mint a vizsgált kutatási probléma különböz jellemzinek megadása (kérdíves adatfelvételek esetén a kérdív kérdéseinek megfogalmazása képezi ezt a tevékenységet). Az operacionalizálás elképzelhetetlen a megfigyelési egységek definiálása (a vizsgált sokaság beazonosítása), valamint a mérési eljárások kialakítása (az ismérvek vagy változók megfogalmazása) nélkül. 4

A vizsgálat tárgyát képez egységek összességét, halmazát statisztikai sokaságnak, vagy rövidebben sokaságnak esetleg populációnak nevezzük. A statisztikai sokaság egyedei a statisztikai egységek. Ezek az egységek lehetnek éllények: emberek, pl. a népszámlálás esetén; állatok, a mezgazdasági összeírásoknál; tárgyak, pl. a személygépkocsi állomány állapotának felmérésénél; szervezetek, pl. a vállalkozások IT felszereltségének felmérésekor, események, pl. a kulturális rendezvények vizsgálata esetén, de lehetnek képzett egységek is, pl. a GDP alakulásának vizsgálatakor. Azt, hogy mit tekintünk a statisztikai vizsgálatnál a sokaságnak, mindig a vizsgálat célja dönti el. Ha pl. a Sapientia egyetem hallgatóinak tévénézési szokásait szeretnénk vizsgálni, akkor az alapsokaság nem más, mint az abban az idpontban hallgatói jogviszonnyal rendelkez diákok sokasága. Mivel a valóságban legtöbbször nem áll módunkban a populáció egészérl adatfelvételt készíteni, ezért mintát veszünk és az ilyen módon begyjtött adatokon végzünk statisztikai elemzéseket. A sokaság egységei különböz tulajdonságaik megadásával jellemezhetek. Ezen tulajdonságok egy része a sokaság minden egyes egységére nézve közös, más részük azonban nem. A sokaság tagjai, egységei a vizsgálat tárgyának ismeretében legtöbbször elég egyértelmen adódnak, de vannak olyan esetek is, amikor a sokaság egységei nem különülnek jól el egymástól, hanem csak önkényesen definiálhatóak (vagy a valóságban nem is léteznek). Amikor a valóság jól elkülönül egységekbl áll (számolásnál), diszkrét sokaságról beszélünk, ilyen pl. egy adott településen él lakósok száma. Amikor valóságos, de csak önkényesen elkülöníthet egységekbl áll (két adott érték között elméletileg az összes értéket felveheti), akkor folytonos sokaságról beszélünk, mint pl. a Sapientia egyetem diákjai által egy nap elfogyasztott ásványvíz mennyisége. Ha a sokaság elképzelt egységekbl áll, fiktív sokaságról beszélünk (pl. Románia 009. dec. -i lakósainak száma). Amikor a sokaság csak egy adott idpontra vonatkozóan értelmezhet, álló sokaságnak nevezzük (pl. a lakosság száma 006. március 8-án), amikor csak valamely adott idtartamra vonatkoztatva értelmezhet, mozgó sokaságnak nevezzük (pl. a Hargita megyei munkanélküliek száma a 00-es év folyamán). 5

Ismérv vagy változó Az ismérvek olyan vizsgálati szempontok, amelyek alapján egy sokaság egymást át nem fed részekre bontható. A sokaság egyes egységeinek e felbontásban való elhelyezkedését az egységek adott szempont szerinti tulajdonságai határozzák meg. A valamely szempont szerint lehetséges tulajdonságokat ismérv-változatoknak (attribútumnak) nevezzük. Ha az ismérv változatai számszerek, akkor azokat ismérvértékeknek, magát az ismérvet pedig változónak (a logikailag egymáshoz tartozó attribútumok halmazának) nevezzük. A mindössze két változattal rendelkez ismérveket alternatív ismérveknek (dumy vagy dichotóm változónak) nevezzük. Nézzük az alábbi példát. Kérdíves kutatást készítettünk a Sapientia Egyetem diákjai körében. Ebben az esetben: Sokaság: a 007/008-az tanévben az egyetemmel hallgatói jogviszonyban álló diákok Ismérvek: Ismérvváltozatok: Nem férfi, n Életkor (év) 988, 989, stb. Állandó lakóhely (település neve) Csíkszentgyörgy, Sepsiszentgyörgy, stb. C típusú nyelvvizsga nincs, alapfokú, középfokú, felsfokú Internethasználat igen, nem Magasság (cm) 7, 68, stb. Testsúly (kg) 48, 66, stb. Fizikai állapotával való elégedettség elégedetlen, igen is meg nem is, elégedett Látható, hogy a fenti példában alkalmazott ismérvek nem ugyanolyan jelleg információt hordoznak. Az életkor, magasság és testsúly ismérvek ismérvváltozatai konkrét számértékek, amelyekkel akár mveleteket is végezhetünk (például annak megállapítására, hogy a diák hány éves lesz négy év múlva, vagy átlagosan milyen magasak a diákok). Ezzel szemben a nyelvvizsga foka, valamint a fizikai állapotával való elégedettség olyan ismérvek, amelyek ismérvváltozatai nem számértékek, de mégis fennáll valamiféle hierarchia az ismérvváltozatok között, hiszen tudjuk, hogy a középfokú nyelvtudás magasabb szint, mint az alapfokú, stb. A nem, az internethasználat, illetve az állandó lakóhely esetében azonban az ismérvváltozatok egyrészt nem számértékek, másrészt nem áll fenn semmiféle hierarchia sem az egyes ismérvváltozatok között, hiszen nem dönthet el, hogy Csíkszentgyörgyön lakni jobb, vagy rosszabb, mint Sepsiszentgyörgyön, és az sem egyértelmen eldönthet, hogy nnek, vagy férfinek lenni jobb, stb. Ezenkívül a nem és az internethasználat ismérveknek csak két ismérvváltozata lehet, míg a lakóhelynek jóval több. Összefoglalva tehát azt mondhatjuk, hogy mivel a statisztikai egységek tulajdonságainak észlelése és rögzítése adat formájában valamiféle mérésnek 6

tekinthet, a különböz ismérveknek más-más mérhetségi tulajdonságaik vannak. Mindez jelentsen befolyásolhatja a statisztikai vizsgálatot. Az ismérvek mérhetségi tulajdonságainak egyik jellemzje a hozzájuk tartozó mérési szint, vagy mérési skála. Bizonyos szabályok betartása mellett egy eredetileg nem mennyiségi ismérv (valamilyen számlálás vagy mérés számszer eredményeit rendeli hozzá a sokaság egységeihez) lehetséges változatai számértékké alakíthatóak, kódolhatók. Ilyen módon bármely észlelt tulajdonság szám formájában történ rögzítése az egységek számokkal való jellemzésének, azaz mérésnek tekinthet. De miként a fenti példából is kitnik, egyáltalán nem mindegy, hogy a sokaság egységeihez ilyen módon hozzárendelt számértékek mely tulajdonságai érvényesek a sokaság egységeinek a számértékekkel jellemezni kívánt tulajdonságaira is. Errl szólnak a mérési skálák vagy mérési szintek..3. Mérési szintek A szociológiában négy mérési skálát szokás használni:. nominális, megnevezéses vagy névleges mérési szint. ordinális, rendezési vagy sorrendi mérési szint 3. intervallum vagy különbségi mérési szint 4. arány-skála. Ebbl az els két skálát szokás még minségi, a második kettt pedig mennyiségi mérési skáláknak nevezni. A nominális skála a legegyszerbb és legkevésbé informatív mérési fokozat. Csak az egységekhez rendelt számértékek egyez vagy különböz voltát engedi meg az egységeket ténylegesen is jellemz tulajdonságként elfogadni. Az egységekhez hozzátartozó számértékeknek nincs mértékegysége, tulajdonképpen csupán egy megkülönböztet címkérl beszélhetünk. A kódszámok közti különbségeknek, azok hányadosának vagy a nagyságrendjének nincsen semmi értelme, viszont az egységek csoportosítására kiválóan alkalmas. A fenti példánkban ilyen mérési szint változó a nem, az állandó lakhely és az internethasználat. Az ordinális skála esetében nemcsak a skálaértékek azonos vagy nem azonos volta, hanem azok sorrendisége is az egységek között fennálló valós viszonyokat írja le. Az egységekhez hozzárendelt számértékek sorrendje az adott egységek valamilyen szempontból vett sorrendjét mutatja (az egyes attribútumok a vizsgált tulajdonsággal 7

relatíve kisebb vagy nagyobb mértékben rendelkeznek). A skálaértékek bármilyen, az egységek adott sorrendjét megtartó számértékek lehetnek, hiszen maguk a számértékek nem hordoznak információt, csakis azoknak sorrendje. Akár csak a nominális mérési szint változók esetében, ezeknek a számértékeknek sincs mértékegysége, valamint a skálaértékek különbsége sem informatív, továbbá nincs értelme a skálaértékekkel végzett más mveleteknek sem. A fenti példánkban ilyen mérési szint változó a nyelvvizsga, valamint a fizikai állapottal való elégedettség. Az intervallum skála a szó szoros értelmében is mérést jelent, mivel a mennyivel nagyobb kérdésre is választ tudunk adni. A skálaértékek különbségei is valós információt nyújtanak a sokaság egységeirl, valamint e skálának már valamilyen mértékegység is a szerves tartozékát képezi. A skála kezdpontja a 0-pont, azonban ez önkényes, illetve valamilyen konvención alapszik - ez lehetetlenné teszi a skálaértékek egymás közötti arányának meghatározását. A szociológiai adatfelvételekkor ritkán találkozunk intervallum skálával, a fenti példánk sem tartalmaz ilyen változót. A klasszikus példa intervallum mérési szint változóra a hmérséklet, hiszen nincs abszolút 0 pont, a víz fagyáspontjának választása esetleges, függ az alapul vett hmérsékleti skálától. Példa. A 0 0 C és 0 0 C hmérséklet közötti különbség Fahrenheit skálán mérve is ugyanannyi, mint a 5 0 C és 5 0 C közötti különbség (a különbségnek valós értelme van). F 9*C/5 + 3 a. 0 0 C 9*0/5 + 3 50 0 F b. 0 0 C 9*0/5 + 3 68 0 F c. -5 0 C 9*(-5)/5 + 3 3 0 F d. 5 0 C 9*5/5 + 3 4 0 F 0 0 C 0 0 C 0 0 C 68 0 F 50 0 F 8 0 F 5 0 C (-5) 0 C 0 0 C 4 0 F 3 0 F 8 0 F. A 0 0 C és az 5 0 C hmérséklet egymáshoz viszonyított aránya nem független az alapul vett hmérsékleti skálától (az arányoknak nincs értelme). 0 0 C 68 0 F (b.) 5 0 C 4 0 F (c.) 68 0 F/4 0 F,66 0 0 C/5 0 C 4 8

Az arány-skála a legtöbb információt nyújtó mérési szint. Már a kezdpont is egyértelmen adott és rögzített, bármely két skála-érték egymáshoz viszonyított aránya is egyértelmen meghatározható, azaz információt hordoz. A fenti példánkban ilyen mérési szint változó az életkor, magasság és testsúly változók. A mérési szintek egymáshoz való viszonya A mérési szintek bemutatott sorrendje a mérés egymást követ olyan fokozatainak tekinthetk, amelyek a mérés eredményeit kifejez számértékek egyre több tulajdonságának kihasználását teszi lehetvé. Ilyen értelemben a nominális mérési szint a legalacsonyabb, az arány-skála pedig a legmagasabb mérési szint, ugyanakkor egy adott mérési szint változó alacsonyabb szintként is kezelhet. Az ismérvfajták és mérési skálák egymástól való megkülönböztetése azért lényeges, mert más-más fajta elemzést tesznek lehetvé. Az ismérvek fajtája, illetve a mérés adott szintje mindig behatárolja az elemzés egy-egy adott esetben szóba jöv eszközeit, tehát különböz mérési szint változók más-más típusú statisztikai elemzéseket tesznek vagy nem tesznek lehetvé. A mérés adott szintje azonban kétféle értelemben is relatív:. sohasem függetleníthet el teljesen a vizsgálat célkitzéseitl a magas mérési szintek alacsonyabbakká válhatnak. bizonyos elemzési technikák a megkívántnál alacsonyabb mérési szint adatok elemzésére is jól használhatók (pl. faktorelemzés)..4. Adatbázisok létrehozása, címkézés Az adatbázis (adatmátrix) nem más, mint a kutatás során a sokaság (vagy minta) elemeirl begyjtött adatok halmaza. Az adatokat kódolt és rendszerezett formában szokás elektronikus formában rögzíteni, úgy, hogy minden egyes egységünk (esetünk, amely lehet egy megkérdezett személy, szervezet, stb.) külön sorba, minden egyes változónk (ismérvünk, mért tulajdonságuk) pedig külön oszlopba kerüljön. Az adatbázisban minden egyes cellában egyetlen érték szerepelhet. Az operacionalizálás során nyert fogalmak, tulajdonságok a mérés eredményeként elvileg megfeleli lesznek a statisztikai adatbázist alkotó változóknak, de ez a megfelelés nem teljes. Vannak olyan tulajdonságok, amelyeknél a megfeleltetett kérdésbl nem egy, hanem 9

több változó is készül, pontosan azért, hogy a statisztikai feldolgozhatóság kedvéért egy cellában csak egyetlen adat szerepeljen. Adatbázist több programban is létre lehet hozni, Excel-ben, dbase-ben, SPSS-ben, stb. A továbbiakban csak a szociológusok által leggyakrabban használt SPSS programcsomagra (ennek is a 9.0-ás verziójára) fogok kitérni. A példákban és ábrákban használt adatbázis a MOZAIK00 Magyar fiatalok a Kárpát-medencében cím szociológiai kutatás székelyföldi adatbázisa. Az adatbázis formája az SPSS-ben az alábbi ábra szerint néz ki: Változó Változó Változó 6 Eset Eset Eset 7 Adatbázis létrehozása SPSS-el Indítsuk el az SPSS programot! Válasszuk a TYPE IN DATA opciót és kattintsunk az OK gombra. Ha már fut a program, akkor a File fmenüpontban a New pontban válasszuk a Data-t.. Miként a fenti ábrából is kitnik, az SPSS táblázata hasonlít az Excel-ére. Számozott sorok vannak, ahova az egyes esetek/megkérdezettek (cases) adatai fognak kerülni, az oszlopokba (variables) pedig a változók szerepelnek. Els lépésben el kell neveznünk (definiálnunk) az egyes változókat és azok tulajdonságait. Ezt úgy kezdjük, hogy a DATA fmenüpont Define Variable menüpontjára megyünk, vagy duplán klikkelünk az els oszlop var (az els változó) mezjére (a 0.0-s vagy ennél késbbi SPSS-ek ekkor átváltanak a Variable View nézetre). Itt a Variable Name pontnál nevet adunk a változónak (max. 8 karakter hosszúságú lehet, nem kezddhet számmal), amely meg fog jelenni az adatbázis fejlécében (érdemes olyan nevet adni, amivel könnyen beazonosítható, hogy melyik kérdésrl is van szó). A Type pontnál beállítjuk a változó formátumát. Legtöbb esetben numerikus adataink vannak, mivel a kódokat (számokat) sokkal könnyebb 0

bevezetni, mint a szöveget, így az SPSS is alapértelmezésben numerikus adatbevitelre van beállítva. Sokszor azonban elfordul, hogy pl. egy nyílt kérdést nem sikerült kódolni és a szöveget szeretnénk bevezetni ilyenkor a Define Variable Type-nél a string gombra kattintunk. A Labels pontnál felcímkézzük a változónkat, vagyis a Variable Label-nél megadjuk az ismérvünk bármilyen hosszú nevét, a Value Labelnél pedig megadjuk a változóhoz tartozó egyes attribútumokat (minden egyes bevezetett címke után Add -et nyomunk): pl. Variable Label: A megkérdezett neme, Value:, Value Lable: n, majd Add, Value:, Value Lable: férfi (a Remove gombbal törölhetjük, a Change gombbal módosíthatjuk a korábban beírtakat), majd Add és Continue. Visszatérve a Define Variable almenübe, a Missing Values pontnál megadhatjuk, hogy milyen kóddal szerepl eseteket kezeljen az SPSS hiányzó adatként: pl. ha a 0 azt jelentette, hogy valaki nem tud válaszolni és nem szeretnénk a számításainkba bevonni ezt az értéket, a Define Missing Values-nál a 0-t beírjuk a Discrete missing values pontnál, majd Continue-t nyomunk. A Define Variable almenüben még beállítható az oszlopszélességet (Column Format) és az ismérvünk mérési szintje (nominális, ordinális vagy skála, azaz mennyiségi). Amikor több változónk ugyanazokkal az attribútumokkal rendelkezik (pl. megkérdeztük a háztartásban él összes személy foglalkozását, vagy több olyan kérdésünk van, amelyekre igen/nem válaszokat lehet adni), a DATA fmenübl a Templates almenüt választjuk. Ezen belül a Define menü segítségével beállíthatjuk a változó típusát, felcímkézhetjük, megadhatjuk a hiányzó adatok kezelésére vonatkozó

utasításokat (az elzek szerint), majd a Name-re kattintva nevet adunk a változónak (pl. IGENNEM) és Add-et klikkelünk. A következ ilyen típusú változónknál nincs más dolgunk, mint a Templates almenübl kiválasztani a megfelel változót (pl. IGENNEM), az Apply funkcióval bejelöljük, hogy milyen beállításokat szeretnénk az új változónkra alkalmazni, majd Ok-t klikkelünk. Ilyen módon tudunk létrehozni változókat, el tudjuk ket nevezni. Miután megvan a keretfájlunk, nem marad más dolgunk, mint bevezetni az adatokat a kódutasítás (az UTILITIES fmenü File Info pontja segítségével könnyen elkészíthet) szerint. Adatbázisunkat a többi Windows alatt futó programokhoz hasonlóan a FILE fmenü Save vagy Save As menüpontjai segítségével menthetjük meg.

.5. Az SPSS által kezelt adatállományok, adatbázisok összekapcsolása, esetek leválogatása Az SPSS által kezelt adatállományok Az Excel programmal szemben egy SPSS sajátosság, hogy egyszerre csak egy adatbázist lehet megnyitni. Ezért nagyon fontos arra figyelni, hogy amikor több adatbázissal dolgozunk, mindig a megfelel változatot mentsük el. Miként a többi ismert programban is, a megnyitás a FILE fmenü Open almenüjébl történik. Az SPSS több más, nem SPSS (.sav) formátumú adatbázist is be tud olvasni. Ez nyilvánvalóan akkor igen hasznos, amikor nem saját adatbázisból szeretnénk dolgozni, ismerjük az SPSS programcsomagot, viszont a feldolgozandó adatfájlunk nem SPSS-ben készült. A legvalószínbb eset, amikor az adatokat egy Excel file-ba vitték be. Ebben az esetben úgy járunk el, hogy az Excel fájlt 4.0-ás verzióba elmentjük (mivel a magasabb verziók egyszerre több adatbázist is tudnak kezelni, az SPSS pedig csak egyet), bezárjuk, majd SPSS-ben az Open menüpontból (a Files of Type meznél az *.xls kiterjesztés fájlokat jelöljük meg) megnyitjuk az Excel állományt. Amennyiben az Excel fájlunk fejléccel rendelkezik, az opcióknál beállítjuk, hogy az SPSS adatbázisban is maradjon meg a fejléc (Read Variable Names), majd elmentjük SPSS adatbázisként. Adatfájlok összekapcsolása az SPSS-ben A program lehetséget ad különböz SPSS adatbázisok összekapcsolására. Adatmátrixról lévén szó, két lehetségünk van:. olyan adatbázisokat ragasztunk össze, amelyek ugyanazokat a változókat tartalmazzák, de más-más esetekre vonatkoznak (pl. egy kérdíves felmérés kitöltött kérdíveit több személy vezette be számítógépbe úgy, hogy X az A településen lekérdezetteket, Y pedig a B településen lekérdezetteket). olyan adatbázisokat ragasztunk össze, amelyeknél ugyanazok a megfigyelési egységek/esetek, de különböz változók szerepelnek (pl. egy kérdíves felmérés 3

kitöltött kérdíveit több személy vezette be számítógépbe úgy, hogy X minden kérdív els 0 kérdését, Y pedig minden kérdív utolsó 0 kérdését). Az els esetben a DATA fmenü Merge Files, Add Cases menüpontjával, a második esetben a Merge Files, Add Variables menüponttal dolgozunk. Mindkét esetben a megnyíló ablakban kiválasztjuk a megnyitott adatbázishoz kapcsolni kívánt fájlt, majd az Open gombra kattintunk. Mindkét esetben az SPSS lehetséget ad arra, hogy ellenrizzük az új, összeragasztott adatbázis változóit és módosítsunk rajta (a megnyitott adatbázisunk változóit (*)-al, az importált adatbázis változóit pedig (+)-al jelöli). Amikor új változókat szeretnénk hozzáadni az adatbázisunkhoz, mindig figyeljünk arra, hogy az eseteink ugyanabban a sorrendben legyenek mindkét adatbázisban (a DATA, Sort Cases segítségével lehet ugyanazon változó szerint sorba rendezni adatbázisainkat), tehát legalább egy közös változónk kell legyen mindkét adatmátrixban. Megfigyelések leválogatása az SPSS-ben A megfigyelések/esetek szelektálása SPSS sajátosság. Miként a neve is jelzi, olyankor használjuk, amikor nem a teljes adatbázissal, hanem csak annak egy részével kívánunk dolgozni. A leválogatásra több lehetségünk is van a DATA fmenü Select Cases almenüjében. A Select, If condition is satisfied, If meznél egy vagy több változó értékei szerinti feltételes leválogatást hajthatunk végre numerikus és logikai mveletek segítségével. 4

Mint a legtöbb SPSS fablakban, ebben is (baloldalon) megtalálható az összes változó, amivel jelenleg dolgozunk. Jobboldalon helyezkednek el (egy számológépre emlékeztet rész formájában) a különböz mveleti és numerikus gombok. Az ismers mveleti jeleken kívül (+,-, *, /) vannak olyanok is, amelyek az egyszer számológépeken nem találhatók meg. Ilyen pl. az &, a ~ stb., ezek logikai mveletek elvégzését teszik lehetvé, amelyekrl az alábbi táblázat nyújt összefoglalót: Jel Jelentése < Kisebb, mint > Nagyobb, mint < Kisebb vagy egyenl, mint > Nagyobb vagy egyenl, mint Egyenl ~ Egyenltlenség & És Vagy ~ Nem A numerikus gombok mellett található még egy ablak, a Functions, amely elre elkészített utasításokat, függvényeket tartalmaz, egyszerbbeket és kicsit bonyolultabbakat is. Példa Munkaadatbázisunkban (AdatbazisifjusSap.sav) 4-30 éves fiatalokon felvett adatok szerepelnek. Feltételezzük, hogy a továbbiakban csak a 0 évnél idsebb fiatalokról szeretnénk elemzést készíteni, ezért a 4-0 éves fiatalokat kiszrjük. Ekkor a 5

következképpen járunk el: a DATA fmenü Select Cases almenüjében a Select, If condition is satisfied, If mezre kattintva átvisszük a k. (születési év) változót, majd megadjuk a leválogatás feltételét, vagyis, hogy a válotzó értékei legyenek kisebbek, mint 98. Aki 98-ben született, az 00-ben, vagyis az adatfelvétel évében pontosan 0 éves volt (minket az k adataik sem érdekelnek, hiszen csak a -30 évesekrl szeretnénk valamit mondani, ezért a Kisebb, mint, nem pedig a Kisebb vagy egyenl, mint feltételt adjuk meg), aki ennél korábban született, az 0 évnél idsebb. Miután megadtuk a leválogatás feltételét, tehát k. < 98, Continue-t klikkelünk, majd visszaérve a Select Cases almenübe az Ok gombra kattintunk. Az SPSS választási lehetséget kínál, hogy hogyan kezelje a leválogatott eseteket (a példánkban a 4-0 éveseket). Alapértelmezésben a Filtered, vagyis a (meg)szrt eset szerepel, ami azt jelenti, hogy bár a számításainkban nem jelennek meg, fizikailag továbbra is minden adatunk az adatbázisban van. A második lehetség, hogy kitöröltetünk minden olyan esetet, amelyikkel nem dolgozunk ebben az esetben nagyon kell figyelni arra, hogy a teljes adatbázisunk még valahol meglegyen, mivel mint tudjuk, ennek létrehozása rendkívül idigényes munka. Miként már korábban említésre került, több változó szerint is lehet feltételes leválogatási parancsot adni. Ha tovább szeretnénk szkíteni a kört, és csak pl. Hargita megyei -30 éves fiatalokat szeretnénk vizsgálni, akkor a következképpen adjuk meg a parancsot: k. < 98 & megye. A megye nem más, mint a megkérdezett lakóhelyének megyék szerinti besorolására vonatkozó változó, az -es kód pedig Hargita megyét jelöli. A logikai feltételek közül az és logikai feltételt alkalmazzuk, mivel azt szeretnénk, hogy feltételeink közül mindkett teljesüljön. 6

Természetesen ugyanazt a leválogatási feltételt többféleképpen meg lehet adni, pl. az elzvel azonos értelm a k. < 98 & (megye ~ & megye ~ 3 ), stb. Minden esetleválogatáskor nagyon figyeljünk arra (erre az SPSS Data Editor ablak jobb alsó sarkában lev Filter on jelzés is figyelmeztet), hogy amikor befejeztük a részsokaságunk elemzését és újra a teljes adatbázissal szeretnénk dolgozni, mindig vegyük vissza a leválogatási feltételeinket (DATA, Select Cases, All cases). Mintavétel az SPSS-ben A mintavétel is tulajdonképpen esetleválogatást jelent, hiszen akkor használjuk, amikor nem a teljes adatainkból, hanem azoknak csak egy véletlen halmazából kívánunk dolgozni ( a mintavételrl lásd bvebben a III. fejezetet). Az SPSS-ben két lehetségünk van a mintavételre: vagy arra utasítjuk a programot, hogy az összesetek bizonyos százalékának megfelelen alkosson véletlen mintát, vagy megadjuk a kívánt mintánk pontos esetszámát. Mindezt szintén a DATA fmenü Select Cases almenüjében, a Random sample of cases segítségével lehet megvalósítani. Ha például adatbázisunkból egy 400 fs véletlen mintát szeretnénk venni, a DATA fmenü Select Cases almenüjében a Random sample os cases Sample mezjére kattintunk, és utasítjuk az SPSS-t, hogy pontosan egy 400 fs véletlen mintát válasszon az els 750 (az összes) eset közül, majd Continue-t és végül Ok-t kattintunk. 7

.6. Változók átalakítása Adatok transzformációja vagy változók átalakítása SPSS-ben Ahhoz, hogy az adatbázisunkban szerepl változóinkkal dolgozni tudjunk, legtöbb esetben módosítanunk, alakítanunk kell rajtuk. Elég, ha csak arra gondolunk, hogy minden elemzés eltt meg kell tisztítanunk adatainkat a nem releváns válaszoktól, össze kell vonnunk, csoportosítanunk kell adatainkat. Az SPSS-ben minden, a meglév adatsokaságunk változtatásához (transzformációjához), új változók létrehozásához szükséges alkalmazás a TRANSFORM fmenüben található. A TRANSFORM- on belül megjelen menüsor elemei közül a leggyakrabban használt négyet, vagyis a különböz számítások, matematikai mveletek elvégzésére használatos Compute, az egyes változóértékek többszöri elfordulása összegzésére használatos Count, az átkódolásra használt Recode, valamint a szöveges adataink kezelésére használható Automatic Recode alkalmazásokat ismertetem. A Compute menü Mint a legtöbb SPSS fablakban, ebben is (baloldalon) megtalálható az összes változó, amivel jelenleg dolgozunk. Az adatok különféle transzformációinál (pl. a Recode -ban) lehetség van választani, hogy a változtatásokat ugyanabba a változóba vagy egy új, általunk létrehozott változóba kérjük. Jelen esetben azonban erre nincs lehetség. A program alapértelmezettnek veszi, hogy a változón/változókon a különböz algebrai mveleteket úgy akarjuk végrehajtani, hogy az eredeti változó/változók sértetlenek maradjanak, vagyis nevet kell adnunk az új változónak, 8

mely a már transzformált adatokat fogja tartalmazni. Ezt az új nevet adhatjuk meg a TARGET VARIABLE mezben, közvetlenül a változók neveit tartalmazó ablak fölött. A NUMERIC EXPRESSION elnevezés ablakban fognak megjelenni a kért változtatások algebrai alakjai, ahogyan ezt már az esetek leválogatásánál (Select Cases, If..) megismertük. A mveleti jelek alatt található egy If feliratú gomb. Amennyiben szkíteni akarjuk a változtatni kívánt adatok körét, ezt az If -re kattintva megjelen ablak segítségével megtehetjük (ahogyan a Select Casese-nél). Példa Adatbázisunkban szerepel a megkérdezettek születési éve, de mivel ez intervallum mérési szint változó, nagyon könnyen arányskálává tudjuk alakítani olyan módon, hogy életkorrá alakítjuk. Mivel adataink 00-bl származnak, minket az érdekel, hogy a kérdezés idpontjában a megkérdezettek hány évesek voltak, így 00-bl kivonjuk minden egyes megkérdezettünk (esetünk) születési évét. Ekkor a TRANSFORM fmenü Compute almenüjében nevet adunk a létrehozni kívánt új változónknak (eletkor), a Numeric Expression mezbe beírjuk az algebrai mveletet: 00 -, majd átvisszük a születési év (k.) változót és az Ok-ra kattintunk. Ekkor adatbázisunk végén meg fog jelenni az új eletkor nev változónk, amelynek a korább elmondottak szerint megadjuk a paramétereit. Az új változónkban olyan értékek fognak szerepelni, mint 4, 5, 30, tehát a megkérdezettek életkora a kérdezés idpontjában. 9

A Count menü A Count menüt akkor használjuk, amikor olyan új változót kívánunk létrehozni, amelyben a kijelölt változók együttes elfordulásait szeretnénk regisztrálni. Itt is a Target Variable meznél nevet adunk az új változónknak, a Target Lable meznél az új értékünk nevét adjuk meg, a Variables mezbe átvisszük azokat a változókat, amelyeknek az együttes elfordulásait vizsgáljuk, majd a Define Values-nál megadjuk a vizsgált értéket/értékeket, amelyek érdekelnek. Az If segítségével itt is szkíthet a vizsgált esetek köre. Példa Adatbázisunkban a k58.-k58.7 változók a háztartások infrastrukturális felszereltségére vonatkoznak, az alábbiak szerint: k58. Van-e ebben a lakásban.. VAN NINCS. vezetékes víz?. vízöblítéses WC? 3. vezetékes gáz? 4. villany? 5. szennyvízelvezet csatorna? 6. központi ftés? 7. állandó melegvízellátás? Az ebben a formában szerepl adatok esetében egy egyszer gyakoriság segítségével rögtön megtudhatjuk, hogy a háztartások hány százaléka rendelkezik állandó melegvízellátással, stb., viszont a különböz szolgáltatások együttes elfordulásáról nincs információnk. Amennyiben pl. azt szeretnénk megtudni, hogy az adatbázisunkban szerepl háztartásoknak hány százaléka rendelkezik a felsorolt infrastrukturális szolgáltatások közül legtöbb 3-al, a Count menühöz folyamodunk. A Target Variable meznél az infrastr (max. 8 karakter) nevet adjuk az új változónak, a Target Lable meznél A háztartások infrastrukturális ellátottsága nevet adjuk, a Variables mezbe átvisszük a k58., k58., k58.3, k58.7 változókat, majd a Define Values-nál megadjuk az (a van kódja) értéket, mivel az érdekel, hogy az egyes háztartások a maximális 7 szolgáltatásból hánnyal rendelkeznek. Ezt követen Add-et és Continue-t, majd visszatérve a fablakba Ok-t klikkelünk. 0