Kutatásmódszertan és prezentációkészítés 10. rész: Az adatelemzés alapjai Szerző: Kmetty Zoltán Lektor: Fokasz Nikosz
Tizedik rész Az adatelemzés alapjai
Tartalomjegyzék Bevezetés Leíró statisztikák I Leíró statisztikák II Hisztogram Kereszttábla elemzés I Kereszttábla elemzés II Felhasznált irodalom
Bevezetés A 8-es egységben, a következtetési statisztika alapjaival foglalkoztunk. Ebben az egységben a leíró statisztikákat fogjuk megvizsgálni részletesebben. A leíró statisztikák esetében, is külön kell választanunk az alacsony és a magas mérési szinten értelmezhető statisztikákat. Az egység első részében a magas mérési szintre koncentrálunk. Mivel a magas mérési szintű változók esetében az adatok százalékos megoszlása magában kevés információval szolgál, ezért olyan mutatókat próbálunk alkalmazni, amelyek magukban is informatívak a változóra nézve. Ha egy sokaságot jellemezni szeretnénk, akkor általában egy statisztika magában kevés információt nyújt, ezért érdemes ezen statisztikákat együttesen alkalmazni. Megkülönböztetünk centrális, és szóródási statisztikákat.
Leíró statisztikák I Statisztika Átlag Medián Módusz Összeg (szumma) Minimum Maximum Terjedelem Szórás Variancia Percentilis Jelentése Az értékek összege osztva az elemszámmal.. A minta átlaga (X átlag), a teljes sokaság várható értékének torzítatlan becslése A változó középső értéke rendezett mintában. Az adott érték két egyenlő részre vágja a sokaságot A változó leggyakoribb értéke. Értelmezhető alacsony mérési szinten is. Magas mérési szinten a sűrűségfüggvény maximuma A változó összes értékének összege A változó legkisebb értéke A változó legnagyobb értéke A maximum és a minimum érték különbsége Átlagtól való átlagos eltérés. A szigma az elméleti szórást jelenti, az s pedig az empirikus szórást Szórás négyzete Az n%-os (vagy n-edik) percentilis azt jelenti, hogy az adatok n%-a kisebb, mint ez az érték. A medián az 50 százalékos percentilis Centrális mutatók Szóródás mutatók
Leíró statisztikák II Magas mérési szintű változók esetében, nemcsak a leíró statisztikák informatívak, hanem a változók grafikus megjelenítése is. Magas mérési szint esetén a változók eloszlása, adhat további képet számunkra az adatok szerkezetéről. A változó eloszlása azt mutatja meg, hogy a változó egyes értékei a minta hány százalékára jellemzők. A statisztikai következtetés elméletben a normális eloszlásnak különleges szerepe van, ezért ezzel foglalkozunk a továbbiakban. A normális megoszlású változók esetében a sokaság többsége az átlag körül helyezkedik el, és minél távolabb kerülünk az átlagtól annál kevesebb az egyes esetek előfordulási valószínűsége (például az IQ). A normál eloszlás szimmetrikus eloszlás, tehát az átlag kettévágja a sokaságot (így az átlag megegyezik a mediánnal), és az átlag két oldala gyakorlatilag tükrözhető egymásra. Normál eloszlás esetében a minta 68 százaléka az átlag +- 1 szórásnyira helyezkedik el, és az esetek 95 százaléka pedig az átlag +- 2 szórásán belül. A standard normális eloszlás a korábbi tulajdonságok mellett még azzal is rendelkezik, hogy az átlaga 0, a szórása pedig 1.
Hisztogram
Kereszttábla elemzés I Az alacsony mérési szintű változók esetében alapvetően a százalékos megoszlásokra koncentrálunk az elemzés során Százalék: Az adott kategória aránya a teljes esetszámhoz képest Érvényes százalék: Az adott kategória aránya a kérdésre érvényesen válaszolók körében Kereszttábla elemzés A 8-as egységben, már részletesen foglalkoztunk a kereszttábla elemzés kapcsán a függetlenség kérdésével. Ebben az egységben az elemzés leíró részére koncentrálunk. A kereszttábla elemzésben négy alap vizsgálati megközelítést mutatunk be: esetszám: a cellában megfigyelt esetek száma sorszázalék: cella elemszám osztva a sor marginálissal oszlopszázalék: cella elemszám osztva az oszlop marginálissal teljes százalék: cella elemszám osztva az összes eset számával A mutatókat a 8-as egységben már felhasznált példánkon illusztráljuk:
Kereszttábla elemzés II Esetszám Sorszázalék Kisfiú Kislány Összesen Kisfiú Kislány Összesen Kap virgácsot 40 20 60 Kap virgácsot 67% 33% 60 Nem kap virgácsot 20 20 40 Nem kap virgácsot 50% 50% 40 Összesen 60 40 100 Összesen 60 40 100 Oszlop százalék Teljes százalék Kisfiú Kislány Összesen Kisfiú Kislány Összesen Kap virgácsot 67% 50% 60 Kap virgácsot 40% 20% 60 Nem kap virgácsot 33% 50% 40 Nem kap virgácsot 20% 20% 40 Összesen 60 40 100 Összesen 60 40 100 sorszázalék: A virgácsot kapók 67 százaléka kisfiú oszlopszázalék: A kisfiúk 33 százaléka nem kapott virgácsot teljes százalék: Az összes megkérdezett 40 százaléka, aki virgácsot kapott és kisfiú
Felhasznált irodalom: Obádovics Gyula: Valószínűségszámítás és matematikai statisztika, Budapest Scolar, 2009 Rudas Tamás: Hogyan olvassunk közvélemény-kutatásokat? Új Mandátum Könyvkiadó Budapest, 1998. Rudas Tamás: Közvélemény-kutatás. Corvina Budapest, 2006.