Statisztika. Politológus képzés. Daróczi Gergely február 20. Politológia Tanszék

Hasonló dokumentumok
Statisztika. Politológus képzés. Daróczi Gergely február 23. Politológia Tanszék

Statisztika. Politológus képzés. Daróczi Gergely február 28. Politológia Tanszék

A társadalomkutatás módszerei I.

A társadalomkutatás módszerei I. Outline. Most járunk, vagy nem járunk? Már úgy szeretném megtudnííí, hogy most já-runk-e, vagy nem já-runk?

A társadalomkutatás módszerei I.

Statisztika. Politológus képzés. Daróczi Gergely március 20. Politológia Tanszék

A társadalomkutatás módszerei I. Outline. Ismétlés. Notes. Notes. Notes. 6. hét. Daróczi Gergely október. 20.

A társadalomkutatás módszerei I.

Statisztika. Politológus képzés. Daróczi Gergely május 4. Politológia Tanszék

Statisztika. Politológus képzés. Daróczi Gergely április 17. Politológia Tanszék

Statisztika. Politológus képzés. Daróczi Gergely március 13. Politológia Tanszék

ELTE TáTK Közgazdaságtudományi Tanszék GAZDASÁGSTATISZTIKA. Készítette: Bíró Anikó. Szakmai felelős: Bíró Anikó június

Orvosi szociológia (1. szeminárium) KUTATÁSMÓDSZERTAN

A mérés problémája a pedagógiában. Dr. Nyéki Lajos 2015

3/29/12. Biomatematika 2. előadás. Biostatisztika = Biometria = Orvosi statisztika. Néhány egyszerű definíció:

Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió

Statisztika. Politológus képzés. Daróczi Gergely április 24. Politológia Tanszék

Adatok statisztikai értékelésének főbb lehetőségei

Tartalomjegyzék I. RÉSZ: KÍSÉRLETEK MEGTERVEZÉSE

Mintavétel fogalmai STATISZTIKA, BIOMETRIA. Mintavételi hiba. Statisztikai adatgyűjtés. Nem véletlenen alapuló kiválasztás

Témaválasztás, kutatási kérdések, kutatásmódszertan

Módszertani Intézeti Tanszéki Osztály. A megoldás részletes mellékszámítások hiányában nem értékelhető!

A statisztika alapjai - Bevezetés az SPSS-be -

Bevezetés az SPSS program használatába

Statisztika I. 11. előadás. Előadó: Dr. Ertsey Imre

Matematikai geodéziai számítások 6.

Többváltozós lineáris regressziós modell feltételeinek tesztelése I.

III. Kvantitatív változók kapcsolata (korreláció, regresszió)

Matematikai geodéziai számítások 6.

Többváltozós lineáris regressziós modell feltételeinek

ELTE TáTK Közgazdaságtudományi Tanszék GAZDASÁGSTATISZTIKA. Készítette: Bíró Anikó. Szakmai felelős: Bíró Anikó június

Statisztikai alapok. Leíró statisztika Lineáris módszerek a statisztikában

Korreláció és lineáris regresszió

Korrelációs kapcsolatok elemzése

Dr. Nagy Zita Barbara igazgatóhelyettes KÖVET Egyesület a Fenntartható Gazdaságért november 15.

Korreláció számítás az SPSSben

A HŐMÉRSÉKLET ÉS A CSAPADÉK HATÁSA A BÜKK NÖVEKEDÉSÉRE

Először éljenek együtt, de azután Az élettársi kapcsolatok megítélése Magyarországon és Európában

STATISZTIKA. András hármas. Éva ötös. Nóri négyes. 5 4,5 4 3,5 3 2,5 2 1,5 ANNA BÉLA CILI 0,5 MAGY. MAT. TÖRT. KÉM.

Területi statisztikai elemzések

VALÓSZÍNŰSÉG, STATISZTIKA TANÍTÁSA

A társadalomtudományi kutatás teljes íve és alapstratégiái. áttekintés

Statisztika. Politológus képzés. Daróczi Gergely május 8. Politológia Tanszék

S atisztika 1. előadás

Szerzők: Kmetty Zoltán Lektor: Fokasz Nikosz TÁMOP A/1-11/ INFORMÁCIÓ - TUDÁS ÉRVÉNYESÜLÉS

Az empirikus vizsgálatok alapfogalmai

Matematikai alapok és valószínőségszámítás. Statisztikai változók Adatok megtekintése

Bevezető Mi a statisztika? Mérés Csoportosítás

Diszkriminancia-analízis

PIACKUTATÁS (MARKETINGKUTATÁS)

(Independence, dependence, random variables)

Tárgy- és névmutató. C Cox & Snell R négyzet 357 Cramer-V 139, , 151, 155, 159 csoportok közötti korrelációs mátrix 342 csúcsosság 93 95, 102

4/24/12. Regresszióanalízis. Legkisebb négyzetek elve. Regresszióanalízis

Mit mond a XXI. század emberének a statisztika?

Mintavétel a gyakorlatban

Segítség az outputok értelmezéséhez

[Biomatematika 2] Orvosi biometria

Alba Vélemény Radar 1. - GYORSJELENTÉS -

ELEMZŐ SZOFTVEREK. A tanárok elemző munkáját támogatja három, egyszerűen használható, minimális alkalmazói ismereteket igénylő Excel állomány.

STATISZTIKA I. A változók mérési szintjei. Nominális változók. Alacsony és magas mérési szint. Nominális változó ábrázolása

Kutatói pályára felkészítı modul

Biometria gyakorló feladatok BsC hallgatók számára

Logisztikus regresszió

A statisztika alapjai - Bevezetés az SPSS-be -

Lineáris regresszió vizsgálata resampling eljárással

Regresszió számítás az SPSSben

Függetlenségvizsgálat, Illeszkedésvizsgálat

Társadalmi tőke és területi fejlettség a Balaton térségében

STATISZTIKA. A maradék független a kezelés és blokk hatástól. Maradékok leíró statisztikája. 4. A modell érvényességének ellenőrzése

S atisztika 2. előadás

Monitoring adatelemzés. Dr. Csoknyai Tamás

ELTE TáTK Közgazdaságtudományi Tanszék GAZDASÁGSTATISZTIKA. Készítette: Bíró Anikó. Szakmai felelős: Bíró Anikó június

[GVMGS11MNC] Gazdaságstatisztika

Uniós források és hatásuk -- mennyiségek és mérési lehetőségek Major Klára. HÉTFA Kutatóintézet és Elemző Központ

Statisztika I. 12. előadás. Előadó: Dr. Ertsey Imre

1. óra: A területi adatbázis elkészítése, területi szintek

Van-e kapcsolat a változók között? (példák: fizetés-távolság; felvételi pontszám - görgetett átlag)

Centura Szövegértés Teszt

Matematikai statisztika c. tárgy oktatásának célja és tematikája

y ij = µ + α i + e ij

Abszolútértékes egyenlôtlenségek

A Statisztika alapjai

Megoldások. Az ismérv megnevezése közös megkülönböztető szeptember 10-én Cégbejegyzés időpontja

STATISZTIKA I. Centrális mutatók. Helyzeti középértékek. Középértékek. Bimodális eloszlás, U. Módusz, Mo. 4. Előadás.

Biomatematika 2 Orvosi biometria

Logisztikus regresszió

Talajvízszint idősorok vizsgálata statisztikai módszerekkel a 4-es metró építésének pesti területén A D J U N K T U S





Az OECD PISA adatbázis elemzése

Térinformatika gyakorlati alkalmazási lehetőségei a Mezőgazdasági Szakigazgatási Hivatal Növény- és Talajvédelmi Igazgatóságán

A társadalomkutatás módszerei I.

A kvantitatív kutatás folyamata

Többváltozós Regresszió-számítás

KÖZPONTI STATISZTIKAI HIVATAL. Szóbeli vizsgatevékenység

Statisztika. Dr Gősi Zsuzsanna. Egyetemi adjunktus. Sportmenedzsment Tanszék

Az SPC (statisztikai folyamatszabályozás) ingadozásai

Átírás:

Statisztika Politológus képzés Daróczi Gergely Politológia Tanszék 2012. február 20.

Outline 1 A mérési hiba Megbízhatóság és érvényesség 2 A kutatás megtervezése A kutatás lehetséges céljai A kutatás egységei Ökológiai tévkövetkeztetés Változók és mérési szintek 3 Mérési szintek 4 A változók közötti kapcsolatról Grafikus példák A relációk típusai További példák 5 A kutatás főbb fázisai Daróczi Gergely (PPKE BTK) Statisztika 2012-02-21 2 / 30

Megbízhatóság és érvényesség Méréseket végeztünk egy vödör 60 C hőmérsékletű vízben: Daróczi Gergely (PPKE BTK) Statisztika 2012-02-21 3 / 30

Megbízhatóság és érvényesség Méréseket végeztünk egy vödör 60 C hőmérsékletű vízben: Nem megbízható, nem érvényes mérés: Daróczi Gergely (PPKE BTK) Statisztika 2012-02-21 3 / 30

Megbízhatóság és érvényesség Méréseket végeztünk egy vödör 60 C hőmérsékletű vízben: Nem megbízható, nem érvényes mérés: Daróczi Gergely (PPKE BTK) Statisztika 2012-02-21 3 / 30

Megbízhatóság és érvényesség Méréseket végeztünk egy vödör 60 C hőmérsékletű vízben: Nem megbízható, nem érvényes mérés: Megbízható, de nem érvényes mérés: Daróczi Gergely (PPKE BTK) Statisztika 2012-02-21 3 / 30

Megbízhatóság és érvényesség Méréseket végeztünk egy vödör 60 C hőmérsékletű vízben: Nem megbízható, nem érvényes mérés: Megbízható, de nem érvényes mérés: Daróczi Gergely (PPKE BTK) Statisztika 2012-02-21 3 / 30

Megbízhatóság és érvényesség Méréseket végeztünk egy vödör 60 C hőmérsékletű vízben: Nem megbízható, nem érvényes mérés: Megbízható, de nem érvényes mérés: Nem megbízható, de érvényes mérés: Daróczi Gergely (PPKE BTK) Statisztika 2012-02-21 3 / 30

Megbízhatóság és érvényesség Méréseket végeztünk egy vödör 60 C hőmérsékletű vízben: Nem megbízható, nem érvényes mérés: Megbízható, de nem érvényes mérés: Nem megbízható, de érvényes mérés: Daróczi Gergely (PPKE BTK) Statisztika 2012-02-21 3 / 30

Megbízhatóság és érvényesség Méréseket végeztünk egy vödör 60 C hőmérsékletű vízben: Nem megbízható, nem érvényes mérés: Megbízható, de nem érvényes mérés: Nem megbízható, de érvényes mérés: Megbízható és érvényes mérés: Daróczi Gergely (PPKE BTK) Statisztika 2012-02-21 3 / 30

Megbízhatóság és érvényesség Méréseket végeztünk egy vödör 60 C hőmérsékletű vízben: Nem megbízható, nem érvényes mérés: Megbízható, de nem érvényes mérés: Nem megbízható, de érvényes mérés: Megbízható és érvényes mérés: Megbízható, érvényes? Daróczi Gergely (PPKE BTK) Statisztika 2012-02-21 3 / 30

Megbízhatóság és érvényesség Újratöltve Forrás: ccustomerthink.com Daróczi Gergely (PPKE BTK) Statisztika 2012-02-21 4 / 30

Megbízhatóság és érvényesség A társadalomtudományban 10 hallgat magasságát mértük: 150 160 170 180 190 200 cm Daróczi Gergely (PPKE BTK) Statisztika 2012-02-21 5 / 30

Megbízhatóság és érvényesség A társadalomtudományban 10 hallgat magasságát mértük: 150 160 170 180 190 200 cm Forrás: http://www.wallpaperhere.com/ Daróczi Gergely (PPKE BTK) Statisztika 2012-02-21 5 / 30

A kutatás lehetséges céljai Brainstorming A következő kérdések közül melyek lehetnek megfelelő kutatási témák? Hány hajléktalan ember él a fővárosban? Melyek a leginkább elterjedt öngyilkossági eljárások? Milyen színű a banán? Daróczi Gergely (PPKE BTK) Statisztika 2012-02-21 6 / 30

A kutatás lehetséges céljai Értelmetlennek tűnő kutatási témák Egy egyszerű idősor: Daróczi Gergely (PPKE BTK) Statisztika 2012-02-21 7 / 30

A kutatás lehetséges céljai Értelmetlennek tűnő kutatási témák Egy valódi adatfelvétel (N=225.000) adatai alapján: Egy egyszerű idősor: Daróczi Gergely (PPKE BTK) Statisztika 2012-02-21 7 / 30

A kutatás lehetséges céljai Brainstorming A következő kérdések közül melyek lehetnek megfelelő kutatási témák? Hány hajléktalan ember él a fővárosban? Melyek a leginkább elterjedt öngyilkossági eljárások? Milyen színű a banán? Mennyibe kerül egy vödör alma? Milyen kapcsolat állhat fenn az emberek hajszíne és testsúlya között? Melyik a legolvasottab könyv a világon? Mik lehetnek a témaválasztás fő faktorai? Definíció: feltáró, leíró és magyarázó kutatások Daróczi Gergely (PPKE BTK) Statisztika 2012-02-21 8 / 30

A kutatás egységei Mintavételi egység, megfigyelési egység, eset Milyen alanyokat vizsgálunk az alábbiakban? Az idősebb emberek jobban félnek a bűnözőktől, mint a fiatalabbak. A gazdasági fejlődés valóban a várható életkor csökkenésével jár együtt? Melyik a legnagyobb magyar focidrukker csapat? Minél hosszabb az eljegyzés, annál hosszab a házasság. Mely foglalkozás bír a legnagyobb presztízzsel? A megfigyelési egység minden esetben egybeesik a mintavételi egységgel? Daróczi Gergely (PPKE BTK) Statisztika 2012-02-21 9 / 30

Ökológiai tévkövetkeztetés Egy légből kapott példa A Turisztikai Kutató Központ adatai alapján Budapesten 2010-ben 2 millió turista fordult meg. A jelentés azt is tartalmazta, miszerint a Balatonnál ugyanezen évben 2,5 millió ember fordult meg. Állítható-e a fentiek alapján, hogy... Budapest lakó kevésbé barátságos, mint a Balaton körül élő emberek? Budapesten kevesebb a látványosság, mint a Balaton környékén? a tó kedveltebb turista-célpont? a turisták szerint a Balatonnál jobb időzni, mint Budapesten? a Balaton környékén több turisztikai adót fizettek, mint a fővárosban? Egyáltalán: mi mondható el a fenti adatsor alapján? Daróczi Gergely (PPKE BTK) Statisztika 2012-02-21 10 / 30

Ökológiai tévkövetkeztetés Egy klasszikus példa Emile Durkheim (1897): Le Suicide Tétel A férfiak hajlamosabbak öngyilkosságot elkövetni, mint a nők. Az öngyilkosság jellemzőbb az özvegy, elvált vagy házasságon kívül élőkre, mint a házasokra. Gyerekes emberek körében kisebb az öngyilkossági arány. Az öngyilkossági ráta a protestánsoknál magasabb, mint a katolikusoknál vagy a zsidóknál. Ez annak köszönhető, hogy a katolikus országokban sokkal nagyobb a társadalmi integráltság, mint a protestánsoknál. Az öngyilkossági arány kimagasló a katonák körében. Annak a veszélye, hogy egyes emberekről mint elemzési egységekről fogalmazunk meg állításokat csoportokon végzett megfigyelések alapján. Daróczi Gergely (PPKE BTK) Statisztika 2012-02-21 11 / 30

Változók és mérési szintek Egy konkrét példa Hány éves Ön? >18 19-24 25-30 31-40 41-100 100< Mutasd be a fenti példában a változót és annak attribútumait! Daróczi Gergely (PPKE BTK) Statisztika 2012-02-21 12 / 30

Változók és mérési szintek Tipológia A változók típusai Belső változók Függő változó kvalitatív változók kvantitatív változók Független változó Küldő változók kvalitatív változók kvantitatív változók Kontroll-változó Egyéb változók Hozz 1-1 példát a fentebbi típusokra! Daróczi Gergely (PPKE BTK) Statisztika 2012-02-21 13 / 30

Mérési szintek Kvalitatív és kvantitatív változók Kvalitatív változók: Nominális: egymást kizáró, a teljes válasz-univerzumot lefedő kategóriák Ordinális: u.a., mint fentebb + a kategóriák sorbarendezhetőek Nominális Ordinális Intervallum Arány Klasszifikáció X X X X Sorrend X X X Egyenlő távolságok X X Nullpont X Kvantitatív változók: Intervallum: u.a., mint fentebb + a kategóriák egyenlő távolságra találhatóak Arány: u.a., mint fentebb + nullpont Daróczi Gergely (PPKE BTK) Statisztika 2012-02-21 14 / 30

A változók közötti kapcsolatról Egy grafikus ábrázolás 53.940 diamonds $15,000 $10,000 $5,000 Fair Good Very Good Premium Ideal ggplot(diamonds, aes(cut, price)) + geom_boxplot() + xlab( ) + ylab( ) + scale_y_continuous(formatter="dollar") + theme_bw() + opts(title="53.940 diamonds") Daróczi Gergely (PPKE BTK) Statisztika 2012-02-21 15 / 30

Az adatbázis szerkezete ggplot2/diamonds Prices of 50,000 round cut diamonds Description: A dataset containing the prices and other attributes of almost 54,000 diamonds. The variables are as follows: price. price in US dollars (\$326--\$18,823) carat. weight of the diamond (0.2--5.01) cut. quality of the cut (Fair, Good, Very Good, Premium, Ideal) colour. diamond colour, from J (worst) to D (best) clarity. a measurement of how clear the diamond is (I1 (worst), SI1, SI2, VS1, VS2, VVS1, VVS2, IF (best)) x. length in mm (0--10.74) y. width in mm (0--58.9) z. depth in mm (0--31.8) depth. total depth percentage = z / mean(x, y) = 2 * z / (x + y) (43--79) table. width of top of diamond relative to widest point (43--95) Daróczi Gergely (PPKE BTK) Statisztika 2012-02-21 16 / 30

A változók közötti kapcsolatról Egy grafikus ábrázolás ggplot(diamonds, aes(carat, price)) + geom_point() + geom_smooth() + ylab( ) + scale_y_continuous(formatter="dollar") + theme_bw() + opts(title="53.940 diamonds") Daróczi Gergely (PPKE BTK) Statisztika 2012-02-21 17 / 30

A változók közötti kapcsolatról Egy grafikus ábrázolás 53.940 diamonds 12000 10000 N 8000 6000 4000 cut Fair Good Very Good Premium Ideal 2000 0 I1 SI2 SI1 VS2 VS1 VVS2 VVS1 IF clarity ggplot(diamonds, aes(clarity, fill=cut)) + geom_bar() + ylab("n") + theme_bw() + opts(title="53.940 diamonds") Daróczi Gergely (PPKE BTK) Statisztika 2012-02-21 18 / 30

A változók közötti kapcsolatról Egy grafikus ábrázolás 5000 Fair 53.940 diamonds Good Very Good 4000 3000 2000 1000 0 N 5000 Premium Ideal 4000 3000 2000 1000 0 I1 SI2 SI1 VS2 VS1 VVS2VVS1 IF I1 SI2 SI1 VS2 VS1 VVS2VVS1 IF clarity I1 SI2 SI1 VS2 VS1 VVS2VVS1 IF ggplot(diamonds, aes(clarity)) + geom_bar() + ylab("n") + facet_wrap(~ cut) + theme_bw() + opts(title="53.940 diamonds") Daróczi Gergely (PPKE BTK) Statisztika 2012-02-21 19 / 30

A változók közötti kapcsolatról Egy grafikus ábrázolás ggplot(diamonds, aes(carat, price, color=clarity)) + geom_point() + ylab( ) + scale_y_continuous(formatter="dollar") + theme_bw() + opts(title="53.940 diamonds") Daróczi Gergely (PPKE BTK) Statisztika 2012-02-21 20 / 30

A változók közötti kapcsolatról Egy grafikus ábrázolás ggplot(diamonds, aes(carat, price, color=cut)) + geom_point() + ylab( ) + facet_wrap(~ clarity,nro scale_y_continuous(formatter="dollar") + theme_bw() + opts(title="53.940 diamonds") Daróczi Gergely (PPKE BTK) Statisztika 2012-02-21 21 / 30

A változók közötti kapcsolatról Egy grafikus ábrázolás Price of a diamond (N=53.940) 4% 3% 2% 1% 0% 0 5000 10000 15000 Online kutatást végeztünk az Interneten gyémántot árusító emberek között. A megkérdezettek a fentebbi válaszokat adták. Mit gondolhatunk a kutatás érvényességéről és megbízhatóságáról? Daróczi Gergely (PPKE BTK) Statisztika 2012-02-21 22 / 30

A változók közötti kapcsolat lehetséges típusai Lehetséges kapcsolat két változó között: együttjárás, korreláció, hamis/látszólagos összefüggés, hatás, a hatás iránya, okság. Statisztikai szignifikáns... Daróczi Gergely (PPKE BTK) Statisztika 2012-02-21 23 / 30

A változók közötti kapcsolatról A hatás iránya 53.940 diamonds $15,000 $10,000 $5,000 D E F G H I J ggplot(diamonds, aes(color, price)) + geom_boxplot() + xlab( ) + ylab( ) + scale_y_continuous(formatter="dollar") + theme_bw() + opts(title="53.940 diamonds") Daróczi Gergely (PPKE BTK) Statisztika 2012-02-21 24 / 30

A változók közötti kapcsolatról Magas korreláció A korrelációs együttható magas értéke nem cáfolható. És? Daróczi Gergely (PPKE BTK) Statisztika 2012-02-21 25 / 30

A változók közötti kapcsolatról Korrelálatlan változók Forrás: http://xkcd.com/323/ Daróczi Gergely (PPKE BTK) Statisztika 2012-02-21 26 / 30

A változók közötti kapcsolatról Korreláció Pozitív ( egyenes arányosság : R = 1), negatív ( fordított arányosság : R = 1), lineáris, négyzetes... és korrelálatlan (R = 0) kapcsolat R: korrelációs együttható Daróczi Gergely (PPKE BTK) Statisztika 2012-02-21 27 / 30

A változók és attribútumaik Teszt! Milyen változók, milyen mérési szintek feleltethetőek meg az alábbi kérdéseknek/kijelentéseknek? Az idősebb emberek jobban félnek a bűnözőktől, mint a fiatalabbak. A gazdasági fejlődés valóban a várható életkor csökkenésével jár együtt? Melyik a legnagyobb magyar focidrukker csapat? Minél hosszabb az eljegyzés, annál hosszab a házasság. Mely foglalkozás bír a legnagyobb presztízzsel? Attribútumok? Daróczi Gergely (PPKE BTK) Statisztika 2012-02-21 28 / 30

A kutatás főbb fázisai Egy folyamatábra A kutatási probléma meghatározása A kutatási terv elkészítése Mintavétel A mérés módjának meghatározása Adatgyűjtés Az adatok feldolgozása Adatelemzés és értelmezés Daróczi Gergely (PPKE BTK) Statisztika 2012-02-21 29 / 30

Köszönöm a figyelmet! Daróczi Gergely daroczi.gergely@btk.ppke.hu