Statisztika. Politológus képzés. Daróczi Gergely február 23. Politológia Tanszék

Hasonló dokumentumok
Statisztika. Politológus képzés. Daróczi Gergely február 20. Politológia Tanszék

Statisztika. Politológus képzés. Daróczi Gergely február 28. Politológia Tanszék

A társadalomkutatás módszerei I.

A társadalomkutatás módszerei I. Outline. Most járunk, vagy nem járunk? Már úgy szeretném megtudnííí, hogy most já-runk-e, vagy nem já-runk?

A társadalomkutatás módszerei I.

Statisztika. Politológus képzés. Daróczi Gergely március 20. Politológia Tanszék

A társadalomkutatás módszerei I. Outline. Ismétlés. Notes. Notes. Notes. 6. hét. Daróczi Gergely október. 20.

A társadalomkutatás módszerei I.

Statisztika. Politológus képzés. Daróczi Gergely május 4. Politológia Tanszék

Statisztika. Politológus képzés. Daróczi Gergely április 17. Politológia Tanszék

ELTE TáTK Közgazdaságtudományi Tanszék GAZDASÁGSTATISZTIKA. Készítette: Bíró Anikó. Szakmai felelős: Bíró Anikó június

Statisztika. Politológus képzés. Daróczi Gergely március 13. Politológia Tanszék

A mérés problémája a pedagógiában. Dr. Nyéki Lajos 2015

Orvosi szociológia (1. szeminárium) KUTATÁSMÓDSZERTAN

3/29/12. Biomatematika 2. előadás. Biostatisztika = Biometria = Orvosi statisztika. Néhány egyszerű definíció:

Tartalomjegyzék I. RÉSZ: KÍSÉRLETEK MEGTERVEZÉSE

Mintavétel fogalmai STATISZTIKA, BIOMETRIA. Mintavételi hiba. Statisztikai adatgyűjtés. Nem véletlenen alapuló kiválasztás

Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió

Módszertani Intézeti Tanszéki Osztály. A megoldás részletes mellékszámítások hiányában nem értékelhető!

Statisztika I. 11. előadás. Előadó: Dr. Ertsey Imre

Témaválasztás, kutatási kérdések, kutatásmódszertan

A statisztika alapjai - Bevezetés az SPSS-be -

Adatok statisztikai értékelésének főbb lehetőségei

Bevezetés az SPSS program használatába

Statisztika. Politológus képzés. Daróczi Gergely április 24. Politológia Tanszék

Matematikai geodéziai számítások 6.

Többváltozós lineáris regressziós modell feltételeinek tesztelése I.

III. Kvantitatív változók kapcsolata (korreláció, regresszió)

Matematikai geodéziai számítások 6.

Többváltozós lineáris regressziós modell feltételeinek

Statisztikai alapok. Leíró statisztika Lineáris módszerek a statisztikában

Korreláció és lineáris regresszió

STATISZTIKA. András hármas. Éva ötös. Nóri négyes. 5 4,5 4 3,5 3 2,5 2 1,5 ANNA BÉLA CILI 0,5 MAGY. MAT. TÖRT. KÉM.

Dr. Nagy Zita Barbara igazgatóhelyettes KÖVET Egyesület a Fenntartható Gazdaságért november 15.

ELTE TáTK Közgazdaságtudományi Tanszék GAZDASÁGSTATISZTIKA. Készítette: Bíró Anikó. Szakmai felelős: Bíró Anikó június

Tárgy- és névmutató. C Cox & Snell R négyzet 357 Cramer-V 139, , 151, 155, 159 csoportok közötti korrelációs mátrix 342 csúcsosság 93 95, 102

Statisztika. Politológus képzés. Daróczi Gergely május 8. Politológia Tanszék

Bevezető Mi a statisztika? Mérés Csoportosítás

Korreláció számítás az SPSSben

Először éljenek együtt, de azután Az élettársi kapcsolatok megítélése Magyarországon és Európában

PIACKUTATÁS (MARKETINGKUTATÁS)

(Independence, dependence, random variables)

Korrelációs kapcsolatok elemzése

4/24/12. Regresszióanalízis. Legkisebb négyzetek elve. Regresszióanalízis

VALÓSZÍNŰSÉG, STATISZTIKA TANÍTÁSA

[Biomatematika 2] Orvosi biometria

S atisztika 1. előadás

A társadalomtudományi kutatás teljes íve és alapstratégiái. áttekintés

Matematikai alapok és valószínőségszámítás. Statisztikai változók Adatok megtekintése

Szerzők: Kmetty Zoltán Lektor: Fokasz Nikosz TÁMOP A/1-11/ INFORMÁCIÓ - TUDÁS ÉRVÉNYESÜLÉS

Logisztikus regresszió

STATISZTIKA I. A változók mérési szintjei. Nominális változók. Alacsony és magas mérési szint. Nominális változó ábrázolása

ELEMZŐ SZOFTVEREK. A tanárok elemző munkáját támogatja három, egyszerűen használható, minimális alkalmazói ismereteket igénylő Excel állomány.

Lineáris regresszió vizsgálata resampling eljárással

A HŐMÉRSÉKLET ÉS A CSAPADÉK HATÁSA A BÜKK NÖVEKEDÉSÉRE

STATISZTIKA. A maradék független a kezelés és blokk hatástól. Maradékok leíró statisztikája. 4. A modell érvényességének ellenőrzése

Területi statisztikai elemzések

[GVMGS11MNC] Gazdaságstatisztika

ELTE TáTK Közgazdaságtudományi Tanszék GAZDASÁGSTATISZTIKA. Készítette: Bíró Anikó. Szakmai felelős: Bíró Anikó június

Van-e kapcsolat a változók között? (példák: fizetés-távolság; felvételi pontszám - görgetett átlag)

Statisztika I. 12. előadás. Előadó: Dr. Ertsey Imre

Abszolútértékes egyenlôtlenségek

Matematikai statisztika c. tárgy oktatásának célja és tematikája

y ij = µ + α i + e ij

Logisztikus regresszió

Centura Szövegértés Teszt

Segítség az outputok értelmezéséhez





Mintavétel a gyakorlatban

A Statisztika alapjai

STATISZTIKA I. Centrális mutatók. Helyzeti középértékek. Középértékek. Bimodális eloszlás, U. Módusz, Mo. 4. Előadás.

Az OECD PISA adatbázis elemzése

Biometria gyakorló feladatok BsC hallgatók számára

Az empirikus vizsgálatok alapfogalmai

Diszkriminancia-analízis

A statisztika alapjai - Bevezetés az SPSS-be -

Statisztika. Dr Gősi Zsuzsanna. Egyetemi adjunktus. Sportmenedzsment Tanszék

KÖZPONTI STATISZTIKAI HIVATAL. Szóbeli vizsgatevékenység

Alba Vélemény Radar 1. - GYORSJELENTÉS -

Függetlenségvizsgálat, Illeszkedésvizsgálat

Vizuális adatelemzés

S atisztika 2. előadás

V. Gyakorisági táblázatok elemzése

Vargha András Károli Gáspár Református Egyetem Budapest

Matematikai alapok és valószínőségszámítás. Középértékek és szóródási mutatók

Matematika osztályozó vizsga témakörei 9. évfolyam II. félév:

Kutatói pályára felkészítı modul

Megoldások. Az ismérv megnevezése közös megkülönböztető szeptember 10-én Cégbejegyzés időpontja

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Többváltozós Regresszió-számítás

Követelmény a 7. évfolyamon félévkor matematikából

Varianciaanalízis 4/24/12

Az SPC (statisztikai folyamatszabályozás) ingadozásai

Mit mond a XXI. század emberének a statisztika?

1. ábra: Az egészségi állapot szubjektív jellemzése (%) 38,9 37,5 10,6 9,7. Nagyon rossz Rossz Elfogadható Jó Nagyon jó

Statisztika. Politológus képzés. Daróczi Gergely április 27. Politológia Tanszék

Átírás:

Statisztika Politológus képzés Daróczi Gergely Politológia Tanszék 2011. február 23.

Outline 1 A mérési hiba Megbízhatóság és érvényesség 2 A kutatás megtervezése A kutatás lehetséges céljai A kutatás egységei Ökológiai tévkövetkeztetés Változók és mérési szintek 3 Mérési szintek 4 A változók közötti kapcsolatról Visual examples A relációk típusai További példák 5 A kutatás főbb fázisai Daróczi Gergely (PPKE BTK) Statisztika 2011-02-23 2 / 28

Megbízhatóság és érvényesség Méréseket végeztünk egy vödör 60 C hőmérsékletű vízben: 1. méréssorozat 0 10 20 30 40 50 60 70 80 90 100 C 2. méréssorozat 0 10 20 30 40 50 60 70 80 90 100 C 3. méréssorozat 0 10 20 30 40 50 60 70 80 90 100 C 4. méréssorozat 0 10 20 30 40 50 60 70 80 90 100 C 5. méréssorozat 0 10 20 30 40 50 60 70 80 90 100 C Daróczi Gergely (PPKE BTK) Statisztika 2011-02-23 3 / 28

A kutatás lehetséges céljai Brainstorming A következő kérdések közül melyek lehetnek megfelelő kutatási témák? Hány hajléktalan ember él a fővárosban? Melyek a leginkább elterjedt öngyilkossági eljárások? Milyen színű a banán? Daróczi Gergely (PPKE BTK) Statisztika 2011-02-23 4 / 28

A kutatás lehetséges céljai Értelmetlennek tűnő kutatási témák Egy valódi adatfelvétel (N=225.000) adatai alapján: Egy egyszerű idősor: Daróczi Gergely (PPKE BTK) Statisztika 2011-02-23 5 / 28

A kutatás lehetséges céljai Brainstorming textbfa következő kérdések közül melyek lehetnek megfelelő kutatási témák? Hány hajléktalan ember él a fővárosban? Melyek a leginkább elterjedt öngyilkossági eljárások? Milyen színű a banán? Mennyibe kerül egy vödör alma? Milyen kapcsolat állhat fenn az emberek hajszíne és testsúlya között? Melyik a legolvasottab könyv a világon? Mik lehetnek a témaválasztás fő faktorai? Definíció: feltáró, leíró és magyarázó kutatások Daróczi Gergely (PPKE BTK) Statisztika 2011-02-23 6 / 28

A kutatás egységei Mintavételi egység, megfigyelési egység, eset Milyen alanyokat vizsgálunk az alábbiakban? Az idősebb emberek jobban félnek a bűnözőktől, mint a fiatalabbak. A gazdasági fejlődés valóban a várható életkor csökkenésével jár együtt? Melyik a legnagyobb magyar focidrukker csapat? Minél hosszabb az eljegyzés, annál hosszab a házasság. Mely foglalkozás bír a legnagyobb presztízzsel? A megfigyelési egység minden esetben egybeesik a mintavételi egységgel? Daróczi Gergely (PPKE BTK) Statisztika 2011-02-23 7 / 28

Ökológiai tévkövetkeztetés Egy klasszikus példa Emile Durkheim (1897): Le Suicide A férfiak hajlamosabbak öngyilkosságot elkövetni, mint a nők. Az öngyilkosság jellemzőbb az özvegy, elvált vagy házasságon kívül élőkre, mint a házasokra. Gyerekes emberek körében kisebb az öngyilkossági arány. Az öngyilkossági ráta a protestánsoknál magasabb, mint a katolikusoknál vagy a zsidóknál. Ez annak köszönhető, hogy a katolikus országokban sokkal nagyobb a társadalmi integráltság, mint a protestánsoknál. Tétel Az öngyilkossági arány kimagasló a katonák körében. Annak a veszélye, hogy egyes emberekről mint elemzési egységekről fogalmazunk meg állításokat csoportokon végzett megfigyelések alapján. Daróczi Gergely (PPKE BTK) Statisztika 2011-02-23 8 / 28

Ökológiai tévkövetkeztetés Egy légből kapott példa A Turisztikai Kutató Központ adatai alapján Budapesten 2010-ben 2 millió turista fordult meg. A jelentés azt is tartalmazta, miszerint a Balatonnál ugyanezen évben 2,5 millió ember fordult meg. Állítható-e a fentiek alapján, hogy... Budapest lakó kevésbé barátságos, mint a Balaton körül élő emberek? Budapesten kevesebb a látványosság, mint a Balaton környékén? a tó kedveltebb turista-célpont? a turisták szerint a Balatonnál jobb időzni, mint Budapesten? a Balaton környékén több turisztikai adót fizettek, mint a fővárosban? Egyáltalán: mi mondható el a fenti adatsor alapján? Daróczi Gergely (PPKE BTK) Statisztika 2011-02-23 9 / 28

Változók és mérési szintek Egy konkrét példa Hány éves Ön? >18 19-24 25-30 31-40 41-100 100< Mutasd be a fenti példában a változót és annak attribútumait! Daróczi Gergely (PPKE BTK) Statisztika 2011-02-23 10 / 28

Változók és mérési szintek Tipológia A változók típusai Belső változók Függő változó kvalitatív változók kvantitatív változók Független változó Küldő változók kvalitatív változók kvantitatív változók Kontroll-változó Egyéb változók Hozz 1-1 példát a fentebbi típusokra! Daróczi Gergely (PPKE BTK) Statisztika 2011-02-23 11 / 28

Mérési szintek Kvalitatív és kvantitatív változók Kvalitatív változók: Nominális: egymást kizáró, a teljes válasz-univerzumot lefedő kategóriák Ordinális: u.a., mint fentebb + a kategóriák sorbarendezhetőek Nominális Ordinális Intervallum Arány Klasszifikáció X X X X Sorrend X X X Egyenlő távolságok X X Nullpont X Kvantitatív változók: Intervallum: u.a., mint fentebb + a kategóriák egyenlő távolságra találhatóak Arány: u.a., mint fentebb + nullpont Daróczi Gergely (PPKE BTK) Statisztika 2011-02-23 12 / 28

A változók közötti kapcsolatról Egy grafikus ábrázolás 53.940 diamonds $15,000 $10,000 $5,000 Fair Good Very Good Premium Ideal ggplot(diamonds, aes(cut, price)) + geom_boxplot() + xlab( ) + ylab( ) + scale_y_continuous(formatter="dollar") + theme_bw() + opts(title="53.940 diamonds") Daróczi Gergely (PPKE BTK) Statisztika 2011-02-23 13 / 28

Az adatbázis szerkezete ggplot2/diamonds Prices of 50,000 round cut diamonds Description: A dataset containing the prices and other attributes of almost 54,000 diamonds. The variables are as follows: price. price in US dollars (\$326--\$18,823) carat. weight of the diamond (0.2--5.01) cut. quality of the cut (Fair, Good, Very Good, Premium, Ideal) colour. diamond colour, from J (worst) to D (best) clarity. a measurement of how clear the diamond is (I1 (worst), SI1, SI2, VS1, VS2, VVS1, VVS2, IF (best)) x. length in mm (0--10.74) y. width in mm (0--58.9) z. depth in mm (0--31.8) depth. total depth percentage = z / mean(x, y) = 2 * z / (x + y) (43--79) table. width of top of diamond relative to widest point (43--95) Daróczi Gergely (PPKE BTK) Statisztika 2011-02-23 14 / 28

A változók közötti kapcsolatról Egy grafikus ábrázolás ggplot(diamonds, aes(carat, price)) + geom_point() + geom_smooth() + ylab( ) + scale_y_continuous(formatter="dollar") + theme_bw() + opts(title="53.940 diamonds") Daróczi Gergely (PPKE BTK) Statisztika 2011-02-23 15 / 28

A változók közötti kapcsolatról Egy grafikus ábrázolás 53.940 diamonds 12000 10000 N 8000 6000 4000 cut Fair Good Very Good Premium Ideal 2000 0 I1 SI2 SI1 VS2 VS1 VVS2 VVS1 IF clarity ggplot(diamonds, aes(clarity, fill=cut)) + geom_bar() + ylab("n") + theme_bw() + opts(title="53.940 diamonds") Daróczi Gergely (PPKE BTK) Statisztika 2011-02-23 16 / 28

A változók közötti kapcsolatról Egy grafikus ábrázolás 5000 Fair 53.940 diamonds Good Very Good 4000 3000 2000 1000 0 N 5000 Premium Ideal 4000 3000 2000 1000 0 I1 SI2 SI1 VS2 VS1 VVS2VVS1 IF I1 SI2 SI1 VS2 VS1 VVS2VVS1 IF clarity I1 SI2 SI1 VS2 VS1 VVS2VVS1 IF ggplot(diamonds, aes(clarity)) + geom_bar() + ylab("n") + facet_wrap(~ cut) + theme_bw() + opts(title="53.940 diamonds") Daróczi Gergely (PPKE BTK) Statisztika 2011-02-23 17 / 28

A változók közötti kapcsolatról Egy grafikus ábrázolás ggplot(diamonds, aes(carat, price, color=clarity)) + geom_point() + ylab( ) + scale_y_continuous(formatter="dollar") + theme_bw() + opts(title="53.940 diamonds") Daróczi Gergely (PPKE BTK) Statisztika 2011-02-23 18 / 28

A változók közötti kapcsolatról Egy grafikus ábrázolás ggplot(diamonds, aes(carat, price, color=cut)) + geom_point() + ylab( ) + facet_wrap(~ clarity,nr scale_y_continuous(formatter="dollar") + theme_bw() + opts(title="53.940 diamonds") Daróczi Gergely (PPKE BTK) Statisztika 2011-02-23 19 / 28

A változók közötti kapcsolatról Egy grafikus ábrázolás Price of a diamond (N=53.940) 4% 3% 2% 1% 0% 0 5000 10000 15000 Online kutatást végeztünk az Interneten gyémántot árusító emberek között. A megkérdezettek a fentebbi válaszokat adták. Mit gondolhatunk a kutatás érvényességéről és Daróczi Gergely (PPKE BTK) Statisztika 2011-02-23 20 / 28

A változók közötti kapcsolat lehetséges típusai Lehetséges kapcsolat két változó között: együttjárás, korreláció, hamis/látszólagos összefüggés, hatás, a hatás iránya, okság. Statisztikai szignifikáns... Daróczi Gergely (PPKE BTK) Statisztika 2011-02-23 21 / 28

A változók közötti kapcsolatról A hatás iránya 53.940 diamonds $15,000 $10,000 $5,000 D E F G H I J ggplot(diamonds, aes(color, price)) + geom_boxplot() + xlab( ) + ylab( ) + scale_y_continuous(formatter="dollar") + theme_bw() + opts(title="53.940 diamonds") Daróczi Gergely (PPKE BTK) Statisztika 2011-02-23 22 / 28

A változók közötti kapcsolatról Magas korreláció A korrelációs együttható magas értéke nem cáfolható. És? Daróczi Gergely (PPKE BTK) Statisztika 2011-02-23 23 / 28

A változók közötti kapcsolatról Korrelálatlan változók Forrás: http://xkcd.com/323/ Daróczi Gergely (PPKE BTK) Statisztika 2011-02-23 24 / 28

A változók közötti kapcsolatról Korreláció Pozitív ( egyenes arányosság : R = 1), negatív ( fordított arányosság : R = 1), lineáris, négyzetes... és korrelálatlan (R = 0) kapcsolat R: korrelációs együttható Daróczi Gergely (PPKE BTK) Statisztika 2011-02-23 25 / 28

A változók és attribútumaik Teszt! Milyen változók, milyen mérési szintek feleltethetőek meg az alábbi kérdéseknek/kijelentéseknek? Az idősebb emberek jobban félnek a bűnözőktől, mint a fiatalabbak. A gazdasági fejlődés valóban a várható életkor csökkenésével jár együtt? Melyik a legnagyobb magyar focidrukker csapat? Minél hosszabb az eljegyzés, annál hosszab a házasság. Mely foglalkozás bír a legnagyobb presztízzsel? Attribútumok? Daróczi Gergely (PPKE BTK) Statisztika 2011-02-23 26 / 28

A kutatás főbb fázisai Egy folyamatábra A kutatási probléma meghatározása A kutatási terv elkészítése Mintavétel A mérés módjának meghatározása Adatgyűjtés Az adatok feldolgozása Adatelemzés és értelmezés Daróczi Gergely (PPKE BTK) Statisztika 2011-02-23 27 / 28

It was a pleasure! Daróczi Gergely daroczi.gergely@btk.ppke.hu