Typotex Kiadó. Tartalomjegyzék

Hasonló dokumentumok
Tárgy- és névmutató. C Cox & Snell R négyzet 357 Cramer-V 139, , 151, 155, 159 csoportok közötti korrelációs mátrix 342 csúcsosság 93 95, 102

Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet

Gazdaságtudományi Kar. Gazdaságelméleti és Módszertani Intézet. Faktoranalízis előadás. Kvantitatív statisztikai módszerek

Diszkriminancia-analízis

Faktoranalízis az SPSS-ben

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Faktoranalízis az SPSS-ben

Korrelációs kapcsolatok elemzése

Logisztikus regresszió

Egy és többváltozós logisztikus regressziós vizsgálatok és alkalmazásaik a klinikumban

Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet

Több valószínűségi változó együttes eloszlása, korreláció

Többváltozós lineáris regressziós modell feltételeinek tesztelése II.

Korreláció számítás az SPSSben

Korreláció és Regresszió (folytatás) Logisztikus telítıdési függvény Több független változós regressziós függvények

Statisztika elméleti összefoglaló

Többváltozós Regresszió-számítás

Többváltozós lineáris regressziós modell feltételeinek tesztelése I.

4/24/12. Regresszióanalízis. Legkisebb négyzetek elve. Regresszióanalízis

Matematikai statisztika Gazdaságinformatikus MSc október 8. lineáris regresszió. Adatredukció: Faktor- és főkomponensanaĺızis.

Többváltozós lineáris regressziós modell feltételeinek

GEOSTATISZTIKA II. Geográfus MSc szak. 2019/2020 I. félév TANTÁRGYI KOMMUNIKÁCIÓS DOSSZIÉ

Logisztikus regresszió

Egyszempontos variancia analízis. Statisztika I., 5. alkalom

Többváltozós lineáris regresszió 3.

Regresszió számítás az SPSSben

Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

Statisztika I. 12. előadás. Előadó: Dr. Ertsey Imre

Regressziós vizsgálatok

STATISZTIKA. Fogalom. A standard lineáris regressziós modell mátrixalgebrai jelölése. A standard lineáris modell. Eredménytáblázat

A statisztika oktatásáról konkrétan

A TANTÁRGY ADATLAPJA

Matematikai statisztika Gazdaságinformatikus MSc október 8. lineáris regresszió. Adatredukció: Faktor- és főkomponensanaĺızis.

y ij = µ + α i + e ij

Osztályozás, regresszió. Nagyméretű adathalmazok kezelése Tatai Márton

Regresszió. Csorba János. Nagyméretű adathalmazok kezelése március 31.

1. Ismétlés Utóbbi előadások áttekintése IV. esettanulmány Uniós országok munkanélkülisége... 1

Egy és (többváltozós) logisztikus regressziós vizsgálatok és alkalmazásaik a klinikumban

Nagy-György Judit. Szegedi Tudományegyetem, Bolyai Intézet

Matematikai geodéziai számítások 6.

Minitab 17 újdonságai. Lakat Károly L.K.Quality Bt szept

SZÉKELYI MÁRIA BARNA ILDIKÓ: TÚLÉLÕKÉSZLET AZ SPSS-HEZ. Többváltozós elemzési technikákról társadalomkutatók számára (Budapest: Typotex, 2002)

Matematikai geodéziai számítások 6.

Bevezetés a Korreláció &

Fogalom STATISZTIKA. Alkalmazhatósági feltételek. A standard lineáris modell. Projekciós mátrix, P

Logisztikus regresszió

Együttmőködés és innováció

Adatok statisztikai értékelésének főbb lehetőségei

Anyagvizsgálati módszerek Mérési adatok feldolgozása. Anyagvizsgálati módszerek

2013 ŐSZ. 1. Mutassa be az egymintás z-próba célját, alkalmazásának feltételeit és módszerét!

A többváltozós lineáris regresszió III. Főkomponens-analízis

Korreláció és lineáris regresszió

Ismételt méréses multifaktoriális varianciaanaĺızis (repeated measures MANOVA) szeptember 19.

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió

5. előadás - Regressziószámítás

Regressziós vizsgálatok

TARTALOMJEGYZÉK 1. RÉSZ: AZ SPSS ALAPJAI A

ELTE TáTK Közgazdaságtudományi Tanszék GAZDASÁGSTATISZTIKA. Készítette: Bíró Anikó. Szakmai felelős: Bíró Anikó június

A ÉVI KOMPETENCIAMÉRÉS FIT- JELENTÉSEINEK ÚJ ELEMEI

Statisztikai következtetések Nemlineáris regresszió Feladatok Vége

6. előadás - Regressziószámítás II.

Ökonometriai modellek paraméterei: számítás és értelmezés

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok

: az i -ik esélyhányados, i = 2, 3,..I

A becslés tulajdonságai nagyban függnek a megfigyelésvektortól. A klasszikus esetben, amikor az

STATISZTIKA. András hármas. Éva ötös. Nóri négyes. 5 4,5 4 3,5 3 2,5 2 1,5 ANNA BÉLA CILI 0,5 MAGY. MAT. TÖRT. KÉM.

MELLÉKLET. A parancsikonok használata: Fıkomponens- és faktorelemzés. I : A fıkomponens- és a faktorelemzés indítása.

GEOSTATISZTIKA. Földtudományi mérnöki MSc, geofizikus-mérnöki szakirány. 2018/2019 I. félév TANTÁRGYI KOMMUNIKÁCIÓS DOSSZIÉ

A LEGKÖZELEBBI SZOMSZÉD ANALÍZISHEZ SZÜKSÉGES TERÜLETI ADATBÁZISOK KIALAKÍTÁSÁNAK MÓDSZERTANI KÉRDÉSEI

Likelihood, deviancia, Akaike-féle információs kritérium

Gyakorló feladatok statisztikai programcsomagokhoz

[Biomatematika 2] Orvosi biometria

Regresszió. Fő cél: jóslás Történhet:

y ij = µ + α i + e ij STATISZTIKA Sir Ronald Aylmer Fisher Példa Elmélet A variancia-analízis alkalmazásának feltételei Lineáris modell

LOGIT-REGRESSZIÓ a függő változó: névleges vagy sorrendi skála

Melléklet 1. A knn-módszerhez használt változólista

Leíró és matematikai statisztika el adásnapló Matematika alapszak, matematikai elemz szakirány 2016/2017. tavaszi félév

Ökonometria. Dummy változók használata. Ferenci Tamás 1 tamas.ferenci@medstat.hu. Hetedik fejezet. Budapesti Corvinus Egyetem. 1 Statisztika Tanszék

Adatbányászati szemelvények MapReduce környezetben

Regresszió számítás. Tartalomjegyzék: GeoEasy V2.05+ Geodéziai Kommunikációs Program

A többváltozós lineáris regresszió 1.

Mérési adatok illesztése, korreláció, regresszió

Kvantitatív statisztikai módszerek

Egy és (többváltozós) logisztikus regressziós vizsgálatok és alkalmazásaik a klinikumban

Hogyan lesz adatbányából aranybánya?

Gépi tanulás a gyakorlatban. Kiértékelés és Klaszterezés

Mintavétel fogalmai STATISZTIKA, BIOMETRIA. Mintavételi hiba. Statisztikai adatgyűjtés. Nem véletlenen alapuló kiválasztás

Tartalomjegyzék I. RÉSZ: KÍSÉRLETEK MEGTERVEZÉSE

2012. április 18. Varianciaanaĺızis

Segítség az outputok értelmezéséhez

Varianciaanalízis 4/24/12

Kérdıívek, tesztek I. Kérdıívek

Biomatematika 13. Varianciaanaĺızis (ANOVA)

A TANULÓI EREDMÉNYESSÉG HÁTTÉRTÉNYEZŐI

Logisztikus regresszió október 27.

Klaszterelemzés az SPSS-ben

Statisztika II előadáslapok. 2003/4. tanév, II. félév

Számítógépes döntéstámogatás. Statisztikai elemzés

Lineáris regressziós modellek 1

Matematikai statisztika c. tárgy oktatásának célja és tematikája

Átírás:

Tartalomjegyzék Bevezetés... 11 A hasznos véletlen hiba... 13 I. Adatredukciós módszerek... 17 1. Fıkomponens-elemzés... 18 1.1. A fıkomponens jelentése... 25 1.2. Mikor használjunk fıkomponens-elemzést?... 25 1.3. A puding próbája... 28 1.3.1. Az egyenlı teherviselés... 30 2. Faktorelemzés... 40 2.1. A modell javítgatása... 49 2.2. Lássunk tisztán! A rotálás... 53 2.3. Mentsük, ami menthetı: a faktorszkórok létrehozása... 60 2.4. Amiért fáradoztunk: létrejöttek a látens változók... 62 2.5. A hiányzó adatok kezelése... 64 2.6. A faktorelemzés buktatói... 65 2.6.1. A Kaiser Meyer Olkin mutató és a Bartlett-teszt... 66 2.6.2. Amikor a faktorok 100 százaléknál többet magyaráznak... 71 2.6.2.1. A legnagyobb kommunalitású változó kihagyása... 71 2.6.2.2. A rosszul interpretálható változók kihagyása... 78 2.6.2.3. Az egyeduralomra törı változók esete... 82 2.6.2.4. Vissza az elágazási ponthoz... 85 2.6.3. A változók tartalma és a faktorok jelentése... 89 2.6.4. A konfirmációs modell... 91 2.6.5. Amikor minden reménytelen... 96 2.6.5.1. Kétségbeesett kísérlet... 101 2.6.5.2. Feladás helyett: visszahátrálás a fıkomponensbe... 103 2.7. Szezon és fazon... 108

6 Túlélıkészlet az SPSS-hez 3. Klaszterelemzés... 109 3.1. Tudás versus anyagi javak... 109 3.2. Hierarchikus klaszterek... 115 3.2.1. A hierarchikus klaszterezés módszerei... 119 3.2.1.1. A legközelebbi, illetve a legtávolabbi szomszéd... 119 3.2.1.2. Klaszterek távolsága mint a klaszterelemek távolságainak átlaga... 122 3.2.1.3. Klaszterek távolságának meghatározása a klaszterközéppontok segítségével... 125 3.2.2. Miben mérjük a távolságot?... 129 3.2.2.1. Euklideszi távolság... 129 3.2.2.2. Az euklideszi távolság négyzete... 130 3.2.2.3. Asszociáción alapuló közelség-távolság. 130 3.2.3. Sok hőhó majdnem semmiért... 132 3.3. Klaszterezés nagy file-okon... 133 3.3.1. Iniciális klaszterközéppontok... 133 3.3.2. Útban a tökéletesség felé: iterálás... 137 3.3.3. A klaszterek interpretálása... 138 3.3.3.1. Kendızetlen ıszinteség versus a standardizálás álcája... 141 3.4. Kilépés az életbe: típuskeresés klaszterekkel... 143 3.4.1. És megint elölrıl: iterálás több lépésben... 145 3.4.2. Névadás: klaszterek interpretálása... 148 3.4.3. Adjunk-e profilt a bizonytalankodóknak? A hiányzó adatok kezelése... 150 3.4.4. Egy tautológia két jelentése: ANOVA egy kicsit másképpen... 154 3.4.5. Minden út Rómába vezet? Változtassunk a kezdıpontokon!... 157 3.4.5.1. A magunk ásta verem és a kiút... 159 3.5. Tanulságok... 163

Tartalomjegyzék 7 II. Magyarázó modellek... 164 4. Variancia-analízis... 166 4.1. Egyutas variancia-analízis... 167 4.2. Kétutas variancia-analízis... 175 4.3. Az interakció... 176 4.3.1. Az interakcióról bıvebben... 178 4.3.2. A négyzetösszegek értelmezése a kétutas ANOVA-ban... 180 4.3.3. Az interferencia... 182 4.4. A hierarchikus ANOVA... 188 4.5. Korlátozó feltételek... 192 4.5.1. Normalitás-vizsgálat... 194 5. Lineáris regresszióanalízis... 204 5.1. A regressziós egyenes egyenlete... 205 5.2. Egyszerő példa a lineáris regresszióra... 209 5.3. Illeszkedés: mennyire vehetjük komolyan a regressziós egyenest?... 211 5.4. Lineáris regresszióanalízis élesben egyszerő modell 214 5.4.1. A deviánsokról... 217 5.4.2. Vissza az output-hoz... 220 5.5. Kétváltozós regressziós modell... 222 5.5.1. Kétértékő vagy dummy változók... 222 5.5.2. Modellépítés... 223 5.5.3. Még egy kicsit a dummy változókról... 226 5.6. Többváltozós regressziós modell... 227 5.6.1. Ordinális független változók... 227 5.6.2. A Lazarsfeld-paradigma és a regresszió... 230 5.7. Interferencia a regresszióban: a változószelektálás módszerei... 234 5.7.1. A FORWARD módszer... 235 5.7.2. A BACKWARD módszer... 238 5.7.3. A STEPWISE módszer... 241 5.7.4. Az ENTER módszer... 244 5.8. Nominális mérési szintő változók becsempészése a regressziós modellbe: dummyzás... 246

8 Túlélıkészlet az SPSS-hez 5.9. Összefüggı független változók: a multikollinearitás... 252 5.9.1. Függvényszerő multikollinearitás... 252 5.9.1.1. A baj nem jár egyedül: magas mérési szintő és dummy változók a regressziós modellben... 259 5.9.1.2. Amikor csak a gondolkodás segít dummyzzunk másként... 266 5.9.1.3. Szabaduljunk meg a nominális változóktól... 269 5.9.2. Függvényszerő kapcsolat sztochasztikus multikollinearitás... 271 5.9.2.1. Miért félünk a sztochasztikus multikollinearitástól?... 274 5.9.2.2. Barátságosabb út a multikollinearitás meghatározására kétféle mérıszám... 277 5.9.2.3. Hogyan védekezzünk a sztochasztikus multikollinearitás ellen?... 282 5.10. Hab a tortán: a homoszkedaszticitás és az elsırendő autokorreláció... 289 5.11. Biztos, ami biztos: a regressziós modellek validitása... 296 6. Útmodellek... 301 6.1. Az utak erıssége... 302 6.2. Közvetlen és közvetett hatások... 308 6.3. Gondolkodási sémák... 310 6.3.1. Mi az ok, és mi az okozat?... 313 6.3.2. A modell továbbépítése... 314 6.3.3. A modell interpretációja... 317 6.4. Az útmodell korlátai... 318 7. Diszkriminancia-analízis... 320 7.1. A romák lehetséges beilleszkedése a többségi társadalomba: ahogyan a többség látja... 320 7.1.1. Sok kicsi sokra megy?... 324 7.1.2. A magyarázó változók együttes jelentése: a diszkrimináló függvények... 327 7.1.3. Az üdvözlendı diszkrimináció... 333

Tartalomjegyzék 9 7.1.4. Sose lehetünk elég óvatosak átlagok és eloszlások összehasonlítása... 334 7.1.5. Lássuk a medvét!... 338 7.2. Komplex modell... 340 7.2.1. Antiszemitizmus és cigányellenesség... 341 7.2.2. Státus és attitődök: együttes magyarázat... 347 8. Többdimenziós skálázás... 352 8.1. Kisebbségek egy rokonszenv-térképen... 353 8.1.1. Többdimenziós skálázás az SPSS-ben... 356 8.1.2. Meddig mehetünk el? A dimenziócsökkentés határai... 359 8.2. Etnikai csoportok az egymásról alkotott vélemények terében... 366 9. Logisztikus regresszió... 374 9.1. A sztahanovista lineáris regresszió. Miért van szükség logisztikus regresszióra?... 375 9.2. A legfontosabb fogalmak... 378 9.2.1. A valószínőség és az esély... 379 9.2.2. Az esélyhányados... 379 9.3. Út a logisztikus regresszióanalízis felé... 380 9.4. Egy egyszerő modell... 384 9.4.1. A likelihood függvényrıl... 386 9.4.2. Az output érdemi része... 389 9.4.3. A modell magyarázóereje... 391 9.4.3.1. Találatmátrix a logisztikus regresszióban... 394 9.4.4. A független változó hatása... 396 9.5. A modell bıvítése... 398 9.5.1. Összemérhetı hatások: a standardizált regressziós együttható... 401 9.6. Kategoriális független változó a logisztikus regresszióban... 404 9.7. Mindent bele! Sokváltozós modell... 410 9.8. Ugyanaz másképpen... 419

10 Túlélıkészlet az SPSS-hez Melléklet... 425 A parancsikonok használata: Fıkomponens- és faktorelemzés.. 425 A parancsikonok használata: Klaszterelemzés... 430 Hierarchikus klaszterezés... 430 K-Means klaszterezés... 434 A parancsikonok használata: Variancia-analízis... 438 A parancsikonok használata: A lineáris regresszióanalízis... 438 A parancsikonok használata: Diszkriminancia-analízis... 442 A parancsikonok használata: A többdimenziós skálázás... 446 A parancsikonok használata: A logisztikus regresszió... 449 Felhasznált irodalom... 452