Statisztika 1 előadás
|
|
- Mátyás Török
- 7 évvel ezelőtt
- Látták:
Átírás
1 Statisztika 1 előadás Baran Sándor 2016/17 tanév, 1. félév 1 / 189
2 Irodalom Hunyadi László., Vita László: Statisztika I. Aula Kiadó, Budapest, Hunyadi László, Vita László: Statisztika II. Aula Kiadó, Budapest, Keresztély Tibor, Sugár András, Szarvas Beatrix: Statisztika közgazdászoknak. Példatár és feladatgyűjtemény. Nemzeti Tankönyvkiadó, Budapest, Fazekas István: Valószínűségszámítás. Egyetemi Kiadó, Debrecen, Denkinger Géza: Valószínűségszámítás gyakorlatok. Nemzeti Tankönyvkiadó, Budapest, Syllabus, eredmények, információk arato.inf.unideb.hu/baran.sandor/mischu.html 2 / 189
3 Tartalom Alapfogalmak Sokaság egy ismérv szerinti leírása Sokaság több ismérv szerinti leírása Összehasonĺıtás standardizálással és indexszámítással Mintavétel Pontbecslések és tulajdonságaik Nagy számok törvényei Intervallumbecslések Hipotézisvizsgálat 3 / 189
4 Mi a statisztika? A statisztika olyan gyakorlati tevékenység, illetve tudományos módszertan, amely arra szolgál, hogy a valóság tényeinek nagy tömegét tömören, számszerűen jellemezze. Gyakorlati tevékenység: alapadatokat gyűjt, feldolgoz, elemez, majd közzéteszi ezek eredményét. Tudományos módszertan: az elemzéshez szükséges megfontolások, eljárások megadása. A statisztika mindig a tények valamilyen nagy esetleg végtelen nagy tömegéről igyekszik tömör, számszerű képet adni. Példa Az alkalmazásban állók létszáma a nemzetgazdaságban június-július: ezer fő. Pénzügyi, biztosítási tevékenység: 61.6 ezer fő. Az alkalmazásban állók havi bruttó munkajövedelme a nemzetgazdaságban június-július: Ft. Pénzügyi, biztosítási tevékenység: Ft. Forrás: KSH 5 / 189
5 A valóság jellemezni kívánt tényei bizonyos egységekhez köthetőek. Példa Az alkalmazásban állók. Adott időszakban Magyarországra érkező külföldiek. A vizsgálat tárgyának egyedeiről szerzett, megfelelő módon rögzített különféle információkat alapadatoknak, más néven elemi adatoknak nevezzük. Az alapadatok nem feltétlenül számszerűek. A vizsgált egységek bizonyos körét összességében jellemző számszerű információkat általánosságban adatoknak, bizonyos speciális esetekben pedig mutatószámoknak hívjuk. A mutatószám elnevezés többnyire a szabványosított tartalmú, egy-egy jelenség jellemzésére visszatérően használt számszerű információk megjelölésére szolgál. A továbbiakban adatok és mutatószámok helyett csak adatokat fogunk emlegetni. 6 / 189
6 Példák Alapadatok A Magyarországra érkező külföldiek nemzetisége. A Magyarországra érkező külföldiek életkora. A Magyarországra érkező külföldiek itt-tartózkodási ideje. Adatok Egy adott időszak alatt Magyarországra érkező külföldiek száma (2015-ben ezer fő). Egy adott időszak alatt Magyarországra érkező külföldiek összes pénzköltése (2015-ben millió Ft). Mutatók Egy idelátogató külföldi napi átlagok pénzköltése (2015-ben 13.4 ezer Ft). Az vendégéjszakák átlagos száma (2015-ben 2.5 éjszaka). Fontosak a mértékegységek! 7 / 189
7 Sokaságok A vizsgálat tárgyát képező egységek összességét, halmazát statisztikai sokaságnak, röviden sokaságnak (populációnak) nevezzük. A sokaság egységei különféle tulajdonságaik megadásával jellemezhetők. E tulajdonságok egy része a sokaság minden egységére nézve közös, más része azonban nem. Egy sokaság megadható: egységeinek felsorolásával; eloszlásával. Sokaságok típusai, I.: Diszkrét, pl. a magyar népesség január 1.-én ( fő); 2015-ben Magyarországra érkező külföldiek száma ( ezer fő). Folytonos, önkényesen elkülöníthető egységek, pl teljes búzatermése ( tonna); a belföldön közúton szálĺıtott áruk mennyisége 2015-ben ( tonna). Fiktív, valamilyen eloszlással megadott, pl lehetséges búzatermés eredményei. 8 / 189
8 Sokaságok Sokaságok típusai, II.: Álló, azaz valamely időpontra vonatkozik (stock), pl. a magyar népesség január 1.-én; az IK beiratkozott hallgatói szeptember 22.-én. Mozgó, azaz valamely időtartamra értendő (flow), pl teljes búzatermése; a belföldön közúton szálĺıtott áruk mennyisége 2015-ben; az IK hallgatói által a 2015/16 tanév 2. félévének szorgalmi időszakában elfogyasztott sör mennyisége. Sokaságok típusai, III.: Véges, pl. a magyar népesség január 1.-én. Végtelen, pl lehetséges búzatermés eredményei. 9 / 189
9 Sokaságok Aggergált sokaság: különféle dolgokból elfogyasztott/felhasznált termékek vagy szolgáltatások összértéke. Pl. Magyarország teljes exportja 2015-ben ( milliárd forint); az IK hallgatói által a 2015/16 tanév 2. félévének szorgalmi időszakában elfogyasztott alkoholtartalmú italok összértéke. Az aggregált sokaság nagysága (aggregátum): A = n q i p i = i=1 n i=1 ν i q i : az i-edik fajta egységeinek mennyisége valamilyen alkalmas mértékegységben; p i : az i-edik fajta egység egységára; ν i : az i-edik fajta egységek összértéke; n: az egységek száma. 10 / 189
10 Ismérvek Az ismérvek olyan vizsgálati szempontok, melyek alapján a sokaság részekre bontható. A sokaság egységeinek valamely adott szempont szerint lehetséges tulajdonságait ismérvváltozatoknak nevezzük. Ha számszerűek az ismérv változatok, akkor ezeket ismérvértékeknek, magát az ismévet pedig változónak nevezzük. Az ismérvek fajtái területi, pl. lakhely, születési hely; időbeli, pl. születési idő, munkába állás időpontja; minőségi, pl. nem, foglalkozás; mennyiségi, pl. életkor, testmagasság, testtömeg, tanulmányi átlag. 11 / 189
11 Mérési skálák Ismérvváltozatok átkódolhatóak számokká. Csak olyan műveletek megengedettek, amik az eredeti változatokkal is. Mérési szintek Nominális: csak az vizsgálható, két érték egyenlő-e, pl. név, lakhely, foglalkozás. Nincs mértékegysége. Ordinális: csak az értékek sorendje számít, távolsága nem, pl. vizsgajegyek, végzettség. Nincs mértékegysége. Különbségi: az értékek különbsége is információt hordoz, de az arányuk nem, pl. hőmérséklet. A skála kezdőpontja önkényes (Celsius, Kelvin, Fahrenheit fok), van mértékegysége. Arány: kezdőpont egyértelműen adott, az arány is értelmezhető, pl. havi jövedelem, testmagasság. Van mértékegysége. 12 / 189
12 Példa Sokaság Egy konk- Ismérv Ismérv- Ismérvfajta Mérési rét egység változat skála állampol- megyelakó minőségi nominális A Mordor- gárság ba irányuló Zsákos tartózkodási 7 mennyiségi arány idegenfor- idő (nap) galom a Frodó életkor (év) 50 mennyiségi arány harmadkor útitársak 2 mennyiségi arány száma évében igénybe vett szabad ég minőségi nominális szállásfajta alatt faj ember minőségi nominális A Galakti- nem férfi minőségi nominális kus Biro- Luke (alternatív) dalom születési Polis Massa területi nominális népessége Skywalker hely bolygó YU 1 4-ben szül. idő YE 1 19 időbeli intervallum anyabolygó Tatuin területi nominális életkor (év) 24 mennyiségi arány foglalkozás Jedi lovag minőségi nominális 1 YE ill. YU: a yavini csata (a Halálcsillag megsemmisítése) előtt ill. után. 13 / 189
13 Hibák A statisztikai adatok, mutatószámok célszerű megadási módja: A: közeĺıtő érték. a: abszolút hibakorlát. Relatív hibakorlát: A ± a A a valódi érték A + a α = a/a. Példa Magyarország népessége január 1.-én: ezer fő. A = 9830, a = 0.5, α = 0.5/ = 0.005%. Két közeĺıtő érték összegének vagy különbségének abszolút hibakorlátja a megfelelő abszolút hibakorlátok összege. Két közeĺıtő érték szorzatának vagy hányadosának relatív hibakorlátja nagyjából a megfelelő relatív hibakorlátok összege. 14 / 189
14 Statisztikai alapműveletek I. A sokaság jellemzése valamely erre alkalmas adattal vagy mutatószámmal. A sokasághoz hozzárendelünk egy annak egészét jellemző adatot, pl. a nagyságát, átlagát, várható értékét. II. Összehasonĺıtás. Egy adott jelenség időbeli alakulásáról, területi eltéréseiről, vagy egymáshoz valamilyen módon kapcsolódó jelenségek viszonyáról ad számszerű információt. Fontos, hogy az adatok összehasonĺıthatóak legyenek. Az adatokból képezhetünk különbségeket vagy hányadosokat. Az alkalmazásban állók havi bruttó átlagkeresete Év Kereset (Ft) Előző év=100% / 189
15 Több sokaság adatainak összehasonĺıtása A sokaságok A sokaságok adatainak A hányados viszonya felsorolására hányadosára mértékegysége egymáshoz használt elnevezés Időben és/vagy összehasonĺıtó sor összehasonĺıtó vi-, illetve % térben különböző (idősor/területi sor) szonyszám (dinasokaságok mikus viszonyszám területi összehasonĺıtó viszonyszám) Időben és/vagy összehasonĺıtó sor index(szám), illetve % térben különböző (idősor/területi sor) (területi/időbeli) aggregált sokaságok Időben és/vagy intenzitási viszony- a két adat mértérben azonos, de szám tékegységének különböző fajta hányadosa egységekből álló sokaságok Hunyadi, Vita (2008, 1.4 táblázat) 16 / 189
16 Példa Sor- Mérték- Dinamikus szám Megnevezés egység viszonyszám (2005=100) 1. Alkalmazottak évi átl. száma fő Ebből: fizikai foglalkozású fő Feldolgozott cukorrépa 1000 t Cukortermelés 1000 t Fizikai foglalkozásúak által 1000 h teljesített munkaórák száma Intenzitási viszonyszámok Termelékenység 2005: 650 ezer t 520 ezer h Hunyadi, Vita (2008, 1.5 táblázat) = 1.25 t/h. Egy fizikai dolgozóra eső munkaórák száma 2005 ill. 2006: 520 ezer h 261 fő = h/fő ill. Dinamikus viszonyszám 360 ezer h 208 fő = h/fő Egy fizikai dolgozó munkaóráinak változása: h/fő h/fő = = 86.87% 17 / 189
17 Statisztikai alapműveletek III. Osztályozás. Valamely adott sokaság egy vagy több ismérv szerinti tagolása, osztályozása. A csoportok valamilyen szempontból homogénebbek, mint az egész sokaság. Osztályok: az osztályozás során kapott csoportok. Csoportképző ismérv(ek): az osztályok elhatárolására szolgáló ismérv(ek). Példa. Az évfolyam osztályozása a Mikroökonómia jegyei alapján. Elvárások egy osztályozással szemben: legyen teljes; legyen átfedésmentes; eredményezzen homogén osztályokat. Nómenklatúra: szabványosított osztályozási rendszer. Foglalkozások Egységes Osztályozási Rendszere (FEOR 08). 10 főcsoport, 42 csoport, 136 alcsoport, 632 foglalkozás. 18 / 189
18 Csoportosító sor Osztály Egységek száma C 1 f 1 C 2 f 2. C i. C k Összesen. f i. f k N C i : f i : az i-edik osztály azonosítója (i = 1, 2,..., k); az i-edik osztály gyakorisága; k: az osztályok száma, ált. k a legkisebb egész, melyre 2 k N; N: a sokaság nagysága. N = k i=1 f i. Osztály másik elnevezése: részsokaság. Akkor használjuk, ha az osztályokat külön is tovább akarjuk vizsgálni. 19 / 189
19 Kombinációs (kontingencia) tábla Az X ismérv sze- Az Y ismérv szerinti osztályok j rinti osztályok C1 Y C2 Y... Cj Y... Cc Y C1 x f 11 f f 1j... f 1c f 1 C2 x f 21 f f 2j... f 2c f Ci x f i1 f i2... f ij... f ic f i Cr x f r1 f r2... f rj... f rc f r i f 1 f 2... f j... f c N Ci X : az X szerinti i-edik osztály azonosítója (i = 1, 2,..., r); Cj Y : az Y szerinti j-edik osztály azonosítója (j = 1, 2,..., c); f ij : azon elemek száma, melyek mind Ci X, mind pedig Cj Y elemei; r, c: az X illetve Y szerinti osztályok száma. c f ij = f i, r f ij = f j, c r r c f j = f i = f ij = N. j=1 i=1 j=1 i=1 i=1 j=1 20 / 189
20 Viszonyszámok A viszonyszám két adat hányadosa: V : viszonyszám; A: a viszonyítás tárgya; B: a viszonyítás alapja. Típusai V = A/B. A = B V, B = A/V. Dinamikus: idősorok adataiból számított hányadosok. Intenzitási: két egymással kapcsolatban lévő, de nem feltétlenül azonos fajta egységekből álló sokaság nagyságából képzett hányadosok. Megoszlási: valamely sokaságrésznek az egészhez viszonyított nagyságát mutatja. 21 / 189
21 Példa A magyar lakásállomány megoszlása (ezer) adott év január 1.-én Szobák száma és több Összesen Forrás: KSH Szobák Százalékos megoszlás évi évi évi álloszáma állomány (1980=100) mány (1990=100) és több Összesen / 189
22 Dinamikus viszonyszámok kettőnél több adat esetén Y 1, Y 2,..., Y t,..., Y n : az idősor adatai. Bázisviszonyszám: b t = Y t /Y b, t = 1, 2,..., n. Láncviszonyszám: l t = Y t /Y t 1, t = 2, 3,..., n. Egymást követő bázisviszonyszámok hányadosa: b t /b t 1 = ( ) ( ) Y t /Y b : Yt 1 /Y b = Yt /Y t 1 = l t. Új bázisra (pl. Y b -ről Y c -re) való áttérés: b t /b c = ( Y t /Y b ) : ( Yc /Y b ) = Yt /Y c. Láncviszonyszámok szorzata: l 1 l 2... l k = Y b+1 Y b Yb+2 Y b+k... = Y b+k = b b+k. Y b+1 Y b+k 1 Y b Két ugyanazon időegységre vonatkozó bázisviszonyszámsor hányadosa: ( At /A b ) : ( Bt /B b ) = ( At /B t ) : ( Ab /B b ) = Vt /V b. 23 / 189
23 Példa A házi gyerekorvosi betegellátás adatai Házi gyerekorvosok Bejelentkezett lakosok Betegforgalom Év száma (fő) száma (ezer fő) (ezer eset) A házi gyerekorvosi betegellátás időbeli változása Forrás: KSH Orvosok Bejelentke- Beteg- Orvosok Bejelentke- Beteg- Év száma zettek száma forgalom száma zettek száma forgalom 2005=100 Előző év= / 189
24 Példa A házi gyerekorvosi betegellátást jellemző intenzitási viszonyszámok Egy házi gyerekorvosra jutó Százezer bejelent- Egy lakosra jutó Év bejelentkezett betegforgalom kezett lakosra jutó betegforgalom lakos (fő) (eset) házi gyerekorvos (eset) Az előző táblázatból számolt dinamikus viszonyszámok Egy házi gyerekorvosra jutó Százezer bejelent- Egy lakosra jutó bejelentkezett betegforgalom kezett lakosra jutó betegforgalom Év lakos (fő) (eset) házi gyerekorvos (eset) 2005 előző év 2005 előző év 2005 előző év 2005 előző év =100 =100 =100 =100 =100 =100 =100 = / 189
25 Grafikus ábrázolás Idősorok ábrázolása: vonaldiagram Mennyiségi ismérvek kapcsolata: pontdiagram Szerkezeti megoszlás ábrázolása: osztott kör-, oszlop vagy szalagdiagram. Mennyiségi ismérv eloszlásának ábrázolása: hisztogram. 26 / 189
26 Mennyiségi sorok Y : mennyiségi ismérv; N: a sokaság elemszáma; Y 1, Y 2,..., Y N : az Y ismérv változatai, amik különbségi, vagy arány skálán mért számértékek. Diszkrét: csak megszámlálható számosságú értéket vehet fel. Valamilyen számlálás eredménye, pl. háztartás nagysága, családban lévő gépjárművek száma. Megadható a pontos értéke. Folytonos: kontinuum számosságú értéket vehet fel. Valamilyen mérés eredménye, pl. a háztartás összjövedelme, a családban lévő gépjárművek összértéke. Értéke csak bizonyos pontosságra kerekítve adható meg. Ha a diszkrét ismérv nagyon sok értéket vehet fel, kezelhetjük folytonosként, pl. nagyvárosok népessége. A rangsor a megfigyelési egységekhez tartozó Y i ismérvértékeknek az Y i monoton nemcsökkenő sorrendjében történő felsorolása. A rangsor i-edik tagját Y i -gal jelöljük. 28 / 189
27 Gyakorisági sor Az Y szerint képzett osztály Osztályközép Abszolút Relatív alsó határa felső határa gyakoriság Y 10 Y 11 Y 1 f 1 g 1 Y 20 Y 21 Y 2 f 2 g 2.. Y i0 Y i1 Y i f i g i..... Y k0 Y k1 Y k f k g k Összesen N 1 Y i0 és Y i1 : az Y ismérv szerint képzett C i osztály határai. Egybe is eshetnek. Osztályközös gyakorisági sor: f i : a C i osztály gyakorisága. g i = f i /N: a C i osztály relatív gyakorisága... Y i0 és Y i1 nem esik egybe. Y i = ( Y i0 + Y i1 ) /2: osztályközép. 29 / 189.
28 Gyakorisági sor a) Y diszkrét és kevés értéket vesz fel. Példa 405 személygépkocsi hengerszám szerinti megoszlása. A hengerek száma A személygépkocsik (darab) száma százalékos megoszlása Y i f i g i Összesen A rangsor egyértelműen feĺırható. 30 / 189
29 Gyakorisági sor b) Y folytonos vagy diszkrét és sok értéket vesz fel. Példa Magyarország városainak népességszám szerinti megoszlása, január 1. (Hunyadi, Vita, 2008, 2.3. táblázat). A városok A népesség Osztályköz száma számának népességének népességének száma (fő) hosszúság megoszlása száma (fő) megoszlása Összesen Osztályközhossz: h i = Y i1 Y i0 Ha Y 10 és/vagy Y k1 nem ismert, akkor értelmesen megbecsüljük. 31 / 189
30 Értékösszegsor Az értékösszegsor az Y ismérv alapján kialakított osztályokhoz az egyes osztályokba tartozó egységeknél fellépő ismérvértékek S i -vel jelölt összegét rendeli hozzá. S i = S i : tényleges értékösszeg. Y i0 Y Y i1 Y, i = 1, 2,..., k. Ha Y i0 = Y i = Y i1, akkor S i = f i Y i. Osztályközös gyakorisági sor becsült értékösszeg. Relatív értékösszeg: S i = f i Y i, i = 1, 2,..., k. Z i = S i k i=1 S i vagy Zi = S i k i=1 S i. 32 / 189
31 Példa Tényleges és becsült értékösszegek. A népesség száma f i Y i Si = f i Y i Zi S i Z i Összesen Kumulálás Gyakoriságok, értékösszegek: f i Hunyadi, Vita, (2008, 2.6. táblázat) = i j=1 f j, S i = i j=1 S j. 33 / 189
32 Kvantilisek Az Y i/k i-edik k-adrendű kvantilis az a szám, amelynél az összes előforduló ismérvérték legfeljebb i/k-ad része kisebb és legfeljebb (1 i/k)-ad része nagyobb, ahol k 2, i = 1, 2,..., k 1. Az i/k helyett tetszőleges 0 < p < 1 szerepelhet. k Elnevezés Jelölés Lehetséges kvantilisek 2 medián Me Me 4 kvartilis Q i Q 1, Q 2, Q 3 5 kvintilis K i K 1, K 2, K 3, K 4 10 decilis D i D 1, D 2,..., D percentilis P i P 1, P 2,..., P 99 Y 1, Y 2,..., Y N : rangsor s p = p(n + 1). Ha s p Z: Y p = Ys p. Ha s p Z: Y p = Y[s + {s p] p} ( Y[s Y p]+1 [s p]). 34 / 189
33 Példa Néhány alsó középkategóriás személygépkocsi vegyes fogyasztása. Kia cee d Citroën C4 Ford Focus Honda Civic 1.4 CVVT 1.4 Vti 1.6 Ti-VCT 1.4i Teljesítmény (LE) Fogyasztás (l/100km) Mazda 3 Opel Astra Renault Mégane Volkwagen Golf 1.6 MZR 1.4 Ecotec TSI Teljesítmény (LE) Fogyasztás (l/100km) Rangsor: 5.4, 5.5, 5.7, 5.9, 6.0, 6.1, 6.5, 6.7 Alsó kvartilis: p = 1/4, s p = 9/4, [s p] = 2, {s p} = Q 1 = ( ) = Medián: p = 1/2, s p = 9/2, [s p] = 4, {s p} = 0.5. Forrás: Az Autó, 2012/9. Q 2 = Me = ( ) = ( )/2 = Felső kvartilis: p = 3/4, s p = 27/4, [s p] = 6, {s p} = Q 3 = ( ) = / 189
34 Kvantilisek Osztályközös gyakorisági sor: a kvantilis közeĺıtése adható meg. Ỹ p = Y q0 + ( pn f q 1 )h q. f q q: annak a legelső osztálynak a sorszáma, melyre f q pn (a kvantilist tartalmazó osztály). Y q0, h q, f q : a kvantilist tartalmazó osztály alsó határa, szélessége ill. gyakorisága. f q 1 : a kvantilist tartalmazó osztály előtti osztállyal záródó kumulált gyakoriság. Relatív gyakoriságokkal való megadás: Ỹ p = Y q0 + ( p g q 1 )h q, g q Ỹ p = Y q0 + ( 100p 100g q 1 ) h q. 100g q 36 / 189
35 Példa A népesség száma h i f i 100g i f i 100g i Összesen Alsó kvartilis: p = 1/4, pn = 72, q = 2, Y q0 = 5000, h q = 5000, f q = 95, f q 1 = 56. Q 1 = (72 56) 5000/95 = Medián: p = 1/2, q = 2, Y q0 = 5000, h q = 5000, g q = , g q 1 = Q 2 = Me = ( ) 5000/ = Felső kvartilis: p = 3/4, 100p = 75.00, q = 3, Y q0 = 10000, h q = 10000, 100g q = 26.39, 100g q 1 = Q 3 = ( ) 10000/26.39 = / 189
36 Gyakorisági eloszlások grafikus ábrázolása Leveles ág ábra (stem-and-leaf). Függőleges vonal. Tőle balra az ismérvértékek legelső helyiértékű számjegyei (ágak). A vonal jobb oldalán az ismérvértékek további azonosításához szükséges számjegyek szóközzel vagy vesszővel elválasztva (levelek). Doboz ábra (box plot, box-and-whiskers plot). Vízszintes vagy függőleges tengelyen ábrázolja a kvartiliseket, ezek alkotják a dobozt, valamint a legnagyobb és a legkisebb ismérvértéket. Q 1 : a doboz alja; Q 3 : a doboz teteje; Me: a doboz osztóvonala. Hisztogram. Osztályközös gyakorisági sorban az osztályközök fölé oszlopokat emelünk, melyek területe arányos az adott osztály gyakoriságával (gyakoriság hisztogram) vagy relatív gyakoriságával (sűrűség hisztogram). 38 / 189
37 Helyzetmutatók (középértékek). Medián A medián az az ismérvérték, amelyiknél az összes előforduló ismérvérték legfeljebb fele kisebb és legfeljebb fele nagyobb. p = 1/2-hez tartozó kvantilis. N Y i A minimumhelye A = Me. i=1 Rangsorból számolva: N = 2n + 1 : Me = Y k+1, N = 2n : Me = ( Y k + Y k+1) /2. Osztályközös gyakorisági sorból számolva: Me = Y me,0 + ( N/2 f me 1)h me f me. me: a legelső olyan osztályköz sorszáma, ahol f me N/2. 39 / 189
38 Helyzetmutatók (középértékek). Módusz Diszkrét ismérv esetén a módusz a leggyakrabban előforduló ismérvérték, folytonos ismérv esetén pedig a sűrűségfüggvény maximumhelye. Osztályközös gyakorisági sorból számolható: Mo = Y mo,0 + d a d a + d f h mo. mo: a móduszt tartalmazó osztályköz sorszáma; d a = f mo f mo 1, d f = f mo f mo+1. Egyenlő osztályközök: d a és d f a tényleges gyakoriságok különbségei. Nem egyenlő osztályközök: d a és d f az egységesített (korrigált) gyakoriságok különbségei. 40 / 189
39 Példa Magyar városok gyakoriságainak egységesítése. A népesség Osztályköz Eredeti Egységnyi 5000 fő száma (fő) hosszúság hosszúságú osztályközök gyakorisága Összesen 288 Hunyadi, Vita (2008, táblázat). mo = 2, f mo = 95, f mo 1 = 70, f mo+1 = 38, Y mo,0 = 5000, h mo = 5000, d a = = 25, d f = = 57. Mo = = / 189
40 Helyzetmutatók (középértékek). Számtani átlag Y 1, Y 2,..., Y n : ismérvértékek. Számtani átlag (súlyozatlan eset): Y = Y 1 + Y Y n N N i=1 S értékösszegből: N i=1 = Y i = N (Y i A) 2 minimumhelye A = Y. Y = S/N. Gyakorisági sorból (súlyozott eset): Y N. Y = k i=1 f iy i k i=1 f i = k i=1 f iy i N = fy N = f N Y f N = gy g = gy. Y i : az i-edik osztály egyedi értéke vagy osztályközepe; f i : az i-edik osztály gyakorisága. 42 / 189
41 Szóródási mutatók. Terjedelemmutatók Terjedelem: R = YN Y 1 = Y max Y min. Osztályközös gyakorisági sor: problémás. Interkvartilis távolság: R 0.5 = Q 3 Q 1. Példa Személygépkocsik vegyes átlagfogyasztása. Rangsor: 5.4, 5.5, 5.7, 5.9, 6.0, 6.1, 6.5, 6.7 R = = 1.3 l/100km. Kvartilisek: Q 1 = 5.55, Q 3 = 6.4. R 0.5 = = 0.85 l/100km. 43 / 189
42 Szóródási mutatók. Szórás, variancia, relatív szórás Szórás: σ = 1 N (Y i Y ) N 2 = 1 N i=1 k i=1 σ = f i(y i Y ) 2 k i=1 f = i d i = Y i Y : az átlagtól való eltérés. Variancia (szórásnégyzet): σ 2. N i=1 d 2 i k i=1 f id 2 i k i=1 f i súlyozatlan eset, súlyozott eset. N (Y i Y ) 2 = i=1 Relatív szórás: N i=1 Y 2 i NY 2, azaz σ 2 = Y 2 Y 2. V = σ Y. 44 / 189
43 Példa Személygépkocsik vegyes átlagfogyasztása. Ismérvértékek: 6.0, 6.1, 5.9, 5.4, 6.5, 5.5, 6.7, 5.7. Y = = l/100 km. ( ) σ = 2 + ( ) ( ) 2 8 = l/100 km. V = /5.975 = / 189
44 Példa Magyar városok népessége A népesség száma f i Y i f i Y i d i = Y i Y f i di Összesen Y = /288 = σ = = V = / = / 189
45 Koncentráció A sokasághoz tartozó teljes értékösszeg jelentős részének vagy egészének kevés egységre való összpontosulását koncentrációnak nevezzük. Kicsi sokaság: abszolút koncentráció. Nagy sokaság: relatív koncentráció. Lorenz görbe Egyedi adatok: Y1, Y 2,..., Y N rangsor, S értékösszeg. ( ) k k (0, 0) és N, i=1 Y i, k = 1, 2,..., N, pontok. S Osztályközök: g i, Z i osztályközös kumulált relatív gyakoriságok és relatív értékösszegek. (0, 0) és (g i, Z i ), i = 1, 2,..., k, pontok. Koncentrációs együttható: a görbe és a négyzet átlója által bezárt terület (koncentrációs terület) aránya a négyzet feléhez. Jele: L. 47 / 189
46 Példa Magyar városok népességeinek relatív gyakoriságai és értékösszegei. A népesség száma f i g i g i S i Z i Z i Összesen Z i Koncentrációs együttható: L = Közepes koncentráció g i 48 / 189
47 Koncentráció Herfindahl index: HI = N i=1 Z 2 i. HI = 1/N: nincs koncentráció. HI = 1: teljes koncentráció. Példa Autógyárak piaci részesedése (%) Európában 2010 és 2011 júnusában: Gyártó VW csop. PSA csop. Renault csop. GM csop. Ford Gyártó Fiat csop. BMW csop. Daimler csop. Toyota csop. Egyéb Forrás: Európai Autógyártók Szövetsége 2011: HI = = : HI = = / 189
48 Momentumok A körüli r-edik momentum: M r (A) = 1 N N (Y i A) r = 1 N i=1 k i=1 M r (A) = f i(y i A) r k i=1 f = 1 i N N i=1 d r i (A) k i=1 f i d r i (A) súlyozatlan eset, súlyozott eset. d i (A) = Y i A: az A értéktől való eltérés. A = 0: A = Y : r-edik momentum; r-edik centrális momentum. Speciális esetek: M 1 (0) = Y, M 1 (Y ) = 0. M 2 (0) = Y 2, M 2 (Y ) = σ / 189
49 Alakmutatók Csucsosabb Jobbra elnyulo Balra elnyulo Lapultabb Normalis eloszlas Asszimetria: jobbra vagy balra elnyúló. Csúcsosság: hegyesebb vagy lapultabb, mint az ugyanolyan várható értékű és szórású normális eloszlás. 51 / 189
50 Asszimetriamutatók Ferdeség (skewness): α 3 = M 3(Y ) σ 3. Pearson-féle mutató: P = 3(Y Me). σ Decilisek és a medián eltérésén alapuló mutató: F 0,1 = (D 9 Me) (Me D 1 ) (D 9 Me) + (Me D 1 ), 1 F 0,1 1. Mutató Jobbra elnyúló Szimmetrikus Balra elnyúló Ferdeség α 3 > 0 α 3 0 α 3 < 0 Pearson P > 0 P 0 P < 0 Decilisek F 0,1 > 0 F 0,1 0 F 0,1 < 0 52 / 189
51 Példa Személygépkocsik vegyes átlagfogyasztása. Ismérvértékek: 6.0, 6.1, 5.9, 5.4, 6.5, 5.5, 6.7, 5.7. Y = 5.975, σ = , Me = M 3 (Y ) = ( )3 + ( ) ( ) 3 8 = α 3 = = , Jobbra elnyúló. P = 3( ) = / 189
52 Csúcsossági mutató Lapultság (kurtosis): α 4 = M 4(Y ) σ 4 3. Normális eloszlás esetén az elméleti értéke 0. Azonos paraméterű normálishoz hasonĺıtjuk. Normálisnál csúcsosabb Megegyező Normálisnál lapultabb α 4 > 0 α 4 0 α 4 < 0 Példa Személygépkocsik vegyes átlagfogyasztása. Ismérvértékek: 6.0, 6.1, 5.9, 5.4, 6.5, 5.5, 6.7, 5.7. M 4 (Y ) = ( )4 + ( ) ( ) 4 8 = α 4 = = Lapultabb, mint az várható értékű, szórású normális. 54 / 189
53 Heterogén sokaságok Az elemzés Y ismérve szempontjából lényegesen eltérő jellegzetességeket mutató részekre bontható sokaságokat az adott ismérv szempontjából heterogén sokaságoknak nevezzük. A fősokaságot M darab részsokaságra bontjuk valamilyen csoportképző ismérv alapján. Részviszonyszámok: Összetett viszonyszám: V j = A j /B j, j = 1, 2,..., M. V = M j=1 A j M j=1 B j = M A j=1 = B jv j B M j=1 B j = M j=1 A j M j=1. A j V j A j és B j helyett a belőlük képzett megoszlási viszonyszámok is használhatóak. 56 / 189
54 Példa A magyar lakásállomány megoszlása (ezer) adott év január 1.-én Szobák Lakások száma Százalékos megoszlás évi álloszáma mány (1990=100) és több Összesen Utolsó oszlop első 3 sor: részviszonyszámok. Utolsó oszlop utolsó sor: összetett viszonyszám = %, = = = %, = % = % / 189
55 Rész- és főátlagok Y ij : a j-edik részsokaság (j = 1, 2,..., M) i-edik értéke (i = 1, 2,..., N j ). N = M j=1 N j: a fősokaság nagysága. A j-edik részátlag: Y j = 1 N j N j i=1 Y ij = S j N j, j = 1, 2,..., M. S j = N j i=1 Y ij: a j-edik részsokaság értékösszege. A főátlag: mivel Y = 1 N N M j Y ij = 1 N j=1 i=1 M M j=1 S j = N M jy j j=1 M j=1 N = S j j j=1 S j = N j Y j, azaz N j = S j Y j. M j=1, S j Y j 58 / 189
56 Teljes szórás és variancia Átlagtól való eltérés: d ij = Y ij Y = B ij + K j, i = 1, 2,..., N j, j = 1, 2,..., M. Belső eltérés: Külső eltérés: B ij = Y ij Y j, i = 1, 2,..., N j, j = 1, 2,..., M. Teljes szórás: σ = 1 N Teljes variancia: σ 2 = 1 N K j = Y j Y, j = 1, 2,..., M. N M j (Y ij Y ) 2 = 1 N j=1 i=1 N M j (Y ij Y ) 2 = 1 N j=1 i=1 N M j dij 2. j=1 i=1 N M j dij 2. j=1 i=1 59 / 189
57 Belső szórás és variancia Részszórások vagy csoporton belüli szórások: N j σ j = 1 N (Y ij Y j ) N 2 = 1 j Bij 2, j = 1, 2,..., M. j N j i=1 Belső szórás: σ B = 1 N i=1 N M j (Y ij Y j ) 2 = 1 N j=1 i=1 N M j Bij 2. j=1 i=1 A σ B belső szórás azt mutatja, hogy a fősokaság egyes egységeihez tartozó Y ij ismérvéretékek átlagosan mennyivel térnek el a saját részátlaguktól. A belső szórás négyzete a belső variancia. Részvarianciák és belső variancia kapcsolata: σb 2 = 1 M N j σj 2. N j=1 60 / 189
58 Külső szórás és variancia Külső szórás: σ K = 1 N N M j (Y j Y ) 2 = 1 N j=1 i=1 M j=1 N j K 2 j. A σ K külső szórás azt mutatja, hogy a részátlagok átlagosan mennyire térnek el a főátlagtól. Kapcsolat a varianciák között: σ 2 = σb 2 + σ2 K. Négyzetösszegek közötti összefüggés: N M j N M j M (Y ij Y ) 2 = (Y ij Y j ) 2 + N j (Y j Y ) 2. j=1 i=1 j=1 i=1 j=1 SST = SSB + SSK SST a teljes, SSB a belső, SSK a külső négyzetösszeg. 61 / 189
59 Példa Középfölde népei évenkénti fogathajtó versenye döntőjének másodpercekben mért eredményei: j Népcsoport Eredmény Y ij N j S j Nj i=1 (Y ij Y j ) 2 1 Tündék Törpök Emberek Hobbitok Összesen Y 1 = 163.5/3 = 54.50, Y 2 = 100.2/2 = 50.10, Y 3 = 214.0/4 = 53.55, Y 4 = 146.4/3 = Y = = = / 189
60 Példa j Népcsoport Eredmény Y ij N j S j Nj i=1 (Y ij Y j ) 2 1 Tündék Törpök Emberek Hobbitok Összesen Y 1 = 54.50, Y 2 = 50.10, Y 3 = 53.55, Y 4 = 48.80, Y = SST = ( ) ( ) 2 = , SSK = 3 ( ) ( ) 2 = , SSB = SST SSK = σ = = , σ B = = , σ K = = σ 1 = 52.08/3 = , σ 2 = 48.02/2 = , σ 3 = 22.35/4 = , σ 4 = 47.12/3 = / 189
61 Az ismérvek közötti kapcsolat fajtái Lehetséges kapcsolatok két ismérv között: Az ismérvek függetlenek egymástól. Pl. hajszín, testmagasság. A két ismérv között sztochasztikus kapcsolat van, azaz pl. a sokaság egységeinek X szerinti hovatartozásából, milyenségéből következtetni lehet az Y szerinti hovatartozásra, milyenségre. Pl. hajszín, szemszín. A két ismérv között függvényszerű, azaz determinisztikus kapcsolat van. Pl. ösztöndíjátlag, tanulmányi ösztöndíj. Az ismérvek fajtái szerinti csoportosítás: Asszociáció: mindkét ismérv minőségi vagy területi (nominális skála). Vegyes kapcsolat: az egyik ismérv mennyiségi, a másik minőségi vagy területi (különbségi vagy arány és nominális skála). Korreláció: mindkét ismérv mennyiségi (különbségi vagy arány skála). Rangkorreláció: mindkét ismérvet sorrendi skálán mérjük. 64 / 189
62 Asszociáció A kontingenciatábla általános alakja: Az X ismérv sze- Az Y ismérv szerinti osztályok j rinti osztályok C1 Y C2 Y... Cj Y... Cc Y C1 x f 11 f f 1j... f 1c f 1 C2 x f 21 f f 2j... f 2c f Ci x f i1 f i2... f ij... f ic f i Cr x f r1 f r2... f rj... f rc f r i f 1 f 2... f j... f c N Utolsó sor: Y szerinti megoszlás. Utolsó oszlop: X szerinti megoszlás. Ha a soronkénti megoszlások azonosak, akkor X és Y függetlenek. Ha a soronként legfeljebb egy nem 0 gyakoriság van, akkor X értéke egyértelműen meghatározza Y értékét, azaz függvényszerű a kapcsolat. 65 / 189
63 Tényleges és várt gyakoriságok A C X i C Y j tényleges illetve relatív gyakorisága: f ij illetve f ij /N. Ha C X i P ( C X i és C Y j Cj Y ) f ij N, függetlenek, akkor P( Ci X ) f i N, P( Cj Y ) f j N. P ( C X i C Y j ) ( ) ( ) = P C X i P C Y f i j N f j N. C X i C Y j várt gyakorisága (ha függetlenek): NP ( C X i Cj Y ) f i f j N. Várt gyakoriságok (a függetlenség feltételezése mellett): f ij = f i f j N. 66 / 189
64 A kapcsolat szorossága Khi-négyzet (chi-square) mutató: X 2 = r c i=1 j=1 (f ij f ij )2 f ij r = N i=1 j=1 c fij 2 1. f i f j Lehetséges értékei: O X 2 N min { (r 1), (c 1) }. X 2 = 0: X és Y függetlenek. X 2 = N min { (r 1), (c 1) } : kapcsolat. X és Y között függvényszerű a Cramér-féle asszociációs együttható (SPSS: Cramer s V): X C = 2 N min { }, 0 C 1. (r 1), (c 1) C = 0: C = 1: X és Y függetlenek. X és Y között függvényszerű a kapcsolat. 67 / 189
65 Példa Egy kutatócsoport azt vizsgálta, milyen szoros az összefüggés egy bizonyos betegség lefolyásának súlyossága és a betegek életkora között. A vizsgálati adatok: Életkor Összesen 40 alatti fölötti enyhe Lefolyás közepes súlyos Összesen r = c = 3, N = 200. Várt gyakoriságok: X 2 ( )2 ( )2 ( )2 = = C = = Gyenge kapcsolat / 189
66 PRE eljárás a kapcsolat szorosságának mérésére Határozzuk meg annak a többletinformációnak a mennyiségét, amit a sokaság egységeinek az X szerinti hovatartozása nyújt az Y szerinti hovatartozásról. PRE eljárás: 1. Meghatározzuk, hogy összességében mekkora hibával járna, ha sokaság egységenek Y szerinti hovatartozását kizárólag azok Y szerinti megoszlása alapján próbálnánk meg megadni. Jelölés: E Meghatározzuk a hibát akkor is, ha ismerjük az egységek X szerinti hovatartozását. Jelölés: E Meghatározzuk a relatív hibacsökkenést: 0 PRE = E 1 E 2 E 1 1. PRE = 0: PRE = 1: X és Y függetlenek. X és Y között függvényszerű a kapcsolat. 69 / 189
67 Vegyes kapcsolat Y a mennyiségi, X a minőségi vagy területi ismérv. Y ij : a X szerint képzett j-edik részsokaság i-edik egységéhez tartozó Y ismérvérték (j = 1, 2,..., M, i = 1, 2,..., N j ). X ismerete nélkül az Y értékének becslése Y. A becslési hiba: N M j E 1 = (Y ij Y ) 2 = SST. j=1 i=1 Ha tudjuk, a vizsgált egység az X szerinti j-edik részsokaságba tartozik, akkor az Y értékének becslése Y j. A becslési hiba: PRE mutató: PRE = E 1 E 2 E 1 E 2 = = N M j (Y ij Y j ) 2 = SSB. j=1 i=1 SST SSB SST = SSK SST = 1 σ2 B σ 2 = σ2 K σ 2 = H2. 70 / 189
68 Varianciahányados Varianciahányados: 0 H 2 = SST SSB SST = SSK SST 1. H 2 az Y ismérv szórásnégyzetének az X ismérv által megmagyarázott hányada. H 2 = 0 SSK = M N j (Y j Y ) 2 = 0 Y = Y j. j=1 Ez teljesül, ha X és Y független. H 2 = 1 SSB = N M j (Y ij Y j ) 2 = 0 Y ij = Y j. j=1 i=1 Ekkor X és Y között függvényszerű a kapcsolat. Szóráshányados: H = H / 189
69 Példa Középfölde népei évenkénti fogathajtó versenye döntőjének másodpercekben mért eredményei: j Népcsoport Eredmény Y ij N j 1 Tündék Törpök Emberek Hobbitok Összesen 12 SST = , SSB = , SSK = H 2 = = (28.11%), H = A népcsoporthoz való tartozás az Y szórásnégyzetének 28.11%-át magyarázza. H = közepesen erős kapcsolatot jelez. 72 / 189
70 Empirikus (tapasztalati) regressziófüggvény X és Y mennyiségi ismérvek (akár fel is cserélhető a szerepük). X : csoportképző ismérv. X szerinti osztályokat sorrendbe tudjuk álĺıtani X értékei szerint. Vizsgálható az X és az Y közötti kapcsolat iránya. Ha X növekedésével Y értéke is nő, az irány pozitív, ellenkező esetben negatív. Az X szerint képzett részsokaságokhoz hozzárendelt Y j részátlagok sorozatát az Y változó X változóra vonatkozó (X szerinti) empirikus regressziófüggvényének nevezzük. Grafikus ábrázolás: az (X i, Y i ) pontokat összekötő vonaldiagram. Y -nak X -re vonatkozó determinációs hányadosa (az X szerinti osztályokból számolt varianciahányados): η 2 Y X = σ2 K (Y ) σ 2 (Y ). σ 2 K (Y ) illetve σ2 (Y ): Y külső, illetve teljes szórásnégyzete. 73 / 189
71 Példa A háztartások taglétszáma és átlagos egy főre jutó havi nettó jövedelme 2004-ben Budapesten és a községekben. A háztartás Az adott taglétszámú háztartásban lévő személyek tagjainak százalékos megoszlása egy főre jutó jövedelme (Ft) száma Budapesten községekben Budapesten községekben és több Összesen Forrás: KSH Legalább 6 fős háztartások átlagos létszáma Budapesten 6.55 fő, a községekben 6.74 fő. 74 / 189
72 Empirikus regressziófüggvény Egy fore juto havi netto jovedelem (ezer Ft) Budapest kozsegek Tagletszam (fo) Az egy főre jutó havi nettó jövedelem és a háztartások taglétszáma közötti kapcsolat empirikus regressziófüggvényei. 75 / 189
73 Analitikus regressziófüggvény X és Y mennyiségi ismérvek. Az (X i, Y i ) párokat vizsgáljuk. Kérdés: Felhasználható-e az X változó X i értéke az Y változó ugyanazon egységéhez tartozó Y i érték előrejelzésére? Az X és Y közötti sztochasztikus kapcsolat természetét egy f (X ) függvénnyel, analitikus regressziófüggvénnyel akarjuk leírni. Például: f (X ) = β 0 + β 1 X, f (X ) = β 0 β X 1, lineáris regresszió; exponenciális regresszió. Az Y változó X i -hez tartozó értékének előrejelzése f (X i ). Pontdiagram: az (X i, Y i ) párok ábrázolása a kétdimenziós tér pontjaiként. Utal az f (X ) létezésére illetve alakjára. 76 / 189
74 Pontdiagram típusok a) b) Y Y X c) X d) Y Y X X a) X és Y független. b) X és Y között pozitív irányú (lineáris) kapcsolat. c) X és Y között negatív d) X és Y között nemlineáris irányú (lineáris) kapcsolat. kapcsolat. 77 / 189
75 Korreláció (Lineáris) korrelációs együttható: dxi d Yi Xi Y r(x, Y ) = i NX Y = d 2 Xi d 2 ( )( Yi X 2 ) i N(X ) 2 Y 2 i N(Y ) 2 N X i Y i ( )( ) X i Yi = ( N Xi 2 ( ) )( 2 X i N Yi 2 ( ) ). 2 Y i Az 1 r(x, Y ) 1 korrelációs együttható abszolút értéke az X és Y közötti lineáris kapcsolat szorosságát méri, előjele pedig a kapcsolat irányát mutatja. r(x, Y ) = ±1: függvényszerű lineáris kapcsolat; r(x, Y ) = 0: nincs lineáris kapcsolat. Korrelálatlanok. Nem feltétlenül függetlenek! Minél nagyobb r(x, Y ), annál szorosabb a kapcsolat. 78 / 189
76 Kovariancia X és Y kovarianciája: Kapcsolata a korrelációval: σ X, σ Y : X illetve Y szórása. C(X, Y ) = dxi d Yi N r(x, Y ) = C(X, Y ) σ X σ Y. Kapcsolata a varianciával: C(X, X ) = σ 2 X. C(X, Y ) > 0: X és Y között pozitív irányú kapcsolat; C(X, Y ) < 0: X és Y között negatív irányú kapcsolat. C(X, Y ) = 0: nincs lineáris kapcsolat. Nem feltétlenül függetlenek!. 79 / 189
77 Determinációs együttható, súlyozott alakok Determinációs együttható: r 2. PRE mutató. 100r 2 azt mutatja, hogy az X ismerete hány százalékkal csökkenti az Y nagyságával kapcsolatos bizonytalanságot, ha X és Y között lineáris kapcsolat van. Súlyozott alakok: C(X, Y ) = fi d Xi d Yi N, r(x, Y ) = fi d Xi d Yi fi d 2 Xi fi d 2 Yi. f i : az (X i, Y i ) pár gyakorisága. N = f i : a sokaság elemszáma. 80 / 189
78 Példa Néhány alsó középkategóriás személygépkocsi vegyes fogyasztása és CO 2 kibocsátása. Kia cee d Citroën C4 Ford Focus Honda Civic 1.4 CVVT 1.4 Vti 1.6 Ti-VCT 1.4i Teljesítmény (LE) Fogyasztás (l/100km) CO 2 (g/km) Mazda 3 Opel Astra Renault Mégane Volkwagen Golf 1.6 MZR 1.4 Ecotec TSI Teljesítmény (LE) Fogyasztás (l/100km) CO 2 (g/km) Forrás: Az Autó, 2012/9. X : 6.0, 6.1, 5.9, 5.4, 6.5, 5.5, 6.7, 5.7; X = 5.975; Y : 139, 140, 136, 128, 149, 129, 155, 134; Y = / 189
79 d x : 0.025, 0.125, 0.075, 0.575, 0.525, 0.475, 0.725, 0.275; d y : 0.25, 1.25, 2.75, 10.75, 10.25, 9.75, 16.25, d 2 x = ( 0.275) 2 = 1.455, d 2 y = ( 4.75) 2 = 611.5, dx d y = ( 0.275) ( 4.75) = dxi d Yi C(X, Y ) = N r(x, Y ) = = dxi d Yi = d 2 Xi d 2 Yi = , = Nagyon erős lineáris kapcsolat. 82 / 189
80 Pontdiagram CO2 (Y ) Fogyasztas (X) Korreláció: r(x, Y ) = Determinációs együttható: r 2 = Az egyenes egyenlete: f (X ) = X. 83 / 189
81 Rangkorreláció Mindkét ismérv sorrendi skálán mérhető. R X és R Y : az X és Y változó szerinti rangok. Kapcsolt rangok: az adott ismérv több értéke is megegyezik. A hozzájuk tartozó rangok átlagát kapja meg mindegyik azonos ismérvérték. Spearman-féle rangkorrelációs együttható: 1 ϱ = 1 6 (R X R Y ) 2 N(N 2 1) 1. ϱ = 1: ϱ = 1: ϱ = 0: tökéletesen egyező rangsorolás. tökéletesen ellentétes rangsorolás. nincs kapcsolat a rangsorolások között. Nincsenek kapcsolt rangok ϱ megegyezik a rangokból számolt r korrelációs együtthatóval. ϱ 2 : a kapcsolat szorosságát mérő PRE mutató. 84 / 189
82 Példa A hazai informatikai képzőhelyek 2015-ös, a hallgatói, illetve az oktatói kiválóság szerinti rangsorai. (Forrás: eduline.hu) ϱ = 1 Intézmény Hallgatók (R X ) Oktatók (R Y ) (R X R Y ) 2 BME-VIK ELTE-IK SZTE-TTIK PE-MIK DE-IK DF OE-NIK PPKE-ITK GDF Kf-GAMFK Összesen (100 1) = 1 3 =0.3(3), ϱ2 = 1 =0.1(1), r = Gyenge kapcsolat a rangsorok között. 85 / 189
83 Összetett intenzitási viszonyszámok összehasonĺıtása Két azonos tartalmú, de különböző összetett viszonyszámot kívánunk összehasonĺıtani. V 0i = A 0i /B 0i, V 1i = A 1i /B 1i : Összetett viszonyszámok: j V s = A sj j j B = B sjv sj sj j B sj V 0 és V 1 eltérésének okai: részviszonyszámok. = j j A sj, s = 0, 1. A sj V sj eltérőek lehetnek a két sokaság ugyanazon részeire számított V 0i és V 1i részviszonyszámok, és/vagy eltérő lehet a két sokaság szerkezete (összetétele). 87 / 189
84 Jelölések Rész- Első sokaság Második sokaság Összehasonĺıtás sokaság szám- neve- viszony- szám- neve- viszony- különb- hányasorszáma láló ző szám láló ző szám ség dos 1 A 01 B 01 V 01 A 11 B 11 V 11 k 1 i 1 2 A 02 B 02 V 02 A 12 B 12 V 12 k 2 i j A 0j B 0j V 0j A 1j B 1j V 1j k j i j M A 0M B 0M V 0M A 1M B 1M V 1M k M i M Fősokaság A0j B0j V 0 A1j B1j V 1 K I Részviszonyszám különbségek: k j = V 1j V 0j. Részviszonyszám hányadosok: i j = V 1j /V 0j. Összetett viszonyszám különbségek: K = V 1 V 0. Összetett viszonyszám hányadosok: I = V 1 /V / 189
85 Különbségfelbontás Teljes különbség: K = V 1 V 0. K = B1 V 1 B1 B0 V 0 B0. Részhatás különbség(ek): K = K s Bs V 1 = Bs Bs V 0 Bs = Bs (V 1 V 0 ) Bs k =, s = 0, 1. Bs Bs A részviszonyszámok közötti eltérések hatását mutatja. Összetétel hatás különbség(ek): K = K s = B1 V s B1 B0 V s B0, s = 0, 1. A sokaságok eltérő összetételének a hatását mutatja. Feltétel: K = K + K. a) Ha K -ben B s = B 0, akkor K -ben V s = V 1 (K = K 0 + K 1 ). b) Ha K -ben B s = B 1, akkor K -ben V s = V 0 (K = K 1 + K 0 ). 89 / 189
86 Példa Korcso- Népesség száma Halálozások száma Halálozási arányszám port (millió fő) (fő) ( ) (év) Mexikó Svédország Mexikó Svédország Mexikó Svédország Összesen Keresztély, Sugár, Szarvas (2005, B.7 feladat, 87. old.) Korcso- Népesség megoszlása port (%) (év) Mexikó Svédország Összesen A 1 : A 0 : B 1 : B 0 : V 1 : V 0 : halálozások száma, Svédország; halálozások száma, Mexikó; népesség száma, Svédország; népesség száma, Mexikó; halálozási arány, Svédország; halálozási arány, Mexikó. K = V 1 V 0 = = / 189
87 Példa Korcso- Népesség Halálozások száma Halálozási arányszám port megoszlása (% ) (fő) ( ) (év) Mexikó Svédország Mexikó Svédország Mexikó Svédország Összesen K = 10.3 = K = 4.8 = K 1 = K K 0 = = 7.3 K 0 = K K 1 = = 9.4 K 10 = K 1 + K = = K 10 = K 1 + K 0 2 = = / 189
88 Hányadosfelbontás Összhatásindex: I = V 1 /V 0. A1 A0 I = : = B1 B0 Részhatásindex(ek): A1 A0 : B1 B1 V 1 B0 V = : 0. B0 B1 B0 I = I s = Bs V 1 Bs : Bs V 0 Bs V = 1, s = 0, 1. Bs Bs V 0 A részviszonyszámok változásának hatását mutatja. Összetételhatás index(ek): I = I s = B1 V s B1 : B0 V s B0, s = 0, 1. A sokaságok összetétele megváltozásának a hatását mutatja. Feltétel: I = I I. a) Ha I -ben B s = B 0, akkor I -ben V s = V 1 (I = I 0 I 1 ). b) Ha I -ben B s = B 1, akkor I -ben V s = V 0 (I = I 1 I 0 ). 92 / 189
89 Példa Legmaga- Létszám Havi Létszám Havi 2007= sabb iskolai bruttó bruttó 100 végzettség fő megosz- átlag- fő megosz- átlag- i = B 0 lás (% ) kereset, B 1 lás (% ) kereset, V 1 /V 0 eft V 0 eft V 1 8 ált. alatt általános Szakiskola Középisk Föiskola Egyetem Összesen Forrás: Munkaügyi adattár. 2008, I = 113.4%, I 1 = : = (109.81%), I 0 = : = (103.27%), I 0 = : = (109.89%), I 1 = : = (103.20%). 93 / 189
90 Aggregátumok összehasonĺıtása Aggregátum: A = n q i p i = i=1 n i=1 q i : az i-edik fajta egységeinek (termékeinek) mennyisége valamilyen alkalmas mértékegységben; p i : az i-edik fajta egység egységára; ν i : az i-edik fajta egységek összértéke. Ha a q i adatok: termelt mennyiségek, akkor A a termelés; eladott mennyiségek, akkor A a forgalom; fogyasztott mennyiségek, akkor A a fogyasztás. ν i q i : valamilyen időszakra értelmezhető. p i : valamilyen időpontra értelmezhető. Továbbiakban: q i termelt mennyiség; p i egységár. 94 / 189
91 Két időszak közötti összehasonĺıtás n termék két időszakra vonatkozóan: bázisidőszak, tárgyidőszak Termék Termelt Egységár Termelt Egységár sorszáma (i) mennyiség mennyiség a bázisidőszakban a tárgyidőszakban 1 q 01 p 01 q 11 p 11 2 q 02 p 02 q 12 p i q 0i p 0i q 1i p 1i..... n q 0n p 0n q 1n p 1n Rövid jelölés q 0 p 0 q 1 p 1 Kérdések egy termékkel vagy a termékek összességével kapcsolatban: a) hogyan változott a termelés értéke; b) hogyan változott a termelés mennyisége (volumene); c) hogyan változott az ár, ill. az árszinvonal. 95 / 189
92 Egyedi indexek Egy termék vizsgálata dinamikus viszonyszámok. i ν = q 1ip 1i q oi p oi = ν 1i ν 0i, i q = q 1i q oi, i p = p 1i p oi. Az egy termékre vonatkozóan meghatározott i ν, i q és i p dinamikus viszonyszámokat egyedi indexenknek nevezzük. Az egyedi indexek rendre azt mutatják meg, hogy hogyan (hány százalékkal) változott az adott termékre vonatkozó termelési érték, termelt mennyiség, egységár a bázisidőszakról a tárgyidőszakra. Összefüggés az egyedi indexek között: i ν = i q i p. 96 / 189
93 Érték- és volumenindex Értékindex: I ν = q1 p 1 ν1 =. q0 p 0 ν0 Az I ν értékindex azt mutatja, hogy hogyan (hány százalékkal) változott a teljes termelés értéke a bázisidőszakról a tárgyidőszakra. Volumenindex: I q = q1 p s q0 p s. p s : mindkét időszakra érvényesnek feltételezett egységár. Az I q volumenindex azt mutatja, hogy a termelt mennyiségek összességükben hogyan (hány százalékkal) változtak, vagyis hogyan változott a termelés volumene a bázisidőszakról a tárgyidőszakra. 97 / 189
Statisztika 1 előadás
Statisztika 1 előadás Baran Sándor 2017/18 tanév, 1. félév Baran Sándor Statisztika 1 előadás 2017/18 tanév, 1. félév 1 / 189 Irodalom Hunyadi László., Vita László: Statisztika I. Aula Kiadó, Budapest,
RészletesebbenBevezető Adatok rendezése Adatok jellemzése Időbeli elemzés
Gazdaságstatisztika 2. előadás Egy ismérv szerinti rendezés Kóczy Á. László KGK VMI Áttekintés Gyakorisági sorok Grafikus ábrázolásuk Helyzetmutatók Szóródási mutatók Az aszimmetria mérőszámai Koncentráció
RészletesebbenBevezető Adatok rendezése Adatok jellemzése Időbeli elemzés. Gazdaságstatisztika KGK VMI
Gazdaságstatisztika 2. előadás Egy ismérv szerinti rendezés Kóczy Á. László KGK VMI Áttekintés Gyakorisági sorok Grafikus ábrázolásuk Helyzetmutatók Szóródási mutatók Az aszimmetria mérőszámai Koncentráció
RészletesebbenStatisztikai alapfogalmak
Statisztika I. KÉPLETEK 2011-2012-es tanév I. félév Statisztikai alapfogalmak Adatok pontossága Mért adat Abszolút hibakorlát Relatív hibakorlát Statisztikai elemzések viszonyszámokkal : a legutolsó kiírt
RészletesebbenKÖZPONTI STATISZTIKAI HIVATAL. Szóbeli vizsgatevékenység
KÖZPONTI STATISZTIKAI HIVATAL A vizsgarészhez rendelt követelménymodul azonosító száma, megnevezése: 2144-06 Statisztikai szervezői és elemzési feladatok A vizsgarészhez rendelt vizsgafeladat megnevezése:
RészletesebbenKorrelációs kapcsolatok elemzése
Korrelációs kapcsolatok elemzése 1. előadás Kvantitatív statisztikai módszerek Két változó közötti kapcsolat Független: Az X ismérv szerinti hovatartozás ismerete nem ad semmilyen többletinformációt az
Részletesebben2. előadás. Viszonyszámok típusai
2. előadás Viszonyszámok típusai Mérési skálák Nominális /névleges skála: kötetlen hozzárendelése a számoknak Sorrendi / Ordinális skála: sokaság egyedeinek egy közös tulajdonság szerinti sorbarendezése
RészletesebbenStatisztika I. 2. előadás: Statisztikai táblák elemzése. Kóczy Á. László. Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet Óbudai Egyetem
Statisztika I 2 előadás: Statisztikai táblák elemzése Kóczy Á László koczylaszlo@kgkuni-obudahu Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet Óbudai Egyetem Eddig statisztikai alapfogalmak
RészletesebbenBevezető Mi a statisztika? Mérés Csoportosítás
Gazdaságstatisztika 1. előadás Kóczy Á. László Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet Oktatók Előadó Kóczy Á. László (koczy.laszlo@kgk.bmf.hu) Fogadóóra: szerda 11:30 11:55, TA125 Gyakorlatvezető
RészletesebbenSta t ti t s i zt z i t k i a 3. előadás
Statisztika 3. előadás Statisztika fogalma Gyakorlati tevékenység Adatok összessége Módszertan A statisztika, mint gyakorlati tevékenység a tömegesen előforduló jelenségek egyedeire vonatkozó információk
RészletesebbenStatisztika 2. Dr Gősi Zsuzsanna Egyetemi adjunktus
Statisztika 2. Dr Gősi Zsuzsanna Egyetemi adjunktus Gyakorisági sorok Mennyiségi ismérv jellemző rangsor készítünk. (pl. napi jegyeladások száma) A gyakorisági sor képzése igazából tömörítést jelent Nagyszámú
Részletesebben[GVMGS11MNC] Gazdaságstatisztika
[GVMGS11MNC] Gazdaságstatisztika 1. előadás Kóczy Á. László koczy.laszlo@kgk.uni-obuda.hu Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet Óbudai Egyetem Oktatók Előadó Kóczy Á. László (koczy.laszlo@kgk.uni-obuda.hu)
RészletesebbenSta t ti t s i zt z i t k i a 1. előadás
Statisztika 1 előadás Témakörök Statisztikai alapfogalmak Statisztikai sorok Mennyiségi sorok csoportosítása Statisztikai táblák Statisztika fogalma Gyakorlati tevékenység Adatok összessége Módszertan
RészletesebbenViszonyszám A B. Viszonyszám: két, egymással kapcsolatban álló statisztikai adat hányadosa, ahol A: a. viszonyítadóadat
Viszonyszámok Viszonyszám Viszonyszám: két, egymással kapcsolatban álló statisztikai adat hányadosa, ahol A: a viszonyítandó adat Viszonyítás tárgya (viszonyítandó adat) B: a viszonyítás alapja V viszonyítadóadat
RészletesebbenStatisztika I. 11. előadás. Előadó: Dr. Ertsey Imre
Statisztika I. 11. előadás Előadó: Dr. Ertsey Imre Összefüggés vizsgálatok A társadalmi gazdasági élet jelenségei kölcsönhatásban állnak, összefüggnek egymással. Statisztika alapvető feladata: - tényszerűségek
RészletesebbenFüggetlenségvizsgálat, Illeszkedésvizsgálat
Varga Beatrix, Horváthné Csolák Erika Függetlenségvizsgálat, Illeszkedésvizsgálat 4. előadás Üzleti statisztika A sokaság/minta több ismérv szerinti vizsgálata A statisztikai elemzés egyik ontos eladata
RészletesebbenSTATISZTIKA I. A változók mérési szintjei. Nominális változók. Alacsony és magas mérési szint. Nominális változó ábrázolása
A változók mérési szintjei STATISZTIKA I. 3. Előadás Az adatok mérési szintjei, Viszonyszámok A változók az alábbi típusba tartozhatnak: Nominális (kategorikus és diszkrét) Ordinális Intervallum skála
RészletesebbenKvantitatív statisztikai módszerek
Kvantitatív statisztikai módszerek 1. konzultáció tárgyjegyző Dr. Szilágyi Roland Mérési skálák Számok meghatározott szabályok szerinti hozzárendelése jelenségekhez, bizonyos tulajdonságokhoz. 4 féle szabály
RészletesebbenStatisztika 3. Dr Gősi Zsuzsanna Egyetemi adjunktus Koncentráció mérése Koncentráció általában a jelenségek tömörülését, összpontosulását értjük. Koncentráció meglétéről gyorsan tájékozódhatunk, ha sokaságot
RészletesebbenStatisztikai alapfogalmak
i alapfogalmak statisztikai sokaság: a megfigyelés tárgyát képező egyedek összessége 2 csoportja van: álló sokaság: mindig vmiféle állapotot, állományt fejez ki, adatai egy adott időpontban értelmezhetők
RészletesebbenBevezető Mi a statisztika? Mérés Feldolgozás Adatok rendezése Adatok jellemzése Időbeli elemzés Feladatok. Statisztika I.
Statisztika I. 1. előadás: A statisztika alapfogalmai Kóczy Á. László koczy.laszlo@kgk.uni-obuda.hu Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet Óbudai Egyetem A kurzusról A kurzus célja
RészletesebbenMegoldások. Az ismérv megnevezése közös megkülönböztető 2007. szeptember 10-én Cégbejegyzés időpontja
Megoldások 1. feladat A sokaság: 2007. szeptember 12-én a Miskolci Egyetem GT-204-es tankör statisztika óráján lévő tagjai az A 1 épület III. em. 53-as teremben 8-10-ig. Közös ismérv Megkülönböztető ismérv
Részletesebben2013 ŐSZ. 1. Ismertesse a mérési skálák tulajdonságait és a közöttük lévő összefüggéseket.
GAZDASÁGSTATISZTIKA KIDOLGOZOTT ELMÉLETI KÉRDÉSEK AZ 1. ZH-HOZ 2013 ŐSZ (Jelen kérdések az első zh összes elméleti témakörét összegzik, melyeket egymásra épülő sorrendben, illetve tematika szerinti bontásban
RészletesebbenStatisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1
Statisztika - bevezetés 00.04.05. Méréselmélet PE MIK MI_BSc VI_BSc Bevezetés Véletlen jelenség fogalma jelenséget okok bizonyos rendszere hozza létre ha mindegyik figyelembe vehető egyértelmű leírás általában
RészletesebbenSTATISZTIKA. Gyakorló feladatok az első zh-ra
STATISZTIKA Gyakorló feladatok az első zh-ra A változás átlagos üteme év Kenyér Ft/ kg bázisindex % 2002 151 100,0 2003 156 103,3 2004 178 117,9 2005 173 114,6 2006 179 118,5 2007 215 142,4 I = n 1 l i
RészletesebbenStatisztikai következtetések Nemlineáris regresszió Feladatok Vége
[GVMGS11MNC] Gazdaságstatisztika 10. előadás: 9. Regressziószámítás II. Kóczy Á. László koczy.laszlo@kgk.uni-obuda.hu Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet A standard lineáris modell
Részletesebben5. Előadás. Grafikus ábrázolás Koncentráció elemzése
5. Előadás Grafikus ábrázolás Koncentráció elemzése Grafikus ábrázolás fontossága Grafikus ábrázolás során elkövethető hibák: Mondanivaló szempontjából nem megfelelő ábratípus kiválasztása Tárgynak megfelelő
RészletesebbenSTATISZTIKA I. 3. rész. T.Nagy Judit
STATSZTKA. 3. rész T.Nagy Judit tnagy.judit@hjf.hu Standardizálás és standardizáláson alauló indexszámítás nhomogén (heterogén) sokaságokra vonatkozó átlagok; intenzitási viszonyszámok (átlagbérek, átlagos
Részletesebben1. Egy Kft dolgozóit a havi bruttó kereseteik alapján csoportosítottuk: Havi bruttó bér, ezer Ft/fő
Figyelem! A példasor nem tartalmazza valamennyi típuspéldát. A dolgozatban az órán leadott feladatok közül bármely típusú előfordulhat. A példasor már a második dolgozat anyagát gyakorló feladatokat is
RészletesebbenStatisztika összefoglalás
Statisztika összefoglalás 1 / 18. oldal 1. Alapfogalmak Statisztika: a tömegesen előforduló jelenségek vizsgálatával foglalkozik, ezekre vonatkozóan adatokat gyűjt, feldolgoz, elemez és közzé tesz. o a
RészletesebbenTANTÁRGYI ÚTMUTATÓ. Statisztika 1.
I. évfolyam BA TANTÁRGYI ÚTMUTATÓ Statisztika 1. TÁVOKTATÁS Tanév 2014/2015 II. félév A KURZUS ALAPADATAI Tárgy megnevezése: Statisztika 1. Tanszék: Módszertani Tantárgyfelelős neve: Sándorné Dr. Kriszt
RészletesebbenELTE TáTK Közgazdaságtudományi Tanszék GAZDASÁGSTATISZTIKA. Készítette: Bíró Anikó. Szakmai felelős: Bíró Anikó június
GAZDASÁGSTATISZTIKA GAZDASÁGSTATISZTIKA Készült a TÁMOP-4.1.2-08/2/A/KMR-2009-0041pályázati projekt keretében Tartalomfejlesztés az ELTE TátK Közgazdaságtudományi Tanszékén az ELTE Közgazdaságtudományi
RészletesebbenVéletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus.
Valószín ségelméleti és matematikai statisztikai alapfogalmak összefoglalása (Kemény Sándor - Deák András: Mérések tervezése és eredményeik értékelése, kivonat) Véletlen jelenség: okok rendszere hozza
RészletesebbenStatisztika 1. Tantárgyi útmutató
Módszertani Intézeti Tanszék Nappali tagozat Statisztika 1. Tantárgyi útmutató 2015/16 tanév II. félév 1/6 Tantárgy megnevezése: Statisztika 1. Tantárgy kódja: STAT1KAMEMM Tanterv szerinti óraszám: 2+2
RészletesebbenA valószínűségszámítás elemei
A valószínűségszámítás elemei Kísérletsorozatban az esemény relatív gyakorisága: k/n, ahol k az esemény bekövetkezésének abszolút gyakorisága, n a kísérletek száma. Pl. Jelenség: kockadobás Megfigyelés:
RészletesebbenIdősorok elemzése [leíró statisztikai eszközök] I
Leíró és matematikai statisztika Matematika alapszak, matematikai elemző szakirány Zempléni András Valószínűségelméleti és Statisztika Tanszék Matematikai Intézet Természettudományi Kar Eötvös Loránd Tudományegyetem
RészletesebbenMintavétel fogalmai STATISZTIKA, BIOMETRIA. Mintavételi hiba. Statisztikai adatgyűjtés. Nem véletlenen alapuló kiválasztás
STATISZTIKA, BIOMETRIA. Előadás Mintavétel, mintavételi technikák, adatbázis Mintavétel fogalmai A mintavételt meg kell tervezni A sokaság elemei: X, X X N, lehet véges és végtelen Mintaelemek: x, x x
RészletesebbenGAZDASÁGI STATISZTIKA
GAZDASÁGI STATISZTIKA Dr. Kun István GÁBOR DÉNES FŐISKOLA Tantárgy: Gazdasági statisztika Kódszám: 224 Lapszám: 1 TÉMAKÖRÖK A STATISZTIKA ALAPFOGALMAI STATISZTIKAI SOROK STATISZTIKAI TÁBLÁK ÖSSZETETT VISZONYSZÁMOK
Részletesebben[GVMGS11MNC] Gazdaságstatisztika
[GVMGS11MNC] Gazdaságstatisztika 5. előadás Érték-, ár-, és volumenindexek http://uni-obuda.hu/users/koczyl/gazdasagstatisztika.htm Kóczy Á. László KGK-VMI Az indexszám fogalma Gazdasági elemzésben fontos
RészletesebbenSTATISZTIKA I. Centrális mutatók. Helyzeti középértékek. Középértékek. Bimodális eloszlás, U. Módusz, Mo. 4. Előadás.
Centrális mutatók STATISZTIKA I. 4. Előadás Centrális mutatók 1/51 2/51 Középértékek Helyzeti középértékek A meghatározása gyakoriság vagy sorszám alapján Számítás nélkül Az elemek nagyság szerint rendezett
RészletesebbenFeladatok: pontdiagram és dobozdiagram. Hogyan csináltuk?
Feladatok: pontdiagram és dobozdiagram Hogyan csináltuk? Alakmutatók: ferdeség, csúcsosság Alakmutatók a ferdeség és csúcsosság mérésére Ez eloszlás centrumát (középérték) és az adatok centrum körüli terpeszkedését
RészletesebbenGVMST22GNC Statisztika II.
GVMST22GNC Statisztika II. 4. előadás: 9. Kétváltozós korreláció- és regressziószámítás Kóczy Á. László koczy.laszlo@kgk.uni-obuda.hu Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet Korrelációszámítás
RészletesebbenStatisztika I. 12. előadás. Előadó: Dr. Ertsey Imre
Statisztika I. 1. előadás Előadó: Dr. Ertsey Imre Regresszió analízis A korrelációs együttható megmutatja a kapcsolat irányát és szorosságát. A kapcsolat vizsgálata során a gyakorlatban ennél messzebb
RészletesebbenSegítség az outputok értelmezéséhez
Tanulni: 10.1-10.3, 10.5, 11.10. Hf: A honlapra feltett falco_exp.zip-ben lévő exploratív elemzések áttanulmányozása, érdekességek, észrevételek kigyűjtése. Segítség az outputok értelmezéséhez Leiro: Leíró
RészletesebbenMatematikai statisztikai elemzések 2.
Nyugat-magyarországi Egyetem Geoinformatikai Kara Prof. Dr. Závoti József Matematikai statisztikai elemzések 2. MSTE2 modul Helyzetmutatók, átlagok, kvantilisek. A szórás és szóródás egyéb mérőszámai.
RészletesebbenKorreláció és lineáris regresszió
Korreláció és lineáris regresszió Két folytonos változó közötti összefüggés vizsgálata Szűcs Mónika SZTE ÁOK-TTIK Orvosi Fizikai és Orvosi Informatikai Intézet Orvosi Fizika és Statisztika I. előadás 2016.11.02.
RészletesebbenA sokaság elemei közül a leggyakrabban előforduló érték. diszkrét folytonos
Középérték Középérték A középérték a statisztikai adatok tömör számszerű jellemzése. helyzeti középérték: módusz medián számított középérték: számtani átlag kronológikus átlag harmonikus átlag mértani
RészletesebbenMatematikai statisztikai elemzések 5.
Nyugat-magyarországi Egyetem Geoinformatikai Kara Prof. Dr. Závoti József Matematikai statisztikai elemzések. MSTE modul Kapcsolatvizsgálat: asszociáció vegyes kapcsolat korrelációszámítás. Varianciaanalízis
RészletesebbenA leíró statisztikák
A leíró statisztikák A leíró statisztikák fogalma, haszna Gyakori igény az, hogy egy adathalmazt elemei egyenkénti felsorolása helyett néhány jellemző tulajdonságának megadásával jellemezzünk. Ezeket az
RészletesebbenFEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI
FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 4 IV. MINTA, ALAPsTATIsZTIKÁK 1. MATEMATIKAI statisztika A matematikai statisztika alapfeladatát nagy általánosságban a következőképpen
RészletesebbenLeíró és matematikai statisztika el adásnapló Matematika alapszak, matematikai elemz szakirány 2016/2017. tavaszi félév
Leíró és matematikai statisztika el adásnapló Matematika alapszak, matematikai elemz szakirány 2016/2017. tavaszi félév A pirossal írt anyagrészeket nem fogom közvetlenül számon kérni a vizsgán, azok háttérismeretként,
RészletesebbenSTATISZTIKA I. Változékonyság (szóródás) A szóródás mutatószámai. Terjedelem. Forgalom terjedelem. Excel függvények. Függvénykategória: Statisztikai
Változékonyság (szóródás) STATISZTIKA I. 5. Előadás Szóródási mutatók A középértékek a sokaság elemeinek értéknagyságbeli különbségeit eltakarhatják. A változékonyság az azonos tulajdonságú, de eltérő
Részletesebben2013 ŐSZ. 1. Mutassa be az egymintás z-próba célját, alkalmazásának feltételeit és módszerét!
GAZDASÁGSTATISZTIKA KIDOLGOZOTT ELMÉLETI KÉRDÉSEK A 3. ZH-HOZ 2013 ŐSZ Elméleti kérdések összegzése 1. Mutassa be az egymintás z-próba célját, alkalmazásának feltételeit és módszerét! 2. Mutassa be az
RészletesebbenStatisztika. Dr Gősi Zsuzsanna. Egyetemi adjunktus. Sportmenedzsment Tanszék
Statisztika Dr Gősi Zsuzsanna Egyetemi adjunktus Sportmenedzsment Tanszék Kötelező irodalom - Számonkérés Pintér József Ács Pongrác Bevezetés a sportstatisztikába Dialóg Campus Kiadó 2007 Honlap: www.dialog-kiado.hu
RészletesebbenStatisztika I. 7. előadás. Előadó: Dr. Ertsey Imre
Statisztika I. 7. előadás Előadó: Dr. Ertsey Imre STATISZTIKAI INDEXEK STATISZTIKAI INDEXEK Index: latin eredetű szó, egyszerűen mutatót jelent A statisztikai indexszám: - komplexebb tartalmú, - többet
RészletesebbenA mérés problémája a pedagógiában. Dr. Nyéki Lajos 2015
A mérés problémája a pedagógiában Dr. Nyéki Lajos 2015 A mérés fogalma Mérésen olyan tevékenységet értünk, amelynek eredményeként a vizsgált jelenség számszerűen jellemezhetővé, más hasonló jelenségekkel
RészletesebbenBiomatematika 2 Orvosi biometria
Biomatematika 2 Orvosi biometria 2017.02.05. Orvosi biometria (orvosi biostatisztika) Statisztika: tömegjelenségeket számadatokkal leíró tudomány. A statisztika elkészítésének menete: tanulmányok (kísérletek)
RészletesebbenMatematikai alapok és valószínőségszámítás. Középértékek és szóródási mutatók
Matematikai alapok és valószínőségszámítás Középértékek és szóródási mutatók Középértékek A leíró statisztikák talán leggyakrabban használt csoportját a középértékek jelentik. Legkönnyebben mint az adathalmaz
RészletesebbenBiomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János
Szent István Egyetem Állatorvos-tudományi Kar Biomatematikai és Számítástechnikai Tanszék Biomatematika 12. Regresszió- és korrelációanaĺızis Fodor János Copyright c Fodor.Janos@aotk.szie.hu Last Revision
RészletesebbenStatisztika elméleti összefoglaló
1 Statisztika elméleti összefoglaló Tel.: 0/453-91-78 1. Tartalomjegyzék 1. Tartalomjegyzék.... Becsléselmélet... 3 3. Intervallumbecslések... 5 4. Hipotézisvizsgálat... 8 5. Regresszió-számítás... 11
RészletesebbenGRADUÁLIS BIOSTATISZTIKAI KURZUS február hó 22. Dr. Dinya Elek egyetemi docens
GRADUÁLIS BIOSTATISZTIKAI KURZUS 2012. február hó 22. Dr. Dinya Elek egyetemi docens Biometria fogalma The active pursuit of biological knowledge by quantitative methods Sir R. A. Fisher, 1948 BIOMETRIA
RészletesebbenÁruforgalom tervezése. 1. óra A gazdasági statisztika alapjai Alapfogalmak, viszonyszámok
Áruforgalom tervezése 1. óra A gazdasági statisztika alapjai Alapfogalmak, viszonyszámok Alapvető gazdasági számítások 1. Egy vállalkozás tevékenysége nagyon összetett. Szükség van arra, hogy ismerjük
RészletesebbenStatisztika I. 8. előadás. Előadó: Dr. Ertsey Imre
Statisztika I. 8. előadás Előadó: Dr. Ertsey Imre Minták alapján történő értékelések A statisztika foglalkozik. a tömegjelenségek vizsgálatával Bizonyos esetekben lehetetlen illetve célszerűtlen a teljes
RészletesebbenNem Fő (f) % (g) -160 100 161-180 150 181-200 50 Z 300. Férfi 180 60% Nő 120 40% Z 300 100%
IX. 08. előadás Statisztikai sokaság: amire a megfigyelés irányul. Statisztikai ismérv: vizsgálati szempont, tulajdonság. Van közös (körülhatárolja a sokaságot) és megkülönböztető: területi {pl: születési
RészletesebbenSTATISZTIKA. András hármas. Éva ötös. Nóri négyes. 5 4,5 4 3,5 3 2,5 2 1,5 ANNA BÉLA CILI 0,5 MAGY. MAT. TÖRT. KÉM.
STATISZTIKA 5 4,5 4 3,5 3 2,5 2 1,5 1 0,5 0 MAGY. MAT. TÖRT. KÉM. ANNA BÉLA CILI András hármas. Béla Az átlag 3,5! kettes. Éva ötös. Nóri négyes. 1 mérés: dolgokhoz valamely szabály alapján szám rendelése
Részletesebben[Biomatematika 2] Orvosi biometria
[Biomatematika 2] Orvosi biometria 2016.02.29. A statisztika típusai Leíró jellegű statisztika: összegzi egy adathalmaz jellemzőit. A középértéket jelemzi (medián, módus, átlag) Az adatok változékonyságát
RészletesebbenBIOMATEMATIKA ELŐADÁS
BIOMATEMATIKA ELŐADÁS 9. Együttes eloszlás, kovarianca, nevezetes eloszlások Debreceni Egyetem, 2015 Dr. Bérczes Attila, Bertók Csanád A diasor tartalma 1 Bevezetés, definíciók Együttes eloszlás Függetlenség
RészletesebbenKutatásmódszertan és prezentációkészítés
Kutatásmódszertan és prezentációkészítés 10. rész: Az adatelemzés alapjai Szerző: Kmetty Zoltán Lektor: Fokasz Nikosz Tizedik rész Az adatelemzés alapjai Tartalomjegyzék Bevezetés Leíró statisztikák I
Részletesebben[Biomatematika 2] Orvosi biometria
[Biomatematika 2] Orvosi biometria Bódis Emőke 2016. 04. 25. J J 9 Korrelációanalízis Regresszióanalízis: hogyan változik egy vizsgált változó értéke egy másik változó változásának függvényében. Korrelációs
RészletesebbenDr. Nagy Zita Barbara igazgatóhelyettes KÖVET Egyesület a Fenntartható Gazdaságért november 15.
Dr. Nagy Zita Barbara igazgatóhelyettes KÖVET Egyesület a Fenntartható Gazdaságért 2018. november 15. PÉNZ a boldogság bitorlója? A jövedelemegyenlőtlenség természetes határa A boldog ember gondolata a
RészletesebbenMi az adat? Az adat elemi ismeret. Az adatokból információkat
Mi az adat? Az adat elemi ismeret. Tények, fogalmak olyan megjelenési formája, amely alkalmas emberi eszközökkel történő értelmezésre, feldolgozásra, továbbításra. Az adatokból gondolkodás vagy gépi feldolgozás
RészletesebbenA sokaság/minta eloszlásának jellemzése
3. előadás A sokaság/mnta eloszlásának jellemzése tpkus értékek meghatározása; az adatok különbözőségének vzsgálata, a sokaság/mnta eloszlásgörbéjének elemzése. Eloszlásjellemzők Középértékek helyzet (Me,
RészletesebbenBevezető Mi a statisztika? Mérés Feldolgozás Adatok rendezése Adatok jellemzése Időbeli elemzés Feladatok. Statisztika I.
Statisztika I. 1. előadás: A statisztika alapfogalmai Kóczy Á. László koczy.laszlo@kgk.uni-obuda.hu Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet Óbudai Egyetem A kurzusról A kurzus célja
RészletesebbenBiometria az orvosi gyakorlatban. Korrelációszámítás, regresszió
SZDT-08 p. 1/31 Biometria az orvosi gyakorlatban Korrelációszámítás, regresszió Werner Ágnes Villamosmérnöki és Információs Rendszerek Tanszék e-mail: werner.agnes@virt.uni-pannon.hu Korrelációszámítás
RészletesebbenRegressziós vizsgálatok
Regressziós vizsgálatok Regresszió (regression) Általános jelentése: visszaesés, hanyatlás, visszafelé mozgás, visszavezetés. Orvosi területen: visszafejlődés, involúció. A betegség tünetei, vagy maga
RészletesebbenStatisztika I. 4. előadás Mintavétel. Kóczy Á. László KGK-VMI. Minta Mintavétel Feladatok. http://uni-obuda.hu/users/koczyl/statisztika1.
Statisztika I. 4. előadás Mintavétel http://uni-obuda.hu/users/koczyl/statisztika1.htm Kóczy Á. László KGK-VMI koczy.laszlo@kgk.uni-obuda.hu Sokaság és minta Alap- és mintasokaság A mintasokaság az a részsokaság,
Részletesebben[Biomatematika 2] Orvosi biometria
[Biomatematika 2] Orvosi biometria 2016.02.08. Orvosi biometria (orvosi biostatisztika) Statisztika: tömegjelenségeket számadatokkal leíró tudomány. A statisztika elkészítésének menete: tanulmányok (kísérletek)
RészletesebbenA Statisztika alapjai
A Statisztika alapjai BME A3c Magyar Róbert 2016.05.12. Mi az a Statisztika? A statisztika a valóság számszerű információinak megfigyelésére, összegzésére, elemzésére és modellezésére irányuló gyakorlati
RészletesebbenStatisztika I. 4. előadás Mintavétel. Kóczy Á. László KGK-VMI. Minta Mintavétel Feladatok. http://uni-obuda.hu/users/koczyl/statisztika1.
Statisztika I. 4. előadás Mintavétel http://uni-obuda.hu/users/koczyl/statisztika1.htm Kóczy Á. László KGK-VMI koczy.laszlo@kgk.uni-obuda.hu Sokaság és minta Alap- és mintasokaság A mintasokaság az a részsokaság,
RészletesebbenMatematikai statisztika
Matematikai statisztika PROGRAMTERVEZŐ INFORMATIKUS alapszak, A szakiráy Arató Miklós Valószíűségelméleti és Statisztika Taszék Természettudomáyi Kar 2019. február 18. Arató Miklós (ELTE) Matematikai statisztika
RészletesebbenNappali tagozat. Statisztika és Valószínűségszámítási alapok Tantárgyi útmutató
Módszetani Intézet Alkalmazott Kvantitatív Módszertan Tanszék Nappali tagozat Statisztika és Valószínűségszámítási alapok Tantárgyi útmutató 2018/19. tanév I. félév 1 Tantárgy megnevezése: Statisztika
RészletesebbenMatematikai statisztikai elemzések 5.
Matematikai statisztikai elemzések 5. Kapcsolatvizsgálat: asszociáció, vegyes kapcsolat, korrelációszámítás. Varianciaanalízis Prof. Dr. Závoti, József Matematikai statisztikai elemzések 5.: Kapcsolatvizsgálat:
Részletesebben(Independence, dependence, random variables)
Két valószínűségi változó együttes vizsgálata Feltételes eloszlások Két diszkrét változó együttes eloszlása a lehetséges értékpárok és a hozzájuk tartozó valószínűségek (táblázat) Példa: Egy urna 3 fehér,
RészletesebbenIII. Kvantitatív változók kapcsolata (korreláció, regresszió)
III. Kvantitatív változók kapcsolata (korreláció, regresszió) Tartalom Változók kapcsolata Kétdimenziós minta (pontdiagram) Regressziós előrejelzés (predikció) Korreláció Tanuló Kétdimenziós minta Tanulással
RészletesebbenElemi statisztika fizikusoknak
1. oldal Elemi statisztika fizikusoknak Pollner Péter Biológiai Fizika Tanszék pollner@elte.hu Az adatok leírása, megismerése és összehasonlítása 2-1 Áttekintés 2-2 Gyakoriság eloszlások 2-3 Az adatok
RészletesebbenMatematikai statisztikai elemzések 2.
Matematikai statisztikai elemzések 2. Helyzetmutatók, átlagok, kvantilisek. A szórás és szóródás Prof. Dr. Závoti, József Matematikai statisztikai elemzések 2.: Helyzetmutatók, átlagok, Prof. Dr. Závoti,
RészletesebbenQ1 = 1575 eft Me = 2027,7778 eft Q3 = 2526,3158 eft
Gyak1: b) Mo = 1857,143 eft A kocsma tipikus (leggyakoribb) havi bevétele 1.857.143 Ft. c) Q1 = 1575 eft Me = 2027,7778 eft Q3 = 2526,3158 eft Gyak2: b) X átlag = 35 Mo = 33,33 σ = 11,2909 A = 0,16 Az
RészletesebbenValószínűségszámítás összefoglaló
Statisztikai módszerek BMEGEVGAT Készítette: Halász Gábor Budapesti Műszaki és Gazdaságtudományi Egyetem Gépészmérnöki Kar Hidrodinamikai Rendszerek Tanszék, Budapest, Műegyetem rkp. 3. D ép. 334. Tel:
RészletesebbenFEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI
FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 3 III. VÉLETLEN VEKTOROK 1. A KÉTDIMENZIÓs VÉLETLEN VEKTOR Definíció: Az leképezést (kétdimenziós) véletlen vektornak nevezzük, ha Definíció:
RészletesebbenStatisztika példatár
Statisztika példatár v0.02 A példatár folyamatosan b vül, keresd a frissebb verziót a http://matstat.fw.hu honlapon a letölthet példatárak közt. Országh Tamás Budapest, 2006 Mottó: Ki kéne vágni minden
Részletesebben7, 6, 0, 4, 0, 1, 5, 2, 2, 16, 1, 0, 2, 3, 9, 2, 4, 10, 3, 1, 2, 12, 4, 1
52. feladat Stat Jenő egyetemi hallgató autóbusszal jár az egyetemre. Néhány napon át megmérte, hogy mennyit kell várnia az első egyetem felé közlekedő autóbuszra. A következő időket tapasztalta (percben):
RészletesebbenMatematikai statisztika c. tárgy oktatásának célja és tematikája
Matematikai statisztika c. tárgy oktatásának célja és tematikája 2015 Tematika Matematikai statisztika 1. Időkeret: 12 héten keresztül heti 3x50 perc (előadás és szeminárium) 2. Szükséges előismeretek:
RészletesebbenStatisztikai alapfogalmak. Statisztika I. GZM, EE, TV szakok (LEVELEZŐ tagozat) Témakörök. Statisztikai alapfogalmak. Kötelező és ajánlott irodalmak
Témakörök Statisztika I. GZM, EE, TV szakok (LEVELEZŐ tagozat) 2011-2012-es tanév I. félév Oktató: Dr. Csáfor Hajnalka tanszékvezető főiskolai docens Regionális és Környezetgazdaságtan Tsz. E-mail: hcsafor@ektf.hu
RészletesebbenMatematikai geodéziai számítások 6.
Nyugat-magyarországi Egyetem Geoinformatikai Kara Dr. Bácsatyai László Matematikai geodéziai számítások 6. MGS6 modul Lineáris regresszió számítás elektronikus távmérőkre SZÉKESFEHÉRVÁR 2010 Jelen szellemi
RészletesebbenStatisztikai alapfogalmak (2011. szeptember ) Statisztika I. GZM, EE, TV szakok (nappali tagozat) Témakörök. Statisztikai alapfogalmak
Témakörök Statisztika I. GZM, EE, TV szakok (nappali tagozat) 2011-2012-es tanév I. félév Oktató: Dr. Csáfor Hajnalka tanszékvezető főiskolai docens Regionális és Környezetgazdaságtan Tsz. E-mail: hcsafor@ektf.hu
RészletesebbenMatematikai geodéziai számítások 6.
Matematikai geodéziai számítások 6. Lineáris regresszió számítás elektronikus távmérőkre Dr. Bácsatyai, László Matematikai geodéziai számítások 6.: Lineáris regresszió számítás elektronikus távmérőkre
RészletesebbenAdatok statisztikai értékelésének főbb lehetőségei
Adatok statisztikai értékelésének főbb lehetőségei 1. a. Egy- vagy kétváltozós eset b. Többváltozós eset 2. a. Becslési problémák, hipotézis vizsgálat b. Mintázatelemzés 3. Szint: a. Egyedi b. Populáció
RészletesebbenHipotézis, sejtés STATISZTIKA. Kétmintás hipotézisek. Tudományos hipotézis. Munkahipotézis (H a ) Nullhipotézis (H 0 ) 11. Előadás
STATISZTIKA Hipotézis, sejtés 11. Előadás Hipotézisvizsgálatok, nem paraméteres próbák Tudományos hipotézis Nullhipotézis felállítása (H 0 ): Kétmintás hipotézisek Munkahipotézis (H a ) Nullhipotézis (H
RészletesebbenMINDEN FELADATOT A FELADATOT TARTALMAZÓ LAPON OLD- JONMEG!
NÉV: ERA kód: évf.: gyak. vez.: MINDEN FELADATOT A FELADATOT TARTALMAZÓ LAPON OLD- JONMEG! Al. (a) Definiálja a mo ment um és a centrális momentum fogalmát (általában) (4 pont)! Egy megyében egy vizsgált
RészletesebbenMicrosoft Excel 2010. Gyakoriság
Microsoft Excel 2010 Gyakoriság Osztályközös gyakorisági tábla Nagy számú mérési adatokat csoportokba (osztályokba) rendezése -> könnyebb áttekintés Osztályokban szereplő adatok száma: osztályokhoz tartozó
Részletesebben