Statisztika 2. Dr Gősi Zsuzsanna Egyetemi adjunktus

Hasonló dokumentumok
Bevezető Adatok rendezése Adatok jellemzése Időbeli elemzés

Bevezető Adatok rendezése Adatok jellemzése Időbeli elemzés. Gazdaságstatisztika KGK VMI

A sokaság elemei közül a leggyakrabban előforduló érték. diszkrét folytonos

Matematikai statisztikai elemzések 2.

A sokaság/minta eloszlásának jellemzése

Matematikai alapok és valószínőségszámítás. Középértékek és szóródási mutatók

STATISZTIKA I. Centrális mutatók. Helyzeti középértékek. Középértékek. Bimodális eloszlás, U. Módusz, Mo. 4. Előadás.

Matematikai statisztika

STATISZTIKA I. Változékonyság (szóródás) A szóródás mutatószámai. Terjedelem. Forgalom terjedelem. Excel függvények. Függvénykategória: Statisztikai

Statisztikai alapfogalmak

A valószínűségszámítás elemei

Statisztika. Politológus képzés. Daróczi Gergely április 17. Politológia Tanszék

Bevezető Mi a statisztika? Mérés Feldolgozás Adatok rendezése Adatok jellemzése Időbeli elemzés Feladatok. Statisztika I.

STATISZTIKA. Gyakorló feladatok az első zh-ra

Elemi statisztika fizikusoknak

Matematikai statisztikai elemzések 2.

1. Egy Kft dolgozóit a havi bruttó kereseteik alapján csoportosítottuk: Havi bruttó bér, ezer Ft/fő

Bevezető Mi a statisztika? Mérés Csoportosítás

Gazdaságtudományi Kar. Gazdaságelméleti és Módszertani Intézet. Bevezetés. 1. előadás. Statisztikai szoftver alkalmazás.

GRADUÁLIS BIOSTATISZTIKAI KURZUS február hó 22. Dr. Dinya Elek egyetemi docens

STATISZTIKA KÉSZÍTETTE: TAKÁCS SÁNDOR

Biomatematika 2 Orvosi biometria

1. óra: Területi statisztikai alapok viszonyszámok, középértékek

[GVMGS11MNC] Gazdaságstatisztika

Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus.

A(a; b) = 2. A(a; b) = a+b. Példák A(37; 49) = x 2x = x = : 2 x = x = x

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1

Kutatásmódszertan és prezentációkészítés

STATISZTIKA. András hármas. Éva ötös. Nóri négyes. 5 4,5 4 3,5 3 2,5 2 1,5 ANNA BÉLA CILI 0,5 MAGY. MAT. TÖRT. KÉM.

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

ELTE TáTK Közgazdaságtudományi Tanszék GAZDASÁGSTATISZTIKA. Készítette: Bíró Anikó. Szakmai felelős: Bíró Anikó június

[Biomatematika 2] Orvosi biometria

A leíró statisztikák

Matematika III. 8. A szórás és a szóródás egyéb mérőszámai Prof. Dr. Závoti, József

Statisztika. Eloszlásjellemzők

A Statisztika alapjai

Bevezető Mi a statisztika? Mérés Feldolgozás Adatok rendezése Adatok jellemzése Időbeli elemzés Feladatok. Statisztika I.

Statisztika I. 11. előadás. Előadó: Dr. Ertsey Imre

Mintavétel fogalmai STATISZTIKA, BIOMETRIA. Mintavételi hiba. Statisztikai adatgyűjtés. Nem véletlenen alapuló kiválasztás

KÖZPONTI STATISZTIKAI HIVATAL. Szóbeli vizsgatevékenység

Adatsorok jellegadó értékei

Statisztika I. 8. előadás. Előadó: Dr. Ertsey Imre

MINTAFELADATOK. 1. Az alábbi diagram egy kiskereskedelmi lánc boltjainak forgalomkoncentrációját szemlélteti:

Nyugat-magyarországi Egyetem Geoinformatikai Kara. Prof. Dr. Závoti József. Matematika III. 7. MA3-7 modul. Helyzetmutatók, átlagok, kvantilisek

Q1 = 1575 eft Me = 2027,7778 eft Q3 = 2526,3158 eft

STATISZTIKA. A Föld pályája a Nap körül. Philosophiae Naturalis Principia Mathematica (A természetfilozófia matematikai alapelvei, 1687)

A mérés problémája a pedagógiában. Dr. Nyéki Lajos 2015

Statisztika I. 6. előadás. Előadó: Dr. Ertsey Imre

Változók eloszlása, középértékek, szóródás

Sta t ti t s i zt z i t k i a 1. előadás

Statisztika gyakorlat

Statisztika összefoglalás

Modern műszeres analitika szeminárium Néhány egyszerű statisztikai teszt

Méréselmélet példatár

5. Előadás. Grafikus ábrázolás Koncentráció elemzése

Vizsgáljuk elôször, hogy egy embernek mekkora esélye van, hogy a saját

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Segítség az outputok értelmezéséhez

[Biomatematika 2] Orvosi biometria

2. előadás. Viszonyszámok típusai

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Matematikai statisztika. Mi a modell? Binomiális eloszlás sűrűségfüggvény. Binomiális eloszlás

Dr. Nagy Zita Barbara igazgatóhelyettes KÖVET Egyesület a Fenntartható Gazdaságért november 15.

Brósch Zoltán (Debreceni Egyetem Kossuth Lajos Gyakorló Gimnáziuma) Megoldások


Korrelációs kapcsolatok elemzése

VALÓSZÍNŰSÉG, STATISZTIKA TANÍTÁSA

y ij = µ + α i + e ij STATISZTIKA Sir Ronald Aylmer Fisher Példa Elmélet A variancia-analízis alkalmazásának feltételei Lineáris modell

Valószínűségszámítás összefoglaló

MÉRÉSI EREDMÉNYEK PONTOSSÁGA, A HIBASZÁMÍTÁS ELEMEI

STATISZTIKA I. A változók mérési szintjei. Nominális változók. Alacsony és magas mérési szint. Nominális változó ábrázolása

Példa: Egy üzletlánc boltjainak forgalmára vonatkozó adatok október hó: (adott a vastagon szedett!) S i g i z i g i z i

Tantárgyi útmutató. 1. A tantárgy helye a szaki hálóban. 2. A tantárgyi program általános célja. Statisztika 1.

352 Nevezetes egyenlôtlenségek. , az átfogó hossza 81 cm

Az értékelés a következők szerint történik: 0-4 elégtelen 5-6 elégséges 7 közepes 8 jó 9-10 jeles. A szóbeli vizsga várható időpontja

GAZDASÁGI STATISZTIKA

7, 6, 0, 4, 0, 1, 5, 2, 2, 16, 1, 0, 2, 3, 9, 2, 4, 10, 3, 1, 2, 12, 4, 1

A statisztika alapfogalmai Kovács, Előd, Pannon Egyetem

Módszertani Intézeti Tanszéki Osztály

y ij = µ + α i + e ij

Foglalkozási napló. Vasútforgalmi szolgálattevő

BIOSTATISZTIKA ÉS INFORMATIKA. Leíró statisztika

Magyarország 1,2360 1,4622 1,6713 1,8384 2,0186 2,2043

A területi koncentráció interpretálása: kitüntetett helyzetek

9.3. Külkereskedelmi statisztika Pénzügystatisztika, az államháztartás információs rendszere Agrárstatisztikai információs

6. Előadás. Vereb György, DE OEC BSI, október 12.

Statisztikai következtetések Nemlineáris regresszió Feladatok Vége

[Biomatematika 2] Orvosi biometria

Számelmélet Megoldások

Valószínűségi változók. Várható érték és szórás

Statisztika példatár

Biomatematika 2 Orvosi biometria

STATISZTIKAI ALAPOK. Statisztikai alapok_eloszlások_becslések 1

Statisztika I. 4. előadás. Előadó: Dr. Ertsey Imre

Mérési hibák

Függetlenségvizsgálat, Illeszkedésvizsgálat

Statisztikai becslés

SZÁMÍTÓGÉPES ADATFELDOLGOZÁS

Geokémia gyakorlat. 1. Geokémiai adatok értelmezése: egyszerű statisztikai módszerek. Geológus szakirány (BSc) Dr. Lukács Réka

18. modul: STATISZTIKA

Idősorok elemzése [leíró statisztikai eszközök] I

Átírás:

Statisztika 2. Dr Gősi Zsuzsanna Egyetemi adjunktus

Gyakorisági sorok Mennyiségi ismérv jellemző rangsor készítünk. (pl. napi jegyeladások száma) A gyakorisági sor képzése igazából tömörítést jelent Nagyszámú ismérvértékek esetén érdemes osztályközöket kialakítani (képlete: k=1+(3,3lgn) Használhatunk un. kumulált gyakorisági sorokat is 2009. 10. 14. 2

Gyakorisági sorok Gyakorisági sor: bérek 50 000 Ft-os osztályközökkel (Bruttó bér 50000-ig, 50000-100000, 100000-150000), vagy munkanélküliek száma életkor szerint 5 évenkénti bontásban Általános alapelv, hogy az osztályközök legyenek azonos hosszúságúak 2009. 10. 14. 3

Középértékek Számított középértékek (átlagok) Számtani átlag Harmonikus átlag Mértani átlag Négyzetes átlag Helyzeti középértékek Módusz Medián 2009. 10. 14. 4

Középértékek Az azonos fajta adatok tömegének számszerű jellemzője. Követelmények vele szemben Közepes helyet foglal el Számszerű értékek halmazának legyenek tipikus értékei Jól kezelhető matematikai formulával meghatározható legyen Jól értelmezhető legyen Ne legyen érzékeny a kiugró értékekre 2009. 10. 14. 5

Módusz Az ismérvértékek tipikus, leginkább jellemző értékét jelöli. /Diszkrét értékekkel rendelkező mennyiségi ismérv módusza a sokaságban leggyakrabban előforduló ismérvérték./ Magyarországon a lakott lakások száma 3688 ezer volt, ebből egy szobás 588 ezer, két szobás 1607 ezer, háromszobás 1493 ezer. Mi a módusz értéke? 2009. 10. 14. 6

Módusz Osztályközös gyakorisági sor esetében a módusz közelítő meghatározása az un. modális osztályköz. M o x mo, a k 1 k 1 k 2 xh X mo,a modális osztályköz alsó határa k 1 a modális osztályköz és a megelőző osztályköz gyakoriságának különbsége k 2 a modális osztályköz és az azt követő osztályköz gyakoriságának különbsége h a modális osztályköz hossza 2009. 10. 14. 7

A versenyzők életkorának Életkor (év) megoszlása Versenyzők száma (fő) Kummulált gyakoriság -20 6 6 21-25 7 13 26-30 18 31 31-35 11 42 35-8 50 Összesen 50 2009. 10. 14. 8

Medián A medián szó a legszorosabb értelemben közepes érték, a mennyiségi ismérvnek azon értéke, amelynél ugyanannyi kisebb, mint amennyi nagyobb érték fordul elő. 2009. 10. 14. 9

Medián meghatározása A számértékeket rangsorba kell rendezni Páratlan egyed szám esetén (n+1)/2 lesz a medián Páros esetén az n/2 és n/2+1 egyszerű számtani átlaga 2009. 10. 14. 10

Határozd meg a mediánt Felsőoktatásban eltöltött idő 1 év 8 fő 2év 4 fő 3 év- 1 fő 4 év- 2 fő 5 év 3 fő 2009. 10. 14. 11

Medián értéke a gyakorisági sorban Me x me, a s f f ' me1 me xh X me,a a mediánt magába foglaló osztályköz alsó határa S n/2 a medián sorszáma f me-1 a mediánt megelőző osztályköz kumulált gyakorisága f me a mediánt tartalmazó osztályköz gyakorisága h a mediánt tartalmazó osztályköz hoszza 2009. 10. 14. 12

Számtani átlag A számtani átlag az a szám, amelyet az átlagolandó értékek helyébe téve azok összege azonos marad. _ x n i 1 n x i 2009. 10. 14. 13

Súlyozott számtani átlag /figyelembe vesszük az elemek gyakoriságát/ _ x n i 1 f n i x i 2009. 10. 14. 14

Munkatábla (egy hónapban eladott jegyek száma db) Naponta eladott jegyek száma (db) Napok száma -30 2 31-40 5 41-50 7 51-60 8 61-70 5 71 3 Összesen 30 2009. 10. 14. 15

Harmonikus átlag Az a szám, amelyet az átlagolandó értékek helyébe téve, azok reciprokainak összege változatlan marad. Akkor alkalmazzuk, ha az értékek reciprokainak összege értelmezhető. 2009. 10. 14. 16

Harmonikus átlag képlete x h n i1 n 1 x i 2009. 10. 14. 17

Súlyozott harmonikus átlag k x h k i 1 i 1 f f i i 1 x i 2009. 10. 14. 18

A dollár MNB által rögzített középárfolyama, (állandó összegű forintot feltételezve) január 212.76 július 222.69 február 207.29 augusztus 213.99 március 212.14 szeptember 216.86 április 218.39 október 215.48 május 210.75 november 206.02 június 205.54 december 193.31 2009. 10. 14. 19

Példa Egy személyszállítással foglalkozó vállalkozó két mikrobusza egy adott napon 40 illetve 60 liter benzint fogyasztott. A kocsik üzemanyagigénye 100 km-ként 20 illetve 15 liter. Mennyi az átlagfogyasztás? (Pt 23/33) 2009. 10. 14. 20

Mértani átlag Az a szám, amelyet az átlagolandó számértékek helyébe téve azok szorzata változatlan marad. _ n x g n xi i1 2009. 10. 14. 21

Mintapélda Egy kézilabdacsapat nézőszáma 2002-ről, 2003-ra 2%-kal, 2003-ról 2004-re 3,9%- kal, 2004-ről 2005-re 8,5%-kal nőtt. Határozd meg az éves átlagos nézőszám növekedés mértékét.(tk 62.old) 2009. 10. 14. 22

Négyzetes átlag Más néven kvadratikus átlag. Az a szám, amelyet az átlagolandó számértékek helyébe téve azok négyzetösszege változatlan marad. /A szórás kiszámításánál kap majd szerepet/ x _ n i1 q x n 2 i 2009. 10. 14. 23

Kvantilisek Ha a rangsorba rendezett sokaságot 2,3,4 k egyenlőre osztjuk, az osztópontnak megfelelő ismérvértékeket kavantiliseknek hívjuk. (néhány fontosabb kvantilis érték 2- Medián, 3-Tercilis, 10- Decililis) 2009. 10. 14. 24

Az egy fõre jutó személyes nettó jövedelmek alapján képzett népességtizedek részesedése az összes személyes jövedelembõl, 1972-1997, % Év 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. Tized 1972 4,0 5,9 7,0 8,0 8,9 9,8 10,8 11,9 13,8 19,9 1977 4,5 6,3 7,3 8,1 8,9 9,8 10,8 12,0 13,7 18,6 1982 4,9 6,4 7,3 8,1 8,8 9,6 10,7 11,9 13,7 18,6 1987 4,5 6,0 6,9 7,7 8,5 9,4 10,5 11,8 13,8 20,9 1995 3,3 5,0 6,2 7,2 8,2 9,1 10,2 11,7 14,1 25,0 1997 2,9 4,7 5,9 7,0 7,9 8,9 10,0 11,6 14,4 26,7 2009. 10. 14. 25

Szóródás Szóródásnak nevezzük statisztikában az adatatok (általában a mennyiségi ismérv értékek) eltérését egymástól, vagy egy meghatározott, a sokaság egészét jellemző értéktől. 2009. 10. 14. 26

Leggyakrabban használt szóródási mérőszámok Szóródás terjedelme (T) Interkvartilis terjedelme (TQ) Átlagos eltérés δ Szórás σ és a variancia szórásnégyzet σ 2 Relatív szórás V 2009. 10. 14. 27

Szórás terjedelme A szóródás terjedelme az előforduló legnagyobb és legkisebb érték különbsége. T = x max x min Jellemzője: jól értelmezhető, de a kiugró értékek nagyban befolyásolják /kiugró eredmény pl. a világcsúcs is/ 2009. 10. 14. 28

Interkvartilis terjedelem Az interkvartilis terjedelem azt az intervallumot jelöli, ahol az összes érték középső 50%-a helyezkedik el. 2009. 10. 14. 29

Átlagos eltérés Az átlagos eltérés épít arra a gondolatmenetre, hogy a számértékeknek egy középértékektől való eltéréseiből következtetni tudunk a szóródás nagyságára. Ezeket az eltéréseket sűrűsíthetjük egy középérték segítségével. 2009. 10. 14. 30

Számítása Az átlagos eltérés számításánál az eltérések abszolút értékeiből számított átlagnak van értelme. δ n i 1 x n i _ x 2009. 10. 14. 31

Szórás Az egyes értékek számtani átlagtól való eltéréseinek négyzetes átlagát szórásnak nevezzük. n 1 n i1 _ x xi 2 2009. 10. 14. 32

Relatív szórás Nem mértékegységben adja meg az eltérést, hanem százalékban. Számítása: szóródási mérőszámot egy középértékhez viszonyítjuk (számtani átlag) V _ x 2009. 10. 14. 33

Szórás felhasználásának lehetősége Sportolók esetében a teljesítmény ingadozása Minimumküszöbök szintidők meghatározása /Sportolók teljesítményének kockázata/ 2009. 10. 14. 34

Eloszlás típusok Empirikus eloszlás Egymóduszú eloszlás Többmóduszú eloszlás Szimetrikus Asszimetrikus U alakú eloszlás M alakú eloszlás 2009. 10. 14. 35

Egymóduszú eloszlások A szimetrikus gyakorisági sorok jellemzője, hogy grafikus ábrájuk a módusz értékénél felvehető tengelyre szimetrikus. Az ilyen eloszlásnál a módusz, a medián, és a számtani átlag megegyezik egymással. (Ilyen pl. a testmagasság) Aszimmetrikus eloszlások esetén a módusz a két szélső érték közül az egyikhez esik közelebb Bal oldali asszimetria Mo > Me > x Jobb oldali asszimetira Mo <Me < x 2009. 10. 14. 36

Asszimetria mérése A mérőszámok tulajdonsága a következő kell, hogy legyen Értékük nulla legyen, ha az eloszlás szimetrikus Jobb oldali asszimetria esetén pozítív, míg ellenkező esetben negatív értéket vegyenek fel. 2009. 10. 14. 37

A mutatószám A mutatószám azon a tényen alapul, hogy szimetrikus eloszlásoknál a számtani átlag és a módusz értéke megegyezik. Jobb oldali asszimetria esetén pozitív míg baloldali asszimetria esetén negatív értéket vesz fel. _ A x Mo 2009. 10. 14. 38

F mutatószám Logikája azt feltételezi, hogy szmetrikus eloszlású gyakorisági sorok esetén a madián az alső és felső kvartilis egyenlő távolságra helyezkedik el. F Q 3 Me Me Q1 Q 3 Me Me Q1 2009. 10. 14. 39