3. előadás
A sokaság/mnta eloszlásának jellemzése tpkus értékek meghatározása; az adatok különbözőségének vzsgálata, a sokaság/mnta eloszlásgörbéjének elemzése.
Eloszlásjellemzők Középértékek helyzet (Me, Mo) számított Aszmmetra mérése Pearson-féle mutató (A) F mutató β 1 mutató grafkus ábrázolás Szóródás mérőszámok szórás ( ) relatív szórás (V) terjedelem (R) nterkvartls terjedelem (IQR) Egyéb jellemzők koncentrácó kvantlsek momentumok grafkus ábrák
Középértékekkel szemben követelmények egyértelmű számítás; tpkus, jellemző értékek legyenek; szemléletes, jó értelmezhetőség; közepes helyzet X mn K X max
Középértékek jellemző A mennység smérvet egyetlen számmal jellemzk. Dmenzó: az smérv mértékegysége.
Középértékek : Átlagok Számtan x Harmonkus Mértan x g Négyzetes Kronológkus x q x h x k Helyzet középértékek Módusz (Mo) Medán (Me)
Számtan átlag Az a szám, amelyet az átlagolandó értékek helyére téve azok összege változatlan marad.
Számtan átlag Egyed értékeknél: x x1 x2... n n 1 x n n x Súlyozott forma: n x 1 f f x
A számtan átlag matematka tulajdonsága Az egyes elemek - átlagolandó értékek - átlagtól való eltérésenek összege 0: n =1 Ha mnden egyes elemhez hozzáadunk egy "a" konstans értéket, az így kapott elemek számtan átlaga "a"-val tér el az eredet elemek átlagától. Ha mnden egyes elemet megszorzunk egy "b" konstans értékkel, akkor az így kapott elemek átlaga "b"-szerese lesz az eredet elemek átlagának. x - x = 0
A számtan átlag matematka tulajdonsága Ha az x 1, x 2,..., x n elemek átlaga, az y 1, y 2,..., y n elemek átlaga, y akkor az x 1 + y 1 ; x 2 + y 2 ;...; x n + y n átlaga lesz. x y Az elemek mndegykéből egy tetszőleges "a" állandót levonva ezen eltérések négyzetösszege akkor lesz mnmáls, ha az "a" állandó éppen az,azaz x x n =1 x - a 2 mnmáls, ha a = x
Példa a számtan átlag tulajdonságara x x x +50 x 1,1 Z= 100 150 110 210 150 200 165 315 210 260 231 441 240 290 264 504 300 350 330 630 Σ 1000 1250 1100 2100 200 250 220 420
A számtan átlag előnyös tulajdonsága Vlágos, érthető fogalom, számítása egyszerű. Mnden adathalmaznak létezk számtan átlaga, s egy van belőle. Mnden elem fgyelembe vételével kerül kszámításra. Kszámításához nem szükséges az egyed értékek smerete, elegendő azok összegét tudn.
A számtan átlag hátrányos tulajdonsága A kugró értékekre (ún. outler-ekre) érzékeny. (nyesett átlag trmmed mean) Osztályközös gyakorság sor alkalmazása esetén nem tudjuk fgyelembe venn az egyed értékeket. Nytott osztályközök használatakor adatvesztés.
Geometra átlag Geometra átlag az a szám, amelyet az egyed értékek helyére írva azok szorzata változatlan marad. Egyed értékek esetén: x g n n 1 x Súlyozott átlagforma: x g n n π 1 x f
A GDP volumenndexének alakulása Magyarországon Időszak Előző negyedév=100% 2008. I. n.év 100,9 2008. II. n.év 99,8 2008. III. n.év 99,0 2008. IV. n.év 98,1 Forrás: KSH Gyorstájékoztató A változás átlagos üteme: x g 4 1,0090,9980,990,981 4 0,978 0,994 99,4%
Megoszlás vszonyszám és dnamkus vszonyszám között kapcsolat Telep Árbevétel (MFt) Árbevétel megoszlása Dnamkus vszonyszám t 0 t 1 t 0 (%) t 1 (%) (%) A 30 36 20 19 120 B 40 60 27 32 150 C 70 77 47 41 110 D 10 14,5 6 8 145 Összesen 150 187,5 100 100 125
1,25 1,4 14,5 1,1 77 1,5 60 1,2 36 187,5 V A A V 1,25 1 1,45 0,06 1,1 0,47 1,5 0,27 1,2 0,2 B V B V 1,25 150 1,45 10 1,1 70 1,5 40 1,2 30 B V B V 1,25 150 187,5 B A V
Súlyozott átlagok x : átlagolandó értékek f : súlyok A súlyozott átlag nagysága függ: az átlagolandó értékek abszolút nagyságától, a súlyarányoktól (a súlyok egymáshoz vszonyított arányától), súlyként f /n=g s használható.
Helyzet középértékek Medán A rangsorba rendezett adatok közül a középső elem (az előforduló értékek fele ksebb a medán-nál, fele pedg nagyobb)
Medán előnyös tulajdonsága egyértelműen meghatározható, nem csak mennység jellemzők esetén határozható meg, hanem rangsorba rendezhető mnőség smérvek esetén s, értéke független a szélső értékektől.
Medán hátrányos tulajdonsága Csak rangsorba rendezett elemekből számítható. Induktív statsztka célra nem gazán alkalmas. Ha az egyedek jelentős hányada azonos smérvértékkel rendelkezk, akkor nem célszerű használn.
Módusz (Mo) Dszkrét smérv esetén: A leggyakrabban előforduló elem Folytonos smérv esetén: A gyakorság görbe maxmuma.
A módusz jellemző Előnyös tulajdonságok: Tpkus érték Valamenny mérés skála esetén alkalmazható. Nem érzékeny a szélső, kugró értékekre. Hátrányos tulajdonságok: Nem mnden esetben létezk, vagy előfordulhat, hogy több s van belőle. Induktív statsztka célra általában nem alkalmas
Kvantlsek Azok az értékek, melyeknél az összes előforduló értékek j/k-ad része ksebb, lletve az (1-j/k)-ad része nagyobb. (j=1,2,,k-1) Fontosabb kvantlsek: Medán (Me) k=2 Terclsek (T j ) k=3 Kvartlsek (Q j ) k=4 Kvntlsek (K j ) k=5 Declsek (D j ) k=10 A j-edk kvantls sorszáma j n 1 k
Mennység csoportosító sorok fajtá Egy társasház vízfogyasztására vonatkozó adatok Vízfogyasztás (m 3 ) Lakások száma f g(%) g (%) s(m 3 ) z(%) 15 5 5 10 10 50 3 15 25 17 22 34 44 340 24 25 35 15 37 30 74 450 32 35 45 8 45 16 90 320 23 45 5 50 10 100 250 18 Összesen 50-100 1410 100
Köszönöm a fgyelmet