Matematikai statisztika PROGRAMTERVEZŐ INFORMATIKUS alapszak, A szakiráy Arató Miklós Valószíűségelméleti és Statisztika Taszék Természettudomáyi Kar 2019. február 18. Arató Miklós (ELTE) Matematikai statisztika 2019. február 18. 1 / 14
Hisztogram Hisztogram Ha a meyiségi ismérv folytoos vagy sok ismérvérték va, akkor alkalmas módo osztályokat képezük, majd mide egyes adatot potosa egy osztályhoz redeljük. A hisztogram az osztályok gyakoriságait ábrázolja. javaslat az osztályok számára: k = log 2 ha azoos hosszúságú (h) osztályközöket akaruk létrehozi, akkor h = x x 1 k az f i gyakoriságokat ábrázoljuk a függőleges tegelye sűrűséghisztogramál a g i = f i relatív gyakoriságokat ábrázoljuk a függőleges tegelye ha az osztályközök külöböző hosszúságúak, akkor a gyakoriságokat egy közös hosszra kell aráyosítai Gyakoriságok 0 1 2 3 4 5 12 14 16 18 20 22 Lemerülési ido (óra) Arató Miklós (ELTE) Matematikai statisztika 2019. február 18. 2 / 14
Hisztogram (folyt.) Arató Miklós (ELTE) Matematikai statisztika 2019. február 18. 3 / 14
Hisztogram (folyt.) Arató Miklós (ELTE) Matematikai statisztika 2019. február 18. 4 / 14
Hisztogram (folyt.) Arató Miklós (ELTE) Matematikai statisztika 2019. február 18. 5 / 14
Tapasztalati eloszlás Tapasztalati eloszlás: mide megfigyeléshez azoos, 1 súlyt redelük ez egy diszkrét eloszlás A mitaátlag éppe eek a várható értéke A tapasztalati eloszlás eloszlásfüggvéyét hívjuk tapasztalati eloszlásfüggvéyek, ami egy tiszta ugrófüggvéy, értéke mide mitaelem helyé 1 agyságot ugrik felfelé. A tapasztalati eloszlásfüggvéy az x helye: I(x 1 < x) + I(x 2 < x) +... + I(x < x) = I(x i < x) Azt mutatja meg, hogy a mitaelemek háyad része kisebb x-él. Arató Miklós (ELTE) Matematikai statisztika 2019. február 18. 6 / 14
Középértékek számítása Adott az elemű x = (x 1, x 2,..., x ) tapasztalati mita; osztályközös gyakorisági sor eseté k jelöli az osztályok számát, x i az osztályközepeket, f i pedig a gyakoriságokat. Mitaátlag: az adatok átlagos értéke x i Számítása közvetleül az adatokból: x = Számítása osztályközös gyakorisági sorból: x = Módusz: a legtöbbször előforduló ismérvérték Számítása osztályközös gyakorisági sorból: Mo= x mo,a + h mo, ahol da d a+d f k f i x i a móduszt tartalmazó osztályköz: amelyikbe egységyi osztályköz hosszra a legagyobb gyakoriság jut ( korrigált gyakoriságok!) x mo,a : a móduszt tartalmazó osztályköz alsó értéke h mo : a móduszt tartalmazó osztályköz hossza d a : a móduszt tartalmazó osztályköz korrigált gyakorisága míusz a móduszt közvetleül megelőző osztályköz korrigált gyakorisága d f : a móduszt tartalmazó osztályköz korrigált gyakorisága míusz a móduszt közvetleül követő osztályköz korrigált gyakorisága Arató Miklós (ELTE) Matematikai statisztika 2019. február 18. 7 / 14
Középértékek számítása Adott az elemű x = (x 1, x 2,..., x ) tapasztalati mita; osztályközös gyakorisági sor eseté k jelöli az osztályok számát, x i az osztályközepeket, f i pedig a gyakoriságokat. Mitaátlag: az adatok átlagos értéke x i Számítása közvetleül az adatokból: x = Számítása osztályközös gyakorisági sorból: x = Módusz: a legtöbbször előforduló ismérvérték Számítása osztályközös gyakorisági sorból: Mo= x mo,a + h mo, ahol da d a+d f k f i x i a móduszt tartalmazó osztályköz: amelyikbe egységyi osztályköz hosszra a legagyobb gyakoriság jut ( korrigált gyakoriságok!) x mo,a : a móduszt tartalmazó osztályköz alsó értéke h mo : a móduszt tartalmazó osztályköz hossza d a : a móduszt tartalmazó osztályköz korrigált gyakorisága míusz a móduszt közvetleül megelőző osztályköz korrigált gyakorisága d f : a móduszt tartalmazó osztályköz korrigált gyakorisága míusz a móduszt közvetleül követő osztályköz korrigált gyakorisága Arató Miklós (ELTE) Matematikai statisztika 2019. február 18. 7 / 14
Középértékek számítása Jelölje x 1 x 2... x a redezett tapasztalati mitát. Mediá: azo ismérvérték, amelyél ugyaayi kisebb vagy egyelő, mit agyobb vagy egyelő ismérvérték fordul elő a mitába (a "középső" elem) Számítása közvetleül az adatokból: x +1, ha páratla 2 Me= x +x +1 2 2 2, ha páros Számítása osztályközös gyakorisági sorból két lépésbe lieáris iterpolációval: 1. Melyik osztályközbe va a mediá: azo i, amire f i 1 2 és f i 2 2. Me = x i,a + 2 f i 1 f i h i, ahol x i,a : a mediát tartalmazó osztályköz alsó értéke h i : a mediát tartalmazó osztályköz hossza f i 1: a mediát közvetleül megelőző osztályköz kumulált gyakorisága f i : a mediát tartalmazó osztályköz gyakorisága Arató Miklós (ELTE) Matematikai statisztika 2019. február 18. 8 / 14
Tapasztalati kvatilisek számítása Tapasztalati y-kvatilis: azo ismérvérték, amelyél a mitaelemek y-ad része kisebb vagy egyelő, míg (1 y)-ad része agyobb vagy egyelő, 0 < y < 1 Számítása em egyértelmű, mi midig az egyik iterpolációs módszert alkalmazzuk két lépésbe: 1. háyadik mitaelem a keresett kvatilis sorszám: s := ( + 1)y 2. lieáris iterpolációval a kvatilis kiszámítása Számítása közvetleül az adatokból 1. Sorszám: s = e + t (e: egészrész, t: törtrész) 2. q y = xe + t(xe+1 x e ) Számítása osztályközös gyakorisági sorból két lépésbe lieáris iterpolációval: 1. Melyik osztályközbe va az s-edik elem: jelölje ezt i, azaz f i 1 s és f i s 2. q y = x i,a + s f i 1 f i h i, ahol x i,a, h i, f i 1 és f i ugyaazokat jelöli, mit az előző fólia aljá, csak az adott y-kvatilisre voatkozóa Arató Miklós (ELTE) Matematikai statisztika 2019. február 18. 9 / 14
Tapasztalati kvatilisek számítása Tapasztalati y-kvatilis: azo ismérvérték, amelyél a mitaelemek y-ad része kisebb vagy egyelő, míg (1 y)-ad része agyobb vagy egyelő, 0 < y < 1 Számítása em egyértelmű, mi midig az egyik iterpolációs módszert alkalmazzuk két lépésbe: 1. háyadik mitaelem a keresett kvatilis sorszám: s := ( + 1)y 2. lieáris iterpolációval a kvatilis kiszámítása Számítása közvetleül az adatokból 1. Sorszám: s = e + t (e: egészrész, t: törtrész) 2. q y = xe + t(xe+1 x e ) Számítása osztályközös gyakorisági sorból két lépésbe lieáris iterpolációval: 1. Melyik osztályközbe va az s-edik elem: jelölje ezt i, azaz f i 1 s és f i s 2. q y = x i,a + s f i 1 f i h i, ahol x i,a, h i, f i 1 és f i ugyaazokat jelöli, mit az előző fólia aljá, csak az adott y-kvatilisre voatkozóa Arató Miklós (ELTE) Matematikai statisztika 2019. február 18. 9 / 14
Nevezetes kvatilisek A szakirodalomba a tapasztalati és az elméleti értékek között em teszek külöbséget, midegyiket agy betűvel írják (ami éha meglehetőse zavaró...). Jelölje q y a tapasztalati y-kvatilist. tercilisek: T 1 = q 1/3, T 2 = q 2/3 kvartilisek: Q 1 = q 1/4 (alsó kvartilis) Q 2 = Me = q 2/4 (középső kvartilis vagy mediá) Q 3 = q 3/4 (felső kvartilis) kvitilisek: K 1 = q 1/5, K 2 = q 2/5, K 3 = q 3/5, K 4 = q 4/5 decilisek: D i = q i/10, i = 1, 2,..., 9 percetilisek: P i = q i/100, i = 1, 2,..., 99 Arató Miklós (ELTE) Matematikai statisztika 2019. február 18. 10 / 14
Szóródási mutatók számítása Terjedelem: R = x x 1 (R=rage) Iterkvartilis terjedelem: IQR = Q 3 Q 1 Tapasztalati szórás: az átlagtól való átlagos eltérés abszolút mértékegységbe Számítása közvetleül az adatokból: s = Számítása osztályközös gyakorisági sorból: s = (x i x) 2 k f i (x i x) 2 Korrigált tapasztalati szórás: az átlagtól való átlagos eltérés abszolút mértékegységbe Számítása közvetleül az adatokból: s = (x i x) 2 1 k f i (x i x) 2 Számítása osztályközös gyakorisági sorból: s = 1 ezt "szeretjük" a legjobba, mide szoftver, programcsomag szórás számításáál ezt veszi alapértelmezettek Arató Miklós (ELTE) Matematikai statisztika 2019. február 18. 11 / 14
Szóródási mutatók számítása Relatív szórás vagy szórási együttható: az átlagtól való átlagos eltérés százalékba; lehet a korrigált és a korrigálatla tapasztalati szóráségyzetből is számítai: V = s x vagy V = s x Kevésbé gyakra haszált, szóródást mérő mutatók: átlagos abszolút eltérés: Gii-együttható: G = 1 ( 1) x i x j=1 x i x j. Arató Miklós (ELTE) Matematikai statisztika 2019. február 18. 12 / 14
Alakmutatók számítása A szórást ezekél is választhatjuk a tapasztalati vagy a korrigált tapasztalati szórásak egyarát. Tapasztalati ferdeség Számítása közvetleül az adatokból: Számítása osztályközös gyakorisági sorból: Tapasztalati csúcsosság Számítása közvetleül az adatokból: (x i x) 3 (s ) 3 f i (x i x) 3 (s ) 3 (x i x) 4 Számítása osztályközös gyakorisági sorból: (s ) 4 3 f i (x i x) 4 (s ) 4 3 Arató Miklós (ELTE) Matematikai statisztika 2019. február 18. 13 / 14
Fotos leíró statisztikai ábrák Boxplot ábra (Box&Whiskers diagram) ez fekvő, de lehet álló is A betűk a következő értékeket jeletik: A = max{x 1, Q 1 1, 5 IQR} B = Q 1 C = Me D = Q 3 E = mi{x, Q 3 + 1, 5 IQR} F: kieső érték (outlier) azokat az adatpotokat tütetjük fel, amik A- vagy E- kívülre esek ahol IQR = Q 3 Q 1 az iterkvartilis terjedelem Arató Miklós (ELTE) Matematikai statisztika 2019. február 18. 14 / 14