Matematikai statisztika

Hasonló dokumentumok
Eddig megismert eloszlások Jelölése Eloszlása EX D 2 X P(X = 1) = p Ind(p) P(X = 0) = 1 p. Leíró és matematikai statisztika

BIOSTATISZTIKA ÉS INFORMATIKA. Leíró statisztika

1. előadás: Bevezetés. Irodalom. Számonkérés. Cél. Matematikai statisztika előadás survey statisztika MA szakosoknak. A matematikai statisztika tárgya

A statisztikai vizsgálat tárgyát képező egyedek összességét statisztikai sokaságnak nevezzük.

Statisztika 2. Dr Gősi Zsuzsanna Egyetemi adjunktus

Bevezető Adatok rendezése Adatok jellemzése Időbeli elemzés. Gazdaságstatisztika KGK VMI

Matematika B4 I. gyakorlat

Bevezető Adatok rendezése Adatok jellemzése Időbeli elemzés

A sokaság elemei közül a leggyakrabban előforduló érték. diszkrét folytonos

Populáció. Történet. Adatok. Minta. A matematikai statisztika tárgya. Valószínűségszámítás és statisztika előadás info. BSC/B-C szakosoknak

Statisztika. Eloszlásjellemzők

Statisztika I. 4. előadás. Előadó: Dr. Ertsey Imre

Statisztika gyakorlat Geológus szakirány

A statisztika részei. Példa:

Statisztika 1. zárthelyi dolgozat március 21.

A biostatisztika alapfogalmai, konfidenciaintervallum. Dr. Boda Krisztina PhD SZTE ÁOK Orvosi Fizikai és Orvosi Informatikai Intézet

Statisztika október 27.

Elemi statisztika fizikusoknak

Segédanyag a Leíró és matematikai statisztika tantárgyhoz március 28.

Virág Katalin. Szegedi Tudományegyetem, Bolyai Intézet

Zavar (confounding): akkor lép fel egy kísérletben, ha a kísérletet végző nem tudja megkülönböztetni az egyes faktorokat.

Matematikai alapok és valószínőségszámítás. Középértékek és szóródási mutatók

Matematikai statisztikai elemzések 2.

Megjegyzések. További tételek. Valódi határeloszlások. Tulajdonságok. Gyenge (eloszlásbeli) konvergencia

Statisztikai alapfogalmak

A sokaság/minta eloszlásának jellemzése

STATISZTIKA. Gyakorló feladatok az első zh-ra

Villamos gépek tantárgy tételei

Az átlagra vonatkozó megbízhatósági intervallum (konfidencia intervallum)

STATISZTIKA I. x ÁR. x ÁR. x ÁR. x ÁR. Számosállat. Egységhozam. Termelési érték, árbevétel. Az ár. Hogyan lehet ezeket összehasonlítani?

Pályázat címe: Pályázati azonosító: Kedvezményezett: Szegedi Tudományegyetem Cím: 6720 Szeged, Dugonics tér

Leíró és matematikai statisztika gyakorlat 2018/2019 II. félév

Statisztika 1. zárthelyi dolgozat március 18.

Leíró és matematikai statisztika el adásnapló Matematika alapszak, matematikai elemz szakirány 2016/2017. tavaszi félév

Leíró és matematikai statisztika

Mo= argmax f(x), ha X abszolút folytonos; Mo= argmax P (X = x i ), ha X diszkrét.

BIOMATEMATIKA ELŐADÁS

MINTAFELADATOK. 1. Az alábbi diagram egy kiskereskedelmi lánc boltjainak forgalomkoncentrációját szemlélteti:

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Statisztika. Földtudomány szak, geológus szakirány, 2015/2016. tanév tavaszi

STATISZTIKA I. Változékonyság (szóródás) A szóródás mutatószámai. Terjedelem. Forgalom terjedelem. Excel függvények. Függvénykategória: Statisztikai

Segítség az outputok értelmezéséhez

Kutatói pályára felkészítı modul

24. tétel A valószínűségszámítás elemei. A valószínűség kiszámításának kombinatorikus modellje.

Matematikai statisztika gyakorlat 2018/2019 II. félév

Biomatematika 2 Orvosi biometria

ELTE TáTK Közgazdaságtudományi Tanszék GAZDASÁGSTATISZTIKA. Készítette: Bíró Anikó. Szakmai felelős: Bíró Anikó június

STATISZTIKA. András hármas. Éva ötös. Nóri négyes. 5 4,5 4 3,5 3 2,5 2 1,5 ANNA BÉLA CILI 0,5 MAGY. MAT. TÖRT. KÉM.

Statisztika. Politológus képzés. Daróczi Gergely április 17. Politológia Tanszék

Brósch Zoltán (Debreceni Egyetem Kossuth Lajos Gyakorló Gimnáziuma) Statisztika

Feladatok: pontdiagram és dobozdiagram. Hogyan csináltuk?

1. Egy Kft dolgozóit a havi bruttó kereseteik alapján csoportosítottuk: Havi bruttó bér, ezer Ft/fő

A valószínűségszámítás elemei

Kutatásmódszertan és prezentációkészítés

10.M ALGEBRA < <

KÖZPONTI STATISZTIKAI HIVATAL. Szóbeli vizsgatevékenység

Microsoft Excel Gyakoriság

1. Adatok közelítése. Bevezetés. 1-1 A közelítő függvény

Leíró és matematikai statisztika

képzetes t. z = a + bj valós t. a = Rez 5.2. Műveletek algebrai alakban megadott komplex számokkal

Segédanyag a Leíró és matematikai statisztika tantárgyhoz március 1.

Vargha András Károli Gáspár Református Egyetem Budapest

Változók eloszlása, középértékek, szóródás

ALGEBRA. egyenlet megoldásait, ha tudjuk, hogy egész számok, továbbá p + q = 198.

ORVOSI STATISZTIKA. Az orvosi statisztika helye. Egyéb példák. Példa: test hőmérséklet. Lehet kérdés? Statisztika. Élettan Anatómia Kémia. Kérdések!

STATISZTIKA I. Centrális mutatók. Helyzeti középértékek. Középértékek. Bimodális eloszlás, U. Módusz, Mo. 4. Előadás.

STATISZTIKA KÉSZÍTETTE: TAKÁCS SÁNDOR

[Biomatematika 2] Orvosi biometria

biometria III. foglalkozás előadó: Prof. Dr. Rajkó Róbert Hipotézisvizsgálat

Debreceni Egyetem, Közgazdaság- és Gazdaságtudományi Kar. Feladatok a Gazdasági matematika I. tárgy gyakorlataihoz. Halmazelmélet

A leíró statisztikák

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Statisztikai programcsomagok

Matematikai játékok. Svetoslav Bilchev, Emiliya Velikova

1 k < n(1 + log n) C 1n log n, d n. (1 1 r k + 1 ) = 1. = 0 és lim. lim n. f(n) < C 3

SZÁMELMÉLET. Vasile Berinde, Filippo Spagnolo

Matematika I. 9. előadás

Vizsgáljuk elôször, hogy egy embernek mekkora esélye van, hogy a saját

Rudas Tamás: A hibahatár a becsült mennyiség függvényében a mért pártpreferenciák téves értelmezésének egyik forrása

18. Differenciálszámítás

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Matematikai statisztika. Mi a modell? Binomiális eloszlás sűrűségfüggvény. Binomiális eloszlás

A matematikai statisztika elemei

2. fejezet. Számsorozatok, számsorok

n akkor az n elem összes ismétléses ... k l k 3 k 1! k 2!... k l!

Tartalom. Kezdeti szimulációs technikák. Tipikus kérdések. A bootstrap módszer. Bevezetés A független, azonos eloszlású eset:

Ingatlanfinanszírozás és befektetés

SULINOVA PROGRAMTANTERVÉHEZ ILLESZKEDŐ TANMENET 9. ÉVFOLYAM SZÁMÁRA

= dx 0,45 0,4 0,35 0,3 0,25 0,2 0,15 0,1 0,05 0,45 0,4 0,35 0,3 0,25 0,2 0,15 0,1 0,05 0,45 0,4 0,35 0,3 0,25 0,2 0,15 0,1 0,05

2. egy iskola tanulói, a változók: magasságuk cm-ben, súlyuk (tömegük) kilóban; 3. egy iskola tanulói, a változó: tanulmányi átlaguk;

VII.Valószínűségszámítási, statisztikai, gráfelméleti alapfogalmak

Bevezető Mi a statisztika? Mérés Feldolgozás Adatok rendezése Adatok jellemzése Időbeli elemzés Feladatok. Statisztika I.

Gazdaságtudományi Kar. Gazdaságelméleti és Módszertani Intézet. Bevezetés. 1. előadás. Statisztikai szoftver alkalmazás.

3. Számelmélet. 1-nek pedig pontosan három. Hány pozitív osztója van az n számnak? OKTV 2012/2013; I. kategória, 1. forduló

Alkalmazott statisztika feladatok

Leíró statisztika. Adatok beolvasása az R-be és ezek mentése

5. Kombinatorika. 8. Legfeljebb hány pozitív egész számot adhatunk meg úgy, hogy semelyik kettő összege és különbsége se legyen osztható 2015-tel?

Matematikai statisztika

18. modul: STATISZTIKA

Eseme nyalgebra e s kombinatorika feladatok, megolda sok

Intervallum Paraméteres Hipotézisek Nemparaméteres. Statisztika december 2.

Átírás:

Matematikai statisztika PROGRAMTERVEZŐ INFORMATIKUS alapszak, A szakiráy Arató Miklós Valószíűségelméleti és Statisztika Taszék Természettudomáyi Kar 2019. február 18. Arató Miklós (ELTE) Matematikai statisztika 2019. február 18. 1 / 14

Hisztogram Hisztogram Ha a meyiségi ismérv folytoos vagy sok ismérvérték va, akkor alkalmas módo osztályokat képezük, majd mide egyes adatot potosa egy osztályhoz redeljük. A hisztogram az osztályok gyakoriságait ábrázolja. javaslat az osztályok számára: k = log 2 ha azoos hosszúságú (h) osztályközöket akaruk létrehozi, akkor h = x x 1 k az f i gyakoriságokat ábrázoljuk a függőleges tegelye sűrűséghisztogramál a g i = f i relatív gyakoriságokat ábrázoljuk a függőleges tegelye ha az osztályközök külöböző hosszúságúak, akkor a gyakoriságokat egy közös hosszra kell aráyosítai Gyakoriságok 0 1 2 3 4 5 12 14 16 18 20 22 Lemerülési ido (óra) Arató Miklós (ELTE) Matematikai statisztika 2019. február 18. 2 / 14

Hisztogram (folyt.) Arató Miklós (ELTE) Matematikai statisztika 2019. február 18. 3 / 14

Hisztogram (folyt.) Arató Miklós (ELTE) Matematikai statisztika 2019. február 18. 4 / 14

Hisztogram (folyt.) Arató Miklós (ELTE) Matematikai statisztika 2019. február 18. 5 / 14

Tapasztalati eloszlás Tapasztalati eloszlás: mide megfigyeléshez azoos, 1 súlyt redelük ez egy diszkrét eloszlás A mitaátlag éppe eek a várható értéke A tapasztalati eloszlás eloszlásfüggvéyét hívjuk tapasztalati eloszlásfüggvéyek, ami egy tiszta ugrófüggvéy, értéke mide mitaelem helyé 1 agyságot ugrik felfelé. A tapasztalati eloszlásfüggvéy az x helye: I(x 1 < x) + I(x 2 < x) +... + I(x < x) = I(x i < x) Azt mutatja meg, hogy a mitaelemek háyad része kisebb x-él. Arató Miklós (ELTE) Matematikai statisztika 2019. február 18. 6 / 14

Középértékek számítása Adott az elemű x = (x 1, x 2,..., x ) tapasztalati mita; osztályközös gyakorisági sor eseté k jelöli az osztályok számát, x i az osztályközepeket, f i pedig a gyakoriságokat. Mitaátlag: az adatok átlagos értéke x i Számítása közvetleül az adatokból: x = Számítása osztályközös gyakorisági sorból: x = Módusz: a legtöbbször előforduló ismérvérték Számítása osztályközös gyakorisági sorból: Mo= x mo,a + h mo, ahol da d a+d f k f i x i a móduszt tartalmazó osztályköz: amelyikbe egységyi osztályköz hosszra a legagyobb gyakoriság jut ( korrigált gyakoriságok!) x mo,a : a móduszt tartalmazó osztályköz alsó értéke h mo : a móduszt tartalmazó osztályköz hossza d a : a móduszt tartalmazó osztályköz korrigált gyakorisága míusz a móduszt közvetleül megelőző osztályköz korrigált gyakorisága d f : a móduszt tartalmazó osztályköz korrigált gyakorisága míusz a móduszt közvetleül követő osztályköz korrigált gyakorisága Arató Miklós (ELTE) Matematikai statisztika 2019. február 18. 7 / 14

Középértékek számítása Adott az elemű x = (x 1, x 2,..., x ) tapasztalati mita; osztályközös gyakorisági sor eseté k jelöli az osztályok számát, x i az osztályközepeket, f i pedig a gyakoriságokat. Mitaátlag: az adatok átlagos értéke x i Számítása közvetleül az adatokból: x = Számítása osztályközös gyakorisági sorból: x = Módusz: a legtöbbször előforduló ismérvérték Számítása osztályközös gyakorisági sorból: Mo= x mo,a + h mo, ahol da d a+d f k f i x i a móduszt tartalmazó osztályköz: amelyikbe egységyi osztályköz hosszra a legagyobb gyakoriság jut ( korrigált gyakoriságok!) x mo,a : a móduszt tartalmazó osztályköz alsó értéke h mo : a móduszt tartalmazó osztályköz hossza d a : a móduszt tartalmazó osztályköz korrigált gyakorisága míusz a móduszt közvetleül megelőző osztályköz korrigált gyakorisága d f : a móduszt tartalmazó osztályköz korrigált gyakorisága míusz a móduszt közvetleül követő osztályköz korrigált gyakorisága Arató Miklós (ELTE) Matematikai statisztika 2019. február 18. 7 / 14

Középértékek számítása Jelölje x 1 x 2... x a redezett tapasztalati mitát. Mediá: azo ismérvérték, amelyél ugyaayi kisebb vagy egyelő, mit agyobb vagy egyelő ismérvérték fordul elő a mitába (a "középső" elem) Számítása közvetleül az adatokból: x +1, ha páratla 2 Me= x +x +1 2 2 2, ha páros Számítása osztályközös gyakorisági sorból két lépésbe lieáris iterpolációval: 1. Melyik osztályközbe va a mediá: azo i, amire f i 1 2 és f i 2 2. Me = x i,a + 2 f i 1 f i h i, ahol x i,a : a mediát tartalmazó osztályköz alsó értéke h i : a mediát tartalmazó osztályköz hossza f i 1: a mediát közvetleül megelőző osztályköz kumulált gyakorisága f i : a mediát tartalmazó osztályköz gyakorisága Arató Miklós (ELTE) Matematikai statisztika 2019. február 18. 8 / 14

Tapasztalati kvatilisek számítása Tapasztalati y-kvatilis: azo ismérvérték, amelyél a mitaelemek y-ad része kisebb vagy egyelő, míg (1 y)-ad része agyobb vagy egyelő, 0 < y < 1 Számítása em egyértelmű, mi midig az egyik iterpolációs módszert alkalmazzuk két lépésbe: 1. háyadik mitaelem a keresett kvatilis sorszám: s := ( + 1)y 2. lieáris iterpolációval a kvatilis kiszámítása Számítása közvetleül az adatokból 1. Sorszám: s = e + t (e: egészrész, t: törtrész) 2. q y = xe + t(xe+1 x e ) Számítása osztályközös gyakorisági sorból két lépésbe lieáris iterpolációval: 1. Melyik osztályközbe va az s-edik elem: jelölje ezt i, azaz f i 1 s és f i s 2. q y = x i,a + s f i 1 f i h i, ahol x i,a, h i, f i 1 és f i ugyaazokat jelöli, mit az előző fólia aljá, csak az adott y-kvatilisre voatkozóa Arató Miklós (ELTE) Matematikai statisztika 2019. február 18. 9 / 14

Tapasztalati kvatilisek számítása Tapasztalati y-kvatilis: azo ismérvérték, amelyél a mitaelemek y-ad része kisebb vagy egyelő, míg (1 y)-ad része agyobb vagy egyelő, 0 < y < 1 Számítása em egyértelmű, mi midig az egyik iterpolációs módszert alkalmazzuk két lépésbe: 1. háyadik mitaelem a keresett kvatilis sorszám: s := ( + 1)y 2. lieáris iterpolációval a kvatilis kiszámítása Számítása közvetleül az adatokból 1. Sorszám: s = e + t (e: egészrész, t: törtrész) 2. q y = xe + t(xe+1 x e ) Számítása osztályközös gyakorisági sorból két lépésbe lieáris iterpolációval: 1. Melyik osztályközbe va az s-edik elem: jelölje ezt i, azaz f i 1 s és f i s 2. q y = x i,a + s f i 1 f i h i, ahol x i,a, h i, f i 1 és f i ugyaazokat jelöli, mit az előző fólia aljá, csak az adott y-kvatilisre voatkozóa Arató Miklós (ELTE) Matematikai statisztika 2019. február 18. 9 / 14

Nevezetes kvatilisek A szakirodalomba a tapasztalati és az elméleti értékek között em teszek külöbséget, midegyiket agy betűvel írják (ami éha meglehetőse zavaró...). Jelölje q y a tapasztalati y-kvatilist. tercilisek: T 1 = q 1/3, T 2 = q 2/3 kvartilisek: Q 1 = q 1/4 (alsó kvartilis) Q 2 = Me = q 2/4 (középső kvartilis vagy mediá) Q 3 = q 3/4 (felső kvartilis) kvitilisek: K 1 = q 1/5, K 2 = q 2/5, K 3 = q 3/5, K 4 = q 4/5 decilisek: D i = q i/10, i = 1, 2,..., 9 percetilisek: P i = q i/100, i = 1, 2,..., 99 Arató Miklós (ELTE) Matematikai statisztika 2019. február 18. 10 / 14

Szóródási mutatók számítása Terjedelem: R = x x 1 (R=rage) Iterkvartilis terjedelem: IQR = Q 3 Q 1 Tapasztalati szórás: az átlagtól való átlagos eltérés abszolút mértékegységbe Számítása közvetleül az adatokból: s = Számítása osztályközös gyakorisági sorból: s = (x i x) 2 k f i (x i x) 2 Korrigált tapasztalati szórás: az átlagtól való átlagos eltérés abszolút mértékegységbe Számítása közvetleül az adatokból: s = (x i x) 2 1 k f i (x i x) 2 Számítása osztályközös gyakorisági sorból: s = 1 ezt "szeretjük" a legjobba, mide szoftver, programcsomag szórás számításáál ezt veszi alapértelmezettek Arató Miklós (ELTE) Matematikai statisztika 2019. február 18. 11 / 14

Szóródási mutatók számítása Relatív szórás vagy szórási együttható: az átlagtól való átlagos eltérés százalékba; lehet a korrigált és a korrigálatla tapasztalati szóráségyzetből is számítai: V = s x vagy V = s x Kevésbé gyakra haszált, szóródást mérő mutatók: átlagos abszolút eltérés: Gii-együttható: G = 1 ( 1) x i x j=1 x i x j. Arató Miklós (ELTE) Matematikai statisztika 2019. február 18. 12 / 14

Alakmutatók számítása A szórást ezekél is választhatjuk a tapasztalati vagy a korrigált tapasztalati szórásak egyarát. Tapasztalati ferdeség Számítása közvetleül az adatokból: Számítása osztályközös gyakorisági sorból: Tapasztalati csúcsosság Számítása közvetleül az adatokból: (x i x) 3 (s ) 3 f i (x i x) 3 (s ) 3 (x i x) 4 Számítása osztályközös gyakorisági sorból: (s ) 4 3 f i (x i x) 4 (s ) 4 3 Arató Miklós (ELTE) Matematikai statisztika 2019. február 18. 13 / 14

Fotos leíró statisztikai ábrák Boxplot ábra (Box&Whiskers diagram) ez fekvő, de lehet álló is A betűk a következő értékeket jeletik: A = max{x 1, Q 1 1, 5 IQR} B = Q 1 C = Me D = Q 3 E = mi{x, Q 3 + 1, 5 IQR} F: kieső érték (outlier) azokat az adatpotokat tütetjük fel, amik A- vagy E- kívülre esek ahol IQR = Q 3 Q 1 az iterkvartilis terjedelem Arató Miklós (ELTE) Matematikai statisztika 2019. február 18. 14 / 14