Matematikai statisztika

Hasonló dokumentumok
FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

A Statisztika alapjai

Valószín ségszámítás. Survey statisztika mesterszak és földtudomány alapszak Backhausz Ágnes 2018/2019.

Valószín ségszámítás és statisztika

Matematikai alapok és valószínőségszámítás. Középértékek és szóródási mutatók

Biomatematika 2 Orvosi biometria

Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus.

Leíró és matematikai statisztika el adásnapló Matematika alapszak, matematikai elemz szakirány 2016/2017. tavaszi félév

Normális eloszlás paramétereire vonatkozó próbák

[Biomatematika 2] Orvosi biometria

A leíró statisztikák

Kutatásmódszertan és prezentációkészítés

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió

Elemi statisztika fizikusoknak

Alkalmazott statisztika feladatok

Abszolút folytonos valószín ségi változó (4. el adás)

Segítség az outputok értelmezéséhez

Valószín ségszámítás és statisztika

STATISZTIKA. András hármas. Éva ötös. Nóri négyes. 5 4,5 4 3,5 3 2,5 2 1,5 ANNA BÉLA CILI 0,5 MAGY. MAT. TÖRT. KÉM.

STATISZTIKA I. Változékonyság (szóródás) A szóródás mutatószámai. Terjedelem. Forgalom terjedelem. Excel függvények. Függvénykategória: Statisztikai

18. modul: STATISZTIKA

2. A ξ valószín ségi változó eloszlásfüggvénye a következ : x 4 81 F (x) = x 4 ha 3 < x 0 különben

Matematikai statisztika c. tárgy oktatásának célja és tematikája

Statisztika 2. Dr Gősi Zsuzsanna Egyetemi adjunktus

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1

[Biomatematika 2] Orvosi biometria

Valószín ségszámítás és statisztika

Tartalomjegyzék I. RÉSZ: KÍSÉRLETEK MEGTERVEZÉSE

Statisztika I. 4. előadás Mintavétel. Kóczy Á. László KGK-VMI. Minta Mintavétel Feladatok.

6. Előadás. Vereb György, DE OEC BSI, október 12.

Matematikai alapok és valószínőségszámítás. Statisztikai becslés Statisztikák eloszlása

KÖVETKEZTETŐ STATISZTIKA

[Biomatematika 2] Orvosi biometria

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Statisztika I. 4. előadás Mintavétel. Kóczy Á. László KGK-VMI. Minta Mintavétel Feladatok.

biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás

STATISZTIKA. Egymintás u-próba. H 0 : Kefir zsírtartalma 3% Próbafüggvény, alfa=0,05. Egymintás u-próba vagy z-próba

Biomatematika 2 Orvosi biometria

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok

Biostatisztika. Sz cs Gábor. 2018/19 tavaszi félév. Szegedi Tudományegyetem, Bolyai Intézet

Statisztika I. 8. előadás. Előadó: Dr. Ertsey Imre

Dr. Nagy Zita Barbara igazgatóhelyettes KÖVET Egyesület a Fenntartható Gazdaságért november 15.

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Mintavétel fogalmai STATISZTIKA, BIOMETRIA. Mintavételi hiba. Statisztikai adatgyűjtés. Nem véletlenen alapuló kiválasztás

Matematikai statisztika elıadás, földtudományi BSc (geológus szakirány) 2014/ félév Arató Miklós

Bevezető Adatok rendezése Adatok jellemzése Időbeli elemzés

Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

Matematikai statisztika

A valószínűségszámítás elemei

Bevezető Mi a statisztika? Mérés Csoportosítás

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Matematikai statisztika. Mi a modell? Binomiális eloszlás sűrűségfüggvény. Binomiális eloszlás

Biometria gyakorló feladatok BsC hallgatók számára

Kísérlettervezés alapfogalmak

Microsoft Excel Gyakoriság

A konfidencia intervallum képlete: x± t( α /2, df )

földtudományi BSc (geológus szakirány) Matematikai statisztika elıadás, 2014/ félév 6. elıadás

Normális eloszlás tesztje

Biostatisztika feladatok

Hipotéziselmélet - paraméteres próbák. eloszlások. Matematikai statisztika Gazdaságinformatikus MSc szeptember 10. 1/58

Vargha András Károli Gáspár Református Egyetem Budapest

Hipotézis vizsgálatok

Bevezetés a hipotézisvizsgálatokba

Bevezető Adatok rendezése Adatok jellemzése Időbeli elemzés. Gazdaságstatisztika KGK VMI

Statisztika. Politológus képzés. Daróczi Gergely április 17. Politológia Tanszék

Statisztika elméleti összefoglaló

Orvosi szociológia (1. szeminárium) KUTATÁSMÓDSZERTAN

Képfeldolgozás. 1. el adás. A képfeldolgozás m veletei. Mechatronikai mérnök szak BME, 2008

Feladatok: pontdiagram és dobozdiagram. Hogyan csináltuk?

Modern műszeres analitika szeminárium Néhány egyszerű statisztikai teszt

Elméleti összefoglaló a Sztochasztika alapjai kurzushoz

Függetlenségvizsgálat, Illeszkedésvizsgálat

Adatok statisztikai értékelésének főbb lehetőségei

Matematikai statisztika szorgalmi feladatok

Matematikai alapok és valószínőségszámítás. Statisztikai változók Adatok megtekintése

Nagy számok törvényei Statisztikai mintavétel Várható érték becslése. Dr. Berta Miklós Fizika és Kémia Tanszék Széchenyi István Egyetem

Egyszempontos variancia analízis. Statisztika I., 5. alkalom

Statisztika I. 9. előadás. Előadó: Dr. Ertsey Imre

Populációbecslés és monitoring. Eloszlások és alapstatisztikák

[GVMGS11MNC] Gazdaságstatisztika

Valószín ségszámítás és statisztika Gyakorlat (Statisztika alapjai)

Biometria, haladó biostatisztika EA+GY biometub17vm Szerda 8:00-9:00, 9:00-11:00 Déli Tömb 0-804, Lóczy Lajos terem

Statisztikai becslés

1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása

Bevezetés a biometriába Dr. Dinya Elek egyetemi tanár. PhD kurzus

BAGME11NNF Munkavédelmi mérnökasszisztens Galla Jánosné, 2011.

Vizsgáljuk elôször, hogy egy embernek mekkora esélye van, hogy a saját

NEVEZETES FOLYTONOS ELOSZLÁSOK

STATISZTIKA. A maradék független a kezelés és blokk hatástól. Maradékok leíró statisztikája. 4. A modell érvényességének ellenőrzése

Kabos: Statisztika II. t-próba 9.1. Ha ismert a doboz szórása de nem ismerjük a

Kiválasztás. A változó szerint. Rangok. Nem-paraméteres eljárások. Rang: Egy valamilyen szabály szerint felállított sorban elfoglalt hely.

Elméleti összefoglaló a Valószín ségszámítás kurzushoz

MINTAFELADATOK. 1. Az alábbi diagram egy kiskereskedelmi lánc boltjainak forgalomkoncentrációját szemlélteti:

Matematika A3 Valószínűségszámítás, 6. gyakorlat 2013/14. tavaszi félév

x, x R, x rögzített esetén esemény. : ( ) x Valószínűségi Változó: Feltételes valószínűség: Teljes valószínűség Tétele: Bayes Tétel:

Biostatisztika Összefoglalás

matematikai statisztika

1/8. Iskolai jelentés. 10.évfolyam matematika

STATISZTIKA. A Föld pályája a Nap körül. Philosophiae Naturalis Principia Mathematica (A természetfilozófia matematikai alapelvei, 1687)

Kísérlettervezés alapfogalmak

Biostatisztika VIII. Mátyus László. 19 October

Átírás:

Matematikai statisztika Survey statisztika mesterszak + földtudomány alapszak Backhausz Ágnes agnes@math.elte.hu Fogadóóra: szerda 10 11 és 13 14, D 3-415 2018/2019. tavaszi félév

Bevezetés A statisztika céljai mérési eredmények, meggyelések elemzése (leíró statisztika) ismeretlen paraméterek becslése (matematikai statisztika, becsléselmélet) hipotézisek ellen rzése vagy cáfolata (matematikai statisztika, hipotézisvizsgálat) véletlen folyamatok el rejelzése (regresszió, id sorelemzés) Alkalmazási területek társadalomtudományok: szociológia, pszichológia él és élettelen természettudományok, pl. geológia, meteorológia pénzügyi matematika, biztosítás, közgazdaságtan

A kurzus célja és ajánlott irodalom A kurzus célja a matematikai statisztika f bb módszereinek (például becsléselméleti, hipotézisvizsgálati módszerek) és azok matematikai hátterének bemutatása, az alkalmazási készség elsajátítása. BollaKrámli: Statisztikai következtetések elmélete. JohnsonBhattacharyya: Statistics. MóriSzeidlZempléni: Matematikai statisztika példatár. PröhleZempléni: Statistical problem solving in R. John C. Davis: Statistics and data analysis in geology. Wiley, 2009. E. H. Isaaks and R. M. Srivastava: Applied geostatistics. Oxford University Press, 1989. Gyakorló feladatok, tematika, diasor, jegyzet, képletgy jtemény: moodle.elte.hu Követelmények (ld. neptun tárgytematika): 100 pontos írásbeli vizsga, 30, 49, 68, 86 ponthatárokkal. Minden házi feladat 3 pont. Ezekkel legalább elégséges gyakorlati jegy esetén egy jegyet lehet javítani legfeljebb (a vizsga és a házi feladat pontok összeadódnak).

Statisztikai elemzés populáció: azon egyedek összessége, akikr l információt szeretnénk gy jteni például: budapesti lakosok, egy területen található k zetek a teljes populáció felmérése a gyakorlatban nehezen megvalósítható, véletlenszer en választott mintákkal dolgozunk

Statisztikai elemzés populáció: azon egyedek összessége, akikr l információt szeretnénk gy jteni például: budapesti lakosok, egy területen található k zetek a teljes populáció felmérése a gyakorlatban nehezen megvalósítható, véletlenszer en választott mintákkal dolgozunk minta: az összegy jtött adatok összessége például: ezer megkérdezett budapesti lakos adatai, ötven k zetminta adatai A statisztikai elemzés lépései tervezés: adatgy jtés, mérés megtervezése adatgy jtés, mérés kódolás: az adatok csoportokba sorolása, ha szükséges hibajavítás: olyan kiugró adatok korrekciója vagy elhagyása, amelyek feltehet en mérési hibából keletkeztek leíró statisztika: ellen rzés, f bb jellemz k meghatározása, ábrázolás matematikai statisztikai elemzés, következtetések levonása

Statisztikai adatok Adat: valamely sokaság jellemz jére vonatkozó mért vagy számított eredmény alapadatok: méréssel vagy leszámlálással közvetlenül kapott eredmény például: egy ember testmagassága, jövedelme, egy háztartásban él k száma származtatott adatok: az alapadatokból m veletek eredményeként kapjuk például: emberek testmagasságának átlaga, a jövedelmek mediánja, az egy háztartásban él k számának szórása

Statisztikai adatok Adat: valamely sokaság jellemz jére vonatkozó mért vagy számított eredmény alapadatok: méréssel vagy leszámlálással közvetlenül kapott eredmény például: egy ember testmagassága, jövedelme, egy háztartásban él k száma származtatott adatok: az alapadatokból m veletek eredményeként kapjuk például: emberek testmagasságának átlaga, a jövedelmek mediánja, az egy háztartásban él k számának szórása Az adatok pontossága általában korlátozott (mérési hiba, kerekítés, tévedés,. Ha ϑ a valós érték, és X a mérés eredménye: abszolút hiba: a valós érték és a mérés eredményének különbségének abszolút értéke: X ϑ. relatív hiba: az abszolút hiba és a mért érték hányadosa: X ϑ X. Példa: egy mérleg 60 dkg lisztet 57 dkg-nak mér. Az abszolút hiba dkg-ban 3, a relatív hiba 3/57 = 5, 3%.

Ismérvek, az adatok típusai Statisztikai ismérv: a populáció egyedeit jellemz tulajdonság. Lehetséges kimenetelei az ismérvváltozatok. Például: családi állapot (házas, özvegy stb.), k zet színe (sárga, szürke stb.), csapadékmennyiség egy-egy nap alatt (0, 1, 2,... mm).

Ismérvek, az adatok típusai Statisztikai ismérv: a populáció egyedeit jellemz tulajdonság. Lehetséges kimenetelei az ismérvváltozatok. Például: családi állapot (házas, özvegy stb.), k zet színe (sárga, szürke stb.), csapadékmennyiség egy-egy nap alatt (0, 1, 2,... mm). Az adatok típusai (skála) nominális: min ségi ismérv, csak az egyes ismérvváltozatok gyakoriságát tudjuk megszámolni (pl. nem, foglalkozás, nemzetiség) ordinális: egyértelm sorrendbe rendezhet változatokkal rendelkez ismérv (pl. jóközepesrossz); kvantiliseket lehet számolni intervallum: h mérséklet) az adatok különbsége egyértelm, de a hányadosuk nem (pl. arány: az ismérv egy valós számmal jellemezhet, melyek különbsége és hányadosa is egyértelm (pl. jövedelem, tömeg, szemcseméret, csapadékmennyiség)

Matematikai statisztika Példa matematikai statisztikai kérdésre Egy adott helyen húsz éven keresztül feljegyezték, hogy hányszor volt hurrikán. Ezek alapján várhatóan hány hurrikán lesz 2020-ban? Mennyi a becslésünk bizonytalansága? Mennyi a valószín sége, hogy ötnél több hurrikán lesz? Egy közvéleménykutatás során 1000 ember közül 63 választana egy adott pártot. Ez alapján állíthatjuk-e, hogy a párt támogatottsága szignikánsan magasabb 5%-nál? Mennyi a tévedésünk valószín sége? Megmérték 100 fér és 60 n testmagasságát. Állíthatjuk-e az adatok alapján, hogy a férak szignikánsan magasabbak a n knél? Mennyi a tévedésünk valószín sége? 100 ember közül 27 télen, 22 tavasszal, 34 nyáron, a többiek sszel születtek. Állíthatjuk-e az adatok alapján, hogy a születések eloszlása szignikánsan eltér az egyenletes eloszlástól (amikor minden évszaknak 1/4 a valószín sége)?

Matematikai statisztika A mintavétel eredményeként kapott adatok véletlenek: véletlenszer en választjuk a megkérdezetteket, mérési hibát követünk el stb. A kísérlet megismétlésénél más eredményeket kapnánk. Statisztikai minta: (X 1, X 2,..., X n ) valószín ségi változók (azaz: valószín ségi vektorváltozó). Mintaelemszám: n

Matematikai statisztika A mintavétel eredményeként kapott adatok véletlenek: véletlenszer en választjuk a megkérdezetteket, mérési hibát követünk el stb. A kísérlet megismétlésénél más eredményeket kapnánk. Statisztikai minta: (X 1, X 2,..., X n ) valószín ségi változók (azaz: valószín ségi vektorváltozó). Mintaelemszám: n A minta független, ha az (X 1, X 2,..., X n ) valószín ségi változók függetlenek (például a megkérdezetteket függetlenül választottuk, a mérések nem befolyásolják egymást), azaz P(X 1 t 1, X 2 t 2,..., X n t n ) = P(X 1 t 1 ) P(X 2 t 2 )... P(X n t n ) teljesül tetsz leges t 1, t 2,..., t n valós számok esetén.

Matematikai statisztika A mintavétel eredményeként kapott adatok véletlenek: véletlenszer en választjuk a megkérdezetteket, mérési hibát követünk el stb. A kísérlet megismétlésénél más eredményeket kapnánk. Statisztikai minta: (X 1, X 2,..., X n ) valószín ségi változók (azaz: valószín ségi vektorváltozó). Mintaelemszám: n A minta független, ha az (X 1, X 2,..., X n ) valószín ségi változók függetlenek (például a megkérdezetteket függetlenül választottuk, a mérések nem befolyásolják egymást), azaz P(X 1 t 1, X 2 t 2,..., X n t n ) = P(X 1 t 1 ) P(X 2 t 2 )... P(X n t n ) teljesül tetsz leges t 1, t 2,..., t n valós számok esetén. Az (X 1, X 2,..., X n ) valószín ségi változók eloszlása nem ismert. A cél ezeknek a valószín ségi változók eloszlásának a becslése, rá vonatkozó hipotézisek eldöntése a meggyelések, vagyis az adatok alapján.

Példa: statisztikai minta A Duna vízállása húsz napon keresztül (2016. január): 106 133 171 205 218 211 189 164 148 135 126 120 113 111 102 99 123 158 180 186

Példa: statisztikai minta A Duna vízállása húsz napon keresztül (2016. január): 106 133 171 205 218 211 189 164 148 135 126 120 113 111 102 99 123 158 180 186 X i valószín ségi változó: a vízállás az i. napon (i = 1, 2,..., 20). Vagyis ennél a meggyelésnél X 1 = 106, X 2 = 133,..., X 20 = 186. Független-e ez a minta?

Példa: statisztikai minta A Duna vízállása húsz napon keresztül (2016. január): 106 133 171 205 218 211 189 164 148 135 126 120 113 111 102 99 123 158 180 186 X i valószín ségi változó: a vízállás az i. napon (i = 1, 2,..., 20). Vagyis ennél a meggyelésnél X 1 = 106, X 2 = 133,..., X 20 = 186. Független-e ez a minta? Nem független, nagyobb vízállás után várhatóan másnap is magasabb lesz a Duna szintje.

Leíró statisztika Nem a véletlen hatásának megértése és valószín ségszámítási módszereken alapuló következtetések levonása a célja, hanem a meggyelt adatok megjelenítése, jellemz inek kiszámítása. Ide tartozhat: diagramok: kördiagram, oszlopdiagram, hisztogram táblázatok, kontingenciatáblák középértekek, szórások kiszámítása kvantilisek számítása, boxplot ábra indexek számítása

Indexek számítása Cél: egyetlen értéket rendelni egy olyan jellemz höz, ami több komponensb l áll össze, például: intelligencia, gazdasági állapot, t zsde a komponensek kiválasztása a komponensek együttes viselkedésének megértése (például a korreláció segítségével) a súlyok és szorzók meghatározása: a komponensek lehetséges értékei alapján annak meghatározása, hogy melyiket milyen szorzóval vegyük gyelembe, hogy végül is megfelel súllyal szerepelhessenek tesztelés: egy meglév adathalmazon annak kipróbálása, hogy az index alapján el rejelezhet k-e olyan jellemz k, amik az indexbe nincsenek beépítve

Példa: az adatok ábrázolása

Példa: hisztogram A Duna vízállásának hisztogramja

Példa: hisztogram Választunk egy intervallumot, mely magában foglalja a mérési adatokat. Az intervallumot egyenl nagyságú részekre osztjuk. Az egyes kis intervallumokba es mérési adatok számát ábrázoljuk. Sem a túl hosszú, sem a túl rövid intervallumok nem adnak informatív ábrát.

Példa: túl hosszú intervallumok, túl kevés osztály hist(viz, col="orange", xlab="vízállás (cm)", ylab="gyakoriság", main="duna", breaks=4)

Példa: túl rövid intervallumok, túl sok osztály hist(viz, col="orange", xlab="vízállás (cm)", ylab="gyakoriság", main="duna", breaks=15)

Alapstatisztikák Minta: X 1,..., X n (a példában X 1 = 106, X 2 = 133,..., X 20 = 186) minimum: a legkisebb mintaelem, azaz min(x 1, X 2,..., X n ). maximum: a legnagyobb mintaelem, azaz max(x 1, X 2,..., X n ). terjedelem (range): a legnagyobb és legkisebb mintaelem különbsége, azaz max(x 1, X 2,..., X n ) min(x 1, X 2,..., X n ). medián: a nagyság szerinti középs mintaelem, vagy a középs kett átlaga (ha n páros). módusz (mode): a leggyakrabban el forduló mintaelem.

Alapstatisztikák Minta: X 1, X 2,..., X n. mintaátlag (mean): X = 1 n n j=1 X j = X1+...+Xn n. tapasztalati szórásnégyzet: s 2 n = 1 n n (X j X ) 2 = 1 n j=1 n j=1 X 2 j X 2 = X 2 1 + X 2 2 +... + X 2 n n X 2. tapasztalati szórás: s n = s 2 n. korrigált tapasztalati szórásnégyzet (variance): s 2 n = n n 1 s2 n = 1 n 1 n (X j X ) 2 = n ( 1 n 1 n j=1 n j=1 X 2 j X 2 ). korrigált tapasztalati szórás (standard deviation, sd): s n = s 2 n.

További statisztikák korrigált tapasztalati szórásnégyzet (variance): s 2 n = n n 1 s2 n = 1 n 1 n (X j X ) 2 = n ( 1 n 1 n j=1 n j=1 X 2 j X 2 ). korrigált tapasztalati szórás (standard deviation, sd): s n = s 2 n. relatív szórás (relative standard deviation, rsd): s n X. standard hiba (standard error): s n n

Példa: alapstatisztikák 106 133 171 205 218 211 189 164 148 135 126 120 113 111 102 99 123 158 180 186 mintaelemszám: n = 20 minta: X 1 = 106, X 2 = 133,..., X 20 = 186. átlag: X = 149, 9 tapasztalati szórásnégyzet: s 2 n = 1412, 09 tapasztalati szórás: s n = 37, 58 korrigált tapasztalati szórásnégyzet: s 2 n = 1486, 411 korrigált tapasztalati szórás: s n = 38, 55 relatív szórás: 0, 257 standard hiba: 8, 62

Középértékek: medián Minta: (X 1, X 2,..., X n ), mintaelemszám: n. Deníció (medián) Ha n páratlan: a rendezett minta középs, (n+1)/2. elemét, azaz X (n+1)/2 -t a minta mediánjának nevezzük. Ha n páros: a rendezett minta n/2. és n/2 + 1. elemének átlagát, azaz a X n/2 + X n/2+1 mennyiséget a minta mediánjának nevezzük. 2 Megjegyzés: páros n esetén a teljes [ X n/2, X n/2+1] intervallumot (vagy annak bármely elemét) is a minta mediánjának lehet hívni. Példa: a Duna vízállásáról kapott húszelem minta mediánja: 1 2 (X 10 + X11) = 1 (135 + 148) = 141, 5. 2

Középértékek: az átlag és a medián összehasonlítása Normális eloszlás 500 elem független minta: X 1, X 2,..., X 500 függetlenek, eloszlásuk normális eloszlás m = 1 várható értékkel és σ = 1 szórással Min. 1st Qu. Median Mean 3rd Qu. Max. -1.9840 0.2847 0.9842 0.9863 1.6930 3.6110 Exponenciális eloszlás 500 elem független minta: Y 1, Y 2,..., Y 500 függetlenek, eloszlásuk exponenciális eloszlás b = 1 paraméterrel. E(Y k ) = 1 és D(Y k ) = 1 minden k = 1, 2,..., 500-ra. Min. 1st Qu. Median Mean 3rd Qu. Max. 0.001326 0.282700 0.637300 0.984900 1.349000 5.895000

A normális eloszlású minta hisztogramja

Az exponenciális eloszlású minta hisztogramja

Az átlag és a medián összehasonlítása Az átlag több információt használ érzékenyebb a kiugró adatokra, azaz egy hibás mérés is könnyen megváltoztathatja nem szimmetrikus esetben eltérhet a leggyakrabban meggyelt értékekt l A mediánt is érdemes használni, ha vannak kiugró (esetleg hibás) adatok; ha az eloszlás nem szimmetrikus, és az átlag és a medián jelent sen különbözik (mint a fenti példában az exponenciális eloszlás esetén).

Példa: hisztogram A Duna vízállásának hisztogramja (medián: 141,5)

Középértékek közelítése osztályközös gyakoriságokkal Tegyük fel, hogy az adatokat nem ismerjük pontosan, csak a hisztogramot, vagyis hogy az egyes osztályokba, intervallumokba hány meggyelés esik. Legyen x j a j. osztályközép (az alsó és fels határ átlaga), és f j a j. osztályba es meggyelések száma, továbbá n = f 1 +f 2 +...+f k az összes meggyelés száma. Ekkor az átlag közelítése: f 1 x 1 + f 2 x 2 +... + f k x k ; n

Középértékek közelítése osztályközös gyakoriságokkal Tegyük fel, hogy az adatokat nem ismerjük pontosan, csak a hisztogramot, vagyis hogy az egyes osztályokba, intervallumokba hány meggyelés esik. Legyen x j a j. osztályközép (az alsó és fels határ átlaga), és f j a j. osztályba es meggyelések száma, továbbá n = f 1 +f 2 +...+f k az összes meggyelés száma. Ekkor az átlag közelítése: f 1 x 1 + f 2 x 2 +... + f k x k ; n a medián közelítése: tme + n/2 F me 1 fme hme, ahol tme a mediánt tartalmazó osztály alsó határa, Fme 1 a mediánt tartalmazó osztályt megel z osztályok gyakoriságainak összege, fme a mediánt tartalmazó osztály gyakorisága, hme a mediánt tartalmazó osztály szélessége.

Házi feladat február 20., 9:00-ig Kérdezzünk meg legalább húsz feln tt ismer st az testmagasságukról; nemükr l; cip jük méretér l. Az adatokra az egész félév során szükség lesz a házi feladatoknál. Készítsünk egy ábrára boxplotot a testmagasságról úgy, hogy legyenek külön ábrázolva a férak és a n k adatai, illetve a teljes adatsor is. Készítsük el ugyanezt a cip mérettel is. Milyen következtetéseket vonhatunk le a kapott ábrákról?