Matematika B4 I. gyakorlat 2006. február 16. 1. Egy-dimeziós adatredszerek Va valamilye adatredszer (számsorozat), amelyről szereték kiszámoli bizoyos dolgokat. Az egyes értékeket jelöljük z i -vel, a számukat pedig -el. Nézzük egy kokrét példát: 1, 3, 2, 1, 4. A valószíűségszámításba és statisztikába legfotosabb meyiségek a következők: 1. Átlag: Az adatok átlaga: z = 1 i=1 z i. A példákba: z = 1 5 (1 + 3 + 2 + 1 + 4) = 2.2 2. Átlagos abszolút eltérés az átlagtól: 1 i=1 z i z A példákba: 1 5 ( 1 2.2 + 3 2.2 + 2 2.2 + 1 2.2 + 4 2.2 ) = 1.04 3. Mometumok: Az adatredszer k-adik mometuma: 1 i=1 z i k. Mide adatredszerre a ulladik mometum 1, az első mometum pedig megegyezik az átlaggal. A feti példába a második mometum 6.2, a harmadik mometum 20.2. 4. Valamely c potra voatkozó mometumok i=1 (z i c) k 1 5. Szóráségyzet: Az adatok átlagos égyzetes eltérése az átlagtól. σ 2 = 1 (zi z) 2 = ( 1 i=1 z i 2 ) z 2. A szóráségyzet em más, mit az átlagra voatkozó második mometum. A példákba: σ 2 = 1 5 (12 + 3 2 + 2 2 + 1 2 + 4 2 ) 2.2 2 = 1.36 6. Szórás: A szóráségyzet gyöke. σ = σ 2. Esetükbe σ = 1.36 = 1.17 7. Mediá: Redezzük agyság szerit sorba az adatokat. Ha páratla, akkor a mediá a középső elem, ha páros, akkor a két középső elem átlaga. A mediától agyobb és kisebb elemből is ugyaayi va. A feti példába a mediá a 2. 8. Relatív gyakoriság: a) Egy elem relatív gyakoriságát úgy kapjuk meg, hogy előfordulási számát elosztjuk az adatredszer összes elemeiek számával. Esetükbe az 1 relatív gyakorisága 2 5, a 2, 3, 4 relatív gyakorisága 1 5. b) Szokás az X-tegelyt itervallumokra is felosztai, ilyekor egy itervallum relatív gyakoriságát úgy kapjuk meg, hogy az itervallumba eső adatok számát osztjuk az összes adat számával. Például a [0, 0.25] itervallum relatív gyakorisága 3 5, a (2.5, 5] relatív gyakorisága 2 5. 1
9. Szemléltetés pálcikákkal A relatív gyakoriságok grafikoja, ahol az X-tegelye ábrázoljuk az előforduló értékeket, az Y -tegelye pedig a hozzájuk tartozó relatív gyakoriságáak megfelelő hosszúságú pálcikát. 1. ábra. 10. Hisztogram: Ha az X-tegelyt diszjukt itervallumokra botjuk, akkor az itervallumok fölé rajzolhatuk téglalapokat úgy, hogy területük az itervallum relatív gyakoriságával egyezze meg. 11. Eloszlásfüggvéy: x-él szigorúa kisebb elemek száma Tetszőleges x érték eseté az F (x) defiíciója: F (x) =. Az eloszlásfüggvéy grafikoja midig egy olya lépcsős függvéy, amely vízszites darabokból és ugrásokból áll. Ugrások ott leszek, ahol az adatok vaak, az ugrás agysága az adott relatív gyakorisággal egyelő. A feti példa eloszlásfüggvéye: 2. ábra. Vegyük 10 db egész számot 1 és 6 között. Ezek lehetek kitalált számok, idexbeli jegyek, de haszálhatuk dobókockát is ezek geerálásához. Ezek a számok alkotják az 1. adatredszert. A 2. adatredszer elemei legyeek az 1. adatredszer elemeiek kétszerese. A 3. adatredszer elemeit úgy kapjuk meg, hogy az 1. adatredszer elemeihez hozzáaduk 10-et. A 4. adatredszer elemeit úgy kapjuk meg, hogy az 1. adatredszer elemeit emeljük égyzetre. A 5. adatredszer elemeit úgy kapjuk meg, hogy az 1. adatredszer elemeiek vesszük a reciprokát. Például: 1. adatredszer 3 1 6 2 3 3 3 1 4 5 2. adatredszer 6 2 12 4 6 6 6 2 8 10 3. adatredszer 13 11 16 12 13 13 13 11 14 15 4. adatredszer 9 1 36 4 9 9 9 1 16 25 5. adatredszer 1/3 1 1/6 1/2 1/3 1/3 1/3 1 1/4 1/5 2. Feladatok 1. Számoljuk ki az így kapott adatsorok átlagát, szórását, második és harmadik mometumát. Mit állapíthatuk meg az átlagról és a szórásról? Hogya változak az egyes sorozatok eseté? Igazoljuk az észrevételeket általá- 2
os esetre! Szemléltessük az adatredszert a) "dróto"! b) "ablakpárkáyo"! 2. A feti sorozatok relatív gyakoriságait a) szemléltessük pálcikákkal b) rajzoljuk fel az eloszlásfüggvéyeket c) rajzoljuk fel a hisztogramjaikat d) határozzuk meg a mediát. 3. Bizoyítsuk be, hogy mide adatredszerbe az átlagtól való átlagos (előjeles) külöbség 0. 4. Mit jelet az, hogy ha a szórás 0? 5. Az alábbi két ábrá pálcikákkal ábrázoltuk a relatív gyakoriságot. Számoljuk ki a mediát és átlagot midkét esetbe! 3. ábra. 6. Készítsük olya adatsort, ahol a) a mediá megegyezik az átlaggal! b) a mediá agyobb az átlagtól! c) a mediá kisebb az átlagtól! 7. Lehet-e agyobb az átlagos abszolút eltérés a szórástól? És fordítva? 8. 1000 adatot gyűjtük össze. Az első 600 szám átlaga 9, a maradék 400 átlaga 5. Meyi a teljes adatredszer átlaga? 9. Vegyük a következő adatredszert: 5, 5, 10, 25, 35. a) Mi az a szám, amit mide elemhez hozzáadva 20 lesz az átlag? b) Meyivel kell megszorozi a számokat, hogy az új adatredszer szórása 6 legye? c) Cetralizáljuk az adatredszert, azaz toljuk el az elemeket úgy, hogy az új adatredszer átlaga 0 legye. d) Stadarizáljuk a feti számsorozatot, azaz miutá eltoltuk úgy, hogy 0 legye az átlag szorozzuk be az elemeket egy számmal, hogy az új adatreszer szórása 1 legye. 10. Adottak a következő számok: x 1 = 3, x 2 = 7, x 3 = 21. Keressük meg, hogy mely c-re lesz a 3 i=1 z i c kifejezés miimális! Mi a megoldás általáos esetbe? 11. Oldjuk meg az elő feladatot abszolút érték helyett égyzettel, azaz mely c érték mellett lesz a 3 i=1 (x 1 c) 2 miimális? Mi az általáos megoldás? 3
12. Geeráljuk 20 db véletle számot a zsebszámológép segítségével (az RND gomb haszálatával). Osszuk fel a) 2 egyelő részre az itervallumot. b) 4 egyelő részre az itervallumot. c) 10 egyelő részre az itervallumot. Ábrázoljuk az adatredszert dróto, ablakpárkáyo, számoljuk ki az eloszlásfüggvéyét. Ábrázoljuk a relatív gyakoriságokat pálcikákkal és hisztogrammal is. 13. Legye RND 1 és RND 2 két számológéppel geerált szám. A feti feladatot számoljuk végig úgy is, hogy mide egyes adatot RND1+RND2 2 utasítással defiiáluk. 14. Egy adatredszerbe csak két féle érték szerepel: 0 és 1. Tudjuk, hogy az átlag 0.3, adjuk meg a relatív gyakoriságokat! 3. Többdimeziós adatredszerek Kétdimeziós adatredszerek eseté külö számolhatuk átlagot és szórást koordiátákét, de felmerül, hogy mi a kapcsolat eze koordiáták között. u i -vel és v i -vel jelölöm az adatok koordiátáit, például u i az i. hallgató HáRe jegye, v i pedig a B4 jegye. HáRe 1 2 2 3 2 1 B4 2 4 5 4 1 2 4. ábra. 1. Kovariacia: c = 1 (u i u)(v i v) i=1 A feti példába a B4 és HáRe jegyek kovariaciája pozitív, 0.5. Ez ituitíve azt jeleti, hogy a agyobb jobb HáRe jegyhez "általába" jobb B4 jegy is párosul. 2. Korrelációs együttható: c r = σ U σ V Esetükbe a korrelációs együttható: 0.51, mivel a HáRe eseté a szórás 0.69, B4 eseté 1.41. 4
4. Feladatok Adott a következő táblázat: Név Hal Otmár K. Bea Lepi Pál Saaayi Magasság (U) 182 165 171 195 Súly (V) 87 62 95 117 15. Számoljuk ki a magasság és súly kovariaciáját és korrelációs együtthatóját. 16. Keressük meg azt a(z) a) origó átmeő b) kostas c) általáos v = l(u) egyeest, amelyre a i=1 (v i l(u i )) 2 érték miimális lesz! (Ezek az egyeesek leszek a égyzetes értelembe vett legjobb becslések U ismeretébe V-re, ha figyelembe vesszük a feltételeket.) 17. Oldjuk meg az előző feladatot úgy is, hogy U és V szerepét felcseréljük (azaz olya, mitha V ismeretébe szereték becsüli U-et)! 18. Készítsük 3 adatból álló adatredszert, amelybe a korrelációs együttható értéke: a) r = 0 b) r = 1 c) r = 1 d) r = 0.5 e) r = 0.5 f) r = 0.8 g) r = 0.8 19. Elleőrizzük az eddigi példáko, hogy c 2 σ U σ V és vele együtt r 1 egyelőtleség midig teljesül. Próbáljuk meg beláti, hogy c 2 σ U σ V midig feáll. Ötlet: A tétel Cauchy-Schwarz egyelőtleség felhaszálásával ( i=1 (a ib i ) 2 i=1 a i 2 i=1 b i 2 ) köyű, a Cauchy-Scwarz pedig egy kis számolás utá kijö a 0 (a i t b i ) 2 kibotásából és diszkrimiása vizsgálatából. 5