A. Matematikai Statisztika 2.MINTA ZH. 2003 december Név (olvasható) :... A feladatmegoldásnak az alkalmazott matematikai modell valószínűségszámítási ill. statisztikai szóhasználat szerinti megfogalmazását, a feltett kérdésre adott választ és ennek indokolását kell tartalmaznia. Az előadásban ill. jegyzetben szereplő dolgokat nem kell a dolgozatba belemásolni. Minden feladat megoldását arra a lapra kell írni, ahol a feladat szerepel. Piszkozat is beadható, de minden feladat külön lapon legyen. Értékelhetetlenek a név nélkül beadott lapok. A jelen lapon szereplő információk az egész dolgozatra vonatkoznak, a további lapokon szereplő adatok csak abban a feladatban érvényesek. Bergengócia négy tartományból áll, melyek elnevezése: A északnyugati tartomány B északkeleti tartomány C délnyugati tartomány D délkeleti tartomány Értelemszerűen használják még a következő megnevezéseket: A és B együtt: Észak-Bergengócia C és D együtt: Dél-Bergengócia, stb. A C B D Bergengóciában 10 millió felnőtt állampolgár él, 2 millió az A tartományban, 3 millió a B tartományban, 2 millió a C tartományban, 3 millió a D tartományban. A bergengóc lakosság szemszín szerinti megoszlása a négy tartományban azonos: a lakosság 30 százaléka kékszemű és 70 százaléka zöldszemű. A kékszemű bergengócok (cm-ben kifejezett) testmagassága normális eloszlású, várhatóértéke µ K =181, szórása σ K =ismeretlen. A zöldszemű bergengócok (cm-ben kifejezett) testmagassága normális eloszlású, várhatóértéke µ Z =190, szórása σ Z =ismeretlen. A Bergengóc Jövedelemkutató Intézet (BJKI) munkatársai az alábbi mintát vették: 110 elemű egyszerű véletlen minta az észak-bergengóc lakosságból, 90 elemű egyszerű véletlen minta a dél-bergengóc lakosságból, így kiválasztanak összesen 200 embert. Megkérdezik őket, mennyi a havi nettó jövedelmük (bergengóc tallérban). Minden megkérdezett egy számmal válaszolt (amit a továbbiakban t jelöl). A következő táblázat a csoportonkénti átlagokat és a csoportokon belüli négyzetösszegeket közli: mintanagyság csoportátlag csoporton belüli négyzetösszeg N A = 44 t A = 70 W A = (t n t A ) 2 = 4400 n A N B = 66 t B = 66 W B = (t n t B ) 2 = 7200 n B N C = 35 t C = 70 W C = (t n t C ) 2 = 5200 n C N D = 55 t D = 76 W D = (t n t D ) 2 = 8400 n D Értékelés: jeles: 50-80 pont jó: 40-49 pont megfelelő: 20-39 pont nem megfelelő: 0-19 pont
1. A BJKI adatai alapján adjon torzítatlan becslést a t változóra (t bergengóciai átlagértékére). Mit tud mondani a becslés szórásáról?
A kutatók Dél-Bergengócia jövedelmi viszonyait vizsgálják azon a 90 fős egyszerű véletlen mintán, amit a BJKI vett a felnőtt dél-bergengóc lakosságból (az első lapon olvasható táblázatról van szó, de csak a C és D sorokat kell nézni). A bergengóc kutatók egyszempontos variancia-analízis modell alapján vizsgálják azt hipotézist, hogy a t változó C tartománybeli átlaga megegyezik a t változó D tartománybeli átlagával, azaz H 0 : µ C = µ D és a D 2 = SSQ B + SSQ W ANOVA egyenlet tényezőit számolják ki a minta adatain, ahol D 2 : a t változó C és D tartományon vett mintabeli teljes négyzetösszege SSQ B : a C és a D csoportok közötti mintabeli négyzetösszeg SSQ W : a C és a D csoportokon belüli mintabeli négyzetösszeg 2.1. Melyek az egyszempontos variancia-analízis modell alkalmazási feltételei? Teljesülnek-e ezek a feltételek a jelen példában? (tudjuk, hogy teljesül - tudjuk, hogy nem teljesül - nem tudjuk, hogy teljesül - nem tudjuk, hogy teljesül, de tudjuk tesztelni ) 2.2. Adja meg az ANOVA egyenlet tényezőinek mintabeli értékét. 2.3. Mennyi t varianciája Dél-Bergengóciában? (adjon az adatok alapján torzítatlan becslést)
Ebben a feladatban σ K = σ Z = 10. Az alábbiakban a bergengóc felnőtt lakosság körében értelmezünk két változót: X : testmagasság (cm) C : szemszín, C = 3. Mennyi X és C korrelációja? 1, ha az illető kékszemű 2, ha az illető zöldszemű
4. Ebben a feladatban σ K = σ Z = 10. Az alábbiakban a bergengóc felnőtt lakosság körében értelmezünk három változót: X : magasság, X = 1, ha az illető nem magasabb, mint 180 cm 2, ha az illető magasabb, mint 180 cm Z : lakhely, Z = 1, ha az illető lakhelye A 2, ha az illető lakhelye B 3, ha az illető lakhelye C 4, ha az illető lakhelye D C : szemszín, C = 1, ha az illető kékszemű 2, ha az illető zöldszemű A bergengóc kutatók (akik nem ismerik a ZH első lapján közölt információkat) a felnőtt bergengóc lakosságra vett N = 1200 elemű egyszerű véletlen minta alapján az alábbi hipotézist vizsgálják: H: X és Z feltételesen függetlenek C mint feltételre nézve 4.1. a bergengóc kutatók a H hipotézist khi-négyzet próbával tesztelik, adja meg a khi-négyzet statisztika elfogadási tartományát 4.2. mi (akik tudjuk, hogy a ZH első lapján közölt információk igazak) el tudjuk-e statisztikai vizsgálat nélkül dönteni, hogy fennáll-e a H hipotézis?