Kidolgozott feladatok a nemparaméteres statisztika témaköréből

Hasonló dokumentumok
Hipotézis vizsgálatok. Egy példa. Hipotézisek. A megfigyelt változó eloszlása Kérdés: Hatásos a lázcsillapító gyógyszer?

s n s x A m és az átlag Standard hiba A m becslése Információ tartalom Átlag Konfidencia intervallum Pont becslés Intervallum becslés

Variancia-analízis (ANOVA) Mekkora a tévedés esélye? A tévedés esélye Miért nem csinálunk kétmintás t-próbákat?

Statisztikai próbák. Ugyanazon problémára sokszor megvan mindkét eljárás.

20 PONT Aláírás:... A megoldások csak szöveges válaszokkal teljes értékőek!

Tanult nem paraméteres próbák, és hogy milyen probléma megoldására szolgálnak.

4 2 lapultsági együttható =

Táblázatok 4/5. C: t-próbát alkalmazunk és mivel a t-statisztika értéke 3, ezért mind a 10%-os, mind. elutasítjuk a nullhipotézist.

ORVOSI STATISZTIKA. Az orvosi statisztika helye. Egyéb példák. Példa: test hőmérséklet. Lehet kérdés? Statisztika. Élettan Anatómia Kémia. Kérdések!

Gyakorló feladatok a Kísérletek tervezése és értékelése c. tárgyból Lineáris regresszió, ismétlés nélküli mérések

VARIANCIAANALÍZIS (szóráselemzés, ANOVA)

Kísérlettervezési alapfogalmak:

Minősítéses mérőrendszerek képességvizsgálata

Kabos: Statisztika II. t-próba 9.1. Ha ismert a doboz szórása de nem ismerjük a

1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása

Műszaki folyamatok közgazdasági elemzése. Kevert stratégiák és evolúciós játékok

Az entrópia statisztikus értelmezése

Regresszió. Fő cél: jóslás Történhet:

8. Programozási tételek felsoroló típusokra

Békefi Zoltán. Közlekedési létesítmények élettartamra vonatkozó hatékonyság vizsgálati módszereinek fejlesztése. PhD Disszertáció

Nemparaméteres eljárások

y ij = µ + α i + e ij

Statisztika I. 10. előadás. Előadó: Dr. Ertsey Imre

Biomatematika 13. Varianciaanaĺızis (ANOVA)

METROLÓGIA ÉS HIBASZÁMíTÁS

Algoritmusok és adatszerkezetek gyakorlat 09 Rendezések

y ij = µ + α i + e ij STATISZTIKA Sir Ronald Aylmer Fisher Példa Elmélet A variancia-analízis alkalmazásának feltételei Lineáris modell

Az elektromos kölcsönhatás

ANOVA összefoglaló. Min múlik?

Balogh Edina Árapasztó tározók működésének kockázatalapú elemzése PhD értekezés Témavezető: Dr. Koncsos László egyetemi tanár

A bankközi jutalék (MIF) elő- és utóélete a bankkártyapiacon. A bankközi jutalék létező és nem létező versenyhatásai a Visa és a Mastercard ügyek

d(f(x), f(y)) q d(x, y), ahol 0 q < 1.

ALAKOS KÖRKÉS PONTOSSÁGI VIZSGÁLATA EXCEL ALAPÚ SZOFTVERREL OKTATÁSI SEGÉDLET. Összeállította: Dr. Szabó Sándor

KOMBINATORIKA ELŐADÁS osztatlan matematika tanár hallgatók számára. Szita formula

Kettőnél több csoport vizsgálata. Makara B. Gábor MTA Kísérleti Orvostudományi Kutatóintézet

Lineáris regresszió. Statisztika I., 4. alkalom

Varianciaanalízis. Egytényezős kísérletek (Más néven: egyutas osztályozás, egyszempontos varianciaanalízis ANOVA)

Kettőnél több csoport vizsgálata. Makara B. Gábor

NKFP6-BKOMSZ05. Célzott mérőhálózat létrehozása a globális klímaváltozás magyarországi hatásainak nagypontosságú nyomon követésére. II.

Méréselmélet: 5. előadás,

[Biomatematika 2] Orvosi biometria. Visegrády Balázs

Hipotézis vizsgálatok

Tiszta és kevert stratégiák

Statisztika I. 9. előadás. Előadó: Dr. Ertsey Imre

Elemi szelekciós elmélet

Kiválasztás. A változó szerint. Rangok. Nem-paraméteres eljárások. Rang: Egy valamilyen szabály szerint felállított sorban elfoglalt hely.

1. Halmazok, számhalmazok, alapműveletek

/11 Változtatások joga fenntartva. Kezelési útmutató. UltraGas kondenzációs gázkazán. Az energia megőrzése környezetünk védelme

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

ADATREDUKCIÓ I. Középértékek

Biomatematika 15. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

A Ga-Bi OLVADÉK TERMODINAMIKAI OPTIMALIZÁLÁSA

Fuzzy rendszerek. A fuzzy halmaz és a fuzzy logika

Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus.

A DÖNTÉSELMÉLET ALAPJAI

Biostatisztika e-book Dr. Dinya Elek

(eseményalgebra) (halmazalgebra) (kijelentéskalkulus)

II. Rákóczi Ferenc Kárpátaljai Magyar Fıiskola. Pataki Gábor. STATISZTIKA I. Jegyzet

Intelligens elosztott rendszerek

Példa: Egy üzletlánc boltjainak forgalmára vonatkozó adatok október hó: (adott a vastagon szedett!) S i g i z i g i z i

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1

Kiváltott agyi jelek informatikai feldolgozása Statisztika - Gyakorlat Kiss Gábor IB.157.

ELTE TáTK Közgazdaságtudományi Tanszék ÖKONOMETRIA. Készítette: Elek Péter, Bíró Anikó. Szakmai felelős: Elek Péter június

Dr. Ratkó István. Matematikai módszerek orvosi alkalmazásai Magyar Tudomány Napja. Gábor Dénes Főiskola

STATISZTIKA. A maradék független a kezelés és blokk hatástól. Maradékok leíró statisztikája. 4. A modell érvényességének ellenőrzése

Nemparaméteres módszerek. Krisztina Boda PhD SZTE ÁOK Orvosi Fizikai és Orvosi Informatikai Intézet

Számelmélet Megoldások

Adatelemzés és adatbányászat MSc

Normális eloszlás tesztje

Jövedelem és szubjektív jóllét: az elemzési módszer megválasztásának hatása a levonható következtetésekre

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok

STATISZTIKA III. Oktatási segédlet

Philosophiae Doctores. A sorozatban megjelent kötetek listája a kötet végén található

ADATREDUKCIÓ I. Középértékek

Hipotézisvizsgálat R-ben

Varianciaanalízis 4/24/12

A maximum likelihood becslésről

Elosztott rendszerek játékelméleti elemzése: tervezés és öszönzés. Toka László

Hipotézisvizsgálat az Excel adatelemző eljárásaival. Dr. Nyéki Lajos 2018

? közgazdasági statisztika

Statisztika I. 11. előadás. Előadó: Dr. Ertsey Imre

Teljes eseményrendszer. Valószínőségszámítás. Példák. Teljes valószínőség tétele. Példa. Bayes tétele

Példák ekvivalencia relációra (TÉTELként kell tudni ezeket zárthelyin, vizsgán):

biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás

Statisztikai következtetések Nemlineáris regresszió Feladatok Vége

Egy negyedrendű rekurzív sorozatcsaládról

nem kezelt 1.29, 1.60, 2.27, 1.31, 1.81, 2.21 kezelt 0.96, 1.14, 1.59

4/24/12. Regresszióanalízis. Legkisebb négyzetek elve. Regresszióanalízis

Műszaki folyamatok közgazdasági elemzése Előadásvázlat november 06. A közgazdaságtan játékelméleti megközelítései

Egyszempontos variancia analízis. Statisztika I., 5. alkalom

Matematikai statisztika

Adatsorok jellegadó értékei

Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

Várható érték:... p Módusz:...

A szórások vizsgálata. Az F-próba. A döntés. Az F-próba szabadsági fokai

Eloszlás-független módszerek (folytatás) 14. elıadás ( lecke) 27. lecke khí-négyzet eloszlású statisztikák esetszámtáblázatok

Bevezetés a biometriába Dr. Dinya Elek egyetemi tanár. PhD kurzus. KOKI,

1. Gauss-eloszlás, természetes szórás

Bevezetés a hipotézisvizsgálatokba

GVMST22GNC Statisztika II. Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet

Átírás:

Kdolgozott feladatok a nemparaméteres statsztka témaköréből A táékozódást mndenféle színkódok segítk. A feladatok eredet szövege zöld, a megoldások fekete, a fgyelmeztető, magyarázó elemek pros színűek. 1. Nyuszka az erdő szélén ú répatorta-gyárat szeretne üzembe helyezn. 3 különböző kváló receptet s smer, így kísérletesen kívána megállapítan, hogy melykkel legnagyobb a műszakonként termelékenysége. Mndhárom recepttel 3-3 napon át gyárta a tortákat, mnden nap 3-3 műszakban dolgoznak szorgos munkása, és felegyzk a műszakonként előállított torták számát. Egy nap csak egyféle recept szernt megy a gyártás, és a 3 műszak 3 smételt gyártás kísérletnek teknthető. Az alább ANOVA táblában Nyuszka kszámította az eltérés-négyzetösszegeket: hatás SS szabadság fok szórásnégyzet F recept 34,5 16,6 7,69 nap 16,67 6 1,11,86 error 13,67 18 7,37 a) Íruk föl a modellt, eldöntve, hogy mely faktor véletlen, melyk rögzített, és mlyen a terv szerkezete! Mlyen nullhpotézseket vzsgálhatunk tt? A faktorok (ahogy az ANOVA táblából s látszk) a recept és a nap, a műszakok smétlésnek számítanak (egy műszakhoz egy adat tartozk). Mvel egy nap csak egy receptet használ, így a nap a receptbe van ágyazva. El kell dönten, hogy a faktorok rögzített vagy véletlen természetűek. A nap véletlen faktor, mvel 1) beágyazott faktor, ) a nap (és a hozzá hasonló természet háttérre vonatkozó dőtípusú faktorok) mndg véletlen faktor. A recept rögzített faktor, mvel k akara választan a legobbat. yk A nap véletlen faktor, tehát: 0, A nullhpotézsek: ~ N 0 0 Az ANOVA táblából sethető volt, hogy a modell herarchkus, de csupán erre hvatkozn nem elegendő. Lehetett volna az s, hogy ez egy kereszt-osztályozás típusú modell, csak a kölcsönhatást bevonták az errorba. b) Íruk be a táblázatba a hányzó értékeket! Hogy döntünk az egyes nullhpotézsekről? A számokat fentebb lehet látn a táblázatban (feketével). A recept szabadság foka 3 1. A nap szabadság foka 3 3 1 6 Az error szabadság foka 3 33 1 18 Az összes faktor szabadság fokat ha összeaduk, eggyel kevesebbet kell kapnunk, mnt az összes kísérlet száma. Ezt célszerű mndg ellenőrzn. Itt az összes kísérlet száma 3 33 7 a számolt szabadság fokok összege 6, tehát lyen szempontból nyugodtak lehetünk. A szórásnégyzetet (MS) úgy kapuk, hogy az eltérés-négyzetösszeget (SS) elosztuk a szabadság fokkal. k

Az F próbastatsztkák számlálóában mndg annak a faktornak a szórásnégyzete szerepel, amre a próbastatsztka vonatkozk. Egy lyen herarchkus modellben a beágyazott faktorhoz tartozó próbastatsztka nevezőébe az error szórásnégyzet, a nem beágyazott faktorhoz tartozó próbastatsztka nevezőébe pedg a beágyazott faktor szórásnégyzete kerül. A 16,6 F 7,69 1,11 A 1,11 F,86 7,37 A recepthez tartozó próbastatsztka szabadság foka és 6, az 0, 05 -höz tartozó krtkus érték: 5,14, ennél nagyobb a próbastatsztka értéke, így az első nullhpotézst elutasítuk. A naphoz tartozó próbastatsztka szabadság foka 6 és 18, az 0, 05 -höz tartozó krtkus érték:,66, ennél nagyobb a próbastatsztka értéke, így a másodk nullhpotézst elutasítuk. ár nem volt feladat, adhatunk szakma választ s. Tehát szgnfkáns különbséget skerült kmutatn a receptek között, lletve a napok pluszngadozást okoznak a műszakokhoz képest. c) Ha Nyuszka kválaszta a legnagyobb termelékenységű receptet, mekkora ngadozásra számíthat a gyártás során? Nyuszka e nagyságú ngadozásra számíthat. Ezek értékét csak becsüln tuduk, hszen ezek a sokaság paramétere. A becslése az error szórásnégyzet: ˆ 7, 37. e e A becslését onnan kaphatuk meg, hogy EMS ( ) 3 e. Ez általában úgy néz k, hogy EMS ( ) p e, ahol p a cellánként smétlések száma, egy beágyazott faktor esetén. Mndezt általánosságban, bármlyen modellre a csllagosnégyszöges táblázatból kaphatuk meg. s sr 1,11 7,37 Innen ˆ 4, 58. 3 3 Így a teles ngadozás becslése: ˆ ˆ 4,58 7,37 11, 95 e. ergengócában egy ásatás során egy kőtáblát találnak, amn egy ANOVA tábla látható. Sanos a szöveg és a számok ava része nem olvasható (Ahol üres helyet láthatunk az alább táblázatban, ott olvashatatlan a szöveg). hatás SS szabadság fok szórásnégyzet F p A faktor 40 3 140 3,50 0,031 faktor 86 43 1,075 0,356 A kölcsönhat. 333 6 55,5 1,388 0,59 error 960 4 40 a) Ezek alapán el tuduk-e dönten, hogy a vzsgált faktorok véletlen vagy rögzített faktorok voltak-e? Mért? Azt kell megvzsgáln, hogy az A faktor próbastatsztkáát hogyan kapták meg. Ugyans a nevezőben csak akkor szerepelhet az error szórásnégyzet, ha mndkettő faktor rögzített. Ha a két faktor közül bármelyk (tehát akár az A, akár a, de lehet mndkettő s) véletlen faktor, akkor mndkettőhöz tartozó próbastatsztka nevezőébe a kölcsönhatás szórásnégyzete kell, hogy kerülön (tehát a rögzített faktoréba s!).

140,5 140 ; 3, 5, tehát mndkét faktor rögzített. 55,5 40 b) Íruk föl a modellt és a nullhpotézseket! Két faktor szernt keresztosztályozásról van szó. A nullhpotézsek: yk 0 0 Mndg anny nullhpotézsnek kell lenne, ahány statsztka próbát végzünk (azaz ahány F, lletve p-érték van az ANOVA-táblában). c) Határozzuk meg, hogy a hányzó helyeken mlyen értékek állhattak egykoron! Az error szabadság fokát az eltérés-négyzetösszeg (SS) és a szórásnégyzet (MS) 960 hányadosaként kapuk: 4 40 A kölcsönhatás szabadság fokát a két főhatás szabadság fokának szorzataként kapuk. Két SS hányzk, ezeket a megfelelő MS és szabadság fok szorzataként kapuk meg. A faktor szórásnégyzetét az SS és szabadság fok hányadosaként kapuk. Mnt azt már korábban megállapítottuk, mnden F-próbastatsztka nevezőében az error szórásnégyzet szerepel, így ezzel osztuk le a szórásnégyzeteket: 43 55,5 1,075 ; 1, 388 40 40 d) Ezek alapán állíthatuk-e, hogy az A faktornak nncs hatása? Az A faktorhoz tartozó p-érték 0,031 < 0,05, azaz a nullhpotézst elutasítuk, tehát ezek alapán az A faktornak van hatása, így nylván nem állíthatuk, hogy nncs. Ez a feladat véletlenül lett lyen duplán trükkös, eredetleg olyan faktort szerettem volna választan, ahol a nullhpotézst elfogaduk. Ilyen mad még lesz a másodk feladatsorban. 3. Az öreg krály közhírré tétette, annak ada a lánya kezét, ak olyan abrakot tud készíten varázslatos telvérének, amtől az gyorsabban fog futn, mnt bármely ló a vdéken. A leleményes krályf 5 féle abrakot készített, és ezek közül k akarta választan, hogy melykkel futnak a lovak a leggyorsabban. Ehhez kísérleteket végzett. Elment a hely ménesbe, és tt a lovakat az abrakokkal etette, és mérte, hogy mlyen gyorsan futnak. a) Mlyen modellt és nullhpotézst használt a krályf? Alapvetően egyetlen faktor van bztosan a modellben, mégpedg az abrak. Ha csak ezt a faktort vesszük be a modellbe, akkor ez egy egy faktor szernt ANOVA. y 0 A nullhpotézs: 0 A faktor rögzített, mert az abrakok közül a legobbat szerette volna kválasztan. Mvel nem volt telesen egyértelműsítve, hogy a krályf a kísérleteket hogyan végezte, így több másk modell s elképzelhető. k

Például ha egy abrakkal több lovat s etetett, de ezeknek több futását s megmérte, akkor például egy herarchkus modell írható fel, ahol az abrak faktorba van a lovak faktor beágyazva (ekkor ez véletlen faktor), és a futások adák az smétlést. Ha vszont a rendelkezésre álló lovakat mnd az 5 abrakkal kpróbálta, akkor ez a lovak és az abrakok között keresztosztályozás lesz. (Az abrakok még mndg rögzített faktor, a lovak pedg véletlen.) Természetesen bármlyen mesét és hozzá passzoló modellt+nullhpotézseket maxmáls pontszámmal fogadtam el. b) Mkor követ el másodfaú hbát? Mlyen következménye lehetnek, ha másodfaú hbát vét? Másodfaú hbát akkor követ el, ha elfogada a nullhpotézst, am vszont hams. Azaz elen helyzetben úgy talála, hogy az abrakok között nncs különbség, vszont valóában lenne közöttük egy legobb (vagy több obb, de mndenféleképp lenne reménytel abrak). Ematt valószínűleg nem próbálna benevezn a versenybe, pedg lehetséges, hogy nála lett volna a nyerő abrak. Azaz lehet, hogy lett volna esélye a králylány kezére, de nem s próbálkozott. A fordított válasz az elsőfaú hbához tartozk, és így természetesen nem ó válasz a kérdésre. Ez az lenne, hogy azt hsz, hogy megtalála a legobb abrakot, mközben az egy telesen hétköznap abrak. Ekkor benevez a versenyre, és nagy valószínűséggel elbuka azt, és így nem nyer el a králylány kezét. Ennek a következménye, hogy önmagában azt a következtetést, hogy nem nyer el a králylány kezét nem tudtam elfogadn, hszen az elsőfaú hba s ugyanerre a végkövetkeztetésre utna. (Mellesleg: A krályf a králylány kezére pályázk, de hbát követ el. Ebből mndenféle statsztka megfontolás nélkül s meg lehet seten, hogy nem foga elnyern a králylány kezét. Tehát ezt nem tudtam értékeln.) c) A krályf tudta előre, hogy a két legobban telesítő abrakot külön össze foga hasonlítan t-próbával. Tervezett vagy post-hoc összehasonlítást végez-e lyenkor? Tervezett összehasonlítást akkor végzünk, ha már az eredmények megszerzése előtt s tuduk, hogy melyk kettő csoportot foguk összehasonlítan. Azt nem tuduk az eredmények megszerzése előtt, hogy melyk az a két csoport (abrak), am a két legobb eredményt ada. Így ez post-hoc összehasonlítás. Sanos kmaradt a feladatból, hogy megkérdezzem, hogy mért az a ó válasz. Így sokan egyáltalán nem írtak ndoklást, amt vszont így maxmum ponttal kellett elfogadnom. Nem meglepő módon a másodk feladatsorban vsszatér ez a kérdés, és ott már nem követtem el ezt a hbát. 4. Okoska Törp tuda, hogy az ANOVA feltétele a hbák függetlensége, és ezt sokszor hangoztata s. Nem tuda vszont a tovább kérdésekre a választ. Segítsünk nek! a) Mtől kell a hbáknak függetlennek lennük? A hbáknak egymástól kell függetlennek lennük. (Csoporton belül és csoportok között s.) b) Hogyan vzsgáluk, hogy ez ténylegesen telesül-e? A rezduumokat a mérések sorrendében kell ábrázoln. Ha ebben bármlyen tendencát vélünk felfedezn, akkor abból arra következtethetünk, hogy nem telesül a függetlenség. Nem ó válasz az, ha valak csak annyt írt, hogy rezduumábrával, mert vannak más típusú rezduumábrák, amken ezt nem lehet vzsgáln.

c) Mt tehetünk, ha az adódk, hogy ez mégsem telesül? Sok mndent nem lehet tenn. Talán a legobb válasz az, hogy úra elvégezzük a méréseket úgy, hogy ügyelünk arra, hogy telesülön a függetlenség. Szntén elfogadható válasz az, hogy megpróbáluk kompenzáln a hatást, vagy a kértékelés során fgyelmeztetük magunkat, lletve a megbízónkat, hogy az eredmények nem feltétlenül megfelelőek, mert valószínűleg nem telesül a függetenség. Rossz válasz az, hogy randomzáluk az adatokat. Ennek nylvánvalóan semm értelme, ugyans a randomzálásnak a mérések elvégzése előtt van értelme. d) Mt és mkor tehetünk annak érdekében, hogy ez telesülön? Randomzáln kell a méréseket. (Azaz a méréseket véletlenszerű sorrendben kell elvégezn.) Az előbb mondatban már benne van, hogy mndezt a mérések elvégzése előtt lehet megtenn. Voltam annyra kedves, hogy ha valak a c) feladathoz leírta azt, hogy a méréseket véletlenszerű sorrendben kell elvégezn (azaz a mondatból egyértelműen kderül az, hogy a randomzálást a mérések előtt lehet megtenn), a d)-hez vszont nem írt semmt, akkor a c)-re természetesen nem adtam pontot, de a d) feladatra megadtam a pontot. 5. A ölcs agoly ANOVA vzsgálatot végzett, a rezduumokat a mért érték függvényében ábrázolta, így kapta az alább ábrát. 40 Raw Resduals 0 0-0 -40 50 150 50 350 Predcted Values a) Mlyen következtetést vonhatunk le ebből az ábrából? Ha a rezduumokat a becsült érték függvényében ábrázoluk, akkor mndg a hba varancáának konstans voltát vzsgáluk. Ezen az ábrán azt láthatuk, hogy a hba varancáa monoton változk a becsült értékkel, nagyobb becsült értékeknél ksebb a varanca. (Tehát nem konstans.) b) Mt tanácsolunk nek, hogyan folytassa tovább az elemzést? Ha a varanca úgy nem konstans, hogy a becsült értékkel (várható értékkel) monoton változk, akkor van remény arra, hogy ox-cox transzformácóval a varanca konstanssá tehető. Tehát a ölcs agolynak ox-cox transzformácót kellene végezne az adatara. Fontos, hogy általában ha nem konstans a hba varancáa, a ox-cox transzformácó nem bztos, hogy segít. Ehhez az kell, hogy a varanca a várható értékkel monoton változzon. (Mnt ahogy tt most van.) Természetesen erre a elenségre s lesz egy feladat, am felhíva a fgyelmet a másodk feladatsorban.

. feladatsor (ez volt a pótzh, a képen szereplő nyusz nagyon cuk, és benne volt a ZHban) 1. Egy vállalatnak nagy mennységű nyúlszőrre van szüksége, a nyulak szőrét pedg a növekedésük során ápoln kell. A vállalat 3 potencáls készítmény közül szeretné kválasztan, hogy melyk az, amvel a legobban nő a nyulak szőre. A 3 készítményhez ksorsolnak 4-4 nyulat, amelyek szőrét a növekedésük során végg az adott készítménnyel kezelk. A kísérletet fél éven keresztül folytatták, és mérték, hogy menny szőrt lehet az állatokról lenyírn. Az adatokat alább láthatuk szabványos nyúlszőr-egységekben. 1. készítmény. készítmény 3. készítmény 77 91 68 89 83 73 7 96 8 83 90 77 eltérés-négyzetösszeg (SS): 16,75 86,00 106,00 a) Mért fontos, hogy véletlenszerűen sorsolák k, hogy melyk nyulat melyk készítménnyel kezelk? Ez a kérdés a randomzálás fontosságára, célára kérdez rá. Azért fontos, hogy bztosítsuk az adatok függetlenségét. Ha nem randomzálunk, és például az 1. készítményhez olyan nyulakat választunk k, amknek a szőre alapvetően nagyobb hozammal növekszk, akkor nem foguk tudn megállapítan, hogy a nyulak szőre a kezelés hatására növekszk obban (azaz az a kezelés obb, mnt a több), vagy csak a nyulak obbak önmagukban. Másk oldalról megközelítve a dolgot, így csaln tudunk a kísérletekkel, és olyan készítményt s hatásosnak tudunk beállítan, am valóában nem s az. b) Íruk fel a modellt és a nullhpotézst! Ez egy egyszerű egyfaktoros ANOVA, a nyulak smétléseknek teknthetők. A kezelés faktor rögzített, hszen k akaruk választan közülük a legobbat. A nullhpotézs: y 0 c) Végezzük el az elemzést! Az ANOVA táblát kell felírn. hatás SS szabadság fok szórásnégyzet F készítmény 463,50 31,75 5,879 error 354,75 9 39,4 Az errorhoz tartozó SS-t a megadott csoportokon belül SS-ek összeadásával kapuk meg.

A csoportokon belül SS (ezt egyébként a megadott adatokból k lehetett volna számoln, csak a számítás megkönnyítése végett adtam meg): y y Az error SS: y y A hatás SS-ének számításához k kell számoln a csoportátlagokat és az összes adat átlagát: y 80,5 1 y 90, 00 y 75, 3 00 y 81, 75 A hatás SS-e: SS A 4y1 y 4y y 4y3 y 4,5 468,06 445,56 463, 50 A készítmény szabadság foka, mert 3 készítmény volt. Az error szabadság foka 3 4 1 9, mert 3 csoportban 4-4 nyulat kezeltek. Érdemes ellenőrzn a szabadság fokokat, az összes szabadság fok összegének 1-gyel kevesebbnek kell lenne, mnt ahány kísérletet végeztek (elenleg a nyulak száma). + 9 = 11, 1 nyúl volt, tehát ez így ó. A szórásnégyzeteket osztással kapuk, az F próbastatsztkát pedg az MS-ek hányadosaként. A próbastatsztka szabadság foka és 9, az 0, 05 -höz tartozó krtkus érték: 4,6, ennél nagyobb a próbastatsztka értéke (5,879), így a nullhpotézst elutasítuk. Így a készítményekkel elérhető várható nyúlszőr-hozamok különböznek. d) Végezzünk páronként összehasonlítást az 1. és. készítményre! Kétmntás t-próbát kell végezn úgy, hogy a nevezőbe az error MS négyzetgyökét kell írn. ( becslése). e t H 80,5 90,00 0 : 1 9,75 6,80,71 0,196 1 1 39,4 4 4 Arra kell fgyeln, hogy a gyök alá a nevezőbe mndg a csoportok elemszámát kell írn, akármből s számítuk a nevezőben lévő szórást. Mvel az error MS szabadság foka 9, így a használatos t-próba szabadság foka s 9. Az 0, 05 -höz tartozó kétoldal krtkus érték: ±,6. A kapott próbastatsztka értéke ezek között van, tehát a nullhpotézst elfogaduk. Tehát az adatok nem mondanak ellent annak, hogy az 1. és. készítménnyel kezelt nyulak esetén a várható szőrhozam megegyezk.

. Az adóhatóság 3 ksvállalkozás bevételet néz het bontásban egy vzsgálat során. Összesen 1 hetet vzsgáltak, 3 hónapon keresztül (annak ellenére, hogy a hetek átívelhetnek a hónapokon, tt az első 4 hetet tekntük az első hónapnak, a másodk 4-et a másodknak, a harmadk 4-et pedg a harmadknak). Azt kívánták megállapítan, hogy a 3 vállalkozás közül melyknek a legnagyobb a het várható bevétele. Az alább ANOVA táblában az eltérés-négyzetösszegek már megelentek: hatás SS szabadság fok szórásnégyzet F vállalkozás 168 84 3,5 hónap 348 174 7,5 vállalk.*hónap 96 4 4 error 34 7 1 a) Íruk fel a modellt és a nullhpotézseket! Két faktort vzsgálunk a feladatban, a hónapokat és a vállalkozásokat, a hetek smétléseknek teknthetők, hszen egy héthez egyetlen adat tartozk. A vállalkozás rögzített faktornak teknthető, hszen k akarták választan, hogy melyknek a legnagyobb a várható bevétele. A hónap dőellegű faktor, így véletlen faktor. A vállalkozás és a hónap keresztosztályozás típusú vszonyban vannak, mert mndegyk vállalkozás esetén ugyanazt a 3-3 hónapot vzsgáluk. yk A hónap véletlen faktor, tehát: 0, és 0, A nullhpotézsek: ~ N 0 0 A 0 k ~ A N b) Töltsük k a hányzó cellákat, és döntsünk a nullhpotézsekről! A vállalkozás szabadság foka, mert 3 vállalkozás volt. A hónap szabadság foka, mert 3 hónapot vzsgáltak. A kölcsönhatás szabadság foka 4. Az error szabadság foka 3 34 1 7, mert a 3 vállalkozás 3 hónapában 4-4 hét volt. Érdemes ellenőrzn a szabadság fokokat, az összes szabadság fok összegének 1-gyel kevesebbnek kell lenne, mnt ahány kísérletet végeztek. + + 4 + 7 = 35, 36 adatunk van, tehát ez így ó. A szórásnégyzetek osztással számolandók k. Mvel van véletlen faktor, így mndkét főhatásnál a próbastatsztka nevezőébe a kölcsönhatás szórásnégyzetét kell írn. A kölcsönhatáséba természetesen az errort. A F F A F 84 3,5 4 174 7,5 4 4 1

A vállalkozáshoz tartozó próbastatsztka szabadság foka és 4, az 0, 05 -höz tartozó krtkus érték: 6,94, ennél ksebb a próbastatsztka értéke, így az első nullhpotézst elfogaduk. A hónaphoz tartozó próbastatsztka szabadság foka és 4, az 0, 05 -höz tartozó krtkus érték: 6,94, ennél nagyobb a próbastatsztka értéke, így a másodk nullhpotézst elutasítuk. A kölcsönhatáshoz tartozó próbastatsztka szabadság foka 4 és 7, az 0, 05 -höz tartozó krtkus érték:,73, ennél ksebb a próbastatsztka értéke, így a harmadk nullhpotézst elfogaduk. ár nem volt feladat, adhatunk szakma választ s. Az adatok alapán nem skerült különbséget kmutatn a vállalatok het várható bevétele között, a hónapok pluszngadozást okoznak, a kölcsönhatásról pedg nem skerült kmutatn, hogy pluszngadozást okozna. c) A hatóság előre tudta, hogy végül a két legnagyobb átlagos bevételt hozó vállalkozást külön össze foga hasonlítan. Mlyen típusú összehasonlítás ez? Mért? Mvel előre nem lehet tudn, hogy melyk két vállalkozás lesz az, amelyknek a legnagyobb lesz az átlagos bevétele, így ez post-hoc összehasonlítás. Megegyzendő, hogy mvel nem skerült különbséget kmutatn, így nem túlságosan ésszerű páronként összehasonlítást végezn tt. 3. Az ANOVA feltétele a normáls eloszlás. Ez a megfogalmazás nem elég pontos. A következő ezzel kapcsolatos állításokról döntsük el, hogy gazak-e vagy hamsak-e! Mnden esetben ndokoluk a döntésünket! a) Az ANOVA elvégzése során feltételezzük, hogy az adatok egyazon normáls eloszlásból származnak. Hams. A hbákról feltételezzük a normáls eloszlást. Ha például egy rögzített faktornak hatása van, akkor ott a csoportok várható értéke különböző lesz, így az adatok márs nem egyazon normáls eloszlásból fognak származn. b) Ha a rezduumok normáls eloszlást követnek, akkor az adatok bztosan egyazon normáls eloszlásból származnak. Hams. Az ndok ugyanaz, mnt az előző kérdésnél. c) Nem tuduk elvégezn az ANOVA vzsgálatot, azaz a számítás nem kvtelezhető, ha a hbák nem normáls eloszlásúak. Hams. A számítás elvégzésénél egyszerűen az alapműveleteket végezzük el, semmlyen eloszlással kapcsolatos feltételezés nem befolyásola ezeknek az elvégezhetőségét. d) ANOVA vzsgálat során elképzelhető, hogy az adatok egyazon normáls eloszlásból származnak, vszont a hbák nem. Hams. Ahhoz, hogy az összes adat normáls eloszlásból származzon, az kell, hogy egyetlen rögzített faktornak se legyen hatása, és a véletlen faktorokra és a hbákra s telesülön, hogy normáls eloszlásból származnak. e) A normaltás vzsgálatakor a rezduumokat ún. Gauss-hálós elrendezésben ábrázoluk. Igaz. A normaltás vzsgálatakor a rezduumokat és nem a hbákat ábrázoluk, hszen azok értékét nem smerhetük. Ha valak ndoklás nélkül tppelt, akkor s kapott pontot. Ennek a következménye, hogy ha valak eltalálta, hogy gaz vagy hams az állítás, de rossz ndoklást írt, akkor s megkapta ezt a pontot. Mvel a d) és e) kérdésnél a válasz úgymond trváls, így tt egyrészt bármlyen nem értelmetlen ndoklást elfogadtam, másrészt tt a ó tpp - pontot ért, a másk 3 kérdésnél csak 1-1-et a 4-ből.

4. Egy földmntában szeretnék meghatározn a nehézfémtartalmat. A nyomozó hatóság 3 különböző laboratórumba s elküldte a földmnta 1-1 részét. Mndhárom laborban 4-4 párhuzamos mntaelőkészítést végeztek, mad mnden mntából - elemzést végeztek. a) Íruk föl a modellt és a nullhpotézseket! Két faktorunk van, a labor és a mntaelőkészítés. Mvel a laborokban külön-külön mntaelőkészítéseket végeztek, ezért a mntaelőkészítés sznte csak a laborokon belül értelmezhetők, azaz a mntaelőkészítés faktor a labor faktorba van ágyazva. A mntaelőkészítés véletlen faktor egyrészt mert beágyazott faktor, másrészt nylván nncs értelme azt kérdezn, hogy melyk mntaelőkészítés a legobb. A labor faktorra nem dönthető el telesen egyértelműen, hogy rögzített vagy véletlen. Véletlen faktornak teknthető akkor, ha a hatóság azért küldte el több laborba a mntát, mert több szakértő véleményét s k szerette volna kérn, hogy pontosabb eredményt kapon. Rögzített faktornak teknthető, ha azért küldték több helyre, mert a laborokat szerették volna összehasonlítan, mad ezek közül kválasztan azt, hogy a vzsgálatokat később melyk laborral fogák elvégeztetn. Ez a másodk gazából végtelenül erőltetett elképzelés, és mndenknek érezne kellene, hogy az első megoldás a ó, de ha valak ezt így megndokolta, akkor azt s elfogadtam. yk Ha a labor rögzített faktor, a nullhpotézs: Ha véletlen faktor, 0, 0 ~ N A, a nullhpotézs: A 0 ~ N 0, A mntaelőkészítés véletlen faktor, tehát: 0 k, a nullhpotézs: b) Aduk meg, hogyan számoluk k az egyes próbastatsztkákat! Mlyen szabadság fokú F-próbát végzünk tt? (Az F eloszlásnak szabadság foka van!) Szerencsére a kérdésre adott választ nem befolyásola, hogy a labor rögzített vagy véletlen faktor. A labor szabadság foka, mert 3 labor volt. A mntaelőkészítés szabadság foka 3 4 1 9, mert 3 laborban 4-4 mntaelőkészítést végeztek. Az error szabadság foka 3 4 1 1, mert az összesen 3 4 1 mntából - smételt mérést végeztek. A laborhoz tartozó próba számlálóában a laborhoz tartozó szórásnégyzet, a nevezőében a beágyazott faktor, azaz a mntaelőkészítés szórásnégyzete van. Az F-próba szabadság foka így és 9. labor MSlabor F ;9 MSmnta A mntaelőkészítéshez tartozó próba számlálóában a mntaelőkészítéshez tartozó szórásnégyzet, a nevezőében az error szórásnégyzet van. Az F-próba szabadság foka így 9 és 1. mnta MSmnta F 9;1 MS c) Az elemzés során azt találák, hogy a laborokra vonatkozó nullhpotézsre p = 0,131. Mondhatuk-e ez alapán, hogy a labornak nncs hatása? Mért? error

Ha p = 0,131, akkor a nullhpotézst elfogaduk. Ekkor nem állíthatuk azt, hogy a labornak nncs hatása, csupán azt, hogy az adott szgnfkancasznten nem tudtunk hatást kmutatn. Itt arra kell gondoln, hogy csak a nullhpotézs elutasítása bzonyító ereű. Itt az előző feladatsor d) kérdésével ellentétben skerült olyan p értéket megadnom, amre a nullhpotézst elfogaduk. Az alább ábrán a rezduumokat a becsült értékek függvényében, a laborok szernt csoportosítva ábrázoltuk. Resds 10 Predcted d) Mre következtethetünk ebből? Amkor a rezduumokat a becsült érték függvényében ábrázoluk, akkor mndg a hba varancááról tudunk következtetést levonn. Látható, hogy a. labor esetén sokkal obban szórnak a pontok a 0 körül, azaz ebben a laborban nagyobb a hba varancáa, mnt a másk kettőben. Azaz az ANOVA-nak az a feltétele, hogy a hbák varancáa konstans nem telesül. e 8 6 4 0 - -4-6 -8-10 36 37 38 39 40 41 4 43 labor: labor1 labor: labor labor: labor3 e) Mlyen lépéseket kellene tenn ennek tudatában? Látható, hogy nem az a helyzet, hogy a varanca a várható értékkel függ össze, hszen mndhárom labor ugyanolyan értéktartományban mért, tehát egyáltalán nem reménykedhetünk, hogy az adatok ox-cox transzformácóával a varanca konstanssá tehető. K kell hagyn az elemzésből a. labor eredményet, hszen sokkal kevésbé precízen (nagyobb smételhetőség varancával) tudák a nehézfémtartalmat mérn. Mellesleg egyáltalán nem rreáls ez a helyzet, hogy bzonyos laborok kevésbé precízen, mások meg precízebben tudnak mérn.