Kdolgozott feladatok a nemparaméteres statsztka témaköréből A táékozódást mndenféle színkódok segítk. A feladatok eredet szövege zöld, a megoldások fekete, a fgyelmeztető, magyarázó elemek pros színűek. 1. Nyuszka az erdő szélén ú répatorta-gyárat szeretne üzembe helyezn. 3 különböző kváló receptet s smer, így kísérletesen kívána megállapítan, hogy melykkel legnagyobb a műszakonként termelékenysége. Mndhárom recepttel 3-3 napon át gyárta a tortákat, mnden nap 3-3 műszakban dolgoznak szorgos munkása, és felegyzk a műszakonként előállított torták számát. Egy nap csak egyféle recept szernt megy a gyártás, és a 3 műszak 3 smételt gyártás kísérletnek teknthető. Az alább ANOVA táblában Nyuszka kszámította az eltérés-négyzetösszegeket: hatás SS szabadság fok szórásnégyzet F recept 34,5 16,6 7,69 nap 16,67 6 1,11,86 error 13,67 18 7,37 a) Íruk föl a modellt, eldöntve, hogy mely faktor véletlen, melyk rögzített, és mlyen a terv szerkezete! Mlyen nullhpotézseket vzsgálhatunk tt? A faktorok (ahogy az ANOVA táblából s látszk) a recept és a nap, a műszakok smétlésnek számítanak (egy műszakhoz egy adat tartozk). Mvel egy nap csak egy receptet használ, így a nap a receptbe van ágyazva. El kell dönten, hogy a faktorok rögzített vagy véletlen természetűek. A nap véletlen faktor, mvel 1) beágyazott faktor, ) a nap (és a hozzá hasonló természet háttérre vonatkozó dőtípusú faktorok) mndg véletlen faktor. A recept rögzített faktor, mvel k akara választan a legobbat. yk A nap véletlen faktor, tehát: 0, A nullhpotézsek: ~ N 0 0 Az ANOVA táblából sethető volt, hogy a modell herarchkus, de csupán erre hvatkozn nem elegendő. Lehetett volna az s, hogy ez egy kereszt-osztályozás típusú modell, csak a kölcsönhatást bevonták az errorba. b) Íruk be a táblázatba a hányzó értékeket! Hogy döntünk az egyes nullhpotézsekről? A számokat fentebb lehet látn a táblázatban (feketével). A recept szabadság foka 3 1. A nap szabadság foka 3 3 1 6 Az error szabadság foka 3 33 1 18 Az összes faktor szabadság fokat ha összeaduk, eggyel kevesebbet kell kapnunk, mnt az összes kísérlet száma. Ezt célszerű mndg ellenőrzn. Itt az összes kísérlet száma 3 33 7 a számolt szabadság fokok összege 6, tehát lyen szempontból nyugodtak lehetünk. A szórásnégyzetet (MS) úgy kapuk, hogy az eltérés-négyzetösszeget (SS) elosztuk a szabadság fokkal. k
Az F próbastatsztkák számlálóában mndg annak a faktornak a szórásnégyzete szerepel, amre a próbastatsztka vonatkozk. Egy lyen herarchkus modellben a beágyazott faktorhoz tartozó próbastatsztka nevezőébe az error szórásnégyzet, a nem beágyazott faktorhoz tartozó próbastatsztka nevezőébe pedg a beágyazott faktor szórásnégyzete kerül. A 16,6 F 7,69 1,11 A 1,11 F,86 7,37 A recepthez tartozó próbastatsztka szabadság foka és 6, az 0, 05 -höz tartozó krtkus érték: 5,14, ennél nagyobb a próbastatsztka értéke, így az első nullhpotézst elutasítuk. A naphoz tartozó próbastatsztka szabadság foka 6 és 18, az 0, 05 -höz tartozó krtkus érték:,66, ennél nagyobb a próbastatsztka értéke, így a másodk nullhpotézst elutasítuk. ár nem volt feladat, adhatunk szakma választ s. Tehát szgnfkáns különbséget skerült kmutatn a receptek között, lletve a napok pluszngadozást okoznak a műszakokhoz képest. c) Ha Nyuszka kválaszta a legnagyobb termelékenységű receptet, mekkora ngadozásra számíthat a gyártás során? Nyuszka e nagyságú ngadozásra számíthat. Ezek értékét csak becsüln tuduk, hszen ezek a sokaság paramétere. A becslése az error szórásnégyzet: ˆ 7, 37. e e A becslését onnan kaphatuk meg, hogy EMS ( ) 3 e. Ez általában úgy néz k, hogy EMS ( ) p e, ahol p a cellánként smétlések száma, egy beágyazott faktor esetén. Mndezt általánosságban, bármlyen modellre a csllagosnégyszöges táblázatból kaphatuk meg. s sr 1,11 7,37 Innen ˆ 4, 58. 3 3 Így a teles ngadozás becslése: ˆ ˆ 4,58 7,37 11, 95 e. ergengócában egy ásatás során egy kőtáblát találnak, amn egy ANOVA tábla látható. Sanos a szöveg és a számok ava része nem olvasható (Ahol üres helyet láthatunk az alább táblázatban, ott olvashatatlan a szöveg). hatás SS szabadság fok szórásnégyzet F p A faktor 40 3 140 3,50 0,031 faktor 86 43 1,075 0,356 A kölcsönhat. 333 6 55,5 1,388 0,59 error 960 4 40 a) Ezek alapán el tuduk-e dönten, hogy a vzsgált faktorok véletlen vagy rögzített faktorok voltak-e? Mért? Azt kell megvzsgáln, hogy az A faktor próbastatsztkáát hogyan kapták meg. Ugyans a nevezőben csak akkor szerepelhet az error szórásnégyzet, ha mndkettő faktor rögzített. Ha a két faktor közül bármelyk (tehát akár az A, akár a, de lehet mndkettő s) véletlen faktor, akkor mndkettőhöz tartozó próbastatsztka nevezőébe a kölcsönhatás szórásnégyzete kell, hogy kerülön (tehát a rögzített faktoréba s!).
140,5 140 ; 3, 5, tehát mndkét faktor rögzített. 55,5 40 b) Íruk föl a modellt és a nullhpotézseket! Két faktor szernt keresztosztályozásról van szó. A nullhpotézsek: yk 0 0 Mndg anny nullhpotézsnek kell lenne, ahány statsztka próbát végzünk (azaz ahány F, lletve p-érték van az ANOVA-táblában). c) Határozzuk meg, hogy a hányzó helyeken mlyen értékek állhattak egykoron! Az error szabadság fokát az eltérés-négyzetösszeg (SS) és a szórásnégyzet (MS) 960 hányadosaként kapuk: 4 40 A kölcsönhatás szabadság fokát a két főhatás szabadság fokának szorzataként kapuk. Két SS hányzk, ezeket a megfelelő MS és szabadság fok szorzataként kapuk meg. A faktor szórásnégyzetét az SS és szabadság fok hányadosaként kapuk. Mnt azt már korábban megállapítottuk, mnden F-próbastatsztka nevezőében az error szórásnégyzet szerepel, így ezzel osztuk le a szórásnégyzeteket: 43 55,5 1,075 ; 1, 388 40 40 d) Ezek alapán állíthatuk-e, hogy az A faktornak nncs hatása? Az A faktorhoz tartozó p-érték 0,031 < 0,05, azaz a nullhpotézst elutasítuk, tehát ezek alapán az A faktornak van hatása, így nylván nem állíthatuk, hogy nncs. Ez a feladat véletlenül lett lyen duplán trükkös, eredetleg olyan faktort szerettem volna választan, ahol a nullhpotézst elfogaduk. Ilyen mad még lesz a másodk feladatsorban. 3. Az öreg krály közhírré tétette, annak ada a lánya kezét, ak olyan abrakot tud készíten varázslatos telvérének, amtől az gyorsabban fog futn, mnt bármely ló a vdéken. A leleményes krályf 5 féle abrakot készített, és ezek közül k akarta választan, hogy melykkel futnak a lovak a leggyorsabban. Ehhez kísérleteket végzett. Elment a hely ménesbe, és tt a lovakat az abrakokkal etette, és mérte, hogy mlyen gyorsan futnak. a) Mlyen modellt és nullhpotézst használt a krályf? Alapvetően egyetlen faktor van bztosan a modellben, mégpedg az abrak. Ha csak ezt a faktort vesszük be a modellbe, akkor ez egy egy faktor szernt ANOVA. y 0 A nullhpotézs: 0 A faktor rögzített, mert az abrakok közül a legobbat szerette volna kválasztan. Mvel nem volt telesen egyértelműsítve, hogy a krályf a kísérleteket hogyan végezte, így több másk modell s elképzelhető. k
Például ha egy abrakkal több lovat s etetett, de ezeknek több futását s megmérte, akkor például egy herarchkus modell írható fel, ahol az abrak faktorba van a lovak faktor beágyazva (ekkor ez véletlen faktor), és a futások adák az smétlést. Ha vszont a rendelkezésre álló lovakat mnd az 5 abrakkal kpróbálta, akkor ez a lovak és az abrakok között keresztosztályozás lesz. (Az abrakok még mndg rögzített faktor, a lovak pedg véletlen.) Természetesen bármlyen mesét és hozzá passzoló modellt+nullhpotézseket maxmáls pontszámmal fogadtam el. b) Mkor követ el másodfaú hbát? Mlyen következménye lehetnek, ha másodfaú hbát vét? Másodfaú hbát akkor követ el, ha elfogada a nullhpotézst, am vszont hams. Azaz elen helyzetben úgy talála, hogy az abrakok között nncs különbség, vszont valóában lenne közöttük egy legobb (vagy több obb, de mndenféleképp lenne reménytel abrak). Ematt valószínűleg nem próbálna benevezn a versenybe, pedg lehetséges, hogy nála lett volna a nyerő abrak. Azaz lehet, hogy lett volna esélye a králylány kezére, de nem s próbálkozott. A fordított válasz az elsőfaú hbához tartozk, és így természetesen nem ó válasz a kérdésre. Ez az lenne, hogy azt hsz, hogy megtalála a legobb abrakot, mközben az egy telesen hétköznap abrak. Ekkor benevez a versenyre, és nagy valószínűséggel elbuka azt, és így nem nyer el a králylány kezét. Ennek a következménye, hogy önmagában azt a következtetést, hogy nem nyer el a králylány kezét nem tudtam elfogadn, hszen az elsőfaú hba s ugyanerre a végkövetkeztetésre utna. (Mellesleg: A krályf a králylány kezére pályázk, de hbát követ el. Ebből mndenféle statsztka megfontolás nélkül s meg lehet seten, hogy nem foga elnyern a králylány kezét. Tehát ezt nem tudtam értékeln.) c) A krályf tudta előre, hogy a két legobban telesítő abrakot külön össze foga hasonlítan t-próbával. Tervezett vagy post-hoc összehasonlítást végez-e lyenkor? Tervezett összehasonlítást akkor végzünk, ha már az eredmények megszerzése előtt s tuduk, hogy melyk kettő csoportot foguk összehasonlítan. Azt nem tuduk az eredmények megszerzése előtt, hogy melyk az a két csoport (abrak), am a két legobb eredményt ada. Így ez post-hoc összehasonlítás. Sanos kmaradt a feladatból, hogy megkérdezzem, hogy mért az a ó válasz. Így sokan egyáltalán nem írtak ndoklást, amt vszont így maxmum ponttal kellett elfogadnom. Nem meglepő módon a másodk feladatsorban vsszatér ez a kérdés, és ott már nem követtem el ezt a hbát. 4. Okoska Törp tuda, hogy az ANOVA feltétele a hbák függetlensége, és ezt sokszor hangoztata s. Nem tuda vszont a tovább kérdésekre a választ. Segítsünk nek! a) Mtől kell a hbáknak függetlennek lennük? A hbáknak egymástól kell függetlennek lennük. (Csoporton belül és csoportok között s.) b) Hogyan vzsgáluk, hogy ez ténylegesen telesül-e? A rezduumokat a mérések sorrendében kell ábrázoln. Ha ebben bármlyen tendencát vélünk felfedezn, akkor abból arra következtethetünk, hogy nem telesül a függetlenség. Nem ó válasz az, ha valak csak annyt írt, hogy rezduumábrával, mert vannak más típusú rezduumábrák, amken ezt nem lehet vzsgáln.
c) Mt tehetünk, ha az adódk, hogy ez mégsem telesül? Sok mndent nem lehet tenn. Talán a legobb válasz az, hogy úra elvégezzük a méréseket úgy, hogy ügyelünk arra, hogy telesülön a függetlenség. Szntén elfogadható válasz az, hogy megpróbáluk kompenzáln a hatást, vagy a kértékelés során fgyelmeztetük magunkat, lletve a megbízónkat, hogy az eredmények nem feltétlenül megfelelőek, mert valószínűleg nem telesül a függetenség. Rossz válasz az, hogy randomzáluk az adatokat. Ennek nylvánvalóan semm értelme, ugyans a randomzálásnak a mérések elvégzése előtt van értelme. d) Mt és mkor tehetünk annak érdekében, hogy ez telesülön? Randomzáln kell a méréseket. (Azaz a méréseket véletlenszerű sorrendben kell elvégezn.) Az előbb mondatban már benne van, hogy mndezt a mérések elvégzése előtt lehet megtenn. Voltam annyra kedves, hogy ha valak a c) feladathoz leírta azt, hogy a méréseket véletlenszerű sorrendben kell elvégezn (azaz a mondatból egyértelműen kderül az, hogy a randomzálást a mérések előtt lehet megtenn), a d)-hez vszont nem írt semmt, akkor a c)-re természetesen nem adtam pontot, de a d) feladatra megadtam a pontot. 5. A ölcs agoly ANOVA vzsgálatot végzett, a rezduumokat a mért érték függvényében ábrázolta, így kapta az alább ábrát. 40 Raw Resduals 0 0-0 -40 50 150 50 350 Predcted Values a) Mlyen következtetést vonhatunk le ebből az ábrából? Ha a rezduumokat a becsült érték függvényében ábrázoluk, akkor mndg a hba varancáának konstans voltát vzsgáluk. Ezen az ábrán azt láthatuk, hogy a hba varancáa monoton változk a becsült értékkel, nagyobb becsült értékeknél ksebb a varanca. (Tehát nem konstans.) b) Mt tanácsolunk nek, hogyan folytassa tovább az elemzést? Ha a varanca úgy nem konstans, hogy a becsült értékkel (várható értékkel) monoton változk, akkor van remény arra, hogy ox-cox transzformácóval a varanca konstanssá tehető. Tehát a ölcs agolynak ox-cox transzformácót kellene végezne az adatara. Fontos, hogy általában ha nem konstans a hba varancáa, a ox-cox transzformácó nem bztos, hogy segít. Ehhez az kell, hogy a varanca a várható értékkel monoton változzon. (Mnt ahogy tt most van.) Természetesen erre a elenségre s lesz egy feladat, am felhíva a fgyelmet a másodk feladatsorban.
. feladatsor (ez volt a pótzh, a képen szereplő nyusz nagyon cuk, és benne volt a ZHban) 1. Egy vállalatnak nagy mennységű nyúlszőrre van szüksége, a nyulak szőrét pedg a növekedésük során ápoln kell. A vállalat 3 potencáls készítmény közül szeretné kválasztan, hogy melyk az, amvel a legobban nő a nyulak szőre. A 3 készítményhez ksorsolnak 4-4 nyulat, amelyek szőrét a növekedésük során végg az adott készítménnyel kezelk. A kísérletet fél éven keresztül folytatták, és mérték, hogy menny szőrt lehet az állatokról lenyírn. Az adatokat alább láthatuk szabványos nyúlszőr-egységekben. 1. készítmény. készítmény 3. készítmény 77 91 68 89 83 73 7 96 8 83 90 77 eltérés-négyzetösszeg (SS): 16,75 86,00 106,00 a) Mért fontos, hogy véletlenszerűen sorsolák k, hogy melyk nyulat melyk készítménnyel kezelk? Ez a kérdés a randomzálás fontosságára, célára kérdez rá. Azért fontos, hogy bztosítsuk az adatok függetlenségét. Ha nem randomzálunk, és például az 1. készítményhez olyan nyulakat választunk k, amknek a szőre alapvetően nagyobb hozammal növekszk, akkor nem foguk tudn megállapítan, hogy a nyulak szőre a kezelés hatására növekszk obban (azaz az a kezelés obb, mnt a több), vagy csak a nyulak obbak önmagukban. Másk oldalról megközelítve a dolgot, így csaln tudunk a kísérletekkel, és olyan készítményt s hatásosnak tudunk beállítan, am valóában nem s az. b) Íruk fel a modellt és a nullhpotézst! Ez egy egyszerű egyfaktoros ANOVA, a nyulak smétléseknek teknthetők. A kezelés faktor rögzített, hszen k akaruk választan közülük a legobbat. A nullhpotézs: y 0 c) Végezzük el az elemzést! Az ANOVA táblát kell felírn. hatás SS szabadság fok szórásnégyzet F készítmény 463,50 31,75 5,879 error 354,75 9 39,4 Az errorhoz tartozó SS-t a megadott csoportokon belül SS-ek összeadásával kapuk meg.
A csoportokon belül SS (ezt egyébként a megadott adatokból k lehetett volna számoln, csak a számítás megkönnyítése végett adtam meg): y y Az error SS: y y A hatás SS-ének számításához k kell számoln a csoportátlagokat és az összes adat átlagát: y 80,5 1 y 90, 00 y 75, 3 00 y 81, 75 A hatás SS-e: SS A 4y1 y 4y y 4y3 y 4,5 468,06 445,56 463, 50 A készítmény szabadság foka, mert 3 készítmény volt. Az error szabadság foka 3 4 1 9, mert 3 csoportban 4-4 nyulat kezeltek. Érdemes ellenőrzn a szabadság fokokat, az összes szabadság fok összegének 1-gyel kevesebbnek kell lenne, mnt ahány kísérletet végeztek (elenleg a nyulak száma). + 9 = 11, 1 nyúl volt, tehát ez így ó. A szórásnégyzeteket osztással kapuk, az F próbastatsztkát pedg az MS-ek hányadosaként. A próbastatsztka szabadság foka és 9, az 0, 05 -höz tartozó krtkus érték: 4,6, ennél nagyobb a próbastatsztka értéke (5,879), így a nullhpotézst elutasítuk. Így a készítményekkel elérhető várható nyúlszőr-hozamok különböznek. d) Végezzünk páronként összehasonlítást az 1. és. készítményre! Kétmntás t-próbát kell végezn úgy, hogy a nevezőbe az error MS négyzetgyökét kell írn. ( becslése). e t H 80,5 90,00 0 : 1 9,75 6,80,71 0,196 1 1 39,4 4 4 Arra kell fgyeln, hogy a gyök alá a nevezőbe mndg a csoportok elemszámát kell írn, akármből s számítuk a nevezőben lévő szórást. Mvel az error MS szabadság foka 9, így a használatos t-próba szabadság foka s 9. Az 0, 05 -höz tartozó kétoldal krtkus érték: ±,6. A kapott próbastatsztka értéke ezek között van, tehát a nullhpotézst elfogaduk. Tehát az adatok nem mondanak ellent annak, hogy az 1. és. készítménnyel kezelt nyulak esetén a várható szőrhozam megegyezk.
. Az adóhatóság 3 ksvállalkozás bevételet néz het bontásban egy vzsgálat során. Összesen 1 hetet vzsgáltak, 3 hónapon keresztül (annak ellenére, hogy a hetek átívelhetnek a hónapokon, tt az első 4 hetet tekntük az első hónapnak, a másodk 4-et a másodknak, a harmadk 4-et pedg a harmadknak). Azt kívánták megállapítan, hogy a 3 vállalkozás közül melyknek a legnagyobb a het várható bevétele. Az alább ANOVA táblában az eltérés-négyzetösszegek már megelentek: hatás SS szabadság fok szórásnégyzet F vállalkozás 168 84 3,5 hónap 348 174 7,5 vállalk.*hónap 96 4 4 error 34 7 1 a) Íruk fel a modellt és a nullhpotézseket! Két faktort vzsgálunk a feladatban, a hónapokat és a vállalkozásokat, a hetek smétléseknek teknthetők, hszen egy héthez egyetlen adat tartozk. A vállalkozás rögzített faktornak teknthető, hszen k akarták választan, hogy melyknek a legnagyobb a várható bevétele. A hónap dőellegű faktor, így véletlen faktor. A vállalkozás és a hónap keresztosztályozás típusú vszonyban vannak, mert mndegyk vállalkozás esetén ugyanazt a 3-3 hónapot vzsgáluk. yk A hónap véletlen faktor, tehát: 0, és 0, A nullhpotézsek: ~ N 0 0 A 0 k ~ A N b) Töltsük k a hányzó cellákat, és döntsünk a nullhpotézsekről! A vállalkozás szabadság foka, mert 3 vállalkozás volt. A hónap szabadság foka, mert 3 hónapot vzsgáltak. A kölcsönhatás szabadság foka 4. Az error szabadság foka 3 34 1 7, mert a 3 vállalkozás 3 hónapában 4-4 hét volt. Érdemes ellenőrzn a szabadság fokokat, az összes szabadság fok összegének 1-gyel kevesebbnek kell lenne, mnt ahány kísérletet végeztek. + + 4 + 7 = 35, 36 adatunk van, tehát ez így ó. A szórásnégyzetek osztással számolandók k. Mvel van véletlen faktor, így mndkét főhatásnál a próbastatsztka nevezőébe a kölcsönhatás szórásnégyzetét kell írn. A kölcsönhatáséba természetesen az errort. A F F A F 84 3,5 4 174 7,5 4 4 1
A vállalkozáshoz tartozó próbastatsztka szabadság foka és 4, az 0, 05 -höz tartozó krtkus érték: 6,94, ennél ksebb a próbastatsztka értéke, így az első nullhpotézst elfogaduk. A hónaphoz tartozó próbastatsztka szabadság foka és 4, az 0, 05 -höz tartozó krtkus érték: 6,94, ennél nagyobb a próbastatsztka értéke, így a másodk nullhpotézst elutasítuk. A kölcsönhatáshoz tartozó próbastatsztka szabadság foka 4 és 7, az 0, 05 -höz tartozó krtkus érték:,73, ennél ksebb a próbastatsztka értéke, így a harmadk nullhpotézst elfogaduk. ár nem volt feladat, adhatunk szakma választ s. Az adatok alapán nem skerült különbséget kmutatn a vállalatok het várható bevétele között, a hónapok pluszngadozást okoznak, a kölcsönhatásról pedg nem skerült kmutatn, hogy pluszngadozást okozna. c) A hatóság előre tudta, hogy végül a két legnagyobb átlagos bevételt hozó vállalkozást külön össze foga hasonlítan. Mlyen típusú összehasonlítás ez? Mért? Mvel előre nem lehet tudn, hogy melyk két vállalkozás lesz az, amelyknek a legnagyobb lesz az átlagos bevétele, így ez post-hoc összehasonlítás. Megegyzendő, hogy mvel nem skerült különbséget kmutatn, így nem túlságosan ésszerű páronként összehasonlítást végezn tt. 3. Az ANOVA feltétele a normáls eloszlás. Ez a megfogalmazás nem elég pontos. A következő ezzel kapcsolatos állításokról döntsük el, hogy gazak-e vagy hamsak-e! Mnden esetben ndokoluk a döntésünket! a) Az ANOVA elvégzése során feltételezzük, hogy az adatok egyazon normáls eloszlásból származnak. Hams. A hbákról feltételezzük a normáls eloszlást. Ha például egy rögzített faktornak hatása van, akkor ott a csoportok várható értéke különböző lesz, így az adatok márs nem egyazon normáls eloszlásból fognak származn. b) Ha a rezduumok normáls eloszlást követnek, akkor az adatok bztosan egyazon normáls eloszlásból származnak. Hams. Az ndok ugyanaz, mnt az előző kérdésnél. c) Nem tuduk elvégezn az ANOVA vzsgálatot, azaz a számítás nem kvtelezhető, ha a hbák nem normáls eloszlásúak. Hams. A számítás elvégzésénél egyszerűen az alapműveleteket végezzük el, semmlyen eloszlással kapcsolatos feltételezés nem befolyásola ezeknek az elvégezhetőségét. d) ANOVA vzsgálat során elképzelhető, hogy az adatok egyazon normáls eloszlásból származnak, vszont a hbák nem. Hams. Ahhoz, hogy az összes adat normáls eloszlásból származzon, az kell, hogy egyetlen rögzített faktornak se legyen hatása, és a véletlen faktorokra és a hbákra s telesülön, hogy normáls eloszlásból származnak. e) A normaltás vzsgálatakor a rezduumokat ún. Gauss-hálós elrendezésben ábrázoluk. Igaz. A normaltás vzsgálatakor a rezduumokat és nem a hbákat ábrázoluk, hszen azok értékét nem smerhetük. Ha valak ndoklás nélkül tppelt, akkor s kapott pontot. Ennek a következménye, hogy ha valak eltalálta, hogy gaz vagy hams az állítás, de rossz ndoklást írt, akkor s megkapta ezt a pontot. Mvel a d) és e) kérdésnél a válasz úgymond trváls, így tt egyrészt bármlyen nem értelmetlen ndoklást elfogadtam, másrészt tt a ó tpp - pontot ért, a másk 3 kérdésnél csak 1-1-et a 4-ből.
4. Egy földmntában szeretnék meghatározn a nehézfémtartalmat. A nyomozó hatóság 3 különböző laboratórumba s elküldte a földmnta 1-1 részét. Mndhárom laborban 4-4 párhuzamos mntaelőkészítést végeztek, mad mnden mntából - elemzést végeztek. a) Íruk föl a modellt és a nullhpotézseket! Két faktorunk van, a labor és a mntaelőkészítés. Mvel a laborokban külön-külön mntaelőkészítéseket végeztek, ezért a mntaelőkészítés sznte csak a laborokon belül értelmezhetők, azaz a mntaelőkészítés faktor a labor faktorba van ágyazva. A mntaelőkészítés véletlen faktor egyrészt mert beágyazott faktor, másrészt nylván nncs értelme azt kérdezn, hogy melyk mntaelőkészítés a legobb. A labor faktorra nem dönthető el telesen egyértelműen, hogy rögzített vagy véletlen. Véletlen faktornak teknthető akkor, ha a hatóság azért küldte el több laborba a mntát, mert több szakértő véleményét s k szerette volna kérn, hogy pontosabb eredményt kapon. Rögzített faktornak teknthető, ha azért küldték több helyre, mert a laborokat szerették volna összehasonlítan, mad ezek közül kválasztan azt, hogy a vzsgálatokat később melyk laborral fogák elvégeztetn. Ez a másodk gazából végtelenül erőltetett elképzelés, és mndenknek érezne kellene, hogy az első megoldás a ó, de ha valak ezt így megndokolta, akkor azt s elfogadtam. yk Ha a labor rögzített faktor, a nullhpotézs: Ha véletlen faktor, 0, 0 ~ N A, a nullhpotézs: A 0 ~ N 0, A mntaelőkészítés véletlen faktor, tehát: 0 k, a nullhpotézs: b) Aduk meg, hogyan számoluk k az egyes próbastatsztkákat! Mlyen szabadság fokú F-próbát végzünk tt? (Az F eloszlásnak szabadság foka van!) Szerencsére a kérdésre adott választ nem befolyásola, hogy a labor rögzített vagy véletlen faktor. A labor szabadság foka, mert 3 labor volt. A mntaelőkészítés szabadság foka 3 4 1 9, mert 3 laborban 4-4 mntaelőkészítést végeztek. Az error szabadság foka 3 4 1 1, mert az összesen 3 4 1 mntából - smételt mérést végeztek. A laborhoz tartozó próba számlálóában a laborhoz tartozó szórásnégyzet, a nevezőében a beágyazott faktor, azaz a mntaelőkészítés szórásnégyzete van. Az F-próba szabadság foka így és 9. labor MSlabor F ;9 MSmnta A mntaelőkészítéshez tartozó próba számlálóában a mntaelőkészítéshez tartozó szórásnégyzet, a nevezőében az error szórásnégyzet van. Az F-próba szabadság foka így 9 és 1. mnta MSmnta F 9;1 MS c) Az elemzés során azt találák, hogy a laborokra vonatkozó nullhpotézsre p = 0,131. Mondhatuk-e ez alapán, hogy a labornak nncs hatása? Mért? error
Ha p = 0,131, akkor a nullhpotézst elfogaduk. Ekkor nem állíthatuk azt, hogy a labornak nncs hatása, csupán azt, hogy az adott szgnfkancasznten nem tudtunk hatást kmutatn. Itt arra kell gondoln, hogy csak a nullhpotézs elutasítása bzonyító ereű. Itt az előző feladatsor d) kérdésével ellentétben skerült olyan p értéket megadnom, amre a nullhpotézst elfogaduk. Az alább ábrán a rezduumokat a becsült értékek függvényében, a laborok szernt csoportosítva ábrázoltuk. Resds 10 Predcted d) Mre következtethetünk ebből? Amkor a rezduumokat a becsült érték függvényében ábrázoluk, akkor mndg a hba varancááról tudunk következtetést levonn. Látható, hogy a. labor esetén sokkal obban szórnak a pontok a 0 körül, azaz ebben a laborban nagyobb a hba varancáa, mnt a másk kettőben. Azaz az ANOVA-nak az a feltétele, hogy a hbák varancáa konstans nem telesül. e 8 6 4 0 - -4-6 -8-10 36 37 38 39 40 41 4 43 labor: labor1 labor: labor labor: labor3 e) Mlyen lépéseket kellene tenn ennek tudatában? Látható, hogy nem az a helyzet, hogy a varanca a várható értékkel függ össze, hszen mndhárom labor ugyanolyan értéktartományban mért, tehát egyáltalán nem reménykedhetünk, hogy az adatok ox-cox transzformácóával a varanca konstanssá tehető. K kell hagyn az elemzésből a. labor eredményet, hszen sokkal kevésbé precízen (nagyobb smételhetőség varancával) tudák a nehézfémtartalmat mérn. Mellesleg egyáltalán nem rreáls ez a helyzet, hogy bzonyos laborok kevésbé precízen, mások meg precízebben tudnak mérn.