Modern szeres nlitik szeináriu Mintvétel Glbács Gábor MINTAVÉTELLEL KAPCSOLATOS SZÁMÍTÁSI FELADATOK A vontkozó foglk és képletek áttekintése
MINTAVÉTELLEL KAPCSOLATOS SZÁMÍTÁSI FELADATOK A vontkozó foglk és képletek áttekintése MINTAVÉTELLEL KAPCSOLATOS SZÁMÍTÁSI FELADATOK A vontkozó foglk és képletek áttekintése Szórás (stndrd deviáció): (A vrinci szórás négyzete). s (x x) n 1 Abszolút és reltív szórás/hib egyránt behelyettesíthet képletekbe! i Konfidencisáv (hol µ vlódi érték): t s x n Drbos/szecsés intáknál z s és intennyiség (részecskeszá, n r ) összefüggése: n r 1 p p 1 s A hib és intszá (kivett párhuzos inták szá, n ) összefüggése: n t s e A vrinci teljes nlitiki folytr: s s (s ) s e Mérési hib teljes (kétlépéses) nlitiki folytr (hol t értékét z összes ért intszá lpján tekintjük!): e t s n s n n
MINTAVÉTELLEL KAPCSOLATOS SZÁMÍTÁSI FELADATOK A vontkozó foglk és képletek áttekintése A Student-féle eloszlássl kpcsoltos vizsgáltok vlójábn Willi Sely Gosset nevéhez fzdnek, ki Guiness sörfzde dublini központjábn dolgozott. A dolgozóknk Guiness egtiltott, hogy bárit is publikáljnk, nehogy üzleti titkok kerüljenek nyilvánosságr, eitt Gosset Student álnéven publikált 1908-bn legfbb sttisztiki eredényeit x t s n 1. FELADAT A érési hib inilizálás Egy bizonyos nlitiki ódszer intvételhez kpcsolódó vrinci 0.40%, íg z nlízishez gához trtozó vrinci 0.070%. Hsonlítsuk össze teljes ódszerre vontkozó reltív hib értékét következ két intvételezési strtégi esetén (95% egbízhtósági szinten); elyik z elnyösebb?.) öt intát gyjtünk be (n ) és ezekbl egyenként két párhuzos lborintát érünk eg (n ) b.) két intát gyjtünk be (n ) és ezekbl egyenként öt párhuzos lborintát érünk eg (n )
1. MEGOLDÁS A érési hib inilizálás s = 0.40% s = 0.070% e t s n s n n 95% egbízhtósági szinten elyik z elnyösebb strtégi reltív érési hib inilizálásár?.) n = 5 és n = (összesen tehát 10 int érend) e%.6 0.40% 0.070% 0.67% 5 5 b.) n = és n = 5 (összesen tehát 10 int érend) e%.6 0.40% 0.070% 1.0% 5 tehát fontosbb intvételezési hibát inilizálni!. FELADAT A teljes ódszer szórás és nnk inilizálás Egy Pb eghtározási ódszer z lábbi érési dtokt szolgálttt festékinták esetében: Mérés sorszá Válszoljuk eg következ kérdéseket:.) Mekkor teljes ódszer szórás? b.) Hogyn csökkenthet ódszer szórás?
. MEGOLDÁS A teljes ódszer szórásánk száítás Mérés sorszá s s s s x x i n 1 n=5(ostn és n ne függ össze, de éppen egyenlk!) s lborintákból, s stndrd intákból becsülhet. x x 5.58 11.616.) A ódszer teljes szórás: s xi x xi 5.58 xi 11.616 0.881 s 0. 158 n 1 4 4 vegyük észre, hogy stndrd inták töényebbek, tehát z bszolút szórások ne összeérhetk és kobinálhtók! Eitt csk reltív szórássl (RSD) tudjuk z eredényt kifejezni (úgy is legtöbbször csk ennek vn értele). RSD RSD RSD s x s x 0.160. MEGOLDÁS A teljes ódszer szórásánk inilizálás Mérés sorszá s s s s x x i n 1 n=5(ostn és n ne függ össze, de éppen egyenlk!) s lborintákból, s stndrd intákból becsülhet. x x 5.58 11.616 b.) A ódszer szórásánk inilizálás (i összefügg persze hibávl): s x x x 5.5858 i i xi 11.616 n 1 4 0.881 A intvételbl szárzó szórás (ne eglepen) ngyobb, tehát teljes ódszer szórását inták száánk növelésével lehet elérni. s 4 0.158
3. FELADAT A részecskék prítás inttöeg csökkentése érdekében Tegyük fel, hogy egy bizonyos nlitiki ódszer egvlósítás során x. 1% reltív intvételezési szórás eléréséhez in. 110 g szecsézett szilárd int feldolgozásár (intelkészítésére) lenne szükség, de ez túl sok z eszközeink száár. A részecskék jelenlegi átérje x. 50 µ. A egoldás részecskék éretének csökkentése rléssel. Mekkor átérre kell leglább lecsökkenteni göbszernek feltételezett részecskék éretét, hogy indössze 0.5 g intávl dolgozhssunk intelkészítés során? 3. MEGOLDÁS A részecskék prítás inttöeg csökkentése érdekében RSD =0.01 1 = 110 g ( kiindulási töeg) = 0.5 g ( céltöeg) d 1 = 50 µ A feldt úgy is egfoglzhtó, hogy ekkor szecseéretre vn szükség, hogy töegben leglább ugynnnyi drb részecske legyen rlés után, int 1 -ben volt.
3. MEGOLDÁS A részecskék prítás inttöeg csökkentése érdekében RSD =0.01 1 = 110 g ( kiindulási töeg) = 0.5 g ( céltöeg) d 1 = 50 µ A intennyiséget 1 / ránybn szeretnénk csökkenteni. Ez göbszer részecskék feltételezése esetén z átérre vontkozón d d 3 d d 3 1 3 3 1 0 3 d1 41.41 0 vgyis z új részecske átérnek 41 µ lá kell csökkennie. 4. FELADAT A begyjtend intennyiség száítás Tegyük fel, hogy intázndó nyghlz szecsékbl áll, elyekbl csk inden tízezredik trtlzz érend koponenst. Egy szecse töege átlgosn kb. 1 µg. Hány gr hoogenizált intát kell intvétel során begyjtenünk binoiális eloszlás szerint hhoz, hogy intvételbl szárzó reltív szórás csk % legyen?
4. MEGOLDÁS A begyjtend intennyiség száítás r =1µg RSD =0.0 p =10-4 Elször kiszáoljuk részecskeszáot... 1 p n p 1 RSD 1 10 4 10 4 1 (0.0).5 10 7 jd ebbl inttöeget:.5 10 7 10 6 g 5 g 5. FELADAT A intvételi frekvenci egválsztás Az lábbi dtsort egy ipri szennyvíz árlás ph-jánk rövid távú onitorozásávl kptuk. A grfikon lpján jvsoljunk egfelel intvételezési frekvenciát (gykoriságot) egy hosszútávú onitorozáshoz!
5. MEGOLDÁS A intvételi frekvenci egválsztás A rövid távú onitorozás dti lpján kb. 34 ór ltt két, ngyjából szietrikus periodikus változási ciklust ír le ért préter (ph), vgyis értékdó (durv, trendszer) változás periódusideje kb. 17 ór. A Nyquist(-Shnnon) teoré lényegében kiondj, hogy egy korlátozott sávszélesség folytonosn változó jelet tökéletesen rekonstruálni lehet, h jel intvételezése iniu f frekvenciávl történik, hol f z eredeti jelben elforduló legngyobb frekvenciájú koponens (sorfejtés). Ebbl jelen esetben iniális dtgyjtési frekvenciár tehát 1/8.5 ór -1 dódik (3.6 µhz). Láthtó ugynkkor, hogy kb. óránkénti periódusidej, finobb változások is jelen vnnk (vegyük figyelebe érés jelen esetben jó precizitását!), elyek rögzítéséhez kb. félóránként kellene érni. Ez közel tízszer nnyi dt rögzítését igényli, i hosszú távon túl sok lehet. 6. FELADAT Mintvételi terv készítése Arr kérték, hogy lkítson ki érési ódszert egy forgls belvárosi csoópontbn leveg ózonkoncentrációj és forglo közötti összefüggés vizsgált érdekében. Válszolj eg következ kérdéseket:.) Milyen intvételi strtégiát válszt? (véletlenszer, rendszeres, szervezett, illetve ezek kobinációi) b.) Kirgdott, összetett vgy in-situ intákt gyjtene? c.) Hogyn válszoln fenti kérdésekre, h feldt nnk egállpítás lenne, hogy npi ózonszint eghld-e egy dott küszöbértéket?
6. FELADAT Mintvételi strtégi kilkítás Az oldott oxigén koncentrációj terészetes vizekben (legyen ez egy tó) npi és éves ciklusú változékonyságot utt z elbbi npszkok és fotoszintézis összefüggése itt, z utóbbi szezonális hérséklet- ingdozások itt. 1.) készítsen intvételi strtégiát npi változások feltérképezésére.) készítsen intvételi strtégiát z éves változások feltérképezésére
Modern szeres nlitik szeináriu Néhány egyszer sttisztiki teszt Glbács Gábor KIUGRÓ ADATOK KISZRÉSE STATISZTIKAI TESZTEKKEL Dixon Q-tesztje Gykori feldt z nlitiki kéiábn, hogy kiugrónk tn érési dtokról kell eldöntenünk, hogy zokt elhgyjuk-e további száításokból. Erre vontkozón ne feledjük, hogy kisszáú érési dt esetén (ondjuk néhány tíznél kevesebb) seiképpen lehetünk benne biztosk, hogy ért dtok norális (Guss) eloszlásúk, ert nincs elegend inforációnk ennek eldöntésére. Ne feledjük, ebbl z is következik, hogy bbn se lehetünk biztosk, hogy z dtok átlg legjobb becslés helyes értékre! (ilyenkor edián száítás lehet legjobb egoldás). H zonbn biztosk vgyunk norális eloszlásbn, kkor többféle sttisztiki teszt közül válszthtunk kiugró pontok kiszrésére. Ezek közül kettt lklzunk ost: Dixon-féle Q-teszt Grubb-féle teszt
KIUGRÓ ADATOK KISZRÉSE STATISZTIKAI TESZTEKKEL Dixon Q-tesztje A Dixon-féle Q-teszt során Q köz terjedele ennyiséget kell kiszáolni és egy tábláztból vett Q krit értékkel összehsonlítni; h Q> Q krit, kkor gynús érték elhgyhtó. A képletben terjedele legkisebb és legngyobb ért érték közötti távolság, köz pedig gynús dtele és legközelebbi szoszédj közötti távolság. 1. FELADAT Kiugró dt kiszrése Q-teszttel Egy klcit int százlékos CO trtlár következ dtokt kptuk: 55.95%, 56.00%, 56.04%, 56.08%, 56.3% Az utolsó dt gynúsnk tnik. Kiugró értéknek száít-e 90%-os egbízhtósági szinten és így el kell-e hgynunk z dtok közül?
1. MEGOLDÁS Kiugró dt kiszrése Q-teszttel A egdott dtokr: 55.95%, 56.00%, 56.04%, 56.08%, 56.3% terjedele= 56.3% - 55.95% = 0.8% köz = 56.3% - 56.08% = 0.15% Q köz terjedele 0.15% 0.8% 0.54 ivel 90%-os egbízhtósági szinten 5 dtr Q krit = 0.64, inél Q értéke kisebb, ezért z dtot bent kell hgynunk z dtsorbn.. FELADAT Kiugró dt kiszrése Q-teszttel Fenol eghtározás HPLC ódszerrel következ dtokt szolgálttt: Az els dt gynúsnk tnik. Kiugró értéknek száít-e 90%-os egbízhtósági szinten és így el kell-e hgynunk z dtok közül?
. MEGOLDÁS Kiugró dt kiszrése Q-teszttel A egdott dtokr: Q köz terjedele 0.177 0.167 0.189 0.167 0.455 ivel 90%-os egbízhtósági szinten 10 dtr Q krit = 0.41, inél Q értéke ngyobb, ezért z dtot elhgyhtjuk z dtsorból. KIUGRÓ ADATOK KISZRÉSE STATISZTIKAI TESZTEKKEL Grubb-féle teszt A Grubb-féle teszt során feltesszük, hogy norális eloszlásúk z dtink és zt vizsgáljuk, hogy gynús dt elfordulásánk vlószínsége kisebb- e, int egbízhtósági szint. A következ egyszer képlet értékét száoljuk ki gynús dtr: 90% 9.5% 95% 97.5% 99% Z átlg x hol z átlgot z összes ért dtr száoljuk, s z epirikus szórás, x pedig gynús érési dt értéke. Ezek után Z értékét egy tábláztból vett Z krit értékkel kell összehsonlítni; h Z> Z krit, kkor gynús érték elhgyhtó. s
3. FELADAT Kiugró dt kiszrése Grubb-féle teszttel Egy urán izotóp töegspektroszkópiás eghtározás során következ nyolc intenzitás dt született: 199.31; 199.53; 00.19; 00.8; 01.9; 01.95; 0.18; 45.57 Az utolsó dt gynúsnk tnik. Kiugró értéknek száít-e 99%-os egbízhtósági szinten és így el kell-e hgynunk z dtok közül? 3. MEGOLDÁS Kiugró dt kiszrése Grubb-féle teszttel A egdott dtokból: 199.31; 199.53; 00.19; 00.8; 01.9; 01.95; 0.18; 45.57 átlg= 06.433 epirikus szórás (stndrd deviáció)= 15.85 Z átlg x s 06.433 45.57 15.85.468 A tábláztból, 8 dtr Z krit értéke 99%-os szinten.. Ebbl z következik, hogy igen, z dt elhgyhtó.
A MEDIÁN ALKALMAZÁSA KIUGRÓ ADATOK ESETÉN Kisszáú érési dt esetén H kisszáú érési dtunk vn, kkor ne lehetünk biztosk bbn, hogy z dtok norális eloszlást követik. Ekkor z átlgnál jobb becslés vlódi értékre edián egdás, ivel ez sokkl robusztusbb kiugró dtok kezelésében. A edián definíció szerint z z érték egy dthlzbn, elynél z dtoknk pontosn fele ngyobb és pontosn fele kisebb. H pártln tgú dtsorról vn szó, kkor ngyság szerint rendezett dtok közül középs értéke. H páros tgszáú z dtsor, kkor (egy lepuhított definíció szerint ) két középs érték átlgát tekintjük ediánnk. Péld: 4. FELADAT ÉS MEGOLDÁS A edián érték robusztusságánk szeléltetése Akövetkez érési dtsorunk vn: 10.1; 9.9; 9.7; 10.; 10.5; 3.0; 10.3; 10.0; 10.0 i ngyság szerint rendezve egfelel: 3.0; 9.7; 9.9; 10.0; 10.0; 10.1; 10.; 10.3; 10.5 z átlg: 9.3 szórás:.373 edián: 10.0 h elhgyjuk kiugró dtot (3.0), kkor: z átlg: 10.087 szórás: 0.47 edián: 10.05 Gondoljuk végig otthon zt is, hogyn lkulnk száok extré esetben, pl. ikor 10 érési dtból kilenc értéke 1,000, íg egynek z értéke 1,000,000!
MÉRÉSI ADATOK ÁTLAGÁNAK ÖSSZEVETÉSE A VALÓDI ÉRTÉKKEL Null hipotézis Egy ásik gykori, sttisztiki jelleg feldt z nlitiki kéiábn, hogy (pl. egy vlidálás, QC érés során) összevessük érési dtinkt helyes, vlódi értékkel. Ez utóbbit vlójábn csk éppen ilyenkor iserjük, ivel QC érések során egy referenci intát érünk eg, elyet i állítottunk el (vgy kereskedeli) és összetételét pontosn iserjük. Mivel érési dtok pontosn ngy vlószínséggel ne fognk egyezni vlódi értékkel, ezért sttisztiki próbánk kell lávetni z dtokt, hogy eldönthessük, tpsztlt eltérés érési dtok átlg és vlódi érték között ég belefér-e norális eloszlás szórásáb, vgy ne. Az utóbbi esetben rendszeres hibávl (negtív vgy pozitív) állunk szeben. Az ellenrzés z ún. null hipotézissel lehetséges. Feltevésünk z, hogy nincs rendszeres hib (egy dott egbízhtósági szinten). Ez kkor teljesül, h x t s n hol µ vlódi érték, s z epirikus szórás, t Student-féle érték, n pedig érési dtok szá. 5. FELADAT Null hipotézis lklzás Egy kéneghtározási eljárás tesztelése során 0.13% kéntrtlú referenci intár következ elezési eredényeket kptuk: 0.11%; 0.118%; 0.115%; 0.119% Állpítsuk eg, hogy vn-e rendszeres hib érési dtokbn, vgy nincs! A egállpítást tegyük eg 95% és 99% egbízhtósági szintre is!
5. MEGOLDÁS Null hipotézis lklzás µ= 0.13% n= 4 s= 0.003 átlg= 0.116% átlg - µ = 0.007007 95% vlószínségi szinten t 95% = 3.18 (ivel szbdsági fokok szá= 3), így: t s 3.18 0.003 0.0051 n 4 z (átlg - µ) > 0.0051, tehát null hipotézist el kell vetnünk. Vn rendszeres hib ezen vlószínségi szinten! 5. MEGOLDÁS Null hipotézis lklzás µ= 0.13% n= 4 s= 0.003 átlg= 0.116% átlg - µ = 0.007007 95% vlószínségi szinten t 95% = 3.18 (ivel szbdsági fokok szá= 3), így: t s 3.18 0.003 0.0051 n 4 z (átlg - µ) > 0.0051, tehát null hipotézist el kell vetnünk. Vn rendszeres hib ezen vlószínségi szinten! 99% vlószínségi szinten t 99% = 5.84, így ekkor t s 5.84 0.003 0.0093 n 4 z (átlg - µ) < 0.0093, tehát null hipotézis egállj helyét. Nincs rendszeres hib ezen vlószínségi szinten!