Kutatástervezés és értékelés az egy szempontos ANOVA használata
Illusztráció a négyzetes összeg felbontásához Adat Átlag Nagy átlag = véletlen komponens csoportosítási komponens rögzített érték
x M ij A i Az ANOVA modellje e ij az adat összetevői i=(nagy átlag)+(kezelési átlag)+szórás(reziduális, véletlen tényező) az A i kezelések esetében Emlékezzünk az oszlopgrafikonra, ahol i - 1, 2 A 1, A 2, - az oszlop átlag e ij - az adat eltérése az A i től A i lehet rögzített érték, a kezelés adott nagyságú hatása A i lehet véletlentől függő valószínűségi változó maga is
Kitérő: A nyílt hozzáférés (Open Access) Közpénzből dolgozik a tudományos kutatás Eredményei közkinccsé kell váljanak A közlemények hozzáférhetősége Medline és társai Pubmed Central és társai Az adatok hozzáférhetősége Reprodukálhatóság Ellenőrizhetőség Tovább elemzés lehetőségei
Kitérő: a kutatás reprodukálhatósága A kutatás minősége Fontos a kérdés Választ ad a kérdésre A válasz általánosítható (valamilyen körre) A kutatási eredmény ismételten megkapható azaz az eredmény reprodukálható Statisztikai elemzés Milyen valószínűséggel találtunk eltérést a null hipotézistől
Pszichológia Két kiugró tanulmány a reprodukálhatóságról Open Science Collaboration 100 tanulmány 2008-ban jelentős lapban A korábbi eredmények harmada-fele volt reprodukálható Kísérleti rákkutatás Amgen cég kutatói - 10 év jelentős új eredményeit közlő cikkei Reprudukálható volt 11%
Jellegzetes jelenségek Már majdnem kész a cikkünk, csak a statisztika hiányzik. Segítség! Átgondolatlan vagy nem létező előzetes kérdések = lehet, hogy nincs érvényes következtetés A tervezésben sorrend fontos, mindent a maga helyén kell csinálni A statisztikai meggondolások a tervezési szakasz során, annak közepén kerüljenek sorra.
A kutatás teljes folyamatának áttekintése Tervezési szakasz Adatgyűjtési szakasz Értékelési szakasz exploráló adatelemzés statisztikai elemzés Jegyzőkönyvezés, dokumentálás Közlés
Ezen előadás legfontosabb mondanivalói A kutatás legfontosabb lépése a tervezés A tervezés és az értékelés szorosan összefüggenek Az eredmények értékelésében kell a statisztikai szemlélet Néhány statisztikai módszert magunk is elvégezhetünk Érdemes statisztikai szakértőtől tanácsot kérni A statisztikai tervezés és értékelés: szolgáltatásként is rendelkezésre kell álljon
A társadalom érdeke, hogy a kutató objektiv legyen A kutatás objektivitását egyre több jogszabály, előírás próbálja biztosítani. Ez különösen fontos a gyógyszerek, készülékek, eljárások kipróbálásakor Ez ugyanolyan fontos az elméleti hipotézisek vizsgálatánál Good Laboratory Practice Good Clinical Practice Etikai kódex(ek)
A feltáró kutatás (elővizsgálatok) Van feltételezésünk, de keveset tudunk: A kísérletben alkalmazott módszerekről A módszer hibájáról A várható szóródásról Kísérleti beavatkozásainktól várható változások (?) irányáról és méretéről A kísérletezés költségeiről, komplikációkról
Bizonyító kutatás Ennek tervezéséhez van határozott ismeretünk (előkísérletből, adatbányászatból) a célról a populációról a változókról a várható szóródásról a kiértékelés módszeréről a várható, vagy megismerni kívánt mértékű (nagyságú) eredményről (szükséges a vizsgálat erejének számításához)
Az adatok integritása Minden adat rögzítendő Minden nem tervezett tulajdonság jegyzőkönyvezendő Hibás adat azonosítása, kezelése, eltávolítása hogyan történhet? Outlier adat sorsa (nincs ismert hibája, csak az értéke kilóg ) A rögzített adatok ellenőrizendők számitás előtt és után (gyakori hibaforrás?)
A szoftver, a számítások integritása Jó és hiteles szoftvert használjunk A célnak pontosan megfelelő számítást végezzünk Az elemzett adatok köre rögzítendő A rögzített adatok ellenőrizendők számítás előtt és után Az elemzés menete, eredménye ellenőrizendő, fileba vagy papírra nyomtatandó Statisztikai jegyzőkönyvezés (is) kell (GLP) Példa:
A szisztémás hibák elleni védekezés (minimalizálásuk) eszköze a randomizálás Segít biztosítani a módszer kinduló feltételeinek teljesülését (véletlen minta) Sokféleképen lehet randomizálni egyszerűen blokkokban rétegezetten A vak és a kettős vak módszer véd a szubjektív hibák ellen (blind, double blind: vak vagy redőny,? Lásd Chamberlin cikkét Néha a vak kisérletezés nem könnyű
Kísérleti elrendezések egyes típusai (a megvalósítás terve) Random elrendezés (véletlenszerűen kiválasztott k csoport) Randomizált blokk elrendezés, (ahol kísérlet-technikai csoportosítás is történik) Független alanyok, kísérleti egységek önkontroll, egy alanyon több mérés vegyes: egyes tényezők független alanyon, más tényezők önkontrollos elrendezésben Faktoriális elrendezés (ahol sok szempont, faktor szerinti elrendezést vizsgálunk) Latin négyzet elrendezés (ahol kevés alanyon kell sok szempont szerint vizsgálni)
Lebonyolítás Legyen-e közbülső elemzés, vagy fix méret, végső elemzéssel Kizárási feltételek (egyes adat, alany kiesése ) Meddig folytassuk? Cut your losses? Döntésig Előre tervezett időpontig, vagy mennyiségig?
Jegyzőkönyvezés (statisztikai...) Az adatok részletes vizsgálatának alapja Outliers és a jegyzőkönyv Outliers és statisztikai kritériumok Outliers és a report, cikk irása Kizárási feltételeket előre kell(ene) megadni A hiányzó értékek esete ( pótlás, dummy)
Javasolt munkarend Előzetes kísérletek, tájékozódás. A kísérleti hipotézis megfogalmazása A statisztikai hipotézis megfogalmazása A feltételek megvizsgálása Adat elemzés, átalakítás Elemzés Illusztrálás Dokumentálás, a statisztikai jegyzőkönyvezés Véleményezés, rögtön az elemzés végén.
Adatelőkészítés Mérési jegyzőkönyv feldolgozása Kézi adatbevitel Elektronikus rekordok átvitele, kivonatolása átrendezése Statisztikai elemzésre felkészítés Jelölés, csoportosító változók bevitele Hiányzó adat(ok) kezelése Segéd változók, mellékes adatok felvitele Elemzéshez használható lehet
Adatok ellenőrzése, ábrázolás Adatrögzítési, átalakítási hibák elleni védekezés Grafikai bemutatás segíti az áttekintést Előzetes elemzés, egyszerű módszerekkel
A feltételek ellenőrzése Az eloszlás normalitásának vizsgálata Nagyobb adatmennyiség kell hozzá A mintából nem mindig végezhető el A szórásnégyzetek homogenitásának vizsgálata (homoscedascitás) A mintából végezhető Bartlett próba és társai Levene teszt
Transzformálás, ha kell Kölcsönösen egyértelmű átalakítás Mértékegység választás Szigorúan monoton függvények használata y=x 2, y=sin(x), y=log(x), y=e x és inverzeik, stb A lognormális eloszlás Egyirányú átalakítás Osztályokba sorolás Rangtranszformáció
Transzformálás (szisztémás adatátalakítás) Mindig történik (valamilyen) transzformálás A mérés során (műszerbe építetten, kalibrálásnál, számolásnál) gyakori a lineáris, vagy nem líneáris transzformáció A mérési célú transzformációnak van (?) szaktudományos alapja Példa: logit transzformáció radioimmun mérések kiértékelésénél linearizálja a kalibrációs görbét A statisztikai célú transzformáció a kiértékelés lehetőségeit módosítja Példa: a szórás arányos a csoport átlagával a logaritmikus transzformáció ezt eltüntetheti Lehetőleg a tervezési szakaszban meg kell adni a lehetséges eljárást. Ne attól tegyük függővé a transzformálást, hogy utána kijön-e a kívánt eredmény.
Elemzés első szakasza: az ANOVA Az egy szempontos ANOVA esete egyszerű A több szempontos ANOVA-nál a modell választás kritikus lehet Ha az ANOVA eredménye nem szignifikáns Befejeződik a statisztikai elemzés Folytatódhat a kutatás További adatgyűjtéssel ugyanazon kérdésről Módosított vizsgálati feltételekkel
Az elemzés második szakasza: eltérések vizsgálata Tervezett összehasonlítások Dunnett próba, egy kontrollhoz minden más Elemszám optimum: ha m darab kezelt csoport mind j, akkor a kontroll legyen j* m elemszámú. Kontrasztok koefficiensekkel (c i ) úgy hogy c i =0 Minden lehetséges összehasonlítás Páros Kontraszt Fischer LSD, Newman-Keuls, Tukey, Scheffé Power?
Jegyzőkönyvezés, dokumentálás Good laboratory practice A dokumentálás teljes körű legyen Nyers adatok, adatfeldolgozás (célszoftver?) Célszoftver validálás Szelekció? Ábrázolás, a felhasznált adatok reprezentatívak-e? Visszakereshetők-e? Statisztikai szoftver, verziószám, dátum? A munkamenet dokumentálása, Archíválás