Kísérlettervezés alapfogalmak: Tényező, faktor (factor) független változó, ható tényező (kezelés, gyógyszer, takarmány, genotípus, élőhely, stb.) amnek hatását a kísérletben vzsgáln vagy összehasonlítan kívánjuk. Megfgyelés egység (expermental unt) az az egység a kísérletben, amelyre egy bzonyos kezelést vagy kezeléskombnácót alkalmazunk (egy állat, egy alom, egy sejtkultúra, egy petr-csésze táptalaj, stb.). Célváltozó vagy kmenet változó (outcome varable, response varable) olyan megfgyelhető vagy mérhető változó, amely alkalmas a tényezők hatásának mérésére (a megfgyelés egység állapotának, kezelésre adott válaszának jellemzésére). Lehet bnárs (0/, pl. túlélés, gyógyulás, stb.) vagy számszerű (baktérumtelepek száma, átmérője, vérnyomás, közérzet-pontszám, stb.).
Ismétlés (replcaton) ugyanazt a kezelést (kezeléskombnácót) általában több megfgyelés egységen szokták alkalmazn. Ennek az az értelme, hogy csökkentsék annak az esélyét, hogy a kísérlet egyes megfgyelés egységek kesése (elhullás, skertelen mérés, stb.) matt értékelhetetlenné válk, kderüljön, mekkora a kezelésre adott válasz szóródása a populácóban, az eredmények a populácóra általánosíthatók legyenek, növekedjék a vzsgálat pontossága. Célpopulácó (target populaton) és vzsgált populácó (sampled populaton) a célpopulácó az a populácó, amelyre a vzsgálat eredményet alkalmazn kívánjuk, a vzsgált populácó pedg az a populácó, amelyből az elemzés alapjául szolgáló véletlen mntát vettük. Ha e két populácó nem azonos, akkor a kapott eredmény érvényessége megkérdőjelezhető.
Belső és külső valdtás (nternal and external valdty) A vzsgálat belső valdtásán azt értjük, hogy a kapott eredmény valóban érvényes-e a vzsgált mntára (az elemzés nem tartalmaz torzítást), a külső valdtás pedg azt jelent, hogy érvényes-e a kívánt célpopulácóra (azaz általánosítható). Ehhez a belső valdtáson túlmenően még arra s szükség van, hogy a mntavétel se okozzon torzítást. A vzsgálat belső valdtását például veszélyeztet, ha a kértékeléskor egy olyan statsztka módszert alkalmaztunk nem normáls eloszlású változó elemzésére, amelynek feltétele, hogy a vzsgált változó normáls eloszlású legyen. A vzsgálat külső valdtása kérdéses, ha az eredményeket a házorvos praxsra vonatkozóan kívánjuk felhasználn, a vzsgálatot vszont egy egyetem klnka beteganyagán végezzük, ahol jellemzően súlyosabb vagy komplkált esetek fordulnak elő.
Varancaelemzés (analyss of varance), ANOVA Van-e hatása a tényezőnek (kezelés vagy csoport, X) a célváltozóra (Y), pontosabban annak átlagértékére? Vannak-e különbségek az egyes kezelések, kezelés-kombnácók, csoportok között? Erre a kétmntás t-próba s megadja a választ, elég lenne azt páronként elvégezn a változókra gondolhatjuk. Ez azonban hbás megközelítés. A többször elvégzett t-próba esetén alaposan megnőne az első fajú hba valószínűsége. 0 Legyen például 0 mntánk, ezekből = 45 különböző párosítást készíthetünk, és 2 ezek mndegykében 5% hbavalószínűséggel utasítjuk el a nullhpotézst. Másként fogalmazva, 00 szgnfkáns eredményből átlagosan 5 esetben hbásan utasítjuk el a nullhpotézst. Akkor 45 esetből? Az ANOVA maga dolgozk 5% hbavalószínűséggel, az összes mntát tekntve.
Egytényezős one-way, one-factor varancaelemzés: k mnta (k kezelés vagy k csoport) Feltétel: a mnták függetlenek, a célváltozó mnden csoportban normáls eloszlású (kh-négyzet próba, Kolmogorov-Szmrnov-próba), a szórások azonosak (Bartlettpróba, Levene-próba). Nullhpotézs: nncs különbség az átlagok között, a kezelések/csoportok a célváltozó átlagára nézve mnd azonosak: H 0 : µ = µ 2 =... = µ k. Ellenhpotézs: nem mnden átlag egyenlő, a kezelések/csoportok között különbség van : H : nem mnden µ egyenlő egymással. Ha k = 2, akkor a varancaelemzés ekvvalens a kétmntás t-próbával.
Példa: Hasonlítsuk össze a következő három mntát:. mnta 2. mnta 3. mnta összes 8 9 3 0 5 2 3 7 4 5 9 6 7 x = 2 x = 3 x = 7 x = 0. 67 s 2 = 0 s 2 = 0 s 2 = 0 s 2 = 6 20 0 0 0 2 3 Mndhárom szórásnégyzet megegyezk, így a csoporton belül varancák átlaga 0. Az összes megfgyelés varancája nagyobb: 6. A különbség az átlagok között különbségnek tudható be. Alapötlet: a csoportosító tényezőtől független hatások a csoportokon belül s megjelennek
Másképp: a varabltásnak két forrása van a mntán belül átlag körül szóródás (csoportosítástól független hatások matt) a mnták között változatosság, amely a populácók (amelyekből a mnták származnak) várható értékenek különbözőségéből fakad.
Varanca-tábla (szórásfelbontás) A célváltozó varabltását (amelyet az átlagától való eltérés-négyzetösszeggel mérünk) komponensekre bontjuk az alább módon: Teljes varabltás = Kezelések között különbségnek tulajdonítható varabltás + Véletlen varabltás csoportok között (between groups) csoporton belül (wthn groups) rezduáls hba (resdual error) Ha a kezelések között különbségeknek tulajdonítható varabltás szgnfkánsan nagyobb, mnt az ugyanazon kezelést kapottak között véletlen (nem a kezeléssel kapcsolatos de lehet más, zavaró hatásnak tulajdonítható!) varabltás, akkor a nullhpotézst elvetjük. A tesztelés a varancák hányadosát véve, F-próbával történk. Szokásos jelölések: SS, SSQ négyzetösszeg (sum of squares) MS, MSQ varanca (mean squares)
A négyzetösszeg-felbontás szokásos formája, ahogyan a számítógépes programok közlk (ANOVA táblázat): A varanca eredete Source Kezelések között Between Kezelésen belül Wthn SS SS Eltérésnégyzetösszeg SS W B = n k = = k ( x X) 2 n ( xj x) = j= Teljes = ( ) Total k n SST xj X = j= 2 2 Szab. fok * df k- MS Átlagos négyzetes eltérés MS Tesztstatsztka F MSB F = MS k 2 n ( x X) = B = W k k n ( ) k(n-) xj x nk- MS W = = j= ( n ) k MS T = = SS T /(k-) *** 2 p- érték ** p p * feltéve, hogy k csoport van és mndegykben n megfgyelés ** a (k-), k(n-) szabadság fokú F-eloszlásból számítva *** MS T nem más, mnt a célváltozó becsült varancája
Ha a mntaelemszámok egyenlőek: ( ) ( ) ( ) 2 2 = = = = n k x x k X x n F k n j j k Ha a mntaelemszámok nem egyenlőek: ( ) ( ) ( ) = = = = k k k n s n k X x n F 2 2 Utóbb esetben súlyozunk a mntaelemszámokkal.
Ha a varancaelemzés szgnfkáns különbségeket mutat k a kezelések között, azaz a H 0 : µ = µ 2 =... = µ k nullhpotézst elvetjük, akkor kíváncsak lehetünk arra, hogy nevezetesen mely kezelések között van különbség. Erre szolgál a csoportok páronként összehasonlítása (post-hoc tests). A nullhpotézs elvetéséből nem következk, hogy mnd különböznek egymástól! Vannak olyan módszerek s, amelyetet nemcsak egy szgnfkáns ANOVA után, hanem anélkül s használhatunk (multple comparson tests).
Hogyan lehet eldönten, hogy melyk csoportok különböznek egymástól? Sok módszer van, különféle előnyökkel és hátrányokkal, csak néhányat említünk. Kszámítjuk a mntaátlagok konfdenca ntervallumat. Amelyek nem fednek át, azokat tekntjük különbözőknek. (nem teljesen korrekt) K lehet számítan az ún. legksebb szgnfkáns dfferencát LSD p%, és azokat a mntákat tekntjük különbözőknek, amelyek középérékenek különbsége nagyobb, mnt LSD p% (ez sem teljesen korrekt) A Tukey-teszt (korrekt, vszont nem nagyon érzékeny nagy különbség kell ahhoz, hogy szgnfkánsnak tekntse) A Dunnett-teszt: ha a kezelések nem mnd egyenértékűek, hanem van közöttük egy, amelyhez az összes többt hasonlítan akarjuk, akkor ezt a tesztet kell használnunk.
Többtényezős vagy többszempontos (multfactor) varancaelemzés Több tényező van. (Az egyszerűség kedvéért most legyen csak kettő.). tényező: k kezelés (k csoport). 2. tényező: k 2 kezelés (k 2 csoport). A kezeléskombnácók száma k k 2. Tegyük fel, hogy r smétléssel dolgozunk, azaz mnden kezeléskombnácót r megfgyelés egységen alkalmazunk (ez összesen k k 2 r megfgyelés egység). Feltétel tt s, hogy a célváltozó mnden kezeléskombnácó esetén normáls eloszlású, a szórások pedg azonosak legyenek.
Itt többféle nullhpotézst tesztelhetünk (ugyanúgy, mnt az egytényezős esetben, a négyzetösszeg felbontása után F-próbával): H 0 () : az. tényező szernt k kezelés csoport a célváltozó átlagára nézve mnd azonos, az átlagok között nncs különbség: H 0 () : µ () = µ 2 () =... = µ k () H 0 (2) : a 2. tényező szernt k 2 kezelés csoport a célváltozó átlagára nézve mnd azonos, az átlagok között nncs különbség: H 0 (2) : µ (2) = µ 2 (2) =... = µ k2 (2) H 0 ( 2) : az. és a 2. tényező hatása addtív, együttes hatásuk a külön-külön vett hatások egyszerű összege, nncs közöttük kölcsönhatás, nterakcó (H0 ( 2) elvetése azt jelent, hogy a két hatás nem addtív, van közöttük nterakcó) Az nterakcó azt s jelent, akkor az. tényező szernt kezelések hatása a 2. tényező szernt kezelés csoportokban nem azonos. Több tényezőre magasabb rendű nterakcók s bejönnek, de ezek általában nem nterpretálhatóak.
Példa: Seregélyek testtömege hogyan függ a madarak nemétől és a mérés dőpontjától? átlagos testtömeg nő hím hím nő hím nő ősz tavasz ősz tavasz ősz tavasz Az (a) esetben közel párhuzamos az átlagos testtömegeket összekötő vonal: az évszakváltás ugyananny testtömeg változást jelent mndkét nem számára, azaz nncs kölcsönhatás a két változó között. A (b) és (c) esetben a vonalak nem párhuzamosak: az évszakváltás hatása nem azonos az egyes nemek számára, azaz mndkét eset nterakcót jelez
Több mnta esetén: Az (a) esetben nncs nterakcó (közel párhuzamos vonalak), a (b) esetben van. A többtényezős ANOVA elvégezhető úgy s, ha mnden tényező kombnácóban csak egy megfgyelés van, ekkor azonban az nterakcók nem tesztelhetők.
ANCOVA Varanca-kovaranca-elemzésről (ANCOVA) akkor beszélünk, ha a tényezők mellett folytonos magyarázó változókat (ún. kovaránsok) s fgyelembe veszünk, amelyek hatását a célváltozóra lneárs regresszóval fejezzük k (pl. túlélés dő hogyan függ a műtét típusától, a beteg nemétől és életkorától). Ha azt gyanítjuk, hogy a kovaránstól való függés nem lneárs, akkor jobb, ha értéket csoportosítjuk (lehetőleg szakmalag nterpretálható módon!), majd ANOVA-t alkalmazunk. Az eljárást akkor s használhatjuk, ha a feladat az egyes csoportokbel regresszós egyenesek meredekségének összehasonlítása. (A meredekségek különbözőségét az jelz, ha a tényező kovaráns nterakcó szgnfkáns.)
Néha olyan tényezők hatása s érdekel, amelyeknek nem tudjuk, vagy nem akarjuk az összes lehetséges szntjét fgyelembe venn. Ilyenek például a mérés dőpontja (napszak, évszak), az élőhely földrajz elhelyezkedése, többcentrumos vzsgálatban a vzsgálatot végző ntézmény, a mérést végző személy, stb. Ekkor nem az a fontos, hogy az éppen fgyelembe vett szntek (dőpontok, földrajz helyek, ntézmények, személyek) között van-e és mekkora a különbség, hanem hogy ezek a különbségek összességében mennyvel járulnak hozzá a vzsgált változó varancájához (hogy ezt a többlet-varancát el tudjuk különíten a véletlen hbától). Az lyen tényezőt véletlen tényezőnek (random factor), az lyen tényezőt tartalmazó modellt véletlen modellnek (random effect model) nevezzük, szemben az eddg megsmert fx tényezővel (fx factor) és fx modellel (fxed effect model). A vegyes modellben (mxed model) mndkét fajta tényező szerepel.
Véletlen blokkos elrendezés (randomzed blocks desgn) Általában a csoportok között véletlenszerűen osztjuk fel a kezeléseket, azaz randomzálunk. Például 3 különböző kezelésnek teszünk k 5 egyedet, mndegyk kezelést 5 egyeden alkalmazva a kezelések sorrendje lehet például a következő: K K2 K K2 K K3 K K2 K2 K3 K K3 K3 K3 K2 Ha az a gyanúnk, hogy egy tényező nemkívánatos hatást gyakorol a célváltozó értékére, akkor ezt úgy kezelhetjük, hogy a fent teljes randomzálás helyett e tényező szernt rétegzünk és mnden rétegben mndegyk kezelésből ugyanannyt végzünk, és csupán az egyes rétegeken belül randomzálunk. Így az egyes kezelésekhez tartozó átlagértékeket a tényező azonos mértékben befolyásolja. Ezt az elrendezést véletlen blokkos elrendezésnek nevezk. Képzeljük el például, hogy a fent kísérletben azoknak az egyedeknek, amelyek később kerülnek sorra, romlk az állapota, a kezeléseket vszont csak egymás után tudjuk elvégezn. Ekkor eljárhatunk a következőképpen: K K2 K3 K2 K3 K K K3 K2 K3 K2 K K2 K K3
K K2 K3 K2 K3 K K K3 K2 K3 K2 K K2 K K3 Három egyedből álló blokkokat alakítottunk k, a blokkokon belül randomzáltuk csak a kezelést. Ha a kísérletet varancaelemzéssel értékeljük k, akkor a kértékeléshez használt statsztka programot általában úgy kell paraméterezn, mntha 2 tényezős elrendezést használtunk volna (az adatokat s ennek megfelelően kell bevnn), de a kezelés hatása és a blokkhatás között nterakcót kzárjuk és a blokkhatás szgnfkancáját nem vzsgáljuk. Az elrendezés így garantálja, hogy a kezelés hatása és a blokk-hatás szétválasztható. Így a szórásfelbontásban a blokk-hatásnak tulajdonítható szórás el van különítve a véletlen hbától, ez pedg erősebb tesztet eredményez. (Igaz vszont, hogy a kezelés blokk nterakcó, amennyben van lyen, nem választható szét a véletlen hbától, de hát nem szabad telhetetlennek lenn.)
Ha nem egy, hanem 2 környezet gradenst kell fgyelembe vennünk, akkor a Latn négyzet elrendezést alkalmazhatjuk: Ugyananny sora és oszlopa van a rácsnak, és mnden kezelés egyetlen egyszer szerepel mnden oszlopban és mnden sorban. Másodk hatás Első hatás E E2 E3 M K K3 K2 M2 K2 K K3 M3 K3 K2 K Látható, hogy a latn négyzet elrendezés akkor kvtelezhető könnyen, ha a zavaró változók folytonosak, mert ekkor könnyen hozhatunk létre belőlük épp a kezelések számával megegyező számú kategórát.
A kértékeléshez használt statsztka programot tt általában úgy kell paraméterezn, mntha 3 tényezős elrendezést használtunk volna, és az adatokat s ennek megfelelően kell bevnn (lásd lent). Itt s kzárjuk az nterakcókat, és tt sem vzsgáljuk a sor-, lletve oszlophatás szgnfkancáját.