Valószínűség-eloszlás Abból, hogy egy adott érték hányszor fordul elő (értékek gyakorisági vagy frekvencia-eloszlása), elvben meg tudnánk becsülni, hogy egy adott érték milyen valószínűséggel fordul elő (értékek valószínűség-eloszlása). Valószínűség = 0 kizárt; 1 biztos Hány évesek lettek öngyilkosok egy bizonyos szikláról leugorva egy évben
Az értékek előfordulásának valószínűsége Ez nem triviális, és nem is fogjuk kiszámolni, szerencsére megtették helyettünk okos matematikusok meghatároztak olyan elméleti eloszlástípusokat, azaz valószínűség-eloszlásokat, melyekről pontosan tudjuk, hogy az egyes értékek mekkora a valószínűséggel fordulnak elő. Pl.: Normális, standard normális, Poisson, Binommiális, Kevert normális, Khi-négyzet ( 2 ), F Ez miért jó? Mert ha pl. a mintámban lévő értékek kb. normális eloszlásúak, akkor a standardizálással az értékek standard normális eloszlásúvá alakíthatók, és erre már kiszámolták, milyen valószínűséggel fordulnak elő az egyes értékei (ill az annál nagyobb/kisebb értékek)!
Érték valószínűsége Normális eloszlás (Gauss görbe vagy haranggörbe) Ha X értékeinek valószínűségei a felső ábrán látható valószínűségek, akkor az X változó értékeinek relatív gyakorisága (eloszlása) szabálytalan (azaz az X változó aszimmetrikus eloszlású), de az X változó valószínűség-eloszlása szerint definiált 10.000 db 7-elemű minta x átlagainak eloszlása szabályos alakú, a mintaátlagok sűrűje a populáció átlaga körül ingadozik, és az x eloszlás elméleti átlaga egyenlő a populáció átlagával! E(P) = 1,8!
Normális eloszlás (Gauss görbe vagy haranggörbe) Tehát a mintaátlagok a populációátlag körül ingadoznak Sőt, szimulációk igazolják, hogy minél nagyobb a minta elemszáma (tehát nem csak 7, hanem még nagyobb), annál kisebb a mintaátlagok varianciája, És annál inkább igaz az is, hogy a mintaátlagoknak az eloszlása szabályos, szimmetrikus haranggörbére hasonlít: Gauss görbe / normális eloszlásfüggvény / normális sűrűségfüggvény. Az előbbi összefüggés nagyon fontos, így közelíthetjük okos matematikusok szerint (ezt nem tudjuk belátni, higgyük el): azaz Var(x ) = 2 /n a mintaátlagok elméleti varianciája = a populáció (elméleti) varianciája/n
Standard hiba (standard error) Standard hiba a mintaátlagok szórása: megmutatja, hogy az egyes minták mennyire reprezentatívak a populációra nézve, hiszen azt mutatja meg, hogy az egyes mintaátlagok átlagosan mennyire térnek el a populációátlagtól (vagyis a mintaátlagok átlagától). De ezt nem tudom ténylegesen a mintaátlagok szórásként kiszámolni, mert a populáció elméleti szórását nem tudom kiszámolni, hanem az előbb kifundált varianciás egyenletből gyököt vonva (Var(x ) = 2 /n ), de helyett a saját n elemű mintám s szórásából számolom, ha n > 30: azaz (s x vagy) se = s / n. mintaátlagok szórása VAGY standard hiba = az n elemű mintám szórása (valójában a populáció elméleti szórása)/ n
Normális eloszlás (Gauss görbe vagy haranggörbe) Az n elemszámú minták x átlaga tehát mintáról mintára változik, az átlagok ingadoznak a populáció elméleti átlaga körül. De a mintaátlag ingadozásának mértéke függ az n-től (minta méretétől), ugyanis ha növelem az n méretét, az egyes mintaátlagok eltérése az elméleti átlagtól csökken, sőt az eloszlásuk is keskenyebb lesz (egyre keskenyebb és csúcsosabb lesz az eloszlás)! annál jobban hasonlít a mintám a populációra. A nagy kérdés tehát: mekkora elemszám kell ahhoz, hogy a mintaátlag normális eloszlású legyen, és a minta átlaga jól közelítse a populációátlagot (amire valójában kíváncsi vagyok)? Minimum 30! (Lásd: standard hiba) Ennél kevesebb elem a mintában: nem inszignifikáns (??!!!?), legfeljebb a mintám kevésbé reprezentatív a populációra nézve!!!
Normális eloszlás Normális eloszlás: X változó normális eloszlású, ha értékeinek eloszlása ilyen alakú (mint a mintaátlagok eloszlásánál láttuk) (azaz a legtöbb értéke legfeljebb két szórásnyira van), vagy egy lineáris transzformációval ilyen alakra hozható. A normális eloszlások sokféle alakúak lehetnek... De minden lineáris transzformáltjuk (pl. Z-transzformáltja) szintén normális eloszlású lesz. NORMÁLIS ELOSZLÁSOK
Standardizálás (normalizálás) Az eloszlást meghatározza a nagyságszintje, ferdesége, csúcsossága, és a konkrét értékek szakmai dimenziója. Az első három mentén akarom összevetni az eloszlásokat, de a negyedik ezt ellehetetleníti Pl. Összefügg a testmagasság és a tömeg? [kg] [cm], tízes nagyságrend százas nagyságrend. Valahogyan közös nevezőre kell hoznunk a különböző változókat, hogy összehasonlíthatók legyenek. Ehhez egy lineáris transzformációval megszüntetjük a konkrét szakmai dimenziót (mértékegységet, pl. kg, cm), és közös nagyságrendre hozzuk az adatokat.
Standardizálás (normalizálás) Ha egy újszülött 56 cm és 4 kg, akkor melyik mérték szerint kiemelkedőbb (extrémebb)? Közvetlenül nem összevethető. Közös mérce: adjuk meg az adat nagyságát azzal, hogy a populáció átlagától hány szórásnyira van. Magyar csecsemők átlagai és az adatok szórása: Testhossz: 49,8 cm ± 2,5 cm Tömeg: 3,24 kg ± 0,5 kg Az adott baba ehhez képest: Testhossz: (56 49,8)/2,5 = 2,48 Tömeg: (4 3,24)/0,5 = 1,5
Standardizálás (normalizálás) Ha egy újszülött 56 cm és 4 kg, akkor melyik mérték szerint kiemelkedőbb (extrémebb)? Közvetlenül nem összevethető. Közös mérce: adjuk meg az adat nagyságát azzal, hogy a populáció átlagától hány szórásnyira van. Magyar csecsemők átlagai és az adatok szórása: Testhossz: 49,8 cm 2,5 cm Tömeg: 3,24 kg 0,5 kg Az adott baba ehhez képest: Testhossz: (56 49,8)/2,5 = 2,48 Tömeg: (4 3,24)/0,5 = 1,5 szélsőségesebb
Standardizálás (normalizálás) formalizálása: Z-transzformáció X kvantitatív változó Átlaga a populációban: Szórása a populációban: X változó standardizáltja: Z Ha valaki átlagos: Z = 0 Előjel! Z = X μ σ Pozitív érték: a populációátlagnál nagyobb érték; negatív: a populációátlagnál kisebb érték.
Standardizálás (normalizálás): Z elméleti átlaga mindig 0 Z-transzformáció Z elméleti szórása mindig 1 Az így transzformált értékek átlaga és szórása tehát független az eredeti értékek mértékegységtől (skálaléptékétől) és nagyságszintjétől (középértékétől), és csak az eloszlás azon jellemzőit tükrözi, melyek ezektől függetlenek (lapultság, ferdeség), ezért a változók összehasonlíthatók!
Standardizálás a mintában Egy adott érték: x Mintaátlag: x Minta szórása: s s z = x x s s Jelentése: az adott érték hány szórásnyira tér el a mintaátlagtól (előjelesen!). Vajon mikor használjuk?
Standardizálás: 1. példa Likert skálás adatok: egy adott kérdésre válaszadás 1-től 5-ig terjedő skálán. egyesek (a típus: magas ERS, azaz extreme response style érték) extrém értékeket adnak (1, 5), mások (b típus: alacsony ERS érték) ) csak a skála közepét használják (2, 3, 4) a két ksz átlaga hasonló (3 körüli), de a szórás különbözik! adatközlő típus Kérdés sorszáma válaszok átlag szórás da a 1 2 3 1 da a 2 3 da a 3 4 bm b 1 1 3,33333 2,08167 bm b 2 5 bm b 3 4 z = x x s s
Standardizálás: 1. példa Ha arra vagyunk kíváncsiak, hogy a kísérletben releváns kérdések esetében az adatközlők magukhoz képest melyik irányba és mennyire térnek el a legtöbbet adott értéktől, azaz nem érdekel, hogy pontosan milyen értékeléseket adnak, hanem hogy az kirívó-e, vagy semleges. Ehhez az adatközlők saját egyéni átlagértékeire normalizálunk. adatközlő típus Kérdés sorszáma válaszok átlag szórás Z-érték da a 1 2 3 1-1 da a 2 3 0 da a 3 4 1 bm b 1 1 3,33333 2,08167-1,1209 bm b 2 5 0,800641 bm b 3 4 0,320256 Ugyanaz a 4-es értékelés a szűkebb tartományt használó esetében messzebb van, azaz többet ér, nagyobb a jelentősége.
Normális eloszlás Normális eloszlás: X változó normális eloszlású, ha értékeinek eloszlása ilyen alakú (mint a mintaátlagok eloszlásánál láttuk), vagy egy lineáris transzformációval ilyen alakra hozható. A normális eloszlások sokféle alakúak lehetnek... De minden lineáris transzformáltjuk (pl. Z- transzformáltja) szintén normális eloszlású lesz. NORMÁLIS ELOSZLÁSOK
Standard normális eloszlás Standard normális eloszlás: egy kitüntetett normális eloszlás (bármely Z-transzformált normális eloszlás), melynek átlaga 0, szórása 1. A standardizálás miatt összehasonlíthatókká válnak.
Normális eloszlások tulajdonságai Az adatok kb 68%-a az átlag körüli 2 szórásnyi intervallumon van. Az adatok kb 95%-a az átlag körüli 4 szórásnyi intervallumon van. Az adatok kb 99,8%-a a 6 szórásnyi intervallumon van.
Mit jelent az adatok ilyen jellegű eloszlása? Ha X változó normális eloszlású az adott populációban, akkor az egyes személyek 95%-ának X értéke nem tér e jobban az átlagtól, mint 2 szórás (maximum 2 távolságra van). Azaz az X változó egy véletlenszerűen megfigyelt értéke kb. 95% eséllyel (P 0,95) 2 vagy +2 tartományba esik. Azaz: az átlaghoz képest 2 szórásnál kisebb vagy nagyobb értékek ritkák (a két oldalon ÖSSZESEN > 5% p < 0,05)!!!
Standard normális eloszlás
Intervallumbecslés, pontbecslés
Statisztikai becslés Az X változó eloszlását akkor ismerjük, ha diszkrét esetben ismerjük az egyes értékeke előfordulási valószínűségét (pl dobókockán a számok), ill. folytonos esetben a sűrűségfüggvényt. De sokszor elég tudnunk az eloszlás elméleti átlagát, szóródását, szétterültségét, csúcsosságát, ferdeségét ezek az eloszlás elméleti paraméterei. Normális eloszlásnál ilyen paraméter a és a A 2 és a t-eloszlás esetében az f (= n-1) szabadságfok Az F-eloszlás esetében az (f1, f2) szabadságfokpár, stb. (Ezek a stat. tesztek felírásában visszaköszönnek!)
Statisztikai becslés A populációt jellemző eloszlások elméleti paramétereire azonban csak a véletlenszerűen választott mintából tudunk következtetni. statisztikai becslés útján.
Hipotézisek a statisztikában Hipotézis = alternatív hipotézis (néha kísérleti hipotézisnek nevezik) (H 1 ): előzetes feltevés, előzetes válasz egy tudományos kérdésre. Általában egy állítás arról, hogy egy hatást találunk. Nullhipotézis (H 0 ): az alternatív hipotézis ellentéte, tehát általában a hatás hiányát mondja ki. Miért kell a H 0? csak ez falszifikálható! Ha nem sikerül, korroboráltuk (megerősítettük) a H 1 -et, de nem bizonyítottuk be!
Példa Hipotézis = alternatív hipotézis (H 1 ): A Big Brother résztvevői alacsonyabb pontot érnének el egy IQ teszten, mint a nem résztvevők humanoidok. Nullhipotézis (H 0 ): ugyanolyan IQ pontot mutatna a tesz. Ha a stat teszt szignifikáns (p < 0,05), elvethetjük a H 0 t, és elfogadhatjuk H 1 -et átmenetileg, DE EZ NEM BIZONYÍTÉK RÁ HOGY IGAZ! korroborálás, megerősítés! p < 0,05: kisebb mint 5% az esélye, hogy tévedünk ha H 0 -t elutasítjuk.
Statisztikai becsléssel meghatározható kérdések Amit korábban slendriánul statisztikailag megválaszolhatónak neveztem. Pl. A magyar lakosság hány százalékára jellemző a suksükölés? Hány perc szükséges 10 portugál szó megtanulásához? Mi az IQ átlaga az egyetemi hallgatók populációjának?
Statisztikai becslés Hogyan válaszolhatom meg ezeket a kérdéseket? Nekem kell eldöntenem, hogy melyik elméleti paraméter válaszol rá! Ha eldöntöttem, hogy pl. ha az X változó elméleti átlaga érdekel, két lehetőségem van:
Statisztikai becslés 1. Pontbecslés: Kiszámítom a véletlen minta átlagát (legyen 35,5) és azt mondom, ez a populáció átlaga, 35,5. Ahogyan korábban azt mondtuk, hogy az átlag modellezi a mintát, és a modell pontosságát a szórás adja meg, úgy a populáció modellezésének pontosságát a standard hiba adja meg. biztosan tévedünk (hiszen kis mintából következtetünk egy végtelen méretű mintára), a kérdés csak az, hogy mekkorát: standard hiba mennyire szórnak a mintaátlagok a populációátlag körül. 2. Intervallumbecslés: az elméleti érték (populációátlag) valahol egy alsó és egy felső határ között van (pl. 35,5-tól ±3 egységre) Kevesebbet állítunk, de nagyobb az esélye, hogy igazat mondjunk.
Pontbecslés és intervallumbecslés
Pontbecslés Szokványos módja az, hogy az elméleti paramétert a mintabeli jellemzővel becsüljük. Láttuk, hogy ezek nem egyeznek az elméleti vagy populáció átlaggal, de körülötte ingadoznak. Azaz E(x ) = E(X) (a mintaátlagok elméleti átlaga = a populációátlag) Hogyan állapítom meg a pontbecslés jóságát? Standard hiba: a mintaátlagok szórása. azt várjuk, hogy ez kicsi legyen (a mintabeli középértékhez viszonyítva), akkor tekinthetjük a populációt reprezentálónak a mintát.
Példa Két csoport átlaga (az egyikben több szélsőséges érték) átlag nagyon eltérő, medián nem Az se a szélsőségesebb csoportban nagyon nagy következtetés: az átlag nem ad jó becslést a populációátlagról. És tényleg, a szélsőségesebb mintában az átlag az extrém értékek miatt nagyon eltolódik.
Intervallumbecslés A populáció átlagát nem tudjuk próbáljuk meg inkább azt megállapítani, hogy milyen tartományba esik. Konfidencia-intervallum: az a tartomány, amiről azt feltételezzük, hogy beleesik a populációátlag. Ez egy másik megközelítés az se-hez képest arra, hogy értékeljük, mennyire jó modell az átlag.
50 minta (átlag és konf. Interval) Spermák száma Konfidenciaintervallum Néha beleesik a popoulációátlag a mintában mért átlag konfidenciaintervallumába, néha nem A valódi populációátlag
Japán tintahalas kísérlet Egy alkalommal x számú sperma kilövellése + kikalkulált konf interval: plusz mínusz valamennyi sperma 50 kísérletből egy csomó esetben a konf intervalban benne van a populációátlag néhányban nem Mi a konf interval? Ha 95% konfidenciaszinten számolom ki a konfidencia-intervallumot: 100 mintából 95 tartalmazza a populációátlagot.
Konfidencia-intervallum A konfidencia-intervallum 95% ( jelentése ): a konfidencia intervallum megbízhatósági szintje vagy konfidenciaszintje 95% Az a limit, amit konfidencia-intervallumnak választottunk, 95% valószínűséggel tartalmazza a populációátlagot ha gyűjtenék 100 db mintát, és meghatároznám rájuk átlagot és hozzá az általam kiötlött konfidenciaintervallumot, akkor 95 db minta konfidenciaintervallumában benne lenne a populációátlag. Ezt az intervallumot hogyan tudom megállapítani?
Konfidencia-intervallum Nade hogyan határozom meg a konfidencia-intervallumot? Hova esik a mintaátlagok 95%-a mintaátlagok eloszlásában? Normális eloszlás esetén az átlag ± 2 szórásnyi tartományba, ami standard normális eloszlás esetén ± 1,96!
Konfidencia-intervallum Csakhogy, mint mondtuk, a populáció szórása nem ismert. De standard normális eloszlás (azaz z- transzformált bármilyen normális eloszlás) esetén az intervallum határai 2 -ra vannak, és értéküket is tudom: 1,96 és -1,96 Normalizálás képlete még egyszer: z = x x s s
Konfidencia-intervallum A normalizálás egyenletét átrendezve, és az s szórást se-re cserélve kijön, hogy standard normális eloszlás esetén annak a tartománynak, ahová az értékek (mintaátlagok) 95%-a esik 1,96 = x x 1,96 = x x ss ss Az alsó határa = mintaátlag (1,96 se) A felső határa = mintaátlag + (1,96 se) minél nagyobb a minta annál kisebb az se és annál jobban reprezentálja az átlag a populációátlagot, ill. annál szűkebb tartomány lesz a konfidencia-intervallum.
Konfidencia-intervallum Mivel ez az intervallum 95%, hogy tartalmazza a populációátlagot, feltesszük hogy tartalmazza Minél kisebb a konfidencia-intervallum, annál jobban reprezentálja a minta a populációt.
Megbízhatóság vs. hiba Konfidencia-intervallum: értéktartomány, amely a becsülendő paramétert egy előre rögzített valószínűséggel tartalmazza. Megbízhatósági/konfidencia-szint (p): az előre rögzített valószínűség, pl. 95% 95%, hogy a konfidencia-intervallum tartalmazza a populációátlagot. Ekkor a hiba valószínűsége: (1 0,95 = 0,5=) 5% 5% az esélye, hogy az intervallumom nem tartalmazza a populációátlagot alfa-hiba:
Konfidenciaszint vs. hiba A mintaátlagok eloszlása: Konfidencia-szint (p): az intervallumhoz tatozó előre rögzített valószínűség, pl. 95% Konfidencia-intervallum: az az értéktartomány, amely a becsülendő paramétert egy előre rögzített valószínűséggel (pl 95%) tartalmazza. hiba: Ha egy adott x mintaátlag nem esik bele a konfidencia-intervallumba, akkor, bár kicsi az esélye, de tartozhat az adott populációhoz.
Konfidencia-intervallum Ne aggódjunk, manapság nem kell pontosan tudnunk, hogyan kell kiszámolni, mert nem csináljuk kézzel (ehhez egyébként kellenének a t-eloszlás kvantilisei és kritikus értékei, amiket nagyszerű táblázatok foglalnak magukba hosszú oldalakon). Ezt kiszámolják nekünk a stat programok (R, SPSS), szóval ha ábrázolni támad kedvünk (fog), akkor nem kell nekiesni a táblázatoknak. A lényeg: a mintaátlagom köré kiszámolt konfidenciaintervallum (tehát hogy az átlaghoz képest pl. 95% valószínűséggel milyen tartományba saccolhatom a populációátlagot) alapvető fontosságú! Lássuk, miért.
Konfidencia-intervallumok vizuális megjelenítése: átlag (mean) + hibasáv (error bar) MINTA ÁTLAGA I KONFI- DENCIA- INTER- VALLUM Két minta kicsit eltérő átlaggal, de erősen átfedő konfidencia-intervallummal. Mivel 95% (100-ból 95 esetben igaz), hogy a konfidencia-intervallum tartalmazza a populációátlagot, feltehető, hogy ez a két minta ugyanabból a populációból való.
Konfidencia-intervallumok vizuális megjelenítése: átlag (mean) + hibasáv (error bar) MINTA ÁTLAGA I KONFI- DENCIA- INTER- VALLUM Két minta jelentősen eltérő átlaggal, de ami még fontosabb, nem átfedő konfidencia-intervallummal. Mivel mindkét mintában 95%, hogy a konfidenciaintervallumok tartalmazzák a populációátlagot, tehát két dolog lenne feltehető!
Konfidencia-intervallumok vizuális megjelenítése: átlag (mean) + hibasáv (error bar) 1. Mindkét konfidencia-intervallum tartalmazza a populációátlagot ez esetben ez a két minta nem ugyanabból a populációból való. 2. A két minta ugyanabból a populációból való, és az egyik intervallum nem tartalmazza a populációtálagot erre a konfidencia szint szerint 5% esély van. valószínűbb, az 1. megoldás (de ez még nem stat próba!).
Mi a populációhoz tartozás jelentősége? A kísérletezésben mindig összehasonlítunk: két vagy több feltételt/kondíciót. Kérdés: lehet-e csökkenteni az emberek a statisztikától való szorongását pozitív megerősítésekkel (behaviorista eszközökkel)? A kísérlethez két véletlen mintát választok, amik közt az tesz különbséget, hogy az egyiket manipulálom a kísérletben. Manipuláció: pl. veszek két véletlen mintát az emberekből, és az egyiknek adok csokit, amikor stat könyvet lát. Kiindulásként azt feltételezem, hogy ezek az emberek egy populációból valók (hisz pl. mind emberek). Ha viszont mégis azt találom, hogy a két csoport átlaga az error barral (hibasáv) ennyire eltér (l. előbbi ábra), tehát a minták eltérő populációból valók, az csak akkor lehet, ha a különbséget az általam vizsgált hatás okozza.
Mi a populációhoz tartozás Fonetikusi példa: jelentősége? Ha felteszem, hogy a V időtartamra hatással van a hangsúly, összevetek hangsúlyos és hangsúlytalan magánhangzókat (pl. csak á-kat). Kiinduláskor feltételezem, hogy ezek mind egy populáció (hisz mind á). Ha mégis azt találom, hogy ezek az á-k eltérő populációból valók, és a kísérlet jól kontrollált, akkor az eltérés oka a vizsgált változó, azaz a hangsúly!
Mi a populációhoz tartozás jelentősége? Ha azt találom, hogy a két csoport átlaga az error bar-ral együtt ennyire eltér egymástól (ilyenkor az error bar-ok gyakorlatilag nincsenek átfedésben), azaz a minták eltérő populációból valók, az csak akkor lehet, ha a különbséget az általam vizsgált hatás okozza. Ilyenkor mondjuk, hogy a minták átlaga szignifikánsan eltér (és örülünk ).
Hipotézis tesztelése A hipotézisünk, azaz az alternatív hipotézis (H 1 ): állítás, egy hatás jelenléte. De a vizsgálatban állításunk ellenhipotézisét (nullhipotézis, H 0 ) vizsgáljuk meg, tehát a hipotézist a falszifikáción keresztül teszteljük. Miért kell a H 0? csak ez tesztelhető, mert ez falszifikálható! Ha nem sikerül falszifikálni, korroboráltuk (megerősítettük) a H 1 -et (de nem bizonyítottuk be!) Éppen ezért a konfidenciaszint nem arra utal, hogy mekkora az esélye annak, hogy igaz a H 1, hanem hogy mekkora az esélye (5%) annak, hogy tévedünk, ha H 0 elvetjük, és H 1 -t elfogadjuk, de NEM A H 1 -T TESZTELTÜK!!! (hattyúk!)
Falra, vérrel felírandó Mivel a statisztikában H 0 -t teszteljük, világos, hogy a konfidenciaszint nem utalhat arra, hogy mekkora az esélye (95%) annak, hogy igazunk van, hanem csak arra, hogy mekkora az esélye (< 5%) annak, hogy tévedünk, ha H 0 elvetjük és H 1 -t elfogadjuk. Másként 95% valószínűséggel igazunk van, ha elvetjük H 0 -t. Éppen ezért nagyon örülünk, ha p kicsi (pl. p < 0,05 azaz 5% az esélye), de ez az érték önkényes, lehetnénk szigorúbbak (0,001) vagy engedékenyebbek (pl. 0,1?) is.
Statisztikai modellek A hipotézis teszteléséhez adatokat gyűjtök, majd az adatokra egy modellt illesztek: (általánosan:) megfigyelt adat = modell + hiba Példa: az átlag egy is egy egyszerű modell. Megfigyelt adat i = átlag + hiba i Behelyettesítve az 1 ismerőssel bíró ember (pl. Sanyi) egy átlagosan (modell!) 2,6 ismerőssel bíró mintában. Hiba Sanyi : 1 Sanyi 2,6 = 1,6 Ekkor a modell: 1 = 2,6 1,6 = 1 Itt a variancia és szórás pedig azt méri, hogy mennyire jó az átlag mint modell, hiszen ezek azt mondják meg, hogy mennyire térnek el a megfigyelt értékek a modell által jósolt érték(ek)től (ami itt az átlag).
Statisztikai próba Mindez általánosságban is igaz bár általában egy pont (pl. az átlag) helyett egyenest illesztünk az adatokra modell gyanánt. A modell tesztelése a statisztikai próba. Ahogyan az átlagnál is, a statisztikai próba azt mondja meg, hogy a modell mennyire illeszkedik a modell a megfigyelt adatokra. statisztikai próba = a modell által megmagyarázott variancia a modell által nem megmagyarázott variancia Minél jobb a modell, annál nagyobb számot kapok a próbastatisztika értékére.
Statisztikai próba (próbastatisztika) A statisztikai próbák (l. F vagy 2 stb) értékeinek az eloszlását (milyen gyakoriak az értékek) kiszámolták (ez az érték = végtelen sokszor elvégzett próba, és az így kapott összes t, F stb. érték eloszlása). Az eloszlás alapján meg lehet állapítani, hogy mekkora a valószínűsége annak, hogy adott értéket kapjak a próbára. Minél nagyobb az adott érték, annál kisebb jobban leírja a modell a valóságban (mintában) megfigyelhető varianciát ÉS annál kisebb a valószínűsége, hogy véletlenül kaptam miért?
Statisztikai próba (próbastatisztika) A kritikus értéket, ami H 0 elutasításához (α = 0,05) kell, előre megszabom. Mit jelent ez? Annak a valószínűsége, hogy ezt az értéket kapjam, ha H 0 igaz, nagyon kicsi (0,05, azaz 100 esetből 5 eset). Tehát minél nagyobb a próbastatisztika értéke, annál nagyobb a valószínűsége, hogy ez nem a véletlen műve (annál valószínűbb, hogy a modellem jól modellezi az adatokat). Ha elérjük a 0,05-öt, az azt jelenti, hogy 5% a valószínűsége, hogy ezt az eredményt a stat próbára véletlenül kaptam (ez a SZIGNIFIKÁNS eredmény), azaz a modell elég jól írja le a valóságban megfigyelhető varianciát elfogadjuk a modellt. DE a kritikus értéket (pl. 95%) előre szabjuk meg, és eztán már döntés bináris (elfogadjuk/elvetjük H 0 -t), azaz a 0,01 nem értelmezhető szignifikánsabbnak, mint a 0,05!!!
Statisztikai próba H 0 A statisztikai modell a hipotézisünket tükrözi: azt ragadja meg, hogy egy izének van hatása. Így a szignifikáns statisztikai teszt azt mondja, hogy a modell jól illeszkedik a világra (magas érték a próbán), ami valószínűtlen lenne, ha az izének nem lenne kimutatható hatása (ha a H 0 igaz lenne). Ezért ilyenkor felbátorodunk, és elvetjük H 0 -t, és megerősítve érezzük magunkat, hogy a hipotézisünk valószínűleg igaz (bár ez sosem biztos).
Statisztikai próba logikája 1. Ha magas és szignifikáns a próba értéke, az azt jelenti, hogy valószerűtlen hogy ez az érték a véletlen műve legyen 2. Ebből arra következtethetek, hogy elég jó a modellem (amiben kódolva van, az az állítás, hogy egy X faktornak van hatása) 3. Ebből arra következtetek, hogy nem igazán valószínű, hogy az X faktornak nincs hatása (tehát hogy igaz a H 0 ). elvetem H 0 -t, és azt feltételezem, a hatás létezik (és nem csak a mintában!).
Kitérő: statisztikai próba felírása Mindezen okokból a stat felírás sosem csak annyi, hogy p < 0,005!! Általában felírjuk a stat próba értékét (pl. t), és az adott próbához és az adott eloszláshoz (pl. t- eloszláshoz) kapcsolódó további értéket is (itt: 1 db szabadságfok). Statisztikai próba eredménye (itt: t értéke) Pl. t(8) = 2,89, p = 0,02 Szabadságfok 9 elemű volt a minta Ekkora a valószínűsége, hogy a 2,89-es t-értéket véletlenül kaptam.
Első fajta (I.) és második fajta (II.) hiba A vizsgálatainkban általában abban vagyunk érdekeltek, hogy a statisztikai próba értéke ne tartozzon a p-be (1 -ba), hanem kívül essen, tehát -ba tartozzon (hogy H 0 -t elutasíthassuk). Első fajta vagy hiba: false positive még ha nincs is hatása a tesztelt változónak a populációra, 95% konfidenciaszinten van 5% az esélye (100 mintavételből 5-ször fordul elő), hogy ennek ellenére az -ba tartozó értéket kapunk, tehát tévesen arra következtethetünk, hogy a vizsgált változónak van hatása. Statisztikai próba értéke
Első fajta (I.) és második fajta (II.) hiba Második fajta vagy β-hiba (az előző ellentettje): false negative van, hogy bár egy hatás valóban létezik (hat a populációra), mégis az -n kívüli értéket kapunk, tehát a H 0 -t megtartjuk, azaz ezért tévesen arra következtetünk, hogy a vizsgált változónak nincs hatása. Statisztikai próba értéke
Hatásméret (effect size) Akár egy kísérletileg manipulált valami hatását nézem (pl. a hangsúly hatását), Akár két változó közti összefüggést vizsgálom (pl. a vízbe fulladtak száma ~ Nicolas Cage azévben megjelent filmjeinek száma) Nem csak arra vagyok kíváncsi, hogy van-e hatás (eltérnek-e a minták, azaz két populációt kapoke), hanem arra is, hogy ez a hatás mekkora.
Hatásméret (effect size) Ezek általában standardizált értékek, tehát a különböző mértékkel (szívverés gyorsasága vagy sebesség ms-ban) megmért hatások összevethetők. Ennek talán legelterjedtebb mérőszáma a Pearsonféle korrelációs koefficiens (r) amiről bár a korrelációnál fogunk beszélni, az első esetben is értelmezhető (csak ritkán szoktuk). Pearson-féle r: értékei -1 és 1 közé esnek: 0: nincs hatás; 1/-1: tökéletes hatás. (előjelesen! negatív: fordított arányosság, pozitív: egyenes arányosság)
Statisztikai erő Annak a mértéke, hogy egy adott teszt mennyire képes kimutatni a vizsgált hatást. Ez a minta elemszámától és az effect size-tól függ. Cohen s rule of thumb: 0,05-es -nál (95% konfidencia-szinten) a megfelelő statisztikai erő elérhető, ha A hatás kicsi r = 0,1 783 résztvevővel A hatás közepes r = 0,3 85 résztvevővel A hatás nagy r = 0,5 28 résztvevővel.