A m és az átlag Standard hba Mnta átlag 1 170 Az átlagok szntén ngadoznak a m körül. s x s n Az átlagok átlagos eltérése a m- től! 168 A m konfdenca ntervalluma. 3 166 4 173 x s x ~ 68% ~68% annak a valószínűsége, hogy a m ebben a tartományban van. (~3%, hogy nem!) A m becslése Informácó tartalom Átlag Pont becslés Egy egyszerű érték. Konfdenca ntervallum Intervallum becslés Egy tartomány és egy valószínűség, amely megadja annak az esélyét, hogy m ebbe a tartományba esk. x s x ~ 68% x s ~ 95% x x s ~ 99.5% 3 x x 100% De: a konfdenca ntervallum hossza függ a standard hba nagyságától! 1
Normál tartomány Hpotézs vzsgálatok Normáls eloszlású változó Egyéb típusú változó Kérdések (példa) Hogyan adhatunk választ? Egy olyan tartomány, amely a lehetséges értékek 95%-át tartalmazza. Hatásos-e a gyógyszer?? rodalomból De: 5% az esélye, hogy a tartományon kívülre esk!!! kísérletekből Egy példa Hpotézsek Kérdés: Hatásos a lázcsllapító gyógyszer? A gyógyszer hatástalan A gyógyszer hatásos Egymást kzáró állítások, elég az egyket megvzsgáln! Melykkel érdemes foglalkozn?
A megfgyelt változó eloszlása A gyógyszer hatástalan A gyógyszer hatásos Ha a populácót megsmerhetnénk!!! Eredmény Következtetés m = 0 A gyógyszer hatástalan. A véletlen hatások eredője 0. Mekkora a hatás? m < 0 A gyógyszer hatásos, a hatás mértékére a m jellemző. A helyzet fokozódk A populácó általában nem smert. A mnta nem azonos a populácóval! pl. az átlagok ngadoznak a várható érték körül! M az oka az eltérésnek? Mntavételezés véletlen ngadozás. (A feltevésünk helyes!) Az alapfeltevésünk (hpotézsünk) nem gaz (tévedtünk!). Az eltérés nem véletlen. 3
M alapján dönthetünk? Nullhpotézs: (H 0 ) Mekkora az esélye, hogy a mnta valóban az adott populácóból származk? Ehhez smert paraméterű eloszlás szükséges! a mnta/mnták eltérése a választott populácó(k)tól a mntavételből származó véletlen eltérés. Gyakran egy tagadó válasz a feltett kérdésre. (példa: a gyógyszer nem hatásos.) Alternatív hpotézs: (H 1 ) a mnta/mnták eltérése a választott populácó(k)tól nem véletlen. (példa: a gyógyszer hatásos) Nullhpotézs Szgnfkáns? Mekkora az esélye a véletlen eltérésnek? Ismert eloszlás esetében megadható! (Az eloszlás alakja nem mndg lyen, de smert!) Ha p elég nagy, lehet véletlen, ha p elég kcs a különbséget szgnfkánsnak tekntjük! p annak a valószínűsége, hogy az eltérés véletlen! 4
Szgnfkanca sznt A döntés alapja Elég nagy, elég kcs? Válasszunk egy értéket, amelyet határnak tekntünk! Ez a szgnfkanca sznt. Ha a p elég kcs, nagyobb az esélye, hogy a nullhpotézs nem gaz. Azaz nkább az alternatív hpotézs a valószínűbb. x krtkus : a szgnfkanca sznthez tartozó érték x számolt : a mntá(k)ból számolt érték Jelölése: a. Orvos gyakorlatban értéke gen gyakran 5%. p annak a valószínűsége, hogy x számolt x krtkus. A döntés A döntés jósága 1. Ha a véletlen eltérés valószínűsége kcs (p( x x krt ) 5%) elvetjük a nullhpotézst.. Ha a véletlen eltérés valószínűsége nagy (p( x x krt ) > 5%) megtartjuk a nullhpotézst. tény: a nullhpotézs gaz hams döntés: a nullhpotézst megtartjuk Helyes döntés II. Típusú hba (b) elvetjük I. Típusú hba (a) Helyes döntés A válasz sohasem gen - nem, vagy gaz - hams!!! 5
Vzsgálat egy csoportban: (egymntás t-próba) Kérdés: A mnta alapján lehet-e a populácó jellemző értéke egy megadott érték? A példa: Hatásos-e a lázcsllapító vagy sem? Nullhpotézs: nem! m 0 = 0. De az átlag nem 0! Mt jelent a nagy eltérés? M a mértéke az eltérésnek? Standard hba: az átlagok átlagos eltérése a m-től. mnta átlag 1. -0, C. -1 C 3. -1,5 C Ha az eltérés nagyobb, bztosabbnak tűnk az alternatív hpotézs (a gyógyszer hatásos) ( x sx ) ~ 68% - konfdenca ntervallum. x m 0 t s x A t-érték Vszonyítsuk az eltérést a standard hbához! (m 0 gen gyakran = 0) Mért alkalmasabb a t-érték? Képesek vagyunk kszámoln ennek az eltérésnek a valószínűségét!!! (Student- vagy t-eloszlás) Mvel az átlagok a m 0 körül ngadoznak, a t-értékek a 0 körül. (feltéve, hogy a nullhpotézs gaz!) Csak a t-értékek véletlen ngadozását írja le! Az eloszlás alakja függ az elemszámtól. 6
A t-táblázat A szabadság fok Gondoltam 3 számra! (mnta) A 3 szám átlaga: 8! (nformácó!) Különböző t krt értékek tartoznak a különböző valószínűség értékekhez. 3, 1, 8 vagy 5, 7, 11 stb. A szabadság fok = n 3, 1, 9 vagy 5, 7, 1 stb. A szabadság fok = n-1 Döntés t-táblázat alapján Kválasztunk egy alkalmas szgnfkanca szntet! Döntés számítógép segítségével Én tudok ntegráln!!! p: annak a valószínűsége, hogy véletlenül lyen nagy a t számolt. 7
A döntés 1. Ha a véletlen eltérés valószínűsége kcs (p( t t krt ) 5%) elvetjük a nullhpotézst.. Ha a véletlen eltérés valószínűsége nagy (p( t t krt ) > 5%) megtartjuk a nullhpotézst. Az egymntás t-próba feltétele A feladat: egy mnta alapján döntés a m értékéről. A változó normáls eloszlású legyen. Vzsgálat két csoportban kétmntás t-próba Kérdés: A két mnta származhat-e azonos populácóból, vagy a két populácó paramétere azonosak? x1 x? Ismert eloszlású változóra van szükség! m 1 = m? Nullhpotézs: m 1 = m (általában x1 x) kétmntás t-próba t s * x x 1 1 1 1 n n s * Q1 Q n n 1 8
A próba A kétmntás t-próba feltétele A t-érték az t-érték! Akkor meg tudom csnáln! Pardon, menny a szabadság fokok száma? A feladat: két egymástól független csoport összehasonlítása. A változó normáls eloszlású legyen. A szórás a két csoportban azonosnak teknthető. sz.f. = n 1 +n - ((n 1-1)+(n -1)) Ez utóbb új! Hogyan állapítható meg? A szórások vzsgálata Hogyan fogjunk hozzá? Nullhpotézs: a két szórás azonos, az eltérés véletlen (mntavétel). De hszen ez olyan, mnt egy hpotézsvzsgálat! F s s 1 A nullhpotézshez tartozk egy ún. F-eloszlás. Az F-próba De melyk varanca legyen a számlálóban? A számlálóban mndg a nagyobb varanca van! (F 1) 9
Döntés vagy több változó 1. Ha a véletlen eltérés valószínűsége kcs (p(f F krt ) 5%) elvetjük a nullhpotézst.. Ha a véletlen eltérés valószínűsége nagy (p(f F krt ) > 5%) megtartjuk a nullhpotézst. Korrelácó és regresszó Kapcsolat két változó között. Függvényszerű leírás. Korrelácó Példa: Van-e kapcsolat a testsúly és a testmagasság között? kísérlet: n adatok: magasság (cm) 1 150 61 170 70 3 166 75 4 174 70 5 180 7 6 155 50 7 17 65 8 161 59 9 177 81 súly (kg) Ábrázolás A B C nncs semmlyen tendenca például: x a magasság és y a súly. lehetséges esetek: Poztív tendenca Negatív tendenca 10
Pearson-féle korrelácós együttható Determnácós együttható cov( x, y) r s s x Az r lehetséges értéke: y Q x xy Q Q 1 r 1 y A populácóban: r = 0 nncs korrelácó, Qxy x x y y Qx x x Q y y y r 0 van! (mértéke arányos az r abszolút értékével.) r Megadja, hogy mlyen erős a kapcsolat. Az y változásanak mekkora része értelmezhető az x változásaval. Korrelácós t-teszt A számolt r csak becslése az r populácóbel értékének. A számolt érték az elmélet r körül ngadozk. (pl. r számolt = 0,1?) Kh-négyzet teszt (gyakorság adatok elemzése). példa: fejfájás hatásos: elmúlt. H 0 : r = 0! n t r sz.f.: n - 1 r tabletta Döntés: a t-érték alapján. Lásd előző példákat! Feltétele: Legalább az egyk változó normáls eloszlású. nem hatásos: nem múlt el. 11
Kísérlet Kontngenca tábla 1. csoport: gyógyszer. csoport: placebo Nem múlt el elmúlt Összes 1. csoport a b a+b. csoport c d c+d nem múlt el (a) elmúlt (b) nem múlt el (c) elmúlt (d) összes a+c b+d n (a,b,c,d gyakorság adatok) x tábla. Nullhpotézs Ha a hatás független a gyógyszertől, azt várjuk, hogy: Képlet x táblákhoz: c -eloszlás c nad bc a bc d a cb d a b c d ad bc Nullhpotézs: c = 0, a különbség csupán mntavétel hba. Nullhpotézs: a hatás független a gyógyszertől, csupán placebo hatás. kh-négyzet teszt (függetlenség). c -eloszlás: megadja a c -érték véletlen eltéréset. 1
Döntés Hasonló a t-eloszlás esetében megbeszéltekhez. A különbség: a c -eloszlást használjuk. A várható érték = 0, ha a nullhpotézs gaz. ha c számolt c krt - elvetjük ellenkező esetben megtartjuk a nullhpotézst. vagy p(c c számolt) 5% - elvetjük ellenkező esetben megtartjuk a nullhpotézst. Ha a változók normáls eloszlásúak, a kapcsolat közöttük lneárs jellegű. Lneárs regresszó y ax b h (x,y ) h szabadság fokok száma: ebben a specáls esetben = 1. általában: sz.f.=(s-1)(o-1), ahol s a sorok száma o az oszlopok száma y: függő változó x: független változó h : hbatag = y (ax +b). (A különbség a megfgyelt és a feltételezett érték között) Q h h A legksebb négyzetek módszere y ax b x és y mért értékek. a és b az smeretlen! Melyk a legjobban lleszkedő egyenes? Q h mnmáls! Q a Q xy xx n x xy y n x x 1 b y a x 1 Kapcsolat az nzuln érzékenység és a BMI között. r : determnácós koeffcens. független regresszós eggyüttható st. hba t p döntés BMI -0,077 0,018-4,5 0,0011 szgnfkáns r 0,6 13
Feladat Megmértük egy csoport kolesztern szntjét egy hatóanyag beadása előtt és utána. A két adatsorból számolt p érték: 0,05. Mlyen módszerrel kaptuk az értéket és mlyen döntést hozna 5%-os szgnfkanca sznt mellett? Rövden ndokolja a válaszát. 14