BIOSTATISZTIKA ÉS INFORMATIKA Leíró statisztika Első közelítésbe a statisztikai tevékeységeket égy csoportba sorolhatjuk, de ezek között ics éles határ:. adatgyűjtés, 2. az adatok áttekithetővé tétele, (ehhez ics szükség a valószíűség fogalmára: leíró statisztika) 3. az adatok elemzése, 4. következtetések (a valószíűségszámítás alapjai élkül em agyo érthető) iduktív statisztika. adatgyűjtés az adatgyűjtés valamilye cél eléréséhez szükséges (azoosítás, megkülöböztetés) az adatok egy része ismert, csak meg kell kérdezi valakitől, másik részét csak meg kell figyeli, egy harmadikat meg kell méri valahogy (orvosi vizsgálat)
2. az adatok áttekithetővé tétele A mideapi életbe is gyakra előfordul, hogy egy probléma kapcsá viszoylag sok adat áll redelkezésükre. Ilye esetekbe szükséges, hogy az adatokról valamilye áttekitésük legye. 2/a táblázat Kórokozó Betegség abszolút gyakoriság Salmoellosis relatív gyakoriság feltételes relatív gyakoriság (szalmoella fertőzés) 94 0,280 0,452 baktérium Scarlatia (skarlát) 02 208 0,303 0,69 0,490,000 egyéb bakteriális eredetű 2 0,036 0,058 Hepatitis ifectiosa (fertőző májgyulladás) 22 0,065 0,75 vírus Mooucleosis ifectiosa 22 26 0,065 0,375 0,75,000 Lyssa (veszettség) 74 0,220 0,587 egyéb vírusos eredetű 8 0,025 0,063 egyéb egyéb fertőző betegségek 2 2 0,006 0,006,000,000 összese 336 336,000,000 abszolút gyakoriságok relatív gyakoriságok háyados, ezért emcsak azt kell tisztázi, hogy miek a relatív gyakoriságáról beszélük, haem azt is, hogy mihez viszoyítuk feltételes relatív gyakoriságok a külöbség csupá ayi, hogy itt szűkebb összességhez viszoyított relatív gyakoriságról va szó Összegzési szabályok az abszolút gyakoriságok midig összeadhatók a relatív gyakoriságok is összeadhatók abba az esetbe, ha ugyaahhoz az összességhez viszoyítjuk őket 2
Szorzási szabály Feladat: Egyetemükö a tavalyi vizsgáko az elégtele osztályzatok relatív gyakorisága 0,5, a sikeres vizsgák között a jelesek relatív gyakorisága 0,2 volt. Az összes vizsgajegy között meyi volt a jeles relatív gyakorisága? 2/b grafiko torta diagram oszlop diagram 3
Számszerű adatok jellemzői Emlékeztető: baktérium populáció szaporodása A változások determiisztikus és sztochasztikus része midig egyszerre fordul elő. Va-e mód a szétválasztásukra? Kiidulásképpe tegyük fel, hogy egyelőre csak olya adatokat vizsgáluk, ahol ics determiisztikus változás. folytoos eset diszkrét eset 4
Vegyük kokrét számokat. 85,03684782 85,0 85,047257389 85,0 84,8050250975 84,8 84,987905059 85,0 85,795262649 85,2 + 95 számadat A folytoos esetbe sohasem kapuk egyforma adatokat. A diszkrét esetbe meg kell aduk a gyakoriságokat is. 5
Gyakorisági eloszlás A diszkrét esetbe egyértelmű. A folytoos esetbe alakja függ az itervallumok, más éve az osztályok megválasztásától (de általába em agyo). A jobb összehasolíthatóság kedvéért sokszor a relatív gyakoriságokat adjuk meg. Pl. Fizetési kimutatás (Ft): 20 és < 30 ezer között 24 4% 30 és < 40 ezer között 95 22% 40 és < 60 ezer között 293 33% 60 és < 200 ezer között 95 22% 200 és 300 ezer között 80 9% összese 887 00% Hogya szemléltessük? Hisztogram az oszlopok területe adja meg a relatív gyakoriságokat. A teljes terület 00 %, vagyis. Ameyibe az oszlopok egyforma szélesek, tehát egyeközű osztályszélességek eseté a két ábrázolás azoos. 6
Eloszlásfüggvéy Az x, x 2, x 3, adatredszer F eloszlásfüggvéye: F( x) = az x él kisebb adatok darabszáma Pl. () [, 2, 5, 6] Pl. (2) A korábbi 00 adat folytoos esetbe. Pl. (3) A korábbi 00 adat diszkrét esetbe. Az oszlopok a relatív gyakoriságokat mutatják. Ezeket egymás utá összeadva megkapjuk az eloszlásfüggvéy megfelelő értékeit. Az állítás megfordítása is igaz. Az eloszlásfüggvéy külöbségei a relatív gyakoriságokat adják meg. 7
Kevés adat eseté em látszaak a gyakorisági eloszlás jellegzetességei. egy csúcsú szimmetrikus jobbra ferde balra ferde csúcsos lapult Számszerű jellemzők (midig meghatározhatók): Középértékek ( elemű adatredszer) több csúcsú. az adatredszer átlaga (számtai közép).pl.,2,2,7; 2.Pl.,,3,7 4 + 2 + 2 + 7 xátlag = x = = 3 = x 4 4 i= i = i= x i Érzékey a kiugró értékekre! Helyzeti középértékek (helyzetükél fogva azok) 2. az adatredszer mediája (x mediá ) agyság szerit sorba redezzük az adatokat és megkeressük a középsőt vagy középsőket.pl.,2,2,7 x mediá = 2; 2.Pl.,,3,7 x mediá = 3 3. ha az adatredszerbe vaak azoosak, akkor azt, amelyikből a legtöbb va az adatredszer móduszáak (x módusz ) evezzük (ebből lehet több is) ( mode divatos).pl.,2,2,7 x módusz = 2; 2.Pl.,,3,7 x módusz = Nem érzékeyek a kiugró értékekre! 8
Kvatilisek (osztóértékek) Mekkora jövedelem eseté tartozik valaki a felső tízezer -be. Az adatokat először itt is agyság szerit sorba redezzük. Pl. alsó kvartilis, középső kvartilis = mediá, felső kvartilis p = 3,75 (-p) =,25 Legye p 0 és közötti szám az adatredszer p-kvatiliséek evezzük azt a számot, amelyél kisebb adatok darabszáma legfeljebb p és amelyél agyobb adatok darabszáma legfeljebb ( p) kvitilis (p = /5), decilis (p = /0), percetilis (p = /00) 9
A szóródás jellemzői. az adatredszer legagyobb és legkisebb eleméek eltérése az adatredszer terjedelme Mekkora az adatok (átlagos) eltérése az átlagtól?.pl.,2,2,7 (3 ) + (3 2) +(3 2) +(3 7) = 0 2.Pl.,,3,7 (3 ) + (3 ) +(3 3) +(3 7) = 0 ( x i x) = 0 i= Mekkora az adatok (átlagos) abszolút eltérése a mediától? Belátható, hogy miimális, azaz legye x* egy rögzített érték, akkor az x i x * i= kifejezés akkor miimális, ha x* = x mediá Mekkora az adatok (átlagos) égyzetes eltérése az átlagtól? Belátható, hogy miimális, azaz legye x* egy rögzített érték, akkor az 2 ( x i x*) kifejezés akkor miimális, ha x* = x átlag i= 2. az adatredszer átlagától vett égyzetes eltérések átlagát az adatredszer szóráségyzetéek vagy variaciájáak evezzük, az adatredszer szórását pedig az s x = i= ( x i x) 2 kifejezés adja meg További jellemzők is megadhatók (ferdeségre, csúcsosságra). 0