Statisztikai alapok. Leíró statisztika Lineáris módszerek a statisztikában

Hasonló dokumentumok
Az empirikus vizsgálatok alapfogalmai

Változók eloszlása, középértékek, szóródás

Matematikai alapok és valószínőségszámítás. Statisztikai változók Adatok megtekintése

Orvosi szociológia (1. szeminárium) KUTATÁSMÓDSZERTAN

Mintavétel fogalmai STATISZTIKA, BIOMETRIA. Mintavételi hiba. Statisztikai adatgyűjtés. Nem véletlenen alapuló kiválasztás

[Biomatematika 2] Orvosi biometria

6. Előadás. Vereb György, DE OEC BSI, október 12.

Vargha András Károli Gáspár Református Egyetem Budapest

Biomatematika 2 Orvosi biometria

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1

Biomatematika 2 Orvosi biometria

Mi az adat? Az adat elemi ismeret. Az adatokból információkat

[Biomatematika 2] Orvosi biometria

3/29/12. Biomatematika 2. előadás. Biostatisztika = Biometria = Orvosi statisztika. Néhány egyszerű definíció:

[Biomatematika 2] Orvosi biometria

Matematikai alapok és valószínőségszámítás. Statisztikai becslés Statisztikák eloszlása

1 Hipot ezisek, sk alat ıpusok Objektumok az R-ben

Leíró statisztika. Adatok beolvasása az R-be és ezek mentése

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Statisztika I. 8. előadás. Előadó: Dr. Ertsey Imre

Bevezetés a biometriába Dr. Dinya Elek egyetemi tanár. PhD kurzus

biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás

Matematikai alapok és valószínőségszámítás. Középértékek és szóródási mutatók

A mérés problémája a pedagógiában. Dr. Nyéki Lajos 2015

Statisztika I. 4. előadás Mintavétel. Kóczy Á. László KGK-VMI. Minta Mintavétel Feladatok.

Bevezetés a biometriába Dr. Dinya Elek egyetemi tanár. PhD kurzus. KOKI,

Adatok statisztikai értékelésének főbb lehetőségei

Kutatásmódszertan és prezentációkészítés

Statisztika I. 4. előadás Mintavétel. Kóczy Á. László KGK-VMI. Minta Mintavétel Feladatok.

y ij = µ + α i + e ij

ORVOSI STATISZTIKA. Az orvosi statisztika helye. Egyéb példák. Példa: test hőmérséklet. Lehet kérdés? Statisztika. Élettan Anatómia Kémia. Kérdések!

A Statisztika alapjai

y ij = µ + α i + e ij STATISZTIKA Sir Ronald Aylmer Fisher Példa Elmélet A variancia-analízis alkalmazásának feltételei Lineáris modell

Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus.

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Matematikai statisztika. Mi a modell? Binomiális eloszlás sűrűségfüggvény. Binomiális eloszlás

[Biomatematika 2] Orvosi biometria

Populációbecslések és monitoring

Hipotézis, sejtés STATISZTIKA. Kétmintás hipotézisek. Tudományos hipotézis. Munkahipotézis (H a ) Nullhipotézis (H 0 ) 11. Előadás

A valószínűségszámítás elemei

Populációbecslések és monitoring

STATISZTIKA. András hármas. Éva ötös. Nóri négyes. 5 4,5 4 3,5 3 2,5 2 1,5 ANNA BÉLA CILI 0,5 MAGY. MAT. TÖRT. KÉM.

Matematikai alapok és valószínőségszámítás. Valószínőségi eloszlások Binomiális eloszlás

Biometria az orvosi gyakorlatban. Számítógépes döntéstámogatás

[Biomatematika 2] Orvosi biometria. Visegrády Balázs

V. Gyakorisági táblázatok elemzése

STATISZTIKA I. A változók mérési szintjei. Nominális változók. Alacsony és magas mérési szint. Nominális változó ábrázolása

Módszertani Intézeti Tanszéki Osztály. A megoldás részletes mellékszámítások hiányában nem értékelhető!

Valószínűségszámítás összefoglaló

x, x R, x rögzített esetén esemény. : ( ) x Valószínűségi Változó: Feltételes valószínűség: Teljes valószínűség Tétele: Bayes Tétel:

Gyakorló feladatok. Az alábbi feladatokon kívül a félév szemináriumi anyagát is nézzék át. Jó munkát! Gaál László

Az első számjegyek Benford törvénye

KÖVETKEZTETŐ STATISZTIKA

Valószínűségi változók. Várható érték és szórás

Kísérlettervezés alapfogalmak

A valószínűségszámítás elemei

A kockázat fogalma. A kockázat fogalma. Fejezetek a környezeti kockázatok menedzsmentjéből 2 Bezegh András

Területi statisztikai elemzések

A mintavétel szakszerűtlenségeinek hatása a monitoring-statisztikákra

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok

STATISZTIKA. A maradék független a kezelés és blokk hatástól. Maradékok leíró statisztikája. 4. A modell érvényességének ellenőrzése

Segítség az outputok értelmezéséhez

Matematikai statisztika c. tárgy oktatásának célja és tematikája

NEVEZETES FOLYTONOS ELOSZLÁSOK

Bevezető Mi a statisztika? Mérés Csoportosítás

Kísérlettervezés alapfogalmak

GRADUÁLIS BIOSTATISZTIKAI KURZUS február hó 22. Dr. Dinya Elek egyetemi docens

Dr. Nagy Zita Barbara igazgatóhelyettes KÖVET Egyesület a Fenntartható Gazdaságért november 15.

Normális eloszlás tesztje

Statisztikai becslés

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió

Függetlenségvizsgálat, Illeszkedésvizsgálat

[GVMGS11MNC] Gazdaságstatisztika

Biostatisztika Összefoglalás

A statisztika alapjai - Bevezetés az SPSS-be -

Bevezetés az SPSS program használatába

Matematika A3 Valószínűségszámítás, 6. gyakorlat 2013/14. tavaszi félév

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Bevezetés az SPSS program statisztikai alapjaiba. Előadó: Dr. Balogh Péter

Kettőnél több csoport vizsgálata. Makara B. Gábor MTA Kísérleti Orvostudományi Kutatóintézet

A leíró statisztikák

Nagy számok törvényei Statisztikai mintavétel Várható érték becslése. Dr. Berta Miklós Fizika és Kémia Tanszék Széchenyi István Egyetem

18. modul: STATISZTIKA

A mérések általános és alapvető metrológiai fogalmai és definíciói. Mérések, mérési eredmények, mérési bizonytalanság. mérés. mérési elv

MINTAVÉTELEZÉS. Alaptípusai: sampling. véletlen érvényesítésére v. mellőzzük azt. = preferenciális mintav. = véletlen mintav.

Gazdasági matematika II. vizsgadolgozat megoldása A csoport

GVMST22GNC Statisztika II. Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet

Mintavétel. Kovács István BME Menedzsment és Vállalatgazdaságtan. Tanszék

Biostatisztika VIII. Mátyus László. 19 October

Bevezető Adatok rendezése Adatok jellemzése Időbeli elemzés. Gazdaságstatisztika KGK VMI

Microsoft Excel Gyakoriság

Többváltozós lineáris regressziós modell feltételeinek tesztelése I.

Matematika III. 4. A valószínűségi változó és jellemzői Prof. Dr. Závoti, József

Bevezető Adatok rendezése Adatok jellemzése Időbeli elemzés

e (t µ) 2 f (t) = 1 F (t) = 1 Normális eloszlás negyedik centrális momentuma:

MATEMATIKA HETI 5 ÓRA. IDŐPONT: Június 4.

Matematikai statisztika

Többváltozós lineáris regressziós modell feltételeinek

Több valószínűségi változó együttes eloszlása, korreláció

A következő feladat célja az, hogy egyszerű módon konstruáljunk Poisson folyamatokat.

Mérési hibák

Átírás:

Statisztikai alapok Leíró statisztika Lineáris módszerek a statisztikában

Tudományosan és statisztikailag tesztelhető állítások? A keserűcsokoládé finomabb, mint a tejcsoki. A patkány a legrondább állat, a pók szorosan követi. A nők arra vannak teremtve, hogy ellássák a háztartást. Szebbek-e a magyar nők, mint az olaszok? Miért? Ezek szubjektív vélekedések; és ezek kvalitatív tulajdonságok (kategóriák), azaz nehezen tesztelhetőek közvetlenül számszerű adatokkal, nehezen mérhetőek (a méréséhez kell némi módszertani ismeret és konszenzus).

A tudományosság alapfeltételei (Karl Popper) 1. Falszifikálhatóság/megcáfolhatóság: Az elméletünknek/állításunknak megcáfolhatónak kell lennie. Egy nagy szörny lakik a Loch Ness-i tóban. (?) 2. Operacionalizálás lehetősége (számszerűsíthetőség): Kérdésfeltevés úgy, hogy empirikusan megfigyelhető adatok alapján megválaszolható legyen. A mai emberek igénytelenebbül beszélnek mint a régiek. (?) 3. Reprodukálhatóság: A kísérleti dizájn és a felhasznált módszerek alapján az eredményeknek megismételhetőknek kell lenniük. Előfeltétel: módszerek részletes leírása. 4. Objektivitás: Függetlenség a kísérletvezetőtől és a kísérlet körülményeitől. Tudok egy tavat, ahol fekete hattyúk élnek, oda megyek kísérletezni!

A tudományos megfigyelések: kvalitatív és kvantitatív adatok Kvantitatív: megszámolható vagy mérhető egységek. Kvalitatív vagy kategorikus: nem számszerű, kategóriákba tartozó, pl. szemszín, vallás, vélekedés arról, hogy szép.

Az empirikus vizsgálatok néhány alapfogalma Populáció = statisztikai sokaság: az egyéneknek az a csoportja, akikre az állítás vonatozik. (Nem a teljes emberiség, hanem pl. az idősek vagy cukorbetegek, stb.) Valamely olyan közös tulajdonsággal rendelkezik, Amely alapján eldönthető, hogy egy egyed a populációba tartozik-e. A populáció tulajdonságait nem tudom a populáció egészén vizsgálni ~ Sajtból van a Hold nem tudok kimerítő vizsgálatot végezni Megfigyelési egységek: amikre/akikre vonatkozóan a megfigyelést teszem (pl. vizsgálati személyek; nyelvi egységek, pl. beszédhangok; gyümölcsfák, stb.)

Az empirikus vizsgálatok néhány alapfogalma Minta: A kutatásba ténylegesen bevont megfigyelési egységek együttese pontosabban a vizsgált változó ezeken az egységeken mért értéke (nem Kovács Sanyi, hanem 192 cm) A minta alapján megfogalmazott következtetés csak akkor utal a populációra, ha a minta reprezentatív, tehát jól leképezi a populáció tulajdonságait. Ez hogyan biztosítható? Mivel a populáció tulajdonságait nem, vagy nem jól ismerjük, a reprezentatív mintavétel úgy biztosítható, ha a mintavétel véletlen és független tehát a populáció minden tagjának egyenlő esélye van bekerülni. Irányítottan reprezentatív mintavétel: a minta rétegzettsége leképezi a társadalmat (ez nagyon ritka, főként mert nagyon nehéz)

Az empirikus vizsgálatok néhány alapfogalma A mintabeli egységek nem teljességükben, csak bizonyos jellemzőik, paramétereik tekintetében vizsgáljuk (Pl. vajdasági és mo.-i magyarok összevetése antropometriai? Pszichológiai? Szociológiai? nyelvi?). Statisztikai változó vagy változó: Meg kell határozni, milyen ismérvek hordozzák a kérdéses jelenségről az információt (pl. nem, életkor, vérnyomás, tetszés mértéke egy ötfokú skálán, formánsfrekvenciák, stb).

Értékskálák és változótípusok A számok tulajdonságai alapján négy különböző erősségű eltérő rendű értékskálát határozhatunk meg: 1. Arányskála (arányskálájú vált.) 2. Intervallum-skála (intervallum skálájú vált.) a számok minden tulajdonságával rendelkezik 3. Ordinális skála (ordinális vált.) 4. Nominális skála (nominális vált.) a számok egyik tulajdonságával sem rendelkezik

Változók további tulajdonságai Kvalitatív (kategorikus): nominális, ordinális Kvantitatív: aránysk., intervallumsk. Diszkrét: megszámolható, véges érték Folytonos: értéke egy adott intervallumban akármilyen valós számot felvehet Kategóriák vagy csoportok: változók összefoglalása (pl. 25 és 35 év közöttiek fiatal felnőttek ). Egyszerűbb kezelés, de információvesztés.

Populáció jellemzése Empirikus kutatás (statisztikai elemzés) célja: a mintából a populációra következtetni inferenciális statisztika. Minta: egy adott változó a megfigyelési egységeken mért értékei. Minta elemzése/jellemzése: leíró statisztika. A leíró statisztikában megállapított jellemzők: Gyakoriság, Eloszlás, Középérték, Szóródás. Inferenciális statisztika: ezekkel a tulajdonságokkal becsüljük a populáció tulajdonságait.

Változók populációbeli eloszlása Statisztikai elemzés célja: a mintából a populációra következtetni. Egy megfigyelési egység: nő vagy férfi a populáció: nem nő v. ffi hanem x%-a nő a populációt nem a kategóriák, hanem az összetétel jellemzi Változó eloszlása: Egy populáció egy adott változó szerinti jellegét az adja meg, hogy annak egyes értékei milyen gyakran fordulnak elő az adott populációban.

Relatív gyakoriság (%) Diszkrét változók eloszlása: gyakoriság Mo. lakosságának iskolai végzettsége: alsófokú középfokú felsőfokú OSZLOPDIAGRAM Értékek gyakorisága (db): 3 150 000 4 500 000 1 800 000 (össz. = elemszám) Értékek relatív gyakorisága (%): 35% 45% 20% (össz. 100%) Értékek kumulatív gyakorisága (%, mediánhoz jön jól): 35% 80% 100% betűhossz Az érték előfordulásának valószínűsége: p = 0,35 p = 0,45 p = 0,20 (össz. 1)

Folytonos változók eloszlása: sűrűségfüggvény Folytonos változók: értékei a számegyenes egy adott intervallumán végtelen számosságúak lehetnek. Nem tudom megszámolni ( túl sok lenne az oszlop ). Megszámlálás helyett azt kellene megtudni, hogy az értékskála egyes övezeteibe a populáció hányad része esik. sűrűségfüggvény. Sűrűségfüggvény: Ez a fv. a változó minden x értékéhez egy nem negatív egész f(x) számot rendel: f(x) nagyobb azokra az x-ekre, melyek környezetében a populációbeli egyedek jobban sűrűsödnek.

Sűrűség Sűrűségfüggvény Folytonos változóra. Egy adott intervallumhoz eső területszelet területe egyenlő az a és b érték közti intervallumra eső értékekkel jellemezhető személyek és a populáció arányával azaz az adott értékek valószínűségével. A fenti okból a sűrűségfüggvény grafikonja alatti összterület mindig 1 (= a populáció 100%-a).

Sűrűség Sűrűségfüggvény értelmezése életkor 5 9 T (a,b) = a populációban az 5 és 9 év köztiek aránya Pl.: T = 0,63, akkor a populáció 63 %-a esik ebbe az életkori sávba T = 0,63 a valószínűsége (azaz 63%), hogy ennyi idős embert választok, ha véletlenül választok.

Eloszlás jelentése és jelentősége Sorrendbe állított elemek milyen gyakran fordulnak elő. Legalább ordinális adatok kellenek hozzá! Előállítás: folytonos vagy diszkrét értékek közti interpolációval. Interpoláció: a függvénytan (matematika) eszköze, nem ismert értékekre ismert értékek alapján ad becslést. Eloszlás jelentősége: ez a valószínűségi statisztikai elemzés alapja!

Valószínűségek és statisztika kapcsolata Valószínűségszámítás: ismerem a világot (populációt). Egy betegség előfordulási gyakorisága 20%. Mekkora a valószínűsége, hogy egy 50 elemű véletlenszerűen kiválasztott mintában négy beteget találunk? Statisztika: nem ismerem a világot (populációt), hanem a mintából próbálok következtetni rá. Ha 50 véletlenül kiválasztott egyed között 4 beteget találunk, mit állíthatunk a betegség előfordulási gyakoriságáról a populációban?