Mintavétel fogalmai STATISZTIKA, BIOMETRIA. Mintavételi hiba. Statisztikai adatgyűjtés. Nem véletlenen alapuló kiválasztás

Hasonló dokumentumok
STATISZTIKA I. Mintavétel fogalmai. Mintavételi hiba. Statisztikai adatgyűjtés Nem véletlenen alapuló kiválasztás

STATISZTIKA I. A változók mérési szintjei. Nominális változók. Alacsony és magas mérési szint. Nominális változó ábrázolása

STATISZTIKA. rgykód. beosztás. Oktatók. Időbeoszt. Tematika. 1. előadás MTB Szeptember 15. November 28.

KÖVETKEZTETŐ STATISZTIKA

Statisztika I. 8. előadás. Előadó: Dr. Ertsey Imre

Orvosi szociológia (1. szeminárium) KUTATÁSMÓDSZERTAN

Statisztika I. 4. előadás Mintavétel. Kóczy Á. László KGK-VMI. Minta Mintavétel Feladatok.

Statisztika I. 4. előadás Mintavétel. Kóczy Á. László KGK-VMI. Minta Mintavétel Feladatok.

[Biomatematika 2] Orvosi biometria

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1

Mi az adat? Az adat elemi ismeret. Az adatokból információkat

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

[Biomatematika 2] Orvosi biometria

Biomatematika 2 Orvosi biometria

Statisztikai alapok. Leíró statisztika Lineáris módszerek a statisztikában

Statisztika elméleti összefoglaló

A mérés problémája a pedagógiában. Dr. Nyéki Lajos 2015

Bevezetés a biometriába Dr. Dinya Elek egyetemi tanár. PhD kurzus

Bevezető Mi a statisztika? Mérés Csoportosítás

KUTATÁSMÓDSZERTAN 4. ELŐADÁS. A minta és mintavétel

6. Előadás. Vereb György, DE OEC BSI, október 12.

Bevezetés a biometriába Dr. Dinya Elek egyetemi tanár. PhD kurzus. KOKI,

[GVMGS11MNC] Gazdaságstatisztika

biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás

Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus.

Mintavételi eljárások

3/29/12. Biomatematika 2. előadás. Biostatisztika = Biometria = Orvosi statisztika. Néhány egyszerű definíció:

Matematikai alapok és valószínőségszámítás. Középértékek és szóródási mutatók

A statisztika alapjai - Bevezetés az SPSS-be -

[Biomatematika 2] Orvosi biometria

Adatok statisztikai értékelésének főbb lehetőségei

Bevezetés az SPSS program használatába

Kiválasztás. A változó szerint. Rangok. Nem-paraméteres eljárások. Rang: Egy valamilyen szabály szerint felállított sorban elfoglalt hely.

y ij = µ + α i + e ij STATISZTIKA Sir Ronald Aylmer Fisher Példa Elmélet A variancia-analízis alkalmazásának feltételei Lineáris modell

MINTAVÉTELEZÉS. Alaptípusai: sampling. véletlen érvényesítésére v. mellőzzük azt. = preferenciális mintav. = véletlen mintav.

Valószínűségi változók. Várható érték és szórás

y ij = µ + α i + e ij

Biomatematika 2 Orvosi biometria

Matematikai alapok és valószínőségszámítás. Statisztikai becslés Statisztikák eloszlása

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok

Mintavétel. Kovács István BME Menedzsment és Vállalatgazdaságtan. Tanszék

Mérési hibák

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Matematikai statisztika. Mi a modell? Binomiális eloszlás sűrűségfüggvény. Binomiális eloszlás

A Statisztika alapjai

1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása

Statisztika. Politológus képzés. Daróczi Gergely április 24. Politológia Tanszék

Statisztika I. 9. előadás. Előadó: Dr. Ertsey Imre

STATISZTIKA. A Föld pályája a Nap körül. Philosophiae Naturalis Principia Mathematica (A természetfilozófia matematikai alapelvei, 1687)

Statisztikai becslés

Nagy számok törvényei Statisztikai mintavétel Várható érték becslése. Dr. Berta Miklós Fizika és Kémia Tanszék Széchenyi István Egyetem

STATISZTIKA Mezőgazdászok részére

STATISZTIKA. A maradék független a kezelés és blokk hatástól. Maradékok leíró statisztikája. 4. A modell érvényességének ellenőrzése

STATISZTIKA. András hármas. Éva ötös. Nóri négyes. 5 4,5 4 3,5 3 2,5 2 1,5 ANNA BÉLA CILI 0,5 MAGY. MAT. TÖRT. KÉM.

GVMST22GNC Statisztika II. Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet

Populációbecslések és monitoring

Hipotézis, sejtés STATISZTIKA. Kétmintás hipotézisek. Tudományos hipotézis. Munkahipotézis (H a ) Nullhipotézis (H 0 ) 11. Előadás

Az empirikus vizsgálatok alapfogalmai

Kabos: Statisztika II. t-próba 9.1. Ha ismert a doboz szórása de nem ismerjük a

Dr. Nagy Zita Barbara igazgatóhelyettes KÖVET Egyesület a Fenntartható Gazdaságért november 15.

A statisztika alapjai - Bevezetés az SPSS-be -

Khi-négyzet eloszlás. Statisztika II., 3. alkalom

Statisztika 2. Dr Gősi Zsuzsanna Egyetemi adjunktus

STATISZTIKA. Egymintás u-próba. H 0 : Kefir zsírtartalma 3% Próbafüggvény, alfa=0,05. Egymintás u-próba vagy z-próba

Kettőnél több csoport vizsgálata. Makara B. Gábor MTA Kísérleti Orvostudományi Kutatóintézet

A maximum likelihood becslésről

Statisztikai alapismeretek (folytatás) 4. elıadás (7-8. lecke) Becslések, Hipotézis vizsgálat

Statisztika I. 11. előadás. Előadó: Dr. Ertsey Imre

A leíró statisztikák

Huzsvai László. STATISZTIKA Gazdaságelemzők részére Excel és R alkalmazások

STATISZTIKA I. Változékonyság (szóródás) A szóródás mutatószámai. Terjedelem. Forgalom terjedelem. Excel függvények. Függvénykategória: Statisztikai

Populációbecslések és monitoring

SZÁMÍTÓGÉPES ADATFELDOLGOZÁS

x, x R, x rögzített esetén esemény. : ( ) x Valószínűségi Változó: Feltételes valószínűség: Teljes valószínűség Tétele: Bayes Tétel:

Eloszlás-független módszerek (folytatás) 14. elıadás ( lecke) 27. lecke khí-négyzet eloszlású statisztikák esetszámtáblázatok

Kvantitatív kutatás mire figyeljünk? Majláth Melinda PhD Tartalom. Kutatási kérdés kérdőív kérdés. Kutatási kérdés kérdőív kérdés

Statisztikai következtetések Nemlineáris regresszió Feladatok Vége

Kutatásmódszertan és prezentációkészítés

VIZSGADOLGOZAT. I. PÉLDÁK (60 pont)

Közösségi kezdeményezéseket megalapozó szükségletfeltárás módszertana. Domokos Tamás, módszertani igazgató

Leíró statisztika. Adatok beolvasása az R-be és ezek mentése

Statisztika I. 10. előadás. Előadó: Dr. Ertsey Imre

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Bevezető Adatok rendezése Adatok jellemzése Időbeli elemzés

Több valószínűségi változó együttes eloszlása, korreláció

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Matematikai statisztika c. tárgy oktatásának célja és tematikája

Biometria gyakorló feladatok BsC hallgatók számára

Mintavétel: terv és eljárások

STATISZTIKA. Mit nevezünk idősornak? Az idősorok elemzésének módszertana. Az idősorelemzés célja. Determinisztikus idősorelemzés

MÉRÉSI EREDMÉNYEK PONTOSSÁGA, A HIBASZÁMÍTÁS ELEMEI

Kísérlettervezés alapfogalmak

ÉRZÉKELŐK ÉS BEAVATKOZÓK I. 3. MÉRÉSFELDOLGOZÁS

A TÁRKI ADATFELVÉTELEINEK DOKUMENTUMAI. Omnibusz 2003/08. A kutatás dokumentációja. Teljes kötet

VALÓSZÍNŰSÉG, STATISZTIKA TANÍTÁSA

Sta t ti t s i zt z i t k i a 1. előadás

Függetlenségvizsgálat, Illeszkedésvizsgálat

Vargha András Károli Gáspár Református Egyetem Budapest

KÖZPONTI STATISZTIKAI HIVATAL. Szóbeli vizsgatevékenység

Mintavétel: terv és eljárások

Átírás:

STATISZTIKA, BIOMETRIA. Előadás Mintavétel, mintavételi technikák, adatbázis Mintavétel fogalmai A mintavételt meg kell tervezni A sokaság elemei: X, X X N, lehet véges és végtelen Mintaelemek: x, x x n, mindig véges Véletlen minta = a minta elemek véletlen kiválasztása Kiválasztási arány : Mintavételi hiba Statisztikai adatgyűjtés Abból adódik, hogy nem a teljes sokaságot figyeljük meg. A sokaság heterogén. Kísérletek (ellenőrzött) Részleges adatfelvétel Reprezentatív megfigyelés Teljes körű (cenzus) Véletlen mintavétel Nem véletlen mintavétel Véletlen mintavétel Homogén sokaság esetén FAE: független azonos eloszlású minta EV: egyszerű véletlen minta Heterogén sokaság esetén R: rétegzett mintavétel Cs: csoportos (egylépcsős) mintavétel TL: többlépcsős mintavétel Nem véletlenen alapuló kiválasztás Szisztematikus Kvótás Hólabda Koncentrált Önkényes Egyéb

A kísérlet tulajdonságai Jó kísérlet Kezeléshatások Véletlen hiba Rossz kísérlet Kezeléshatások Szisztematikus hiba Véletlen hiba Reprezentatív minta tulajdonságai Tükrözi az alapsokaság jellemzőit (lehet általánosítani) Csak a mintavételi hibát tartalmazza Meghatározható a mintavételi hiba nagysága NEM reprezentatív minta tulajdonságai Nem lehet belőle általánosítani A mintavételi hiba mellett szisztematikus hibát is tartalmaz A levont következtetések kizárólag a megfigyelt egyedekre vonatkoznak Véletlen mintavétel, szisztematikus hiba Minden elem egymástól függetlenül és azonos valószínűséggel kerül a mintába (véletlen számok) Előnye: a belőle származtatott statisztikai mutatók csak a véletlen eltérést mutatják az alapsokaság mutatójához képest Szelekció szisztematikus hiba Reprezentativitás Véletlen minta előállítása Véletlen szám generátor Pszeudó véletlen szám generátor Rnd() függvény Excel Vél() függvénye VÉL()*(b-a)+a Statisztikai Valamely paraméter ismeretlen (feltételezett) tényleges értékének közelítő megadása egy statisztikai függvénnyel. Elvileg bármelyik statisztikai függvény tekinthető nek, valójában csak azokat használjuk, amelyeknek megvannak a jó legfontosabb tulajdonságai

A jó kritériumai Kis minta tulajdonságai Torzítatlanság (becsült várható érték = valódi érték) Hatásosság (variancia) Nagy minta tulajdonságai Konzisztencia Torzítatlan és konzisztens Olyan, amelynek várható értéke az igazi paraméter (torzítatlan) Olyan, amely a minta n elemszámának növekedésével (n ) a paraméter igazi értékéhez konvergál sztochasztikusan (erős konzisztencia esetén valószínűséggel) Torzítatlan és hatásos Torzított és hatásos Torzítatlan, de nem hatásos Torzított és nem hatásos

Mi az adatbázis Egy témakör vagy cél köré csoportosuló információ. Jó tervezés = hatékony adattárolás és információkinyerés Célorientált adatbázisok Adatbázis tervezés Milyen információt akarunk kinyerni? Milyen elkülönülő tématerületeken kell tárolni az adatokat? Hogyan kapcsolódnak ezek egymáshoz? Az egyes területeken belül milyen adatokat kell tárolni? Mi az adat? Minden információ, amit tárolni kell. szám szöveg dátum hang kép, stb. A mértékegységek többszörösei kilo- k 0 mega- M 0 6 giga- G 0 9 tera- T 0 peta- P 0 exa- E 0 8 SI (Systém International d Unités) Adatbázis felépítése Tábla Tábla (table) Ismérv, tulajdonság, változó, Mező (field) Megfigyelési egység, szubjektum, Rekord (record) Oszlop = változó Sor = megfigyelési egység, rekord

A jó adatbázis (kritériumok). minden mezőnek egyedi neve van a mezők elemi információt tartalmaznak A jó adatbázis (kritériumok)..nem lehet két egyforma sora.a sorok és oszlopok sorrendje tetszőleges ID Év Hely Tömeg Hosszúság ID Év Hely Tömeg Hosszúság A jó adatbázis (kritériumok)..ne tartalmazzon származtatott, kiszámított adatot (redundancia) 6.egy mező megváltoztatása nem hathat ki más mezőkre Rossz adatbázis ID Kérdés Válasz Válasz Válasz Válasz Helyes Hol? Itt Ott Amott Emitt ID Év Nettó ÁFA Bruttó A jó adatbázis (kritériumok). 7.minden szükséges adatot tartalmaz 8.van elsődleges kulcsa ID Év Hely Tömeg Hosszúság A változók mérési szintjei A változók az alábbi típusba tartozhatnak: Nominális (kategorikus és diszkrét) Ordinális Intervallum skála Arányskála

Alacsony és magas mérési szint Az alacsony mérési szintű változók: nominális (középértéke a módusz, a leggyakrabban előforduló adat) ordinális (középértéke a medián, a középen elhelyezkedő adat) Magas mérési szintű változók: intervallum arányskála? Nominális változók Nominális változó jellemzői Megszámlálható Gyakoriság Jellemző értéke: módusz Távolság és arány nem értelmezett a kategóriák között. Számítások a gyakorisági értékekkel. Mit lehet kiszámítani belőlük? Milyen kérdéseket lehet megfogalmazni? Nominális változó ábrázolása Ordinális skála Sorrenden alapuló skála Az egyes kategóriák kvantitatív alapon sorba rendezhetők Az objektumok közötti eltérés mértéke nem ismert Jellemző értéke: medián Intervallumskála Az egyes kategóriák kvantitatív alapon sorba rendezhetők Az objektumok közötti eltérés mértéke ismert Nincs abszolút nulla pont Jellemző értéke: átlag 6

Arányskála Az intervallumskála jellemzőivel rendelkezik Abszolút nullaponttal rendelkezik Jellemző értéke: átlag Elfogadná házastársnak? 7