Biostatisztika és alkalmazásai

Méret: px
Mutatás kezdődik a ... oldaltól:

Download "Biostatisztika és alkalmazásai"

Átírás

1 2013. szeptember 25.

2 Tartalom 1 Mi a statisztika? 2 A statisztika alapfogalmai 3 Deskriptív statisztika A deskriptív statisztikáról általában Egyváltozós elemzés, minőségi változó Egyváltozós elemzés, mennyiségi változó Két minőségi változó kapcsolata: asszociáció Két mennyiségi változó kapcsolata: korreláció 4 Induktív statisztika A mintavételi helyzet konzekvenciái Becsléselmélet Hipotézisvizsgálat 5 Klinikai vizsgálatok

3 Tartalom 1 Mi a statisztika? 2 A statisztika alapfogalmai 3 Deskriptív statisztika A deskriptív statisztikáról általában Egyváltozós elemzés, minőségi változó Egyváltozós elemzés, mennyiségi változó Két minőségi változó kapcsolata: asszociáció Két mennyiségi változó kapcsolata: korreláció 4 Induktív statisztika A mintavételi helyzet konzekvenciái Becsléselmélet Hipotézisvizsgálat 5 Klinikai vizsgálatok

4 Mi a statisztika? Hivatalosan: A statisztika a valóság számszerűsíthető tényeinek szisztematikus összegyűjtésével és elemzésével foglalkozó tudományos módszer és gyakorlat Nemhivatalosan: A hazugságok három kategóriába sorolhatóak: kis hazugságok, gyalázatos hazugságok, és statisztikák (Benjamin Disraeli-nek tulajdonítva) A statisztika a matematika azon ága, melynek feladata, hogy eszközt adjon a politikusok kezébe, mellyel tetszőleges állítás és annak ellentéte is tudományos alapon igazolható (Általános iskolai matematika tanárom)

5 Mi a statisztika? Hivatalosan: A statisztika a valóság számszerűsíthető tényeinek szisztematikus összegyűjtésével és elemzésével foglalkozó tudományos módszer és gyakorlat Nemhivatalosan: A hazugságok három kategóriába sorolhatóak: kis hazugságok, gyalázatos hazugságok, és statisztikák (Benjamin Disraeli-nek tulajdonítva) A statisztika a matematika azon ága, melynek feladata, hogy eszközt adjon a politikusok kezébe, mellyel tetszőleges állítás és annak ellentéte is tudományos alapon igazolható (Általános iskolai matematika tanárom)

6 Mi a statisztika? Hivatalosan: A statisztika a valóság számszerűsíthető tényeinek szisztematikus összegyűjtésével és elemzésével foglalkozó tudományos módszer és gyakorlat Nemhivatalosan: A hazugságok három kategóriába sorolhatóak: kis hazugságok, gyalázatos hazugságok, és statisztikák (Benjamin Disraeli-nek tulajdonítva) A statisztika a matematika azon ága, melynek feladata, hogy eszközt adjon a politikusok kezébe, mellyel tetszőleges állítás és annak ellentéte is tudományos alapon igazolható (Általános iskolai matematika tanárom)

7 Mi a statisztika? Hivatalosan: A statisztika a valóság számszerűsíthető tényeinek szisztematikus összegyűjtésével és elemzésével foglalkozó tudományos módszer és gyakorlat Nemhivatalosan: A hazugságok három kategóriába sorolhatóak: kis hazugságok, gyalázatos hazugságok, és statisztikák (Benjamin Disraeli-nek tulajdonítva) A statisztika a matematika azon ága, melynek feladata, hogy eszközt adjon a politikusok kezébe, mellyel tetszőleges állítás és annak ellentéte is tudományos alapon igazolható (Általános iskolai matematika tanárom)

8 Miért statisztika? Akkor miért foglalkozzunk statisztikával? Ennek ellenére? Nem! Éppen ezért!

9 Miért statisztika? Akkor miért foglalkozzunk statisztikával? Ennek ellenére? Nem! Éppen ezért!

10 Miért statisztika? Akkor miért foglalkozzunk statisztikával? Ennek ellenére? Nem! Éppen ezért!

11 Miért jó, ha értünk a statisztikához? (Személyes vélemény jön) 3 fő szempont: 1 Hogy ne tudjanak átverni minket 2 Hogy új ismereteket szerezzünk 3 Hogy feltevéseinket precízen vizsgáljuk

12 Miért jó, ha értünk a statisztikához? (Személyes vélemény jön) 3 fő szempont: 1 Hogy ne tudjanak átverni minket 2 Hogy új ismereteket szerezzünk 3 Hogy feltevéseinket precízen vizsgáljuk

13 Miért jó, ha értünk a statisztikához? (Személyes vélemény jön) 3 fő szempont: 1 Hogy ne tudjanak átverni minket 2 Hogy új ismereteket szerezzünk 3 Hogy feltevéseinket precízen vizsgáljuk

14 Miért jó, ha értünk a statisztikához? (Személyes vélemény jön) 3 fő szempont: 1 Hogy ne tudjanak átverni minket 2 Hogy új ismereteket szerezzünk 3 Hogy feltevéseinket precízen vizsgáljuk

15 Miért jó, ha értünk a statisztikához? (Személyes vélemény jön) 3 fő szempont: 1 Hogy ne tudjanak átverni minket 2 Hogy új ismereteket szerezzünk 3 Hogy feltevéseinket precízen vizsgáljuk

16 Feltevések precíz vizsgálata Elsősorban az agrometriából indult a XX. század elején Nagyon hamar kapcsolódott az orvoslás is Ok: az orvostudomány empirikussá válása Később ez a gondolat az evidence-based medicine-ben teljesedett ki Például a gyógyszerkísérletek kapcsán hatalmas gyakorlati jelentősége van nüanszoknak is

17 Feltevések precíz vizsgálata Elsősorban az agrometriából indult a XX. század elején Nagyon hamar kapcsolódott az orvoslás is Ok: az orvostudomány empirikussá válása Később ez a gondolat az evidence-based medicine-ben teljesedett ki Például a gyógyszerkísérletek kapcsán hatalmas gyakorlati jelentősége van nüanszoknak is

18 Feltevések precíz vizsgálata Elsősorban az agrometriából indult a XX. század elején Nagyon hamar kapcsolódott az orvoslás is Ok: az orvostudomány empirikussá válása Később ez a gondolat az evidence-based medicine-ben teljesedett ki Például a gyógyszerkísérletek kapcsán hatalmas gyakorlati jelentősége van nüanszoknak is

19 Feltevések precíz vizsgálata Elsősorban az agrometriából indult a XX. század elején Nagyon hamar kapcsolódott az orvoslás is Ok: az orvostudomány empirikussá válása Később ez a gondolat az evidence-based medicine-ben teljesedett ki Például a gyógyszerkísérletek kapcsán hatalmas gyakorlati jelentősége van nüanszoknak is

20 Feltevések precíz vizsgálata Elsősorban az agrometriából indult a XX. század elején Nagyon hamar kapcsolódott az orvoslás is Ok: az orvostudomány empirikussá válása Később ez a gondolat az evidence-based medicine-ben teljesedett ki Például a gyógyszerkísérletek kapcsán hatalmas gyakorlati jelentősége van nüanszoknak is

21 Új ismeretek szerzése Adatok strukturálása, alkalmas megjelenítése, információtömörítés, lényegkiemelés Hatalmas motivációt jelent a számítástechnikai (és orvosi) lehetőségek fejlődése miatt létrejövő egyre nagyobb és nagyobb adatbázisok léte

22 Új ismeretek szerzése Adatok strukturálása, alkalmas megjelenítése, információtömörítés, lényegkiemelés Hatalmas motivációt jelent a számítástechnikai (és orvosi) lehetőségek fejlődése miatt létrejövő egyre nagyobb és nagyobb adatbázisok léte

23 Hogy ne tudjanak átverni minket A KSH szerint 2011-ben a magyar bruttó átlagkereset 213 ezer forint volt. Mégis, a másik táblázatból az derül ki, hogy az emberek 68%-a ennél kevesebbet keresett! Hogy a fenében lehetne akkor ez az átlag?! A KSH hazudik! A HRT-kezelésben részesülő nők körében 1,8-szer kevesebb a szív-érrendszeri megbetegedés, mint az ilyet nem kapók között. A HRT-kezelés tehát jó hatással van a kardiovaszkuláris rendszerre. A minap a suliból (munkahelyem) hazafelé tartva, a buszra vártam. Néhány diák a közelben beszélgetett. Az volt a téma, hogy milyen sokan hiányoznak az osztályból, mert betegek. Egyikük megjegyezte, hogy ő is azóta beteg, mióta megkapták az oltást.

24 Korreláció nem implikál kauzalitást Tűzoltók példája: a tűzesetben esett kár és a kiküldött tűzoltók száma HRT-s példa: HRT-kezelés megléte és a kardiovaszkuláris rizikó Két dolog együttjárásából nem következik, hogy az egyik okozza a másikat! T1DM és császármetszés: milyen confounder-ek jönnek szóba...?

25 Korreláció nem implikál kauzalitást Tűzoltók példája: a tűzesetben esett kár és a kiküldött tűzoltók száma HRT-s példa: HRT-kezelés megléte és a kardiovaszkuláris rizikó Két dolog együttjárásából nem következik, hogy az egyik okozza a másikat! T1DM és császármetszés: milyen confounder-ek jönnek szóba...?

26 Korreláció nem implikál kauzalitást Tűzoltók példája: a tűzesetben esett kár és a kiküldött tűzoltók száma HRT-s példa: HRT-kezelés megléte és a kardiovaszkuláris rizikó Két dolog együttjárásából nem következik, hogy az egyik okozza a másikat! T1DM és császármetszés: milyen confounder-ek jönnek szóba...?

27 Korreláció nem implikál kauzalitást Tűzoltók példája: a tűzesetben esett kár és a kiküldött tűzoltók száma HRT-s példa: HRT-kezelés megléte és a kardiovaszkuláris rizikó Két dolog együttjárásából nem következik, hogy az egyik okozza a másikat! T1DM és császármetszés: milyen confounder-ek jönnek szóba...?

28 A biostatisztika elhatárolása Valószínűségszámítás Statisztika Alkalmazott statisztikai ágak Biostatisztika, Pszichometria, Agrometria, Ökonometria stb. vs. bioinformatika: inkább számítástechnikai kérdések, nagy adatbázisokon hatékony algoritmus megoldások vs. biomatematika: inkább nem-statisztikai, elsősorban analízisbeli modellezési eszközök (pl. differenciál-egyenletek) használata

29 A biostatisztika elhatárolása Valószínűségszámítás Statisztika Alkalmazott statisztikai ágak Biostatisztika, Pszichometria, Agrometria, Ökonometria stb. vs. bioinformatika: inkább számítástechnikai kérdések, nagy adatbázisokon hatékony algoritmus megoldások vs. biomatematika: inkább nem-statisztikai, elsősorban analízisbeli modellezési eszközök (pl. differenciál-egyenletek) használata

30 A biostatisztika elhatárolása Valószínűségszámítás Statisztika Alkalmazott statisztikai ágak Biostatisztika, Pszichometria, Agrometria, Ökonometria stb. vs. bioinformatika: inkább számítástechnikai kérdések, nagy adatbázisokon hatékony algoritmus megoldások vs. biomatematika: inkább nem-statisztikai, elsősorban analízisbeli modellezési eszközök (pl. differenciál-egyenletek) használata

31 A biostatisztika elhatárolása Valószínűségszámítás Statisztika Alkalmazott statisztikai ágak Biostatisztika, Pszichometria, Agrometria, Ökonometria stb. vs. bioinformatika: inkább számítástechnikai kérdések, nagy adatbázisokon hatékony algoritmus megoldások vs. biomatematika: inkább nem-statisztikai, elsősorban analízisbeli modellezési eszközök (pl. differenciál-egyenletek) használata

32 Milyen alapokra van szükség, hogy biostatisztikával foglalkozzak? Valószínűségszámítás, lineáris algebra Matematikai statisztika Orvosi ismeretek

33 Milyen alapokra van szükség, hogy biostatisztikával foglalkozzak? Valószínűségszámítás, lineáris algebra Matematikai statisztika Orvosi ismeretek

34 Milyen alapokra van szükség, hogy biostatisztikával foglalkozzak? Valószínűségszámítás, lineáris algebra Matematikai statisztika Orvosi ismeretek

35 Statisztikai programcsomagok Mai biostatisztika elképzelhetetlen számítógépes támogatás nélkül Pár közismert, biostatisztikára (is) használható program: SAS Gyógyszeripar kedveli, jól standardizált, rettenetesen drága SPSS Általános célú statisztikai programcsomag (eredetileg szociológusoknak), az alap dolgokat könnyű megcsinálni, a komplexebbeket cserében nagyon nehéz R Klasszikus akadémiai programcsomag, az alap dolgokat sem könnyű megcsinálni, a komplexebbeket cserében viszont lehet; ingyenes és nyílt forráskódú (!),

36 Statisztikai programcsomagok Mai biostatisztika elképzelhetetlen számítógépes támogatás nélkül Pár közismert, biostatisztikára (is) használható program: SAS Gyógyszeripar kedveli, jól standardizált, rettenetesen drága SPSS Általános célú statisztikai programcsomag (eredetileg szociológusoknak), az alap dolgokat könnyű megcsinálni, a komplexebbeket cserében nagyon nehéz R Klasszikus akadémiai programcsomag, az alap dolgokat sem könnyű megcsinálni, a komplexebbeket cserében viszont lehet; ingyenes és nyílt forráskódú (!),

37 Statisztikai programcsomagok Mai biostatisztika elképzelhetetlen számítógépes támogatás nélkül Pár közismert, biostatisztikára (is) használható program: SAS Gyógyszeripar kedveli, jól standardizált, rettenetesen drága SPSS Általános célú statisztikai programcsomag (eredetileg szociológusoknak), az alap dolgokat könnyű megcsinálni, a komplexebbeket cserében nagyon nehéz R Klasszikus akadémiai programcsomag, az alap dolgokat sem könnyű megcsinálni, a komplexebbeket cserében viszont lehet; ingyenes és nyílt forráskódú (!),

38 Ez az előadás... Áttekintés a biostatisztika szempontjából legfontosabb statisztikai alapokról Részletek nélkül, csak bevezető jelleggel (képlet, levezetés általában kevés) Összbenyomás a területről Szemléletformálás Klinikai vizsgálatok, mint a biostatisztika fontos adatforrása, alkalmazási területe

39 Ez az előadás... Áttekintés a biostatisztika szempontjából legfontosabb statisztikai alapokról Részletek nélkül, csak bevezető jelleggel (képlet, levezetés általában kevés) Összbenyomás a területről Szemléletformálás Klinikai vizsgálatok, mint a biostatisztika fontos adatforrása, alkalmazási területe

40 Ez az előadás... Áttekintés a biostatisztika szempontjából legfontosabb statisztikai alapokról Részletek nélkül, csak bevezető jelleggel (képlet, levezetés általában kevés) Összbenyomás a területről Szemléletformálás Klinikai vizsgálatok, mint a biostatisztika fontos adatforrása, alkalmazási területe

41 Ez az előadás... Áttekintés a biostatisztika szempontjából legfontosabb statisztikai alapokról Részletek nélkül, csak bevezető jelleggel (képlet, levezetés általában kevés) Összbenyomás a területről Szemléletformálás Klinikai vizsgálatok, mint a biostatisztika fontos adatforrása, alkalmazási területe

42 Ez az előadás... Áttekintés a biostatisztika szempontjából legfontosabb statisztikai alapokról Részletek nélkül, csak bevezető jelleggel (képlet, levezetés általában kevés) Összbenyomás a területről Szemléletformálás Klinikai vizsgálatok, mint a biostatisztika fontos adatforrása, alkalmazási területe

43 Tartalom 1 Mi a statisztika? 2 A statisztika alapfogalmai 3 Deskriptív statisztika A deskriptív statisztikáról általában Egyváltozós elemzés, minőségi változó Egyváltozós elemzés, mennyiségi változó Két minőségi változó kapcsolata: asszociáció Két mennyiségi változó kapcsolata: korreláció 4 Induktív statisztika A mintavételi helyzet konzekvenciái Becsléselmélet Hipotézisvizsgálat 5 Klinikai vizsgálatok

44 Pár demonstratív kérdés, amit szeretnénk megválaszolni Egy új vérnyomáscsökkentő gyógyszer-jelölt valóban csökkenti a vérnyomást? Egy új vérnyomáscsökkentő gyógyszer-jelölt nem okoz megnövekedett epilepszia-kockázatot? Magasfeszültségű vezeték közelében tartózkodás növeli a rák-kockázatot? Milyen tényezők hatnak adott rákban a túlélési időre? Mennyi jelen kurzus hallgatóinak átlagos testtömege? Mennyi az I. éves fiú egyetemisták átlagos testtömege? Igaz-e, hogy az I. éves fiú egyetemisták átlagos testtömege 70 kg? Van-e összefüggés tehenek takarmányozása és a tejhozamuk között?

45 Pár definíció Amire (akikre) a kérdésünk irányul: (cél)populáció, sokaság Elemei: megfigyelési egységek Amely jellemzőire kíváncsiak vagyunk: változó (vagy ismérv) A változó értékének meghatározása egy adott sokasági elemre: megfigyelés Nagyon ritkán tudjuk a sokaság valamennyi elemét megfigyelni (ez lenne a teljeskörű megfigyelés), technikai gondok, és...

46 Pár definíció Amire (akikre) a kérdésünk irányul: (cél)populáció, sokaság Elemei: megfigyelési egységek Amely jellemzőire kíváncsiak vagyunk: változó (vagy ismérv) A változó értékének meghatározása egy adott sokasági elemre: megfigyelés Nagyon ritkán tudjuk a sokaság valamennyi elemét megfigyelni (ez lenne a teljeskörű megfigyelés), technikai gondok, és...

47 Pár definíció Amire (akikre) a kérdésünk irányul: (cél)populáció, sokaság Elemei: megfigyelési egységek Amely jellemzőire kíváncsiak vagyunk: változó (vagy ismérv) A változó értékének meghatározása egy adott sokasági elemre: megfigyelés Nagyon ritkán tudjuk a sokaság valamennyi elemét megfigyelni (ez lenne a teljeskörű megfigyelés), technikai gondok, és...

48 Pár definíció Amire (akikre) a kérdésünk irányul: (cél)populáció, sokaság Elemei: megfigyelési egységek Amely jellemzőire kíváncsiak vagyunk: változó (vagy ismérv) A változó értékének meghatározása egy adott sokasági elemre: megfigyelés Nagyon ritkán tudjuk a sokaság valamennyi elemét megfigyelni (ez lenne a teljeskörű megfigyelés), technikai gondok, és...

49 Pár definíció Amire (akikre) a kérdésünk irányul: (cél)populáció, sokaság Elemei: megfigyelési egységek Amely jellemzőire kíváncsiak vagyunk: változó (vagy ismérv) A változó értékének meghatározása egy adott sokasági elemre: megfigyelés Nagyon ritkán tudjuk a sokaság valamennyi elemét megfigyelni (ez lenne a teljeskörű megfigyelés), technikai gondok, és...

50 Kicsit elidőzve a sokaság fogalmánál Mennyi jelen kurzus hallgatóinak átlagos testtömege? véges sokaság (N = 23) De: Egy új vérnyomáscsökkentő gyógyszer-jelölt valóban csökkenti a vérnyomást? Mi itt a sokaság? Ez végtelen sokaság! (Szokás fiktívnek is nevezni.)

51 Kicsit elidőzve a sokaság fogalmánál Mennyi jelen kurzus hallgatóinak átlagos testtömege? véges sokaság (N = 23) De: Egy új vérnyomáscsökkentő gyógyszer-jelölt valóban csökkenti a vérnyomást? Mi itt a sokaság? Ez végtelen sokaság! (Szokás fiktívnek is nevezni.)

52 Kicsit elidőzve a sokaság fogalmánál Mennyi jelen kurzus hallgatóinak átlagos testtömege? véges sokaság (N = 23) De: Egy új vérnyomáscsökkentő gyógyszer-jelölt valóban csökkenti a vérnyomást? Mi itt a sokaság? Ez végtelen sokaság! (Szokás fiktívnek is nevezni.)

53 Kicsit elidőzve a sokaság fogalmánál Mennyi jelen kurzus hallgatóinak átlagos testtömege? véges sokaság (N = 23) De: Egy új vérnyomáscsökkentő gyógyszer-jelölt valóban csökkenti a vérnyomást? Mi itt a sokaság? Ez végtelen sokaság! (Szokás fiktívnek is nevezni.)

54 Mintavétel Tehát: általában nem tudjuk az egész sokaságot megfigyelni mintavételes helyzet Amit meg tudunk figyelni: minta (Illetve tervezett minta, nem biztos, hogy pont ezt figyeljük meg ténylegesen) Sokaság Tényleges minta Tervezett minta Induktív statisztikánál foglalkozunk vele tovább

55 Mintavétel Tehát: általában nem tudjuk az egész sokaságot megfigyelni mintavételes helyzet Amit meg tudunk figyelni: minta (Illetve tervezett minta, nem biztos, hogy pont ezt figyeljük meg ténylegesen) Sokaság Tényleges minta Tervezett minta Induktív statisztikánál foglalkozunk vele tovább

56 Mintavétel Tehát: általában nem tudjuk az egész sokaságot megfigyelni mintavételes helyzet Amit meg tudunk figyelni: minta (Illetve tervezett minta, nem biztos, hogy pont ezt figyeljük meg ténylegesen) Sokaság Tényleges minta Tervezett minta Induktív statisztikánál foglalkozunk vele tovább

57 Mintavétel Tehát: általában nem tudjuk az egész sokaságot megfigyelni mintavételes helyzet Amit meg tudunk figyelni: minta (Illetve tervezett minta, nem biztos, hogy pont ezt figyeljük meg ténylegesen) Sokaság Tényleges minta Tervezett minta Induktív statisztikánál foglalkozunk vele tovább

58 Mérés, mérési skálák A vizsgált tulajdonságot mérhetővé kell tenni Operacionalizálás Proxy változók Mérési skálák (Stevens, 1946) 1 Nominális skála 2 Ordinális skála 3 Intervallum skála 4 Arányskála Az első két típusba tartozót szokás minőségi (kvalitatív) változónak is nevezni az utóbbi kettőt pedig mennyiségi (kvantitatív) változónak

59 Mérés, mérési skálák A vizsgált tulajdonságot mérhetővé kell tenni Operacionalizálás Proxy változók Mérési skálák (Stevens, 1946) 1 Nominális skála 2 Ordinális skála 3 Intervallum skála 4 Arányskála Az első két típusba tartozót szokás minőségi (kvalitatív) változónak is nevezni az utóbbi kettőt pedig mennyiségi (kvantitatív) változónak

60 Mérés, mérési skálák A vizsgált tulajdonságot mérhetővé kell tenni Operacionalizálás Proxy változók Mérési skálák (Stevens, 1946) 1 Nominális skála 2 Ordinális skála 3 Intervallum skála 4 Arányskála Az első két típusba tartozót szokás minőségi (kvalitatív) változónak is nevezni az utóbbi kettőt pedig mennyiségi (kvantitatív) változónak

61 Mérés, mérési skálák A vizsgált tulajdonságot mérhetővé kell tenni Operacionalizálás Proxy változók Mérési skálák (Stevens, 1946) 1 Nominális skála 2 Ordinális skála 3 Intervallum skála 4 Arányskála Az első két típusba tartozót szokás minőségi (kvalitatív) változónak is nevezni az utóbbi kettőt pedig mennyiségi (kvantitatív) változónak

62 Mérés, mérési skálák A vizsgált tulajdonságot mérhetővé kell tenni Operacionalizálás Proxy változók Mérési skálák (Stevens, 1946) 1 Nominális skála 2 Ordinális skála 3 Intervallum skála 4 Arányskála Az első két típusba tartozót szokás minőségi (kvalitatív) változónak is nevezni az utóbbi kettőt pedig mennyiségi (kvantitatív) változónak

63 Mérés, mérési skálák A vizsgált tulajdonságot mérhetővé kell tenni Operacionalizálás Proxy változók Mérési skálák (Stevens, 1946) 1 Nominális skála 2 Ordinális skála 3 Intervallum skála 4 Arányskála Az első két típusba tartozót szokás minőségi (kvalitatív) változónak is nevezni az utóbbi kettőt pedig mennyiségi (kvantitatív) változónak

64 Mérés, mérési skálák A vizsgált tulajdonságot mérhetővé kell tenni Operacionalizálás Proxy változók Mérési skálák (Stevens, 1946) 1 Nominális skála 2 Ordinális skála 3 Intervallum skála 4 Arányskála Az első két típusba tartozót szokás minőségi (kvalitatív) változónak is nevezni az utóbbi kettőt pedig mennyiségi (kvantitatív) változónak

65 Mérés, mérési skálák A vizsgált tulajdonságot mérhetővé kell tenni Operacionalizálás Proxy változók Mérési skálák (Stevens, 1946) 1 Nominális skála 2 Ordinális skála 3 Intervallum skála 4 Arányskála Az első két típusba tartozót szokás minőségi (kvalitatív) változónak is nevezni az utóbbi kettőt pedig mennyiségi (kvantitatív) változónak

66 Mérés, mérési skálák A vizsgált tulajdonságot mérhetővé kell tenni Operacionalizálás Proxy változók Mérési skálák (Stevens, 1946) 1 Nominális skála 2 Ordinális skála 3 Intervallum skála 4 Arányskála Az első két típusba tartozót szokás minőségi (kvalitatív) változónak is nevezni az utóbbi kettőt pedig mennyiségi (kvantitatív) változónak

67 Mérés, mérési skálák A vizsgált tulajdonságot mérhetővé kell tenni Operacionalizálás Proxy változók Mérési skálák (Stevens, 1946) 1 Nominális skála 2 Ordinális skála 3 Intervallum skála 4 Arányskála Az első két típusba tartozót szokás minőségi (kvalitatív) változónak is nevezni az utóbbi kettőt pedig mennyiségi (kvantitatív) változónak

68 Adatok jellemzői Kimenetek száma szerint Diszkrét (véges, vagy legfeljebb megszámlálhatóan sok, pl. szemszín) Folytonos (kontinuum sok, pl. testhőmérséklet) Általában megfeleltetjük a minőségi-mennyiségi csoportoknak (noha ez elvileg nem helyes), de vigyázat: a darabszám nevezetes kivétel Időbeli jelleg szerint: Keresztmetszeti (egy eszmei időpontra vonatkozó megfigyelések) Longitudinális (időbeli követés)

69 Adatok jellemzői Kimenetek száma szerint Diszkrét (véges, vagy legfeljebb megszámlálhatóan sok, pl. szemszín) Folytonos (kontinuum sok, pl. testhőmérséklet) Általában megfeleltetjük a minőségi-mennyiségi csoportoknak (noha ez elvileg nem helyes), de vigyázat: a darabszám nevezetes kivétel Időbeli jelleg szerint: Keresztmetszeti (egy eszmei időpontra vonatkozó megfigyelések) Longitudinális (időbeli követés)

70 Adatok jellemzői Kimenetek száma szerint Diszkrét (véges, vagy legfeljebb megszámlálhatóan sok, pl. szemszín) Folytonos (kontinuum sok, pl. testhőmérséklet) Általában megfeleltetjük a minőségi-mennyiségi csoportoknak (noha ez elvileg nem helyes), de vigyázat: a darabszám nevezetes kivétel Időbeli jelleg szerint: Keresztmetszeti (egy eszmei időpontra vonatkozó megfigyelések) Longitudinális (időbeli követés)

71 Adatok jellemzői Kimenetek száma szerint Diszkrét (véges, vagy legfeljebb megszámlálhatóan sok, pl. szemszín) Folytonos (kontinuum sok, pl. testhőmérséklet) Általában megfeleltetjük a minőségi-mennyiségi csoportoknak (noha ez elvileg nem helyes), de vigyázat: a darabszám nevezetes kivétel Időbeli jelleg szerint: Keresztmetszeti (egy eszmei időpontra vonatkozó megfigyelések) Longitudinális (időbeli követés)

72 Adatok jellemzői Kimenetek száma szerint Diszkrét (véges, vagy legfeljebb megszámlálhatóan sok, pl. szemszín) Folytonos (kontinuum sok, pl. testhőmérséklet) Általában megfeleltetjük a minőségi-mennyiségi csoportoknak (noha ez elvileg nem helyes), de vigyázat: a darabszám nevezetes kivétel Időbeli jelleg szerint: Keresztmetszeti (egy eszmei időpontra vonatkozó megfigyelések) Longitudinális (időbeli követés)

73 Adatok jellemzői Kimenetek száma szerint Diszkrét (véges, vagy legfeljebb megszámlálhatóan sok, pl. szemszín) Folytonos (kontinuum sok, pl. testhőmérséklet) Általában megfeleltetjük a minőségi-mennyiségi csoportoknak (noha ez elvileg nem helyes), de vigyázat: a darabszám nevezetes kivétel Időbeli jelleg szerint: Keresztmetszeti (egy eszmei időpontra vonatkozó megfigyelések) Longitudinális (időbeli követés)

74 Adatok jellemzői Kimenetek száma szerint Diszkrét (véges, vagy legfeljebb megszámlálhatóan sok, pl. szemszín) Folytonos (kontinuum sok, pl. testhőmérséklet) Általában megfeleltetjük a minőségi-mennyiségi csoportoknak (noha ez elvileg nem helyes), de vigyázat: a darabszám nevezetes kivétel Időbeli jelleg szerint: Keresztmetszeti (egy eszmei időpontra vonatkozó megfigyelések) Longitudinális (időbeli követés)

75 Példa adatbázis Baystate Medical Center (Springfield, Massachusetts, USA) Low Infant Birth Weight adatbázisa (1986) R-ben: MASS könyvtár birthwt adatbázis Kis kivonat: low age lwt race smoke ptl ht ui ftv bwt

76 Példa adatbázis Baystate Medical Center (Springfield, Massachusetts, USA) Low Infant Birth Weight adatbázisa (1986) R-ben: MASS könyvtár birthwt adatbázis Kis kivonat: low age lwt race smoke ptl ht ui ftv bwt

77 Példa adatbázis Baystate Medical Center (Springfield, Massachusetts, USA) Low Infant Birth Weight adatbázisa (1986) R-ben: MASS könyvtár birthwt adatbázis Kis kivonat: low age lwt race smoke ptl ht ui ftv bwt

78 A példa adatbázis jellemzése Keresztmetszeti n = 189 elemű minta egy fiktív, végtelen sokaságból Változók: Rövidítés Tartalom Mérési skála low Születési tömeg < 2,5 kg? [0:nem, 1:igen] Nominális age Anya életkora [év] Arányskála lwt Anya testtömege (UM) [font] Arányskála race Rassz [1: kaukázusi, 2: afroamerikai, 3: egyéb] Nominális smoke Anya dohányzik? [0:nem, 1:igen] Nominális ptl Korábbi koraszülések száma [darab] Arányskála ht Anyai hipertónia? [0:nem, 1:igen] Nominális ui Irritábilis méh? [0:nem, 1:igen] Nominális ftv Vizitek száma (1. trimeszter) [darab] Arányskála bwt Születési tömeg [g] Arányskála

79 A példa adatbázis jellemzése Keresztmetszeti n = 189 elemű minta egy fiktív, végtelen sokaságból Változók: Rövidítés Tartalom Mérési skála low Születési tömeg < 2,5 kg? [0:nem, 1:igen] Nominális age Anya életkora [év] Arányskála lwt Anya testtömege (UM) [font] Arányskála race Rassz [1: kaukázusi, 2: afroamerikai, 3: egyéb] Nominális smoke Anya dohányzik? [0:nem, 1:igen] Nominális ptl Korábbi koraszülések száma [darab] Arányskála ht Anyai hipertónia? [0:nem, 1:igen] Nominális ui Irritábilis méh? [0:nem, 1:igen] Nominális ftv Vizitek száma (1. trimeszter) [darab] Arányskála bwt Születési tömeg [g] Arányskála

80 A példa adatbázis jellemzése Keresztmetszeti n = 189 elemű minta egy fiktív, végtelen sokaságból Változók: Rövidítés Tartalom Mérési skála low Születési tömeg < 2,5 kg? [0:nem, 1:igen] Nominális age Anya életkora [év] Arányskála lwt Anya testtömege (UM) [font] Arányskála race Rassz [1: kaukázusi, 2: afroamerikai, 3: egyéb] Nominális smoke Anya dohányzik? [0:nem, 1:igen] Nominális ptl Korábbi koraszülések száma [darab] Arányskála ht Anyai hipertónia? [0:nem, 1:igen] Nominális ui Irritábilis méh? [0:nem, 1:igen] Nominális ftv Vizitek száma (1. trimeszter) [darab] Arányskála bwt Születési tömeg [g] Arányskála

81 Tartalom 1 Mi a statisztika? 2 A statisztika alapfogalmai 3 Deskriptív statisztika A deskriptív statisztikáról általában Egyváltozós elemzés, minőségi változó Egyváltozós elemzés, mennyiségi változó Két minőségi változó kapcsolata: asszociáció Két mennyiségi változó kapcsolata: korreláció 4 Induktív statisztika A mintavételi helyzet konzekvenciái Becsléselmélet Hipotézisvizsgálat 5 Klinikai vizsgálatok

82 A deskriptív statisztikáról általában Tartalom 1 Mi a statisztika? 2 A statisztika alapfogalmai 3 Deskriptív statisztika A deskriptív statisztikáról általában Egyváltozós elemzés, minőségi változó Egyváltozós elemzés, mennyiségi változó Két minőségi változó kapcsolata: asszociáció Két mennyiségi változó kapcsolata: korreláció 4 Induktív statisztika A mintavételi helyzet konzekvenciái Becsléselmélet Hipotézisvizsgálat 5 Klinikai vizsgálatok

83 A deskriptív statisztikáról általában Mi a deskriptív statisztika? Röviden: nem törődünk a mintavételes helyzettel! A minta az univerzum, úgy vesszük mintha csak a minta lenne Tipikus feladat itt: információtömörítés, a mintában lévő információ legjobban emészthetővé tétele Trade-off a tömörítésnél: Áttekinthetőség Hűség

84 A deskriptív statisztikáról általában Mi a deskriptív statisztika? Röviden: nem törődünk a mintavételes helyzettel! A minta az univerzum, úgy vesszük mintha csak a minta lenne Tipikus feladat itt: információtömörítés, a mintában lévő információ legjobban emészthetővé tétele Trade-off a tömörítésnél: Áttekinthetőség Hűség

85 A deskriptív statisztikáról általában Mi a deskriptív statisztika? Röviden: nem törődünk a mintavételes helyzettel! A minta az univerzum, úgy vesszük mintha csak a minta lenne Tipikus feladat itt: információtömörítés, a mintában lévő információ legjobban emészthetővé tétele Trade-off a tömörítésnél: Áttekinthetőség Hűség

86 A deskriptív statisztikáról általában Mi a deskriptív statisztika? Röviden: nem törődünk a mintavételes helyzettel! A minta az univerzum, úgy vesszük mintha csak a minta lenne Tipikus feladat itt: információtömörítés, a mintában lévő információ legjobban emészthetővé tétele Trade-off a tömörítésnél: Áttekinthetőség Hűség

87 A deskriptív statisztikáról általában Az információtömörítés trade-off-ja Nyers adat: 2523, 2551, 2557, 2594, 2600, 2622,..., 2495, 2495, 2495 Tömörítések 2944,6 2944,6 ± 729,2 2944,6 (2977) ± 729,2 (1073) 2944,6 (2977) [ ] ± 729,2 (1073) Mi a cél? az eredeti információ átláthatatlan (ki mond meg bármit is 189 számból?) Az információtömörítés ugyan adatvesztés, de épp ez teszi lehetővé, hogy a fontosat észrevegyük! Egyensúlyozni kell a kettő között

88 A deskriptív statisztikáról általában Az információtömörítés trade-off-ja Nyers adat: 2523, 2551, 2557, 2594, 2600, 2622,..., 2495, 2495, 2495 Tömörítések 2944,6 2944,6 ± 729,2 2944,6 (2977) ± 729,2 (1073) 2944,6 (2977) [ ] ± 729,2 (1073) Mi a cél? az eredeti információ átláthatatlan (ki mond meg bármit is 189 számból?) Az információtömörítés ugyan adatvesztés, de épp ez teszi lehetővé, hogy a fontosat észrevegyük! Egyensúlyozni kell a kettő között

89 A deskriptív statisztikáról általában Az információtömörítés trade-off-ja Nyers adat: 2523, 2551, 2557, 2594, 2600, 2622,..., 2495, 2495, 2495 Tömörítések 2944,6 2944,6 ± 729,2 2944,6 (2977) ± 729,2 (1073) 2944,6 (2977) [ ] ± 729,2 (1073) Mi a cél? az eredeti információ átláthatatlan (ki mond meg bármit is 189 számból?) Az információtömörítés ugyan adatvesztés, de épp ez teszi lehetővé, hogy a fontosat észrevegyük! Egyensúlyozni kell a kettő között

90 A deskriptív statisztikáról általában Az információtömörítés trade-off-ja Nyers adat: 2523, 2551, 2557, 2594, 2600, 2622,..., 2495, 2495, 2495 Tömörítések 2944,6 2944,6 ± 729,2 2944,6 (2977) ± 729,2 (1073) 2944,6 (2977) [ ] ± 729,2 (1073) Mi a cél? az eredeti információ átláthatatlan (ki mond meg bármit is 189 számból?) Az információtömörítés ugyan adatvesztés, de épp ez teszi lehetővé, hogy a fontosat észrevegyük! Egyensúlyozni kell a kettő között

91 A deskriptív statisztikáról általában Az információtömörítés trade-off-ja Nyers adat: 2523, 2551, 2557, 2594, 2600, 2622,..., 2495, 2495, 2495 Tömörítések 2944,6 2944,6 ± 729,2 2944,6 (2977) ± 729,2 (1073) 2944,6 (2977) [ ] ± 729,2 (1073) Mi a cél? az eredeti információ átláthatatlan (ki mond meg bármit is 189 számból?) Az információtömörítés ugyan adatvesztés, de épp ez teszi lehetővé, hogy a fontosat észrevegyük! Egyensúlyozni kell a kettő között

92 A deskriptív statisztikáról általában Az információtömörítés trade-off-ja Nyers adat: 2523, 2551, 2557, 2594, 2600, 2622,..., 2495, 2495, 2495 Tömörítések 2944,6 2944,6 ± 729,2 2944,6 (2977) ± 729,2 (1073) 2944,6 (2977) [ ] ± 729,2 (1073) Mi a cél? az eredeti információ átláthatatlan (ki mond meg bármit is 189 számból?) Az információtömörítés ugyan adatvesztés, de épp ez teszi lehetővé, hogy a fontosat észrevegyük! Egyensúlyozni kell a kettő között

93 A deskriptív statisztikáról általában Az információtömörítés trade-off-ja Nyers adat: 2523, 2551, 2557, 2594, 2600, 2622,..., 2495, 2495, 2495 Tömörítések 2944,6 2944,6 ± 729,2 2944,6 (2977) ± 729,2 (1073) 2944,6 (2977) [ ] ± 729,2 (1073) Mi a cél? az eredeti információ átláthatatlan (ki mond meg bármit is 189 számból?) Az információtömörítés ugyan adatvesztés, de épp ez teszi lehetővé, hogy a fontosat észrevegyük! Egyensúlyozni kell a kettő között

94 A deskriptív statisztikáról általában Az információtömörítés trade-off-ja Nyers adat: 2523, 2551, 2557, 2594, 2600, 2622,..., 2495, 2495, 2495 Tömörítések 2944,6 2944,6 ± 729,2 2944,6 (2977) ± 729,2 (1073) 2944,6 (2977) [ ] ± 729,2 (1073) Mi a cél? az eredeti információ átláthatatlan (ki mond meg bármit is 189 számból?) Az információtömörítés ugyan adatvesztés, de épp ez teszi lehetővé, hogy a fontosat észrevegyük! Egyensúlyozni kell a kettő között

95 A deskriptív statisztikáról általában Az információtömörítés trade-off-ja Nyers adat: 2523, 2551, 2557, 2594, 2600, 2622,..., 2495, 2495, 2495 Tömörítések 2944,6 2944,6 ± 729,2 2944,6 (2977) ± 729,2 (1073) 2944,6 (2977) [ ] ± 729,2 (1073) Mi a cél? az eredeti információ átláthatatlan (ki mond meg bármit is 189 számból?) Az információtömörítés ugyan adatvesztés, de épp ez teszi lehetővé, hogy a fontosat észrevegyük! Egyensúlyozni kell a kettő között

96 A deskriptív statisztikáról általában Exploratív adatelemzés Grafikus technikák előnyei Az emberi agy különösen jó az ilyen (vizuális) információk feldolgozásában Ügyes vizualizáció sokat érhet! There is no excuse for failing to plot and look! (JW Tukey)

97 A deskriptív statisztikáról általában Exploratív adatelemzés Grafikus technikák előnyei Az emberi agy különösen jó az ilyen (vizuális) információk feldolgozásában Ügyes vizualizáció sokat érhet! There is no excuse for failing to plot and look! (JW Tukey)

98 A deskriptív statisztikáról általában Exploratív adatelemzés Grafikus technikák előnyei Az emberi agy különösen jó az ilyen (vizuális) információk feldolgozásában Ügyes vizualizáció sokat érhet! There is no excuse for failing to plot and look! (JW Tukey)

99 A deskriptív statisztikáról általában Exploratív adatelemzés Grafikus technikák előnyei Az emberi agy különösen jó az ilyen (vizuális) információk feldolgozásában Ügyes vizualizáció sokat érhet! There is no excuse for failing to plot and look! (JW Tukey)

100 A deskriptív statisztikáról általában A deskriptív statisztika dimenziói Eszköze szerint Analitikus (mutatószám) Grafikus (ábra) Változók száma szerint Egyváltozós Többváltozós (Sokváltozós) A változók mérési skálája szerint Minőségi Mennyiségi (Vegyes)

101 A deskriptív statisztikáról általában A deskriptív statisztika dimenziói Eszköze szerint Analitikus (mutatószám) Grafikus (ábra) Változók száma szerint Egyváltozós Többváltozós (Sokváltozós) A változók mérési skálája szerint Minőségi Mennyiségi (Vegyes)

102 A deskriptív statisztikáról általában A deskriptív statisztika dimenziói Eszköze szerint Analitikus (mutatószám) Grafikus (ábra) Változók száma szerint Egyváltozós Többváltozós (Sokváltozós) A változók mérési skálája szerint Minőségi Mennyiségi (Vegyes)

103 A deskriptív statisztikáról általában A deskriptív statisztika dimenziói Eszköze szerint Analitikus (mutatószám) Grafikus (ábra) Változók száma szerint Egyváltozós Többváltozós (Sokváltozós) A változók mérési skálája szerint Minőségi Mennyiségi (Vegyes)

104 A deskriptív statisztikáról általában A deskriptív statisztika dimenziói Eszköze szerint Analitikus (mutatószám) Grafikus (ábra) Változók száma szerint Egyváltozós Többváltozós (Sokváltozós) A változók mérési skálája szerint Minőségi Mennyiségi (Vegyes)

105 A deskriptív statisztikáról általában A deskriptív statisztika dimenziói Eszköze szerint Analitikus (mutatószám) Grafikus (ábra) Változók száma szerint Egyváltozós Többváltozós (Sokváltozós) A változók mérési skálája szerint Minőségi Mennyiségi (Vegyes)

106 Egyváltozós elemzés, minőségi változó Tartalom 1 Mi a statisztika? 2 A statisztika alapfogalmai 3 Deskriptív statisztika A deskriptív statisztikáról általában Egyváltozós elemzés, minőségi változó Egyváltozós elemzés, mennyiségi változó Két minőségi változó kapcsolata: asszociáció Két mennyiségi változó kapcsolata: korreláció 4 Induktív statisztika A mintavételi helyzet konzekvenciái Becsléselmélet Hipotézisvizsgálat 5 Klinikai vizsgálatok

107 Egyváltozós elemzés, minőségi változó Példa race (rassz): low age lwt race smoke ptl ht ui ftv bwt

108 Egyváltozós elemzés, minőségi változó Analitikus eszközök Gyakorisági sor: Kategória f i g i Kaukázusi 96 0,508 Afroamerikai 26 0,138 Egyéb 67 0,354 Összesen 189 1,000 (Istenigazából semmilyen adatvesztést nem jelent most)

109 Egyváltozós elemzés, minőségi változó Analitikus eszközök Gyakorisági sor: Kategória f i g i Kaukázusi 96 0,508 Afroamerikai 26 0,138 Egyéb 67 0,354 Összesen 189 1,000 (Istenigazából semmilyen adatvesztést nem jelent most)

110 Egyváltozós elemzés, minőségi változó Analitikus eszközök Módusz: leggyakoribb kimenet (Mo = arg max i f i ); ez már kompromisszum! Ordinálisnál: van értelme az ún. kumulálásnak is (elvileg mediánról is lehetne beszélni, inkább máshol vezetjük be) Ezen kívül más mutatónak nincs sok értelme

111 Egyváltozós elemzés, minőségi változó Analitikus eszközök Módusz: leggyakoribb kimenet (Mo = arg max i f i ); ez már kompromisszum! Ordinálisnál: van értelme az ún. kumulálásnak is (elvileg mediánról is lehetne beszélni, inkább máshol vezetjük be) Ezen kívül más mutatónak nincs sok értelme

112 Egyváltozós elemzés, minőségi változó Analitikus eszközök Módusz: leggyakoribb kimenet (Mo = arg max i f i ); ez már kompromisszum! Ordinálisnál: van értelme az ún. kumulálásnak is (elvileg mediánról is lehetne beszélni, inkább máshol vezetjük be) Ezen kívül más mutatónak nincs sok értelme

113 Egyváltozós elemzés, minőségi változó Grafikus eszközök: oszlopdiagram Oszlopdiagram Gyakoriság [fő] Kaukázusi Afroamerikai Egyéb Rassz

114 Egyváltozós elemzés, minőségi változó Grafikus eszközök: tortadiagram Kördiagram Kaukázusi 50.8 % Afroamerikai 13.8 % Egyéb 35.4 % Rassz

115 Egyváltozós elemzés, minőségi változó Grafikus eszközök Melyik jobb? Miért? (Van rá tudományos válasz!)

116 Egyváltozós elemzés, minőségi változó Grafikus eszközök Melyik jobb? Miért? (Van rá tudományos válasz!) Az emberi szem sokkal jobban érzékeli a lineáris méreteket, mint a relatív területeket

117 Egyváltozós elemzés, mennyiségi változó Tartalom 1 Mi a statisztika? 2 A statisztika alapfogalmai 3 Deskriptív statisztika A deskriptív statisztikáról általában Egyváltozós elemzés, minőségi változó Egyváltozós elemzés, mennyiségi változó Két minőségi változó kapcsolata: asszociáció Két mennyiségi változó kapcsolata: korreláció 4 Induktív statisztika A mintavételi helyzet konzekvenciái Becsléselmélet Hipotézisvizsgálat 5 Klinikai vizsgálatok

118 Egyváltozós elemzés, mennyiségi változó Példa bwt (születési tömeg): low age lwt race smoke ptl ht ui ftv bwt

119 Egyváltozós elemzés, mennyiségi változó Analitikus eszközök: osztályközös gyakorisági sor I. Szokásos gyakorisági sor már nem készíthető (könnyen lehet, hogy minden számból csak 1 lesz!) Megoldás az osztályközös gyakorisági sor, például: C i0 C i1 f i g i f i g i , , , , , , , , , , , , , , , , , ,000 Összesen 189 1,000

120 Egyváltozós elemzés, mennyiségi változó Analitikus eszközök: osztályközös gyakorisági sor I. Szokásos gyakorisági sor már nem készíthető (könnyen lehet, hogy minden számból csak 1 lesz!) Megoldás az osztályközös gyakorisági sor, például: C i0 C i1 f i g i f i g i , , , , , , , , , , , , , , , , , ,000 Összesen 189 1,000

121 Egyváltozós elemzés, mennyiségi változó Analitikus eszközök: osztályközös gyakorisági sor II. De vigyázat, itt már van információvesztés! kérdés, hogy hogyan vesszük fel az osztályközöket

122 Egyváltozós elemzés, mennyiségi változó Analitikus eszközök: a centrális tendencia mutatói I. Átlag, jele x: az a szám, mellyel valamennyi megfigyelési egységnél helyettesítve a változó tényleges értékét, az értékösszeg változatlan maradna, azaz x = S n = n i=1 x i n Akkor van értelme, ha a változónál az összeg bír tárgyi értelemmel! (Ha a szorzat, akkor a mértani átlag adódik.) Előnye, hogy közismert tartalmú, jól értelmezhető, hátránya, hogy nem robusztus (outlier-ekre érzékeny trimmelt átlag)

123 Egyváltozós elemzés, mennyiségi változó Analitikus eszközök: a centrális tendencia mutatói I. Átlag, jele x: az a szám, mellyel valamennyi megfigyelési egységnél helyettesítve a változó tényleges értékét, az értékösszeg változatlan maradna, azaz x = S n = n i=1 x i n Akkor van értelme, ha a változónál az összeg bír tárgyi értelemmel! (Ha a szorzat, akkor a mértani átlag adódik.) Előnye, hogy közismert tartalmú, jól értelmezhető, hátránya, hogy nem robusztus (outlier-ekre érzékeny trimmelt átlag)

124 Egyváltozós elemzés, mennyiségi változó Analitikus eszközök: a centrális tendencia mutatói I. Átlag, jele x: az a szám, mellyel valamennyi megfigyelési egységnél helyettesítve a változó tényleges értékét, az értékösszeg változatlan maradna, azaz x = S n = n i=1 x i n Akkor van értelme, ha a változónál az összeg bír tárgyi értelemmel! (Ha a szorzat, akkor a mértani átlag adódik.) Előnye, hogy közismert tartalmú, jól értelmezhető, hátránya, hogy nem robusztus (outlier-ekre érzékeny trimmelt átlag)

125 Egyváltozós elemzés, mennyiségi változó Analitikus eszközök: a centrális tendencia mutatói II. Medián, jele Me: az a szám, melyre teljesül, hogy a megfigyelési egységek fele nála kisebb, fele nála nagyobb, tehát a középső elem (páratlan elemszámnál egyértelmű, párosnál legyen mondjuk a két középső átlaga) Előnye, hogy robusztus, hátránya, hogy kevésbé közismert p-kvantilis: a medián általánosítása, a minta p-ed része alatta, (1 p)-ed része felette van Nevezetes kvantilisek: kvartilisek (negyedelőpontok: Q 1, Q 2 Me, Q 3 ), decilisek (tizedelőpontok: D 1, D 2,..., D 9 ), percentilisek (századolópontok: P 1, P 2,..., P 100 )

126 Egyváltozós elemzés, mennyiségi változó Analitikus eszközök: a centrális tendencia mutatói II. Medián, jele Me: az a szám, melyre teljesül, hogy a megfigyelési egységek fele nála kisebb, fele nála nagyobb, tehát a középső elem (páratlan elemszámnál egyértelmű, párosnál legyen mondjuk a két középső átlaga) Előnye, hogy robusztus, hátránya, hogy kevésbé közismert p-kvantilis: a medián általánosítása, a minta p-ed része alatta, (1 p)-ed része felette van Nevezetes kvantilisek: kvartilisek (negyedelőpontok: Q 1, Q 2 Me, Q 3 ), decilisek (tizedelőpontok: D 1, D 2,..., D 9 ), percentilisek (századolópontok: P 1, P 2,..., P 100 )

127 Egyváltozós elemzés, mennyiségi változó Analitikus eszközök: a centrális tendencia mutatói II. Medián, jele Me: az a szám, melyre teljesül, hogy a megfigyelési egységek fele nála kisebb, fele nála nagyobb, tehát a középső elem (páratlan elemszámnál egyértelmű, párosnál legyen mondjuk a két középső átlaga) Előnye, hogy robusztus, hátránya, hogy kevésbé közismert p-kvantilis: a medián általánosítása, a minta p-ed része alatta, (1 p)-ed része felette van Nevezetes kvantilisek: kvartilisek (negyedelőpontok: Q 1, Q 2 Me, Q 3 ), decilisek (tizedelőpontok: D 1, D 2,..., D 9 ), percentilisek (századolópontok: P 1, P 2,..., P 100 )

128 Egyváltozós elemzés, mennyiségi változó Analitikus eszközök: a centrális tendencia mutatói II. Medián, jele Me: az a szám, melyre teljesül, hogy a megfigyelési egységek fele nála kisebb, fele nála nagyobb, tehát a középső elem (páratlan elemszámnál egyértelmű, párosnál legyen mondjuk a két középső átlaga) Előnye, hogy robusztus, hátránya, hogy kevésbé közismert p-kvantilis: a medián általánosítása, a minta p-ed része alatta, (1 p)-ed része felette van Nevezetes kvantilisek: kvartilisek (negyedelőpontok: Q 1, Q 2 Me, Q 3 ), decilisek (tizedelőpontok: D 1, D 2,..., D 9 ), percentilisek (századolópontok: P 1, P 2,..., P 100 )

129 Egyváltozós elemzés, mennyiségi változó Analitikus eszközök: a szóródás mutatói Minimum, maximum: a minta legnagyobb és legkisebb eleme Terjedelem, jele R: a maximum és a minimum különbsége Szórás, jele σ x : az átlagtól vett átlagos eltérés, négyzetes átlagot használva n i=1 σ x = (x i x) 2 n Előnye, hogy közismert tartalmú, hátránya, hogy nem robusztus (duplán nem) Interkvartilis terjedelem, jele IQR: a felső és alsó kvartilis különbsége (IQR = Q 3 Q 1 ); előnye, hogy robusztus ( xi MAD: MAD = Me Me (x) )

130 Egyváltozós elemzés, mennyiségi változó Analitikus eszközök: a szóródás mutatói Minimum, maximum: a minta legnagyobb és legkisebb eleme Terjedelem, jele R: a maximum és a minimum különbsége Szórás, jele σ x : az átlagtól vett átlagos eltérés, négyzetes átlagot használva n i=1 σ x = (x i x) 2 n Előnye, hogy közismert tartalmú, hátránya, hogy nem robusztus (duplán nem) Interkvartilis terjedelem, jele IQR: a felső és alsó kvartilis különbsége (IQR = Q 3 Q 1 ); előnye, hogy robusztus ( xi MAD: MAD = Me Me (x) )

131 Egyváltozós elemzés, mennyiségi változó Analitikus eszközök: a szóródás mutatói Minimum, maximum: a minta legnagyobb és legkisebb eleme Terjedelem, jele R: a maximum és a minimum különbsége Szórás, jele σ x : az átlagtól vett átlagos eltérés, négyzetes átlagot használva n i=1 σ x = (x i x) 2 n Előnye, hogy közismert tartalmú, hátránya, hogy nem robusztus (duplán nem) Interkvartilis terjedelem, jele IQR: a felső és alsó kvartilis különbsége (IQR = Q 3 Q 1 ); előnye, hogy robusztus ( xi MAD: MAD = Me Me (x) )

132 Egyváltozós elemzés, mennyiségi változó Analitikus eszközök: a szóródás mutatói Minimum, maximum: a minta legnagyobb és legkisebb eleme Terjedelem, jele R: a maximum és a minimum különbsége Szórás, jele σ x : az átlagtól vett átlagos eltérés, négyzetes átlagot használva n i=1 σ x = (x i x) 2 n Előnye, hogy közismert tartalmú, hátránya, hogy nem robusztus (duplán nem) Interkvartilis terjedelem, jele IQR: a felső és alsó kvartilis különbsége (IQR = Q 3 Q 1 ); előnye, hogy robusztus ( xi MAD: MAD = Me Me (x) )

133 Egyváltozós elemzés, mennyiségi változó Analitikus eszközök: a szóródás mutatói Minimum, maximum: a minta legnagyobb és legkisebb eleme Terjedelem, jele R: a maximum és a minimum különbsége Szórás, jele σ x : az átlagtól vett átlagos eltérés, négyzetes átlagot használva n i=1 σ x = (x i x) 2 n Előnye, hogy közismert tartalmú, hátránya, hogy nem robusztus (duplán nem) Interkvartilis terjedelem, jele IQR: a felső és alsó kvartilis különbsége (IQR = Q 3 Q 1 ); előnye, hogy robusztus ( xi MAD: MAD = Me Me (x) )

134 Egyváltozós elemzés, mennyiségi változó Analitikus eszközök: a szóródás mutatói Minimum, maximum: a minta legnagyobb és legkisebb eleme Terjedelem, jele R: a maximum és a minimum különbsége Szórás, jele σ x : az átlagtól vett átlagos eltérés, négyzetes átlagot használva n i=1 σ x = (x i x) 2 n Előnye, hogy közismert tartalmú, hátránya, hogy nem robusztus (duplán nem) Interkvartilis terjedelem, jele IQR: a felső és alsó kvartilis különbsége (IQR = Q 3 Q 1 ); előnye, hogy robusztus ( xi MAD: MAD = Me Me (x) )

135 Egyváltozós elemzés, mennyiségi változó Analitikus eszközök: alakmutatók Még finomabb leírása az eloszlásnak Szimmetria/ferdeség Csúcsosság

136 Egyváltozós elemzés, mennyiségi változó Analitikus eszközök: alakmutatók Még finomabb leírása az eloszlásnak Szimmetria/ferdeség Csúcsosság

137 Egyváltozós elemzés, mennyiségi változó Analitikus eszközök: alakmutatók Még finomabb leírása az eloszlásnak Szimmetria/ferdeség Csúcsosság

138 Egyváltozós elemzés, mennyiségi változó Grafikus eszközök: hisztogram A születési tömegek hisztogramja Sűrűség 0e+00 1e-04 2e-04 3e-04 4e-04 5e Születési tömeg [g]

139 Egyváltozós elemzés, mennyiségi változó Grafikus eszközök: hisztogram A számegyenest diszjunkt intervallumokra osztjuk, és megszámoljuk, hogy az egyes intervallumokba hány megfigyelési egység esik f i n h i (Mintha az osztályközös gyakorisági sorból gyártanánk oszlopdiagramot csak rések nélkül) A hisztogram hatalmas előnye, hogy hihetetlenül szemléletes: az eloszlás rengeteg fontos jellemzője ránézésre leolvasható (A hisztogram a háttéreloszlás sűrűségfüggvényét fogja becsülni)

140 Egyváltozós elemzés, mennyiségi változó Grafikus eszközök: hisztogram A számegyenest diszjunkt intervallumokra osztjuk, és megszámoljuk, hogy az egyes intervallumokba hány megfigyelési egység esik f i n h i (Mintha az osztályközös gyakorisági sorból gyártanánk oszlopdiagramot csak rések nélkül) A hisztogram hatalmas előnye, hogy hihetetlenül szemléletes: az eloszlás rengeteg fontos jellemzője ránézésre leolvasható (A hisztogram a háttéreloszlás sűrűségfüggvényét fogja becsülni)

141 Egyváltozós elemzés, mennyiségi változó Grafikus eszközök: hisztogram A számegyenest diszjunkt intervallumokra osztjuk, és megszámoljuk, hogy az egyes intervallumokba hány megfigyelési egység esik f i n h i (Mintha az osztályközös gyakorisági sorból gyártanánk oszlopdiagramot csak rések nélkül) A hisztogram hatalmas előnye, hogy hihetetlenül szemléletes: az eloszlás rengeteg fontos jellemzője ránézésre leolvasható (A hisztogram a háttéreloszlás sűrűségfüggvényét fogja becsülni)

142 Egyváltozós elemzés, mennyiségi változó Grafikus eszközök: hisztogram A számegyenest diszjunkt intervallumokra osztjuk, és megszámoljuk, hogy az egyes intervallumokba hány megfigyelési egység esik f i n h i (Mintha az osztályközös gyakorisági sorból gyártanánk oszlopdiagramot csak rések nélkül) A hisztogram hatalmas előnye, hogy hihetetlenül szemléletes: az eloszlás rengeteg fontos jellemzője ránézésre leolvasható (A hisztogram a háttéreloszlás sűrűségfüggvényét fogja becsülni)

143 Egyváltozós elemzés, mennyiségi változó Grafikus eszközök: hisztogram Hátránya, hogy érzékeny az intervallumok határainak megválasztására: A születési tömegek hisztogramja A születési tömegek hisztogramja A születési tömegek hisztogramja Sűrűség 0e+00 1e-04 2e-04 3e-04 4e-04 5e-04 6e-04 Sűrűség 0e+00 1e-04 2e-04 3e-04 4e-04 5e-04 6e-04 Sűrűség 0e+00 1e-04 2e-04 3e-04 4e-04 5e-04 6e Születési tömeg [g] Születési tömeg [g] Születési tömeg [g]

144 Egyváltozós elemzés, mennyiségi változó Grafikus eszközök: magfüggvényes becslő A születési tömegek magfüggvényes sűrűségbecslése Sűrűség 0e+00 1e-04 2e-04 3e-04 4e-04 5e Születési tömeg [g]

145 Egyváltozós elemzés, mennyiségi változó Grafikus eszközök: magfüggvényes becslő A mintapontokat koncentrált helyett valódi eloszlással helyettesíti Kevésbé paraméterérzékeny (de azért ezen is kell paraméterezni)

146 Egyváltozós elemzés, mennyiségi változó Grafikus eszközök: magfüggvényes becslő A mintapontokat koncentrált helyett valódi eloszlással helyettesíti Kevésbé paraméterérzékeny (de azért ezen is kell paraméterezni)

147 Egyváltozós elemzés, mennyiségi változó Grafikus eszközök: boxplot A születési tömegek boxplot-ja Születési tömeg [g]

148 Egyváltozós elemzés, mennyiségi változó Grafikus eszközök: boxplot Doboz Q 1 -től Q 3 -ig, benne megjelölve Me Antennák vagy a minimumig és a maximumig nyúlnak ki, vagy a legtávolabbi elemig, ami nincs messzebb a Me-től mint az IQR α-szorosa (tipikusan α = 1,5) Ez utóbbi egyszerű outlier-keresést is lehetővé tesz Nagy előnye, hogy rendkívül kompakt (gondoljunk arra, ha pl. rasszok szerint akarjuk ábrázolni a születési tömeg eloszlását), és robusztus is

149 Egyváltozós elemzés, mennyiségi változó Grafikus eszközök: boxplot Doboz Q 1 -től Q 3 -ig, benne megjelölve Me Antennák vagy a minimumig és a maximumig nyúlnak ki, vagy a legtávolabbi elemig, ami nincs messzebb a Me-től mint az IQR α-szorosa (tipikusan α = 1,5) Ez utóbbi egyszerű outlier-keresést is lehetővé tesz Nagy előnye, hogy rendkívül kompakt (gondoljunk arra, ha pl. rasszok szerint akarjuk ábrázolni a születési tömeg eloszlását), és robusztus is

150 Egyváltozós elemzés, mennyiségi változó Grafikus eszközök: boxplot Doboz Q 1 -től Q 3 -ig, benne megjelölve Me Antennák vagy a minimumig és a maximumig nyúlnak ki, vagy a legtávolabbi elemig, ami nincs messzebb a Me-től mint az IQR α-szorosa (tipikusan α = 1,5) Ez utóbbi egyszerű outlier-keresést is lehetővé tesz Nagy előnye, hogy rendkívül kompakt (gondoljunk arra, ha pl. rasszok szerint akarjuk ábrázolni a születési tömeg eloszlását), és robusztus is

151 Egyváltozós elemzés, mennyiségi változó Grafikus eszközök: boxplot Doboz Q 1 -től Q 3 -ig, benne megjelölve Me Antennák vagy a minimumig és a maximumig nyúlnak ki, vagy a legtávolabbi elemig, ami nincs messzebb a Me-től mint az IQR α-szorosa (tipikusan α = 1,5) Ez utóbbi egyszerű outlier-keresést is lehetővé tesz Nagy előnye, hogy rendkívül kompakt (gondoljunk arra, ha pl. rasszok szerint akarjuk ábrázolni a születési tömeg eloszlását), és robusztus is

152 Két minőségi változó kapcsolata: asszociáció Tartalom 1 Mi a statisztika? 2 A statisztika alapfogalmai 3 Deskriptív statisztika A deskriptív statisztikáról általában Egyváltozós elemzés, minőségi változó Egyváltozós elemzés, mennyiségi változó Két minőségi változó kapcsolata: asszociáció Két mennyiségi változó kapcsolata: korreláció 4 Induktív statisztika A mintavételi helyzet konzekvenciái Becsléselmélet Hipotézisvizsgálat 5 Klinikai vizsgálatok

153 Két minőségi változó kapcsolata: asszociáció Példa Két minőségi változó kapcsolatát asszociációnak nevezzük race (rassz) és ui (irritábilis méh): low age lwt race smoke ptl ht ui ftv bwt

154 Két minőségi változó kapcsolata: asszociáció Példa Két minőségi változó kapcsolatát asszociációnak nevezzük race (rassz) és ui (irritábilis méh): low age lwt race smoke ptl ht ui ftv bwt

155 Két minőségi változó kapcsolata: asszociáció Analitikus eszközök: kontingenciatábla Ez is hordoz minden információt: Irritábilis méh Rassz Nem Igen Összesen Kaukázusi Afroamerikai Egyéb Összesen Kapcsolat értelmezése: viszonyítás a függetlenséghez (mennyi információt jelent a sor szempontjából, ha tudjuk, hogy az alany melyik oszlopba tartozik? és viszont) Mutatók: χ 2, Cramer-V stb. stb.; nagyon számítanak a feltevések

156 Két minőségi változó kapcsolata: asszociáció Analitikus eszközök: kontingenciatábla Ez is hordoz minden információt: Irritábilis méh Rassz Nem Igen Összesen Kaukázusi Afroamerikai Egyéb Összesen Kapcsolat értelmezése: viszonyítás a függetlenséghez (mennyi információt jelent a sor szempontjából, ha tudjuk, hogy az alany melyik oszlopba tartozik? és viszont) Mutatók: χ 2, Cramer-V stb. stb.; nagyon számítanak a feltevések

157 Két minőségi változó kapcsolata: asszociáció Analitikus eszközök: kontingenciatábla Ez is hordoz minden információt: Irritábilis méh Rassz Nem Igen Összesen Kaukázusi Afroamerikai Egyéb Összesen Kapcsolat értelmezése: viszonyítás a függetlenséghez (mennyi információt jelent a sor szempontjából, ha tudjuk, hogy az alany melyik oszlopba tartozik? és viszont) Mutatók: χ 2, Cramer-V stb. stb.; nagyon számítanak a feltevések

158 Két minőségi változó kapcsolata: asszociáció Grafikus eszközök Esetleg mozaikábra vagy asszociációs ábra nem túl gyakori Vetületi megoszlások vagy feltételes megoszlások ábrázolhatóak oszlop-, illetve kördiagramon

159 Két minőségi változó kapcsolata: asszociáció Grafikus eszközök Esetleg mozaikábra vagy asszociációs ábra nem túl gyakori Vetületi megoszlások vagy feltételes megoszlások ábrázolhatóak oszlop-, illetve kördiagramon

160 Két mennyiségi változó kapcsolata: korreláció Tartalom 1 Mi a statisztika? 2 A statisztika alapfogalmai 3 Deskriptív statisztika A deskriptív statisztikáról általában Egyváltozós elemzés, minőségi változó Egyváltozós elemzés, mennyiségi változó Két minőségi változó kapcsolata: asszociáció Két mennyiségi változó kapcsolata: korreláció 4 Induktív statisztika A mintavételi helyzet konzekvenciái Becsléselmélet Hipotézisvizsgálat 5 Klinikai vizsgálatok

161 Két mennyiségi változó kapcsolata: korreláció Példa Két mennyiségi változó kapcsolatát korreláció nevezzük lwt (anyai testtömeg) és bwt (születési tömeg): low age lwt race smoke ptl ht ui ftv bwt

162 Két mennyiségi változó kapcsolata: korreláció Példa Két mennyiségi változó kapcsolatát korreláció nevezzük lwt (anyai testtömeg) és bwt (születési tömeg): low age lwt race smoke ptl ht ui ftv bwt

163 Két mennyiségi változó kapcsolata: korreláció Grafikus eszközök: szóródási diagram Ez minden információt hordoz: Az anya és az újszülött testtömegének szóródási diagramja Születési tömeg [g] Anya testtömege (UM) [font]

164 Két mennyiségi változó kapcsolata: korreláció Analitikus eszközök: korrelációs együttható Korrelációs együttható, jele r: a két változó közti sztochasztikus kapcsolat mérőszáma 1 n [ n i=1 (xi x) (y i y) ] r x,y = σ x σ y A kapcsolat irányát és szorosságát mutatja

165 Két mennyiségi változó kapcsolata: korreláció Analitikus eszközök: korrelációs együttható Korrelációs együttható, jele r: a két változó közti sztochasztikus kapcsolat mérőszáma 1 n [ n i=1 (xi x) (y i y) ] r x,y = σ x σ y A kapcsolat irányát és szorosságát mutatja

166 Két mennyiségi változó kapcsolata: korreláció Analitikus eszközök: korrelációs együttható A kapcsolat iránya és szorossága szemléletesen: corr = -1 corr = corr = -0.7 corr = -0.2 corr = 0 corr = 0.2 corr = 0.7 corr = 0.99 corr = 1 y y y y y y y y y x x x x x x x x x

167 Két mennyiségi változó kapcsolata: korreláció Analitikus eszközök: korrelációs együttható De vigyázzunk (Anscombe-kvartett): y y x x2 y y x x4

168 Tartalom 1 Mi a statisztika? 2 A statisztika alapfogalmai 3 Deskriptív statisztika A deskriptív statisztikáról általában Egyváltozós elemzés, minőségi változó Egyváltozós elemzés, mennyiségi változó Két minőségi változó kapcsolata: asszociáció Két mennyiségi változó kapcsolata: korreláció 4 Induktív statisztika A mintavételi helyzet konzekvenciái Becsléselmélet Hipotézisvizsgálat 5 Klinikai vizsgálatok

169 A mintavételi helyzet konzekvenciái Tartalom 1 Mi a statisztika? 2 A statisztika alapfogalmai 3 Deskriptív statisztika A deskriptív statisztikáról általában Egyváltozós elemzés, minőségi változó Egyváltozós elemzés, mennyiségi változó Két minőségi változó kapcsolata: asszociáció Két mennyiségi változó kapcsolata: korreláció 4 Induktív statisztika A mintavételi helyzet konzekvenciái Becsléselmélet Hipotézisvizsgálat 5 Klinikai vizsgálatok

170 A mintavételi helyzet konzekvenciái Emlékeztetőül Nagyon sok esetben technikai okokból, vagy elvileg is lehetetlen a teljes sokaság megfigyelése Csak egy részét, a mintát ismerjük És itt jön a kulcsprobléma: mi mégis a sokaságról akarunk nyilatkozni! Lehet egyáltalán? Hogyan? Biztosat már nem tudunk mondani... de valószínűségi állítást igen!

171 A mintavételi helyzet konzekvenciái Emlékeztetőül Nagyon sok esetben technikai okokból, vagy elvileg is lehetetlen a teljes sokaság megfigyelése Csak egy részét, a mintát ismerjük És itt jön a kulcsprobléma: mi mégis a sokaságról akarunk nyilatkozni! Lehet egyáltalán? Hogyan? Biztosat már nem tudunk mondani... de valószínűségi állítást igen!

172 A mintavételi helyzet konzekvenciái Emlékeztetőül Nagyon sok esetben technikai okokból, vagy elvileg is lehetetlen a teljes sokaság megfigyelése Csak egy részét, a mintát ismerjük És itt jön a kulcsprobléma: mi mégis a sokaságról akarunk nyilatkozni! Lehet egyáltalán? Hogyan? Biztosat már nem tudunk mondani... de valószínűségi állítást igen!

173 A mintavételi helyzet konzekvenciái Emlékeztetőül Nagyon sok esetben technikai okokból, vagy elvileg is lehetetlen a teljes sokaság megfigyelése Csak egy részét, a mintát ismerjük És itt jön a kulcsprobléma: mi mégis a sokaságról akarunk nyilatkozni! Lehet egyáltalán? Hogyan? Biztosat már nem tudunk mondani... de valószínűségi állítást igen!

174 A mintavételi helyzet konzekvenciái Emlékeztetőül Nagyon sok esetben technikai okokból, vagy elvileg is lehetetlen a teljes sokaság megfigyelése Csak egy részét, a mintát ismerjük És itt jön a kulcsprobléma: mi mégis a sokaságról akarunk nyilatkozni! Lehet egyáltalán? Hogyan? Biztosat már nem tudunk mondani... de valószínűségi állítást igen!

175 A mintavételi helyzet konzekvenciái Mintavételi ingadozás Ha csak a sokaság egy részét (a mintát) ismerjük, akkor minden belőle számolt jellemző két dologtól fog függeni 1 a jellemző sokaságbeli értékétől 2 attól, hogy konkrétan hogyan választottuk ki a mintát Mi értelemszerűen az elsőre vagyunk kíváncsiak... csakhogy a kikerülhetetlen második ( pont milyen mintát vettünk ) azt fogja okozni, hogy minden eredményünk mintáról-mintára változni fog A szerencse: ez az ún. mintavételi ingadozás követ valószínűségszámítási törvényeket, így valószínűségi állításokat meg tudunk fogalmazni! Hibázhatunk, de ennek természetéről tudunk nyilatkozni

176 A mintavételi helyzet konzekvenciái Mintavételi ingadozás Ha csak a sokaság egy részét (a mintát) ismerjük, akkor minden belőle számolt jellemző két dologtól fog függeni 1 a jellemző sokaságbeli értékétől 2 attól, hogy konkrétan hogyan választottuk ki a mintát Mi értelemszerűen az elsőre vagyunk kíváncsiak... csakhogy a kikerülhetetlen második ( pont milyen mintát vettünk ) azt fogja okozni, hogy minden eredményünk mintáról-mintára változni fog A szerencse: ez az ún. mintavételi ingadozás követ valószínűségszámítási törvényeket, így valószínűségi állításokat meg tudunk fogalmazni! Hibázhatunk, de ennek természetéről tudunk nyilatkozni

177 A mintavételi helyzet konzekvenciái Mintavételi ingadozás Ha csak a sokaság egy részét (a mintát) ismerjük, akkor minden belőle számolt jellemző két dologtól fog függeni 1 a jellemző sokaságbeli értékétől 2 attól, hogy konkrétan hogyan választottuk ki a mintát Mi értelemszerűen az elsőre vagyunk kíváncsiak... csakhogy a kikerülhetetlen második ( pont milyen mintát vettünk ) azt fogja okozni, hogy minden eredményünk mintáról-mintára változni fog A szerencse: ez az ún. mintavételi ingadozás követ valószínűségszámítási törvényeket, így valószínűségi állításokat meg tudunk fogalmazni! Hibázhatunk, de ennek természetéről tudunk nyilatkozni

178 A mintavételi helyzet konzekvenciái Mintavételi ingadozás Ha csak a sokaság egy részét (a mintát) ismerjük, akkor minden belőle számolt jellemző két dologtól fog függeni 1 a jellemző sokaságbeli értékétől 2 attól, hogy konkrétan hogyan választottuk ki a mintát Mi értelemszerűen az elsőre vagyunk kíváncsiak... csakhogy a kikerülhetetlen második ( pont milyen mintát vettünk ) azt fogja okozni, hogy minden eredményünk mintáról-mintára változni fog A szerencse: ez az ún. mintavételi ingadozás követ valószínűségszámítási törvényeket, így valószínűségi állításokat meg tudunk fogalmazni! Hibázhatunk, de ennek természetéről tudunk nyilatkozni

179 A mintavételi helyzet konzekvenciái Mintavételi ingadozás Ha csak a sokaság egy részét (a mintát) ismerjük, akkor minden belőle számolt jellemző két dologtól fog függeni 1 a jellemző sokaságbeli értékétől 2 attól, hogy konkrétan hogyan választottuk ki a mintát Mi értelemszerűen az elsőre vagyunk kíváncsiak... csakhogy a kikerülhetetlen második ( pont milyen mintát vettünk ) azt fogja okozni, hogy minden eredményünk mintáról-mintára változni fog A szerencse: ez az ún. mintavételi ingadozás követ valószínűségszámítási törvényeket, így valószínűségi állításokat meg tudunk fogalmazni! Hibázhatunk, de ennek természetéről tudunk nyilatkozni

180 A mintavételi helyzet konzekvenciái Mintavételi ingadozás Ha csak a sokaság egy részét (a mintát) ismerjük, akkor minden belőle számolt jellemző két dologtól fog függeni 1 a jellemző sokaságbeli értékétől 2 attól, hogy konkrétan hogyan választottuk ki a mintát Mi értelemszerűen az elsőre vagyunk kíváncsiak... csakhogy a kikerülhetetlen második ( pont milyen mintát vettünk ) azt fogja okozni, hogy minden eredményünk mintáról-mintára változni fog A szerencse: ez az ún. mintavételi ingadozás követ valószínűségszámítási törvényeket, így valószínűségi állításokat meg tudunk fogalmazni! Hibázhatunk, de ennek természetéről tudunk nyilatkozni

181 A mintavételi helyzet konzekvenciái Mintavételi ingadozás Ha csak a sokaság egy részét (a mintát) ismerjük, akkor minden belőle számolt jellemző két dologtól fog függeni 1 a jellemző sokaságbeli értékétől 2 attól, hogy konkrétan hogyan választottuk ki a mintát Mi értelemszerűen az elsőre vagyunk kíváncsiak... csakhogy a kikerülhetetlen második ( pont milyen mintát vettünk ) azt fogja okozni, hogy minden eredményünk mintáról-mintára változni fog A szerencse: ez az ún. mintavételi ingadozás követ valószínűségszámítási törvényeket, így valószínűségi állításokat meg tudunk fogalmazni! Hibázhatunk, de ennek természetéről tudunk nyilatkozni

182 A mintavételi helyzet konzekvenciái Mintavételi hiba Figyelem, ennél a hibázásnál nem arról van szó, hogy rosszul veszünk mintát: például a legtökéletesebben véletlenszerű mintavételnél is előfordulhat, hogy egy 1000 fős sokaságból úgy becsüljük az átlagos testtömeget, hogy pont a 30 legkönnyebbet választjuk ki De: ennek a valószínűsége extrém kicsi! (Egész pontosan 1/ ( ) %) Így értendő, hogy ez a hiba valószínűségszámítási úton, sztochasztikusan limitálható Ezt nevezzük mintavételi hibának

183 A mintavételi helyzet konzekvenciái Mintavételi hiba Figyelem, ennél a hibázásnál nem arról van szó, hogy rosszul veszünk mintát: például a legtökéletesebben véletlenszerű mintavételnél is előfordulhat, hogy egy 1000 fős sokaságból úgy becsüljük az átlagos testtömeget, hogy pont a 30 legkönnyebbet választjuk ki De: ennek a valószínűsége extrém kicsi! (Egész pontosan 1/ ( ) %) Így értendő, hogy ez a hiba valószínűségszámítási úton, sztochasztikusan limitálható Ezt nevezzük mintavételi hibának

184 A mintavételi helyzet konzekvenciái Mintavételi hiba Figyelem, ennél a hibázásnál nem arról van szó, hogy rosszul veszünk mintát: például a legtökéletesebben véletlenszerű mintavételnél is előfordulhat, hogy egy 1000 fős sokaságból úgy becsüljük az átlagos testtömeget, hogy pont a 30 legkönnyebbet választjuk ki De: ennek a valószínűsége extrém kicsi! (Egész pontosan 1/ ( ) %) Így értendő, hogy ez a hiba valószínűségszámítási úton, sztochasztikusan limitálható Ezt nevezzük mintavételi hibának

185 A mintavételi helyzet konzekvenciái Mintavételi hiba Figyelem, ennél a hibázásnál nem arról van szó, hogy rosszul veszünk mintát: például a legtökéletesebben véletlenszerű mintavételnél is előfordulhat, hogy egy 1000 fős sokaságból úgy becsüljük az átlagos testtömeget, hogy pont a 30 legkönnyebbet választjuk ki De: ennek a valószínűsége extrém kicsi! (Egész pontosan 1/ ( ) %) Így értendő, hogy ez a hiba valószínűségszámítási úton, sztochasztikusan limitálható Ezt nevezzük mintavételi hibának

186 A mintavételi helyzet konzekvenciái Mintavételi hiba Figyelem, ennél a hibázásnál nem arról van szó, hogy rosszul veszünk mintát: például a legtökéletesebben véletlenszerű mintavételnél is előfordulhat, hogy egy 1000 fős sokaságból úgy becsüljük az átlagos testtömeget, hogy pont a 30 legkönnyebbet választjuk ki De: ennek a valószínűsége extrém kicsi! (Egész pontosan 1/ ( ) %) Így értendő, hogy ez a hiba valószínűségszámítási úton, sztochasztikusan limitálható Ezt nevezzük mintavételi hibának

187 A mintavételi helyzet konzekvenciái Nem-mintavételi hiba Ez természetesen arra vonatkoznak, hogy mi a mintavételi ingadozásból adódó hiba De nem csak ilyen van: alullefedés, túllefedés, kódolási hiba stb. és a legnagyobb baj: a minta megválasztása Mi van, ha a minta nem véletlen részhalmaza a sokaságnak? ( reprezentativitás kérdése) Literary Digest esete Különösen óvatosan a kényelmi mintával Survey statisztika (külön szak!)

188 A mintavételi helyzet konzekvenciái Nem-mintavételi hiba Ez természetesen arra vonatkoznak, hogy mi a mintavételi ingadozásból adódó hiba De nem csak ilyen van: alullefedés, túllefedés, kódolási hiba stb. és a legnagyobb baj: a minta megválasztása Mi van, ha a minta nem véletlen részhalmaza a sokaságnak? ( reprezentativitás kérdése) Literary Digest esete Különösen óvatosan a kényelmi mintával Survey statisztika (külön szak!)

189 A mintavételi helyzet konzekvenciái Nem-mintavételi hiba Ez természetesen arra vonatkoznak, hogy mi a mintavételi ingadozásból adódó hiba De nem csak ilyen van: alullefedés, túllefedés, kódolási hiba stb. és a legnagyobb baj: a minta megválasztása Mi van, ha a minta nem véletlen részhalmaza a sokaságnak? ( reprezentativitás kérdése) Literary Digest esete Különösen óvatosan a kényelmi mintával Survey statisztika (külön szak!)

190 A mintavételi helyzet konzekvenciái Nem-mintavételi hiba Ez természetesen arra vonatkoznak, hogy mi a mintavételi ingadozásból adódó hiba De nem csak ilyen van: alullefedés, túllefedés, kódolási hiba stb. és a legnagyobb baj: a minta megválasztása Mi van, ha a minta nem véletlen részhalmaza a sokaságnak? ( reprezentativitás kérdése) Literary Digest esete Különösen óvatosan a kényelmi mintával Survey statisztika (külön szak!)

191 A mintavételi helyzet konzekvenciái Nem-mintavételi hiba Ez természetesen arra vonatkoznak, hogy mi a mintavételi ingadozásból adódó hiba De nem csak ilyen van: alullefedés, túllefedés, kódolási hiba stb. és a legnagyobb baj: a minta megválasztása Mi van, ha a minta nem véletlen részhalmaza a sokaságnak? ( reprezentativitás kérdése) Literary Digest esete Különösen óvatosan a kényelmi mintával Survey statisztika (külön szak!)

192 A mintavételi helyzet konzekvenciái Nem-mintavételi hiba Ez természetesen arra vonatkoznak, hogy mi a mintavételi ingadozásból adódó hiba De nem csak ilyen van: alullefedés, túllefedés, kódolási hiba stb. és a legnagyobb baj: a minta megválasztása Mi van, ha a minta nem véletlen részhalmaza a sokaságnak? ( reprezentativitás kérdése) Literary Digest esete Különösen óvatosan a kényelmi mintával Survey statisztika (külön szak!)

193 Becsléselmélet Tartalom 1 Mi a statisztika? 2 A statisztika alapfogalmai 3 Deskriptív statisztika A deskriptív statisztikáról általában Egyváltozós elemzés, minőségi változó Egyváltozós elemzés, mennyiségi változó Két minőségi változó kapcsolata: asszociáció Két mennyiségi változó kapcsolata: korreláció 4 Induktív statisztika A mintavételi helyzet konzekvenciái Becsléselmélet Hipotézisvizsgálat 5 Klinikai vizsgálatok

194 Becsléselmélet Pontbecslés Feladat: valamely sokasági jellemző meghatározása minta alapján Például sokaság átlaga/várhatóértéke minta alapján Naiv tipp: mondjuk a minta átlagát becslésként! Az ilyen szabály a becslőfüggvény: a mintaelemekből megmondja a legjobb tippünket a sokasági jellemzőre Mi az, hogy jó becslő? A két legfontosabb tulajdonság: 1 Elfogadjuk, hogy a becslőfüggvény által szolgáltatott becslés mintáról-mintára ingadozik, de legalább az teljesüljön, hogy az ingadozás centrumában a valódi (sokasági) jellemző legyen (torzítatlanság) 2 Ennek az ingadozásnak a mértéke lehetőleg minél kisebb legyen (hatásosság) A becslőfüggvény eloszlása (ugye annak eloszlása lesz, és nem értéke, hiszen mintáról-mintára változik; és adott tartományokban különböző valószínűséggel esik!) az ún. mintavételi eloszlás

195 Becsléselmélet Pontbecslés Feladat: valamely sokasági jellemző meghatározása minta alapján Például sokaság átlaga/várhatóértéke minta alapján Naiv tipp: mondjuk a minta átlagát becslésként! Az ilyen szabály a becslőfüggvény: a mintaelemekből megmondja a legjobb tippünket a sokasági jellemzőre Mi az, hogy jó becslő? A két legfontosabb tulajdonság: 1 Elfogadjuk, hogy a becslőfüggvény által szolgáltatott becslés mintáról-mintára ingadozik, de legalább az teljesüljön, hogy az ingadozás centrumában a valódi (sokasági) jellemző legyen (torzítatlanság) 2 Ennek az ingadozásnak a mértéke lehetőleg minél kisebb legyen (hatásosság) A becslőfüggvény eloszlása (ugye annak eloszlása lesz, és nem értéke, hiszen mintáról-mintára változik; és adott tartományokban különböző valószínűséggel esik!) az ún. mintavételi eloszlás

196 Becsléselmélet Pontbecslés Feladat: valamely sokasági jellemző meghatározása minta alapján Például sokaság átlaga/várhatóértéke minta alapján Naiv tipp: mondjuk a minta átlagát becslésként! Az ilyen szabály a becslőfüggvény: a mintaelemekből megmondja a legjobb tippünket a sokasági jellemzőre Mi az, hogy jó becslő? A két legfontosabb tulajdonság: 1 Elfogadjuk, hogy a becslőfüggvény által szolgáltatott becslés mintáról-mintára ingadozik, de legalább az teljesüljön, hogy az ingadozás centrumában a valódi (sokasági) jellemző legyen (torzítatlanság) 2 Ennek az ingadozásnak a mértéke lehetőleg minél kisebb legyen (hatásosság) A becslőfüggvény eloszlása (ugye annak eloszlása lesz, és nem értéke, hiszen mintáról-mintára változik; és adott tartományokban különböző valószínűséggel esik!) az ún. mintavételi eloszlás

197 Becsléselmélet Pontbecslés Feladat: valamely sokasági jellemző meghatározása minta alapján Például sokaság átlaga/várhatóértéke minta alapján Naiv tipp: mondjuk a minta átlagát becslésként! Az ilyen szabály a becslőfüggvény: a mintaelemekből megmondja a legjobb tippünket a sokasági jellemzőre Mi az, hogy jó becslő? A két legfontosabb tulajdonság: 1 Elfogadjuk, hogy a becslőfüggvény által szolgáltatott becslés mintáról-mintára ingadozik, de legalább az teljesüljön, hogy az ingadozás centrumában a valódi (sokasági) jellemző legyen (torzítatlanság) 2 Ennek az ingadozásnak a mértéke lehetőleg minél kisebb legyen (hatásosság) A becslőfüggvény eloszlása (ugye annak eloszlása lesz, és nem értéke, hiszen mintáról-mintára változik; és adott tartományokban különböző valószínűséggel esik!) az ún. mintavételi eloszlás

198 Becsléselmélet Pontbecslés Feladat: valamely sokasági jellemző meghatározása minta alapján Például sokaság átlaga/várhatóértéke minta alapján Naiv tipp: mondjuk a minta átlagát becslésként! Az ilyen szabály a becslőfüggvény: a mintaelemekből megmondja a legjobb tippünket a sokasági jellemzőre Mi az, hogy jó becslő? A két legfontosabb tulajdonság: 1 Elfogadjuk, hogy a becslőfüggvény által szolgáltatott becslés mintáról-mintára ingadozik, de legalább az teljesüljön, hogy az ingadozás centrumában a valódi (sokasági) jellemző legyen (torzítatlanság) 2 Ennek az ingadozásnak a mértéke lehetőleg minél kisebb legyen (hatásosság) A becslőfüggvény eloszlása (ugye annak eloszlása lesz, és nem értéke, hiszen mintáról-mintára változik; és adott tartományokban különböző valószínűséggel esik!) az ún. mintavételi eloszlás

199 Becsléselmélet Pontbecslés Feladat: valamely sokasági jellemző meghatározása minta alapján Például sokaság átlaga/várhatóértéke minta alapján Naiv tipp: mondjuk a minta átlagát becslésként! Az ilyen szabály a becslőfüggvény: a mintaelemekből megmondja a legjobb tippünket a sokasági jellemzőre Mi az, hogy jó becslő? A két legfontosabb tulajdonság: 1 Elfogadjuk, hogy a becslőfüggvény által szolgáltatott becslés mintáról-mintára ingadozik, de legalább az teljesüljön, hogy az ingadozás centrumában a valódi (sokasági) jellemző legyen (torzítatlanság) 2 Ennek az ingadozásnak a mértéke lehetőleg minél kisebb legyen (hatásosság) A becslőfüggvény eloszlása (ugye annak eloszlása lesz, és nem értéke, hiszen mintáról-mintára változik; és adott tartományokban különböző valószínűséggel esik!) az ún. mintavételi eloszlás

200 Becsléselmélet Pontbecslés Feladat: valamely sokasági jellemző meghatározása minta alapján Például sokaság átlaga/várhatóértéke minta alapján Naiv tipp: mondjuk a minta átlagát becslésként! Az ilyen szabály a becslőfüggvény: a mintaelemekből megmondja a legjobb tippünket a sokasági jellemzőre Mi az, hogy jó becslő? A két legfontosabb tulajdonság: 1 Elfogadjuk, hogy a becslőfüggvény által szolgáltatott becslés mintáról-mintára ingadozik, de legalább az teljesüljön, hogy az ingadozás centrumában a valódi (sokasági) jellemző legyen (torzítatlanság) 2 Ennek az ingadozásnak a mértéke lehetőleg minél kisebb legyen (hatásosság) A becslőfüggvény eloszlása (ugye annak eloszlása lesz, és nem értéke, hiszen mintáról-mintára változik; és adott tartományokban különböző valószínűséggel esik!) az ún. mintavételi eloszlás

201 Becsléselmélet Pontbecslés Feladat: valamely sokasági jellemző meghatározása minta alapján Például sokaság átlaga/várhatóértéke minta alapján Naiv tipp: mondjuk a minta átlagát becslésként! Az ilyen szabály a becslőfüggvény: a mintaelemekből megmondja a legjobb tippünket a sokasági jellemzőre Mi az, hogy jó becslő? A két legfontosabb tulajdonság: 1 Elfogadjuk, hogy a becslőfüggvény által szolgáltatott becslés mintáról-mintára ingadozik, de legalább az teljesüljön, hogy az ingadozás centrumában a valódi (sokasági) jellemző legyen (torzítatlanság) 2 Ennek az ingadozásnak a mértéke lehetőleg minél kisebb legyen (hatásosság) A becslőfüggvény eloszlása (ugye annak eloszlása lesz, és nem értéke, hiszen mintáról-mintára változik; és adott tartományokban különböző valószínűséggel esik!) az ún. mintavételi eloszlás

202 Becsléselmélet Mintavételi eloszlás: egy állítás Ha a sokaság X N ( µ, σ 2 0) eloszlást követ (tehát figyelem: ez egy ún. eloszlásával (és nem elemeivel!) adott sokaság; fiktív, végtelen sokaságnál tipikus), akkor a belőle vett n elemű minták átlaga, azaz a µ sokasági várhatóérték (mint sokasági jellemző) fenti becslőfüggvénye x N ( µ, σ 2 0 /n) eloszlást fog követni (Tehát feltételeztük, hogy azt a priori tudjuk, hogy normális eloszlású a sokaság, sőt, σ-t is ismertnek vesszük csak a µ a kérdés) Figyelem, a sokasági jellemző, amit becsülni szeretnénk, itt a µ maga; az tehát nem követ semmilyen eloszlást, egy konstans szám! (Csak mi nem ismerjük.) Ez csak fae (független, azonos eloszlású) mintavételre igaz Ez matematikai úton (valószínűségszámítási módszerekkel) belátható; hogy legyen pár képlet is, bármennyire is bevezetésről van szó, ezt megmutatjuk

203 Becsléselmélet Mintavételi eloszlás: egy állítás Ha a sokaság X N ( µ, σ 2 0) eloszlást követ (tehát figyelem: ez egy ún. eloszlásával (és nem elemeivel!) adott sokaság; fiktív, végtelen sokaságnál tipikus), akkor a belőle vett n elemű minták átlaga, azaz a µ sokasági várhatóérték (mint sokasági jellemző) fenti becslőfüggvénye x N ( µ, σ 2 0 /n) eloszlást fog követni (Tehát feltételeztük, hogy azt a priori tudjuk, hogy normális eloszlású a sokaság, sőt, σ-t is ismertnek vesszük csak a µ a kérdés) Figyelem, a sokasági jellemző, amit becsülni szeretnénk, itt a µ maga; az tehát nem követ semmilyen eloszlást, egy konstans szám! (Csak mi nem ismerjük.) Ez csak fae (független, azonos eloszlású) mintavételre igaz Ez matematikai úton (valószínűségszámítási módszerekkel) belátható; hogy legyen pár képlet is, bármennyire is bevezetésről van szó, ezt megmutatjuk

204 Becsléselmélet Mintavételi eloszlás: egy állítás Ha a sokaság X N ( µ, σ 2 0) eloszlást követ (tehát figyelem: ez egy ún. eloszlásával (és nem elemeivel!) adott sokaság; fiktív, végtelen sokaságnál tipikus), akkor a belőle vett n elemű minták átlaga, azaz a µ sokasági várhatóérték (mint sokasági jellemző) fenti becslőfüggvénye x N ( µ, σ 2 0 /n) eloszlást fog követni (Tehát feltételeztük, hogy azt a priori tudjuk, hogy normális eloszlású a sokaság, sőt, σ-t is ismertnek vesszük csak a µ a kérdés) Figyelem, a sokasági jellemző, amit becsülni szeretnénk, itt a µ maga; az tehát nem követ semmilyen eloszlást, egy konstans szám! (Csak mi nem ismerjük.) Ez csak fae (független, azonos eloszlású) mintavételre igaz Ez matematikai úton (valószínűségszámítási módszerekkel) belátható; hogy legyen pár képlet is, bármennyire is bevezetésről van szó, ezt megmutatjuk

205 Becsléselmélet Mintavételi eloszlás: egy állítás Ha a sokaság X N ( µ, σ 2 0) eloszlást követ (tehát figyelem: ez egy ún. eloszlásával (és nem elemeivel!) adott sokaság; fiktív, végtelen sokaságnál tipikus), akkor a belőle vett n elemű minták átlaga, azaz a µ sokasági várhatóérték (mint sokasági jellemző) fenti becslőfüggvénye x N ( µ, σ 2 0 /n) eloszlást fog követni (Tehát feltételeztük, hogy azt a priori tudjuk, hogy normális eloszlású a sokaság, sőt, σ-t is ismertnek vesszük csak a µ a kérdés) Figyelem, a sokasági jellemző, amit becsülni szeretnénk, itt a µ maga; az tehát nem követ semmilyen eloszlást, egy konstans szám! (Csak mi nem ismerjük.) Ez csak fae (független, azonos eloszlású) mintavételre igaz Ez matematikai úton (valószínűségszámítási módszerekkel) belátható; hogy legyen pár képlet is, bármennyire is bevezetésről van szó, ezt megmutatjuk

206 Becsléselmélet Mintavételi eloszlás: egy állítás Ha a sokaság X N ( µ, σ 2 0) eloszlást követ (tehát figyelem: ez egy ún. eloszlásával (és nem elemeivel!) adott sokaság; fiktív, végtelen sokaságnál tipikus), akkor a belőle vett n elemű minták átlaga, azaz a µ sokasági várhatóérték (mint sokasági jellemző) fenti becslőfüggvénye x N ( µ, σ 2 0 /n) eloszlást fog követni (Tehát feltételeztük, hogy azt a priori tudjuk, hogy normális eloszlású a sokaság, sőt, σ-t is ismertnek vesszük csak a µ a kérdés) Figyelem, a sokasági jellemző, amit becsülni szeretnénk, itt a µ maga; az tehát nem követ semmilyen eloszlást, egy konstans szám! (Csak mi nem ismerjük.) Ez csak fae (független, azonos eloszlású) mintavételre igaz Ez matematikai úton (valószínűségszámítási módszerekkel) belátható; hogy legyen pár képlet is, bármennyire is bevezetésről van szó, ezt megmutatjuk

207 Becsléselmélet Bizonyítás I. Legyen az n elemű mintánk X 1, X 2,..., X n N ( µ, σ 2) fae (mivel fae, mindegyik ugyanolyan eloszlást követ) Nagy betűket írtunk: ezek nem konkrét (realizálódott) értékek, hanem maguk is val. változók (eggyel nagyobb dimenzió a statisztikai analízishez) n i=1 X i n Ezzel a becslőfüggvényünk: X = Valószínűségszámításból tudjuk, hogy 1 Normális eloszlású v.v.-k összege normális (szépen: a normális eloszláscsalád zárt a konvolúcióra) 2 A várhatóérték-képzés lineáris, így az összeg várhatóértéke a várhatóértékek összege 3 Ha ráadásul függetlenek, akkor a szórásnégyzetek (nem a szórások!) is összeadódnak

208 Becsléselmélet Bizonyítás I. Legyen az n elemű mintánk X 1, X 2,..., X n N ( µ, σ 2) fae (mivel fae, mindegyik ugyanolyan eloszlást követ) Nagy betűket írtunk: ezek nem konkrét (realizálódott) értékek, hanem maguk is val. változók (eggyel nagyobb dimenzió a statisztikai analízishez) n i=1 X i n Ezzel a becslőfüggvényünk: X = Valószínűségszámításból tudjuk, hogy 1 Normális eloszlású v.v.-k összege normális (szépen: a normális eloszláscsalád zárt a konvolúcióra) 2 A várhatóérték-képzés lineáris, így az összeg várhatóértéke a várhatóértékek összege 3 Ha ráadásul függetlenek, akkor a szórásnégyzetek (nem a szórások!) is összeadódnak

209 Becsléselmélet Bizonyítás I. Legyen az n elemű mintánk X 1, X 2,..., X n N ( µ, σ 2) fae (mivel fae, mindegyik ugyanolyan eloszlást követ) Nagy betűket írtunk: ezek nem konkrét (realizálódott) értékek, hanem maguk is val. változók (eggyel nagyobb dimenzió a statisztikai analízishez) n i=1 X i n Ezzel a becslőfüggvényünk: X = Valószínűségszámításból tudjuk, hogy 1 Normális eloszlású v.v.-k összege normális (szépen: a normális eloszláscsalád zárt a konvolúcióra) 2 A várhatóérték-képzés lineáris, így az összeg várhatóértéke a várhatóértékek összege 3 Ha ráadásul függetlenek, akkor a szórásnégyzetek (nem a szórások!) is összeadódnak

210 Becsléselmélet Bizonyítás I. Legyen az n elemű mintánk X 1, X 2,..., X n N ( µ, σ 2) fae (mivel fae, mindegyik ugyanolyan eloszlást követ) Nagy betűket írtunk: ezek nem konkrét (realizálódott) értékek, hanem maguk is val. változók (eggyel nagyobb dimenzió a statisztikai analízishez) n i=1 X i n Ezzel a becslőfüggvényünk: X = Valószínűségszámításból tudjuk, hogy 1 Normális eloszlású v.v.-k összege normális (szépen: a normális eloszláscsalád zárt a konvolúcióra) 2 A várhatóérték-képzés lineáris, így az összeg várhatóértéke a várhatóértékek összege 3 Ha ráadásul függetlenek, akkor a szórásnégyzetek (nem a szórások!) is összeadódnak

211 Becsléselmélet Bizonyítás I. Legyen az n elemű mintánk X 1, X 2,..., X n N ( µ, σ 2) fae (mivel fae, mindegyik ugyanolyan eloszlást követ) Nagy betűket írtunk: ezek nem konkrét (realizálódott) értékek, hanem maguk is val. változók (eggyel nagyobb dimenzió a statisztikai analízishez) n i=1 X i n Ezzel a becslőfüggvényünk: X = Valószínűségszámításból tudjuk, hogy 1 Normális eloszlású v.v.-k összege normális (szépen: a normális eloszláscsalád zárt a konvolúcióra) 2 A várhatóérték-képzés lineáris, így az összeg várhatóértéke a várhatóértékek összege 3 Ha ráadásul függetlenek, akkor a szórásnégyzetek (nem a szórások!) is összeadódnak

212 Becsléselmélet Bizonyítás I. Legyen az n elemű mintánk X 1, X 2,..., X n N ( µ, σ 2) fae (mivel fae, mindegyik ugyanolyan eloszlást követ) Nagy betűket írtunk: ezek nem konkrét (realizálódott) értékek, hanem maguk is val. változók (eggyel nagyobb dimenzió a statisztikai analízishez) n i=1 X i n Ezzel a becslőfüggvényünk: X = Valószínűségszámításból tudjuk, hogy 1 Normális eloszlású v.v.-k összege normális (szépen: a normális eloszláscsalád zárt a konvolúcióra) 2 A várhatóérték-képzés lineáris, így az összeg várhatóértéke a várhatóértékek összege 3 Ha ráadásul függetlenek, akkor a szórásnégyzetek (nem a szórások!) is összeadódnak

213 Becsléselmélet Bizonyítás I. Legyen az n elemű mintánk X 1, X 2,..., X n N ( µ, σ 2) fae (mivel fae, mindegyik ugyanolyan eloszlást követ) Nagy betűket írtunk: ezek nem konkrét (realizálódott) értékek, hanem maguk is val. változók (eggyel nagyobb dimenzió a statisztikai analízishez) n i=1 X i n Ezzel a becslőfüggvényünk: X = Valószínűségszámításból tudjuk, hogy 1 Normális eloszlású v.v.-k összege normális (szépen: a normális eloszláscsalád zárt a konvolúcióra) 2 A várhatóérték-képzés lineáris, így az összeg várhatóértéke a várhatóértékek összege 3 Ha ráadásul függetlenek, akkor a szórásnégyzetek (nem a szórások!) is összeadódnak

214 Becsléselmélet Bizonyítás II. A fenti háromból már következik, hogy n i=1 X i N ( nµ, nσ 2) Szintén valószínűségszámításból tudjuk, hogy 1 E (ax ) = a EX 2 D 2 (ax ) = a 2 D 2 X Amiből pedig már következik, hogy n i=1 X = X i N n ahogy állítottuk is ( ) µ, σ 2 /n, Íme egy nagyon egyszerű példa a matematikai statisztikára! Tehát: torzítatlan becslő (többet is be lehetne látni)

215 Becsléselmélet Bizonyítás II. A fenti háromból már következik, hogy n i=1 X i N ( nµ, nσ 2) Szintén valószínűségszámításból tudjuk, hogy 1 E (ax ) = a EX 2 D 2 (ax ) = a 2 D 2 X Amiből pedig már következik, hogy n i=1 X = X i N n ahogy állítottuk is ( ) µ, σ 2 /n, Íme egy nagyon egyszerű példa a matematikai statisztikára! Tehát: torzítatlan becslő (többet is be lehetne látni)

216 Becsléselmélet Bizonyítás II. A fenti háromból már következik, hogy n i=1 X i N ( nµ, nσ 2) Szintén valószínűségszámításból tudjuk, hogy 1 E (ax ) = a EX 2 D 2 (ax ) = a 2 D 2 X Amiből pedig már következik, hogy n i=1 X = X i N n ahogy állítottuk is ( ) µ, σ 2 /n, Íme egy nagyon egyszerű példa a matematikai statisztikára! Tehát: torzítatlan becslő (többet is be lehetne látni)

217 Becsléselmélet Bizonyítás II. A fenti háromból már következik, hogy n i=1 X i N ( nµ, nσ 2) Szintén valószínűségszámításból tudjuk, hogy 1 E (ax ) = a EX 2 D 2 (ax ) = a 2 D 2 X Amiből pedig már következik, hogy n i=1 X = X i N n ahogy állítottuk is ( ) µ, σ 2 /n, Íme egy nagyon egyszerű példa a matematikai statisztikára! Tehát: torzítatlan becslő (többet is be lehetne látni)

218 Becsléselmélet Bizonyítás II. A fenti háromból már következik, hogy n i=1 X i N ( nµ, nσ 2) Szintén valószínűségszámításból tudjuk, hogy 1 E (ax ) = a EX 2 D 2 (ax ) = a 2 D 2 X Amiből pedig már következik, hogy n i=1 X = X i N n ahogy állítottuk is ( ) µ, σ 2 /n, Íme egy nagyon egyszerű példa a matematikai statisztikára! Tehát: torzítatlan becslő (többet is be lehetne látni)

219 Becsléselmélet Bizonyítás II. A fenti háromból már következik, hogy n i=1 X i N ( nµ, nσ 2) Szintén valószínűségszámításból tudjuk, hogy 1 E (ax ) = a EX 2 D 2 (ax ) = a 2 D 2 X Amiből pedig már következik, hogy n i=1 X = X i N n ahogy állítottuk is ( ) µ, σ 2 /n, Íme egy nagyon egyszerű példa a matematikai statisztikára! Tehát: torzítatlan becslő (többet is be lehetne látni)

220 Becsléselmélet Bizonyítás II. A fenti háromból már következik, hogy n i=1 X i N ( nµ, nσ 2) Szintén valószínűségszámításból tudjuk, hogy 1 E (ax ) = a EX 2 D 2 (ax ) = a 2 D 2 X Amiből pedig már következik, hogy n i=1 X = X i N n ahogy állítottuk is ( ) µ, σ 2 /n, Íme egy nagyon egyszerű példa a matematikai statisztikára! Tehát: torzítatlan becslő (többet is be lehetne látni)

221 Becsléselmélet Intervallumbecslés A fentiekkel egyetlen számot, a legjobb becslést adjuk vissza eredményként Nem adunk számot arról, hogy ebben mekkora a bizonytalanság pedig erről is tudunk nyilatkozni! ( Kalkulálható bizonytalanság ) Tipikus szemléltetés: konfidenciaintervallum (CI): mi az a tartomány, amire igaz, hogy ha sokszor megismételnék a mintavételt, és mindegyik mintából megszerkesztenénk a CI-t, akkor ezen CI-k várhatóan 95%-a tartalmazná az igazi (sokasági) értéket (95% megbízhatóság melletti CI) Nagyobb megbízhatóság semmitmondóbb intervallum

222 Becsléselmélet Intervallumbecslés A fentiekkel egyetlen számot, a legjobb becslést adjuk vissza eredményként Nem adunk számot arról, hogy ebben mekkora a bizonytalanság pedig erről is tudunk nyilatkozni! ( Kalkulálható bizonytalanság ) Tipikus szemléltetés: konfidenciaintervallum (CI): mi az a tartomány, amire igaz, hogy ha sokszor megismételnék a mintavételt, és mindegyik mintából megszerkesztenénk a CI-t, akkor ezen CI-k várhatóan 95%-a tartalmazná az igazi (sokasági) értéket (95% megbízhatóság melletti CI) Nagyobb megbízhatóság semmitmondóbb intervallum

223 Becsléselmélet Intervallumbecslés A fentiekkel egyetlen számot, a legjobb becslést adjuk vissza eredményként Nem adunk számot arról, hogy ebben mekkora a bizonytalanság pedig erről is tudunk nyilatkozni! ( Kalkulálható bizonytalanság ) Tipikus szemléltetés: konfidenciaintervallum (CI): mi az a tartomány, amire igaz, hogy ha sokszor megismételnék a mintavételt, és mindegyik mintából megszerkesztenénk a CI-t, akkor ezen CI-k várhatóan 95%-a tartalmazná az igazi (sokasági) értéket (95% megbízhatóság melletti CI) Nagyobb megbízhatóság semmitmondóbb intervallum

224 Becsléselmélet Intervallumbecslés A fentiekkel egyetlen számot, a legjobb becslést adjuk vissza eredményként Nem adunk számot arról, hogy ebben mekkora a bizonytalanság pedig erről is tudunk nyilatkozni! ( Kalkulálható bizonytalanság ) Tipikus szemléltetés: konfidenciaintervallum (CI): mi az a tartomány, amire igaz, hogy ha sokszor megismételnék a mintavételt, és mindegyik mintából megszerkesztenénk a CI-t, akkor ezen CI-k várhatóan 95%-a tartalmazná az igazi (sokasági) értéket (95% megbízhatóság melletti CI) Nagyobb megbízhatóság semmitmondóbb intervallum

225 Becsléselmélet Intervallumbecslés A fentiekkel egyetlen számot, a legjobb becslést adjuk vissza eredményként Nem adunk számot arról, hogy ebben mekkora a bizonytalanság pedig erről is tudunk nyilatkozni! ( Kalkulálható bizonytalanság ) Tipikus szemléltetés: konfidenciaintervallum (CI): mi az a tartomány, amire igaz, hogy ha sokszor megismételnék a mintavételt, és mindegyik mintából megszerkesztenénk a CI-t, akkor ezen CI-k várhatóan 95%-a tartalmazná az igazi (sokasági) értéket (95% megbízhatóság melletti CI) Nagyobb megbízhatóság semmitmondóbb intervallum

226 Becsléselmélet Példa I. Például: tudjuk, hogy X N ( µ, σ 2 /n ) Ebből következik, hogy X µ σ/ N (0, 1) n Azaz P ( z < X µ σ/ n < z Emiatt, ha ) = Φ (z) Φ ( z) = Φ (z) [ 1 Φ (z) ] = = 2Φ (z) 1 2Φ (z) 1 = 1 α Φ (z) = 1 α 2 z = Φ 1 ( 1 α 2 ) =: z 1 α 2, [ ] akkor rögtön látható, hogy a µ z 1 α σ 2 n, µ + z 1 α σ 2 n tartományba 1 α valószínűséggel esik X ( deduktív statisztika )

227 Becsléselmélet Példa I. Például: tudjuk, hogy X N ( µ, σ 2 /n ) Ebből következik, hogy X µ σ/ N (0, 1) n Azaz P ( z < X µ σ/ n < z Emiatt, ha ) = Φ (z) Φ ( z) = Φ (z) [ 1 Φ (z) ] = = 2Φ (z) 1 2Φ (z) 1 = 1 α Φ (z) = 1 α 2 z = Φ 1 ( 1 α 2 ) =: z 1 α 2, [ ] akkor rögtön látható, hogy a µ z 1 α σ 2 n, µ + z 1 α σ 2 n tartományba 1 α valószínűséggel esik X ( deduktív statisztika )

228 Becsléselmélet Példa I. Például: tudjuk, hogy X N ( µ, σ 2 /n ) Ebből következik, hogy X µ σ/ N (0, 1) n Azaz P ( z < X µ σ/ n < z Emiatt, ha ) = Φ (z) Φ ( z) = Φ (z) [ 1 Φ (z) ] = = 2Φ (z) 1 2Φ (z) 1 = 1 α Φ (z) = 1 α 2 z = Φ 1 ( 1 α 2 ) =: z 1 α 2, [ ] akkor rögtön látható, hogy a µ z 1 α σ 2 n, µ + z 1 α σ 2 n tartományba 1 α valószínűséggel esik X ( deduktív statisztika )

229 Becsléselmélet Példa I. Például: tudjuk, hogy X N ( µ, σ 2 /n ) Ebből következik, hogy X µ σ/ N (0, 1) n Azaz P ( z < X µ σ/ n < z Emiatt, ha ) = Φ (z) Φ ( z) = Φ (z) [ 1 Φ (z) ] = = 2Φ (z) 1 2Φ (z) 1 = 1 α Φ (z) = 1 α 2 z = Φ 1 ( 1 α 2 ) =: z 1 α 2, [ ] akkor rögtön látható, hogy a µ z 1 α σ 2 n, µ + z 1 α σ 2 n tartományba 1 α valószínűséggel esik X ( deduktív statisztika )

230 Becsléselmélet Példa II. Átrendezve kapjuk az induktív statisztikát: ( ) P z 1 α < X µ 2 σ/ n < z 1 α = 1 α 2 ( ) σ σ P X z 1 α < µ < X + z 2 1 α = 1 α n 2 n Tipikusan: α = 0,05, ekkor a 95%-os[ konfidenciaintervallum immár ] egy konkrét mintára a fenti alapján: x z 1 α σ 2 n, x + z 1 α σ 2 n Vigyázat, csak mintavétel előtt vannak val. változók, utána ( kis betűk ) már nem, ezért használtuk a megbízhatóság szót a valószínűség helyett az állítás csak (képzeletbeli) ismételt mintavételi értelemben igaz

231 Becsléselmélet Példa II. Átrendezve kapjuk az induktív statisztikát: ( ) P z 1 α < X µ 2 σ/ n < z 1 α = 1 α 2 ( ) σ σ P X z 1 α < µ < X + z 2 1 α = 1 α n 2 n Tipikusan: α = 0,05, ekkor a 95%-os[ konfidenciaintervallum immár ] egy konkrét mintára a fenti alapján: x z 1 α σ 2 n, x + z 1 α σ 2 n Vigyázat, csak mintavétel előtt vannak val. változók, utána ( kis betűk ) már nem, ezért használtuk a megbízhatóság szót a valószínűség helyett az állítás csak (képzeletbeli) ismételt mintavételi értelemben igaz

232 Becsléselmélet Példa II. Átrendezve kapjuk az induktív statisztikát: ( ) P z 1 α < X µ 2 σ/ n < z 1 α = 1 α 2 ( ) σ σ P X z 1 α < µ < X + z 2 1 α = 1 α n 2 n Tipikusan: α = 0,05, ekkor a 95%-os[ konfidenciaintervallum immár ] egy konkrét mintára a fenti alapján: x z 1 α σ 2 n, x + z 1 α σ 2 n Vigyázat, csak mintavétel előtt vannak val. változók, utána ( kis betűk ) már nem, ezért használtuk a megbízhatóság szót a valószínűség helyett az állítás csak (képzeletbeli) ismételt mintavételi értelemben igaz

233 Hipotézisvizsgálat Tartalom 1 Mi a statisztika? 2 A statisztika alapfogalmai 3 Deskriptív statisztika A deskriptív statisztikáról általában Egyváltozós elemzés, minőségi változó Egyváltozós elemzés, mennyiségi változó Két minőségi változó kapcsolata: asszociáció Két mennyiségi változó kapcsolata: korreláció 4 Induktív statisztika A mintavételi helyzet konzekvenciái Becsléselmélet Hipotézisvizsgálat 5 Klinikai vizsgálatok

234 Hipotézisvizsgálat A hipotézisvizsgálat alapfogalmai Feladat: sokaságra vonatkozó állítás eldöntése minta alapján Lényegében az intervallumbecslés ikertestvére, de hatalmas gyakorlati jelentősége miatt külön eszköztára van Alapeszköze a statisztikai próba (vagy teszt), mely a mintaelemek alapján kiszámol egy ún. tesztstatisztikát (próbafüggényt) Vizsgált állításaink: nullhipotézis ellenhipotézis Egy tipikus példa: H 0 : µ = µ 0 H 1 : µ µ 0 Itt µ 0 általunk megadott, ismert szám (pl. µ 0 = 70 kg a példánkban)

235 Hipotézisvizsgálat A hipotézisvizsgálat alapfogalmai Feladat: sokaságra vonatkozó állítás eldöntése minta alapján Lényegében az intervallumbecslés ikertestvére, de hatalmas gyakorlati jelentősége miatt külön eszköztára van Alapeszköze a statisztikai próba (vagy teszt), mely a mintaelemek alapján kiszámol egy ún. tesztstatisztikát (próbafüggényt) Vizsgált állításaink: nullhipotézis ellenhipotézis Egy tipikus példa: H 0 : µ = µ 0 H 1 : µ µ 0 Itt µ 0 általunk megadott, ismert szám (pl. µ 0 = 70 kg a példánkban)

236 Hipotézisvizsgálat A hipotézisvizsgálat alapfogalmai Feladat: sokaságra vonatkozó állítás eldöntése minta alapján Lényegében az intervallumbecslés ikertestvére, de hatalmas gyakorlati jelentősége miatt külön eszköztára van Alapeszköze a statisztikai próba (vagy teszt), mely a mintaelemek alapján kiszámol egy ún. tesztstatisztikát (próbafüggényt) Vizsgált állításaink: nullhipotézis ellenhipotézis Egy tipikus példa: H 0 : µ = µ 0 H 1 : µ µ 0 Itt µ 0 általunk megadott, ismert szám (pl. µ 0 = 70 kg a példánkban)

237 Hipotézisvizsgálat A hipotézisvizsgálat alapfogalmai Feladat: sokaságra vonatkozó állítás eldöntése minta alapján Lényegében az intervallumbecslés ikertestvére, de hatalmas gyakorlati jelentősége miatt külön eszköztára van Alapeszköze a statisztikai próba (vagy teszt), mely a mintaelemek alapján kiszámol egy ún. tesztstatisztikát (próbafüggényt) Vizsgált állításaink: nullhipotézis ellenhipotézis Egy tipikus példa: H 0 : µ = µ 0 H 1 : µ µ 0 Itt µ 0 általunk megadott, ismert szám (pl. µ 0 = 70 kg a példánkban)

238 Hipotézisvizsgálat A hipotézisvizsgálat alapfogalmai Feladat: sokaságra vonatkozó állítás eldöntése minta alapján Lényegében az intervallumbecslés ikertestvére, de hatalmas gyakorlati jelentősége miatt külön eszköztára van Alapeszköze a statisztikai próba (vagy teszt), mely a mintaelemek alapján kiszámol egy ún. tesztstatisztikát (próbafüggényt) Vizsgált állításaink: nullhipotézis ellenhipotézis Egy tipikus példa: H 0 : µ = µ 0 H 1 : µ µ 0 Itt µ 0 általunk megadott, ismert szám (pl. µ 0 = 70 kg a példánkban)

239 Hipotézisvizsgálat A hipotézisvizsgálat alapfogalmai Feladat: sokaságra vonatkozó állítás eldöntése minta alapján Lényegében az intervallumbecslés ikertestvére, de hatalmas gyakorlati jelentősége miatt külön eszköztára van Alapeszköze a statisztikai próba (vagy teszt), mely a mintaelemek alapján kiszámol egy ún. tesztstatisztikát (próbafüggényt) Vizsgált állításaink: nullhipotézis ellenhipotézis Egy tipikus példa: H 0 : µ = µ 0 H 1 : µ µ 0 Itt µ 0 általunk megadott, ismert szám (pl. µ 0 = 70 kg a példánkban)

240 Hipotézisvizsgálat Próbafüggvény megszerkesztése Itt jön a kulcs: a próbafüggvényt úgy kell megszerkeszteni, hogy H 0 fennállása esetén ismert eloszlást kövessen (nulleloszlás) Például (sokasági normalitás, ismert szórás): ( ) X : nem jó, mert X N µ 0, σ 2 /n (most ugye H 0-t igaznak vesszük!) és ez függ µ 0-tól (σ-tól és n-től is, de az nem baj, mert azokat tudjuk most) Próbálkozzunk ( máshogy, ) X µ 0: technikailag jó, mert X µ 0 N 0, σ 2 /n, de nem túl praktikus, mert minden σ-hoz és n-hez külön táblázat kéne Ennek fényében X µ 0 σ/ : teljesen jó, minden paramétertől függetlenül n N (0, 1) eloszlást követ, ez lesz a jó próbafüggvény

241 Hipotézisvizsgálat Próbafüggvény megszerkesztése Itt jön a kulcs: a próbafüggvényt úgy kell megszerkeszteni, hogy H 0 fennállása esetén ismert eloszlást kövessen (nulleloszlás) Például (sokasági normalitás, ismert szórás): ( ) X : nem jó, mert X N µ 0, σ 2 /n (most ugye H 0-t igaznak vesszük!) és ez függ µ 0-tól (σ-tól és n-től is, de az nem baj, mert azokat tudjuk most) Próbálkozzunk ( máshogy, ) X µ 0: technikailag jó, mert X µ 0 N 0, σ 2 /n, de nem túl praktikus, mert minden σ-hoz és n-hez külön táblázat kéne Ennek fényében X µ 0 σ/ : teljesen jó, minden paramétertől függetlenül n N (0, 1) eloszlást követ, ez lesz a jó próbafüggvény

242 Hipotézisvizsgálat Próbafüggvény megszerkesztése Itt jön a kulcs: a próbafüggvényt úgy kell megszerkeszteni, hogy H 0 fennállása esetén ismert eloszlást kövessen (nulleloszlás) Például (sokasági normalitás, ismert szórás): ( ) X : nem jó, mert X N µ 0, σ 2 /n (most ugye H 0-t igaznak vesszük!) és ez függ µ 0-tól (σ-tól és n-től is, de az nem baj, mert azokat tudjuk most) Próbálkozzunk ( máshogy, ) X µ 0: technikailag jó, mert X µ 0 N 0, σ 2 /n, de nem túl praktikus, mert minden σ-hoz és n-hez külön táblázat kéne Ennek fényében X µ 0 σ/ : teljesen jó, minden paramétertől függetlenül n N (0, 1) eloszlást követ, ez lesz a jó próbafüggvény

243 Hipotézisvizsgálat Próbafüggvény megszerkesztése Itt jön a kulcs: a próbafüggvényt úgy kell megszerkeszteni, hogy H 0 fennállása esetén ismert eloszlást kövessen (nulleloszlás) Például (sokasági normalitás, ismert szórás): ( ) X : nem jó, mert X N µ 0, σ 2 /n (most ugye H 0-t igaznak vesszük!) és ez függ µ 0-tól (σ-tól és n-től is, de az nem baj, mert azokat tudjuk most) Próbálkozzunk ( máshogy, ) X µ 0: technikailag jó, mert X µ 0 N 0, σ 2 /n, de nem túl praktikus, mert minden σ-hoz és n-hez külön táblázat kéne Ennek fényében X µ 0 σ/ : teljesen jó, minden paramétertől függetlenül n N (0, 1) eloszlást követ, ez lesz a jó próbafüggvény

244 Hipotézisvizsgálat Próbafüggvény megszerkesztése Itt jön a kulcs: a próbafüggvényt úgy kell megszerkeszteni, hogy H 0 fennállása esetén ismert eloszlást kövessen (nulleloszlás) Például (sokasági normalitás, ismert szórás): ( ) X : nem jó, mert X N µ 0, σ 2 /n (most ugye H 0-t igaznak vesszük!) és ez függ µ 0-tól (σ-tól és n-től is, de az nem baj, mert azokat tudjuk most) Próbálkozzunk ( máshogy, ) X µ 0: technikailag jó, mert X µ 0 N 0, σ 2 /n, de nem túl praktikus, mert minden σ-hoz és n-hez külön táblázat kéne Ennek fényében X µ 0 σ/ : teljesen jó, minden paramétertől függetlenül n N (0, 1) eloszlást követ, ez lesz a jó próbafüggvény

245 Hipotézisvizsgálat Próbafüggvény megszerkesztése Ez ún. pivot, eloszlása már nem függ ismeretlen paramétertől: Z := X µ 0 σ/ n H 0 N (0, 1), azaz a próbafüggvény H 0 fennállása esetén N (0, 1) eloszlást követ

246 Hipotézisvizsgálat Döntés a hipotézisvizsgálatban I. Hihető-e, hogy az empirikus (adott, konkrét mintából kapott) érték ebből az eloszlásból származik? Biztos döntés nincs! De: mennyire hihetőek ezek?

247 f Hipotézisvizsgálat Döntés a hipotézisvizsgálatban I. Hihető-e, hogy az empirikus (adott, konkrét mintából kapott) érték ebből az eloszlásból származik? Biztos döntés nincs! De: mennyire hihetőek ezek? f z z

248 Hipotézisvizsgálat Döntés a hipotézisvizsgálatban II. Valahol határt kell húznunk szó szerint is! Azt mondjuk, hogy a nagyon kis valószínűségű területekre esést már nem hisszük el Pedig az nem lehetetlen, sőt: az is tudható, hogy az oda esés (azaz a fenti logikával történő hibázás) valószínűsége épp ez a nagyon kis valószínűség Tipikus, hogy a felső és alsó szélén is 2,5-2,5 % valószínűségű területet jelülünk ki (α = 5%, ez a szignifikanciaszint), határai: a c a alsó és a c f felső kritikus értékek (példában: ±1,96)

249 Hipotézisvizsgálat Döntés a hipotézisvizsgálatban II. Valahol határt kell húznunk szó szerint is! Azt mondjuk, hogy a nagyon kis valószínűségű területekre esést már nem hisszük el Pedig az nem lehetetlen, sőt: az is tudható, hogy az oda esés (azaz a fenti logikával történő hibázás) valószínűsége épp ez a nagyon kis valószínűség Tipikus, hogy a felső és alsó szélén is 2,5-2,5 % valószínűségű területet jelülünk ki (α = 5%, ez a szignifikanciaszint), határai: a c a alsó és a c f felső kritikus értékek (példában: ±1,96)

250 Hipotézisvizsgálat Döntés a hipotézisvizsgálatban II. Valahol határt kell húznunk szó szerint is! Azt mondjuk, hogy a nagyon kis valószínűségű területekre esést már nem hisszük el Pedig az nem lehetetlen, sőt: az is tudható, hogy az oda esés (azaz a fenti logikával történő hibázás) valószínűsége épp ez a nagyon kis valószínűség Tipikus, hogy a felső és alsó szélén is 2,5-2,5 % valószínűségű területet jelülünk ki (α = 5%, ez a szignifikanciaszint), határai: a c a alsó és a c f felső kritikus értékek (példában: ±1,96)

251 Hipotézisvizsgálat Döntés a hipotézisvizsgálatban II. Valahol határt kell húznunk szó szerint is! Azt mondjuk, hogy a nagyon kis valószínűségű területekre esést már nem hisszük el Pedig az nem lehetetlen, sőt: az is tudható, hogy az oda esés (azaz a fenti logikával történő hibázás) valószínűsége épp ez a nagyon kis valószínűség Tipikus, hogy a felső és alsó szélén is 2,5-2,5 % valószínűségű területet jelülünk ki (α = 5%, ez a szignifikanciaszint), határai: a c a alsó és a c f felső kritikus értékek (példában: ±1,96)

252 Hipotézisvizsgálat p-érték Vagy: Mennyi lenne az a szignifikanciaszint, ami mellett a mintából kapott (empirikus) tesztstatisztika-érték épp az elfogadás és az elutasítás határára kerülne? (Ez nem más, mint az empirikus értéktől extrémebb helyeken vett integrálja a mintavételi eloszlásnak) A neve: p-érték Manapság (hogy a számításigény már nem probléma), ezt szokták megadni, mert nem binarizálja az eredményt Az olvasó is tud dönteni : ha a választott szignifikanciaszint nagyobb, mint a p-érték, akkor elutasítunk, különben elfogadunk Frekvencionista szemlélet!

253 Hipotézisvizsgálat p-érték Vagy: Mennyi lenne az a szignifikanciaszint, ami mellett a mintából kapott (empirikus) tesztstatisztika-érték épp az elfogadás és az elutasítás határára kerülne? (Ez nem más, mint az empirikus értéktől extrémebb helyeken vett integrálja a mintavételi eloszlásnak) A neve: p-érték Manapság (hogy a számításigény már nem probléma), ezt szokták megadni, mert nem binarizálja az eredményt Az olvasó is tud dönteni : ha a választott szignifikanciaszint nagyobb, mint a p-érték, akkor elutasítunk, különben elfogadunk Frekvencionista szemlélet!

254 Hipotézisvizsgálat p-érték Vagy: Mennyi lenne az a szignifikanciaszint, ami mellett a mintából kapott (empirikus) tesztstatisztika-érték épp az elfogadás és az elutasítás határára kerülne? (Ez nem más, mint az empirikus értéktől extrémebb helyeken vett integrálja a mintavételi eloszlásnak) A neve: p-érték Manapság (hogy a számításigény már nem probléma), ezt szokták megadni, mert nem binarizálja az eredményt Az olvasó is tud dönteni : ha a választott szignifikanciaszint nagyobb, mint a p-érték, akkor elutasítunk, különben elfogadunk Frekvencionista szemlélet!

255 Hipotézisvizsgálat p-érték Vagy: Mennyi lenne az a szignifikanciaszint, ami mellett a mintából kapott (empirikus) tesztstatisztika-érték épp az elfogadás és az elutasítás határára kerülne? (Ez nem más, mint az empirikus értéktől extrémebb helyeken vett integrálja a mintavételi eloszlásnak) A neve: p-érték Manapság (hogy a számításigény már nem probléma), ezt szokták megadni, mert nem binarizálja az eredményt Az olvasó is tud dönteni : ha a választott szignifikanciaszint nagyobb, mint a p-érték, akkor elutasítunk, különben elfogadunk Frekvencionista szemlélet!

256 Hipotézisvizsgálat p-érték Vagy: Mennyi lenne az a szignifikanciaszint, ami mellett a mintából kapott (empirikus) tesztstatisztika-érték épp az elfogadás és az elutasítás határára kerülne? (Ez nem más, mint az empirikus értéktől extrémebb helyeken vett integrálja a mintavételi eloszlásnak) A neve: p-érték Manapság (hogy a számításigény már nem probléma), ezt szokták megadni, mert nem binarizálja az eredményt Az olvasó is tud dönteni : ha a választott szignifikanciaszint nagyobb, mint a p-érték, akkor elutasítunk, különben elfogadunk Frekvencionista szemlélet!

257 Hipotézisvizsgálat p-érték Vagy: Mennyi lenne az a szignifikanciaszint, ami mellett a mintából kapott (empirikus) tesztstatisztika-érték épp az elfogadás és az elutasítás határára kerülne? (Ez nem más, mint az empirikus értéktől extrémebb helyeken vett integrálja a mintavételi eloszlásnak) A neve: p-érték Manapság (hogy a számításigény már nem probléma), ezt szokták megadni, mert nem binarizálja az eredményt Az olvasó is tud dönteni : ha a választott szignifikanciaszint nagyobb, mint a p-érték, akkor elutasítunk, különben elfogadunk Frekvencionista szemlélet!

258 Hipotézisvizsgálat Példa I. (Csak szemléltetésként, részletek nélkül) Van-e különbség a dohányzó és a nem-dohányzó nők gyermekeinek születési tömege között? A mintában 2772 g a dohányzóknál az átlag, 3056 g a nem-dohányzóknál; csakhogy a kérdés nem ez... Ez egy sokaságra vonatkozó kérdés próbát kell végeznünk! Adott a dohányzó nők sokaságában az újszülöttek tömegének eloszlása, és ugyanez a nem-dohányzó nők sokaságában operacionalizáljuk úgy a kérdést, hogy a várhatóértékük eltér-e egymástól Erről kell minta alapján dönteni

259 Hipotézisvizsgálat Példa I. (Csak szemléltetésként, részletek nélkül) Van-e különbség a dohányzó és a nem-dohányzó nők gyermekeinek születési tömege között? A mintában 2772 g a dohányzóknál az átlag, 3056 g a nem-dohányzóknál; csakhogy a kérdés nem ez... Ez egy sokaságra vonatkozó kérdés próbát kell végeznünk! Adott a dohányzó nők sokaságában az újszülöttek tömegének eloszlása, és ugyanez a nem-dohányzó nők sokaságában operacionalizáljuk úgy a kérdést, hogy a várhatóértékük eltér-e egymástól Erről kell minta alapján dönteni

260 Hipotézisvizsgálat Példa I. (Csak szemléltetésként, részletek nélkül) Van-e különbség a dohányzó és a nem-dohányzó nők gyermekeinek születési tömege között? A mintában 2772 g a dohányzóknál az átlag, 3056 g a nem-dohányzóknál; csakhogy a kérdés nem ez... Ez egy sokaságra vonatkozó kérdés próbát kell végeznünk! Adott a dohányzó nők sokaságában az újszülöttek tömegének eloszlása, és ugyanez a nem-dohányzó nők sokaságában operacionalizáljuk úgy a kérdést, hogy a várhatóértékük eltér-e egymástól Erről kell minta alapján dönteni

261 Hipotézisvizsgálat Példa I. (Csak szemléltetésként, részletek nélkül) Van-e különbség a dohányzó és a nem-dohányzó nők gyermekeinek születési tömege között? A mintában 2772 g a dohányzóknál az átlag, 3056 g a nem-dohányzóknál; csakhogy a kérdés nem ez... Ez egy sokaságra vonatkozó kérdés próbát kell végeznünk! Adott a dohányzó nők sokaságában az újszülöttek tömegének eloszlása, és ugyanez a nem-dohányzó nők sokaságában operacionalizáljuk úgy a kérdést, hogy a várhatóértékük eltér-e egymástól Erről kell minta alapján dönteni

262 Hipotézisvizsgálat Példa I. (Csak szemléltetésként, részletek nélkül) Van-e különbség a dohányzó és a nem-dohányzó nők gyermekeinek születési tömege között? A mintában 2772 g a dohányzóknál az átlag, 3056 g a nem-dohányzóknál; csakhogy a kérdés nem ez... Ez egy sokaságra vonatkozó kérdés próbát kell végeznünk! Adott a dohányzó nők sokaságában az újszülöttek tömegének eloszlása, és ugyanez a nem-dohányzó nők sokaságában operacionalizáljuk úgy a kérdést, hogy a várhatóértékük eltér-e egymástól Erről kell minta alapján dönteni

263 Hipotézisvizsgálat Példa I. (Csak szemléltetésként, részletek nélkül) Van-e különbség a dohányzó és a nem-dohányzó nők gyermekeinek születési tömege között? A mintában 2772 g a dohányzóknál az átlag, 3056 g a nem-dohányzóknál; csakhogy a kérdés nem ez... Ez egy sokaságra vonatkozó kérdés próbát kell végeznünk! Adott a dohányzó nők sokaságában az újszülöttek tömegének eloszlása, és ugyanez a nem-dohányzó nők sokaságában operacionalizáljuk úgy a kérdést, hogy a várhatóértékük eltér-e egymástól Erről kell minta alapján dönteni

264 Hipotézisvizsgálat Példa II. Elég nagy minta, ún. kétmintás Welch-próba alkalmazható: p = 0,007 Szokásos szignifikanciaszinteken elvethető a feltevés, hogy a dohányzó és a nem-dohányzó nők csoportjában azonos a születési súly: a születi súly kapcsolatban van azzal, hogy dohányzik-e a várandós anya A dohányzás csökkenti a születési súlyt! na ilyet viszont nem mondhatunk! (Korreláció nem implikál kauzalitást!) Confounderek? (Bár itt jó eséllyel tényleg kauzális kapcsolat van, de ezt csak más kísérleti elrendezéssel lehet szabatosan kimutatni)

265 Hipotézisvizsgálat Példa II. Elég nagy minta, ún. kétmintás Welch-próba alkalmazható: p = 0,007 Szokásos szignifikanciaszinteken elvethető a feltevés, hogy a dohányzó és a nem-dohányzó nők csoportjában azonos a születési súly: a születi súly kapcsolatban van azzal, hogy dohányzik-e a várandós anya A dohányzás csökkenti a születési súlyt! na ilyet viszont nem mondhatunk! (Korreláció nem implikál kauzalitást!) Confounderek? (Bár itt jó eséllyel tényleg kauzális kapcsolat van, de ezt csak más kísérleti elrendezéssel lehet szabatosan kimutatni)

266 Hipotézisvizsgálat Példa II. Elég nagy minta, ún. kétmintás Welch-próba alkalmazható: p = 0,007 Szokásos szignifikanciaszinteken elvethető a feltevés, hogy a dohányzó és a nem-dohányzó nők csoportjában azonos a születési súly: a születi súly kapcsolatban van azzal, hogy dohányzik-e a várandós anya A dohányzás csökkenti a születési súlyt! na ilyet viszont nem mondhatunk! (Korreláció nem implikál kauzalitást!) Confounderek? (Bár itt jó eséllyel tényleg kauzális kapcsolat van, de ezt csak más kísérleti elrendezéssel lehet szabatosan kimutatni)

267 Hipotézisvizsgálat Példa II. Elég nagy minta, ún. kétmintás Welch-próba alkalmazható: p = 0,007 Szokásos szignifikanciaszinteken elvethető a feltevés, hogy a dohányzó és a nem-dohányzó nők csoportjában azonos a születési súly: a születi súly kapcsolatban van azzal, hogy dohányzik-e a várandós anya A dohányzás csökkenti a születési súlyt! na ilyet viszont nem mondhatunk! (Korreláció nem implikál kauzalitást!) Confounderek? (Bár itt jó eséllyel tényleg kauzális kapcsolat van, de ezt csak más kísérleti elrendezéssel lehet szabatosan kimutatni)

268 Hipotézisvizsgálat Próba hibái I. Elvetjük H 0 -t, pedig fennáll (elsőfajú hiba, α): pontosan szabályozható valószínűségű Elfogadjuk H 0 -t, pedig el lehetne vetni (másodfajú hiba, β): általánosságban nem ismert, függ a valóságtól 1 β: próba ereje ( mennyire ismeri fel az eltérést, ha tényleg van ) Mi két dologgal tudjuk befolyásolni a próba erejét, mindkettőhöz egy-egy tételmondat: 1 Választott próba: mindig annyi előfeltevésre építő próbát használjunk, amennyit tudunk, se többet se kevesebbet (több előfeltevésre építő próbák erősebbek ugyan, de ha szükséges előfeltevés nem teljesül, a próba nem lesz valid) 2 Mintanagyság: kis hatáshoz nagy minta kell, nagy hatáshoz elég a kisebb minta is

269 Hipotézisvizsgálat Próba hibái I. Elvetjük H 0 -t, pedig fennáll (elsőfajú hiba, α): pontosan szabályozható valószínűségű Elfogadjuk H 0 -t, pedig el lehetne vetni (másodfajú hiba, β): általánosságban nem ismert, függ a valóságtól 1 β: próba ereje ( mennyire ismeri fel az eltérést, ha tényleg van ) Mi két dologgal tudjuk befolyásolni a próba erejét, mindkettőhöz egy-egy tételmondat: 1 Választott próba: mindig annyi előfeltevésre építő próbát használjunk, amennyit tudunk, se többet se kevesebbet (több előfeltevésre építő próbák erősebbek ugyan, de ha szükséges előfeltevés nem teljesül, a próba nem lesz valid) 2 Mintanagyság: kis hatáshoz nagy minta kell, nagy hatáshoz elég a kisebb minta is

270 Hipotézisvizsgálat Próba hibái I. Elvetjük H 0 -t, pedig fennáll (elsőfajú hiba, α): pontosan szabályozható valószínűségű Elfogadjuk H 0 -t, pedig el lehetne vetni (másodfajú hiba, β): általánosságban nem ismert, függ a valóságtól 1 β: próba ereje ( mennyire ismeri fel az eltérést, ha tényleg van ) Mi két dologgal tudjuk befolyásolni a próba erejét, mindkettőhöz egy-egy tételmondat: 1 Választott próba: mindig annyi előfeltevésre építő próbát használjunk, amennyit tudunk, se többet se kevesebbet (több előfeltevésre építő próbák erősebbek ugyan, de ha szükséges előfeltevés nem teljesül, a próba nem lesz valid) 2 Mintanagyság: kis hatáshoz nagy minta kell, nagy hatáshoz elég a kisebb minta is

271 Hipotézisvizsgálat Próba hibái I. Elvetjük H 0 -t, pedig fennáll (elsőfajú hiba, α): pontosan szabályozható valószínűségű Elfogadjuk H 0 -t, pedig el lehetne vetni (másodfajú hiba, β): általánosságban nem ismert, függ a valóságtól 1 β: próba ereje ( mennyire ismeri fel az eltérést, ha tényleg van ) Mi két dologgal tudjuk befolyásolni a próba erejét, mindkettőhöz egy-egy tételmondat: 1 Választott próba: mindig annyi előfeltevésre építő próbát használjunk, amennyit tudunk, se többet se kevesebbet (több előfeltevésre építő próbák erősebbek ugyan, de ha szükséges előfeltevés nem teljesül, a próba nem lesz valid) 2 Mintanagyság: kis hatáshoz nagy minta kell, nagy hatáshoz elég a kisebb minta is

272 Hipotézisvizsgálat Próba hibái I. Elvetjük H 0 -t, pedig fennáll (elsőfajú hiba, α): pontosan szabályozható valószínűségű Elfogadjuk H 0 -t, pedig el lehetne vetni (másodfajú hiba, β): általánosságban nem ismert, függ a valóságtól 1 β: próba ereje ( mennyire ismeri fel az eltérést, ha tényleg van ) Mi két dologgal tudjuk befolyásolni a próba erejét, mindkettőhöz egy-egy tételmondat: 1 Választott próba: mindig annyi előfeltevésre építő próbát használjunk, amennyit tudunk, se többet se kevesebbet (több előfeltevésre építő próbák erősebbek ugyan, de ha szükséges előfeltevés nem teljesül, a próba nem lesz valid) 2 Mintanagyság: kis hatáshoz nagy minta kell, nagy hatáshoz elég a kisebb minta is

273 Hipotézisvizsgálat Próba hibái I. Elvetjük H 0 -t, pedig fennáll (elsőfajú hiba, α): pontosan szabályozható valószínűségű Elfogadjuk H 0 -t, pedig el lehetne vetni (másodfajú hiba, β): általánosságban nem ismert, függ a valóságtól 1 β: próba ereje ( mennyire ismeri fel az eltérést, ha tényleg van ) Mi két dologgal tudjuk befolyásolni a próba erejét, mindkettőhöz egy-egy tételmondat: 1 Választott próba: mindig annyi előfeltevésre építő próbát használjunk, amennyit tudunk, se többet se kevesebbet (több előfeltevésre építő próbák erősebbek ugyan, de ha szükséges előfeltevés nem teljesül, a próba nem lesz valid) 2 Mintanagyság: kis hatáshoz nagy minta kell, nagy hatáshoz elég a kisebb minta is

274 Hipotézisvizsgálat Próba hibái II. Bár néhol bevett szokás, de elvileg nem korrekt egy próba előfeltevését ugyanazon mintán egy másik próbával eldönteni ( testing hypothesis suggested by data )

275 Hipotézisvizsgálat Szignifikanciavadászat I. Mivel minden tesztnek α elsőfajú hibája van, ezért (sajnos!) aki keres az talál!

Biostatisztika és alkalmazásai

Biostatisztika és alkalmazásai 2013. szeptember 25. Tartalom 1 Mi a statisztika? 2 A statisztika alapfogalmai 3 Deskriptív statisztika A deskriptív statisztikáról általában Egyváltozós elemzés, minőségi változó Egyváltozós elemzés,

Részletesebben

Kutatásmódszertan és prezentációkészítés

Kutatásmódszertan és prezentációkészítés Kutatásmódszertan és prezentációkészítés 10. rész: Az adatelemzés alapjai Szerző: Kmetty Zoltán Lektor: Fokasz Nikosz Tizedik rész Az adatelemzés alapjai Tartalomjegyzék Bevezetés Leíró statisztikák I

Részletesebben

Matematikai alapok és valószínőségszámítás. Középértékek és szóródási mutatók

Matematikai alapok és valószínőségszámítás. Középértékek és szóródási mutatók Matematikai alapok és valószínőségszámítás Középértékek és szóródási mutatók Középértékek A leíró statisztikák talán leggyakrabban használt csoportját a középértékek jelentik. Legkönnyebben mint az adathalmaz

Részletesebben

Bevezető Adatok rendezése Adatok jellemzése Időbeli elemzés. Gazdaságstatisztika KGK VMI

Bevezető Adatok rendezése Adatok jellemzése Időbeli elemzés. Gazdaságstatisztika KGK VMI Gazdaságstatisztika 2. előadás Egy ismérv szerinti rendezés Kóczy Á. László KGK VMI Áttekintés Gyakorisági sorok Grafikus ábrázolásuk Helyzetmutatók Szóródási mutatók Az aszimmetria mérőszámai Koncentráció

Részletesebben

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 4 IV. MINTA, ALAPsTATIsZTIKÁK 1. MATEMATIKAI statisztika A matematikai statisztika alapfeladatát nagy általánosságban a következőképpen

Részletesebben

Segítség az outputok értelmezéséhez

Segítség az outputok értelmezéséhez Tanulni: 10.1-10.3, 10.5, 11.10. Hf: A honlapra feltett falco_exp.zip-ben lévő exploratív elemzések áttanulmányozása, érdekességek, észrevételek kigyűjtése. Segítség az outputok értelmezéséhez Leiro: Leíró

Részletesebben

A mérés problémája a pedagógiában. Dr. Nyéki Lajos 2015

A mérés problémája a pedagógiában. Dr. Nyéki Lajos 2015 A mérés problémája a pedagógiában Dr. Nyéki Lajos 2015 A mérés fogalma Mérésen olyan tevékenységet értünk, amelynek eredményeként a vizsgált jelenség számszerűen jellemezhetővé, más hasonló jelenségekkel

Részletesebben

STATISZTIKA. András hármas. Éva ötös. Nóri négyes. 5 4,5 4 3,5 3 2,5 2 1,5 ANNA BÉLA CILI 0,5 MAGY. MAT. TÖRT. KÉM.

STATISZTIKA. András hármas. Éva ötös. Nóri négyes. 5 4,5 4 3,5 3 2,5 2 1,5 ANNA BÉLA CILI 0,5 MAGY. MAT. TÖRT. KÉM. STATISZTIKA 5 4,5 4 3,5 3 2,5 2 1,5 1 0,5 0 MAGY. MAT. TÖRT. KÉM. ANNA BÉLA CILI András hármas. Béla Az átlag 3,5! kettes. Éva ötös. Nóri négyes. 1 mérés: dolgokhoz valamely szabály alapján szám rendelése

Részletesebben

Matematikai statisztika c. tárgy oktatásának célja és tematikája

Matematikai statisztika c. tárgy oktatásának célja és tematikája Matematikai statisztika c. tárgy oktatásának célja és tematikája 2015 Tematika Matematikai statisztika 1. Időkeret: 12 héten keresztül heti 3x50 perc (előadás és szeminárium) 2. Szükséges előismeretek:

Részletesebben

Statisztikai alapfogalmak

Statisztikai alapfogalmak Statisztika I. KÉPLETEK 2011-2012-es tanév I. félév Statisztikai alapfogalmak Adatok pontossága Mért adat Abszolút hibakorlát Relatív hibakorlát Statisztikai elemzések viszonyszámokkal : a legutolsó kiírt

Részletesebben

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 10 X. SZIMULÁCIÓ 1. VÉLETLEN számok A véletlen számok fontos szerepet játszanak a véletlen helyzetek generálásában (pénzérme, dobókocka,

Részletesebben

Matematikai alapok és valószínőségszámítás. Statisztikai változók Adatok megtekintése

Matematikai alapok és valószínőségszámítás. Statisztikai változók Adatok megtekintése Matematikai alapok és valószínőségszámítás Statisztikai változók Adatok megtekintése Statisztikai változók A statisztikai elemzések során a vizsgálati, vagy megfigyelési egységeket különbözı jellemzık

Részletesebben

Vargha András Károli Gáspár Református Egyetem Budapest

Vargha András Károli Gáspár Református Egyetem Budapest Vargha András Károli Gáspár Református Egyetem Budapest Kötelező irodalom a kurzushoz Vargha András: Matematikai statisztika pszichológiai, nyelvészeti és biológiai alkalmazásokkal (2. kiadás). Pólya Kiadó,

Részletesebben

Orvosi szociológia (1. szeminárium) KUTATÁSMÓDSZERTAN

Orvosi szociológia (1. szeminárium) KUTATÁSMÓDSZERTAN Orvosi szociológia (1. szeminárium) KUTATÁSMÓDSZERTAN (Babbie) 1. Konceptualizáció 2. Operacionalizálás 3. Mérés 4. Adatfeldolgozás 5. Elemzés 6. Felhasználás KUTATÁS LÉPÉSEI 1. Konceptualizáció 2. Operacionalizálás

Részletesebben

GAZDASÁGI STATISZTIKA

GAZDASÁGI STATISZTIKA GAZDASÁGI STATISZTIKA Dr. Kun István GÁBOR DÉNES FŐISKOLA Tantárgy: Gazdasági statisztika Kódszám: 224 Lapszám: 1 TÉMAKÖRÖK A STATISZTIKA ALAPFOGALMAI STATISZTIKAI SOROK STATISZTIKAI TÁBLÁK ÖSSZETETT VISZONYSZÁMOK

Részletesebben

Hol terem a magyar statisztikus?

Hol terem a magyar statisztikus? Hol terem a magyar statisztikus? 90 éves az MST jubileumi konferencia Balatonőszöd, 2012. november 15-16. Rappai Gábor PTE KTK Ki a statisztikus? Értelmező Szótár Statisztikával foglalkozó szakember. Etikai

Részletesebben

Microsoft Excel 2010. Gyakoriság

Microsoft Excel 2010. Gyakoriság Microsoft Excel 2010 Gyakoriság Osztályközös gyakorisági tábla Nagy számú mérési adatokat csoportokba (osztályokba) rendezése -> könnyebb áttekintés Osztályokban szereplő adatok száma: osztályokhoz tartozó

Részletesebben

Statisztika I. 4. előadás Mintavétel. Kóczy Á. László KGK-VMI. Minta Mintavétel Feladatok. http://uni-obuda.hu/users/koczyl/statisztika1.

Statisztika I. 4. előadás Mintavétel. Kóczy Á. László KGK-VMI. Minta Mintavétel Feladatok. http://uni-obuda.hu/users/koczyl/statisztika1. Statisztika I. 4. előadás Mintavétel http://uni-obuda.hu/users/koczyl/statisztika1.htm Kóczy Á. László KGK-VMI koczy.laszlo@kgk.uni-obuda.hu Sokaság és minta Alap- és mintasokaság A mintasokaság az a részsokaság,

Részletesebben

GAZDASÁGSTATISZTIKA. Készítette: Bíró Anikó. Szakmai felelős: Bíró Anikó. 2010. június

GAZDASÁGSTATISZTIKA. Készítette: Bíró Anikó. Szakmai felelős: Bíró Anikó. 2010. június GAZDASÁGSTATISZTIKA Készült a TÁMOP-4.1.2-8/2/A/KMR-29-41pályázati projekt keretében Tartalomfejlesztés az ELTE TáTK Közgazdaságtudományi Tanszékén, az ELTE Közgazdaságtudományi Tanszék, az MTA Közgazdaságtudományi

Részletesebben

KÖZPONTI STATISZTIKAI HIVATAL. Szóbeli vizsgatevékenység

KÖZPONTI STATISZTIKAI HIVATAL. Szóbeli vizsgatevékenység KÖZPONTI STATISZTIKAI HIVATAL A vizsgarészhez rendelt követelménymodul azonosító száma, megnevezése: 2144-06 Statisztikai szervezői és elemzési feladatok A vizsgarészhez rendelt vizsgafeladat megnevezése:

Részletesebben

TÁMOP-4.2.2/B-10/1-2010-0002 Tantárgyi program (rövidített)

TÁMOP-4.2.2/B-10/1-2010-0002 Tantárgyi program (rövidített) TÁMOP-4.2.2/B-10/1-2010-0002 Tantárgyi program (rövidített) Szakkollégiumi műhely megnevezése: Meghirdetés féléve: Tantárgy/kurzus megnevezése: BGF GKZ Szakkollégiuma 2011/2012. tanév II. félév SZAKKOLLÉGIUM

Részletesebben

Bevezetés a statisztikába

Bevezetés a statisztikába Szent István Egyetem Állatorvos-tudományi Kar Biomatematikai és Számítástechnikai Tanszék Biomatematika 9. Bevezetés a statisztikába Fodor János Copyright c Fodor.Janos@aotk.szie.hu Last Revision Date:

Részletesebben

Biostatisztika Bevezetés. Boda Krisztina előadása alapján ma Bari Ferenc SZTE ÁOK Orvosi Fizikai és Orvosi Informatikai Intézet

Biostatisztika Bevezetés. Boda Krisztina előadása alapján ma Bari Ferenc SZTE ÁOK Orvosi Fizikai és Orvosi Informatikai Intézet Biostatisztika Bevezetés Boda Krisztina előadása alapján ma Bari Ferenc SZTE ÁOK Orvosi Fizikai és Orvosi Informatikai Intézet Az orvosi, biológiai kutatások egyik jellemzője, hogy a vizsgálatok eredményeként

Részletesebben

Matematikai statisztikai elemzések 2.

Matematikai statisztikai elemzések 2. Matematikai statisztikai elemzések 2. Helyzetmutatók, átlagok, kvantilisek. A szórás és szóródás Prof. Dr. Závoti, József Matematikai statisztikai elemzések 2.: Helyzetmutatók, átlagok, Prof. Dr. Závoti,

Részletesebben

Statisztika I. 4. előadás Mintavétel. Kóczy Á. László KGK-VMI. Minta Mintavétel Feladatok. http://uni-obuda.hu/users/koczyl/statisztika1.

Statisztika I. 4. előadás Mintavétel. Kóczy Á. László KGK-VMI. Minta Mintavétel Feladatok. http://uni-obuda.hu/users/koczyl/statisztika1. Statisztika I. 4. előadás Mintavétel http://uni-obuda.hu/users/koczyl/statisztika1.htm Kóczy Á. László KGK-VMI koczy.laszlo@kgk.uni-obuda.hu Sokaság és minta Alap- és mintasokaság A mintasokaság az a részsokaság,

Részletesebben

A statisztika oktatásáról konkrétan

A statisztika oktatásáról konkrétan A világ statisztikája a statisztika világa ünnepi konferencia Esztergom, 2010.október 15. A statisztika oktatásáról konkrétan Dr. Varga Beatrix PhD. egyetemi docens MISKOLCI EGYETEM Üzleti Statisztika

Részletesebben

SULINOVA PROGRAMTANTERVÉHEZ ILLESZKEDŐ TANMENET 9. ÉVFOLYAM SZÁMÁRA

SULINOVA PROGRAMTANTERVÉHEZ ILLESZKEDŐ TANMENET 9. ÉVFOLYAM SZÁMÁRA 1 SULINOVA PROGRAMTANTERVÉHEZ ILLESZKEDŐ TANMENET 9. ÉVFOLYAM SZÁMÁRA Heti óraszám: 3 Éves óraszám: 37 x 3 = 111 A tanmenet 101 óra beosztását tartalmazza. A dolgozatok írása és javítása 10 órát foglal

Részletesebben

1. tétel. Valószínűségszámítás vizsga Frissült: 2013. január 19. Valószínűségi mező, véletlen tömegjelenség.

1. tétel. Valószínűségszámítás vizsga Frissült: 2013. január 19. Valószínűségi mező, véletlen tömegjelenség. 1. tétel Valószínűségszámítás vizsga Frissült: 2013. január 19. Valószínűségi mező, véletlen tömegjelenség. A valószínűségszámítás tárgya: véletlen tömegjelenségek vizsgálata. véletlen: a kísérlet kimenetelét

Részletesebben

Statisztika példatár

Statisztika példatár Statisztika példatár v0.02 A példatár folyamatosan b vül, keresd a frissebb verziót a http://matstat.fw.hu honlapon a letölthet példatárak közt. Országh Tamás Budapest, 2006 Mottó: Ki kéne vágni minden

Részletesebben

Definíció. Definíció. 2. El adás (folytatása) Az adatok leírása, megismerése és összehasonlítása. 2-5. fejezet. A variabilitás mér számai 3.

Definíció. Definíció. 2. El adás (folytatása) Az adatok leírása, megismerése és összehasonlítása. 2-5. fejezet. A variabilitás mér számai 3. . El adás (folytatása) Az adatok leírása, megismerése és összehasonlítása -1 Áttekintés - Gyakoriság eloszlások -3 Az adatok vizualizációja -4 A centrum mérıszámai -5 A szórás mérıszámai -6 A relatív elhelyezkedés

Részletesebben

Készítette: Fegyverneki Sándor

Készítette: Fegyverneki Sándor VALÓSZÍNŰSÉGSZÁMÍTÁS Összefoglaló segédlet Készítette: Fegyverneki Sándor Miskolci Egyetem, 2001. i JELÖLÉSEK: N a természetes számok halmaza (pozitív egészek) R a valós számok halmaza R 2 {(x, y) x, y

Részletesebben

TANTÁRGYI ÚTMUTATÓ. Statisztika 1.

TANTÁRGYI ÚTMUTATÓ. Statisztika 1. I. évfolyam BA TANTÁRGYI ÚTMUTATÓ Statisztika 1. TÁVOKTATÁS Tanév 2014/2015 II. félév A KURZUS ALAPADATAI Tárgy megnevezése: Statisztika 1. Tanszék: Módszertani Tantárgyfelelős neve: Sándorné Dr. Kriszt

Részletesebben

Matematika feladatbank I. Statisztika. és feladatgyűjtemény középiskolásoknak

Matematika feladatbank I. Statisztika. és feladatgyűjtemény középiskolásoknak Matematika feladatbank I. Statisztika Elméleti összefoglaló és feladatgyűjtemény középiskolásoknak ÍRTA ÉS ÖSSZEÁLLÍTOTTA: Dugasz János 2011 Fapadoskonyv.hu Kft. Dugasz János Tartalom Bevezető 7 Adatok

Részletesebben

Iskolai jelentés. 10. évfolyam szövegértés

Iskolai jelentés. 10. évfolyam szövegértés 2008 Iskolai jelentés 10. évfolyam szövegértés Az elmúlt évhez hasonlóan 2008-ban iskolánk is részt vett az országos kompetenciamérésben, diákjaink matematika és szövegértés teszteket, illetve egy tanulói

Részletesebben

Bevezető Mi a statisztika? Mérés Feldolgozás Adatok rendezése Adatok jellemzése Időbeli elemzés Feladatok. Statisztika I.

Bevezető Mi a statisztika? Mérés Feldolgozás Adatok rendezése Adatok jellemzése Időbeli elemzés Feladatok. Statisztika I. Statisztika I. 1. előadás: A statisztika alapfogalmai Kóczy Á. László koczy.laszlo@kgk.uni-obuda.hu Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet Óbudai Egyetem A kurzusról A kurzus célja

Részletesebben

Bevezető Mi a statisztika? Mérés Feldolgozás Adatok rendezése Adatok jellemzése Időbeli elemzés Feladatok. Statisztika I.

Bevezető Mi a statisztika? Mérés Feldolgozás Adatok rendezése Adatok jellemzése Időbeli elemzés Feladatok. Statisztika I. Statisztika I. 1. előadás: A statisztika alapfogalmai Kóczy Á. László koczy.laszlo@kgk.uni-obuda.hu Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet Óbudai Egyetem A kurzusról A kurzus célja

Részletesebben

Statisztika 3. Dr Gősi Zsuzsanna Egyetemi adjunktus Koncentráció mérése Koncentráció általában a jelenségek tömörülését, összpontosulását értjük. Koncentráció meglétéről gyorsan tájékozódhatunk, ha sokaságot

Részletesebben

Sta t ti t s i zt z i t k i a 1. előadás

Sta t ti t s i zt z i t k i a 1. előadás Statisztika 1 előadás Témakörök Statisztikai alapfogalmak Statisztikai sorok Mennyiségi sorok csoportosítása Statisztikai táblák Statisztika fogalma Gyakorlati tevékenység Adatok összessége Módszertan

Részletesebben

ELTE TáTK Közgazdaságtudományi Tanszék ÖKONOMETRIA. Készítette: Elek Péter, Bíró Anikó. Szakmai felelős: Elek Péter. 2010. június

ELTE TáTK Közgazdaságtudományi Tanszék ÖKONOMETRIA. Készítette: Elek Péter, Bíró Anikó. Szakmai felelős: Elek Péter. 2010. június ÖKONOMETRIA ÖKONOMETRIA Készült a TÁMOP-4.1.2-08/2/A/KMR-2009-0041pályázati projekt keretében Tartalomfejlesztés az ELTE TátK Közgazdaságtudományi Tanszékén az ELTE Közgazdaságtudományi Tanszék, az MTA

Részletesebben

STATISZTIKA KÉSZÍTETTE: TAKÁCS SÁNDOR

STATISZTIKA KÉSZÍTETTE: TAKÁCS SÁNDOR STATISZTIKA KÉSZÍTETTE: TAKÁCS SÁNDOR ALAPFOGALMAK Statisztika: latin status szóból ered: állapot Mindig egy állapotot tükröz Véletlen tömegjelenségek tanulmányozásával foglakozik Adatok megfigyelés, kísérlet

Részletesebben

Megoldások. Az ismérv megnevezése közös megkülönböztető 2007. szeptember 10-én Cégbejegyzés időpontja

Megoldások. Az ismérv megnevezése közös megkülönböztető 2007. szeptember 10-én Cégbejegyzés időpontja Megoldások 1. feladat A sokaság: 2007. szeptember 12-én a Miskolci Egyetem GT-204-es tankör statisztika óráján lévő tagjai az A 1 épület III. em. 53-as teremben 8-10-ig. Közös ismérv Megkülönböztető ismérv

Részletesebben

INTELLIGENS ADATELEMZÉS

INTELLIGENS ADATELEMZÉS Írta: FOGARASSYNÉ VATHY ÁGNES STARKNÉ WERNER ÁGNES INTELLIGENS ADATELEMZÉS Egyetemi tananyag 2011 COPYRIGHT: 2011 2016, Dr. Fogarassyné Dr. Vathy Ágnes, Pannon Egyetem Műszaki Informatikai Kar Matematika

Részletesebben

Matematikai statisztikai elemzések 1.

Matematikai statisztikai elemzések 1. Matematikai statisztikai elemzések 1. A statisztika alapfogalmai, feladatai, Prof. Dr. Závoti, József Matematikai statisztikai elemzések 1.: A statisztika alapfogalmai, feladatai, statisztika, osztályozás,

Részletesebben

Matematika III. 8. A szórás és a szóródás egyéb mérőszámai Prof. Dr. Závoti, József

Matematika III. 8. A szórás és a szóródás egyéb mérőszámai Prof. Dr. Závoti, József Matematika III. 8. A szórás és a szóródás egyéb Prof. Dr. Závoti, József Matematika III. 8. : A szórás és a szóródás egyéb Prof. Dr. Závoti, József Lektor : Bischof, Annamária Ez a modul a TÁMOP - 4.1.2-08/1/A-2009-0027

Részletesebben

Az Excel táblázatkezelő program használata a matematika és a statisztika tantárgyak oktatásában

Az Excel táblázatkezelő program használata a matematika és a statisztika tantárgyak oktatásában Az Excel táblázatkezelő program használata a matematika és a statisztika tantárgyak oktatásában Hódiné Szél Margit SZTE MGK 1 A XXI. században az informatika rohamos terjedése miatt elengedhetetlen, hogy

Részletesebben

STATISZTIKA I. Tantárgykódok. Oktatók. Időbeosztás. Tematika. http://www.agr.unideb.hu/~huzsvai. 1. Előadás Bevezetés, a statisztika szerepe

STATISZTIKA I. Tantárgykódok. Oktatók. Időbeosztás. Tematika. http://www.agr.unideb.hu/~huzsvai. 1. Előadás Bevezetés, a statisztika szerepe Tantárgykódok STATISZTIKA I. GT_APSN018 GT_AKMN021 GT_ATVN020 1. Előadás Bevezetés, a statisztika szerepe Oktatók Előadó: Dr. habil. Huzsvai László tanszékvezető Gyakorlatvezetők: Dr. Balogh Péter Dr.

Részletesebben

Sta t ti t s i zt z i t k i a 3. előadás

Sta t ti t s i zt z i t k i a 3. előadás Statisztika 3. előadás Statisztika fogalma Gyakorlati tevékenység Adatok összessége Módszertan A statisztika, mint gyakorlati tevékenység a tömegesen előforduló jelenségek egyedeire vonatkozó információk

Részletesebben

A TANTÁRGY ADATLAPJA

A TANTÁRGY ADATLAPJA A TANTÁRGY ADATLAPJA 1. A képzési program adatai 1.1 Felsőoktatási intézmény Babeş-Bolyai Tudományegyetem 1.2 Kar Közgazdaság- és Gazdálkodástudományi Kar 1.3 Intézet Közgazdaság- és Gazdálkodástudományi

Részletesebben

Populációbecslések és monitoring

Populációbecslések és monitoring Populációbecslések és monitoring A becslés szerepe az ökológiában és a vadgazdálkodásban. A becslési módszerek csoportosítása. Teljes számlálás. Statisztikai alapfogalmak. Fontos lehet tudnunk, hogy hány

Részletesebben

MINTAFELADATOK. 1. Az alábbi diagram egy kiskereskedelmi lánc boltjainak forgalomkoncentrációját szemlélteti:

MINTAFELADATOK. 1. Az alábbi diagram egy kiskereskedelmi lánc boltjainak forgalomkoncentrációját szemlélteti: 1. Az alábbi diagram egy kiskereskedelmi lánc boltjainak forgalomkoncentrációját szemlélteti: 100% 90% 80% 70% 60% 50% 2010 2011 40% 30% 20% 10% 0% 0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100% a) Nevezze

Részletesebben

Mérési adatok illesztése, korreláció, regresszió

Mérési adatok illesztése, korreláció, regresszió Mérési adatok illesztése, korreláció, regresszió Korreláció, regresszió Két változó mennyiség közötti kapcsolatot vizsgálunk. Kérdés: van-e kapcsolat két, ugyanabban az egyénben, állatban, kísérleti mintában,

Részletesebben

Statisztikai programcsomagok gyakorlat Pót zárthelyi dolgozat megoldás

Statisztikai programcsomagok gyakorlat Pót zárthelyi dolgozat megoldás Statisztikai programcsomagok gyakorlat Pót zárthelyi dolgozat megoldás A feladatok megoldásához használandó adatállományok: potzh és potolando (weboldalon találhatók) Az állományok kiterjesztése sas7bdat,

Részletesebben

Nyugat-magyarországi Egyetem Geoinformatikai Kara. Prof. Dr. Závoti József. Matematika III. 7. MA3-7 modul. Helyzetmutatók, átlagok, kvantilisek

Nyugat-magyarországi Egyetem Geoinformatikai Kara. Prof. Dr. Závoti József. Matematika III. 7. MA3-7 modul. Helyzetmutatók, átlagok, kvantilisek Nyugat-magyarországi Egyetem Geoinformatikai Kara Prof. Dr. Závoti József Matematika III. 7. MA3-7 modul Helyzetmutatók, átlagok, kvantilisek SZÉKESFEHÉRVÁR 2010 Jelen szellemi terméket a szerzői jogról

Részletesebben

Hunyadi János Általános Iskola

Hunyadi János Általános Iskola 4 Hunyadi János Általános Iskola Az Önök iskolájára vontakozó egyedi adatok táblázatokban és grafikonokon 6. osztály matematika 1 Standardizált átlagos képességek matematikából Az Önök iskolájának átlagos

Részletesebben

Matematikai alapok és valószínőségszámítás. Valószínőségi eloszlások Binomiális eloszlás

Matematikai alapok és valószínőségszámítás. Valószínőségi eloszlások Binomiális eloszlás Matematikai alapok és valószínőségszámítás Valószínőségi eloszlások Binomiális eloszlás Bevezetés A tudományos életben megfigyeléseket teszünk, kísérleteket végzünk. Ezek többféle különbözı eredményre

Részletesebben

Kutatói pályára felkészítı modul

Kutatói pályára felkészítı modul Kutatói pályára felkészítı modul Kutatói pályára felkészítı kutatási ismeretek modul Tudomáyos kutatási alapayag feldolgozása, elemzési ismeretek KÖRNYEZETGAZDÁLKODÁSI MÉRNÖKI MSc TERMÉSZETVÉDELMI MÉRNÖKI

Részletesebben

Zoltánfy István Általános Iskola

Zoltánfy István Általános Iskola 4 Zoltánfy István Általános Iskola Az Önök iskolájára vontakozó egyedi adatok táblázatokban és grafikonokon 8. osztály matematika 1 Standardizált átlagos képességek matematikából Az Önök iskolájának átlagos

Részletesebben

Hogyan írjunk jól sikerült kompetenciamérést? Készítette: Kiss István 2. évf. Mérés-értékelés szakvizsga

Hogyan írjunk jól sikerült kompetenciamérést? Készítette: Kiss István 2. évf. Mérés-értékelés szakvizsga Hogyan írjunk jól sikerült kompetenciamérést? Készítette: Kiss István 2. évf. Mérés-értékelés szakvizsga Tartalom Bevezető Kompetencia Kérdőív Eredmény Bemutatkozás A dolgozat keletkezésének körülményei

Részletesebben

Ady Endre Általános Iskola

Ady Endre Általános Iskola 4 Ady Endre Általános Iskola Az Önök iskolájára vontakozó egyedi adatok táblázatokban és grafikonokon 8. osztály matematika 1 Standardizált átlagos képességek matematikából Az Önök iskolájának átlagos

Részletesebben

Az R halmazt a valós számok halmazának nevezzük, ha teljesíti az alábbi 3 axiómacsoport axiómáit.

Az R halmazt a valós számok halmazának nevezzük, ha teljesíti az alábbi 3 axiómacsoport axiómáit. 2. A VALÓS SZÁMOK 2.1 A valós számok aximómarendszere Az R halmazt a valós számok halmazának nevezzük, ha teljesíti az alábbi 3 axiómacsoport axiómáit. 1.Testaxiómák R-ben két művelet van értelmezve, az

Részletesebben

Leövey Klára Gimnázium

Leövey Klára Gimnázium 4 Leövey Klára Gimnázium 196 Budapest, Vendel u. 1. Az Önök iskolájára vontakozó egyedi adatok táblázatokban és grafikonokon 8. osztály matematika 1 196 Budapest, Vendel u. 1. Standardizált átlagos képességek

Részletesebben

TANTÁRGYI ÚTMUTATÓ. Alkalmazott számítástechnika. tanulmányokhoz

TANTÁRGYI ÚTMUTATÓ. Alkalmazott számítástechnika. tanulmányokhoz 2. évfolyam szakirány BA TANTÁRGYI ÚTMUTATÓ Alkalmazott számítástechnika tanulmányokhoz TÁVOKTATÁS Tanév (2014/2015) 1. félév A KURZUS ALAPADATAI Tárgy megnevezése: Alkalmazott Számítástechnika Tanszék:

Részletesebben

Nyugat-magyarországi Egyetem Geoinformatikai Kara. Prof. Dr. Závoti József. Matematika III. 6. MA3-6 modul. A statisztika alapfogalmai

Nyugat-magyarországi Egyetem Geoinformatikai Kara. Prof. Dr. Závoti József. Matematika III. 6. MA3-6 modul. A statisztika alapfogalmai Nyugat-magyarországi Egyetem Geoinformatikai Kara Prof. Dr. Závoti József Matematika III. 6. MA3-6 modul A statisztika alapfogalmai SZÉKESFEHÉRVÁR 2010 Jelen szellemi terméket a szerzői jogról szóló 1999.

Részletesebben

MÉRÉSI EREDMÉNYEK PONTOSSÁGA, A HIBASZÁMÍTÁS ELEMEI

MÉRÉSI EREDMÉNYEK PONTOSSÁGA, A HIBASZÁMÍTÁS ELEMEI MÉRÉSI EREDMÉYEK POTOSSÁGA, A HIBASZÁMÍTÁS ELEMEI. A mérési eredmény megadása A mérés során kapott értékek eltérnek a mérendő fizikai mennyiség valódi értékétől. Alapvetően kétféle mérési hibát különböztetünk

Részletesebben

13. előadás. Matlab 7. (Statisztika, regresszió, mérési adatok feldolgozása) Dr. Szörényi Miklós, Dr. Kallós Gábor. Széchenyi István Egyetem

13. előadás. Matlab 7. (Statisztika, regresszió, mérési adatok feldolgozása) Dr. Szörényi Miklós, Dr. Kallós Gábor. Széchenyi István Egyetem 13. előadás Matlab 7. (Statisztika, regresszió, mérési adatok feldolgozása) Dr. Szörényi Miklós, Dr. Kallós Gábor 2013 2014 1 Tartalom Statisztikai alapfogalmak Populáció, hisztogram, átlag, medián, szórás,

Részletesebben

A gyakorló feladatok számozása a bevezetı órát követı órán, azaz a második órán indul. Gyakorló feladatok megoldásai 1

A gyakorló feladatok számozása a bevezetı órát követı órán, azaz a második órán indul. Gyakorló feladatok megoldásai 1 A gyakorló feladatok számozása a bevezetı órát követı órán, azaz a második órán indul. Gyakorló feladatok megoldásai 1 1. A populációt a számunkra érdekes egységek (személyek, csalások, iskolák stb.) alkotják,

Részletesebben

Az értékelés során következtetést fogalmazhatunk meg a

Az értékelés során következtetést fogalmazhatunk meg a Az értékelés során következtetést fogalmazhatunk meg a a tanuló teljesítményére, a tanulási folyamatra, a célokra és követelményekre a szülők teljesítményére, a tanulási folyamatra, a célokra és követelményekre

Részletesebben

OKM ISKOLAI EREDMÉNYEK

OKM ISKOLAI EREDMÉNYEK OKM ISKOLAI EREDMÉNYEK Statisztikai alapfogalmak Item Statisztikai alapfogalmak Átlag Leggyakrabban: számtani átlag Egyetlen számadat jól jellemzi az eredményeket Óvatosan: elfed Statisztikai alapfogalmak

Részletesebben

Nem Fő (f) % (g) -160 100 161-180 150 181-200 50 Z 300. Férfi 180 60% Nő 120 40% Z 300 100%

Nem Fő (f) % (g) -160 100 161-180 150 181-200 50 Z 300. Férfi 180 60% Nő 120 40% Z 300 100% IX. 08. előadás Statisztikai sokaság: amire a megfigyelés irányul. Statisztikai ismérv: vizsgálati szempont, tulajdonság. Van közös (körülhatárolja a sokaságot) és megkülönböztető: területi {pl: születési

Részletesebben

Analízis. 11 12. évfolyam. Szerkesztette: Surányi László. 2015. július 5.

Analízis. 11 12. évfolyam. Szerkesztette: Surányi László. 2015. július 5. Analízis 11 12. évfolyam Szerkesztette: Surányi László 2015. július 5. Technikai munkák (MatKönyv project, TEX programozás, PHP programozás, tördelés...) Dénes Balázs, Grósz Dániel, Hraskó András, Kalló

Részletesebben

KVANTITATÍV MÓDSZEREK

KVANTITATÍV MÓDSZEREK KVANTITATÍV MÓDSZEREK Dr. Kövesi János Tóth Zsuzsanna Eszter 6 Tartalomjegyzék Kvantitatív módszerek. Valószínűségszámítási tételek. eltételes valószínűség. Események függetlensége.... 3.. eltételes valószínűség...

Részletesebben

Közösségi kezdeményezéseket megalapozó szükségletfeltárás módszertana. Domokos Tamás, módszertani igazgató

Közösségi kezdeményezéseket megalapozó szükségletfeltárás módszertana. Domokos Tamás, módszertani igazgató Közösségi kezdeményezéseket megalapozó szükségletfeltárás módszertana Domokos Tamás, módszertani igazgató A helyzetfeltárás célja A közösségi kezdeményezéshez kapcsolódó kutatások célja elsősorban felderítés,

Részletesebben

A valós számok halmaza

A valós számok halmaza VA 1 A valós számok halmaza VA 2 A valós számok halmazának axiómarendszere és alapvető tulajdonságai Definíció Az R halmazt a valós számok halmazának nevezzük, ha teljesíti a következő axiómarendszerben

Részletesebben

Csicsman József-Sipos Szabó Eszter csicsman@calculus.hu, siposeszti@gmail.com. Matematikai alapok az adatbányászati szoftverek első megismeréséhez

Csicsman József-Sipos Szabó Eszter csicsman@calculus.hu, siposeszti@gmail.com. Matematikai alapok az adatbányászati szoftverek első megismeréséhez Csicsman József-Sipos Szabó Eszter csicsman@calculus.hu, siposeszti@gmail.com Matematikai alapok az adatbányászati szoftverek első megismeréséhez 1.1 A statisztikai sokaság A statisztika a valóság számszerű

Részletesebben

Centura Szövegértés Teszt

Centura Szövegértés Teszt Centura Szövegértés Teszt Megbízhatósági vizsgálata Tesztfejlesztők: Megbízhatósági vizsgálatot végezte: Copyright tulajdonos: Bóka Ferenc, Németh Bernadett, Selmeci Gábor Bodor Andrea Centura Kft. Dátum:

Részletesebben

Matematika. 9.osztály: Ajánlott tankönyv és feladatgyűjtemény: Matematika I-II. kötet (Apáczai Kiadó; AP-090803 és AP-090804)

Matematika. 9.osztály: Ajánlott tankönyv és feladatgyűjtemény: Matematika I-II. kötet (Apáczai Kiadó; AP-090803 és AP-090804) Matematika A definíciókat és tételeket (bizonyítás nélkül) ki kell mondani, a tananyagrészekhez tartozó alap- és közepes nehézségű feladatokat kell tudni megoldani A javítóvizsga 60 -es írásbeliből áll.

Részletesebben

Általános statisztika II. Kriszt, Éva Varga, Edit Kenyeres, Erika Korpás, Attiláné Csernyák, László

Általános statisztika II. Kriszt, Éva Varga, Edit Kenyeres, Erika Korpás, Attiláné Csernyák, László Általános statisztika II Kriszt, Éva Varga, Edit Kenyeres, Erika Korpás, Attiláné Csernyák, László Általános statisztika II Kriszt, Éva Varga, Edit Kenyeres, Erika Korpás, Attiláné Csernyák, László Publication

Részletesebben

Ökonometria. Adminisztratív kérdések, bevezetés. Ferenci Tamás 1 tamas.ferenci@medstat.hu. Első fejezet. Budapesti Corvinus Egyetem

Ökonometria. Adminisztratív kérdések, bevezetés. Ferenci Tamás 1 tamas.ferenci@medstat.hu. Első fejezet. Budapesti Corvinus Egyetem Adminisztratív kérdések, bevezetés Ferenci Tamás 1 tamas.ferenci@medstat.hu 1 Statisztika Tanszék Budapesti Corvinus Egyetem Első fejezet Tartalom Technikai kérdések 1 Technikai kérdések Adminisztratív

Részletesebben

1. Technikai kérdések 1 1.1. Adminisztratív ügyek... 1 1.2. Tudnivalók a félévről... 3

1. Technikai kérdések 1 1.1. Adminisztratív ügyek... 1 1.2. Tudnivalók a félévről... 3 Tartalom Tartalomjegyzék 1. Technikai kérdések 1 1.1. Adminisztratív ügyek....................................... 1 1.2. Tudnivalók a félévről....................................... 3 2. Bevezetés, alapgondolatok

Részletesebben

Általános és gazdasági statisztika. Csugány Julianna

Általános és gazdasági statisztika. Csugány Julianna Általános és gazdasági statisztika Csugány Julianna MÉDIAINFORMATIKAI KIADVÁNYOK Általános és gazdasági statisztika Csugány Julianna Eger, 2015 Hungarian Online University Ágazati informatikai együttműködés

Részletesebben

1. előadás. Lineáris algebra numerikus módszerei. Hibaszámítás Számábrázolás Kerekítés, levágás Klasszikus hibaanalízis Abszolút hiba Relatív hiba

1. előadás. Lineáris algebra numerikus módszerei. Hibaszámítás Számábrázolás Kerekítés, levágás Klasszikus hibaanalízis Abszolút hiba Relatív hiba Hibaforrások Hiba A feladatok megoldása során különféle hibaforrásokkal találkozunk: Modellhiba, amikor a valóságnak egy közelítését használjuk a feladat matematikai alakjának felírásához. (Pl. egy fizikai

Részletesebben

Helyi tanterv. Batthyány Kázmér Gimnázium Matematika emelt (5+6+6+6 óra/hét) 9-12 évfolyam Készült: 2013 február

Helyi tanterv. Batthyány Kázmér Gimnázium Matematika emelt (5+6+6+6 óra/hét) 9-12 évfolyam Készült: 2013 február Helyi tanterv Batthyány Kázmér Gimnázium Matematika emelt (5+6+6+6 óra/hét) 9-12 évfolyam Készült: 2013 február 1 A TANTERV SZERKEZETE Bevezető Célok és feladatok Fejlesztési célok és kompetenciák Helyes

Részletesebben

A TANTÁRGY ADATLAPJA

A TANTÁRGY ADATLAPJA A TANTÁRGY ADATLAPJA 1. A képzési program adatai 1.1 Felsőoktatási intézmény Babeş-Bolyai Tudományegyetem 1.2 Kar Közgazdasági- és Gazdálkodástudományi Kar 1.3 Intézet Közgazdaság- és Gazdálkodástudományi

Részletesebben

statisztikai menürendszere Dr. Vargha András 2007

statisztikai menürendszere Dr. Vargha András 2007 A statisztikai menürendszere Dr. Vargha András 2007 2 tartalomjegyzék 1. Alapok (egymintás elemzések Alapstatisztikák Részletesebb statisztikák számítása Gyakorisági eloszlás, hisztogram készítése Középértékekre

Részletesebben

Hunyadi János Általános Iskola

Hunyadi János Általános Iskola 4 Hunyadi János Általános Iskola Az Önök iskolájára vontakozó egyedi adatok táblázatokban és grafikonokon. osztály szövegértés 1 Standardizált átlagos képességek szövegértésből Az Önök iskolájának átlagos

Részletesebben

Tantárgyi útmutató. 1. A tantárgy helye a szaki hálóban. 2. A tantárgyi program általános célja. Statisztika 1.

Tantárgyi útmutató. 1. A tantárgy helye a szaki hálóban. 2. A tantárgyi program általános célja. Statisztika 1. Tantárgyi útmutató 1. A tantárgy helye a szaki hálóban Gazdálkodási és menedzsment szakirány áttekintő tanterv Nagyításhoz kattintson a képre! Turizmus - vendéglátás szakirány áttekintő tanterv Nagyításhoz

Részletesebben

Statisztikai alapfogalmak

Statisztikai alapfogalmak i alapfogalmak statisztikai sokaság: a megfigyelés tárgyát képező egyedek összessége 2 csoportja van: álló sokaság: mindig vmiféle állapotot, állományt fejez ki, adatai egy adott időpontban értelmezhetők

Részletesebben

Statisztika oktatása és alkalmazása a mérnöki területen

Statisztika oktatása és alkalmazása a mérnöki területen Statisztika oktatása és alkalmazása a mérnöki területen 1,2 1:, Neumann János Informatikai Kar, Élettani Szabályozások Csoport 2: Budapesti Corvinus Egyetem, Statisztika Tanszék MTA Statisztikai Tudományos

Részletesebben

S atisztika 2. előadás

S atisztika 2. előadás Statisztika 2. előadás 4. lépés Terepmunka vagy adatgyűjtés Kutatási módszerek osztályozása Kutatási módszer Feltáró kutatás Következtető kutatás Leíró kutatás Ok-okozati kutatás Keresztmetszeti kutatás

Részletesebben

Bevezetés. 1. előadás, 2015. február 11. Módszerek. Tematika

Bevezetés. 1. előadás, 2015. február 11. Módszerek. Tematika Bevezetés 1. előadás, 2015. február 11. Zempléni András Valószínűségelméleti és Statisztika Tanszék Természettudományi Kar Eötvös Loránd Tudományegyetem Áringadozások előadás Heti 2 óra előadás + 2 óra

Részletesebben

Q1 = 1575 eft Me = 2027,7778 eft Q3 = 2526,3158 eft

Q1 = 1575 eft Me = 2027,7778 eft Q3 = 2526,3158 eft Gyak1: b) Mo = 1857,143 eft A kocsma tipikus (leggyakoribb) havi bevétele 1.857.143 Ft. c) Q1 = 1575 eft Me = 2027,7778 eft Q3 = 2526,3158 eft Gyak2: b) X átlag = 35 Mo = 33,33 σ = 11,2909 A = 0,16 Az

Részletesebben

Khi-négyzet eloszlás. Statisztika II., 3. alkalom

Khi-négyzet eloszlás. Statisztika II., 3. alkalom Khi-négyzet eloszlás Statisztika II., 3. alkalom A khi négyzet eloszlást (Pearson) leggyakrabban kategorikus adatok elemzésére használjuk. N darab standard normális eloszlású változó négyzetes összegeként

Részletesebben

Biomatematika 15. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

Biomatematika 15. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János Szent István Egyetem Állatorvos-tudományi Kar Biomatematikai és Számítástechnikai Tanszék Biomatematika 15. Nemparaméteres próbák Fodor János Copyright c Fodor.Janos@aotk.szie.hu Last Revision Date: November

Részletesebben

Statisztika gyakorlat

Statisztika gyakorlat Félévi követelményrendszer tatisztika gyakorlat. Gazdasági agrármérnök szak II. évolyam 007.0.. Heti óraszám: + Aláírás eltételei: az elıadásokon való részvétel nem kötelezı, de AJÁNLOTT! a gyakorlatokon

Részletesebben

Kutatásmódszertan és prezentációkészítés

Kutatásmódszertan és prezentációkészítés Kutatásmódszertan és prezentációkészítés 8. rész: Statisztikai eszköztár: Alapfokú statisztikai ismeretek Szerző: Kmetty Zoltán Lektor: Fokasz Nikosz Nyolcadik rész Statisztikai eszköztár: Alapfokú statisztikai

Részletesebben

1/8. Iskolai jelentés. 10.évfolyam matematika

1/8. Iskolai jelentés. 10.évfolyam matematika 1/8 2008 Iskolai jelentés 10.évfolyam matematika 2/8 Matematikai kompetenciaterület A fejlesztés célja A kidolgozásra kerülő programcsomagok az alább felsorolt készségek, képességek közül a számlálás,

Részletesebben

Biomatematika 8. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

Biomatematika 8. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János Szent István Egyetem Állatorvos-tudományi Kar Biomatematikai és Számítástechnikai Tanszék Biomatematika 8. Valószínűség-számítás II. Fodor János Copyright c Fodor.Janos@aotk.szie.hu Last Revision Date:

Részletesebben

Készítette: Ernyei Kitti. Halmazok

Készítette: Ernyei Kitti. Halmazok Halmazok Jelölések: A halmazok jele általában nyomtatott nagybetű: A, B, C Az x eleme az A halmaznak: Az x nem eleme az A halmaznak: Az A halmaz az a, b, c elemekből áll: A halmazban egy elemet csak egyszer

Részletesebben

Elméleti összefoglalók dr. Kovács Péter

Elméleti összefoglalók dr. Kovács Péter Elméleti összefoglalók dr. Kovács Péter 1. Adatállományok létrehozása, kezelése... 2 2. Leíró statisztikai eljárások... 3 3. Várható értékek (átlagok) vizsgálatára irányuló próbák... 5 4. Eloszlások vizsgálata...

Részletesebben