Biostatisztika és alkalmazásai
|
|
- Hanna Soós
- 8 évvel ezelőtt
- Látták:
Átírás
1 2013. szeptember 25.
2 Tartalom 1 Mi a statisztika? 2 A statisztika alapfogalmai 3 Deskriptív statisztika A deskriptív statisztikáról általában Egyváltozós elemzés, minőségi változó Egyváltozós elemzés, mennyiségi változó Két minőségi változó kapcsolata: asszociáció Két mennyiségi változó kapcsolata: korreláció 4 Induktív statisztika A mintavételi helyzet konzekvenciái Becsléselmélet Hipotézisvizsgálat 5 Klinikai vizsgálatok
3 Tartalom 1 Mi a statisztika? 2 A statisztika alapfogalmai 3 Deskriptív statisztika A deskriptív statisztikáról általában Egyváltozós elemzés, minőségi változó Egyváltozós elemzés, mennyiségi változó Két minőségi változó kapcsolata: asszociáció Két mennyiségi változó kapcsolata: korreláció 4 Induktív statisztika A mintavételi helyzet konzekvenciái Becsléselmélet Hipotézisvizsgálat 5 Klinikai vizsgálatok
4 Mi a statisztika? Hivatalosan: A statisztika a valóság számszerűsíthető tényeinek szisztematikus összegyűjtésével és elemzésével foglalkozó tudományos módszer és gyakorlat Nemhivatalosan: A hazugságok három kategóriába sorolhatóak: kis hazugságok, gyalázatos hazugságok, és statisztikák (Benjamin Disraeli-nek tulajdonítva) A statisztika a matematika azon ága, melynek feladata, hogy eszközt adjon a politikusok kezébe, mellyel tetszőleges állítás és annak ellentéte is tudományos alapon igazolható (Általános iskolai matematika tanárom)
5 Mi a statisztika? Hivatalosan: A statisztika a valóság számszerűsíthető tényeinek szisztematikus összegyűjtésével és elemzésével foglalkozó tudományos módszer és gyakorlat Nemhivatalosan: A hazugságok három kategóriába sorolhatóak: kis hazugságok, gyalázatos hazugságok, és statisztikák (Benjamin Disraeli-nek tulajdonítva) A statisztika a matematika azon ága, melynek feladata, hogy eszközt adjon a politikusok kezébe, mellyel tetszőleges állítás és annak ellentéte is tudományos alapon igazolható (Általános iskolai matematika tanárom)
6 Mi a statisztika? Hivatalosan: A statisztika a valóság számszerűsíthető tényeinek szisztematikus összegyűjtésével és elemzésével foglalkozó tudományos módszer és gyakorlat Nemhivatalosan: A hazugságok három kategóriába sorolhatóak: kis hazugságok, gyalázatos hazugságok, és statisztikák (Benjamin Disraeli-nek tulajdonítva) A statisztika a matematika azon ága, melynek feladata, hogy eszközt adjon a politikusok kezébe, mellyel tetszőleges állítás és annak ellentéte is tudományos alapon igazolható (Általános iskolai matematika tanárom)
7 Mi a statisztika? Hivatalosan: A statisztika a valóság számszerűsíthető tényeinek szisztematikus összegyűjtésével és elemzésével foglalkozó tudományos módszer és gyakorlat Nemhivatalosan: A hazugságok három kategóriába sorolhatóak: kis hazugságok, gyalázatos hazugságok, és statisztikák (Benjamin Disraeli-nek tulajdonítva) A statisztika a matematika azon ága, melynek feladata, hogy eszközt adjon a politikusok kezébe, mellyel tetszőleges állítás és annak ellentéte is tudományos alapon igazolható (Általános iskolai matematika tanárom)
8 Miért statisztika? Akkor miért foglalkozzunk statisztikával? Ennek ellenére? Nem! Éppen ezért!
9 Miért statisztika? Akkor miért foglalkozzunk statisztikával? Ennek ellenére? Nem! Éppen ezért!
10 Miért statisztika? Akkor miért foglalkozzunk statisztikával? Ennek ellenére? Nem! Éppen ezért!
11 Miért jó, ha értünk a statisztikához? (Személyes vélemény jön) 3 fő szempont: 1 Hogy ne tudjanak átverni minket 2 Hogy új ismereteket szerezzünk 3 Hogy feltevéseinket precízen vizsgáljuk
12 Miért jó, ha értünk a statisztikához? (Személyes vélemény jön) 3 fő szempont: 1 Hogy ne tudjanak átverni minket 2 Hogy új ismereteket szerezzünk 3 Hogy feltevéseinket precízen vizsgáljuk
13 Miért jó, ha értünk a statisztikához? (Személyes vélemény jön) 3 fő szempont: 1 Hogy ne tudjanak átverni minket 2 Hogy új ismereteket szerezzünk 3 Hogy feltevéseinket precízen vizsgáljuk
14 Miért jó, ha értünk a statisztikához? (Személyes vélemény jön) 3 fő szempont: 1 Hogy ne tudjanak átverni minket 2 Hogy új ismereteket szerezzünk 3 Hogy feltevéseinket precízen vizsgáljuk
15 Miért jó, ha értünk a statisztikához? (Személyes vélemény jön) 3 fő szempont: 1 Hogy ne tudjanak átverni minket 2 Hogy új ismereteket szerezzünk 3 Hogy feltevéseinket precízen vizsgáljuk
16 Feltevések precíz vizsgálata Elsősorban az agrometriából indult a XX. század elején Nagyon hamar kapcsolódott az orvoslás is Ok: az orvostudomány empirikussá válása Később ez a gondolat az evidence-based medicine-ben teljesedett ki Például a gyógyszerkísérletek kapcsán hatalmas gyakorlati jelentősége van nüanszoknak is
17 Feltevések precíz vizsgálata Elsősorban az agrometriából indult a XX. század elején Nagyon hamar kapcsolódott az orvoslás is Ok: az orvostudomány empirikussá válása Később ez a gondolat az evidence-based medicine-ben teljesedett ki Például a gyógyszerkísérletek kapcsán hatalmas gyakorlati jelentősége van nüanszoknak is
18 Feltevések precíz vizsgálata Elsősorban az agrometriából indult a XX. század elején Nagyon hamar kapcsolódott az orvoslás is Ok: az orvostudomány empirikussá válása Később ez a gondolat az evidence-based medicine-ben teljesedett ki Például a gyógyszerkísérletek kapcsán hatalmas gyakorlati jelentősége van nüanszoknak is
19 Feltevések precíz vizsgálata Elsősorban az agrometriából indult a XX. század elején Nagyon hamar kapcsolódott az orvoslás is Ok: az orvostudomány empirikussá válása Később ez a gondolat az evidence-based medicine-ben teljesedett ki Például a gyógyszerkísérletek kapcsán hatalmas gyakorlati jelentősége van nüanszoknak is
20 Feltevések precíz vizsgálata Elsősorban az agrometriából indult a XX. század elején Nagyon hamar kapcsolódott az orvoslás is Ok: az orvostudomány empirikussá válása Később ez a gondolat az evidence-based medicine-ben teljesedett ki Például a gyógyszerkísérletek kapcsán hatalmas gyakorlati jelentősége van nüanszoknak is
21 Új ismeretek szerzése Adatok strukturálása, alkalmas megjelenítése, információtömörítés, lényegkiemelés Hatalmas motivációt jelent a számítástechnikai (és orvosi) lehetőségek fejlődése miatt létrejövő egyre nagyobb és nagyobb adatbázisok léte
22 Új ismeretek szerzése Adatok strukturálása, alkalmas megjelenítése, információtömörítés, lényegkiemelés Hatalmas motivációt jelent a számítástechnikai (és orvosi) lehetőségek fejlődése miatt létrejövő egyre nagyobb és nagyobb adatbázisok léte
23 Hogy ne tudjanak átverni minket A KSH szerint 2011-ben a magyar bruttó átlagkereset 213 ezer forint volt. Mégis, a másik táblázatból az derül ki, hogy az emberek 68%-a ennél kevesebbet keresett! Hogy a fenében lehetne akkor ez az átlag?! A KSH hazudik! A HRT-kezelésben részesülő nők körében 1,8-szer kevesebb a szív-érrendszeri megbetegedés, mint az ilyet nem kapók között. A HRT-kezelés tehát jó hatással van a kardiovaszkuláris rendszerre. A minap a suliból (munkahelyem) hazafelé tartva, a buszra vártam. Néhány diák a közelben beszélgetett. Az volt a téma, hogy milyen sokan hiányoznak az osztályból, mert betegek. Egyikük megjegyezte, hogy ő is azóta beteg, mióta megkapták az oltást.
24 Korreláció nem implikál kauzalitást Tűzoltók példája: a tűzesetben esett kár és a kiküldött tűzoltók száma HRT-s példa: HRT-kezelés megléte és a kardiovaszkuláris rizikó Két dolog együttjárásából nem következik, hogy az egyik okozza a másikat! T1DM és császármetszés: milyen confounder-ek jönnek szóba...?
25 Korreláció nem implikál kauzalitást Tűzoltók példája: a tűzesetben esett kár és a kiküldött tűzoltók száma HRT-s példa: HRT-kezelés megléte és a kardiovaszkuláris rizikó Két dolog együttjárásából nem következik, hogy az egyik okozza a másikat! T1DM és császármetszés: milyen confounder-ek jönnek szóba...?
26 Korreláció nem implikál kauzalitást Tűzoltók példája: a tűzesetben esett kár és a kiküldött tűzoltók száma HRT-s példa: HRT-kezelés megléte és a kardiovaszkuláris rizikó Két dolog együttjárásából nem következik, hogy az egyik okozza a másikat! T1DM és császármetszés: milyen confounder-ek jönnek szóba...?
27 Korreláció nem implikál kauzalitást Tűzoltók példája: a tűzesetben esett kár és a kiküldött tűzoltók száma HRT-s példa: HRT-kezelés megléte és a kardiovaszkuláris rizikó Két dolog együttjárásából nem következik, hogy az egyik okozza a másikat! T1DM és császármetszés: milyen confounder-ek jönnek szóba...?
28 A biostatisztika elhatárolása Valószínűségszámítás Statisztika Alkalmazott statisztikai ágak Biostatisztika, Pszichometria, Agrometria, Ökonometria stb. vs. bioinformatika: inkább számítástechnikai kérdések, nagy adatbázisokon hatékony algoritmus megoldások vs. biomatematika: inkább nem-statisztikai, elsősorban analízisbeli modellezési eszközök (pl. differenciál-egyenletek) használata
29 A biostatisztika elhatárolása Valószínűségszámítás Statisztika Alkalmazott statisztikai ágak Biostatisztika, Pszichometria, Agrometria, Ökonometria stb. vs. bioinformatika: inkább számítástechnikai kérdések, nagy adatbázisokon hatékony algoritmus megoldások vs. biomatematika: inkább nem-statisztikai, elsősorban analízisbeli modellezési eszközök (pl. differenciál-egyenletek) használata
30 A biostatisztika elhatárolása Valószínűségszámítás Statisztika Alkalmazott statisztikai ágak Biostatisztika, Pszichometria, Agrometria, Ökonometria stb. vs. bioinformatika: inkább számítástechnikai kérdések, nagy adatbázisokon hatékony algoritmus megoldások vs. biomatematika: inkább nem-statisztikai, elsősorban analízisbeli modellezési eszközök (pl. differenciál-egyenletek) használata
31 A biostatisztika elhatárolása Valószínűségszámítás Statisztika Alkalmazott statisztikai ágak Biostatisztika, Pszichometria, Agrometria, Ökonometria stb. vs. bioinformatika: inkább számítástechnikai kérdések, nagy adatbázisokon hatékony algoritmus megoldások vs. biomatematika: inkább nem-statisztikai, elsősorban analízisbeli modellezési eszközök (pl. differenciál-egyenletek) használata
32 Milyen alapokra van szükség, hogy biostatisztikával foglalkozzak? Valószínűségszámítás, lineáris algebra Matematikai statisztika Orvosi ismeretek
33 Milyen alapokra van szükség, hogy biostatisztikával foglalkozzak? Valószínűségszámítás, lineáris algebra Matematikai statisztika Orvosi ismeretek
34 Milyen alapokra van szükség, hogy biostatisztikával foglalkozzak? Valószínűségszámítás, lineáris algebra Matematikai statisztika Orvosi ismeretek
35 Statisztikai programcsomagok Mai biostatisztika elképzelhetetlen számítógépes támogatás nélkül Pár közismert, biostatisztikára (is) használható program: SAS Gyógyszeripar kedveli, jól standardizált, rettenetesen drága SPSS Általános célú statisztikai programcsomag (eredetileg szociológusoknak), az alap dolgokat könnyű megcsinálni, a komplexebbeket cserében nagyon nehéz R Klasszikus akadémiai programcsomag, az alap dolgokat sem könnyű megcsinálni, a komplexebbeket cserében viszont lehet; ingyenes és nyílt forráskódú (!),
36 Statisztikai programcsomagok Mai biostatisztika elképzelhetetlen számítógépes támogatás nélkül Pár közismert, biostatisztikára (is) használható program: SAS Gyógyszeripar kedveli, jól standardizált, rettenetesen drága SPSS Általános célú statisztikai programcsomag (eredetileg szociológusoknak), az alap dolgokat könnyű megcsinálni, a komplexebbeket cserében nagyon nehéz R Klasszikus akadémiai programcsomag, az alap dolgokat sem könnyű megcsinálni, a komplexebbeket cserében viszont lehet; ingyenes és nyílt forráskódú (!),
37 Statisztikai programcsomagok Mai biostatisztika elképzelhetetlen számítógépes támogatás nélkül Pár közismert, biostatisztikára (is) használható program: SAS Gyógyszeripar kedveli, jól standardizált, rettenetesen drága SPSS Általános célú statisztikai programcsomag (eredetileg szociológusoknak), az alap dolgokat könnyű megcsinálni, a komplexebbeket cserében nagyon nehéz R Klasszikus akadémiai programcsomag, az alap dolgokat sem könnyű megcsinálni, a komplexebbeket cserében viszont lehet; ingyenes és nyílt forráskódú (!),
38 Ez az előadás... Áttekintés a biostatisztika szempontjából legfontosabb statisztikai alapokról Részletek nélkül, csak bevezető jelleggel (képlet, levezetés általában kevés) Összbenyomás a területről Szemléletformálás Klinikai vizsgálatok, mint a biostatisztika fontos adatforrása, alkalmazási területe
39 Ez az előadás... Áttekintés a biostatisztika szempontjából legfontosabb statisztikai alapokról Részletek nélkül, csak bevezető jelleggel (képlet, levezetés általában kevés) Összbenyomás a területről Szemléletformálás Klinikai vizsgálatok, mint a biostatisztika fontos adatforrása, alkalmazási területe
40 Ez az előadás... Áttekintés a biostatisztika szempontjából legfontosabb statisztikai alapokról Részletek nélkül, csak bevezető jelleggel (képlet, levezetés általában kevés) Összbenyomás a területről Szemléletformálás Klinikai vizsgálatok, mint a biostatisztika fontos adatforrása, alkalmazási területe
41 Ez az előadás... Áttekintés a biostatisztika szempontjából legfontosabb statisztikai alapokról Részletek nélkül, csak bevezető jelleggel (képlet, levezetés általában kevés) Összbenyomás a területről Szemléletformálás Klinikai vizsgálatok, mint a biostatisztika fontos adatforrása, alkalmazási területe
42 Ez az előadás... Áttekintés a biostatisztika szempontjából legfontosabb statisztikai alapokról Részletek nélkül, csak bevezető jelleggel (képlet, levezetés általában kevés) Összbenyomás a területről Szemléletformálás Klinikai vizsgálatok, mint a biostatisztika fontos adatforrása, alkalmazási területe
43 Tartalom 1 Mi a statisztika? 2 A statisztika alapfogalmai 3 Deskriptív statisztika A deskriptív statisztikáról általában Egyváltozós elemzés, minőségi változó Egyváltozós elemzés, mennyiségi változó Két minőségi változó kapcsolata: asszociáció Két mennyiségi változó kapcsolata: korreláció 4 Induktív statisztika A mintavételi helyzet konzekvenciái Becsléselmélet Hipotézisvizsgálat 5 Klinikai vizsgálatok
44 Pár demonstratív kérdés, amit szeretnénk megválaszolni Egy új vérnyomáscsökkentő gyógyszer-jelölt valóban csökkenti a vérnyomást? Egy új vérnyomáscsökkentő gyógyszer-jelölt nem okoz megnövekedett epilepszia-kockázatot? Magasfeszültségű vezeték közelében tartózkodás növeli a rák-kockázatot? Milyen tényezők hatnak adott rákban a túlélési időre? Mennyi jelen kurzus hallgatóinak átlagos testtömege? Mennyi az I. éves fiú egyetemisták átlagos testtömege? Igaz-e, hogy az I. éves fiú egyetemisták átlagos testtömege 70 kg? Van-e összefüggés tehenek takarmányozása és a tejhozamuk között?
45 Pár definíció Amire (akikre) a kérdésünk irányul: (cél)populáció, sokaság Elemei: megfigyelési egységek Amely jellemzőire kíváncsiak vagyunk: változó (vagy ismérv) A változó értékének meghatározása egy adott sokasági elemre: megfigyelés Nagyon ritkán tudjuk a sokaság valamennyi elemét megfigyelni (ez lenne a teljeskörű megfigyelés), technikai gondok, és...
46 Pár definíció Amire (akikre) a kérdésünk irányul: (cél)populáció, sokaság Elemei: megfigyelési egységek Amely jellemzőire kíváncsiak vagyunk: változó (vagy ismérv) A változó értékének meghatározása egy adott sokasági elemre: megfigyelés Nagyon ritkán tudjuk a sokaság valamennyi elemét megfigyelni (ez lenne a teljeskörű megfigyelés), technikai gondok, és...
47 Pár definíció Amire (akikre) a kérdésünk irányul: (cél)populáció, sokaság Elemei: megfigyelési egységek Amely jellemzőire kíváncsiak vagyunk: változó (vagy ismérv) A változó értékének meghatározása egy adott sokasági elemre: megfigyelés Nagyon ritkán tudjuk a sokaság valamennyi elemét megfigyelni (ez lenne a teljeskörű megfigyelés), technikai gondok, és...
48 Pár definíció Amire (akikre) a kérdésünk irányul: (cél)populáció, sokaság Elemei: megfigyelési egységek Amely jellemzőire kíváncsiak vagyunk: változó (vagy ismérv) A változó értékének meghatározása egy adott sokasági elemre: megfigyelés Nagyon ritkán tudjuk a sokaság valamennyi elemét megfigyelni (ez lenne a teljeskörű megfigyelés), technikai gondok, és...
49 Pár definíció Amire (akikre) a kérdésünk irányul: (cél)populáció, sokaság Elemei: megfigyelési egységek Amely jellemzőire kíváncsiak vagyunk: változó (vagy ismérv) A változó értékének meghatározása egy adott sokasági elemre: megfigyelés Nagyon ritkán tudjuk a sokaság valamennyi elemét megfigyelni (ez lenne a teljeskörű megfigyelés), technikai gondok, és...
50 Kicsit elidőzve a sokaság fogalmánál Mennyi jelen kurzus hallgatóinak átlagos testtömege? véges sokaság (N = 23) De: Egy új vérnyomáscsökkentő gyógyszer-jelölt valóban csökkenti a vérnyomást? Mi itt a sokaság? Ez végtelen sokaság! (Szokás fiktívnek is nevezni.)
51 Kicsit elidőzve a sokaság fogalmánál Mennyi jelen kurzus hallgatóinak átlagos testtömege? véges sokaság (N = 23) De: Egy új vérnyomáscsökkentő gyógyszer-jelölt valóban csökkenti a vérnyomást? Mi itt a sokaság? Ez végtelen sokaság! (Szokás fiktívnek is nevezni.)
52 Kicsit elidőzve a sokaság fogalmánál Mennyi jelen kurzus hallgatóinak átlagos testtömege? véges sokaság (N = 23) De: Egy új vérnyomáscsökkentő gyógyszer-jelölt valóban csökkenti a vérnyomást? Mi itt a sokaság? Ez végtelen sokaság! (Szokás fiktívnek is nevezni.)
53 Kicsit elidőzve a sokaság fogalmánál Mennyi jelen kurzus hallgatóinak átlagos testtömege? véges sokaság (N = 23) De: Egy új vérnyomáscsökkentő gyógyszer-jelölt valóban csökkenti a vérnyomást? Mi itt a sokaság? Ez végtelen sokaság! (Szokás fiktívnek is nevezni.)
54 Mintavétel Tehát: általában nem tudjuk az egész sokaságot megfigyelni mintavételes helyzet Amit meg tudunk figyelni: minta (Illetve tervezett minta, nem biztos, hogy pont ezt figyeljük meg ténylegesen) Sokaság Tényleges minta Tervezett minta Induktív statisztikánál foglalkozunk vele tovább
55 Mintavétel Tehát: általában nem tudjuk az egész sokaságot megfigyelni mintavételes helyzet Amit meg tudunk figyelni: minta (Illetve tervezett minta, nem biztos, hogy pont ezt figyeljük meg ténylegesen) Sokaság Tényleges minta Tervezett minta Induktív statisztikánál foglalkozunk vele tovább
56 Mintavétel Tehát: általában nem tudjuk az egész sokaságot megfigyelni mintavételes helyzet Amit meg tudunk figyelni: minta (Illetve tervezett minta, nem biztos, hogy pont ezt figyeljük meg ténylegesen) Sokaság Tényleges minta Tervezett minta Induktív statisztikánál foglalkozunk vele tovább
57 Mintavétel Tehát: általában nem tudjuk az egész sokaságot megfigyelni mintavételes helyzet Amit meg tudunk figyelni: minta (Illetve tervezett minta, nem biztos, hogy pont ezt figyeljük meg ténylegesen) Sokaság Tényleges minta Tervezett minta Induktív statisztikánál foglalkozunk vele tovább
58 Mérés, mérési skálák A vizsgált tulajdonságot mérhetővé kell tenni Operacionalizálás Proxy változók Mérési skálák (Stevens, 1946) 1 Nominális skála 2 Ordinális skála 3 Intervallum skála 4 Arányskála Az első két típusba tartozót szokás minőségi (kvalitatív) változónak is nevezni az utóbbi kettőt pedig mennyiségi (kvantitatív) változónak
59 Mérés, mérési skálák A vizsgált tulajdonságot mérhetővé kell tenni Operacionalizálás Proxy változók Mérési skálák (Stevens, 1946) 1 Nominális skála 2 Ordinális skála 3 Intervallum skála 4 Arányskála Az első két típusba tartozót szokás minőségi (kvalitatív) változónak is nevezni az utóbbi kettőt pedig mennyiségi (kvantitatív) változónak
60 Mérés, mérési skálák A vizsgált tulajdonságot mérhetővé kell tenni Operacionalizálás Proxy változók Mérési skálák (Stevens, 1946) 1 Nominális skála 2 Ordinális skála 3 Intervallum skála 4 Arányskála Az első két típusba tartozót szokás minőségi (kvalitatív) változónak is nevezni az utóbbi kettőt pedig mennyiségi (kvantitatív) változónak
61 Mérés, mérési skálák A vizsgált tulajdonságot mérhetővé kell tenni Operacionalizálás Proxy változók Mérési skálák (Stevens, 1946) 1 Nominális skála 2 Ordinális skála 3 Intervallum skála 4 Arányskála Az első két típusba tartozót szokás minőségi (kvalitatív) változónak is nevezni az utóbbi kettőt pedig mennyiségi (kvantitatív) változónak
62 Mérés, mérési skálák A vizsgált tulajdonságot mérhetővé kell tenni Operacionalizálás Proxy változók Mérési skálák (Stevens, 1946) 1 Nominális skála 2 Ordinális skála 3 Intervallum skála 4 Arányskála Az első két típusba tartozót szokás minőségi (kvalitatív) változónak is nevezni az utóbbi kettőt pedig mennyiségi (kvantitatív) változónak
63 Mérés, mérési skálák A vizsgált tulajdonságot mérhetővé kell tenni Operacionalizálás Proxy változók Mérési skálák (Stevens, 1946) 1 Nominális skála 2 Ordinális skála 3 Intervallum skála 4 Arányskála Az első két típusba tartozót szokás minőségi (kvalitatív) változónak is nevezni az utóbbi kettőt pedig mennyiségi (kvantitatív) változónak
64 Mérés, mérési skálák A vizsgált tulajdonságot mérhetővé kell tenni Operacionalizálás Proxy változók Mérési skálák (Stevens, 1946) 1 Nominális skála 2 Ordinális skála 3 Intervallum skála 4 Arányskála Az első két típusba tartozót szokás minőségi (kvalitatív) változónak is nevezni az utóbbi kettőt pedig mennyiségi (kvantitatív) változónak
65 Mérés, mérési skálák A vizsgált tulajdonságot mérhetővé kell tenni Operacionalizálás Proxy változók Mérési skálák (Stevens, 1946) 1 Nominális skála 2 Ordinális skála 3 Intervallum skála 4 Arányskála Az első két típusba tartozót szokás minőségi (kvalitatív) változónak is nevezni az utóbbi kettőt pedig mennyiségi (kvantitatív) változónak
66 Mérés, mérési skálák A vizsgált tulajdonságot mérhetővé kell tenni Operacionalizálás Proxy változók Mérési skálák (Stevens, 1946) 1 Nominális skála 2 Ordinális skála 3 Intervallum skála 4 Arányskála Az első két típusba tartozót szokás minőségi (kvalitatív) változónak is nevezni az utóbbi kettőt pedig mennyiségi (kvantitatív) változónak
67 Mérés, mérési skálák A vizsgált tulajdonságot mérhetővé kell tenni Operacionalizálás Proxy változók Mérési skálák (Stevens, 1946) 1 Nominális skála 2 Ordinális skála 3 Intervallum skála 4 Arányskála Az első két típusba tartozót szokás minőségi (kvalitatív) változónak is nevezni az utóbbi kettőt pedig mennyiségi (kvantitatív) változónak
68 Adatok jellemzői Kimenetek száma szerint Diszkrét (véges, vagy legfeljebb megszámlálhatóan sok, pl. szemszín) Folytonos (kontinuum sok, pl. testhőmérséklet) Általában megfeleltetjük a minőségi-mennyiségi csoportoknak (noha ez elvileg nem helyes), de vigyázat: a darabszám nevezetes kivétel Időbeli jelleg szerint: Keresztmetszeti (egy eszmei időpontra vonatkozó megfigyelések) Longitudinális (időbeli követés)
69 Adatok jellemzői Kimenetek száma szerint Diszkrét (véges, vagy legfeljebb megszámlálhatóan sok, pl. szemszín) Folytonos (kontinuum sok, pl. testhőmérséklet) Általában megfeleltetjük a minőségi-mennyiségi csoportoknak (noha ez elvileg nem helyes), de vigyázat: a darabszám nevezetes kivétel Időbeli jelleg szerint: Keresztmetszeti (egy eszmei időpontra vonatkozó megfigyelések) Longitudinális (időbeli követés)
70 Adatok jellemzői Kimenetek száma szerint Diszkrét (véges, vagy legfeljebb megszámlálhatóan sok, pl. szemszín) Folytonos (kontinuum sok, pl. testhőmérséklet) Általában megfeleltetjük a minőségi-mennyiségi csoportoknak (noha ez elvileg nem helyes), de vigyázat: a darabszám nevezetes kivétel Időbeli jelleg szerint: Keresztmetszeti (egy eszmei időpontra vonatkozó megfigyelések) Longitudinális (időbeli követés)
71 Adatok jellemzői Kimenetek száma szerint Diszkrét (véges, vagy legfeljebb megszámlálhatóan sok, pl. szemszín) Folytonos (kontinuum sok, pl. testhőmérséklet) Általában megfeleltetjük a minőségi-mennyiségi csoportoknak (noha ez elvileg nem helyes), de vigyázat: a darabszám nevezetes kivétel Időbeli jelleg szerint: Keresztmetszeti (egy eszmei időpontra vonatkozó megfigyelések) Longitudinális (időbeli követés)
72 Adatok jellemzői Kimenetek száma szerint Diszkrét (véges, vagy legfeljebb megszámlálhatóan sok, pl. szemszín) Folytonos (kontinuum sok, pl. testhőmérséklet) Általában megfeleltetjük a minőségi-mennyiségi csoportoknak (noha ez elvileg nem helyes), de vigyázat: a darabszám nevezetes kivétel Időbeli jelleg szerint: Keresztmetszeti (egy eszmei időpontra vonatkozó megfigyelések) Longitudinális (időbeli követés)
73 Adatok jellemzői Kimenetek száma szerint Diszkrét (véges, vagy legfeljebb megszámlálhatóan sok, pl. szemszín) Folytonos (kontinuum sok, pl. testhőmérséklet) Általában megfeleltetjük a minőségi-mennyiségi csoportoknak (noha ez elvileg nem helyes), de vigyázat: a darabszám nevezetes kivétel Időbeli jelleg szerint: Keresztmetszeti (egy eszmei időpontra vonatkozó megfigyelések) Longitudinális (időbeli követés)
74 Adatok jellemzői Kimenetek száma szerint Diszkrét (véges, vagy legfeljebb megszámlálhatóan sok, pl. szemszín) Folytonos (kontinuum sok, pl. testhőmérséklet) Általában megfeleltetjük a minőségi-mennyiségi csoportoknak (noha ez elvileg nem helyes), de vigyázat: a darabszám nevezetes kivétel Időbeli jelleg szerint: Keresztmetszeti (egy eszmei időpontra vonatkozó megfigyelések) Longitudinális (időbeli követés)
75 Példa adatbázis Baystate Medical Center (Springfield, Massachusetts, USA) Low Infant Birth Weight adatbázisa (1986) R-ben: MASS könyvtár birthwt adatbázis Kis kivonat: low age lwt race smoke ptl ht ui ftv bwt
76 Példa adatbázis Baystate Medical Center (Springfield, Massachusetts, USA) Low Infant Birth Weight adatbázisa (1986) R-ben: MASS könyvtár birthwt adatbázis Kis kivonat: low age lwt race smoke ptl ht ui ftv bwt
77 Példa adatbázis Baystate Medical Center (Springfield, Massachusetts, USA) Low Infant Birth Weight adatbázisa (1986) R-ben: MASS könyvtár birthwt adatbázis Kis kivonat: low age lwt race smoke ptl ht ui ftv bwt
78 A példa adatbázis jellemzése Keresztmetszeti n = 189 elemű minta egy fiktív, végtelen sokaságból Változók: Rövidítés Tartalom Mérési skála low Születési tömeg < 2,5 kg? [0:nem, 1:igen] Nominális age Anya életkora [év] Arányskála lwt Anya testtömege (UM) [font] Arányskála race Rassz [1: kaukázusi, 2: afroamerikai, 3: egyéb] Nominális smoke Anya dohányzik? [0:nem, 1:igen] Nominális ptl Korábbi koraszülések száma [darab] Arányskála ht Anyai hipertónia? [0:nem, 1:igen] Nominális ui Irritábilis méh? [0:nem, 1:igen] Nominális ftv Vizitek száma (1. trimeszter) [darab] Arányskála bwt Születési tömeg [g] Arányskála
79 A példa adatbázis jellemzése Keresztmetszeti n = 189 elemű minta egy fiktív, végtelen sokaságból Változók: Rövidítés Tartalom Mérési skála low Születési tömeg < 2,5 kg? [0:nem, 1:igen] Nominális age Anya életkora [év] Arányskála lwt Anya testtömege (UM) [font] Arányskála race Rassz [1: kaukázusi, 2: afroamerikai, 3: egyéb] Nominális smoke Anya dohányzik? [0:nem, 1:igen] Nominális ptl Korábbi koraszülések száma [darab] Arányskála ht Anyai hipertónia? [0:nem, 1:igen] Nominális ui Irritábilis méh? [0:nem, 1:igen] Nominális ftv Vizitek száma (1. trimeszter) [darab] Arányskála bwt Születési tömeg [g] Arányskála
80 A példa adatbázis jellemzése Keresztmetszeti n = 189 elemű minta egy fiktív, végtelen sokaságból Változók: Rövidítés Tartalom Mérési skála low Születési tömeg < 2,5 kg? [0:nem, 1:igen] Nominális age Anya életkora [év] Arányskála lwt Anya testtömege (UM) [font] Arányskála race Rassz [1: kaukázusi, 2: afroamerikai, 3: egyéb] Nominális smoke Anya dohányzik? [0:nem, 1:igen] Nominális ptl Korábbi koraszülések száma [darab] Arányskála ht Anyai hipertónia? [0:nem, 1:igen] Nominális ui Irritábilis méh? [0:nem, 1:igen] Nominális ftv Vizitek száma (1. trimeszter) [darab] Arányskála bwt Születési tömeg [g] Arányskála
81 Tartalom 1 Mi a statisztika? 2 A statisztika alapfogalmai 3 Deskriptív statisztika A deskriptív statisztikáról általában Egyváltozós elemzés, minőségi változó Egyváltozós elemzés, mennyiségi változó Két minőségi változó kapcsolata: asszociáció Két mennyiségi változó kapcsolata: korreláció 4 Induktív statisztika A mintavételi helyzet konzekvenciái Becsléselmélet Hipotézisvizsgálat 5 Klinikai vizsgálatok
82 A deskriptív statisztikáról általában Tartalom 1 Mi a statisztika? 2 A statisztika alapfogalmai 3 Deskriptív statisztika A deskriptív statisztikáról általában Egyváltozós elemzés, minőségi változó Egyváltozós elemzés, mennyiségi változó Két minőségi változó kapcsolata: asszociáció Két mennyiségi változó kapcsolata: korreláció 4 Induktív statisztika A mintavételi helyzet konzekvenciái Becsléselmélet Hipotézisvizsgálat 5 Klinikai vizsgálatok
83 A deskriptív statisztikáról általában Mi a deskriptív statisztika? Röviden: nem törődünk a mintavételes helyzettel! A minta az univerzum, úgy vesszük mintha csak a minta lenne Tipikus feladat itt: információtömörítés, a mintában lévő információ legjobban emészthetővé tétele Trade-off a tömörítésnél: Áttekinthetőség Hűség
84 A deskriptív statisztikáról általában Mi a deskriptív statisztika? Röviden: nem törődünk a mintavételes helyzettel! A minta az univerzum, úgy vesszük mintha csak a minta lenne Tipikus feladat itt: információtömörítés, a mintában lévő információ legjobban emészthetővé tétele Trade-off a tömörítésnél: Áttekinthetőség Hűség
85 A deskriptív statisztikáról általában Mi a deskriptív statisztika? Röviden: nem törődünk a mintavételes helyzettel! A minta az univerzum, úgy vesszük mintha csak a minta lenne Tipikus feladat itt: információtömörítés, a mintában lévő információ legjobban emészthetővé tétele Trade-off a tömörítésnél: Áttekinthetőség Hűség
86 A deskriptív statisztikáról általában Mi a deskriptív statisztika? Röviden: nem törődünk a mintavételes helyzettel! A minta az univerzum, úgy vesszük mintha csak a minta lenne Tipikus feladat itt: információtömörítés, a mintában lévő információ legjobban emészthetővé tétele Trade-off a tömörítésnél: Áttekinthetőség Hűség
87 A deskriptív statisztikáról általában Az információtömörítés trade-off-ja Nyers adat: 2523, 2551, 2557, 2594, 2600, 2622,..., 2495, 2495, 2495 Tömörítések 2944,6 2944,6 ± 729,2 2944,6 (2977) ± 729,2 (1073) 2944,6 (2977) [ ] ± 729,2 (1073) Mi a cél? az eredeti információ átláthatatlan (ki mond meg bármit is 189 számból?) Az információtömörítés ugyan adatvesztés, de épp ez teszi lehetővé, hogy a fontosat észrevegyük! Egyensúlyozni kell a kettő között
88 A deskriptív statisztikáról általában Az információtömörítés trade-off-ja Nyers adat: 2523, 2551, 2557, 2594, 2600, 2622,..., 2495, 2495, 2495 Tömörítések 2944,6 2944,6 ± 729,2 2944,6 (2977) ± 729,2 (1073) 2944,6 (2977) [ ] ± 729,2 (1073) Mi a cél? az eredeti információ átláthatatlan (ki mond meg bármit is 189 számból?) Az információtömörítés ugyan adatvesztés, de épp ez teszi lehetővé, hogy a fontosat észrevegyük! Egyensúlyozni kell a kettő között
89 A deskriptív statisztikáról általában Az információtömörítés trade-off-ja Nyers adat: 2523, 2551, 2557, 2594, 2600, 2622,..., 2495, 2495, 2495 Tömörítések 2944,6 2944,6 ± 729,2 2944,6 (2977) ± 729,2 (1073) 2944,6 (2977) [ ] ± 729,2 (1073) Mi a cél? az eredeti információ átláthatatlan (ki mond meg bármit is 189 számból?) Az információtömörítés ugyan adatvesztés, de épp ez teszi lehetővé, hogy a fontosat észrevegyük! Egyensúlyozni kell a kettő között
90 A deskriptív statisztikáról általában Az információtömörítés trade-off-ja Nyers adat: 2523, 2551, 2557, 2594, 2600, 2622,..., 2495, 2495, 2495 Tömörítések 2944,6 2944,6 ± 729,2 2944,6 (2977) ± 729,2 (1073) 2944,6 (2977) [ ] ± 729,2 (1073) Mi a cél? az eredeti információ átláthatatlan (ki mond meg bármit is 189 számból?) Az információtömörítés ugyan adatvesztés, de épp ez teszi lehetővé, hogy a fontosat észrevegyük! Egyensúlyozni kell a kettő között
91 A deskriptív statisztikáról általában Az információtömörítés trade-off-ja Nyers adat: 2523, 2551, 2557, 2594, 2600, 2622,..., 2495, 2495, 2495 Tömörítések 2944,6 2944,6 ± 729,2 2944,6 (2977) ± 729,2 (1073) 2944,6 (2977) [ ] ± 729,2 (1073) Mi a cél? az eredeti információ átláthatatlan (ki mond meg bármit is 189 számból?) Az információtömörítés ugyan adatvesztés, de épp ez teszi lehetővé, hogy a fontosat észrevegyük! Egyensúlyozni kell a kettő között
92 A deskriptív statisztikáról általában Az információtömörítés trade-off-ja Nyers adat: 2523, 2551, 2557, 2594, 2600, 2622,..., 2495, 2495, 2495 Tömörítések 2944,6 2944,6 ± 729,2 2944,6 (2977) ± 729,2 (1073) 2944,6 (2977) [ ] ± 729,2 (1073) Mi a cél? az eredeti információ átláthatatlan (ki mond meg bármit is 189 számból?) Az információtömörítés ugyan adatvesztés, de épp ez teszi lehetővé, hogy a fontosat észrevegyük! Egyensúlyozni kell a kettő között
93 A deskriptív statisztikáról általában Az információtömörítés trade-off-ja Nyers adat: 2523, 2551, 2557, 2594, 2600, 2622,..., 2495, 2495, 2495 Tömörítések 2944,6 2944,6 ± 729,2 2944,6 (2977) ± 729,2 (1073) 2944,6 (2977) [ ] ± 729,2 (1073) Mi a cél? az eredeti információ átláthatatlan (ki mond meg bármit is 189 számból?) Az információtömörítés ugyan adatvesztés, de épp ez teszi lehetővé, hogy a fontosat észrevegyük! Egyensúlyozni kell a kettő között
94 A deskriptív statisztikáról általában Az információtömörítés trade-off-ja Nyers adat: 2523, 2551, 2557, 2594, 2600, 2622,..., 2495, 2495, 2495 Tömörítések 2944,6 2944,6 ± 729,2 2944,6 (2977) ± 729,2 (1073) 2944,6 (2977) [ ] ± 729,2 (1073) Mi a cél? az eredeti információ átláthatatlan (ki mond meg bármit is 189 számból?) Az információtömörítés ugyan adatvesztés, de épp ez teszi lehetővé, hogy a fontosat észrevegyük! Egyensúlyozni kell a kettő között
95 A deskriptív statisztikáról általában Az információtömörítés trade-off-ja Nyers adat: 2523, 2551, 2557, 2594, 2600, 2622,..., 2495, 2495, 2495 Tömörítések 2944,6 2944,6 ± 729,2 2944,6 (2977) ± 729,2 (1073) 2944,6 (2977) [ ] ± 729,2 (1073) Mi a cél? az eredeti információ átláthatatlan (ki mond meg bármit is 189 számból?) Az információtömörítés ugyan adatvesztés, de épp ez teszi lehetővé, hogy a fontosat észrevegyük! Egyensúlyozni kell a kettő között
96 A deskriptív statisztikáról általában Exploratív adatelemzés Grafikus technikák előnyei Az emberi agy különösen jó az ilyen (vizuális) információk feldolgozásában Ügyes vizualizáció sokat érhet! There is no excuse for failing to plot and look! (JW Tukey)
97 A deskriptív statisztikáról általában Exploratív adatelemzés Grafikus technikák előnyei Az emberi agy különösen jó az ilyen (vizuális) információk feldolgozásában Ügyes vizualizáció sokat érhet! There is no excuse for failing to plot and look! (JW Tukey)
98 A deskriptív statisztikáról általában Exploratív adatelemzés Grafikus technikák előnyei Az emberi agy különösen jó az ilyen (vizuális) információk feldolgozásában Ügyes vizualizáció sokat érhet! There is no excuse for failing to plot and look! (JW Tukey)
99 A deskriptív statisztikáról általában Exploratív adatelemzés Grafikus technikák előnyei Az emberi agy különösen jó az ilyen (vizuális) információk feldolgozásában Ügyes vizualizáció sokat érhet! There is no excuse for failing to plot and look! (JW Tukey)
100 A deskriptív statisztikáról általában A deskriptív statisztika dimenziói Eszköze szerint Analitikus (mutatószám) Grafikus (ábra) Változók száma szerint Egyváltozós Többváltozós (Sokváltozós) A változók mérési skálája szerint Minőségi Mennyiségi (Vegyes)
101 A deskriptív statisztikáról általában A deskriptív statisztika dimenziói Eszköze szerint Analitikus (mutatószám) Grafikus (ábra) Változók száma szerint Egyváltozós Többváltozós (Sokváltozós) A változók mérési skálája szerint Minőségi Mennyiségi (Vegyes)
102 A deskriptív statisztikáról általában A deskriptív statisztika dimenziói Eszköze szerint Analitikus (mutatószám) Grafikus (ábra) Változók száma szerint Egyváltozós Többváltozós (Sokváltozós) A változók mérési skálája szerint Minőségi Mennyiségi (Vegyes)
103 A deskriptív statisztikáról általában A deskriptív statisztika dimenziói Eszköze szerint Analitikus (mutatószám) Grafikus (ábra) Változók száma szerint Egyváltozós Többváltozós (Sokváltozós) A változók mérési skálája szerint Minőségi Mennyiségi (Vegyes)
104 A deskriptív statisztikáról általában A deskriptív statisztika dimenziói Eszköze szerint Analitikus (mutatószám) Grafikus (ábra) Változók száma szerint Egyváltozós Többváltozós (Sokváltozós) A változók mérési skálája szerint Minőségi Mennyiségi (Vegyes)
105 A deskriptív statisztikáról általában A deskriptív statisztika dimenziói Eszköze szerint Analitikus (mutatószám) Grafikus (ábra) Változók száma szerint Egyváltozós Többváltozós (Sokváltozós) A változók mérési skálája szerint Minőségi Mennyiségi (Vegyes)
106 Egyváltozós elemzés, minőségi változó Tartalom 1 Mi a statisztika? 2 A statisztika alapfogalmai 3 Deskriptív statisztika A deskriptív statisztikáról általában Egyváltozós elemzés, minőségi változó Egyváltozós elemzés, mennyiségi változó Két minőségi változó kapcsolata: asszociáció Két mennyiségi változó kapcsolata: korreláció 4 Induktív statisztika A mintavételi helyzet konzekvenciái Becsléselmélet Hipotézisvizsgálat 5 Klinikai vizsgálatok
107 Egyváltozós elemzés, minőségi változó Példa race (rassz): low age lwt race smoke ptl ht ui ftv bwt
108 Egyváltozós elemzés, minőségi változó Analitikus eszközök Gyakorisági sor: Kategória f i g i Kaukázusi 96 0,508 Afroamerikai 26 0,138 Egyéb 67 0,354 Összesen 189 1,000 (Istenigazából semmilyen adatvesztést nem jelent most)
109 Egyváltozós elemzés, minőségi változó Analitikus eszközök Gyakorisági sor: Kategória f i g i Kaukázusi 96 0,508 Afroamerikai 26 0,138 Egyéb 67 0,354 Összesen 189 1,000 (Istenigazából semmilyen adatvesztést nem jelent most)
110 Egyváltozós elemzés, minőségi változó Analitikus eszközök Módusz: leggyakoribb kimenet (Mo = arg max i f i ); ez már kompromisszum! Ordinálisnál: van értelme az ún. kumulálásnak is (elvileg mediánról is lehetne beszélni, inkább máshol vezetjük be) Ezen kívül más mutatónak nincs sok értelme
111 Egyváltozós elemzés, minőségi változó Analitikus eszközök Módusz: leggyakoribb kimenet (Mo = arg max i f i ); ez már kompromisszum! Ordinálisnál: van értelme az ún. kumulálásnak is (elvileg mediánról is lehetne beszélni, inkább máshol vezetjük be) Ezen kívül más mutatónak nincs sok értelme
112 Egyváltozós elemzés, minőségi változó Analitikus eszközök Módusz: leggyakoribb kimenet (Mo = arg max i f i ); ez már kompromisszum! Ordinálisnál: van értelme az ún. kumulálásnak is (elvileg mediánról is lehetne beszélni, inkább máshol vezetjük be) Ezen kívül más mutatónak nincs sok értelme
113 Egyváltozós elemzés, minőségi változó Grafikus eszközök: oszlopdiagram Oszlopdiagram Gyakoriság [fő] Kaukázusi Afroamerikai Egyéb Rassz
114 Egyváltozós elemzés, minőségi változó Grafikus eszközök: tortadiagram Kördiagram Kaukázusi 50.8 % Afroamerikai 13.8 % Egyéb 35.4 % Rassz
115 Egyváltozós elemzés, minőségi változó Grafikus eszközök Melyik jobb? Miért? (Van rá tudományos válasz!)
116 Egyváltozós elemzés, minőségi változó Grafikus eszközök Melyik jobb? Miért? (Van rá tudományos válasz!) Az emberi szem sokkal jobban érzékeli a lineáris méreteket, mint a relatív területeket
117 Egyváltozós elemzés, mennyiségi változó Tartalom 1 Mi a statisztika? 2 A statisztika alapfogalmai 3 Deskriptív statisztika A deskriptív statisztikáról általában Egyváltozós elemzés, minőségi változó Egyváltozós elemzés, mennyiségi változó Két minőségi változó kapcsolata: asszociáció Két mennyiségi változó kapcsolata: korreláció 4 Induktív statisztika A mintavételi helyzet konzekvenciái Becsléselmélet Hipotézisvizsgálat 5 Klinikai vizsgálatok
118 Egyváltozós elemzés, mennyiségi változó Példa bwt (születési tömeg): low age lwt race smoke ptl ht ui ftv bwt
119 Egyváltozós elemzés, mennyiségi változó Analitikus eszközök: osztályközös gyakorisági sor I. Szokásos gyakorisági sor már nem készíthető (könnyen lehet, hogy minden számból csak 1 lesz!) Megoldás az osztályközös gyakorisági sor, például: C i0 C i1 f i g i f i g i , , , , , , , , , , , , , , , , , ,000 Összesen 189 1,000
120 Egyváltozós elemzés, mennyiségi változó Analitikus eszközök: osztályközös gyakorisági sor I. Szokásos gyakorisági sor már nem készíthető (könnyen lehet, hogy minden számból csak 1 lesz!) Megoldás az osztályközös gyakorisági sor, például: C i0 C i1 f i g i f i g i , , , , , , , , , , , , , , , , , ,000 Összesen 189 1,000
121 Egyváltozós elemzés, mennyiségi változó Analitikus eszközök: osztályközös gyakorisági sor II. De vigyázat, itt már van információvesztés! kérdés, hogy hogyan vesszük fel az osztályközöket
122 Egyváltozós elemzés, mennyiségi változó Analitikus eszközök: a centrális tendencia mutatói I. Átlag, jele x: az a szám, mellyel valamennyi megfigyelési egységnél helyettesítve a változó tényleges értékét, az értékösszeg változatlan maradna, azaz x = S n = n i=1 x i n Akkor van értelme, ha a változónál az összeg bír tárgyi értelemmel! (Ha a szorzat, akkor a mértani átlag adódik.) Előnye, hogy közismert tartalmú, jól értelmezhető, hátránya, hogy nem robusztus (outlier-ekre érzékeny trimmelt átlag)
123 Egyváltozós elemzés, mennyiségi változó Analitikus eszközök: a centrális tendencia mutatói I. Átlag, jele x: az a szám, mellyel valamennyi megfigyelési egységnél helyettesítve a változó tényleges értékét, az értékösszeg változatlan maradna, azaz x = S n = n i=1 x i n Akkor van értelme, ha a változónál az összeg bír tárgyi értelemmel! (Ha a szorzat, akkor a mértani átlag adódik.) Előnye, hogy közismert tartalmú, jól értelmezhető, hátránya, hogy nem robusztus (outlier-ekre érzékeny trimmelt átlag)
124 Egyváltozós elemzés, mennyiségi változó Analitikus eszközök: a centrális tendencia mutatói I. Átlag, jele x: az a szám, mellyel valamennyi megfigyelési egységnél helyettesítve a változó tényleges értékét, az értékösszeg változatlan maradna, azaz x = S n = n i=1 x i n Akkor van értelme, ha a változónál az összeg bír tárgyi értelemmel! (Ha a szorzat, akkor a mértani átlag adódik.) Előnye, hogy közismert tartalmú, jól értelmezhető, hátránya, hogy nem robusztus (outlier-ekre érzékeny trimmelt átlag)
125 Egyváltozós elemzés, mennyiségi változó Analitikus eszközök: a centrális tendencia mutatói II. Medián, jele Me: az a szám, melyre teljesül, hogy a megfigyelési egységek fele nála kisebb, fele nála nagyobb, tehát a középső elem (páratlan elemszámnál egyértelmű, párosnál legyen mondjuk a két középső átlaga) Előnye, hogy robusztus, hátránya, hogy kevésbé közismert p-kvantilis: a medián általánosítása, a minta p-ed része alatta, (1 p)-ed része felette van Nevezetes kvantilisek: kvartilisek (negyedelőpontok: Q 1, Q 2 Me, Q 3 ), decilisek (tizedelőpontok: D 1, D 2,..., D 9 ), percentilisek (századolópontok: P 1, P 2,..., P 100 )
126 Egyváltozós elemzés, mennyiségi változó Analitikus eszközök: a centrális tendencia mutatói II. Medián, jele Me: az a szám, melyre teljesül, hogy a megfigyelési egységek fele nála kisebb, fele nála nagyobb, tehát a középső elem (páratlan elemszámnál egyértelmű, párosnál legyen mondjuk a két középső átlaga) Előnye, hogy robusztus, hátránya, hogy kevésbé közismert p-kvantilis: a medián általánosítása, a minta p-ed része alatta, (1 p)-ed része felette van Nevezetes kvantilisek: kvartilisek (negyedelőpontok: Q 1, Q 2 Me, Q 3 ), decilisek (tizedelőpontok: D 1, D 2,..., D 9 ), percentilisek (századolópontok: P 1, P 2,..., P 100 )
127 Egyváltozós elemzés, mennyiségi változó Analitikus eszközök: a centrális tendencia mutatói II. Medián, jele Me: az a szám, melyre teljesül, hogy a megfigyelési egységek fele nála kisebb, fele nála nagyobb, tehát a középső elem (páratlan elemszámnál egyértelmű, párosnál legyen mondjuk a két középső átlaga) Előnye, hogy robusztus, hátránya, hogy kevésbé közismert p-kvantilis: a medián általánosítása, a minta p-ed része alatta, (1 p)-ed része felette van Nevezetes kvantilisek: kvartilisek (negyedelőpontok: Q 1, Q 2 Me, Q 3 ), decilisek (tizedelőpontok: D 1, D 2,..., D 9 ), percentilisek (századolópontok: P 1, P 2,..., P 100 )
128 Egyváltozós elemzés, mennyiségi változó Analitikus eszközök: a centrális tendencia mutatói II. Medián, jele Me: az a szám, melyre teljesül, hogy a megfigyelési egységek fele nála kisebb, fele nála nagyobb, tehát a középső elem (páratlan elemszámnál egyértelmű, párosnál legyen mondjuk a két középső átlaga) Előnye, hogy robusztus, hátránya, hogy kevésbé közismert p-kvantilis: a medián általánosítása, a minta p-ed része alatta, (1 p)-ed része felette van Nevezetes kvantilisek: kvartilisek (negyedelőpontok: Q 1, Q 2 Me, Q 3 ), decilisek (tizedelőpontok: D 1, D 2,..., D 9 ), percentilisek (századolópontok: P 1, P 2,..., P 100 )
129 Egyváltozós elemzés, mennyiségi változó Analitikus eszközök: a szóródás mutatói Minimum, maximum: a minta legnagyobb és legkisebb eleme Terjedelem, jele R: a maximum és a minimum különbsége Szórás, jele σ x : az átlagtól vett átlagos eltérés, négyzetes átlagot használva n i=1 σ x = (x i x) 2 n Előnye, hogy közismert tartalmú, hátránya, hogy nem robusztus (duplán nem) Interkvartilis terjedelem, jele IQR: a felső és alsó kvartilis különbsége (IQR = Q 3 Q 1 ); előnye, hogy robusztus ( xi MAD: MAD = Me Me (x) )
130 Egyváltozós elemzés, mennyiségi változó Analitikus eszközök: a szóródás mutatói Minimum, maximum: a minta legnagyobb és legkisebb eleme Terjedelem, jele R: a maximum és a minimum különbsége Szórás, jele σ x : az átlagtól vett átlagos eltérés, négyzetes átlagot használva n i=1 σ x = (x i x) 2 n Előnye, hogy közismert tartalmú, hátránya, hogy nem robusztus (duplán nem) Interkvartilis terjedelem, jele IQR: a felső és alsó kvartilis különbsége (IQR = Q 3 Q 1 ); előnye, hogy robusztus ( xi MAD: MAD = Me Me (x) )
131 Egyváltozós elemzés, mennyiségi változó Analitikus eszközök: a szóródás mutatói Minimum, maximum: a minta legnagyobb és legkisebb eleme Terjedelem, jele R: a maximum és a minimum különbsége Szórás, jele σ x : az átlagtól vett átlagos eltérés, négyzetes átlagot használva n i=1 σ x = (x i x) 2 n Előnye, hogy közismert tartalmú, hátránya, hogy nem robusztus (duplán nem) Interkvartilis terjedelem, jele IQR: a felső és alsó kvartilis különbsége (IQR = Q 3 Q 1 ); előnye, hogy robusztus ( xi MAD: MAD = Me Me (x) )
132 Egyváltozós elemzés, mennyiségi változó Analitikus eszközök: a szóródás mutatói Minimum, maximum: a minta legnagyobb és legkisebb eleme Terjedelem, jele R: a maximum és a minimum különbsége Szórás, jele σ x : az átlagtól vett átlagos eltérés, négyzetes átlagot használva n i=1 σ x = (x i x) 2 n Előnye, hogy közismert tartalmú, hátránya, hogy nem robusztus (duplán nem) Interkvartilis terjedelem, jele IQR: a felső és alsó kvartilis különbsége (IQR = Q 3 Q 1 ); előnye, hogy robusztus ( xi MAD: MAD = Me Me (x) )
133 Egyváltozós elemzés, mennyiségi változó Analitikus eszközök: a szóródás mutatói Minimum, maximum: a minta legnagyobb és legkisebb eleme Terjedelem, jele R: a maximum és a minimum különbsége Szórás, jele σ x : az átlagtól vett átlagos eltérés, négyzetes átlagot használva n i=1 σ x = (x i x) 2 n Előnye, hogy közismert tartalmú, hátránya, hogy nem robusztus (duplán nem) Interkvartilis terjedelem, jele IQR: a felső és alsó kvartilis különbsége (IQR = Q 3 Q 1 ); előnye, hogy robusztus ( xi MAD: MAD = Me Me (x) )
134 Egyváltozós elemzés, mennyiségi változó Analitikus eszközök: a szóródás mutatói Minimum, maximum: a minta legnagyobb és legkisebb eleme Terjedelem, jele R: a maximum és a minimum különbsége Szórás, jele σ x : az átlagtól vett átlagos eltérés, négyzetes átlagot használva n i=1 σ x = (x i x) 2 n Előnye, hogy közismert tartalmú, hátránya, hogy nem robusztus (duplán nem) Interkvartilis terjedelem, jele IQR: a felső és alsó kvartilis különbsége (IQR = Q 3 Q 1 ); előnye, hogy robusztus ( xi MAD: MAD = Me Me (x) )
135 Egyváltozós elemzés, mennyiségi változó Analitikus eszközök: alakmutatók Még finomabb leírása az eloszlásnak Szimmetria/ferdeség Csúcsosság
136 Egyváltozós elemzés, mennyiségi változó Analitikus eszközök: alakmutatók Még finomabb leírása az eloszlásnak Szimmetria/ferdeség Csúcsosság
137 Egyváltozós elemzés, mennyiségi változó Analitikus eszközök: alakmutatók Még finomabb leírása az eloszlásnak Szimmetria/ferdeség Csúcsosság
138 Egyváltozós elemzés, mennyiségi változó Grafikus eszközök: hisztogram A születési tömegek hisztogramja Sűrűség 0e+00 1e-04 2e-04 3e-04 4e-04 5e Születési tömeg [g]
139 Egyváltozós elemzés, mennyiségi változó Grafikus eszközök: hisztogram A számegyenest diszjunkt intervallumokra osztjuk, és megszámoljuk, hogy az egyes intervallumokba hány megfigyelési egység esik f i n h i (Mintha az osztályközös gyakorisági sorból gyártanánk oszlopdiagramot csak rések nélkül) A hisztogram hatalmas előnye, hogy hihetetlenül szemléletes: az eloszlás rengeteg fontos jellemzője ránézésre leolvasható (A hisztogram a háttéreloszlás sűrűségfüggvényét fogja becsülni)
140 Egyváltozós elemzés, mennyiségi változó Grafikus eszközök: hisztogram A számegyenest diszjunkt intervallumokra osztjuk, és megszámoljuk, hogy az egyes intervallumokba hány megfigyelési egység esik f i n h i (Mintha az osztályközös gyakorisági sorból gyártanánk oszlopdiagramot csak rések nélkül) A hisztogram hatalmas előnye, hogy hihetetlenül szemléletes: az eloszlás rengeteg fontos jellemzője ránézésre leolvasható (A hisztogram a háttéreloszlás sűrűségfüggvényét fogja becsülni)
141 Egyváltozós elemzés, mennyiségi változó Grafikus eszközök: hisztogram A számegyenest diszjunkt intervallumokra osztjuk, és megszámoljuk, hogy az egyes intervallumokba hány megfigyelési egység esik f i n h i (Mintha az osztályközös gyakorisági sorból gyártanánk oszlopdiagramot csak rések nélkül) A hisztogram hatalmas előnye, hogy hihetetlenül szemléletes: az eloszlás rengeteg fontos jellemzője ránézésre leolvasható (A hisztogram a háttéreloszlás sűrűségfüggvényét fogja becsülni)
142 Egyváltozós elemzés, mennyiségi változó Grafikus eszközök: hisztogram A számegyenest diszjunkt intervallumokra osztjuk, és megszámoljuk, hogy az egyes intervallumokba hány megfigyelési egység esik f i n h i (Mintha az osztályközös gyakorisági sorból gyártanánk oszlopdiagramot csak rések nélkül) A hisztogram hatalmas előnye, hogy hihetetlenül szemléletes: az eloszlás rengeteg fontos jellemzője ránézésre leolvasható (A hisztogram a háttéreloszlás sűrűségfüggvényét fogja becsülni)
143 Egyváltozós elemzés, mennyiségi változó Grafikus eszközök: hisztogram Hátránya, hogy érzékeny az intervallumok határainak megválasztására: A születési tömegek hisztogramja A születési tömegek hisztogramja A születési tömegek hisztogramja Sűrűség 0e+00 1e-04 2e-04 3e-04 4e-04 5e-04 6e-04 Sűrűség 0e+00 1e-04 2e-04 3e-04 4e-04 5e-04 6e-04 Sűrűség 0e+00 1e-04 2e-04 3e-04 4e-04 5e-04 6e Születési tömeg [g] Születési tömeg [g] Születési tömeg [g]
144 Egyváltozós elemzés, mennyiségi változó Grafikus eszközök: magfüggvényes becslő A születési tömegek magfüggvényes sűrűségbecslése Sűrűség 0e+00 1e-04 2e-04 3e-04 4e-04 5e Születési tömeg [g]
145 Egyváltozós elemzés, mennyiségi változó Grafikus eszközök: magfüggvényes becslő A mintapontokat koncentrált helyett valódi eloszlással helyettesíti Kevésbé paraméterérzékeny (de azért ezen is kell paraméterezni)
146 Egyváltozós elemzés, mennyiségi változó Grafikus eszközök: magfüggvényes becslő A mintapontokat koncentrált helyett valódi eloszlással helyettesíti Kevésbé paraméterérzékeny (de azért ezen is kell paraméterezni)
147 Egyváltozós elemzés, mennyiségi változó Grafikus eszközök: boxplot A születési tömegek boxplot-ja Születési tömeg [g]
148 Egyváltozós elemzés, mennyiségi változó Grafikus eszközök: boxplot Doboz Q 1 -től Q 3 -ig, benne megjelölve Me Antennák vagy a minimumig és a maximumig nyúlnak ki, vagy a legtávolabbi elemig, ami nincs messzebb a Me-től mint az IQR α-szorosa (tipikusan α = 1,5) Ez utóbbi egyszerű outlier-keresést is lehetővé tesz Nagy előnye, hogy rendkívül kompakt (gondoljunk arra, ha pl. rasszok szerint akarjuk ábrázolni a születési tömeg eloszlását), és robusztus is
149 Egyváltozós elemzés, mennyiségi változó Grafikus eszközök: boxplot Doboz Q 1 -től Q 3 -ig, benne megjelölve Me Antennák vagy a minimumig és a maximumig nyúlnak ki, vagy a legtávolabbi elemig, ami nincs messzebb a Me-től mint az IQR α-szorosa (tipikusan α = 1,5) Ez utóbbi egyszerű outlier-keresést is lehetővé tesz Nagy előnye, hogy rendkívül kompakt (gondoljunk arra, ha pl. rasszok szerint akarjuk ábrázolni a születési tömeg eloszlását), és robusztus is
150 Egyváltozós elemzés, mennyiségi változó Grafikus eszközök: boxplot Doboz Q 1 -től Q 3 -ig, benne megjelölve Me Antennák vagy a minimumig és a maximumig nyúlnak ki, vagy a legtávolabbi elemig, ami nincs messzebb a Me-től mint az IQR α-szorosa (tipikusan α = 1,5) Ez utóbbi egyszerű outlier-keresést is lehetővé tesz Nagy előnye, hogy rendkívül kompakt (gondoljunk arra, ha pl. rasszok szerint akarjuk ábrázolni a születési tömeg eloszlását), és robusztus is
151 Egyváltozós elemzés, mennyiségi változó Grafikus eszközök: boxplot Doboz Q 1 -től Q 3 -ig, benne megjelölve Me Antennák vagy a minimumig és a maximumig nyúlnak ki, vagy a legtávolabbi elemig, ami nincs messzebb a Me-től mint az IQR α-szorosa (tipikusan α = 1,5) Ez utóbbi egyszerű outlier-keresést is lehetővé tesz Nagy előnye, hogy rendkívül kompakt (gondoljunk arra, ha pl. rasszok szerint akarjuk ábrázolni a születési tömeg eloszlását), és robusztus is
152 Két minőségi változó kapcsolata: asszociáció Tartalom 1 Mi a statisztika? 2 A statisztika alapfogalmai 3 Deskriptív statisztika A deskriptív statisztikáról általában Egyváltozós elemzés, minőségi változó Egyváltozós elemzés, mennyiségi változó Két minőségi változó kapcsolata: asszociáció Két mennyiségi változó kapcsolata: korreláció 4 Induktív statisztika A mintavételi helyzet konzekvenciái Becsléselmélet Hipotézisvizsgálat 5 Klinikai vizsgálatok
153 Két minőségi változó kapcsolata: asszociáció Példa Két minőségi változó kapcsolatát asszociációnak nevezzük race (rassz) és ui (irritábilis méh): low age lwt race smoke ptl ht ui ftv bwt
154 Két minőségi változó kapcsolata: asszociáció Példa Két minőségi változó kapcsolatát asszociációnak nevezzük race (rassz) és ui (irritábilis méh): low age lwt race smoke ptl ht ui ftv bwt
155 Két minőségi változó kapcsolata: asszociáció Analitikus eszközök: kontingenciatábla Ez is hordoz minden információt: Irritábilis méh Rassz Nem Igen Összesen Kaukázusi Afroamerikai Egyéb Összesen Kapcsolat értelmezése: viszonyítás a függetlenséghez (mennyi információt jelent a sor szempontjából, ha tudjuk, hogy az alany melyik oszlopba tartozik? és viszont) Mutatók: χ 2, Cramer-V stb. stb.; nagyon számítanak a feltevések
156 Két minőségi változó kapcsolata: asszociáció Analitikus eszközök: kontingenciatábla Ez is hordoz minden információt: Irritábilis méh Rassz Nem Igen Összesen Kaukázusi Afroamerikai Egyéb Összesen Kapcsolat értelmezése: viszonyítás a függetlenséghez (mennyi információt jelent a sor szempontjából, ha tudjuk, hogy az alany melyik oszlopba tartozik? és viszont) Mutatók: χ 2, Cramer-V stb. stb.; nagyon számítanak a feltevések
157 Két minőségi változó kapcsolata: asszociáció Analitikus eszközök: kontingenciatábla Ez is hordoz minden információt: Irritábilis méh Rassz Nem Igen Összesen Kaukázusi Afroamerikai Egyéb Összesen Kapcsolat értelmezése: viszonyítás a függetlenséghez (mennyi információt jelent a sor szempontjából, ha tudjuk, hogy az alany melyik oszlopba tartozik? és viszont) Mutatók: χ 2, Cramer-V stb. stb.; nagyon számítanak a feltevések
158 Két minőségi változó kapcsolata: asszociáció Grafikus eszközök Esetleg mozaikábra vagy asszociációs ábra nem túl gyakori Vetületi megoszlások vagy feltételes megoszlások ábrázolhatóak oszlop-, illetve kördiagramon
159 Két minőségi változó kapcsolata: asszociáció Grafikus eszközök Esetleg mozaikábra vagy asszociációs ábra nem túl gyakori Vetületi megoszlások vagy feltételes megoszlások ábrázolhatóak oszlop-, illetve kördiagramon
160 Két mennyiségi változó kapcsolata: korreláció Tartalom 1 Mi a statisztika? 2 A statisztika alapfogalmai 3 Deskriptív statisztika A deskriptív statisztikáról általában Egyváltozós elemzés, minőségi változó Egyváltozós elemzés, mennyiségi változó Két minőségi változó kapcsolata: asszociáció Két mennyiségi változó kapcsolata: korreláció 4 Induktív statisztika A mintavételi helyzet konzekvenciái Becsléselmélet Hipotézisvizsgálat 5 Klinikai vizsgálatok
161 Két mennyiségi változó kapcsolata: korreláció Példa Két mennyiségi változó kapcsolatát korreláció nevezzük lwt (anyai testtömeg) és bwt (születési tömeg): low age lwt race smoke ptl ht ui ftv bwt
162 Két mennyiségi változó kapcsolata: korreláció Példa Két mennyiségi változó kapcsolatát korreláció nevezzük lwt (anyai testtömeg) és bwt (születési tömeg): low age lwt race smoke ptl ht ui ftv bwt
163 Két mennyiségi változó kapcsolata: korreláció Grafikus eszközök: szóródási diagram Ez minden információt hordoz: Az anya és az újszülött testtömegének szóródási diagramja Születési tömeg [g] Anya testtömege (UM) [font]
164 Két mennyiségi változó kapcsolata: korreláció Analitikus eszközök: korrelációs együttható Korrelációs együttható, jele r: a két változó közti sztochasztikus kapcsolat mérőszáma 1 n [ n i=1 (xi x) (y i y) ] r x,y = σ x σ y A kapcsolat irányát és szorosságát mutatja
165 Két mennyiségi változó kapcsolata: korreláció Analitikus eszközök: korrelációs együttható Korrelációs együttható, jele r: a két változó közti sztochasztikus kapcsolat mérőszáma 1 n [ n i=1 (xi x) (y i y) ] r x,y = σ x σ y A kapcsolat irányát és szorosságát mutatja
166 Két mennyiségi változó kapcsolata: korreláció Analitikus eszközök: korrelációs együttható A kapcsolat iránya és szorossága szemléletesen: corr = -1 corr = corr = -0.7 corr = -0.2 corr = 0 corr = 0.2 corr = 0.7 corr = 0.99 corr = 1 y y y y y y y y y x x x x x x x x x
167 Két mennyiségi változó kapcsolata: korreláció Analitikus eszközök: korrelációs együttható De vigyázzunk (Anscombe-kvartett): y y x x2 y y x x4
168 Tartalom 1 Mi a statisztika? 2 A statisztika alapfogalmai 3 Deskriptív statisztika A deskriptív statisztikáról általában Egyváltozós elemzés, minőségi változó Egyváltozós elemzés, mennyiségi változó Két minőségi változó kapcsolata: asszociáció Két mennyiségi változó kapcsolata: korreláció 4 Induktív statisztika A mintavételi helyzet konzekvenciái Becsléselmélet Hipotézisvizsgálat 5 Klinikai vizsgálatok
169 A mintavételi helyzet konzekvenciái Tartalom 1 Mi a statisztika? 2 A statisztika alapfogalmai 3 Deskriptív statisztika A deskriptív statisztikáról általában Egyváltozós elemzés, minőségi változó Egyváltozós elemzés, mennyiségi változó Két minőségi változó kapcsolata: asszociáció Két mennyiségi változó kapcsolata: korreláció 4 Induktív statisztika A mintavételi helyzet konzekvenciái Becsléselmélet Hipotézisvizsgálat 5 Klinikai vizsgálatok
170 A mintavételi helyzet konzekvenciái Emlékeztetőül Nagyon sok esetben technikai okokból, vagy elvileg is lehetetlen a teljes sokaság megfigyelése Csak egy részét, a mintát ismerjük És itt jön a kulcsprobléma: mi mégis a sokaságról akarunk nyilatkozni! Lehet egyáltalán? Hogyan? Biztosat már nem tudunk mondani... de valószínűségi állítást igen!
171 A mintavételi helyzet konzekvenciái Emlékeztetőül Nagyon sok esetben technikai okokból, vagy elvileg is lehetetlen a teljes sokaság megfigyelése Csak egy részét, a mintát ismerjük És itt jön a kulcsprobléma: mi mégis a sokaságról akarunk nyilatkozni! Lehet egyáltalán? Hogyan? Biztosat már nem tudunk mondani... de valószínűségi állítást igen!
172 A mintavételi helyzet konzekvenciái Emlékeztetőül Nagyon sok esetben technikai okokból, vagy elvileg is lehetetlen a teljes sokaság megfigyelése Csak egy részét, a mintát ismerjük És itt jön a kulcsprobléma: mi mégis a sokaságról akarunk nyilatkozni! Lehet egyáltalán? Hogyan? Biztosat már nem tudunk mondani... de valószínűségi állítást igen!
173 A mintavételi helyzet konzekvenciái Emlékeztetőül Nagyon sok esetben technikai okokból, vagy elvileg is lehetetlen a teljes sokaság megfigyelése Csak egy részét, a mintát ismerjük És itt jön a kulcsprobléma: mi mégis a sokaságról akarunk nyilatkozni! Lehet egyáltalán? Hogyan? Biztosat már nem tudunk mondani... de valószínűségi állítást igen!
174 A mintavételi helyzet konzekvenciái Emlékeztetőül Nagyon sok esetben technikai okokból, vagy elvileg is lehetetlen a teljes sokaság megfigyelése Csak egy részét, a mintát ismerjük És itt jön a kulcsprobléma: mi mégis a sokaságról akarunk nyilatkozni! Lehet egyáltalán? Hogyan? Biztosat már nem tudunk mondani... de valószínűségi állítást igen!
175 A mintavételi helyzet konzekvenciái Mintavételi ingadozás Ha csak a sokaság egy részét (a mintát) ismerjük, akkor minden belőle számolt jellemző két dologtól fog függeni 1 a jellemző sokaságbeli értékétől 2 attól, hogy konkrétan hogyan választottuk ki a mintát Mi értelemszerűen az elsőre vagyunk kíváncsiak... csakhogy a kikerülhetetlen második ( pont milyen mintát vettünk ) azt fogja okozni, hogy minden eredményünk mintáról-mintára változni fog A szerencse: ez az ún. mintavételi ingadozás követ valószínűségszámítási törvényeket, így valószínűségi állításokat meg tudunk fogalmazni! Hibázhatunk, de ennek természetéről tudunk nyilatkozni
176 A mintavételi helyzet konzekvenciái Mintavételi ingadozás Ha csak a sokaság egy részét (a mintát) ismerjük, akkor minden belőle számolt jellemző két dologtól fog függeni 1 a jellemző sokaságbeli értékétől 2 attól, hogy konkrétan hogyan választottuk ki a mintát Mi értelemszerűen az elsőre vagyunk kíváncsiak... csakhogy a kikerülhetetlen második ( pont milyen mintát vettünk ) azt fogja okozni, hogy minden eredményünk mintáról-mintára változni fog A szerencse: ez az ún. mintavételi ingadozás követ valószínűségszámítási törvényeket, így valószínűségi állításokat meg tudunk fogalmazni! Hibázhatunk, de ennek természetéről tudunk nyilatkozni
177 A mintavételi helyzet konzekvenciái Mintavételi ingadozás Ha csak a sokaság egy részét (a mintát) ismerjük, akkor minden belőle számolt jellemző két dologtól fog függeni 1 a jellemző sokaságbeli értékétől 2 attól, hogy konkrétan hogyan választottuk ki a mintát Mi értelemszerűen az elsőre vagyunk kíváncsiak... csakhogy a kikerülhetetlen második ( pont milyen mintát vettünk ) azt fogja okozni, hogy minden eredményünk mintáról-mintára változni fog A szerencse: ez az ún. mintavételi ingadozás követ valószínűségszámítási törvényeket, így valószínűségi állításokat meg tudunk fogalmazni! Hibázhatunk, de ennek természetéről tudunk nyilatkozni
178 A mintavételi helyzet konzekvenciái Mintavételi ingadozás Ha csak a sokaság egy részét (a mintát) ismerjük, akkor minden belőle számolt jellemző két dologtól fog függeni 1 a jellemző sokaságbeli értékétől 2 attól, hogy konkrétan hogyan választottuk ki a mintát Mi értelemszerűen az elsőre vagyunk kíváncsiak... csakhogy a kikerülhetetlen második ( pont milyen mintát vettünk ) azt fogja okozni, hogy minden eredményünk mintáról-mintára változni fog A szerencse: ez az ún. mintavételi ingadozás követ valószínűségszámítási törvényeket, így valószínűségi állításokat meg tudunk fogalmazni! Hibázhatunk, de ennek természetéről tudunk nyilatkozni
179 A mintavételi helyzet konzekvenciái Mintavételi ingadozás Ha csak a sokaság egy részét (a mintát) ismerjük, akkor minden belőle számolt jellemző két dologtól fog függeni 1 a jellemző sokaságbeli értékétől 2 attól, hogy konkrétan hogyan választottuk ki a mintát Mi értelemszerűen az elsőre vagyunk kíváncsiak... csakhogy a kikerülhetetlen második ( pont milyen mintát vettünk ) azt fogja okozni, hogy minden eredményünk mintáról-mintára változni fog A szerencse: ez az ún. mintavételi ingadozás követ valószínűségszámítási törvényeket, így valószínűségi állításokat meg tudunk fogalmazni! Hibázhatunk, de ennek természetéről tudunk nyilatkozni
180 A mintavételi helyzet konzekvenciái Mintavételi ingadozás Ha csak a sokaság egy részét (a mintát) ismerjük, akkor minden belőle számolt jellemző két dologtól fog függeni 1 a jellemző sokaságbeli értékétől 2 attól, hogy konkrétan hogyan választottuk ki a mintát Mi értelemszerűen az elsőre vagyunk kíváncsiak... csakhogy a kikerülhetetlen második ( pont milyen mintát vettünk ) azt fogja okozni, hogy minden eredményünk mintáról-mintára változni fog A szerencse: ez az ún. mintavételi ingadozás követ valószínűségszámítási törvényeket, így valószínűségi állításokat meg tudunk fogalmazni! Hibázhatunk, de ennek természetéről tudunk nyilatkozni
181 A mintavételi helyzet konzekvenciái Mintavételi ingadozás Ha csak a sokaság egy részét (a mintát) ismerjük, akkor minden belőle számolt jellemző két dologtól fog függeni 1 a jellemző sokaságbeli értékétől 2 attól, hogy konkrétan hogyan választottuk ki a mintát Mi értelemszerűen az elsőre vagyunk kíváncsiak... csakhogy a kikerülhetetlen második ( pont milyen mintát vettünk ) azt fogja okozni, hogy minden eredményünk mintáról-mintára változni fog A szerencse: ez az ún. mintavételi ingadozás követ valószínűségszámítási törvényeket, így valószínűségi állításokat meg tudunk fogalmazni! Hibázhatunk, de ennek természetéről tudunk nyilatkozni
182 A mintavételi helyzet konzekvenciái Mintavételi hiba Figyelem, ennél a hibázásnál nem arról van szó, hogy rosszul veszünk mintát: például a legtökéletesebben véletlenszerű mintavételnél is előfordulhat, hogy egy 1000 fős sokaságból úgy becsüljük az átlagos testtömeget, hogy pont a 30 legkönnyebbet választjuk ki De: ennek a valószínűsége extrém kicsi! (Egész pontosan 1/ ( ) %) Így értendő, hogy ez a hiba valószínűségszámítási úton, sztochasztikusan limitálható Ezt nevezzük mintavételi hibának
183 A mintavételi helyzet konzekvenciái Mintavételi hiba Figyelem, ennél a hibázásnál nem arról van szó, hogy rosszul veszünk mintát: például a legtökéletesebben véletlenszerű mintavételnél is előfordulhat, hogy egy 1000 fős sokaságból úgy becsüljük az átlagos testtömeget, hogy pont a 30 legkönnyebbet választjuk ki De: ennek a valószínűsége extrém kicsi! (Egész pontosan 1/ ( ) %) Így értendő, hogy ez a hiba valószínűségszámítási úton, sztochasztikusan limitálható Ezt nevezzük mintavételi hibának
184 A mintavételi helyzet konzekvenciái Mintavételi hiba Figyelem, ennél a hibázásnál nem arról van szó, hogy rosszul veszünk mintát: például a legtökéletesebben véletlenszerű mintavételnél is előfordulhat, hogy egy 1000 fős sokaságból úgy becsüljük az átlagos testtömeget, hogy pont a 30 legkönnyebbet választjuk ki De: ennek a valószínűsége extrém kicsi! (Egész pontosan 1/ ( ) %) Így értendő, hogy ez a hiba valószínűségszámítási úton, sztochasztikusan limitálható Ezt nevezzük mintavételi hibának
185 A mintavételi helyzet konzekvenciái Mintavételi hiba Figyelem, ennél a hibázásnál nem arról van szó, hogy rosszul veszünk mintát: például a legtökéletesebben véletlenszerű mintavételnél is előfordulhat, hogy egy 1000 fős sokaságból úgy becsüljük az átlagos testtömeget, hogy pont a 30 legkönnyebbet választjuk ki De: ennek a valószínűsége extrém kicsi! (Egész pontosan 1/ ( ) %) Így értendő, hogy ez a hiba valószínűségszámítási úton, sztochasztikusan limitálható Ezt nevezzük mintavételi hibának
186 A mintavételi helyzet konzekvenciái Mintavételi hiba Figyelem, ennél a hibázásnál nem arról van szó, hogy rosszul veszünk mintát: például a legtökéletesebben véletlenszerű mintavételnél is előfordulhat, hogy egy 1000 fős sokaságból úgy becsüljük az átlagos testtömeget, hogy pont a 30 legkönnyebbet választjuk ki De: ennek a valószínűsége extrém kicsi! (Egész pontosan 1/ ( ) %) Így értendő, hogy ez a hiba valószínűségszámítási úton, sztochasztikusan limitálható Ezt nevezzük mintavételi hibának
187 A mintavételi helyzet konzekvenciái Nem-mintavételi hiba Ez természetesen arra vonatkoznak, hogy mi a mintavételi ingadozásból adódó hiba De nem csak ilyen van: alullefedés, túllefedés, kódolási hiba stb. és a legnagyobb baj: a minta megválasztása Mi van, ha a minta nem véletlen részhalmaza a sokaságnak? ( reprezentativitás kérdése) Literary Digest esete Különösen óvatosan a kényelmi mintával Survey statisztika (külön szak!)
188 A mintavételi helyzet konzekvenciái Nem-mintavételi hiba Ez természetesen arra vonatkoznak, hogy mi a mintavételi ingadozásból adódó hiba De nem csak ilyen van: alullefedés, túllefedés, kódolási hiba stb. és a legnagyobb baj: a minta megválasztása Mi van, ha a minta nem véletlen részhalmaza a sokaságnak? ( reprezentativitás kérdése) Literary Digest esete Különösen óvatosan a kényelmi mintával Survey statisztika (külön szak!)
189 A mintavételi helyzet konzekvenciái Nem-mintavételi hiba Ez természetesen arra vonatkoznak, hogy mi a mintavételi ingadozásból adódó hiba De nem csak ilyen van: alullefedés, túllefedés, kódolási hiba stb. és a legnagyobb baj: a minta megválasztása Mi van, ha a minta nem véletlen részhalmaza a sokaságnak? ( reprezentativitás kérdése) Literary Digest esete Különösen óvatosan a kényelmi mintával Survey statisztika (külön szak!)
190 A mintavételi helyzet konzekvenciái Nem-mintavételi hiba Ez természetesen arra vonatkoznak, hogy mi a mintavételi ingadozásból adódó hiba De nem csak ilyen van: alullefedés, túllefedés, kódolási hiba stb. és a legnagyobb baj: a minta megválasztása Mi van, ha a minta nem véletlen részhalmaza a sokaságnak? ( reprezentativitás kérdése) Literary Digest esete Különösen óvatosan a kényelmi mintával Survey statisztika (külön szak!)
191 A mintavételi helyzet konzekvenciái Nem-mintavételi hiba Ez természetesen arra vonatkoznak, hogy mi a mintavételi ingadozásból adódó hiba De nem csak ilyen van: alullefedés, túllefedés, kódolási hiba stb. és a legnagyobb baj: a minta megválasztása Mi van, ha a minta nem véletlen részhalmaza a sokaságnak? ( reprezentativitás kérdése) Literary Digest esete Különösen óvatosan a kényelmi mintával Survey statisztika (külön szak!)
192 A mintavételi helyzet konzekvenciái Nem-mintavételi hiba Ez természetesen arra vonatkoznak, hogy mi a mintavételi ingadozásból adódó hiba De nem csak ilyen van: alullefedés, túllefedés, kódolási hiba stb. és a legnagyobb baj: a minta megválasztása Mi van, ha a minta nem véletlen részhalmaza a sokaságnak? ( reprezentativitás kérdése) Literary Digest esete Különösen óvatosan a kényelmi mintával Survey statisztika (külön szak!)
193 Becsléselmélet Tartalom 1 Mi a statisztika? 2 A statisztika alapfogalmai 3 Deskriptív statisztika A deskriptív statisztikáról általában Egyváltozós elemzés, minőségi változó Egyváltozós elemzés, mennyiségi változó Két minőségi változó kapcsolata: asszociáció Két mennyiségi változó kapcsolata: korreláció 4 Induktív statisztika A mintavételi helyzet konzekvenciái Becsléselmélet Hipotézisvizsgálat 5 Klinikai vizsgálatok
194 Becsléselmélet Pontbecslés Feladat: valamely sokasági jellemző meghatározása minta alapján Például sokaság átlaga/várhatóértéke minta alapján Naiv tipp: mondjuk a minta átlagát becslésként! Az ilyen szabály a becslőfüggvény: a mintaelemekből megmondja a legjobb tippünket a sokasági jellemzőre Mi az, hogy jó becslő? A két legfontosabb tulajdonság: 1 Elfogadjuk, hogy a becslőfüggvény által szolgáltatott becslés mintáról-mintára ingadozik, de legalább az teljesüljön, hogy az ingadozás centrumában a valódi (sokasági) jellemző legyen (torzítatlanság) 2 Ennek az ingadozásnak a mértéke lehetőleg minél kisebb legyen (hatásosság) A becslőfüggvény eloszlása (ugye annak eloszlása lesz, és nem értéke, hiszen mintáról-mintára változik; és adott tartományokban különböző valószínűséggel esik!) az ún. mintavételi eloszlás
195 Becsléselmélet Pontbecslés Feladat: valamely sokasági jellemző meghatározása minta alapján Például sokaság átlaga/várhatóértéke minta alapján Naiv tipp: mondjuk a minta átlagát becslésként! Az ilyen szabály a becslőfüggvény: a mintaelemekből megmondja a legjobb tippünket a sokasági jellemzőre Mi az, hogy jó becslő? A két legfontosabb tulajdonság: 1 Elfogadjuk, hogy a becslőfüggvény által szolgáltatott becslés mintáról-mintára ingadozik, de legalább az teljesüljön, hogy az ingadozás centrumában a valódi (sokasági) jellemző legyen (torzítatlanság) 2 Ennek az ingadozásnak a mértéke lehetőleg minél kisebb legyen (hatásosság) A becslőfüggvény eloszlása (ugye annak eloszlása lesz, és nem értéke, hiszen mintáról-mintára változik; és adott tartományokban különböző valószínűséggel esik!) az ún. mintavételi eloszlás
196 Becsléselmélet Pontbecslés Feladat: valamely sokasági jellemző meghatározása minta alapján Például sokaság átlaga/várhatóértéke minta alapján Naiv tipp: mondjuk a minta átlagát becslésként! Az ilyen szabály a becslőfüggvény: a mintaelemekből megmondja a legjobb tippünket a sokasági jellemzőre Mi az, hogy jó becslő? A két legfontosabb tulajdonság: 1 Elfogadjuk, hogy a becslőfüggvény által szolgáltatott becslés mintáról-mintára ingadozik, de legalább az teljesüljön, hogy az ingadozás centrumában a valódi (sokasági) jellemző legyen (torzítatlanság) 2 Ennek az ingadozásnak a mértéke lehetőleg minél kisebb legyen (hatásosság) A becslőfüggvény eloszlása (ugye annak eloszlása lesz, és nem értéke, hiszen mintáról-mintára változik; és adott tartományokban különböző valószínűséggel esik!) az ún. mintavételi eloszlás
197 Becsléselmélet Pontbecslés Feladat: valamely sokasági jellemző meghatározása minta alapján Például sokaság átlaga/várhatóértéke minta alapján Naiv tipp: mondjuk a minta átlagát becslésként! Az ilyen szabály a becslőfüggvény: a mintaelemekből megmondja a legjobb tippünket a sokasági jellemzőre Mi az, hogy jó becslő? A két legfontosabb tulajdonság: 1 Elfogadjuk, hogy a becslőfüggvény által szolgáltatott becslés mintáról-mintára ingadozik, de legalább az teljesüljön, hogy az ingadozás centrumában a valódi (sokasági) jellemző legyen (torzítatlanság) 2 Ennek az ingadozásnak a mértéke lehetőleg minél kisebb legyen (hatásosság) A becslőfüggvény eloszlása (ugye annak eloszlása lesz, és nem értéke, hiszen mintáról-mintára változik; és adott tartományokban különböző valószínűséggel esik!) az ún. mintavételi eloszlás
198 Becsléselmélet Pontbecslés Feladat: valamely sokasági jellemző meghatározása minta alapján Például sokaság átlaga/várhatóértéke minta alapján Naiv tipp: mondjuk a minta átlagát becslésként! Az ilyen szabály a becslőfüggvény: a mintaelemekből megmondja a legjobb tippünket a sokasági jellemzőre Mi az, hogy jó becslő? A két legfontosabb tulajdonság: 1 Elfogadjuk, hogy a becslőfüggvény által szolgáltatott becslés mintáról-mintára ingadozik, de legalább az teljesüljön, hogy az ingadozás centrumában a valódi (sokasági) jellemző legyen (torzítatlanság) 2 Ennek az ingadozásnak a mértéke lehetőleg minél kisebb legyen (hatásosság) A becslőfüggvény eloszlása (ugye annak eloszlása lesz, és nem értéke, hiszen mintáról-mintára változik; és adott tartományokban különböző valószínűséggel esik!) az ún. mintavételi eloszlás
199 Becsléselmélet Pontbecslés Feladat: valamely sokasági jellemző meghatározása minta alapján Például sokaság átlaga/várhatóértéke minta alapján Naiv tipp: mondjuk a minta átlagát becslésként! Az ilyen szabály a becslőfüggvény: a mintaelemekből megmondja a legjobb tippünket a sokasági jellemzőre Mi az, hogy jó becslő? A két legfontosabb tulajdonság: 1 Elfogadjuk, hogy a becslőfüggvény által szolgáltatott becslés mintáról-mintára ingadozik, de legalább az teljesüljön, hogy az ingadozás centrumában a valódi (sokasági) jellemző legyen (torzítatlanság) 2 Ennek az ingadozásnak a mértéke lehetőleg minél kisebb legyen (hatásosság) A becslőfüggvény eloszlása (ugye annak eloszlása lesz, és nem értéke, hiszen mintáról-mintára változik; és adott tartományokban különböző valószínűséggel esik!) az ún. mintavételi eloszlás
200 Becsléselmélet Pontbecslés Feladat: valamely sokasági jellemző meghatározása minta alapján Például sokaság átlaga/várhatóértéke minta alapján Naiv tipp: mondjuk a minta átlagát becslésként! Az ilyen szabály a becslőfüggvény: a mintaelemekből megmondja a legjobb tippünket a sokasági jellemzőre Mi az, hogy jó becslő? A két legfontosabb tulajdonság: 1 Elfogadjuk, hogy a becslőfüggvény által szolgáltatott becslés mintáról-mintára ingadozik, de legalább az teljesüljön, hogy az ingadozás centrumában a valódi (sokasági) jellemző legyen (torzítatlanság) 2 Ennek az ingadozásnak a mértéke lehetőleg minél kisebb legyen (hatásosság) A becslőfüggvény eloszlása (ugye annak eloszlása lesz, és nem értéke, hiszen mintáról-mintára változik; és adott tartományokban különböző valószínűséggel esik!) az ún. mintavételi eloszlás
201 Becsléselmélet Pontbecslés Feladat: valamely sokasági jellemző meghatározása minta alapján Például sokaság átlaga/várhatóértéke minta alapján Naiv tipp: mondjuk a minta átlagát becslésként! Az ilyen szabály a becslőfüggvény: a mintaelemekből megmondja a legjobb tippünket a sokasági jellemzőre Mi az, hogy jó becslő? A két legfontosabb tulajdonság: 1 Elfogadjuk, hogy a becslőfüggvény által szolgáltatott becslés mintáról-mintára ingadozik, de legalább az teljesüljön, hogy az ingadozás centrumában a valódi (sokasági) jellemző legyen (torzítatlanság) 2 Ennek az ingadozásnak a mértéke lehetőleg minél kisebb legyen (hatásosság) A becslőfüggvény eloszlása (ugye annak eloszlása lesz, és nem értéke, hiszen mintáról-mintára változik; és adott tartományokban különböző valószínűséggel esik!) az ún. mintavételi eloszlás
202 Becsléselmélet Mintavételi eloszlás: egy állítás Ha a sokaság X N ( µ, σ 2 0) eloszlást követ (tehát figyelem: ez egy ún. eloszlásával (és nem elemeivel!) adott sokaság; fiktív, végtelen sokaságnál tipikus), akkor a belőle vett n elemű minták átlaga, azaz a µ sokasági várhatóérték (mint sokasági jellemző) fenti becslőfüggvénye x N ( µ, σ 2 0 /n) eloszlást fog követni (Tehát feltételeztük, hogy azt a priori tudjuk, hogy normális eloszlású a sokaság, sőt, σ-t is ismertnek vesszük csak a µ a kérdés) Figyelem, a sokasági jellemző, amit becsülni szeretnénk, itt a µ maga; az tehát nem követ semmilyen eloszlást, egy konstans szám! (Csak mi nem ismerjük.) Ez csak fae (független, azonos eloszlású) mintavételre igaz Ez matematikai úton (valószínűségszámítási módszerekkel) belátható; hogy legyen pár képlet is, bármennyire is bevezetésről van szó, ezt megmutatjuk
203 Becsléselmélet Mintavételi eloszlás: egy állítás Ha a sokaság X N ( µ, σ 2 0) eloszlást követ (tehát figyelem: ez egy ún. eloszlásával (és nem elemeivel!) adott sokaság; fiktív, végtelen sokaságnál tipikus), akkor a belőle vett n elemű minták átlaga, azaz a µ sokasági várhatóérték (mint sokasági jellemző) fenti becslőfüggvénye x N ( µ, σ 2 0 /n) eloszlást fog követni (Tehát feltételeztük, hogy azt a priori tudjuk, hogy normális eloszlású a sokaság, sőt, σ-t is ismertnek vesszük csak a µ a kérdés) Figyelem, a sokasági jellemző, amit becsülni szeretnénk, itt a µ maga; az tehát nem követ semmilyen eloszlást, egy konstans szám! (Csak mi nem ismerjük.) Ez csak fae (független, azonos eloszlású) mintavételre igaz Ez matematikai úton (valószínűségszámítási módszerekkel) belátható; hogy legyen pár képlet is, bármennyire is bevezetésről van szó, ezt megmutatjuk
204 Becsléselmélet Mintavételi eloszlás: egy állítás Ha a sokaság X N ( µ, σ 2 0) eloszlást követ (tehát figyelem: ez egy ún. eloszlásával (és nem elemeivel!) adott sokaság; fiktív, végtelen sokaságnál tipikus), akkor a belőle vett n elemű minták átlaga, azaz a µ sokasági várhatóérték (mint sokasági jellemző) fenti becslőfüggvénye x N ( µ, σ 2 0 /n) eloszlást fog követni (Tehát feltételeztük, hogy azt a priori tudjuk, hogy normális eloszlású a sokaság, sőt, σ-t is ismertnek vesszük csak a µ a kérdés) Figyelem, a sokasági jellemző, amit becsülni szeretnénk, itt a µ maga; az tehát nem követ semmilyen eloszlást, egy konstans szám! (Csak mi nem ismerjük.) Ez csak fae (független, azonos eloszlású) mintavételre igaz Ez matematikai úton (valószínűségszámítási módszerekkel) belátható; hogy legyen pár képlet is, bármennyire is bevezetésről van szó, ezt megmutatjuk
205 Becsléselmélet Mintavételi eloszlás: egy állítás Ha a sokaság X N ( µ, σ 2 0) eloszlást követ (tehát figyelem: ez egy ún. eloszlásával (és nem elemeivel!) adott sokaság; fiktív, végtelen sokaságnál tipikus), akkor a belőle vett n elemű minták átlaga, azaz a µ sokasági várhatóérték (mint sokasági jellemző) fenti becslőfüggvénye x N ( µ, σ 2 0 /n) eloszlást fog követni (Tehát feltételeztük, hogy azt a priori tudjuk, hogy normális eloszlású a sokaság, sőt, σ-t is ismertnek vesszük csak a µ a kérdés) Figyelem, a sokasági jellemző, amit becsülni szeretnénk, itt a µ maga; az tehát nem követ semmilyen eloszlást, egy konstans szám! (Csak mi nem ismerjük.) Ez csak fae (független, azonos eloszlású) mintavételre igaz Ez matematikai úton (valószínűségszámítási módszerekkel) belátható; hogy legyen pár képlet is, bármennyire is bevezetésről van szó, ezt megmutatjuk
206 Becsléselmélet Mintavételi eloszlás: egy állítás Ha a sokaság X N ( µ, σ 2 0) eloszlást követ (tehát figyelem: ez egy ún. eloszlásával (és nem elemeivel!) adott sokaság; fiktív, végtelen sokaságnál tipikus), akkor a belőle vett n elemű minták átlaga, azaz a µ sokasági várhatóérték (mint sokasági jellemző) fenti becslőfüggvénye x N ( µ, σ 2 0 /n) eloszlást fog követni (Tehát feltételeztük, hogy azt a priori tudjuk, hogy normális eloszlású a sokaság, sőt, σ-t is ismertnek vesszük csak a µ a kérdés) Figyelem, a sokasági jellemző, amit becsülni szeretnénk, itt a µ maga; az tehát nem követ semmilyen eloszlást, egy konstans szám! (Csak mi nem ismerjük.) Ez csak fae (független, azonos eloszlású) mintavételre igaz Ez matematikai úton (valószínűségszámítási módszerekkel) belátható; hogy legyen pár képlet is, bármennyire is bevezetésről van szó, ezt megmutatjuk
207 Becsléselmélet Bizonyítás I. Legyen az n elemű mintánk X 1, X 2,..., X n N ( µ, σ 2) fae (mivel fae, mindegyik ugyanolyan eloszlást követ) Nagy betűket írtunk: ezek nem konkrét (realizálódott) értékek, hanem maguk is val. változók (eggyel nagyobb dimenzió a statisztikai analízishez) n i=1 X i n Ezzel a becslőfüggvényünk: X = Valószínűségszámításból tudjuk, hogy 1 Normális eloszlású v.v.-k összege normális (szépen: a normális eloszláscsalád zárt a konvolúcióra) 2 A várhatóérték-képzés lineáris, így az összeg várhatóértéke a várhatóértékek összege 3 Ha ráadásul függetlenek, akkor a szórásnégyzetek (nem a szórások!) is összeadódnak
208 Becsléselmélet Bizonyítás I. Legyen az n elemű mintánk X 1, X 2,..., X n N ( µ, σ 2) fae (mivel fae, mindegyik ugyanolyan eloszlást követ) Nagy betűket írtunk: ezek nem konkrét (realizálódott) értékek, hanem maguk is val. változók (eggyel nagyobb dimenzió a statisztikai analízishez) n i=1 X i n Ezzel a becslőfüggvényünk: X = Valószínűségszámításból tudjuk, hogy 1 Normális eloszlású v.v.-k összege normális (szépen: a normális eloszláscsalád zárt a konvolúcióra) 2 A várhatóérték-képzés lineáris, így az összeg várhatóértéke a várhatóértékek összege 3 Ha ráadásul függetlenek, akkor a szórásnégyzetek (nem a szórások!) is összeadódnak
209 Becsléselmélet Bizonyítás I. Legyen az n elemű mintánk X 1, X 2,..., X n N ( µ, σ 2) fae (mivel fae, mindegyik ugyanolyan eloszlást követ) Nagy betűket írtunk: ezek nem konkrét (realizálódott) értékek, hanem maguk is val. változók (eggyel nagyobb dimenzió a statisztikai analízishez) n i=1 X i n Ezzel a becslőfüggvényünk: X = Valószínűségszámításból tudjuk, hogy 1 Normális eloszlású v.v.-k összege normális (szépen: a normális eloszláscsalád zárt a konvolúcióra) 2 A várhatóérték-képzés lineáris, így az összeg várhatóértéke a várhatóértékek összege 3 Ha ráadásul függetlenek, akkor a szórásnégyzetek (nem a szórások!) is összeadódnak
210 Becsléselmélet Bizonyítás I. Legyen az n elemű mintánk X 1, X 2,..., X n N ( µ, σ 2) fae (mivel fae, mindegyik ugyanolyan eloszlást követ) Nagy betűket írtunk: ezek nem konkrét (realizálódott) értékek, hanem maguk is val. változók (eggyel nagyobb dimenzió a statisztikai analízishez) n i=1 X i n Ezzel a becslőfüggvényünk: X = Valószínűségszámításból tudjuk, hogy 1 Normális eloszlású v.v.-k összege normális (szépen: a normális eloszláscsalád zárt a konvolúcióra) 2 A várhatóérték-képzés lineáris, így az összeg várhatóértéke a várhatóértékek összege 3 Ha ráadásul függetlenek, akkor a szórásnégyzetek (nem a szórások!) is összeadódnak
211 Becsléselmélet Bizonyítás I. Legyen az n elemű mintánk X 1, X 2,..., X n N ( µ, σ 2) fae (mivel fae, mindegyik ugyanolyan eloszlást követ) Nagy betűket írtunk: ezek nem konkrét (realizálódott) értékek, hanem maguk is val. változók (eggyel nagyobb dimenzió a statisztikai analízishez) n i=1 X i n Ezzel a becslőfüggvényünk: X = Valószínűségszámításból tudjuk, hogy 1 Normális eloszlású v.v.-k összege normális (szépen: a normális eloszláscsalád zárt a konvolúcióra) 2 A várhatóérték-képzés lineáris, így az összeg várhatóértéke a várhatóértékek összege 3 Ha ráadásul függetlenek, akkor a szórásnégyzetek (nem a szórások!) is összeadódnak
212 Becsléselmélet Bizonyítás I. Legyen az n elemű mintánk X 1, X 2,..., X n N ( µ, σ 2) fae (mivel fae, mindegyik ugyanolyan eloszlást követ) Nagy betűket írtunk: ezek nem konkrét (realizálódott) értékek, hanem maguk is val. változók (eggyel nagyobb dimenzió a statisztikai analízishez) n i=1 X i n Ezzel a becslőfüggvényünk: X = Valószínűségszámításból tudjuk, hogy 1 Normális eloszlású v.v.-k összege normális (szépen: a normális eloszláscsalád zárt a konvolúcióra) 2 A várhatóérték-képzés lineáris, így az összeg várhatóértéke a várhatóértékek összege 3 Ha ráadásul függetlenek, akkor a szórásnégyzetek (nem a szórások!) is összeadódnak
213 Becsléselmélet Bizonyítás I. Legyen az n elemű mintánk X 1, X 2,..., X n N ( µ, σ 2) fae (mivel fae, mindegyik ugyanolyan eloszlást követ) Nagy betűket írtunk: ezek nem konkrét (realizálódott) értékek, hanem maguk is val. változók (eggyel nagyobb dimenzió a statisztikai analízishez) n i=1 X i n Ezzel a becslőfüggvényünk: X = Valószínűségszámításból tudjuk, hogy 1 Normális eloszlású v.v.-k összege normális (szépen: a normális eloszláscsalád zárt a konvolúcióra) 2 A várhatóérték-képzés lineáris, így az összeg várhatóértéke a várhatóértékek összege 3 Ha ráadásul függetlenek, akkor a szórásnégyzetek (nem a szórások!) is összeadódnak
214 Becsléselmélet Bizonyítás II. A fenti háromból már következik, hogy n i=1 X i N ( nµ, nσ 2) Szintén valószínűségszámításból tudjuk, hogy 1 E (ax ) = a EX 2 D 2 (ax ) = a 2 D 2 X Amiből pedig már következik, hogy n i=1 X = X i N n ahogy állítottuk is ( ) µ, σ 2 /n, Íme egy nagyon egyszerű példa a matematikai statisztikára! Tehát: torzítatlan becslő (többet is be lehetne látni)
215 Becsléselmélet Bizonyítás II. A fenti háromból már következik, hogy n i=1 X i N ( nµ, nσ 2) Szintén valószínűségszámításból tudjuk, hogy 1 E (ax ) = a EX 2 D 2 (ax ) = a 2 D 2 X Amiből pedig már következik, hogy n i=1 X = X i N n ahogy állítottuk is ( ) µ, σ 2 /n, Íme egy nagyon egyszerű példa a matematikai statisztikára! Tehát: torzítatlan becslő (többet is be lehetne látni)
216 Becsléselmélet Bizonyítás II. A fenti háromból már következik, hogy n i=1 X i N ( nµ, nσ 2) Szintén valószínűségszámításból tudjuk, hogy 1 E (ax ) = a EX 2 D 2 (ax ) = a 2 D 2 X Amiből pedig már következik, hogy n i=1 X = X i N n ahogy állítottuk is ( ) µ, σ 2 /n, Íme egy nagyon egyszerű példa a matematikai statisztikára! Tehát: torzítatlan becslő (többet is be lehetne látni)
217 Becsléselmélet Bizonyítás II. A fenti háromból már következik, hogy n i=1 X i N ( nµ, nσ 2) Szintén valószínűségszámításból tudjuk, hogy 1 E (ax ) = a EX 2 D 2 (ax ) = a 2 D 2 X Amiből pedig már következik, hogy n i=1 X = X i N n ahogy állítottuk is ( ) µ, σ 2 /n, Íme egy nagyon egyszerű példa a matematikai statisztikára! Tehát: torzítatlan becslő (többet is be lehetne látni)
218 Becsléselmélet Bizonyítás II. A fenti háromból már következik, hogy n i=1 X i N ( nµ, nσ 2) Szintén valószínűségszámításból tudjuk, hogy 1 E (ax ) = a EX 2 D 2 (ax ) = a 2 D 2 X Amiből pedig már következik, hogy n i=1 X = X i N n ahogy állítottuk is ( ) µ, σ 2 /n, Íme egy nagyon egyszerű példa a matematikai statisztikára! Tehát: torzítatlan becslő (többet is be lehetne látni)
219 Becsléselmélet Bizonyítás II. A fenti háromból már következik, hogy n i=1 X i N ( nµ, nσ 2) Szintén valószínűségszámításból tudjuk, hogy 1 E (ax ) = a EX 2 D 2 (ax ) = a 2 D 2 X Amiből pedig már következik, hogy n i=1 X = X i N n ahogy állítottuk is ( ) µ, σ 2 /n, Íme egy nagyon egyszerű példa a matematikai statisztikára! Tehát: torzítatlan becslő (többet is be lehetne látni)
220 Becsléselmélet Bizonyítás II. A fenti háromból már következik, hogy n i=1 X i N ( nµ, nσ 2) Szintén valószínűségszámításból tudjuk, hogy 1 E (ax ) = a EX 2 D 2 (ax ) = a 2 D 2 X Amiből pedig már következik, hogy n i=1 X = X i N n ahogy állítottuk is ( ) µ, σ 2 /n, Íme egy nagyon egyszerű példa a matematikai statisztikára! Tehát: torzítatlan becslő (többet is be lehetne látni)
221 Becsléselmélet Intervallumbecslés A fentiekkel egyetlen számot, a legjobb becslést adjuk vissza eredményként Nem adunk számot arról, hogy ebben mekkora a bizonytalanság pedig erről is tudunk nyilatkozni! ( Kalkulálható bizonytalanság ) Tipikus szemléltetés: konfidenciaintervallum (CI): mi az a tartomány, amire igaz, hogy ha sokszor megismételnék a mintavételt, és mindegyik mintából megszerkesztenénk a CI-t, akkor ezen CI-k várhatóan 95%-a tartalmazná az igazi (sokasági) értéket (95% megbízhatóság melletti CI) Nagyobb megbízhatóság semmitmondóbb intervallum
222 Becsléselmélet Intervallumbecslés A fentiekkel egyetlen számot, a legjobb becslést adjuk vissza eredményként Nem adunk számot arról, hogy ebben mekkora a bizonytalanság pedig erről is tudunk nyilatkozni! ( Kalkulálható bizonytalanság ) Tipikus szemléltetés: konfidenciaintervallum (CI): mi az a tartomány, amire igaz, hogy ha sokszor megismételnék a mintavételt, és mindegyik mintából megszerkesztenénk a CI-t, akkor ezen CI-k várhatóan 95%-a tartalmazná az igazi (sokasági) értéket (95% megbízhatóság melletti CI) Nagyobb megbízhatóság semmitmondóbb intervallum
223 Becsléselmélet Intervallumbecslés A fentiekkel egyetlen számot, a legjobb becslést adjuk vissza eredményként Nem adunk számot arról, hogy ebben mekkora a bizonytalanság pedig erről is tudunk nyilatkozni! ( Kalkulálható bizonytalanság ) Tipikus szemléltetés: konfidenciaintervallum (CI): mi az a tartomány, amire igaz, hogy ha sokszor megismételnék a mintavételt, és mindegyik mintából megszerkesztenénk a CI-t, akkor ezen CI-k várhatóan 95%-a tartalmazná az igazi (sokasági) értéket (95% megbízhatóság melletti CI) Nagyobb megbízhatóság semmitmondóbb intervallum
224 Becsléselmélet Intervallumbecslés A fentiekkel egyetlen számot, a legjobb becslést adjuk vissza eredményként Nem adunk számot arról, hogy ebben mekkora a bizonytalanság pedig erről is tudunk nyilatkozni! ( Kalkulálható bizonytalanság ) Tipikus szemléltetés: konfidenciaintervallum (CI): mi az a tartomány, amire igaz, hogy ha sokszor megismételnék a mintavételt, és mindegyik mintából megszerkesztenénk a CI-t, akkor ezen CI-k várhatóan 95%-a tartalmazná az igazi (sokasági) értéket (95% megbízhatóság melletti CI) Nagyobb megbízhatóság semmitmondóbb intervallum
225 Becsléselmélet Intervallumbecslés A fentiekkel egyetlen számot, a legjobb becslést adjuk vissza eredményként Nem adunk számot arról, hogy ebben mekkora a bizonytalanság pedig erről is tudunk nyilatkozni! ( Kalkulálható bizonytalanság ) Tipikus szemléltetés: konfidenciaintervallum (CI): mi az a tartomány, amire igaz, hogy ha sokszor megismételnék a mintavételt, és mindegyik mintából megszerkesztenénk a CI-t, akkor ezen CI-k várhatóan 95%-a tartalmazná az igazi (sokasági) értéket (95% megbízhatóság melletti CI) Nagyobb megbízhatóság semmitmondóbb intervallum
226 Becsléselmélet Példa I. Például: tudjuk, hogy X N ( µ, σ 2 /n ) Ebből következik, hogy X µ σ/ N (0, 1) n Azaz P ( z < X µ σ/ n < z Emiatt, ha ) = Φ (z) Φ ( z) = Φ (z) [ 1 Φ (z) ] = = 2Φ (z) 1 2Φ (z) 1 = 1 α Φ (z) = 1 α 2 z = Φ 1 ( 1 α 2 ) =: z 1 α 2, [ ] akkor rögtön látható, hogy a µ z 1 α σ 2 n, µ + z 1 α σ 2 n tartományba 1 α valószínűséggel esik X ( deduktív statisztika )
227 Becsléselmélet Példa I. Például: tudjuk, hogy X N ( µ, σ 2 /n ) Ebből következik, hogy X µ σ/ N (0, 1) n Azaz P ( z < X µ σ/ n < z Emiatt, ha ) = Φ (z) Φ ( z) = Φ (z) [ 1 Φ (z) ] = = 2Φ (z) 1 2Φ (z) 1 = 1 α Φ (z) = 1 α 2 z = Φ 1 ( 1 α 2 ) =: z 1 α 2, [ ] akkor rögtön látható, hogy a µ z 1 α σ 2 n, µ + z 1 α σ 2 n tartományba 1 α valószínűséggel esik X ( deduktív statisztika )
228 Becsléselmélet Példa I. Például: tudjuk, hogy X N ( µ, σ 2 /n ) Ebből következik, hogy X µ σ/ N (0, 1) n Azaz P ( z < X µ σ/ n < z Emiatt, ha ) = Φ (z) Φ ( z) = Φ (z) [ 1 Φ (z) ] = = 2Φ (z) 1 2Φ (z) 1 = 1 α Φ (z) = 1 α 2 z = Φ 1 ( 1 α 2 ) =: z 1 α 2, [ ] akkor rögtön látható, hogy a µ z 1 α σ 2 n, µ + z 1 α σ 2 n tartományba 1 α valószínűséggel esik X ( deduktív statisztika )
229 Becsléselmélet Példa I. Például: tudjuk, hogy X N ( µ, σ 2 /n ) Ebből következik, hogy X µ σ/ N (0, 1) n Azaz P ( z < X µ σ/ n < z Emiatt, ha ) = Φ (z) Φ ( z) = Φ (z) [ 1 Φ (z) ] = = 2Φ (z) 1 2Φ (z) 1 = 1 α Φ (z) = 1 α 2 z = Φ 1 ( 1 α 2 ) =: z 1 α 2, [ ] akkor rögtön látható, hogy a µ z 1 α σ 2 n, µ + z 1 α σ 2 n tartományba 1 α valószínűséggel esik X ( deduktív statisztika )
230 Becsléselmélet Példa II. Átrendezve kapjuk az induktív statisztikát: ( ) P z 1 α < X µ 2 σ/ n < z 1 α = 1 α 2 ( ) σ σ P X z 1 α < µ < X + z 2 1 α = 1 α n 2 n Tipikusan: α = 0,05, ekkor a 95%-os[ konfidenciaintervallum immár ] egy konkrét mintára a fenti alapján: x z 1 α σ 2 n, x + z 1 α σ 2 n Vigyázat, csak mintavétel előtt vannak val. változók, utána ( kis betűk ) már nem, ezért használtuk a megbízhatóság szót a valószínűség helyett az állítás csak (képzeletbeli) ismételt mintavételi értelemben igaz
231 Becsléselmélet Példa II. Átrendezve kapjuk az induktív statisztikát: ( ) P z 1 α < X µ 2 σ/ n < z 1 α = 1 α 2 ( ) σ σ P X z 1 α < µ < X + z 2 1 α = 1 α n 2 n Tipikusan: α = 0,05, ekkor a 95%-os[ konfidenciaintervallum immár ] egy konkrét mintára a fenti alapján: x z 1 α σ 2 n, x + z 1 α σ 2 n Vigyázat, csak mintavétel előtt vannak val. változók, utána ( kis betűk ) már nem, ezért használtuk a megbízhatóság szót a valószínűség helyett az állítás csak (képzeletbeli) ismételt mintavételi értelemben igaz
232 Becsléselmélet Példa II. Átrendezve kapjuk az induktív statisztikát: ( ) P z 1 α < X µ 2 σ/ n < z 1 α = 1 α 2 ( ) σ σ P X z 1 α < µ < X + z 2 1 α = 1 α n 2 n Tipikusan: α = 0,05, ekkor a 95%-os[ konfidenciaintervallum immár ] egy konkrét mintára a fenti alapján: x z 1 α σ 2 n, x + z 1 α σ 2 n Vigyázat, csak mintavétel előtt vannak val. változók, utána ( kis betűk ) már nem, ezért használtuk a megbízhatóság szót a valószínűség helyett az állítás csak (képzeletbeli) ismételt mintavételi értelemben igaz
233 Hipotézisvizsgálat Tartalom 1 Mi a statisztika? 2 A statisztika alapfogalmai 3 Deskriptív statisztika A deskriptív statisztikáról általában Egyváltozós elemzés, minőségi változó Egyváltozós elemzés, mennyiségi változó Két minőségi változó kapcsolata: asszociáció Két mennyiségi változó kapcsolata: korreláció 4 Induktív statisztika A mintavételi helyzet konzekvenciái Becsléselmélet Hipotézisvizsgálat 5 Klinikai vizsgálatok
234 Hipotézisvizsgálat A hipotézisvizsgálat alapfogalmai Feladat: sokaságra vonatkozó állítás eldöntése minta alapján Lényegében az intervallumbecslés ikertestvére, de hatalmas gyakorlati jelentősége miatt külön eszköztára van Alapeszköze a statisztikai próba (vagy teszt), mely a mintaelemek alapján kiszámol egy ún. tesztstatisztikát (próbafüggényt) Vizsgált állításaink: nullhipotézis ellenhipotézis Egy tipikus példa: H 0 : µ = µ 0 H 1 : µ µ 0 Itt µ 0 általunk megadott, ismert szám (pl. µ 0 = 70 kg a példánkban)
235 Hipotézisvizsgálat A hipotézisvizsgálat alapfogalmai Feladat: sokaságra vonatkozó állítás eldöntése minta alapján Lényegében az intervallumbecslés ikertestvére, de hatalmas gyakorlati jelentősége miatt külön eszköztára van Alapeszköze a statisztikai próba (vagy teszt), mely a mintaelemek alapján kiszámol egy ún. tesztstatisztikát (próbafüggényt) Vizsgált állításaink: nullhipotézis ellenhipotézis Egy tipikus példa: H 0 : µ = µ 0 H 1 : µ µ 0 Itt µ 0 általunk megadott, ismert szám (pl. µ 0 = 70 kg a példánkban)
236 Hipotézisvizsgálat A hipotézisvizsgálat alapfogalmai Feladat: sokaságra vonatkozó állítás eldöntése minta alapján Lényegében az intervallumbecslés ikertestvére, de hatalmas gyakorlati jelentősége miatt külön eszköztára van Alapeszköze a statisztikai próba (vagy teszt), mely a mintaelemek alapján kiszámol egy ún. tesztstatisztikát (próbafüggényt) Vizsgált állításaink: nullhipotézis ellenhipotézis Egy tipikus példa: H 0 : µ = µ 0 H 1 : µ µ 0 Itt µ 0 általunk megadott, ismert szám (pl. µ 0 = 70 kg a példánkban)
237 Hipotézisvizsgálat A hipotézisvizsgálat alapfogalmai Feladat: sokaságra vonatkozó állítás eldöntése minta alapján Lényegében az intervallumbecslés ikertestvére, de hatalmas gyakorlati jelentősége miatt külön eszköztára van Alapeszköze a statisztikai próba (vagy teszt), mely a mintaelemek alapján kiszámol egy ún. tesztstatisztikát (próbafüggényt) Vizsgált állításaink: nullhipotézis ellenhipotézis Egy tipikus példa: H 0 : µ = µ 0 H 1 : µ µ 0 Itt µ 0 általunk megadott, ismert szám (pl. µ 0 = 70 kg a példánkban)
238 Hipotézisvizsgálat A hipotézisvizsgálat alapfogalmai Feladat: sokaságra vonatkozó állítás eldöntése minta alapján Lényegében az intervallumbecslés ikertestvére, de hatalmas gyakorlati jelentősége miatt külön eszköztára van Alapeszköze a statisztikai próba (vagy teszt), mely a mintaelemek alapján kiszámol egy ún. tesztstatisztikát (próbafüggényt) Vizsgált állításaink: nullhipotézis ellenhipotézis Egy tipikus példa: H 0 : µ = µ 0 H 1 : µ µ 0 Itt µ 0 általunk megadott, ismert szám (pl. µ 0 = 70 kg a példánkban)
239 Hipotézisvizsgálat A hipotézisvizsgálat alapfogalmai Feladat: sokaságra vonatkozó állítás eldöntése minta alapján Lényegében az intervallumbecslés ikertestvére, de hatalmas gyakorlati jelentősége miatt külön eszköztára van Alapeszköze a statisztikai próba (vagy teszt), mely a mintaelemek alapján kiszámol egy ún. tesztstatisztikát (próbafüggényt) Vizsgált állításaink: nullhipotézis ellenhipotézis Egy tipikus példa: H 0 : µ = µ 0 H 1 : µ µ 0 Itt µ 0 általunk megadott, ismert szám (pl. µ 0 = 70 kg a példánkban)
240 Hipotézisvizsgálat Próbafüggvény megszerkesztése Itt jön a kulcs: a próbafüggvényt úgy kell megszerkeszteni, hogy H 0 fennállása esetén ismert eloszlást kövessen (nulleloszlás) Például (sokasági normalitás, ismert szórás): ( ) X : nem jó, mert X N µ 0, σ 2 /n (most ugye H 0-t igaznak vesszük!) és ez függ µ 0-tól (σ-tól és n-től is, de az nem baj, mert azokat tudjuk most) Próbálkozzunk ( máshogy, ) X µ 0: technikailag jó, mert X µ 0 N 0, σ 2 /n, de nem túl praktikus, mert minden σ-hoz és n-hez külön táblázat kéne Ennek fényében X µ 0 σ/ : teljesen jó, minden paramétertől függetlenül n N (0, 1) eloszlást követ, ez lesz a jó próbafüggvény
241 Hipotézisvizsgálat Próbafüggvény megszerkesztése Itt jön a kulcs: a próbafüggvényt úgy kell megszerkeszteni, hogy H 0 fennállása esetén ismert eloszlást kövessen (nulleloszlás) Például (sokasági normalitás, ismert szórás): ( ) X : nem jó, mert X N µ 0, σ 2 /n (most ugye H 0-t igaznak vesszük!) és ez függ µ 0-tól (σ-tól és n-től is, de az nem baj, mert azokat tudjuk most) Próbálkozzunk ( máshogy, ) X µ 0: technikailag jó, mert X µ 0 N 0, σ 2 /n, de nem túl praktikus, mert minden σ-hoz és n-hez külön táblázat kéne Ennek fényében X µ 0 σ/ : teljesen jó, minden paramétertől függetlenül n N (0, 1) eloszlást követ, ez lesz a jó próbafüggvény
242 Hipotézisvizsgálat Próbafüggvény megszerkesztése Itt jön a kulcs: a próbafüggvényt úgy kell megszerkeszteni, hogy H 0 fennállása esetén ismert eloszlást kövessen (nulleloszlás) Például (sokasági normalitás, ismert szórás): ( ) X : nem jó, mert X N µ 0, σ 2 /n (most ugye H 0-t igaznak vesszük!) és ez függ µ 0-tól (σ-tól és n-től is, de az nem baj, mert azokat tudjuk most) Próbálkozzunk ( máshogy, ) X µ 0: technikailag jó, mert X µ 0 N 0, σ 2 /n, de nem túl praktikus, mert minden σ-hoz és n-hez külön táblázat kéne Ennek fényében X µ 0 σ/ : teljesen jó, minden paramétertől függetlenül n N (0, 1) eloszlást követ, ez lesz a jó próbafüggvény
243 Hipotézisvizsgálat Próbafüggvény megszerkesztése Itt jön a kulcs: a próbafüggvényt úgy kell megszerkeszteni, hogy H 0 fennállása esetén ismert eloszlást kövessen (nulleloszlás) Például (sokasági normalitás, ismert szórás): ( ) X : nem jó, mert X N µ 0, σ 2 /n (most ugye H 0-t igaznak vesszük!) és ez függ µ 0-tól (σ-tól és n-től is, de az nem baj, mert azokat tudjuk most) Próbálkozzunk ( máshogy, ) X µ 0: technikailag jó, mert X µ 0 N 0, σ 2 /n, de nem túl praktikus, mert minden σ-hoz és n-hez külön táblázat kéne Ennek fényében X µ 0 σ/ : teljesen jó, minden paramétertől függetlenül n N (0, 1) eloszlást követ, ez lesz a jó próbafüggvény
244 Hipotézisvizsgálat Próbafüggvény megszerkesztése Itt jön a kulcs: a próbafüggvényt úgy kell megszerkeszteni, hogy H 0 fennállása esetén ismert eloszlást kövessen (nulleloszlás) Például (sokasági normalitás, ismert szórás): ( ) X : nem jó, mert X N µ 0, σ 2 /n (most ugye H 0-t igaznak vesszük!) és ez függ µ 0-tól (σ-tól és n-től is, de az nem baj, mert azokat tudjuk most) Próbálkozzunk ( máshogy, ) X µ 0: technikailag jó, mert X µ 0 N 0, σ 2 /n, de nem túl praktikus, mert minden σ-hoz és n-hez külön táblázat kéne Ennek fényében X µ 0 σ/ : teljesen jó, minden paramétertől függetlenül n N (0, 1) eloszlást követ, ez lesz a jó próbafüggvény
245 Hipotézisvizsgálat Próbafüggvény megszerkesztése Ez ún. pivot, eloszlása már nem függ ismeretlen paramétertől: Z := X µ 0 σ/ n H 0 N (0, 1), azaz a próbafüggvény H 0 fennállása esetén N (0, 1) eloszlást követ
246 Hipotézisvizsgálat Döntés a hipotézisvizsgálatban I. Hihető-e, hogy az empirikus (adott, konkrét mintából kapott) érték ebből az eloszlásból származik? Biztos döntés nincs! De: mennyire hihetőek ezek?
247 f Hipotézisvizsgálat Döntés a hipotézisvizsgálatban I. Hihető-e, hogy az empirikus (adott, konkrét mintából kapott) érték ebből az eloszlásból származik? Biztos döntés nincs! De: mennyire hihetőek ezek? f z z
248 Hipotézisvizsgálat Döntés a hipotézisvizsgálatban II. Valahol határt kell húznunk szó szerint is! Azt mondjuk, hogy a nagyon kis valószínűségű területekre esést már nem hisszük el Pedig az nem lehetetlen, sőt: az is tudható, hogy az oda esés (azaz a fenti logikával történő hibázás) valószínűsége épp ez a nagyon kis valószínűség Tipikus, hogy a felső és alsó szélén is 2,5-2,5 % valószínűségű területet jelülünk ki (α = 5%, ez a szignifikanciaszint), határai: a c a alsó és a c f felső kritikus értékek (példában: ±1,96)
249 Hipotézisvizsgálat Döntés a hipotézisvizsgálatban II. Valahol határt kell húznunk szó szerint is! Azt mondjuk, hogy a nagyon kis valószínűségű területekre esést már nem hisszük el Pedig az nem lehetetlen, sőt: az is tudható, hogy az oda esés (azaz a fenti logikával történő hibázás) valószínűsége épp ez a nagyon kis valószínűség Tipikus, hogy a felső és alsó szélén is 2,5-2,5 % valószínűségű területet jelülünk ki (α = 5%, ez a szignifikanciaszint), határai: a c a alsó és a c f felső kritikus értékek (példában: ±1,96)
250 Hipotézisvizsgálat Döntés a hipotézisvizsgálatban II. Valahol határt kell húznunk szó szerint is! Azt mondjuk, hogy a nagyon kis valószínűségű területekre esést már nem hisszük el Pedig az nem lehetetlen, sőt: az is tudható, hogy az oda esés (azaz a fenti logikával történő hibázás) valószínűsége épp ez a nagyon kis valószínűség Tipikus, hogy a felső és alsó szélén is 2,5-2,5 % valószínűségű területet jelülünk ki (α = 5%, ez a szignifikanciaszint), határai: a c a alsó és a c f felső kritikus értékek (példában: ±1,96)
251 Hipotézisvizsgálat Döntés a hipotézisvizsgálatban II. Valahol határt kell húznunk szó szerint is! Azt mondjuk, hogy a nagyon kis valószínűségű területekre esést már nem hisszük el Pedig az nem lehetetlen, sőt: az is tudható, hogy az oda esés (azaz a fenti logikával történő hibázás) valószínűsége épp ez a nagyon kis valószínűség Tipikus, hogy a felső és alsó szélén is 2,5-2,5 % valószínűségű területet jelülünk ki (α = 5%, ez a szignifikanciaszint), határai: a c a alsó és a c f felső kritikus értékek (példában: ±1,96)
252 Hipotézisvizsgálat p-érték Vagy: Mennyi lenne az a szignifikanciaszint, ami mellett a mintából kapott (empirikus) tesztstatisztika-érték épp az elfogadás és az elutasítás határára kerülne? (Ez nem más, mint az empirikus értéktől extrémebb helyeken vett integrálja a mintavételi eloszlásnak) A neve: p-érték Manapság (hogy a számításigény már nem probléma), ezt szokták megadni, mert nem binarizálja az eredményt Az olvasó is tud dönteni : ha a választott szignifikanciaszint nagyobb, mint a p-érték, akkor elutasítunk, különben elfogadunk Frekvencionista szemlélet!
253 Hipotézisvizsgálat p-érték Vagy: Mennyi lenne az a szignifikanciaszint, ami mellett a mintából kapott (empirikus) tesztstatisztika-érték épp az elfogadás és az elutasítás határára kerülne? (Ez nem más, mint az empirikus értéktől extrémebb helyeken vett integrálja a mintavételi eloszlásnak) A neve: p-érték Manapság (hogy a számításigény már nem probléma), ezt szokták megadni, mert nem binarizálja az eredményt Az olvasó is tud dönteni : ha a választott szignifikanciaszint nagyobb, mint a p-érték, akkor elutasítunk, különben elfogadunk Frekvencionista szemlélet!
254 Hipotézisvizsgálat p-érték Vagy: Mennyi lenne az a szignifikanciaszint, ami mellett a mintából kapott (empirikus) tesztstatisztika-érték épp az elfogadás és az elutasítás határára kerülne? (Ez nem más, mint az empirikus értéktől extrémebb helyeken vett integrálja a mintavételi eloszlásnak) A neve: p-érték Manapság (hogy a számításigény már nem probléma), ezt szokták megadni, mert nem binarizálja az eredményt Az olvasó is tud dönteni : ha a választott szignifikanciaszint nagyobb, mint a p-érték, akkor elutasítunk, különben elfogadunk Frekvencionista szemlélet!
255 Hipotézisvizsgálat p-érték Vagy: Mennyi lenne az a szignifikanciaszint, ami mellett a mintából kapott (empirikus) tesztstatisztika-érték épp az elfogadás és az elutasítás határára kerülne? (Ez nem más, mint az empirikus értéktől extrémebb helyeken vett integrálja a mintavételi eloszlásnak) A neve: p-érték Manapság (hogy a számításigény már nem probléma), ezt szokták megadni, mert nem binarizálja az eredményt Az olvasó is tud dönteni : ha a választott szignifikanciaszint nagyobb, mint a p-érték, akkor elutasítunk, különben elfogadunk Frekvencionista szemlélet!
256 Hipotézisvizsgálat p-érték Vagy: Mennyi lenne az a szignifikanciaszint, ami mellett a mintából kapott (empirikus) tesztstatisztika-érték épp az elfogadás és az elutasítás határára kerülne? (Ez nem más, mint az empirikus értéktől extrémebb helyeken vett integrálja a mintavételi eloszlásnak) A neve: p-érték Manapság (hogy a számításigény már nem probléma), ezt szokták megadni, mert nem binarizálja az eredményt Az olvasó is tud dönteni : ha a választott szignifikanciaszint nagyobb, mint a p-érték, akkor elutasítunk, különben elfogadunk Frekvencionista szemlélet!
257 Hipotézisvizsgálat p-érték Vagy: Mennyi lenne az a szignifikanciaszint, ami mellett a mintából kapott (empirikus) tesztstatisztika-érték épp az elfogadás és az elutasítás határára kerülne? (Ez nem más, mint az empirikus értéktől extrémebb helyeken vett integrálja a mintavételi eloszlásnak) A neve: p-érték Manapság (hogy a számításigény már nem probléma), ezt szokták megadni, mert nem binarizálja az eredményt Az olvasó is tud dönteni : ha a választott szignifikanciaszint nagyobb, mint a p-érték, akkor elutasítunk, különben elfogadunk Frekvencionista szemlélet!
258 Hipotézisvizsgálat Példa I. (Csak szemléltetésként, részletek nélkül) Van-e különbség a dohányzó és a nem-dohányzó nők gyermekeinek születési tömege között? A mintában 2772 g a dohányzóknál az átlag, 3056 g a nem-dohányzóknál; csakhogy a kérdés nem ez... Ez egy sokaságra vonatkozó kérdés próbát kell végeznünk! Adott a dohányzó nők sokaságában az újszülöttek tömegének eloszlása, és ugyanez a nem-dohányzó nők sokaságában operacionalizáljuk úgy a kérdést, hogy a várhatóértékük eltér-e egymástól Erről kell minta alapján dönteni
259 Hipotézisvizsgálat Példa I. (Csak szemléltetésként, részletek nélkül) Van-e különbség a dohányzó és a nem-dohányzó nők gyermekeinek születési tömege között? A mintában 2772 g a dohányzóknál az átlag, 3056 g a nem-dohányzóknál; csakhogy a kérdés nem ez... Ez egy sokaságra vonatkozó kérdés próbát kell végeznünk! Adott a dohányzó nők sokaságában az újszülöttek tömegének eloszlása, és ugyanez a nem-dohányzó nők sokaságában operacionalizáljuk úgy a kérdést, hogy a várhatóértékük eltér-e egymástól Erről kell minta alapján dönteni
260 Hipotézisvizsgálat Példa I. (Csak szemléltetésként, részletek nélkül) Van-e különbség a dohányzó és a nem-dohányzó nők gyermekeinek születési tömege között? A mintában 2772 g a dohányzóknál az átlag, 3056 g a nem-dohányzóknál; csakhogy a kérdés nem ez... Ez egy sokaságra vonatkozó kérdés próbát kell végeznünk! Adott a dohányzó nők sokaságában az újszülöttek tömegének eloszlása, és ugyanez a nem-dohányzó nők sokaságában operacionalizáljuk úgy a kérdést, hogy a várhatóértékük eltér-e egymástól Erről kell minta alapján dönteni
261 Hipotézisvizsgálat Példa I. (Csak szemléltetésként, részletek nélkül) Van-e különbség a dohányzó és a nem-dohányzó nők gyermekeinek születési tömege között? A mintában 2772 g a dohányzóknál az átlag, 3056 g a nem-dohányzóknál; csakhogy a kérdés nem ez... Ez egy sokaságra vonatkozó kérdés próbát kell végeznünk! Adott a dohányzó nők sokaságában az újszülöttek tömegének eloszlása, és ugyanez a nem-dohányzó nők sokaságában operacionalizáljuk úgy a kérdést, hogy a várhatóértékük eltér-e egymástól Erről kell minta alapján dönteni
262 Hipotézisvizsgálat Példa I. (Csak szemléltetésként, részletek nélkül) Van-e különbség a dohányzó és a nem-dohányzó nők gyermekeinek születési tömege között? A mintában 2772 g a dohányzóknál az átlag, 3056 g a nem-dohányzóknál; csakhogy a kérdés nem ez... Ez egy sokaságra vonatkozó kérdés próbát kell végeznünk! Adott a dohányzó nők sokaságában az újszülöttek tömegének eloszlása, és ugyanez a nem-dohányzó nők sokaságában operacionalizáljuk úgy a kérdést, hogy a várhatóértékük eltér-e egymástól Erről kell minta alapján dönteni
263 Hipotézisvizsgálat Példa I. (Csak szemléltetésként, részletek nélkül) Van-e különbség a dohányzó és a nem-dohányzó nők gyermekeinek születési tömege között? A mintában 2772 g a dohányzóknál az átlag, 3056 g a nem-dohányzóknál; csakhogy a kérdés nem ez... Ez egy sokaságra vonatkozó kérdés próbát kell végeznünk! Adott a dohányzó nők sokaságában az újszülöttek tömegének eloszlása, és ugyanez a nem-dohányzó nők sokaságában operacionalizáljuk úgy a kérdést, hogy a várhatóértékük eltér-e egymástól Erről kell minta alapján dönteni
264 Hipotézisvizsgálat Példa II. Elég nagy minta, ún. kétmintás Welch-próba alkalmazható: p = 0,007 Szokásos szignifikanciaszinteken elvethető a feltevés, hogy a dohányzó és a nem-dohányzó nők csoportjában azonos a születési súly: a születi súly kapcsolatban van azzal, hogy dohányzik-e a várandós anya A dohányzás csökkenti a születési súlyt! na ilyet viszont nem mondhatunk! (Korreláció nem implikál kauzalitást!) Confounderek? (Bár itt jó eséllyel tényleg kauzális kapcsolat van, de ezt csak más kísérleti elrendezéssel lehet szabatosan kimutatni)
265 Hipotézisvizsgálat Példa II. Elég nagy minta, ún. kétmintás Welch-próba alkalmazható: p = 0,007 Szokásos szignifikanciaszinteken elvethető a feltevés, hogy a dohányzó és a nem-dohányzó nők csoportjában azonos a születési súly: a születi súly kapcsolatban van azzal, hogy dohányzik-e a várandós anya A dohányzás csökkenti a születési súlyt! na ilyet viszont nem mondhatunk! (Korreláció nem implikál kauzalitást!) Confounderek? (Bár itt jó eséllyel tényleg kauzális kapcsolat van, de ezt csak más kísérleti elrendezéssel lehet szabatosan kimutatni)
266 Hipotézisvizsgálat Példa II. Elég nagy minta, ún. kétmintás Welch-próba alkalmazható: p = 0,007 Szokásos szignifikanciaszinteken elvethető a feltevés, hogy a dohányzó és a nem-dohányzó nők csoportjában azonos a születési súly: a születi súly kapcsolatban van azzal, hogy dohányzik-e a várandós anya A dohányzás csökkenti a születési súlyt! na ilyet viszont nem mondhatunk! (Korreláció nem implikál kauzalitást!) Confounderek? (Bár itt jó eséllyel tényleg kauzális kapcsolat van, de ezt csak más kísérleti elrendezéssel lehet szabatosan kimutatni)
267 Hipotézisvizsgálat Példa II. Elég nagy minta, ún. kétmintás Welch-próba alkalmazható: p = 0,007 Szokásos szignifikanciaszinteken elvethető a feltevés, hogy a dohányzó és a nem-dohányzó nők csoportjában azonos a születési súly: a születi súly kapcsolatban van azzal, hogy dohányzik-e a várandós anya A dohányzás csökkenti a születési súlyt! na ilyet viszont nem mondhatunk! (Korreláció nem implikál kauzalitást!) Confounderek? (Bár itt jó eséllyel tényleg kauzális kapcsolat van, de ezt csak más kísérleti elrendezéssel lehet szabatosan kimutatni)
268 Hipotézisvizsgálat Próba hibái I. Elvetjük H 0 -t, pedig fennáll (elsőfajú hiba, α): pontosan szabályozható valószínűségű Elfogadjuk H 0 -t, pedig el lehetne vetni (másodfajú hiba, β): általánosságban nem ismert, függ a valóságtól 1 β: próba ereje ( mennyire ismeri fel az eltérést, ha tényleg van ) Mi két dologgal tudjuk befolyásolni a próba erejét, mindkettőhöz egy-egy tételmondat: 1 Választott próba: mindig annyi előfeltevésre építő próbát használjunk, amennyit tudunk, se többet se kevesebbet (több előfeltevésre építő próbák erősebbek ugyan, de ha szükséges előfeltevés nem teljesül, a próba nem lesz valid) 2 Mintanagyság: kis hatáshoz nagy minta kell, nagy hatáshoz elég a kisebb minta is
269 Hipotézisvizsgálat Próba hibái I. Elvetjük H 0 -t, pedig fennáll (elsőfajú hiba, α): pontosan szabályozható valószínűségű Elfogadjuk H 0 -t, pedig el lehetne vetni (másodfajú hiba, β): általánosságban nem ismert, függ a valóságtól 1 β: próba ereje ( mennyire ismeri fel az eltérést, ha tényleg van ) Mi két dologgal tudjuk befolyásolni a próba erejét, mindkettőhöz egy-egy tételmondat: 1 Választott próba: mindig annyi előfeltevésre építő próbát használjunk, amennyit tudunk, se többet se kevesebbet (több előfeltevésre építő próbák erősebbek ugyan, de ha szükséges előfeltevés nem teljesül, a próba nem lesz valid) 2 Mintanagyság: kis hatáshoz nagy minta kell, nagy hatáshoz elég a kisebb minta is
270 Hipotézisvizsgálat Próba hibái I. Elvetjük H 0 -t, pedig fennáll (elsőfajú hiba, α): pontosan szabályozható valószínűségű Elfogadjuk H 0 -t, pedig el lehetne vetni (másodfajú hiba, β): általánosságban nem ismert, függ a valóságtól 1 β: próba ereje ( mennyire ismeri fel az eltérést, ha tényleg van ) Mi két dologgal tudjuk befolyásolni a próba erejét, mindkettőhöz egy-egy tételmondat: 1 Választott próba: mindig annyi előfeltevésre építő próbát használjunk, amennyit tudunk, se többet se kevesebbet (több előfeltevésre építő próbák erősebbek ugyan, de ha szükséges előfeltevés nem teljesül, a próba nem lesz valid) 2 Mintanagyság: kis hatáshoz nagy minta kell, nagy hatáshoz elég a kisebb minta is
271 Hipotézisvizsgálat Próba hibái I. Elvetjük H 0 -t, pedig fennáll (elsőfajú hiba, α): pontosan szabályozható valószínűségű Elfogadjuk H 0 -t, pedig el lehetne vetni (másodfajú hiba, β): általánosságban nem ismert, függ a valóságtól 1 β: próba ereje ( mennyire ismeri fel az eltérést, ha tényleg van ) Mi két dologgal tudjuk befolyásolni a próba erejét, mindkettőhöz egy-egy tételmondat: 1 Választott próba: mindig annyi előfeltevésre építő próbát használjunk, amennyit tudunk, se többet se kevesebbet (több előfeltevésre építő próbák erősebbek ugyan, de ha szükséges előfeltevés nem teljesül, a próba nem lesz valid) 2 Mintanagyság: kis hatáshoz nagy minta kell, nagy hatáshoz elég a kisebb minta is
272 Hipotézisvizsgálat Próba hibái I. Elvetjük H 0 -t, pedig fennáll (elsőfajú hiba, α): pontosan szabályozható valószínűségű Elfogadjuk H 0 -t, pedig el lehetne vetni (másodfajú hiba, β): általánosságban nem ismert, függ a valóságtól 1 β: próba ereje ( mennyire ismeri fel az eltérést, ha tényleg van ) Mi két dologgal tudjuk befolyásolni a próba erejét, mindkettőhöz egy-egy tételmondat: 1 Választott próba: mindig annyi előfeltevésre építő próbát használjunk, amennyit tudunk, se többet se kevesebbet (több előfeltevésre építő próbák erősebbek ugyan, de ha szükséges előfeltevés nem teljesül, a próba nem lesz valid) 2 Mintanagyság: kis hatáshoz nagy minta kell, nagy hatáshoz elég a kisebb minta is
273 Hipotézisvizsgálat Próba hibái I. Elvetjük H 0 -t, pedig fennáll (elsőfajú hiba, α): pontosan szabályozható valószínűségű Elfogadjuk H 0 -t, pedig el lehetne vetni (másodfajú hiba, β): általánosságban nem ismert, függ a valóságtól 1 β: próba ereje ( mennyire ismeri fel az eltérést, ha tényleg van ) Mi két dologgal tudjuk befolyásolni a próba erejét, mindkettőhöz egy-egy tételmondat: 1 Választott próba: mindig annyi előfeltevésre építő próbát használjunk, amennyit tudunk, se többet se kevesebbet (több előfeltevésre építő próbák erősebbek ugyan, de ha szükséges előfeltevés nem teljesül, a próba nem lesz valid) 2 Mintanagyság: kis hatáshoz nagy minta kell, nagy hatáshoz elég a kisebb minta is
274 Hipotézisvizsgálat Próba hibái II. Bár néhol bevett szokás, de elvileg nem korrekt egy próba előfeltevését ugyanazon mintán egy másik próbával eldönteni ( testing hypothesis suggested by data )
275 Hipotézisvizsgálat Szignifikanciavadászat I. Mivel minden tesztnek α elsőfajú hibája van, ezért (sajnos!) aki keres az talál!
Biostatisztika és alkalmazásai
2013. szeptember 25. Tartalom 1 Mi a statisztika? 2 A statisztika alapfogalmai 3 Deskriptív statisztika A deskriptív statisztikáról általában Egyváltozós elemzés, minőségi változó Egyváltozós elemzés,
RészletesebbenKutatásmódszertan és prezentációkészítés
Kutatásmódszertan és prezentációkészítés 10. rész: Az adatelemzés alapjai Szerző: Kmetty Zoltán Lektor: Fokasz Nikosz Tizedik rész Az adatelemzés alapjai Tartalomjegyzék Bevezetés Leíró statisztikák I
RészletesebbenMatematikai alapok és valószínőségszámítás. Középértékek és szóródási mutatók
Matematikai alapok és valószínőségszámítás Középértékek és szóródási mutatók Középértékek A leíró statisztikák talán leggyakrabban használt csoportját a középértékek jelentik. Legkönnyebben mint az adathalmaz
RészletesebbenMatematikai statisztika
Matematikai statisztika PROGRAMTERVEZŐ INFORMATIKUS alapszak, A szakiráy Arató Miklós Valószíűségelméleti és Statisztika Taszék Természettudomáyi Kar 2019. február 18. Arató Miklós (ELTE) Matematikai statisztika
RészletesebbenStatisztikai alapok. Leíró statisztika Lineáris módszerek a statisztikában
Statisztikai alapok Leíró statisztika Lineáris módszerek a statisztikában Tudományosan és statisztikailag tesztelhető állítások? A keserűcsokoládé finomabb, mint a tejcsoki. A patkány a legrondább állat,
RészletesebbenBevezető Adatok rendezése Adatok jellemzése Időbeli elemzés. Gazdaságstatisztika KGK VMI
Gazdaságstatisztika 2. előadás Egy ismérv szerinti rendezés Kóczy Á. László KGK VMI Áttekintés Gyakorisági sorok Grafikus ábrázolásuk Helyzetmutatók Szóródási mutatók Az aszimmetria mérőszámai Koncentráció
RészletesebbenSegítség az outputok értelmezéséhez
Tanulni: 10.1-10.3, 10.5, 11.10. Hf: A honlapra feltett falco_exp.zip-ben lévő exploratív elemzések áttanulmányozása, érdekességek, észrevételek kigyűjtése. Segítség az outputok értelmezéséhez Leiro: Leíró
RészletesebbenFEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI
FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 4 IV. MINTA, ALAPsTATIsZTIKÁK 1. MATEMATIKAI statisztika A matematikai statisztika alapfeladatát nagy általánosságban a következőképpen
RészletesebbenBevezető Adatok rendezése Adatok jellemzése Időbeli elemzés
Gazdaságstatisztika 2. előadás Egy ismérv szerinti rendezés Kóczy Á. László KGK VMI Áttekintés Gyakorisági sorok Grafikus ábrázolásuk Helyzetmutatók Szóródási mutatók Az aszimmetria mérőszámai Koncentráció
RészletesebbenBiomatematika 2 Orvosi biometria
Biomatematika 2 Orvosi biometria 2017.02.05. Orvosi biometria (orvosi biostatisztika) Statisztika: tömegjelenségeket számadatokkal leíró tudomány. A statisztika elkészítésének menete: tanulmányok (kísérletek)
RészletesebbenDr. Nagy Zita Barbara igazgatóhelyettes KÖVET Egyesület a Fenntartható Gazdaságért november 15.
Dr. Nagy Zita Barbara igazgatóhelyettes KÖVET Egyesület a Fenntartható Gazdaságért 2018. november 15. PÉNZ a boldogság bitorlója? A jövedelemegyenlőtlenség természetes határa A boldog ember gondolata a
RészletesebbenA mérés problémája a pedagógiában. Dr. Nyéki Lajos 2015
A mérés problémája a pedagógiában Dr. Nyéki Lajos 2015 A mérés fogalma Mérésen olyan tevékenységet értünk, amelynek eredményeként a vizsgált jelenség számszerűen jellemezhetővé, más hasonló jelenségekkel
RészletesebbenStatisztika 2. Dr Gősi Zsuzsanna Egyetemi adjunktus
Statisztika 2. Dr Gősi Zsuzsanna Egyetemi adjunktus Gyakorisági sorok Mennyiségi ismérv jellemző rangsor készítünk. (pl. napi jegyeladások száma) A gyakorisági sor képzése igazából tömörítést jelent Nagyszámú
RészletesebbenElemi statisztika fizikusoknak
1. oldal Elemi statisztika fizikusoknak Pollner Péter Biológiai Fizika Tanszék pollner@elte.hu Az adatok leírása, megismerése és összehasonlítása 2-1 Áttekintés 2-2 Gyakoriság eloszlások 2-3 Az adatok
RészletesebbenVizuális adatelemzés
Vizuális adatelemzés Rendszermodellezés 2017. Budapest University of Technology and Economics Fault Tolerant Systems Research Group Budapest University of Technology and Economics Department of Measurement
RészletesebbenELTE TáTK Közgazdaságtudományi Tanszék GAZDASÁGSTATISZTIKA. Készítette: Bíró Anikó. Szakmai felelős: Bíró Anikó június
GAZDASÁGSTATISZTIKA GAZDASÁGSTATISZTIKA Készült a TÁMOP-4.1.2-08/2/A/KMR-2009-0041pályázati projekt keretében Tartalomfejlesztés az ELTE TátK Közgazdaságtudományi Tanszékén az ELTE Közgazdaságtudományi
RészletesebbenKorrelációs kapcsolatok elemzése
Korrelációs kapcsolatok elemzése 1. előadás Kvantitatív statisztikai módszerek Két változó közötti kapcsolat Független: Az X ismérv szerinti hovatartozás ismerete nem ad semmilyen többletinformációt az
RészletesebbenSTATISZTIKA. András hármas. Éva ötös. Nóri négyes. 5 4,5 4 3,5 3 2,5 2 1,5 ANNA BÉLA CILI 0,5 MAGY. MAT. TÖRT. KÉM.
STATISZTIKA 5 4,5 4 3,5 3 2,5 2 1,5 1 0,5 0 MAGY. MAT. TÖRT. KÉM. ANNA BÉLA CILI András hármas. Béla Az átlag 3,5! kettes. Éva ötös. Nóri négyes. 1 mérés: dolgokhoz valamely szabály alapján szám rendelése
RészletesebbenA leíró statisztikák
A leíró statisztikák A leíró statisztikák fogalma, haszna Gyakori igény az, hogy egy adathalmazt elemei egyenkénti felsorolása helyett néhány jellemző tulajdonságának megadásával jellemezzünk. Ezeket az
Részletesebben[Biomatematika 2] Orvosi biometria
[Biomatematika 2] Orvosi biometria 2016.02.08. Orvosi biometria (orvosi biostatisztika) Statisztika: tömegjelenségeket számadatokkal leíró tudomány. A statisztika elkészítésének menete: tanulmányok (kísérletek)
RészletesebbenMintavétel fogalmai STATISZTIKA, BIOMETRIA. Mintavételi hiba. Statisztikai adatgyűjtés. Nem véletlenen alapuló kiválasztás
STATISZTIKA, BIOMETRIA. Előadás Mintavétel, mintavételi technikák, adatbázis Mintavétel fogalmai A mintavételt meg kell tervezni A sokaság elemei: X, X X N, lehet véges és végtelen Mintaelemek: x, x x
RészletesebbenA Statisztika alapjai
A Statisztika alapjai BME A3c Magyar Róbert 2016.05.12. Mi az a Statisztika? A statisztika a valóság számszerű információinak megfigyelésére, összegzésére, elemzésére és modellezésére irányuló gyakorlati
RészletesebbenFeladatok: pontdiagram és dobozdiagram. Hogyan csináltuk?
Feladatok: pontdiagram és dobozdiagram Hogyan csináltuk? Alakmutatók: ferdeség, csúcsosság Alakmutatók a ferdeség és csúcsosság mérésére Ez eloszlás centrumát (középérték) és az adatok centrum körüli terpeszkedését
RészletesebbenMatematikai statisztika c. tárgy oktatásának célja és tematikája
Matematikai statisztika c. tárgy oktatásának célja és tematikája 2015 Tematika Matematikai statisztika 1. Időkeret: 12 héten keresztül heti 3x50 perc (előadás és szeminárium) 2. Szükséges előismeretek:
RészletesebbenMatematikai alapok és valószínőségszámítás. Statisztikai változók Adatok megtekintése
Matematikai alapok és valószínőségszámítás Statisztikai változók Adatok megtekintése Statisztikai változók A statisztikai elemzések során a vizsgálati, vagy megfigyelési egységeket különbözı jellemzık
RészletesebbenStatisztikai alapfogalmak
Statisztika I. KÉPLETEK 2011-2012-es tanév I. félév Statisztikai alapfogalmak Adatok pontossága Mért adat Abszolút hibakorlát Relatív hibakorlát Statisztikai elemzések viszonyszámokkal : a legutolsó kiírt
RészletesebbenFEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI
FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 10 X. SZIMULÁCIÓ 1. VÉLETLEN számok A véletlen számok fontos szerepet játszanak a véletlen helyzetek generálásában (pénzérme, dobókocka,
RészletesebbenLeíró és matematikai statisztika el adásnapló Matematika alapszak, matematikai elemz szakirány 2016/2017. tavaszi félév
Leíró és matematikai statisztika el adásnapló Matematika alapszak, matematikai elemz szakirány 2016/2017. tavaszi félév A pirossal írt anyagrészeket nem fogom közvetlenül számon kérni a vizsgán, azok háttérismeretként,
RészletesebbenMi az adat? Az adat elemi ismeret. Az adatokból információkat
Mi az adat? Az adat elemi ismeret. Tények, fogalmak olyan megjelenési formája, amely alkalmas emberi eszközökkel történő értelmezésre, feldolgozásra, továbbításra. Az adatokból gondolkodás vagy gépi feldolgozás
RészletesebbenVáltozók eloszlása, középértékek, szóródás
Változók eloszlása, középértékek, szóródás Populáció jellemzése Empirikus kutatás (statisztikai elemzés) célja: a mintából a populációra következtetni. Minta: egy adott változó a megfigyelési egységeken
RészletesebbenStatisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1
Statisztika - bevezetés 00.04.05. Méréselmélet PE MIK MI_BSc VI_BSc Bevezetés Véletlen jelenség fogalma jelenséget okok bizonyos rendszere hozza létre ha mindegyik figyelembe vehető egyértelmű leírás általában
RészletesebbenStatisztika. Politológus képzés. Daróczi Gergely április 17. Politológia Tanszék
Statisztika Politológus képzés Daróczi Gergely Politológia Tanszék 2012. április 17. Outline 1 Leíró statisztikák 2 Középértékek Példa 3 Szóródási mutatók Példa 4 Néhány megjegyzés a grafikonokról 5 Számítások
RészletesebbenVargha András Károli Gáspár Református Egyetem Budapest
Vargha András Károli Gáspár Református Egyetem Budapest Kötelező irodalom a kurzushoz Vargha András: Matematikai statisztika pszichológiai, nyelvészeti és biológiai alkalmazásokkal (2. kiadás). Pólya Kiadó,
Részletesebben3/29/12. Biomatematika 2. előadás. Biostatisztika = Biometria = Orvosi statisztika. Néhány egyszerű definíció:
Biostatisztika = Biometria = Orvosi statisztika Biomatematika 2. előadás Néhány egyszerű definíció: A statisztika olyan tudomány, amely a tömegjelenségekkel kapcsolatos tapasztalati törvényeket megfigyelések
RészletesebbenVizuális adatelemzés
Vizuális adatelemzés Salánki Ágnes, Guta Gábor, PhD Dr. Pataricza András Budapest University of Technology and Economics Fault Tolerant Systems Research Group Budapest University of Technology and Economics
RészletesebbenA valószínűségszámítás elemei
A valószínűségszámítás elemei Kísérletsorozatban az esemény relatív gyakorisága: k/n, ahol k az esemény bekövetkezésének abszolút gyakorisága, n a kísérletek száma. Pl. Jelenség: kockadobás Megfigyelés:
RészletesebbenGRADUÁLIS BIOSTATISZTIKAI KURZUS február hó 22. Dr. Dinya Elek egyetemi docens
GRADUÁLIS BIOSTATISZTIKAI KURZUS 2012. február hó 22. Dr. Dinya Elek egyetemi docens Biometria fogalma The active pursuit of biological knowledge by quantitative methods Sir R. A. Fisher, 1948 BIOMETRIA
RészletesebbenFüggetlenségvizsgálat, Illeszkedésvizsgálat
Varga Beatrix, Horváthné Csolák Erika Függetlenségvizsgálat, Illeszkedésvizsgálat 4. előadás Üzleti statisztika A sokaság/minta több ismérv szerinti vizsgálata A statisztikai elemzés egyik ontos eladata
RészletesebbenVéletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus.
Valószín ségelméleti és matematikai statisztikai alapfogalmak összefoglalása (Kemény Sándor - Deák András: Mérések tervezése és eredményeik értékelése, kivonat) Véletlen jelenség: okok rendszere hozza
RészletesebbenELTE TáTK Közgazdaságtudományi Tanszék GAZDASÁGSTATISZTIKA. Készítette: Bíró Anikó. Szakmai felelős: Bíró Anikó június
GAZDASÁGSTATISZTIKA GAZDASÁGSTATISZTIKA Készült a TÁMOP-4.1.2-08/2/A/KMR-2009-0041pályázati projekt keretében Tartalomfejlesztés az ELTE TátK Közgazdaságtudományi Tanszékén az ELTE Közgazdaságtudományi
RészletesebbenMatematikai statisztikai elemzések 2.
Nyugat-magyarországi Egyetem Geoinformatikai Kara Prof. Dr. Závoti József Matematikai statisztikai elemzések 2. MSTE2 modul Helyzetmutatók, átlagok, kvantilisek. A szórás és szóródás egyéb mérőszámai.
RészletesebbenGAZDASÁGI STATISZTIKA
GAZDASÁGI STATISZTIKA Dr. Kun István GÁBOR DÉNES FŐISKOLA Tantárgy: Gazdasági statisztika Kódszám: 224 Lapszám: 1 TÉMAKÖRÖK A STATISZTIKA ALAPFOGALMAI STATISZTIKAI SOROK STATISZTIKAI TÁBLÁK ÖSSZETETT VISZONYSZÁMOK
Részletesebbenbiometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás
Kísérlettervezés - biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás A matematikai-statisztika feladata tapasztalati adatok feldolgozásával segítséget nyújtani
RészletesebbenAdatok statisztikai értékelésének főbb lehetőségei
Adatok statisztikai értékelésének főbb lehetőségei 1. a. Egy- vagy kétváltozós eset b. Többváltozós eset 2. a. Becslési problémák, hipotézis vizsgálat b. Mintázatelemzés 3. Szint: a. Egyedi b. Populáció
RészletesebbenHol terem a magyar statisztikus?
Hol terem a magyar statisztikus? 90 éves az MST jubileumi konferencia Balatonőszöd, 2012. november 15-16. Rappai Gábor PTE KTK Ki a statisztikus? Értelmező Szótár Statisztikával foglalkozó szakember. Etikai
RészletesebbenA sokaság elemei közül a leggyakrabban előforduló érték. diszkrét folytonos
Középérték Középérték A középérték a statisztikai adatok tömör számszerű jellemzése. helyzeti középérték: módusz medián számított középérték: számtani átlag kronológikus átlag harmonikus átlag mértani
RészletesebbenTárgy- és névmutató. C Cox & Snell R négyzet 357 Cramer-V 139, , 151, 155, 159 csoportok közötti korrelációs mátrix 342 csúcsosság 93 95, 102
Tárgy- és névmutató A a priori kontraszt 174 175 a priori kritérium 259, 264, 276 adatbevitel 43, 47, 49 52 adatbeviteli nézet (data view) 45 adat-elôkészítés 12, 37, 62 adatgyûjtés 12, 15, 19, 20, 23,
RészletesebbenBevezető Mi a statisztika? Mérés Csoportosítás
Gazdaságstatisztika 1. előadás Kóczy Á. László Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet Oktatók Előadó Kóczy Á. László (koczy.laszlo@kgk.bmf.hu) Fogadóóra: szerda 11:30 11:55, TA125 Gyakorlatvezető
RészletesebbenSTATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Matematikai statisztika. Mi a modell? Binomiális eloszlás sűrűségfüggvény. Binomiális eloszlás
ELŐADÁS ÁTTEKINTÉSE STATISZTIKA 9. Előadás Binomiális eloszlás Egyenletes eloszlás Háromszög eloszlás Normális eloszlás Standard normális eloszlás Normális eloszlás mint modell 2/62 Matematikai statisztika
RészletesebbenBIOMATEMATIKA ELŐADÁS
BIOMATEMATIKA ELŐADÁS 9. Együttes eloszlás, kovarianca, nevezetes eloszlások Debreceni Egyetem, 2015 Dr. Bérczes Attila, Bertók Csanád A diasor tartalma 1 Bevezetés, definíciók Együttes eloszlás Függetlenség
RészletesebbenMicrosoft Excel 2010. Gyakoriság
Microsoft Excel 2010 Gyakoriság Osztályközös gyakorisági tábla Nagy számú mérési adatokat csoportokba (osztályokba) rendezése -> könnyebb áttekintés Osztályokban szereplő adatok száma: osztályokhoz tartozó
RészletesebbenA sokaság/minta eloszlásának jellemzése
3. előadás A sokaság/mnta eloszlásának jellemzése tpkus értékek meghatározása; az adatok különbözőségének vzsgálata, a sokaság/mnta eloszlásgörbéjének elemzése. Eloszlásjellemzők Középértékek helyzet (Me,
RészletesebbenGAZDASÁGSTATISZTIKA. Készítette: Bíró Anikó. Szakmai felelős: Bíró Anikó. 2010. június
GAZDASÁGSTATISZTIKA Készült a TÁMOP-4.1.2-8/2/A/KMR-29-41pályázati projekt keretében Tartalomfejlesztés az ELTE TáTK Közgazdaságtudományi Tanszékén, az ELTE Közgazdaságtudományi Tanszék, az MTA Közgazdaságtudományi
RészletesebbenTÁMOP-4.2.2/B-10/1-2010-0002 Tantárgyi program (rövidített)
TÁMOP-4.2.2/B-10/1-2010-0002 Tantárgyi program (rövidített) Szakkollégiumi műhely megnevezése: Meghirdetés féléve: Tantárgy/kurzus megnevezése: BGF GKZ Szakkollégiuma 2011/2012. tanév II. félév SZAKKOLLÉGIUM
RészletesebbenFEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI
FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 9 IX. ROBUsZTUs statisztika 1. ROBUsZTUssÁG Az eddig kidolgozott módszerek főleg olyanok voltak, amelyek valamilyen értelemben optimálisak,
RészletesebbenMindent olyan egyszerűvé kell tenni, amennyire csak lehet, de nem egyszerűbbé.
HA 1 Mindent olyan egyszerűvé kell tenni, amennyire csak lehet, de nem egyszerűbbé. (Albert Einstein) HA 2 Halmazok HA 3 Megjegyzések A halmaz, az elem és az eleme fogalmakat nem definiáljuk, hanem alapfogalmaknak
RészletesebbenAz empirikus orvosi kutatások alapgondolata és a kauzalitás
Az empirikus orvosi kutatások alapgondolata és a kauzalitás Ferenci Tamás tamas.ferenci@medstat.hu 2017. október 22. Az orvosi kutatások egy általános sémája felé Az orvostudomány egy jelentős része egész
Részletesebben[Biomatematika 2] Orvosi biometria
[Biomatematika 2] Orvosi biometria Bódis Emőke 2016. 04. 25. J J 9 Korrelációanalízis Regresszióanalízis: hogyan változik egy vizsgált változó értéke egy másik változó változásának függvényében. Korrelációs
RészletesebbenA statisztika oktatásáról konkrétan
A világ statisztikája a statisztika világa ünnepi konferencia Esztergom, 2010.október 15. A statisztika oktatásáról konkrétan Dr. Varga Beatrix PhD. egyetemi docens MISKOLCI EGYETEM Üzleti Statisztika
RészletesebbenBevezetés a statisztikába
Szent István Egyetem Állatorvos-tudományi Kar Biomatematikai és Számítástechnikai Tanszék Biomatematika 9. Bevezetés a statisztikába Fodor János Copyright c Fodor.Janos@aotk.szie.hu Last Revision Date:
RészletesebbenOrvosi szociológia (1. szeminárium) KUTATÁSMÓDSZERTAN
Orvosi szociológia (1. szeminárium) KUTATÁSMÓDSZERTAN (Babbie) 1. Konceptualizáció 2. Operacionalizálás 3. Mérés 4. Adatfeldolgozás 5. Elemzés 6. Felhasználás KUTATÁS LÉPÉSEI 1. Konceptualizáció 2. Operacionalizálás
RészletesebbenKÖZPONTI STATISZTIKAI HIVATAL. Szóbeli vizsgatevékenység
KÖZPONTI STATISZTIKAI HIVATAL A vizsgarészhez rendelt követelménymodul azonosító száma, megnevezése: 2144-06 Statisztikai szervezői és elemzési feladatok A vizsgarészhez rendelt vizsgafeladat megnevezése:
RészletesebbenBevezetés a biometriába Dr. Dinya Elek egyetemi tanár. PhD kurzus
Bevezetés a biometriába Dr. Dinya Elek egyetemi tanár PhD kurzus Mi a statisztika? A sokaság (a sok valami) feletti áttekintés megszerzése, a sokaságról való információszerzés eszköze. Célja: - a sokaságot
RészletesebbenMatematikai statisztika
Matematikai statisztika PROGRAMTERVEZŐ INFORMATIKUS alapszak, A szakirány Arató Miklós Valószínűségelméleti és Statisztika Tanszék Természettudományi Kar 2019. február 11. Arató Miklós (ELTE) Matematikai
RészletesebbenBevezetés a biometriába Dr. Dinya Elek egyetemi tanár. PhD kurzus. KOKI,
Bevezetés a biometriába Dr. Dinya Elek egyetemi tanár PhD kurzus. KOKI, 2015.09.17. Mi a statisztika? A sokaság (a sok valami) feletti áttekintés megszerzése, a sokaságról való információszerzés eszköze.
RészletesebbenBiometria az orvosi gyakorlatban. Korrelációszámítás, regresszió
SZDT-08 p. 1/31 Biometria az orvosi gyakorlatban Korrelációszámítás, regresszió Werner Ágnes Villamosmérnöki és Információs Rendszerek Tanszék e-mail: werner.agnes@virt.uni-pannon.hu Korrelációszámítás
RészletesebbenLeíró statisztika. Adatok beolvasása az R-be és ezek mentése
Leíró statisztika. Adatok beolvasása az R-be és ezek mentése Leíró statisztika Definíciója: populáció egy ismert részhalmazára vonatkozó megfigyelések leírása és összegzése. Jelentősége: nominális adatok
RészletesebbenStatisztika I. 4. előadás Mintavétel. Kóczy Á. László KGK-VMI. Minta Mintavétel Feladatok. http://uni-obuda.hu/users/koczyl/statisztika1.
Statisztika I. 4. előadás Mintavétel http://uni-obuda.hu/users/koczyl/statisztika1.htm Kóczy Á. László KGK-VMI koczy.laszlo@kgk.uni-obuda.hu Sokaság és minta Alap- és mintasokaság A mintasokaság az a részsokaság,
RészletesebbenKvantitatív statisztikai módszerek
Kvantitatív statisztikai módszerek 1. konzultáció tárgyjegyző Dr. Szilágyi Roland Mérési skálák Számok meghatározott szabályok szerinti hozzárendelése jelenségekhez, bizonyos tulajdonságokhoz. 4 féle szabály
RészletesebbenSTATISZTIKA I. Változékonyság (szóródás) A szóródás mutatószámai. Terjedelem. Forgalom terjedelem. Excel függvények. Függvénykategória: Statisztikai
Változékonyság (szóródás) STATISZTIKA I. 5. Előadás Szóródási mutatók A középértékek a sokaság elemeinek értéknagyságbeli különbségeit eltakarhatják. A változékonyság az azonos tulajdonságú, de eltérő
RészletesebbenBiostatisztika Bevezetés. Boda Krisztina előadása alapján ma Bari Ferenc SZTE ÁOK Orvosi Fizikai és Orvosi Informatikai Intézet
Biostatisztika Bevezetés Boda Krisztina előadása alapján ma Bari Ferenc SZTE ÁOK Orvosi Fizikai és Orvosi Informatikai Intézet Az orvosi, biológiai kutatások egyik jellemzője, hogy a vizsgálatok eredményeként
RészletesebbenVALÓSZÍNŰSÉG, STATISZTIKA TANÍTÁSA
VALÓSZÍNŰSÉG, STATISZTIKA TANÍTÁSA A VALÓSZÍNŰSÉGI SZEMLÉLET ALAPOZÁSA 1-6. OSZTÁLY A biztos, a lehetetlen és a lehet, de nem biztos események megkülünböztetése Valószínűségi játékok, kísérletek események
RészletesebbenMatematikai statisztikai elemzések 2.
Matematikai statisztikai elemzések 2. Helyzetmutatók, átlagok, kvantilisek. A szórás és szóródás Prof. Dr. Závoti, József Matematikai statisztikai elemzések 2.: Helyzetmutatók, átlagok, Prof. Dr. Závoti,
RészletesebbenMindent olyan egyszerűvé kell tenni, amennyire csak lehet, de nem egyszerűbbé. (Albert Einstein) Halmazok 1
Halmazok 1 Mindent olyan egyszerűvé kell tenni, amennyire csak lehet, de nem egyszerűbbé. (Albert Einstein) Halmazok 2 A fejezet legfontosabb elemei Halmaz megadási módjai Halmazok közti műveletek (metszet,
RészletesebbenSTATISZTIKA I. A változók mérési szintjei. Nominális változók. Alacsony és magas mérési szint. Nominális változó ábrázolása
A változók mérési szintjei STATISZTIKA I. 3. Előadás Az adatok mérési szintjei, Viszonyszámok A változók az alábbi típusba tartozhatnak: Nominális (kategorikus és diszkrét) Ordinális Intervallum skála
Részletesebben[GVMGS11MNC] Gazdaságstatisztika
[GVMGS11MNC] Gazdaságstatisztika 1. előadás Kóczy Á. László koczy.laszlo@kgk.uni-obuda.hu Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet Óbudai Egyetem Oktatók Előadó Kóczy Á. László (koczy.laszlo@kgk.uni-obuda.hu)
Részletesebben1/8. Iskolai jelentés. 10.évfolyam matematika
1/8 2009 Iskolai jelentés 10.évfolyam matematika 2/8 Matematikai kompetenciaterület A fejlesztés célja A kidolgozásra kerülő programcsomagok az alább felsorolt készségek, képességek közül a számlálás,
RészletesebbenElemi statisztika. >> =weiszd= << december 20. Szerintem nincs sok szükségünk erre... [visszajelzés esetén azt is belerakom] x x = n
Elemi statisztika >> =weiszd=
RészletesebbenBiomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János
Szent István Egyetem Állatorvos-tudományi Kar Biomatematikai és Számítástechnikai Tanszék Biomatematika 12. Regresszió- és korrelációanaĺızis Fodor János Copyright c Fodor.Janos@aotk.szie.hu Last Revision
RészletesebbenSULINOVA PROGRAMTANTERVÉHEZ ILLESZKEDŐ TANMENET 9. ÉVFOLYAM SZÁMÁRA
1 SULINOVA PROGRAMTANTERVÉHEZ ILLESZKEDŐ TANMENET 9. ÉVFOLYAM SZÁMÁRA Heti óraszám: 3 Éves óraszám: 37 x 3 = 111 A tanmenet 101 óra beosztását tartalmazza. A dolgozatok írása és javítása 10 órát foglal
RészletesebbenStatisztika I. 4. előadás Mintavétel. Kóczy Á. László KGK-VMI. Minta Mintavétel Feladatok. http://uni-obuda.hu/users/koczyl/statisztika1.
Statisztika I. 4. előadás Mintavétel http://uni-obuda.hu/users/koczyl/statisztika1.htm Kóczy Á. László KGK-VMI koczy.laszlo@kgk.uni-obuda.hu Sokaság és minta Alap- és mintasokaság A mintasokaság az a részsokaság,
RészletesebbenTerületi statisztikai elemzések
Területi statisztikai elemzések KOTOSZ Balázs, SZTE, kotosz@eco.u-szeged.hu Módszertani dilemmák a statisztikában 2016. november 18. Budapest Apropó Miért különleges a területi adatok elemzése? A számításokhoz
RészletesebbenStatisztika I. 8. előadás. Előadó: Dr. Ertsey Imre
Statisztika I. 8. előadás Előadó: Dr. Ertsey Imre Minták alapján történő értékelések A statisztika foglalkozik. a tömegjelenségek vizsgálatával Bizonyos esetekben lehetetlen illetve célszerűtlen a teljes
RészletesebbenHipotézis, sejtés STATISZTIKA. Kétmintás hipotézisek. Tudományos hipotézis. Munkahipotézis (H a ) Nullhipotézis (H 0 ) 11. Előadás
STATISZTIKA Hipotézis, sejtés 11. Előadás Hipotézisvizsgálatok, nem paraméteres próbák Tudományos hipotézis Nullhipotézis felállítása (H 0 ): Kétmintás hipotézisek Munkahipotézis (H a ) Nullhipotézis (H
Részletesebben[Biomatematika 2] Orvosi biometria
[Biomatematika 2] Orvosi biometria 2016.02.15. Esemény Egy kísérlet vagy megfigyelés (vagy mérés) lehetséges eredményeinek összessége (halmaza) alkotja az eseményteret. Esemény: az eseménytér részhalmazai.
RészletesebbenStatisztikai becslés
Kabos: Statisztika II. Becslés 1.1 Statisztikai becslés Freedman, D. - Pisani, R. - Purves, R.: Statisztika. Typotex, 2005. Reimann J. - Tóth J.: Valószínűségszámítás és matematikai statisztika. Tankönyvkiadó,
RészletesebbenSTATISZTIKA I. Centrális mutatók. Helyzeti középértékek. Középértékek. Bimodális eloszlás, U. Módusz, Mo. 4. Előadás.
Centrális mutatók STATISZTIKA I. 4. Előadás Centrális mutatók 1/51 2/51 Középértékek Helyzeti középértékek A meghatározása gyakoriság vagy sorszám alapján Számítás nélkül Az elemek nagyság szerint rendezett
RészletesebbenPár történeti megjegyzés
Ferenci Tamás tamas.ferenci@medstat.hu 2017. október 22. Az orvosi kutatások egy általános sémája felé Az orvostudomány egy jelentős része egész története alatt igen egyszerű alakban megfogalmazható kérdések
RészletesebbenPár történeti megjegyzés
Pár történeti megjegyzés Ferenci Tamás tamas.ferenci@medstat.hu 2017. október 22. Az orvosi kutatások egy általános sémája felé Az orvostudomány egy jelentős része egész története alatt igen egyszerű alakban
RészletesebbenKorreláció és lineáris regresszió
Korreláció és lineáris regresszió Két folytonos változó közötti összefüggés vizsgálata Szűcs Mónika SZTE ÁOK-TTIK Orvosi Fizikai és Orvosi Informatikai Intézet Orvosi Fizika és Statisztika I. előadás 2016.11.02.
Részletesebben1. Egy Kft dolgozóit a havi bruttó kereseteik alapján csoportosítottuk: Havi bruttó bér, ezer Ft/fő
Figyelem! A példasor nem tartalmazza valamennyi típuspéldát. A dolgozatban az órán leadott feladatok közül bármely típusú előfordulhat. A példasor már a második dolgozat anyagát gyakorló feladatokat is
RészletesebbenStatisztika I. 11. előadás. Előadó: Dr. Ertsey Imre
Statisztika I. 11. előadás Előadó: Dr. Ertsey Imre Összefüggés vizsgálatok A társadalmi gazdasági élet jelenségei kölcsönhatásban állnak, összefüggnek egymással. Statisztika alapvető feladata: - tényszerűségek
RészletesebbenSTATISZTIKA. A maradék független a kezelés és blokk hatástól. Maradékok leíró statisztikája. 4. A modell érvényességének ellenőrzése
4. A modell érvényességének ellenőrzése STATISZTIKA 4. Előadás Variancia-analízis Lineáris modellek 1. Függetlenség 2. Normális eloszlás 3. Azonos varianciák A maradék független a kezelés és blokk hatástól
RészletesebbenBiomatematika 2 Orvosi biometria
Biomatematika 2 Orvosi biometria 2017.02.13. Populáció és minta jellemző adatai Hibaszámítás Valószínűség 1 Esemény Egy kísérlet vagy megfigyelés (vagy mérés) lehetséges eredményeinek összessége (halmaza)
RészletesebbenMatematikai alapok és valószínőségszámítás. Normál eloszlás
Matematikai alapok és valószínőségszámítás Normál eloszlás A normál eloszlás Folytonos változók esetén az eloszlás meghatározása nehezebb, mint diszkrét változók esetén. A változó értékei nem sorolhatóak
Részletesebben1. tétel. Valószínűségszámítás vizsga Frissült: 2013. január 19. Valószínűségi mező, véletlen tömegjelenség.
1. tétel Valószínűségszámítás vizsga Frissült: 2013. január 19. Valószínűségi mező, véletlen tömegjelenség. A valószínűségszámítás tárgya: véletlen tömegjelenségek vizsgálata. véletlen: a kísérlet kimenetelét
Részletesebben[Biomatematika 2] Orvosi biometria
[Biomatematika 2] Orvosi biometria 2016.02.29. A statisztika típusai Leíró jellegű statisztika: összegzi egy adathalmaz jellemzőit. A középértéket jelemzi (medián, módus, átlag) Az adatok változékonyságát
RészletesebbenTANTÁRGYI ÚTMUTATÓ. Statisztika 1.
I. évfolyam BA TANTÁRGYI ÚTMUTATÓ Statisztika 1. TÁVOKTATÁS Tanév 2014/2015 II. félév A KURZUS ALAPADATAI Tárgy megnevezése: Statisztika 1. Tanszék: Módszertani Tantárgyfelelős neve: Sándorné Dr. Kriszt
RészletesebbenFEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI
FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 8 VIII. REGREssZIÓ 1. A REGREssZIÓs EGYENEs Két valószínűségi változó kapcsolatának leírására az eddigiek alapján vagy egy numerikus
RészletesebbenMatematika feladatbank I. Statisztika. és feladatgyűjtemény középiskolásoknak
Matematika feladatbank I. Statisztika Elméleti összefoglaló és feladatgyűjtemény középiskolásoknak ÍRTA ÉS ÖSSZEÁLLÍTOTTA: Dugasz János 2011 Fapadoskonyv.hu Kft. Dugasz János Tartalom Bevezető 7 Adatok
Részletesebben