Mintavétel fogalmai STATISZTIKA I.. Előadás Mintavétel, mintavételi technikák, adatbázis A mintavételt meg kell tervezni A sokaság elemei: X, X X N, lehet véges és végtelen Mintaelemek: x, x x n, mindig véges Véletlen minta = a minta elemek véletlen kiválasztása Kiválasztási arány : Mintavételi hiba Statisztikai adatgyűjtés Abból adódik, hogy nem a teljes sokaságot figyeljük meg. A sokaság heterogén. Kísérletek (ellenőrzött) Részleges adatfelvétel Reprezentatív megfigyelés Teljes körű (cenzus) Véletlen mintavétel Nem véletlen mintavétel Véletlen mintavétel. Homogén sokaság esetén FAE: független azonos eloszlású minta EV: egyszerű véletlen minta. Heterogén sokaság esetén R: rétegzett mintavétel Cs: csoportos (egylépcsős) mintavétel TL: többlépcsős mintavétel Nem véletlenen alapuló kiválasztás. Szisztematikus. Kvótás. Hólabda. Koncentrált. Önkényes 6. Egyéb
A kísérlet tulajdonságai. Jó kísérlet Kezeléshatások Véletlen hiba. Rossz kísérlet Kezeléshatások Szisztematikus hiba Véletlen hiba Reprezentatív minta tulajdonságai. Tükrözi az alapsokaság jellemzőit (lehet általánosítani). Csak a mintavételi hibát tartalmazza. Meghatározható a mintavételi hiba nagysága NEM reprezentatív minta tulajdonságai. Nem lehet belőle általánosítani. A mintavételi hiba mellett szisztematikus hibát is tartalmaz. A levont következtetések kizárólag a megfigyelt egyedekre vonatkoznak Véletlen mintavétel, szisztematikus hiba.minden elem egymástól függetlenül és azonos valószínűséggel kerül a mintába (véletlen számok).előnye: a belőle származtatott statisztikai mutatók csak a véletlen eltérést mutatják az alapsokaság mutatójához képest.szelekció szisztematikus hiba.reprezentativitás Véletlen minta előállítása. Véletlen szám generátor. Pszeudó véletlen szám generátor. Rnd() függvény. Excel Vél() függvénye. VÉL()*(b-a)+a Statisztikai becslés. Valamely paraméter ismeretlen (feltételezett) tényleges értékének közelítő megadása egy statisztikai függvénnyel. Elvileg bármelyik statisztikai függvény tekinthető becslésnek, valójában csak azokat használjuk, amelyeknek megvannak a jó becslés legfontosabb tulajdonságai
A jó becslés kritériumai.kis minta tulajdonságai Torzítatlanság (becsült várható érték = valódi érték) Hatásosság (variancia).nagy minta tulajdonságai Konzisztencia Torzítatlan és konzisztens becslés. Olyan becslés, amelynek várható értéke az igazi paraméter (torzítatlan). Olyan becslés, amely a minta n elemszámának növekedésével (n ) a paraméter igazi értékéhez konvergál sztochasztikusan (erős konzisztencia esetén valószínűséggel) Torzítatlan és hatásos becslés Torzított és hatásos becslés Torzítatlan, de nem hatásos becslés Torzított és nem hatásos becslés
Mi az adatbázis. Egy témakör vagy cél köré csoportosuló információ.. Jó tervezés = hatékony adattárolás és információkinyerés. Célorientált adatbázisok Adatbázis tervezés. Milyen információt akarunk kinyerni?. Milyen elkülönülő tématerületeken kell tárolni az adatokat?. Hogyan kapcsolódnak ezek egymáshoz?. Az egyes területeken belül milyen adatokat kell tárolni? Mi az adat? Minden információ, amit tárolni kell. szám szöveg dátum hang kép, stb. A mértékegységek többszörösei. kilo- k 0. mega- M 0 6. giga- G 0 9. tera- T 0. peta- P 0 6. exa- E 0 8 SI (Systém International d Unités) Adatbázis felépítése Tábla.Tábla (table) Ismérv, tulajdonság, változó, Mező (field) Megfigyelési egység, szubjektum, Rekord (record) Oszlop = változó Sor = megfigyelési egység, rekord
A jó adatbázis (kritériumok).. minden mezőnek egyedi neve van. a mezők elemi információt tartalmaznak ID Év Hely Tömeg Hosszúság A jó adatbázis (kritériumok).. nem lehet két egyforma sora. a sorok és oszlopok sorrendje tetszőleges ID Év Hely Tömeg Hosszúság A jó adatbázis (kritériumok).. ne tartalmazzon származtatott, kiszámított adatot (redundancia) 6. egy mező megváltoztatása nem hathat ki más mezőkre Rossz adatbázis ID Kérdés Válasz Válasz Válasz Válasz Helyes Hol? Itt Ott Amott Emitt ID Év Nettó ÁFA Bruttó A jó adatbázis (kritériumok). Gyakorlat adatbázisa 7. minden szükséges adatot tartalmaz 8. van elsődleges kulcsa ID Év Hely Tömeg Hosszúság
Sorba rendezés. Az adatmátrix sorai csökkenő vagy növekvő sorrendbe rendezhetők.. Meg kell határozni az elsődleges kulcsot, ami szerint a rendezés történjen. Egymásba ágyazott rendezés: elsődleges, másodlagos, harmadlagos stb. kulcs szerint. Szűrés. Eseteket választhatunk ki az adatbázisból. Négy lehetőség közül választhatunk: Minden eset részt vegyen az analízisben. Ha valamilyen feltétel teljesül (if then) Véletlen minta az esetekből Kijelölhetjük az esetek bizonyos tartományát, az első és utolsó eset megjelölésével Használhatunk szűrő változót. Mi legyen a ki nem választott esetek sorsa? Lehet megjelölni és törölni őket az adatbázisból. Aggregálás. Valamilyen ismérv, csoportképző változó vagy változók szerint különböző algoritmusok (számítások) szerint tömöríthetjük az adatokat. Algoritmusok: átlag, összeg, szórás, stb.. Az aggregált adatok további elemzése Transzponálás. Az adatmátrix sorainak és oszlopainak felcserélése, ezzel az esetek és változók szerepei is felcserélődnek. A régi változók nevei a legelső új változó esetei lesznek, a többi új változó neve case_, case_, stb. lesznek.. Nagy jelentősége van a többváltozós statisztikai eljárásoknál az Q és R-technika alkalmazásakor Adatbázis bővítése. Új megfigyelésekkel Feltétel: a két adatbázisban a változók nevei, típusa, stb. tökéletesen egyezzenek. Új változókkal Feltétel: a két adatbázisban legalább egy azonos változó szerepeljen, amely a kulcsváltozó, kapcsoló mező szerepét tölti be Fontosabb statisztikai adatbázisok Magyar Statisztikai Évkönyv Magyar Statisztikai Zsebkönyv Gazdaságstatisztikai Évkönyv (990-től) Élelmiszeripari Statisztikai Zsebkönyv Külkereskedelmi Statisztikai Évkönyv Magyarország Demográfiai évkönyv Ipari és építőipari statisztikai évkönyv Mezőgazdasági statisztikai évkönyv Területi statisztikai évkönyv Nemzetközi Statisztikai Évkönyv FAO Trade Yearbook FAO Production Yearbook EUROSTAT kiadványok 6
Jelentősebb kiadványok Legfrissebb adatok A KSH gyorsjelentések Statisztikai havi közlemények Statisztikai Szemle Gazdaság és Statisztika Területi Statisztika Demográfia Módszertani Füzetek ELŐADÁS Felhasznált forrásai. Lothar Sachs.: Statisztikai módszerek. Mezőgazdasági Kiadó, Budapest, 98.. Baráth Cs.-né. - Ittzés A. - Ugrósdy Gy.: 996. Biometria: módszertan és a MINITAB programcsomag alkalmazása. Mezőgazda Kiadó, Budapest. G.U. Yule M.G. Kendall: Bevezetés a statisztika elméletébe. Közgazdasági és Jogi könyvkiadó, Budapest. 96.. Sváb J.: Biometriai módszerek a kutatásban. Mezőgazdasági Kiadó, Budapest, 97. (második, átdolgozott, bővített kiadás) KÖSZÖNÖM A FIGYELMÜKET KÖVETKEZŐ ELŐADÁS CÍME Az adatok mérési szintjei, jellemző értékek meghatározása, adatábrázolások Előadás anyagát készítette: Dr. Huzsvai László 7