Tantárgykódok STATISZTIKA I. GT_APSN018 GT_AKMN021 GT_ATVN020 1. Előadás Bevezetés, a statisztika szerepe Oktatók Előadó: Dr. habil. Huzsvai László tanszékvezető Gyakorlatvezetők: Dr. Balogh Péter Dr. Csipkés Margit Dr. Nagy Lajos Dr. Soltész Angéla Időbeosztás Szeptember 21. December 11. új ismeretek átadása. December 14. December 18. gyakorlati jegy megszerzése. Tematika 1. Bevezetés, alapfogalmak 2. Mintavétel, adatbázisok 3. Az adatok mérési szintjei, jellemző értékek, adatábrázolás 4. Viszonyszámok 5. Centrális mutató 6. Szóródási mutatók 7. A koncentráció mérése 8. Indexek 9. Normális, standard normális és t-eloszlás 10. Konfidencia intervallumok 11. Hipotézisvizsgálatok, nem paraméteres próbák http://www.agr.unideb.hu/~huzsvai 1
Kötelező irodalom Kötelező irodalom: Huzsvai L. (szerk.): STATISZTIKA Gazdaságelemzők részére (Excel és R alkalmazások), Seneca-Books, Debrecen, 2012. Tankönyvek Ajánlott irodalom: Huzsvai L. (2013): Variancia-anlalízisek az R-ben, Seneca-Books, Debrecen. Hunyadi L. Vita L.: Statisztika I. Aula Kiadó, Budapest, 2008. 1-348. o. Hunyadi L. Vita L.: Statisztika II. Aula Kiadó, Budapest, 2008. 1-300. o. Hunyadi L. Vita L.: Statisztikai képletek és táblázatok (oktatási segédlet), Aula Kiadó, Budapest, 2008. 1-51. o. Szűcs I.: Alkalmazott Statisztika Agroinform Kiadó, Budapest, 2002. 1-551. o. Kerékgyártó Gy-né L. Balogh I. Sugár A. Szarvas B.: Statisztikai módszerek és alkalmazásuk a gazdasági és társadalmi elemzésekben AULA Kiadó, Budapest, 2008. 1-446. o. Rappai G.: Üzleti statisztika Excellel. KSH, 2001. Reiczigel J.-Harnos A.-Solymosi N.: Biostatisztika nem statisztikusoknak. Parst Kft. Nagykovácsi, 2007. Tankönyv Churcill és a statisztika Csak abban a statisztikában hiszek, amit én magam hamisítok NEM IGAZ Statisztikai programok 1. MS Excel? 2. LibreOffice Calc? 3. R Statistics 4. SPSS 5. SAS 6. MATLAB 7. MINITAB 8. stb 2
R Statistics Miért tanuljunk statisztikát? 1. Elhiggyük-e amit olvasunk vagy hallunk? 2. Jobban értsük a világot 3. Statisztikai bűvészkedések felismerése Mimikri Elhiggyük? Egy 2002-es tanulmány szerint azok, akik naponta nyolc óránál többet alszanak, az átlagosnál nagyobb valószínűséggel halnak meg. Forrás: Reiczigel et al.: Biostatisztika Elhiggyük? Csalás az átlagjövedelem számításában? Kiderült, hogy az emberek többsége kevesebbet keres, mint az átlagjövedelem KSH által közölt értéke! Elhiggyük? Az emberek túlnyomó többségének az átlagosnál több lába van. Forrás: Reiczigel et al.: Biostatisztika Forrás: Reiczigel et al.: Biostatisztika 3
A statisztika fogalma 1. A statisztika a valóság minőségi és mennyiségi információinak megfigyelésére, összegzésére, elemzésére és modellezésére irányuló gyakorlati tevékenység és tudomány. 2. Gyakran hívják statisztikának a statisztikai tevékenység eredményeként keletkező adatokat is. Alapfogalmak 1. Sokaság: A megfigyelési egységek, egyedek összessége, amire a statisztikai megfigyelés irányul. 2. Ismérv: A sokaság egyedeinek tulajdonsága Mit mérek: Milyen? Mennyi? (mértékegység) Hol? Mikor? Egyéb metaadatok 3. Paraméter 4. Minta A statisztika nyelvezete Paraméter 1. Kijelentéseit, egy adott intervallumra vonatkoztatva, valószínűségi állítás formájában fogalmazza meg. Az alapsokaság ismeretlen jellemző értékeit paraméternek nevezzük (görög betűvel jelöljük) Hatvan százalék az esélye, valószínűsége annak, hogy holnap 20 és 30 mm közötti csapadék fog esni. Minta 1. A minta adataiból az alapsokaság ismeretlen paramétereire következtetünk 2. A minta középértékből az alapsokaság középértékére következtetünk 3. Megbízhatósági intervallum 4. Valószínűség s σ A statisztika részterületei 1. Leíró statisztika, exploratív adatelemzés Célja egy már rendelkezésre álló, valóságra vonatkozó adathalmaz összefoglalása, elemzése, információtömörítés. Statisztikai módszerek alkalmazása, hogy megismerjük a sokaság legfontosabb statisztikai jellemzőit. 2. Matematikai statisztika 4
Leíró statisztika 1. Gyakoriságok 2. Kvantilis értékek 3. Centrális mutatók (középértékek): medián, módusz, átlag 4. Szóródási mutatók: terjedelem, szórás, relatív szórás, stb. 5. Viszonyszámok 6. Indexek Matematikai statisztika 1. Reprezentatív mintavétel alapján a sokaság jellemző paramétereinek becslése (átlag, szórás, stb.) 2. Minta alapján az alapsokaságra vonatkozó feltételezések, hipotézisek igazolása. 3. Összefüggés vizsgálatok sztochasztikus modellekkel A statisztikai munka fázisai 1. Megfigyelés, empíria A semmiféle elmélettel sem értelmezhető megfigyelések teljesen haszontalanok. SELYE 5
A tehén 2. A probléma megfogalmazása Munkahipotézis Mi a modell? 3. Modellalkotás Nullhipotézis A modell bonyolult természeti képződmények, objektumok működésének megismerésére létrehozott egyszerűsített helyettesítő. Nem a valóság lekicsinyítése! 6
Sztochasztikus modell 4. Adatgyűjtés megtervezése Minimális mintaszám meghatározása Átlag Mintavételi technikák Szórás Szórás Kísérlettervezés 5. Adatgyűjtés 1. Mintavétel 2. Kísérlet beállítása, mérés A kísérlet Megfelelő elméleti megalapozás után kialakított elgondolás, következtetés helyes vagy helytelen voltának mérésekkel történő ellenőrzése. Foltszerű bizonytalan megoldások. Mi okozza? A folyamat sztochasztikus jellege 6. Adatbázis készítése 1. Relációs adatbázisok 7. Elemzés Az adatokból a modell paramétereinek meghatározása 7
8. A modell validálása (érvényessége) 1. Az alkalmazhatósági feltételek megvizsgálása 9. Becslés a modell segítségével Számokkal kiértékelhető modell, melyet alkalmazva képesek vagyunk a jelenségek mennyiségi előrejelzésére Még nem ismert jelenségek becslése, előrejelzése a modell segítségével 10. Döntés KÖSZÖNÖM A FIGYELMÜKET KÖVETKEZŐ ELŐADÁS CÍME Mintavétel, mintavételi technikák Előadás anyagát készítette: Dr. habil. Huzsvai László 8