Logisztikus regresszió
|
|
- Csilla Teréz Szalai
- 6 évvel ezelőtt
- Látták:
Átírás
1 Logisztikus regresszió 9. előadás Kvantitatív statisztikai módszerek Dr. Szilágyi Roland
2 Függő változó (y) Nem metrikus Metri kus Gazdaságtudományi Kar Független változó () Nem metrikus Metrikus Kereszttábla elemzés Varianciaanalízis Diszkriminancia-analízis, Logisztikus regresszió Korreláció- és regresszióelemzés Logisztikus regresszió előnyei: Mind metrikus, mind nem metrikus független változók használatát megengedi Kevesebb feltétel teljesülését kívánja meg
3 Logisztikus regresszió Olyan többváltozós módszer, amely segítségével esetek kategorizálását végezhetjük el a függő változó kategóriái szerint. Ellenőrizzük, hogy a csoporthoz való tartozás becsülhető-e, és ha igen, milyen arányban. Lehet: Kétváltozós (a függő változó bináris) Többváltozós
4 A logisztikus regresszió számítás célja A megfigyelési egységek valamely csoportba sorolása. A csoportosítás pontosságának mérése. Tehát beazonosítani azokat a tényezőket, amelyek szignifikánsan megkülönböztetik az esetek csoportjait, és ellenőrizni, hogy a csoporthoz való tartozás becsülhető-e adott független változókkal, és ha igen, hány százalékban.
5 Alkalmazási területei Piackutatás Vásárlási modellezés (vásárol - nem vásárol) Megbízhatóság (vissza fizeti a hitelt, vagy nem) Cégvizsgálat (csődös, vagy nem) Stb.
6 A vizsgálat menete 1 Cél, probléma megfogalmazása 2 Feltételek vizsgálata 3 Elemzés elvégzése 4 Eredmények értelmezése 5 Érvényesség értékelése
7 A logisztikus regresszó-számítás feltételei 1. A változók mérési szintje A függő változó nominális skálán mérhető, - -lehet kétcsoportos ilyen esetben (binomiális 0/1), -lehet több csoportos is (multinomiális). A független változók bármilyen skálán mérhetők. (A nominális változók interakciói is szerepeltethetők a modellben).
8 A logisztikus regresszó-számítás feltételei 2. Az adatok függetlensége Az összes megfigyelésnek függetlennek kell lennie egymástól, vagyis az adatok nem lehetnek korreláltak. Erre az adatgyűjtésnél, mintavételnél komoly figyelmet kell fordítani.
9 A logisztikus regresszó-számítás feltételei 3. A mintanagyság Itt is kritikus pont a megfigyelések számának és a független változók számának aránya. Legalább 60 elemű minta szükséges. A teljes mintanagyság legalább tízszer nagyobb legyen a független változók számánál.
10 A logisztikus regresszó-számítás feltételei 4. Normalitás A független változóknak normális eloszlásúnak kell lenniük. A feltétel sérülhet a kiugró értékek és a helytelen skálás miatt is. Egyváltozós normalitás tesztelése: boplot, QQ ábra, hipotézis vizsgálat. Többváltozós normalitás tesztelése: Mahalanobis-mutató
11 A logisztikus regresszó-számítás feltételei 5. Multikollinearitás Számos eddigi feltétel a többváltozós regresszió számításnál is megtalálható volt, hasonlóan a multikollinearitáshoz. A logisztikus regressziónál is feltételeznünk kell, hogy a független változók csak a függő változóval függnek össze, egymással nem.
12 Logisztikus regresszió A logisztikus regresszió két egymást kölcsönösen kizáró kategória bekövetkezési esélyeinek az egymáshoz való arányát, vagyis az odds mértékét modellezi i magyarázó változók értékeinek az ismeretében. odds Forrás: Hajdu Ottó: Többváltozós statisztikai számítások; KSH, Budapest, P 1 P
13 Logisztikus regresszió Y A logisztikus regresszió feltételezése szerint az odds logaritmusa másképpen a siker valószínűségének logitja a magyarázó változók lineáris függvénye. ln( odds ) logit( P ) p p odds e p p Forrás: Hajdu Ottó: Többváltozós statisztikai számítások; KSH, Budapest, 2003.
14 Logisztikus regresszió Forrás: Hajdu Ottó: Többváltozós statisztikai számítások; KSH, Budapest, p p p p e e P P P odds 1
15 Maimum Likelihood módszer A maimum likelihood módszer célja, hogy adott mérési értékekhez, az ismeretlen paramétereknek olyan becslését adja meg, amely mellett az adott érték a legnagyobb valószínűséggel következik be. Az eljárás a likelihood függvény maimalizálásával történik. Forrás: Wikipedia
16 Maimum Likelihood módszer Az adott kimenet valószínűségét előrejelző függvény paramétereinek (β) becsült értékei adott i magyarázó változók mellett a Likelihood függvény maimumában találhatók, vagyis ahol:. L n 0 e 1 e i p p... p p ma Forrás: Hajdu Ottó: Többváltozós statisztikai számítások; KSH, Budapest, 2003.
17 Modell tesztelés A modell illeszkedésének jóságát a Hosmer- Lemeshow teszt segítségével vizsgáljuk. Ho: illeszkedik H1: nem illeszkedik Az egyedeket a becsült valószínűségek alapján rangsorba rendezi, majd valamely kvantilis (decilis) által meghatározott csoportokon χ 2 tesztet hajt végre.
18 β paraméterek tesztelése H H 0 1 : i 0 : 0 i Wald i = bi s(b i ) 2
19 A modell magyarázóereje Reziduális négyzetösszegre alapozott mutató (lineáris regresszió) Likelihood arányra alapozott mutatók (az elkészített modell Likelihoodját egy alapmodelléhez viszonyítja) A helyes előrejelzések részaránya
20 Pseudo R 2 A Co and Snell R 2 a modell log likelihoodjának értékét egy alapmodell log likelihood értékéhez viszonyítja. A mutató elméleti maimális értéke (ami egy tökéletes modellt feltételez) kisebb, mint egy. A Nagelkerke R 2 az előző mutató skálázási problémáinak korrigálásával határozható meg.
21 Outputok Step 0 Observed Previously defaulted Classification Table a,b Predicted Selected Cases c Unselected Cases d,e Previously Previously defaulted Percenta defaulted Percenta ge ge No Yes Correct No Yes Correct No , ,0 Yes 124 0,0 59 0,0 Overall Percentage 75,2 70,6 a. Constant is included in the model. b. The cut value is,500 Forrás: Help- IBM SPSS Statistics
22 Hosmer and Lemeshow Test Step Chi-square df Sig. 1 3,292 8, ,866 8, ,447 8, ,027 8,855 Forrás: Help- IBM SPSS Statistics
23 Model Summary -2 Log Co & Snell R Nagelkerke R Step likelihood Square Square 1 498,012 a,116, ,301 b,201, ,553 b,257, ,721 c,281,417 Forrás: Help- IBM SPSS Statistics
24 Classification Table a Step 1 Step 2 Step 3 Step 4 Observed Previously defaulted Predicted Selected Cases b Unselected Cases c,d Previously defaulted Previously defaulted Percentage Percentage No Yes Correct No Yes Correct No , ,5 Yes , ,7 Overall Percentage 77,2 75,1 Previously defaulted No , ,8 Yes , ,0 Overall Percentage 79,2 79,1 Previously defaulted No , ,1 Yes , ,5 Overall Percentage 80,2 82,6 Previously defaulted No , ,5 Yes , ,2 Overall Percentage 82,0 80,6
25 Classification table (Confusion matri) valós állapot (observed) előrejelzés (predicted) no (0) yes (1) no (0) valós negatív (VN) álpozitív (ÁP) yes (1) álnegatív (ÁN) valós pozitív (VP) negatív prediktív érték VN/(VN+ÁN) pozitív prediktív érték relevancia/precizitás VP/(ÁP+VP) specificitás VN/(VN+ÁP) szenzitivitás VP/(ÁN+VP) pontosság (VP+VN)/ (VN+ÁP+ÁN+VP)
26 Előrejelzési képesség értelmezése Szenzitivitás: annak a valószínűsége, hogy az előrejelzés 1 lesz egy olyan ügyfél esetében, aki késik (default). Specificitás: annak a valószínűsége, hogy az előrejelzés 0 lesz egy olyan ügyfél esetében, aki nem késik. Pozitív prediktív érték: annak a valószínűsége, hogy az 1 előrejelzés esetében az ügyfél valóban késik. Negatív prediktív érték: annak a valószínűsége, hogy 0 előrejelzés esetében az ügyfél nem késik.
27 Variables in the Equation 95% C.I.for EXP(B) B S.E. Wald df Sig. Ep(B) Lower Upper Step 1 a Debt to income ratio (100),121,017 52,676 1,000 1,129 1,092 1,166 Constant -2,476, ,31 1,000,084 5 Step 2 b Years with current employer -,140,023 38,158 1,000,869,831,909 Debt to income ratio (100),134,018 54,659 1,000 1,143 1,103 1,185 Constant -1,621,259 39,038 1,000,198 Step 3 c Years with current employer -,244,033 54,676 1,000,783,734,836 Debt to income ratio (100),069,022 9,809 1,002 1,072 1,026 1,119 Credit card debt in thousands,506,101 25,127 1,000 1,658 1,361 2,021 Constant -1,058,280 14,249 1,000,347 Step 4 d Years with current employer -,247,034 51,826 1,000,781,731,836 Years at current address -,089,023 15,109 1,000,915,875,957 Debt to income ratio (100),072,023 10,040 1,002 1,074 1,028 1,123 Credit card debt in thousands,602,111 29,606 1,000 1,826 1,470 2,269 Constant -,605,301 4,034 1,045,546
28 Paraméter értekmezés X i 1 egységnyi növekedése esetén az 1 -es előrejelzés esélye átlagosan EXP(B) szeresére változik, minden egyéb változatlansága mellett.
29 Forrás: Help- IBM SPSS Statistics Gazdaságtudományi Kar
30 Köszönöm a figyelmet strolsz@uni-miskolc.hu
Logisztikus regresszió
Logisztikus regresszió Kvantitatív statisztikai módszerek Dr. Szilágyi Roland Függő változó (y) Nem metrikus Metri kus Gazdaságtudományi Kar Független változó (x) Nem metrikus Metrikus Kereszttábla elemzés
Gazdaságtudományi Kar. Gazdaságelméleti és Módszertani Intézet. Logistic regression. Quantitative Statistical Methods. Dr.
Logistic regression Quantitative Statistical Methods Dr. Szilágyi Roland Dependent (y) Quantit ative Qualitative Gazdaságtudományi Kar Connection Analysis Qualitative Independent variable() Quantitative
LOGIT-REGRESSZIÓ a függő változó: névleges vagy sorrendi skála
LOGIT-REGRESSZIÓ a függő változó: névleges vagy sorrendi skála a független változó: névleges vagy sorrendi vagy folytonos skála BIOMETRIA2_NEMPARAMÉTERES_5 1 Y: visszafizeti-e a hitelt x: fizetés (életkor)
Diszkriminancia-analízis
Diszkriminancia-analízis az SPSS-ben Petrovics Petra Doktorandusz Diszkriminancia-analízis folyamata Feladat Megnyitás: Employee_data.sav Milyen tényezőktől függ a dolgozók beosztása? Nem metrikus Független
Gazdaságtudományi Kar. Gazdaságelméleti és Módszertani Intézet. Faktoranalízis előadás. Kvantitatív statisztikai módszerek
Faktoranalízis 6.-7. előadás Kvantitatív statisztikai módszerek Faktoranalízis Olyan többváltozós statisztikai módszer, amely adattömörítésre, a változók számának csökkentésére, az adatstruktúra feltárására
Többváltozós lineáris regressziós modell feltételeinek
Többváltozós lineáris regressziós modell feltételeinek tesztelése I. - A hibatagra vonatkozó feltételek tesztelése - Petrovics Petra Doktorandusz Többváltozós lineáris regressziós modell x 1, x 2,, x p
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet
Fkt Faktoranalízis líi Olyan többváltozós statisztikai módszer, amely adattömörítésre, a változók számának csökkentésére, az adatstruktúra feltárására szolgál. A kiinduló változók számát úgynevezett faktorváltozókba
Többváltozós lineáris regressziós modell feltételeinek tesztelése I.
Többváltozós lineáris regressziós modell feltételeinek tesztelése I. - A hibatagra vonatkozó feltételek tesztelése - Kvantitatív statisztikai módszerek Petrovics Petra Többváltozós lineáris regressziós
Tárgy- és névmutató. C Cox & Snell R négyzet 357 Cramer-V 139, , 151, 155, 159 csoportok közötti korrelációs mátrix 342 csúcsosság 93 95, 102
Tárgy- és névmutató A a priori kontraszt 174 175 a priori kritérium 259, 264, 276 adatbevitel 43, 47, 49 52 adatbeviteli nézet (data view) 45 adat-elôkészítés 12, 37, 62 adatgyûjtés 12, 15, 19, 20, 23,
Regresszió számítás az SPSSben
Regresszió számítás az SPSSben Kvantitatív statisztikai módszerek Petrovics Petra Lineáris regressziós modell X és Y közötti kapcsolatot ábrázoló egyenes. Az Y függ: x 1, x 2,, x p p db magyarázó változótól
Többváltozós Regresszió-számítás
Töváltozós Regresszió-számítás 3. előadás Döntéselőkészítés módszertana Dr. Szilágyi Roland Korreláció Célja a kacsolat szorosságának mérése. Regresszió Célja a kacsolatan megfigyelhető törvényszerűség
Többváltozós lineáris regressziós modell feltételeinek tesztelése II.
Többváltozós lineáris regressziós modell feltételeinek tesztelése II. - A magyarázó változóra vonatkozó feltételek tesztelése - Optimális regressziós modell kialakítása - Kvantitatív statisztikai módszerek
Bevezetés a Korreláció &
Bevezetés a Korreláció & Regressziószámításba Petrovics Petra Doktorandusz Statisztikai kapcsolatok Asszociáció 2 minőségi/területi ismérv között Vegyes kapcsolat minőségi/területi és egy mennyiségi ismérv
Statisztika elméleti összefoglaló
1 Statisztika elméleti összefoglaló Tel.: 0/453-91-78 1. Tartalomjegyzék 1. Tartalomjegyzék.... Becsléselmélet... 3 3. Intervallumbecslések... 5 4. Hipotézisvizsgálat... 8 5. Regresszió-számítás... 11
Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok
STATISZTIKA 1. Előadás Hipotézisvizsgálatok Tematika 1. Hipotézis vizsgálatok 2. t-próbák 3. Variancia-analízis 4. A variancia-analízis validálása, erőfüggvény 5. Korreláció számítás 6. Kétváltozós lineáris
: az i -ik esélyhányados, i = 2, 3,..I
Kabos: Adatelemzés Ordinális logisztikus regresszió-1 Többtényezős regresszió (az adatelemzésben): Y közelítése b 1 X 1 + b 2 X 2 +... + b J X J alakban, y n = b 1 x n,1 + b 2 x n,2 +... + b J x n,j +
Korreláció számítás az SPSSben
Korreláció számítás az SPSSben Kvantitatív statisztikai módszerek Petrovics Petra Statisztikai kapcsolatok Asszociáció 2 minőségi/területi ismérv között Vegyes kapcsolat minőségi/területi és egy mennyiségi
Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János
Szent István Egyetem Állatorvos-tudományi Kar Biomatematikai és Számítástechnikai Tanszék Biomatematika 12. Regresszió- és korrelációanaĺızis Fodor János Copyright c Fodor.Janos@aotk.szie.hu Last Revision
FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI
FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 8 VIII. REGREssZIÓ 1. A REGREssZIÓs EGYENEs Két valószínűségi változó kapcsolatának leírására az eddigiek alapján vagy egy numerikus
Logisztikus regresszió október 27.
Logisztikus regresszió 2017. október 27. Néhány példa Mi a valószínűsége egy adott betegségnek a páciens bizonyos megfigyelt jellemzői (pl. nem, életkor, laboreredmények, BMI stb.) alapján? Mely genetikai
Statisztikai következtetések Nemlineáris regresszió Feladatok Vége
[GVMGS11MNC] Gazdaságstatisztika 10. előadás: 9. Regressziószámítás II. Kóczy Á. László koczy.laszlo@kgk.uni-obuda.hu Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet A standard lineáris modell
Ökonometria. Logisztikus regresszió. Ferenci Tamás 1 Nyolcadik fejezet. Budapesti Corvinus Egyetem. 1 Statisztika Tanszék
Ferenci Tamás 1 tamas.ferenci@medstat.hu 1 Statisztika Tanszék Budapesti Corvinus Egyetem Nyolcadik fejezet Tartalom V. esettanulmány 1 V. esettanulmány Csődelőrejelzés 2 Általános gondolatok 3 becslése
Regressziós vizsgálatok
Regressziós vizsgálatok Regresszió (regression) Általános jelentése: visszaesés, hanyatlás, visszafelé mozgás, visszavezetés. Orvosi területen: visszafejlődés, involúció. A betegség tünetei, vagy maga
Adatok statisztikai értékelésének főbb lehetőségei
Adatok statisztikai értékelésének főbb lehetőségei 1. a. Egy- vagy kétváltozós eset b. Többváltozós eset 2. a. Becslési problémák, hipotézis vizsgálat b. Mintázatelemzés 3. Szint: a. Egyedi b. Populáció
GVMST22GNC Statisztika II. Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet
GVMST22GNC Statisztika II. 3. előadás: 8. Hipotézisvizsgálat Kóczy Á. László Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet Hipotézisvizsgálat v becslés Becslés Ismeretlen paraméter Közeĺıtő
Egy és többváltozós logisztikus regressziós vizsgálatok és alkalmazásaik a klinikumban
Egy és többváltozós logisztikus regressziós vizsgálatok és alkalmazásaik a klinikumban Dr. Prohászka Zoltán Az MTA doktora Semmelweis Egyetem III. Sz. Belgyógyászati Klinika 2015-11-26 prohoz@kut.sote.hu
y ij = µ + α i + e ij
Elmélet STATISZTIKA 3. Előadás Variancia-analízis Lineáris modellek A magyarázat a függő változó teljes heterogenitásának két részre bontását jelenti. A teljes heterogenitás egyik része az, amelynek okai
Osztályozás, regresszió. Nagyméretű adathalmazok kezelése Tatai Márton
Osztályozás, regresszió Nagyméretű adathalmazok kezelése Tatai Márton Osztályozási algoritmusok Osztályozás Diszkrét értékkészletű, ismeretlen attribútumok értékének meghatározása ismert attribútumok értéke
Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió
SZDT-08 p. 1/31 Biometria az orvosi gyakorlatban Korrelációszámítás, regresszió Werner Ágnes Villamosmérnöki és Információs Rendszerek Tanszék e-mail: werner.agnes@virt.uni-pannon.hu Korrelációszámítás
Ökonometria. Logisztikus regresszió. Ferenci Tamás 1 tamas.ferenci@medstat.hu. Nyolcadik fejezet. Budapesti Corvinus Egyetem. 1 Statisztika Tanszék
Ferenci Tamás 1 tamas.ferenci@medstat.hu 1 Statisztika Tanszék Budapesti Corvinus Egyetem Nyolcadik fejezet Tartalom V. esettanulmány 1 V. esettanulmány Csődelőrejelzés 2 Általános gondolatok 3 becslése
Likelihood, deviancia, Akaike-féle információs kritérium
Többváltozós statisztika (SZIE ÁOTK, 2011. ősz) 1 Likelihood, deviancia, Akaike-féle információs kritérium Likelihood függvény Az adatokhoz paraméteres modellt illesztünk. A likelihood függvény a megfigyelt
GYORSTESZTEK ALKALMAZÁSA A
GYORSTESZTEK ALKALMAZÁSA A GYÓGYSZERTÁRAKBAN DR. MISETA ILDIKÓ GÖLLE, SZENT ISTVÁN GYÓGYSZERTÁR Rozsnyay Mátyás emlékverseny Debrecen, 2012. május 10-12. BEVEZETÉS - CÉLKITŰZÉS Miért kell a gyorstesztekkel
Faktoranalízis az SPSS-ben
Faktoranalízis az SPSS-ben Kvantitatív statisztikai módszerek Petrovics Petra Feladat Megnyitás: faktor.sav Fogyasztók materialista vonásai (Richins-skála) Forrás: Sajtos-Mitev, 250.oldal Faktoranalízis
FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI
FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 4 IV. MINTA, ALAPsTATIsZTIKÁK 1. MATEMATIKAI statisztika A matematikai statisztika alapfeladatát nagy általánosságban a következőképpen
Gyakorlat 8 1xANOVA. Dr. Nyéki Lajos 2016
Gyakorlat 8 1xANOVA Dr. Nyéki Lajos 2016 A probléma leírása Azt vizsgáljuk, hogy milyen hatása van a család jövedelmének a tanulók szövegértés teszten elért tanulmányi eredményeire. A minta 59 iskola adatait
Logisztikus regresszió
Logisztikus regresszió Bekövetkezés esélye Valószínűség (P): 0 és 1 közötti valós szám, az esemény bekövetkezésének esélyét fejezi ki. Fej dobásának esélye: 1:2 = 1 2 = 0,5. Odds/esélyérték (O): a tét
Sztochasztikus kapcsolatok
Sztochasztikus kapcsolatok Petrovics Petra PhD Hallgató Ismérvek közötti kapcsolat (1) Függvényszerű az egyik ismérv szerinti hovatartozás egyértelműen meghatározza a másik ismérv szerinti hovatartozást.
Matematikai statisztika c. tárgy oktatásának célja és tematikája
Matematikai statisztika c. tárgy oktatásának célja és tematikája 2015 Tematika Matematikai statisztika 1. Időkeret: 12 héten keresztül heti 3x50 perc (előadás és szeminárium) 2. Szükséges előismeretek:
Hipotézis, sejtés STATISZTIKA. Kétmintás hipotézisek. Tudományos hipotézis. Munkahipotézis (H a ) Nullhipotézis (H 0 ) 11. Előadás
STATISZTIKA Hipotézis, sejtés 11. Előadás Hipotézisvizsgálatok, nem paraméteres próbák Tudományos hipotézis Nullhipotézis felállítása (H 0 ): Kétmintás hipotézisek Munkahipotézis (H a ) Nullhipotézis (H
Biometria az orvosi gyakorlatban. Regresszió Túlélésanalízis
SZDT-09 p. 1/36 Biometria az orvosi gyakorlatban Regresszió Túlélésanalízis Werner Ágnes Villamosmérnöki és Információs Rendszerek Tanszék e-mail: werner.agnes@virt.uni-pannon.hu Logisztikus regresszió
Statisztika II előadáslapok. 2003/4. tanév, II. félév
Statisztika II előadáslapok 3/4 tanév, II félév BECSLÉS ÉS HIPOTÉZISVIZSGÁLAT Egyik konzervgyár vágott zöldbabot exportál A szabvány szerint az üvegek nettó töltősúlyának az átlaga 3 g, a szórása 5 g Az
Lineáris regressziószámítás 1. - kétváltozós eset
Lineáris regressziószámítás 1. - kétváltozós eset Orlovits Zsanett 2019. február 6. Adatbázis - részlet eredmény- és magyarázó jellegű változók Cél: egy eredményváltozó alakulásának jellemzése a magyarázó
Az első számjegyek Benford törvénye
Az első számjegyek Benford törvénye Frank Benford (1883-1948) A General Electric fizikusa Simon Newcomb (1835 1909) asztronómus 1. oldal 2. oldal A híres arizonai csekk sikkasztási eset http://www.aicpa.org/pubs/jofa/may1999/nigrini.htm
Statisztika I. 12. előadás. Előadó: Dr. Ertsey Imre
Statisztika I. 1. előadás Előadó: Dr. Ertsey Imre Regresszió analízis A korrelációs együttható megmutatja a kapcsolat irányát és szorosságát. A kapcsolat vizsgálata során a gyakorlatban ennél messzebb
6. előadás - Regressziószámítás II.
6. előadás - Regressziószámítás II. 2016. október 10. 6. előadás 1 / 30 Specifikációs hibák A magyarázó- és eredményváltozók kiválasztásának alapja: szakirányú elmélet, mögöttes viselkedés ismerete, múltbeli
Több diszkrét kimenet multinomiális és feltételes logit modellek
Több diszkrét kimenet multinomiális és feltételes logit modellek Mikroökonometria, 9. hét Bíró Anikó A tananyag a Gazdasági Versenyhivatal Versenykultúra Központa és a Tudás-Ökonómia Alapítvány támogatásával
Typotex Kiadó. Tartalomjegyzék
Tartalomjegyzék Bevezetés... 11 A hasznos véletlen hiba... 13 I. Adatredukciós módszerek... 17 1. Fıkomponens-elemzés... 18 1.1. A fıkomponens jelentése... 25 1.2. Mikor használjunk fıkomponens-elemzést?...
Egészségügyi mérnöki mesterszak hallgatói adatainak elemzése. Computational Biomedicine (Combine) workgroup
Egészségügyi mérnöki mesterszak hallgatói adatainak elemzése Antal Péter Computational Biomedicine (Combine) workgroup Department of Measurement and Information Systems Budapest University of Technology
Többváltozós lineáris regresszió 3.
Többváltozós lineáris regresszió 3. Orlovits Zsanett 2018. október 10. Alapok Kérdés: hogyan szerepeltethetünk egy minőségi (nominális) tulajdonságot (pl. férfi/nő, egészséges/beteg, szezonális hatások,
Kvantitatív statisztikai módszerek
Kvantitatív statisztikai módszerek 1. konzultáció tárgyjegyző Dr. Szilágyi Roland Mérési skálák Számok meghatározott szabályok szerinti hozzárendelése jelenségekhez, bizonyos tulajdonságokhoz. 4 féle szabály
Korrelációs kapcsolatok elemzése
Korrelációs kapcsolatok elemzése 1. előadás Kvantitatív statisztikai módszerek Két változó közötti kapcsolat Független: Az X ismérv szerinti hovatartozás ismerete nem ad semmilyen többletinformációt az
Lineáris regresszió vizsgálata resampling eljárással
Lineáris regresszió vizsgálata resampling eljárással Dolgozatomban az European Social Survey (ESS) harmadik hullámának adatait fogom felhasználni, melyben a teljes nemzetközi lekérdezés feldolgozásra került,
Magyarországon személysérüléses közúti közlekedési balesetek okozóik és abból alkoholos állapotban lévők szerinti elemzése. Rezsabek Tamás GSZDI
Magyarországon személysérüléses közúti közlekedési balesetek okozóik és abból alkoholos állapotban lévők szerinti elemzése Rezsabek Tamás GSZDI Anyag és módszer Központi Statisztikai Hivatalának adatai
11.Négymezős táblázatok. Egyezés mérése: kappa statisztika Kockázat becslés: esélyhányados (OR) Kockázat becslés: relatív kockázat (RR)
.Négymezős táblázatok Egyezés mérése: kappa statisztika Kockázat becslés: esélyhányados (OR) Kockázat becslés: relatív kockázat (RR) Az egyezés mérése:cohen s Kappa Kappa: az egyezés mérése két nominális
Diagnosztika és előrejelzés
2018. november 28. A diagnosztika feladata A modelldiagnosztika alapfeladatai: A modellillesztés jóságának vizsgálata (idősoros adatok esetén, a regressziónál már tanultuk), a reziduumok fehérzaj voltának
A LAKOSSÁGI ENERGIAFELHASZNÁLÁS ÉS AZ ÉLETSZÍNVONAL KÖZÖTTI ÖSSZEFÜGGÉS SZUBJEKTÍV TÉNYEZŐK ASPEKTUSÁBÓL
Anyagmérnöki Tudományok, 38/1. (2013), pp. 57 65. A LAKOSSÁGI ENERGIAFELHASZNÁLÁS ÉS AZ ÉLETSZÍNVONAL KÖZÖTTI ÖSSZEFÜGGÉS SZUBJEKTÍV TÉNYEZŐK ASPEKTUSÁBÓL CORRESPONDENCE BETWEEN PUBLIC ENERGY CONSUMPTION
Egy és (többváltozós) logisztikus regressziós vizsgálatok és alkalmazásaik a klinikumban
Egy és (többváltozós) logisztikus regressziós vizsgálatok és alkalmazásaik a klinikumban Dr. Prohászka Zoltán Az MTA doktora Semmelweis Egyetem III. Sz. Belgyógyászati Klinika 2016-11-24 prohoz@kut.sote.hu
Több valószínűségi változó együttes eloszlása, korreláció
Tartalomjegzék Előszó... 6 I. Valószínűségelméleti és matematikai statisztikai alapok... 8 1. A szükséges valószínűségelméleti és matematikai statisztikai alapismeretek összefoglalása... 8 1.1. Alapfogalmak...
Függetlenségvizsgálat, Illeszkedésvizsgálat
Varga Beatrix, Horváthné Csolák Erika Függetlenségvizsgálat, Illeszkedésvizsgálat 4. előadás Üzleti statisztika A sokaság/minta több ismérv szerinti vizsgálata A statisztikai elemzés egyik ontos eladata
DOKTORI (PhD) ÉRTEKEZÉS TÉZISEI
DOKTORI (PhD) ÉRTEKEZÉS TÉZISEI HÁMORI GÁBOR Kaposvári Egyetem 2014 KAPOSVÁRI EGYETEM Gazdálkodás- és Szervezéstudományok Doktori Iskola Doktori Iskola vezetője: PROF. DR. Kerekes Sándor MTA Doktora Témavezető:
Két diszkrét változó függetlenségének vizsgálata, illeszkedésvizsgálat
Két diszkrét változó függetlenségének vizsgálata, illeszkedésvizsgálat Szűcs Mónika SZTE ÁOK-TTIK Orvosi Fizikai és Orvosi Informatikai Intézet Orvosi fizika és statisztika I. előadás 2016.11.09 Orvosi
1. ábra: Magyarországi cégek megoszlása és kockázatossága 10-es Rating kategóriák szerint. Cégek megoszlása. Fizetésképtelenné válás valószínűsége
Bisnode Minősítés A Bisnode Minősítést a lehető legkorszerűbb, szofisztikált matematikai-statisztikai módszertannal, hazai és nemzetközi szakértők bevonásával fejlesztettük. A Minősítés a múltra vonatkozó
biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás
Kísérlettervezés - biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás A matematikai-statisztika feladata tapasztalati adatok feldolgozásával segítséget nyújtani
Khi-négyzet eloszlás. Statisztika II., 3. alkalom
Khi-négyzet eloszlás Statisztika II., 3. alkalom A khi négyzet eloszlást (Pearson) leggyakrabban kategorikus adatok elemzésére használjuk. N darab standard normális eloszlású változó négyzetes összegeként
9.1.1 Az 1919-1999 között megjelent lapcímek település szerinti bontásban, korszakonként
9. MELLÉKLETEK 9.1 Lapstatisztikák 9.1.1 Az 1919-1999 között megjelent lapcímek település szerinti bontásban, korszakonként 42. táblázat 1919. január. 1 1940. augusztus. 30 1940. augusztus 31 1944. december
[Biomatematika 2] Orvosi biometria. Visegrády Balázs
[Biomatematika 2] Orvosi biometria Visegrády Balázs 2016. 03. 27. Probléma: Klinikai vizsgálatban három különböző antiaritmiás gyógyszert (ß-blokkoló) alkalmaznak, hogy kipróbálják hatásukat a szívműködés
Statisztikai alapismeretek (folytatás) 4. elıadás (7-8. lecke) Becslések, Hipotézis vizsgálat
Statisztikai alapismeretek (folytatás) 4. elıadás (7-8. lecke) Becslések, Hipotézis vizsgálat 7. lecke Paraméter becslés Konfidencia intervallum Hipotézis vizsgálat feladata Paraméter becslés és konfidencia
Elemi statisztika. >> =weiszd= << december 20. Szerintem nincs sok szükségünk erre... [visszajelzés esetén azt is belerakom] x x = n
Elemi statisztika >> =weiszd=
A biostatisztika alapfogalmai, hipotézisvizsgálatok. Dr. Boda Krisztina Boda PhD SZTE ÁOK Orvosi Informatikai Intézet
A biostatisztika alapfogalmai, hipotézisvizsgálatok Dr. Boda Krisztina Boda PhD SZTE ÁOK Orvosi Informatikai Intézet Hipotézisvizsgálatok A hipotézisvizsgálat során a rendelkezésre álló adatok (statisztikai
Egymintás próbák. Alapkérdés: populáció <paramétere/tulajdonsága> megegyezik-e egy referencia paraméter értékkel/tulajdonsággal?
Egymintás próbák σ s μ m Alapkérdés: A populáció egy adott megegyezik-e egy referencia paraméter értékkel/tulajdonsággal? egymintás t-próba Wilcoxon-féle előjeles
Esettanulmány. A homoszkedaszticitás megsértésének hatása a regressziós paraméterekre. Tartalomjegyzék. 1. Bevezetés... 2
Esettanulmány A homoszkedaszticitás megsértésének hatása a regressziós paraméterekre Tartalomjegyzék 1. Bevezetés... 2 2. A lineáris modell alkalmazhatóságának feltételei... 2 3. A feltételek teljesülésének
Populációbecslés és monitoring. Eloszlások és alapstatisztikák
Populációbecslés és monitoring Eloszlások és alapstatisztikák Eloszlások Az eloszlás megadja, hogy milyen valószínűséggel kapunk egy adott intervallumba tartozó értéket, ha egy olyan populációból veszünk
FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI
FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 9 IX. ROBUsZTUs statisztika 1. ROBUsZTUssÁG Az eddig kidolgozott módszerek főleg olyanok voltak, amelyek valamilyen értelemben optimálisak,
Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet
Klaszteranalízis Hasonló dolgok csoportosítását jelenti, gyakorlatilag az osztályozás szinonimájaként értelmezhetjük. A klaszteranalízis célja A klaszteranalízis alapvető célja, hogy a megfigyelési egységeket
4/24/12. Regresszióanalízis. Legkisebb négyzetek elve. Regresszióanalízis
1. feladat Regresszióanalízis. Legkisebb négyzetek elve 2. feladat Az iskola egy évfolyamába tartozó diákok átlagéletkora 15,8 év, standard deviációja 0,6 év. A 625 fős évfolyamból hány diák fiatalabb
Faktoranalízis az SPSS-ben
Faktoranalízis az SPSS-ben = Adatredukciós módszer Petrovics Petra Doktorandusz Feladat Megnyitás: faktoradat_msc.sav Forrás: Sajtos-Mitev 250.oldal Fogyasztók materialista vonásai (Richins-skála) Faktoranalízis
[Biomatematika 2] Orvosi biometria
[Biomatematika 2] Orvosi biometria 2016.02.29. A statisztika típusai Leíró jellegű statisztika: összegzi egy adathalmaz jellemzőit. A középértéket jelemzi (medián, módus, átlag) Az adatok változékonyságát
A többváltozós lineáris regresszió III. Főkomponens-analízis
A többváltozós lineáris regresszió III. 6-7. előadás Nominális változók a lineáris modellben 2017. október 10-17. 6-7. előadás A többváltozós lineáris regresszió III., Alapok Többváltozós lineáris regresszió
STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Matematikai statisztika. Mi a modell? Binomiális eloszlás sűrűségfüggvény. Binomiális eloszlás
ELŐADÁS ÁTTEKINTÉSE STATISZTIKA 9. Előadás Binomiális eloszlás Egyenletes eloszlás Háromszög eloszlás Normális eloszlás Standard normális eloszlás Normális eloszlás mint modell 2/62 Matematikai statisztika
STATISZTIKA. A maradék független a kezelés és blokk hatástól. Maradékok leíró statisztikája. 4. A modell érvényességének ellenőrzése
4. A modell érvényességének ellenőrzése STATISZTIKA 4. Előadás Variancia-analízis Lineáris modellek 1. Függetlenség 2. Normális eloszlás 3. Azonos varianciák A maradék független a kezelés és blokk hatástól
5. előadás - Regressziószámítás
5. előadás - Regressziószámítás 2016. október 3. 5. előadás 1 / 18 Kétváltozós eset A modell: Y i = α + βx i + u i, i = 1,..., T, ahol X i független u i -től minden i esetén, (u i ) pedig i.i.d. sorozat
KÖVETKEZTETŐ STATISZTIKA
ÁVF GM szak 2010 ősz KÖVETKEZTETŐ STATISZTIKA A MINTAVÉTEL BECSLÉS A sokasági átlag becslése 2010 ősz Utoljára módosítva: 2010-09-07 ÁVF Oktató: Lipécz György 1 A becslés alapfeladata Pl. Hányan láttak
Centura Szövegértés Teszt
Centura Szövegértés Teszt Megbízhatósági vizsgálata Tesztfejlesztők: Megbízhatósági vizsgálatot végezte: Copyright tulajdonos: Bóka Ferenc, Németh Bernadett, Selmeci Gábor Bodor Andrea Centura Kft. Dátum:
Kabos: Statisztika II. t-próba 9.1. Ha ismert a doboz szórása de nem ismerjük a
Kabos: Statisztika II. t-próba 9.1 Egymintás z-próba Ha ismert a doboz szórása de nem ismerjük a doboz várhatóértékét, akkor a H 0 : a doboz várhatóértéke = egy rögzített érték hipotézisről úgy döntünk,
Eloszlás-független módszerek (folytatás) 14. elıadás ( lecke) 27. lecke khí-négyzet eloszlású statisztikák esetszámtáblázatok
Eloszlás-független módszerek (folytatás) 14. elıadás (7-8. lecke) Illeszkedés-vizsgálat 7. lecke khí-négyzet eloszlású statisztikák esetszámtáblázatok elemzésére Illeszkedés-vizsgálat Gyakorisági sorok
Mintavétel fogalmai STATISZTIKA, BIOMETRIA. Mintavételi hiba. Statisztikai adatgyűjtés. Nem véletlenen alapuló kiválasztás
STATISZTIKA, BIOMETRIA. Előadás Mintavétel, mintavételi technikák, adatbázis Mintavétel fogalmai A mintavételt meg kell tervezni A sokaság elemei: X, X X N, lehet véges és végtelen Mintaelemek: x, x x
1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása
HIPOTÉZIS VIZSGÁLAT A hipotézis feltételezés egy vagy több populációról. (pl. egy gyógyszer az esetek 90%-ában hatásos; egy kezelés jelentősen megnöveli a rákos betegek túlélését). A hipotézis vizsgálat
2013 ŐSZ. 1. Mutassa be az egymintás z-próba célját, alkalmazásának feltételeit és módszerét!
GAZDASÁGSTATISZTIKA KIDOLGOZOTT ELMÉLETI KÉRDÉSEK A 3. ZH-HOZ 2013 ŐSZ Elméleti kérdések összegzése 1. Mutassa be az egymintás z-próba célját, alkalmazásának feltételeit és módszerét! 2. Mutassa be az
STATISZTIKA. Egymintás u-próba. H 0 : Kefir zsírtartalma 3% Próbafüggvény, alfa=0,05. Egymintás u-próba vagy z-próba
Egymintás u-próba STATISZTIKA 2. Előadás Középérték-összehasonlító tesztek Tesztelhetjük, hogy a valószínűségi változónk értéke megegyezik-e egy konkrét értékkel. Megválaszthatjuk a konfidencia intervallum
Heckman modell. Szelekciós modellek alkalmazásai.
Heckman modell. Szelekciós modellek alkalmazásai. Mikroökonometria, 12. hét Bíró Anikó A tananyag a Gazdasági Versenyhivatal Versenykultúra Központja és a Tudás-Ökonómia Alapítvány támogatásával készült
Korreláció és lineáris regresszió
Korreláció és lineáris regresszió Két folytonos változó közötti összefüggés vizsgálata Szűcs Mónika SZTE ÁOK-TTIK Orvosi Fizikai és Orvosi Informatikai Intézet Orvosi Fizika és Statisztika I. előadás 2016.11.02.
y ij = µ + α i + e ij STATISZTIKA Sir Ronald Aylmer Fisher Példa Elmélet A variancia-analízis alkalmazásának feltételei Lineáris modell
Példa STATISZTIKA Egy gazdálkodó k kukorica hibrid termesztése között választhat. Jelöljük a fajtákat A, B, C, D-vel. Döntsük el, hogy a hibridek termesztése esetén azonos terméseredményre számíthatunk-e.
Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1
Statisztika - bevezetés 00.04.05. Méréselmélet PE MIK MI_BSc VI_BSc Bevezetés Véletlen jelenség fogalma jelenséget okok bizonyos rendszere hozza létre ha mindegyik figyelembe vehető egyértelmű leírás általában
Egy és (többváltozós) logisztikus regressziós vizsgálatok és alkalmazásaik a klinikumban
Egy és (többváltozós) logisztikus regressziós vizsgálatok és alkalmazásaik a klinikumban Dr. Prohászka Zoltán Az MTA doktora Semmelweis Egyetem III. Sz. Belgyógyászati Klinika 2017-11-23 prohoz@kut.sote.hu
STATISZTIKA. Fogalom. A standard lineáris regressziós modell mátrixalgebrai jelölése. A standard lineáris modell. Eredménytáblázat
Fogalom STATISZTIKA 8 Előadás Többszörös lineáris regresszió Egy jelenség vizsgálata során általában az adott jelenséget több tényező befolyásolja, vagyis többnyire nem elegendő a kétváltozós modell elemzése
Least Squares becslés
Least Squares becslés A négyzetes hibafüggvény: i d i ( ) φx i A négyzetes hibafüggvény mellett a minimumot biztosító megoldás W=( d LS becslés A gradiens számítása és nullává tétele eredményeképp A megoldás
Varianciaanalízis 4/24/12
1. Feladat Egy póker kártya keverő gép a kártyákat random módon választja ki. A vizsgálatban 1600 választott kártya színei az alábbi gyakorisággal fordultak elő. Vizsgáljuk meg, hogy a kártyák kiválasztása
Kísérlettervezés alapfogalmak
Kísérlettervezés alapfogalmak Rendszermodellezés Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika és Információs Rendszerek Tanszék Kísérlettervezés Cél: a modell paraméterezése a valóság alapján
A gravitációs modell felhasználása funkcionális távolságok becslésére
A gravitációs modell felhasználása funkcionális távolságok becslésére Dusek Tamás egyetemi tanár Széchenyi István Egyetem Eger, 2015. november 20. Gravitációs modell "A" város "B" város 100 000 lakos 100
PDF created with FinePrint pdffactory Pro trial version Adott egy X folytonos változó, ami normális eloszlású.
Á dott egy X folytonos változó, ami normális eloszlású. X ( µ,σ ) dottak ezen kívül az Y,Y,,Y k diszkrét változók (faktorok) total H 0 : X - re nincs hatással Y Q = Q + Q +... + Q + Q + Q3 +... + Q k hiba