társadalomtudományokban

Hasonló dokumentumok
Melyik vállalatok nőnek gyorsan békés időkben és válságban? Muraközy Balázs MTA KRTK KTI Közgazdász Vándorgyűlés, Gyula, 2013

Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

Foglalkoztatási modul

Heckman modell. Szelekciós modellek alkalmazásai.

Az 1998-as szakiskolai reform hatása

Statisztikai következtetések Nemlineáris regresszió Feladatok Vége

A MIDAS_HU eredményeinek elemzése, továbbfejlesztési javaslatok HORVÁTH GYULA MÁJUS 28.

Regressziós vizsgálatok

Képesség. Beszámoló Verify képességtesztek eredményéről. Név László Hammer. Dátum 2018 szeptember 28. SHL.com

ELTE TáTK Közgazdaságtudományi Tanszék MAKROÖKONÓMIA. Készítette: Horváth Áron, Pete Péter. Szakmai felelős: Pete Péter

ELTE TáTK Közgazdaságtudományi Tanszék GAZDASÁGSTATISZTIKA. Készítette: Bíró Anikó. Szakmai felelős: Bíró Anikó június

ELTE TáTK Közgazdaságtudományi Tanszék ÖKONOMETRIA. Készítette: Elek Péter, Bíró Anikó. Szakmai felelős: Elek Péter június

A regisztrált álláskeresők számára vonatkozó becslések előrejelző képességének vizsgálata

Válság és előrejelzés

Szakpolitikai programok és intézményi változások hatásának elemzése

Bevezetés a Korreláció &

Uniós források és hatásuk -- mennyiségek és mérési lehetőségek Major Klára. HÉTFA Kutatóintézet és Elemző Központ

6. előadás - Regressziószámítás II.

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

11. Infláció, munkanélküliség és a Phillipsgörbe

Képesség. Beszámoló Verify képességtesztek eredményéről. Név Mr. Jelölt. Dátum.

8. HÁZASSÁG, GYERMEKVÁLLALÁS 8.1. A TINÉDZSERKORI GYERMEKVÁLLALÁS HATÁSA

Tartalomjegyzék I. RÉSZ: KÍSÉRLETEK MEGTERVEZÉSE

Korrelációs kapcsolatok elemzése

módszertana Miben más és mivel foglalkozik a Mit tanultunk mikroökonómiából? és mivel foglalkozik a makroökonómia? Miért

MUNKAGAZDASÁGTAN. Készítette: Köllő János. Szakmai felelős: Köllő János január

Statisztika I. 11. előadás. Előadó: Dr. Ertsey Imre

Funkcionális konnektivitás vizsgálata fmri adatok alapján

Gyakorló feladatok a kétváltozós regresszióhoz 2. Nemlineáris regresszió

Adatok statisztikai értékelésének főbb lehetőségei


Does pension policy make older women work more?

Több valószínűségi változó együttes eloszlása, korreláció

6. Előadás. Vereb György, DE OEC BSI, október 12.

Lineáris regresszió vizsgálata resampling eljárással

Kovács Ernő 1, Füvesi Viktor 2

Kétértékű függő változók: alkalmazások Mikroökonometria, 8. hét Bíró Anikó Probit, logit modellek együtthatók értelmezése

Regresszió számítás az SPSSben

A MIDAS_HU modell elemei és eredményei

Empirikus módszerek alkalmazása a versenyszabályozásban. Muraközy Balázs VÉSZ 2014 kötet bemutató 2015 október 29

The nontrivial extraction of implicit, previously unknown, and potentially useful information from data.

S atisztika 2. előadás

Mérési adatok illesztése, korreláció, regresszió

ELTE TáTK Közgazdaságtudományi Tanszék GAZDASÁGSTATISZTIKA. Készítette: Bíró Anikó. Szakmai felelős: Bíró Anikó június

Inflációs és növekedési kilátások: Az MNB aktuális előrejelzései Hamecz István

Statisztika I. 8. előadás. Előadó: Dr. Ertsey Imre

Tanulás az idegrendszerben. Structure Dynamics Implementation Algorithm Computation - Function

Statisztika I. 12. előadás. Előadó: Dr. Ertsey Imre

Munkaerő-piaci visszacsatoló és oktatásfejlesztési döntéstámogató rendszer kialakítása AP

Fejezet. Hogyan gondolkodnak a közgazdászok? Elmélet, modellalkotás, empirikus tesztelés, alkalmazások

A randomizált kísérletek szerepe a társadalompolitikai programok tesztelésében

Terminológia. Átváltás, alternatív költség, határ-, racionalitás, ösztönző, jószág, infláció, költség, kereslet, kínálat, piac, munkanélküliség

Az agglomerációs előnyök és a technológiai közelség befolyása a vállalatok túlélésére Magyarország, mint átmeneti gazdaság esete

Hogyan gondolkodnak a közgazdászok? Elmélet, modellalkotás, empirikus tesztelés, alkalmazások

Túlélés elemzés október 27.

Diagnosztika és előrejelzés

III. Kvantitatív változók kapcsolata (korreláció, regresszió)

Tanulás tanuló gépek tanuló algoritmusok mesterséges neurális hálózatok

GEOSTATISZTIKA. Földtudományi mérnöki MSc, geofizikus-mérnöki szakirány. 2018/2019 I. félév TANTÁRGYI KOMMUNIKÁCIÓS DOSSZIÉ

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

ELTE TáTK Közgazdaságtudományi Tanszék OKTATÁSGAZDASÁGTAN. Készítette: Varga Júlia. Szakmai felelős: Varga Júlia június

Karrier gyermekvállalás előtt és után. Cukrowska-Torzewska Ewa, Lovász Anna, Szabó-Morvai Ágnes Szirák November

5.4. KÉPZÉSSEL A MUNKAERŐHIÁNY ELLEN? A MUNKAÜGYI KÖZPONTOK ÁLTAL SZERVEZETT VAGY FINANSZÍROZOTT KÉPZÉSEK CÉLZÁSA ÉS EREDMÉNYESSÉGE

KÖZGAZDASÁGTAN II. Készítette: Lovics Gábor. Szakmai felelős: Lovics Gábor június

AZ INNOVÁCIÓ VÉDELME ÜZLETI TITKOK ÉS SZABADALMAK RÉVÉN: AZ EURÓPAI UNIÓS CÉGEK SZÁMÁRA MEGHATÁROZÓ TÉNYEZŐK

A napsugárzás mérések szerepe a napenergia előrejelzésében

WP3 Társadalmi-gazdasági folyamatok modellezése 2050-ig D3.7 MÓDSZERTANI TANULMÁNY A MODELLFUTTATÁS TANULSÁGAIRÓL GAZDASÁGI ELŐREJELZÉS

Bevezetés, tudnivalók, ökonometriai alapok

HÉTFA Kutatóintézet és Elemző Központ A használható tudásért 1051 Budapest Október 6. utca 19.

Félidőben félsiker Részleges eredmények a kutatásalapú kémiatanulás terén

AZ ÁTMENET GAZDASÁGTANA POLITIKAI GAZDASÁGTANI PILLANATKÉPEK MAGYARORSZÁGON

A szegénység fogalmának megjelenése a magyar online médiában

Least Squares becslés

Gépi tanulás a gyakorlatban. Kiértékelés és Klaszterezés

Témaválasztás, kutatási kérdések, kutatásmódszertan

A MEGÚJULÓ ENERGIAPOTENCIÁL EGER TÉRSÉGÉBEN A KLÍMAVÁLTOZÁS TÜKRÉBEN

EGÉSZSÉG-GAZDASÁGTAN

Az állami szabályozás alternatívái: az ön- és együttszabályozás. Muraközy Balázs Valentiny Pál VÉSZ 2012 bemutató

7.2. A készségek és az oktatás jövedelemben megtérülő hozama

A maximum likelihood becslésről

Mit látnak a robotok? Bányai Mihály Matemorfózis, 2017.

Magyarország növekedési kilátásai A magyarországi vállalatok lehetőségei és problémái MTA KRTK KTI workshop

Környezettudatosság horvát és magyar vidéki terekben: egy empirikus kutatás tanulságai

A felsőoktatási részvétel és a felsőfokú végzettség hozamának változása Magyarországon

Hogyan lesz adatbányából aranybánya?

Elektronikus kommunikáció jelentősége a fiatalok baráti kapcsolataiban

3.2. MANIFESZT HIÁNYHELYZETEK BETÖLTETLEN ÁLLÁSOK ÉS KIHASZNÁLATLAN KAPACITÁSOK

Biometria az orvosi gyakorlatban. Regresszió Túlélésanalízis

Makroökonómia. Név: Zárthelyi dolgozat, A. Neptun: május óra Elért pontszám:

A partnerek közötti jövedelem-eloszlás és a szubjektív jóllét kapcsolata

Fertő Imre. Lehet-e a mezőgazdaság a gazdasági növekedés motorja? A közép-kelet európai országok tapasztalatai

BENEDEK GÁBOR. Dupla vagy semmi. Duplikációbecslés szimulációs módszerekkel

Matematikai alapok és valószínőségszámítás. Statisztikai becslés Statisztikák eloszlása

A közötti EU-s támogatások hatása a vállalatok foglalkoztatására, beruházásaira és bruttó hozzáadott értékre

Lőre Vendel- Csigó Györbiró Alpár Üzleti szimulációk az oktatásban

Ökonometria. Dummy változók használata. Ferenci Tamás 1 tamas.ferenci@medstat.hu. Hetedik fejezet. Budapesti Corvinus Egyetem. 1 Statisztika Tanszék

ÖSSZEFOGLALÓ TÁJÉKOZTATÓ IV. NEGYEDÉVES ÉS ÉVES ADATOK AZ EGÉSZSÉGÜGYBEN DOLGOZÓK LÉTSZÁM ÉS BÉRHELYZETÉRŐL

Osztályozás, regresszió. Nagyméretű adathalmazok kezelése Tatai Márton

Ökonometria. Logisztikus regresszió. Ferenci Tamás 1 Nyolcadik fejezet. Budapesti Corvinus Egyetem. 1 Statisztika Tanszék

Intelligens beágyazott rendszer üvegházak irányításában

Átírás:

Gépi tanulás, predikció és okság a társadalomtudományokban Muraközy Balázs (MTA KRTK) Bemutatkozik a Számítógépes Társadalomtudomány témacsoport, MTA, 2017

2/20 Empirikus közgazdasági kérdések Felváltja-e automatikusan a gépi tanulás a hagyományos közgazdasági, ökonometriai modellezést? Modern empirikus közgazdaságtan Fókusza elsősorban oksági Fő kihívás az, hogy nem kísérleti adatokból oksági hatásokat becsüljön Gépi tanulás Célja a mintán kívülre előrejelzés Az eltérő cél miatt a két szemlélet nem automatikusan helyettesítő, sokkal inkább sokszor kiegészíthetik egymást

3/20 Vázlat Amikor a két módszer kiegészíti egymás Adatok az internetről és a műholdakról Sok kérdés valójában prediktív Az oksági elemzésekben is vannak prediktív lépések Alkalmazás: vállalati EU-támogatások hatása Következtetések

4/20 Amikor a két módszer kiegészíti egymás Adatok az internetről és a műholdakról Sok kérdés valójában prediktív Az oksági elemzésekben is vannak prediktív lépések Alkalmazás: vállalati EU-támogatások hatása Következtetések

5/20 Oksági kérdések Oksági kérdések Növeli a béreket az, ha valaki jobb iskolába jár? Gyorsabban nőnek-e azok a vállalatok egy támogatás hatására? Az árfolyam leértékelődése befolyásolja-e az inflációt? Cél egy együttható becslése, ami két változó közötti oksági kapcsolatot mutat Alapvető módszere a regresszió, ami kiszűri a függő változóra ható egyéb tényezőket

6/20 Természetes kísérletek Kvázi-kísérleti megközeĺıtés Bizonyos egyedek valamifajta kezelésben részesültek (jobb iskolába jártak, támogatásban részesültek, leértékelődött a valutájuk) A kezelés és a kimenet közötti korreláció egyszerre tartalmazza az oksági hatást és a szelekciós torzítást - más típusú egyének választódnak ki a kezelésre Hitelességi forradalom Keressünk a kezelteknek olyan kontrollcsoportot, ami a leginkább hasonĺıt hozzájuk A becslés lényege, hogy a kezelt csoport kimeneteit (pl jövedelem) összehasonĺıtjuk a kontrollcsoportéval Minden olyan változó hatását ki kell szűrni, ami egyszerre befolyásolja a kezelés valószínűségét és a kimenetet

7/20 Két kvázi-kísérleti módszer Szakadásos regresszió Akiket pontszámuk alapján pont nem vettek fel az egyetemre szinte pont olyanok, mint akiket épp felvettek - jó kontrollcsoport Megfigyelhető és nem megfigyelhető jellemzőikben hasonló Párosítás A rendelkezésünkre álló információk alapján megbecsüljük, hogy ki milyen valószínűséggel részesül kezelésben Minden kezeltnek ez alapján keresünk párt, ezek kerülnek a kontrollcsoportba Ha csak a megfigyelt változók befolyásolják a kezelést, akkor jó becslést ad

8/20 Gépi tanulás Célja: minél pontosabb előrejelzés a becslésre használt mintán kívül Fő átváltás Alulillesztés: nem fogja meg az adatban lévő mintákat Túlillesztés: A zajra is ráilleszti a modellt, így a mintán kívül nem jól jelez előre Sokszínű módszertan: fák, regressziók, neurális hálók stb. és ezek kombinációi Akkor jönnek ki különösen az előnyei, ha nagyon sok változó van

9/20 Miért nem ad automatikusan jó oksági becslést a jó prediktív modell? Sok gépi tanulásos módszerben egyáltalán nem világos, hogy mi felel meg a becsülni szándékozott együtthatónak (pl. fák vagy neurális hálók) A túlillesztés kiküszöbölésére kidob olyan változókat, amelyek hatását ki kellene szűrni az oksági becsléshez Ha kiszámolható is a szükséges paraméter, az nagyon instabil lehet attól függően, hogy éppen milyen más változók kerültek be a modellbe (Mullainathan and Spiess, 2017)

10/20 Amikor a két módszer kiegészíti egymás Amikor a két módszer kiegészíti egymás Adatok az internetről és a műholdakról Sok kérdés valójában prediktív Az oksági elemzésekben is vannak prediktív lépések Alkalmazás: vállalati EU-támogatások hatása Következtetések

11/20 Amikor a két módszer kiegészíti egymás Adatok az internetről és a műholdakról Új adatok Túl sok változó esetén az oksági becslésben is szükség van változószelekcióra a túlillesztés elkerülésére Ilyenkor a regresszióba a változók kiválasztása történjen gépi tanulással (Chernozhukov és szerzőtársai, 2016) A big data-ból gépi tanulással előálĺıthatók olyan változók, amelyek az ökonometriai elemzés magyarázó vagy függő változói lehetnek A műholdakról származó fénykibocsátás-adatokból nagy területi és időbeli részletességgel prediktálható a GDP gépi tanulással (Henderson és szerzőtársai, 2012; Donaldson és Storeygard, 2016) Sokfajta kérdéshez használhatók a Google Trends adatok (Varian, 2014; Stephen-Davidovitz, 2017)

12/20 Amikor a két módszer kiegészíti egymás Sok kérdés valójában prediktív Sok kérdés valójában prediktív Hagyományosan a közgazdászok minden kérdést regressziós módszerekkel vizsgáltak, de jobban belegondolva néhány tisztán prediktív Például a pénzügy központi elmélete, a hatékony piacok elmélete szerint múltbeli információk alapján nem lehet előrejelezni az árak jövőbeli alakulását Ez a kérdés tisztán prediktív Moritz és Zimmermann (2016) például megmutatja, hogy az amerikai tőzsdeindexek előrejelzhetők gépi tanulással Segít megérteni, milyen piaci tökéletlenségek lehetnek

Amikor a két módszer kiegészíti egymás Az oksági elemzésekben is vannak prediktív lépések Az oksági elemzésben is vannak prediktív lépések Párosítás Első lépés: Ki milyen valószínűséggel részesül kezelésben (propensity score)? Prediktív Célszerű gépi tanulást használni Második lépés: Minden kezelt embernek keresünk olyan nem kezelt párt, aki a propensity score alapján a legjobban hasonĺıt rá (ez a kontrollcsoport) Harmadik lépés: Összehasonĺıtjuk a kezelt és kontrollcsoport kimeneteit Instrumentális változók: Keresünk egy olyan változót, ami összefügg a kezeléssel, de nem hat közvetlenül a kimenetre (instrumentum) Első lépés: hogy függ össze az instrumentum a kezeléssel Prediktív, gépi tanulás hasznos Második lépés: hogy függ össze az első egyenletből prediktált értéke a kimenet-változóval 13/20

14/20 Alkalmazás: vállalati EU-támogatások hatása Amikor a két módszer kiegészíti egymás Adatok az internetről és a műholdakról Sok kérdés valójában prediktív Az oksági elemzésekben is vannak prediktív lépések Alkalmazás: vállalati EU-támogatások hatása Következtetések

Alkalmazás: vállalati EU-támogatások hatása Eu támogatások Az EU-támogatások számottevő részét költötte Magyarország vállalati támogatásokra pl. gépvásárlás, ISO-tanúsítvány bevezetése Ezek fő célja a foglalkoztatás és a versenyképesség növelése Az adatok vállalati szinten tartalmazzák a támogatásokat és a vállalatok mérlegeit A kérdés az, hogy a 2007-ben támogatott vállalatok gyorsabban nőttek-e a következő 3 évben, mint a nem támogatottak Párosításos becslés, különféle gépi tanulási módszerek felhasználásával a propensity score becslésben Döntési fa: a kontrollcsoport az lesz, ami a fának ugyanazon a levelén van Boosting: sok döntési fa eredményéből számolható a propensity score Logisztikus regresszió, a változók gépi tanulással választva 15/20

16/20 Alkalmazás: vállalati EU-támogatások hatása A becsült döntési fa

17/20 Alkalmazás: vállalati EU-támogatások hatása Kiegyensúlyozottsági teszt

18/20 Alkalmazás: vállalati EU-támogatások hatása Becsült hatás

19/20 Következtetések Amikor a két módszer kiegészíti egymás Adatok az internetről és a műholdakról Sok kérdés valójában prediktív Az oksági elemzésekben is vannak prediktív lépések Alkalmazás: vállalati EU-támogatások hatása Következtetések

20/20 Következtetések Következtetések A gépi tanulás és az oksági elemzés célja eltérő, nem fogja kiszorítani az egyik a másikat A kettő viszont több területen is kiegészítheti egymást, különösen a big data térnyerésével