A regisztrált álláskeresők számára vonatkozó becslések előrejelző képességének vizsgálata

Hasonló dokumentumok
Tervezett béremelés a versenyszektorban 2016-ban A októberi vállalati konjunktúra felvétel alapján február 3.

Rövidtávú munkaerőpiaci prognózis 2017

A gazdasági válság földrajza 2011/1

A szegénység fogalmának megjelenése a magyar online médiában

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Hitelfelvétel és a Növekedési Hitelprogramban (NHP) való részvétel a KKV-k körében Az MKIK GVI KKV Körkép című kutatási programjának eredményeiből

A BESZERZÉSI MENEDZSER INDEX ÉS AZ IPARI TERMELÉSI VOLUMENINDEX IDŐSORAI KÖZÖTTI KAPCSOLATOK 2014/7

Iskolázottság és szubjektív jóllét

A nappali tagozatra felvett gépészmérnök és műszaki menedzser hallgatók informatikai ismeretének elemzése a Budapesti Műszaki Főiskolán

Konjunktúra kutatás - Adatbázis

Internethasználat a magyar kis- és középvállalkozások körében

Lineáris regresszió vizsgálata resampling eljárással

A munkaerőhiányra adott vállalati reakciók

Januárban jelentősen javultak a magyar vállalkozások várakozásai

Friss diplomás keresetek a versenyszektorban

A pályakezdő szakmunkások munkaerő-piaci helyzete 2016

Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

Az online sajtó elemzése segít a beruházások előrejelzésében Tartalomelemzés 2010 január és 2013 december között megjelent cikkek alapján

A GVI áprilisi negyedéves konjunktúrafelvételének

ELTE TáTK Közgazdaságtudományi Tanszék GAZDASÁGSTATISZTIKA. Készítette: Bíró Anikó. Szakmai felelős: Bíró Anikó június

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió

A minimálbér és a garantált bérminimum emelésére adott vállalati válaszok

Statisztikai becslés

A munkaerőhiány vállalati percepciója

A tanulószerződéseket kötő vállalatok profilja

Vállalatok véleménye a hatóságok működéséről - Baranya megye

2. Hangfrekvenciás mechanikai rezgések vizsgálata jegyzőkönyv. Zsigmond Anna Fizika Bsc II. Mérés dátuma: Leadás dátuma:

A béren kívüli juttatások alkalmazása a magyar vállalkozások körében

A pályakezdő szakmunkások munkaerő-piaci helyzete 2012

A Növekedési Hitelprogram hatása a kkv szektor beruházási aktivitására Az MKIK GVI KKV Körkép című kutatási programjának eredményeiből

Rövidtávú munkaerő-piaci prognózis 2012

A szakképző iskolát végzettek iránti kereslet várható alakulása a kutatás koncepciójának bemutatása, új elemek ismertetése

társadalomtudományokban

Segítség az outputok értelmezéséhez

Tartalomjegyzék I. RÉSZ: KÍSÉRLETEK MEGTERVEZÉSE

6. Előadás. Vereb György, DE OEC BSI, október 12.

III. Kvantitatív változók kapcsolata (korreláció, regresszió)

Kutatásmódszertan és prezentációkészítés

Diplomás pályakezdők várható foglalkoztatása és bérezése a versenyszektorban magyarországi cég körében végzett felmérés elemzése gyorsjelentés

A szakképzett pályakezdők munkaerő-piaci helyzete és elhelyezkedési esélyei

Adatok statisztikai értékelésének főbb lehetőségei

Statisztika I. 12. előadás. Előadó: Dr. Ertsey Imre

MIÉRT NŐTT MEG A REGISZTRÁLT ÁLLÁSKERESŐK BECSLÉSÉNEK ELŐREJELZÉSI HIBÁJA?

2013 ŐSZ. 1. Mutassa be az egymintás z-próba célját, alkalmazásának feltételeit és módszerét!

BAGME11NNF Munkavédelmi mérnökasszisztens Galla Jánosné, 2011.

Kettőnél több csoport vizsgálata. Makara B. Gábor MTA Kísérleti Orvostudományi Kutatóintézet

KÖVETKEZTETŐ STATISZTIKA

1/8. Iskolai jelentés. 10.évfolyam matematika

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Mi a modell? Matematikai statisztika. 300 dobás. sűrűségfüggvénye. Egyenletes eloszlás

Országos kompetenciamérés eredményeinek kiértékelése 6. és 8. évfolyamokon 2012

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Matematikai statisztika. Mi a modell? Binomiális eloszlás sűrűségfüggvény. Binomiális eloszlás

Statisztikai következtetések Nemlineáris regresszió Feladatok Vége

ELTE TáTK Közgazdaságtudományi Tanszék GAZDASÁGSTATISZTIKA. Készítette: Bíró Anikó. Szakmai felelős: Bíró Anikó június

A GVI októberi negyedéves konjunktúrafelvételének eredményei

Iskolai jelentés. 10. évfolyam szövegértés

Biostatisztika VIII. Mátyus László. 19 October

A fehérjék térszerkezetének jóslása

Nemparaméteres próbák

Biomatematika 15. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

A leíró statisztikák

Alkalmazott statisztika feladatok

Integritás és korrupciós kockázatok a magyar vállalati szektorban december 6.

Matematikai statisztika c. tárgy oktatásának célja és tematikája

Bevezetés a hipotézisvizsgálatokba

a b a b x y a b c d e f PSZT/PSZSZT 1.) Az ábrán e, f egyenesek párhuzamosak. Számítsd ki a hiányzó adatokat!

A mérési eredmény megadása

Jó befektetési lehetőség kell? - Ebben van minden, amit keresel

Kamatos kamat II. Írta: dr. Majoros Mária

TARTALOMJEGYZÉK. 1. téma Átlagbecslés (Barna Katalin) téma Hipotézisvizsgálatok (Nagy Mónika Zita)... 23

Bevezetés a Korreláció &

Országos kompetenciamérés eredményeinek kiértékelése. 6. és 8. évfolyamokon. 6. és 8. évfolyamokon 2017

Forrás: Google Trends Forrás: Google Trends

A konfidencia intervallum képlete: x± t( α /2, df )

A sokaság elemei közül a leggyakrabban előforduló érték. diszkrét folytonos

Matematikai alapok és valószínőségszámítás. Statisztikai becslés Statisztikák eloszlása

Nagy számok törvényei Statisztikai mintavétel Várható érték becslése. Dr. Berta Miklós Fizika és Kémia Tanszék Széchenyi István Egyetem

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok

Szezonális kiigazítás az NFSZ regisztrált álláskeresők idősorain. Készítette: Multiráció Kft.

A munkaerőhiány vállalati percepciója

Curie Matematika Emlékverseny 6. évfolyam Országos döntő Megoldása 2017/2018.

8. A fehérjék térszerkezetének jóslása

5. előadás - Regressziószámítás

Rugalmas állandók mérése

A 2014.évi országos kompetenciamérés értékelése Kecskeméti Bolyai János Gimnázium

Rövidtávú munkaerő-piaci prognózis 2018

Rugalmas állandók mérése

Atomi er mikroszkópia jegyz könyv

Feladatok: pontdiagram és dobozdiagram. Hogyan csináltuk?

Az Erőforrástérkép v2.5 újdonságai: Járási adatok & 1100 mutató Magyarországról és az EU-ról

A gyakorlat célja a fehér és a színes zaj bemutatása.

térképet, és válaszolj a kérdésekre római számokkal!

Hipotézis vizsgálatok

Bevezető Adatok rendezése Adatok jellemzése Időbeli elemzés

Iskolai jelentés. 10. évfolyam szövegértés

Az előadás tartalma. Debrecen 110 év hosszúságú csapadékadatainak vizsgálata Ilyés Csaba Turai Endre Szűcs Péter Ciklusok felkutatása

Elemi statisztika fizikusoknak

Mintavételi eljárások

Mérési adatok illesztése, korreláció, regresszió

A mérések általános és alapvető metrológiai fogalmai és definíciói. Mérések, mérési eredmények, mérési bizonytalanság. mérés. mérési elv

Matematika írásbeli érettségi vizsga eredményessége Budapesti Fazekas Mihály Gimnázium

Átírás:

A regisztrált álláskeresők számára vonatkozó becslések előrejelző képességének vizsgálata Az elemzésben a GoogleTrends (GT, korábban Google Insights for Search) modellek mintán kívüli illeszkedésének vizsgálatával kapcsolatos tapasztalatokat foglaljuk össze. Azoknak a modelleknek a teljesítményét vizsgáltuk, melyeket egy korábbi vizsgálódásunk során dolgoztunk ki. Eredményül azt kaptuk, hogy vannak olyan, a GT felhasználásával készült modellek, amelyek mintán kívüli illeszkedése jobb, mint az AR modellek. Érdemes tehát a regisztrált álláskeresők számának előrejelzésénél a GT által szolgáltatott információkat is figyelembe venne ezekkel pontosabb előrebecslések adhatók. A mintán kívüli illeszkedés a becslésnek az a tulajdonsága, ami megmutatja, hogy egy adott részmintán végzett becslés mennyire jól illeszkedik egy másik részmintára. Speciálisan azt vizsgáltuk, hogy egy adott harminc időszak hosszúságú ablakon végzett becslés segítségével mennyire pontosan tudjuk megmondani, mi várható az ezt követő (harmincegyedik) időszakban. Ez az illeszkedésnek az a tulajdonsága, ami lehetővé teszi, hogy a modellt előrejelzésre használjuk. Ezzel szembe fogjuk állítani összehasonlításul a mintán belüli illeszkedést. Ez a becsléseknek az a tulajdonsága, hogy egy adott részmintán végzett becslés mennyire jól illeszkedik ugyanarra a részmintára. Ezt a vizsgálatot azért végezzük, mert amikor kidolgoztuk a GT adatokat felhasználó előrejelző modelleket, azt tapasztaltuk, hogy ezeknek az adatoknak a felhasználása nagyban javította a mintán belüli illeszkedést. Arra voltunk kíváncsiak, hogy ez a mintán kívüli illeszkedésre is igaz-e; vagyis tényleg javítja-e az előrejelzéseket ezeknek az adatoknak a felhasználása. A vizsgálathoz először elő kell állítani az előrejelzett értékeket. Ezt minden egyes időszakhoz úgy kapjuk meg, hogy az adott időszakot megelőző harminc időszak mintáján megbecsüljük a modell (modellek, variációk) egyenletében szereplő 1 / 5

paramétereket, majd a becsült paraméterekből kiszámítjuk a kérdéses időszakra vonatkozó predikciót. Ezt minden olyan időszak esetében megtettük, ahol a megelőző harminc időszakból van megfigyelésünk, vagyis a teljes minta harmincegyedik időszakától kezdve kiszámolhatjuk a modellek, modell variációk mintán kívüli (out of sample) predikcióját. Először azt szeretnénk vizsgálni, hogy a regisztrált álláskeresők számának GT adatokat felhasználó becslési modellje, vagy az ezeket nélkülöző becslési modell használható jobban előrejelzésre. Vagyis az alapmodell és a GT adatokat felhasználó modell variációinak mintán kívüli illeszkedését hasonlítottuk össze. Az első mutató, amit az így kapott előrejelzések értékeléséhez és összehasonlításához választottunk a root mean standard deviation (rmsd), ami a becslés saját szóródása. Ehhez a fent leírt módon előrejelzett idősornak tényleges értékekhez képesti eltéréseinek négyzetes közepét vesszük. Ez a mérőszám könnyen összehasonlíthatóvá teszi, hogy az egyes modellek milyen pontosan, mekkora szórással tudnak előrejelezni egy időszakot. Legfontosabb tapasztaltunk, hogy a GT modellek között vannak pontosabb előrejelző képességű variációk, mint az alap AR modell variációi. Más variációk elvethetők az előrejelzésben való felhasználás szempontjából, mivel nem javítják a mintán kívüli illeszkedést. A legjobban teljesítő variációk rmsd értékeit mutatja az első táblázat. 1. táblázat: A modellek mintán kívüli illeszkedése Modell rmsd Modell rmsd Alapmodell variáció 1 13416 GT modell variáció 10 13332 Alapmodell variáció 2 13679 GT modell variáció 2 13025 Alapmodell variáció 3 13733 GT modell variáció 6 13319 Nézzük meg a predikciók és a tényleges idősor közti eltérések hisztogramját, mindekét modell legkisebb rmsd értékű variációja esetében. A két hisztogram az 1. és 2. ábrán látható. Azt láthatjuk, hogy a két hisztogram között nincs lényeges eltérés, mindkettő normálisnak mondható. Vagyis a GT modellnek nem csak jobb az rmsd értéke, de az is elmondható, hogy nincs olyan speciális jellegzetesség a tévedéseiben, ami kizárná az előrejelzésben való felhasználhatóságát. 2 / 5

1. ábra: Alapmodell tévedéseinek hisztogramja 3 / 5

2. ábra: A GT modell tévedéseinek hisztogramja Érdemes összehasonlítani a mintán belüli és mintán kívüli illeszkedést az egyes modellek (variációk) esetében. A mintán belüli illeszkedést ugyanúgy rmsd értékkel mértük. A második táblázatban látható azoknak a modelleknek a mintán belüli illeszkedése, amelyeknek a mintán kívüli illeszkedését az első táblázatban láthatjuk. Azt mondhatjuk, hogy a GT adatok felhasználása javítja a mintán kívüli és a mintán belüli illeszkedést is, de a mintán belülit jobban. A mintán kívüli és a mintán belüli illeszkedés között gyenge pozitív összefüggés van. Ennek ellenére mintán belüli predikcióban más variációk bizonyulnak a legjobbnak, mint mintán kívüli predikcióban. 4 / 5

2. táblázat: A modellek mintán belüli illeszkedése Modell rmsd Modell rmsd Alapmodell variáció 1 11102 GT modell variáció 10 10801 Alapmodell variáció 2 11131 GT modell variáció 2 10793 Alapmodell variáció 3 11295 GT modell variáció 6 10701 Azt is érdemes megvizsgálni, mennyire határozza meg a mintán kívüli illeszkedési tulajdonságokat, hogy hány időszak hosszúságú ablakon végezzük a becslést. Ehhez egyszerűen a harmincas becslési ablak helyett kipróbáltunk 60-at, 40-et, valamint 25-öt, 20-at és 15-öt, és megnéztük mi történik az rmsd értékekkel. Azt tapasztaltuk, hogy az ablak hosszúságát a mintán kívüli illeszkedés szempontjából nem érdemes növelni, a 60-as ablak hossz mellett az rmsd értékek 17000 környékére ugrottak fel, 40-es ablak hossz mellett 14000 körüli értéket mutattak. Az ablak hosszúságát rövidítve a 25 és a 20 hosszúságú ablak jobb külső illeszkedést ad, mint a 30, egészen 11000 környékéig csökkenhet az rmsd. Ennél rövidebb ablak esetén gyors ütemben romlik a külső illeszkedés. Irta: Türei Gergely, MKIK GVI Kutatásvezető: Tóth István János (tudományos főmunkatárs, MTA KTI, ügyvezető igazgató, MKIK GVI) tothij@gvi.hu MKIK Gazdaság- és Vállalkozáskutató Intézet 1034 Budapest, Bécsi út 120. Tel: 235-05-84 Fax: 235-07-13 e-mail: gvi@gvi.hu Internet: http://www.gvi.hu/ 5 / 5