STATISZTIKAI DÖNTÉSMEGALAPOZÁSI MODELL DÖNTÉSHOZATALI MODELLEZŐ ESZKÖZ TRANSZNACIONÁLIS ALKALMAZÁSA BUDAPEST, XVIII. KERÜLET, VECSÉS BUDAPEST, 2014 1
BUDAPEST XVIII. KERÜLET PESTSZENTLŐRINC-PESTSZENTIMRE ÖNKORMÁNYZATA VECSÉS VÁROS ÖNKORMÁNYZATA STATISZTIKAI DÖNTÉSMEGALAPOZÁSI MODELL DÖNTÉSHOZATALI MODELLEZŐ ESZKÖZ TRANSZNACIONÁLIS ALKALMAZÁSA BUDAPEST, 2014 2
airled Helyi gazdaságfejlesztés repülőterek vonzáskörzetében project No.4CE485P4. CENTRAL EUROPE PROJECT. A jelentést készítette: DR.HAJDU OTTÓ DSc. DISK-COUNTÍR BT. 3
TARTALOMJEGYZÉK I. AZ ELŐZŐ MUNKAFÁZISOK EREDMÉNYEINEK RÖVID ÖSSZEFOGLALÁSA... 5 II. ÚTMUTATÓ A STATISZTIKAI PROGRAMHOZ... 7 III. AZ R PROGRAM... 9 IV. AZ OUTPUT... 18 V. ÖSSZEFOGLALÁS... 45 VI. FÜGGELÉK... 46 4
I. I. AZ ELŐZŐ MUNKAFÁZISOK EREDMÉNYEINEK RÖVID ÖSSZEFOGLALÁSA A repülőtéri vonzáskörzet társadalmi-gazdasági fejlődését befolyásoló tényezők, indikátorok azonosítása és számszerűsítése jelen statisztikai modellezési munka tárgya. Az airled projekt keretében a magyar régióra elkészült Status Quo jelentés definiálta a Budapest Liszt Ferenc Nemzetközi Repülőtér vonzáskörzetét, mely kevés különbséggel Budapest agglomerációs térségét fedi le. Az előző munkafázisok és számítások alapvető célja az előrejelzendő gazdasági célváltozókra szignifikánsan ható gazdasági-társadalmi indikátorok körének a meghatározása volt. Első lépésként összegyűjtöttük, rendszerbe foglaltuk azon látens dimenziókat, melyek egy térség társadalmi-gazdasági fejlődését, fejlettségét jellemzik. Ezen látens dimenziók manifeszt (mérhető indikátorokban jelentek meg. A statisztikai munka megfigyelési egységeként a Status Quo jelentésben definiált vonzáskörzeti településeket jelöltük meg, így szám szerint 23 budapesti kerület és további 46 környező település 2011.évi (az adatgyűjtés időpontjában elérhető legfrissebb adatai képezték a számítások alapjául szolgáló közel 300 induló manifeszt indikátorból összeállított - keresztmetszeti adatbázist. A több lépcsőben és több dimenzióban elvégzett statisztikai célú szelektálás végeredményeként 58 manifeszt indikátor adódott. A következő lépésben feltártuk az indikátorok közötti ok-okozati kapcsolatokat és azok irányát a SEM (Structural Equation Modeling módszertan segítségével. Elkülönítettük a manifeszt indikátorokat cél (targetváltozókra és prediktor (magyarázó változókra. Ezt követően a célváltozók és prediktor (magyarázó változók közötti oksági kapcsolatokat számszerűsítettük regressziós statisztikai módszertan segítségével és előrejelzést készítettünk mind a célváltozók mind a prediktor (magyarázó változók 2014.évi értékeire vonatkozóan. 5
Az eddigi munka összefoglalásaként tekintsük át az alábbi illusztratív folyamatábrát. BUD-OPR035-20050128-V6i.ppt Döntéselőkészítő előrejelző modell kialakításának és alkalmazásának folyamata Keresztmetszeti regressziós modellek kialakítása 3 kiemelt gazdasági jellemzőre (célváltozóra Keresztmetszeti regressziós modellek szűkítése Keresztmetszeti modellek prediktorainak előrejelzése Reptéri indikátorok bevonása a prediktorok előrejelzésébe A végső előrejelző regressziós modellek kialakítása Előrejelzés a végső regressziós modellekkel Alkalmazás Célok Lépések Eredmények Cél: 3 regressziós modell építése 3 kiemelt célváltozóra 69 település 2011-es adatai, mint keresztmetszet 3 kiemelt célváltozó: Saját folyó bevételek Helyi adóbevételek Foglalkoztatott ak száma 54 magyarázó változó (manifeszt indikátor például kiskereskedelmi üzletek száma Eredmény: 3 db regressziós modell a célváltozókra Cél: az irreleváns magyarázó változók kiszűrése A szűrés végrehajtása az ún. p- szignifikancia érték alapján Eredmény: 3 db szűkített modell a célváltozókra: M2_3C jelöléssel a Saját folyó bevételekre M3_3C jelöléssel a Helyi adóbevételek re M1_2C jelöléssel a Foglalkoztato ttak számára Oksági kapcsolatok feltárása Cél: a M2_3C, M3_3C és a M1_2C modellek releváns magyarázó változóinak (a prediktoroknak az idősoros előrejelzése Prediktorok idősorainak csoportosítása a hiányzó adatok mintázata alapján 4 csoportba Lineáris, kvadratikus és exponenciális trendfüggvények illesztése az első 3 csoport és a későbbiekben a 4. csoport esetében Eredmény: Az első 3 prediktor csoportra a prediktorok előrejelzésre alkalmas szabályok és trendfüggvények Cél: A reptért jellemző naturáliák bevonása az előrejelzésbe A prediktorok idősorainak negyedik csoportjánál kerül sor a bevonásra 2001-2012 időszak adatai ebben a csoportban hiánytalanok Bevonásra került szignifikáns változók:(d2_10 Érkező és induló utasszám repülőtéren, (D3_10 Érkező és induló árutonna repülőtéren Eredmény: Reptéri változókat is tartalmazó prediktorokat előrejelző trendfüggvények Cél: A kitüntetett 3 célváltozó tekintetében előrejelzésre alkalmas modellek kialakítása a 2011. évi keresztmetszeti adatállományban a településre (itt 18.kerület vonatkozó prediktor adatok felülírása azok 2014. évi előrejelzéseivel. A módosított adatállományra a Településspecifikus keresztmetszeti regressziós koefficiensek meghatározása Eredmény: 3 db regressziós modell a célváltozókra: M2_3P, M3_3P és M1_2P jelöléssel Cél: a M2_3P, M3_3P és a M1_2P modellek segítségével a 3 célváltozóra az adott település (itt 18.kerület esetében az előrejelzett érték meghatározása Az előrejelző modellek megfelelő adatokkal való feltöltése Az előrejelzett értékek kiszámítása a regressziós összefüggés segítségével Eredmény: Az adott településre (esetünkben 18.kerület a Saját folyó bevételek Helyi adóbevételek Foglalkoztato ttak száma célváltozók előrejelzése 6
II. II. ÚTMUTATÓ A STATISZTIKAI PROGRAMHOZ A megelőző kimenetekben részletesen és több dimenzióban beszámoltunk az indikátorokról az adatbázis szerkezetéről, szelektálásáról, így jelen munkaanyagban az indikátorok elemzésétől eltekintünk, ugyanakkor az indikátorok megnevezését és kódját a Függelék 1.táblájában közöljük. A statisztikai modellből előrejelzendő célváltozók: 1. Saját folyó bevételek (kód: D2_3, 2. Helyi adóbevételek (kód: D3_3, 3. Foglalkoztatottak száma (kód: D1_2. Jelen statisztikai modell az The R Project for Statistical Computing programnyelv környezetben kerül megadásra. A modell struktúrája a magyar adatbázison definiált modell struktúráját követi. A modell alkalmazása univerzális, és egyszerű. Az alkalmazás alapvetően három komponenst igényel: 1. az "R for Windows" open-source program installációját a komputeren (letöltés: a. www.r-project.org b. download R c. CRAN MIRRORS HUNGARY(javasolt http://cran.rapporter.net/ d. Download R for Windows e. Base Download R 3.1.1 for Windows Futtatás. f. ezt követően a Telepítő követésével az R program a számítógépre telepítésre kerül. 2. két szeparált adatfájlt.csv formátumban rögzítve valamely meghajtón (pl. C:, rendre: a. C:/TimeSeries.csv b. C:/CrossSection.csv 3. és a jelen használati útmutató program-utasításait a "Begin Model" és az "End model" könyvjelzők között (a továbbiakban: airledprogram.txt. A kalkulációk könnyű végrehajtása érdekében mind az airledprogram.txt R-programot, mind a másik két.csv adatfájlt szeparáltan mellékeljük, de a könnyebb áttekintés érdekében a jelen riportban is olvashatók lesznek. Az adatfájlok a Függelékben szerepelnek. A programsorok között azok a karakterek, amelyek közvetlenül # jelet követően szerepelnek, a program szempontjából 7
nem végrehajtandó utasítások, hanem mint "komment" megjegyzések, magyarázatok szerepelnek, tehát a szoftver nem veszi őket figyelembe, csupán a felhasználó tájékozódását segíti. A szoftver a fenti két input fájlra épül, mindkettő ".csv" kiterjesztéssel. Az egyik az idősori előrejelzést szolgáló - time series of the target settlement (Budapest 18.kerület és Repülőtéri adatok fájl, melynek megnevezése az adott meghajtón: "TimeSeries.csv". A másik pedig a keresztmetszeti, településsoros adatbázis, mely a Repülőtér vonzáskörzetébe tartozó településeket(69 db tartalmazza adott, meghatározó évre (esetünkben 2011 év, pl. egy Census évére, melynek neve a fizikai meghajtón "CrossSection.csv". A program megbízható működése érdekében a két.csv adatfájl nevét változtatás nélkül kell hagyni. A nemzetközi alkalmazás e két -.csv- adatfájl ország-specifikus adatainak a cseréjét igényli. Az R-program futtatásának, tehát az előrejelző szoftver alkalmazásának lépései a következők. 1. Az R-project program letöltése a komputerre, ha még nincs installálva. 2. Az országspecifikus TimeSeries.csv és CrossSection.csv adatállományok elkészítése. 3. Jelen "Manual" "Begin Model" és "End Model" könyvjelzői közötti sorainak egyszerű bemásolása az R-konzolba, de az erősen javasolt megoldás az airledprogram.txt fájl teljes egészének a bemásolása az R-Console-ba. Az R-Console az R programikonra kattintással azonnal bejelentkezik, a bejelentkező villogó kurzor után az airledprogram.txt fájl bemásolásával (a végén az utolsó üres sor elején egy kurzorral együtt a program automatikusan lefut és az eredmények megjelennek. Az R program futtatási eredményeit a program piros színnel jelöli. 4. A programsorok és adatállományok javasolt betűtípusa: Courier New. 5. Az automatikusan megjelenő eredmények értelmezése. A program bárhonnan indítható, de az adatokat az útvonal (Path könnyű megadása érdekében ajánlott a C:/ meghajtón tartani. Amennyiben nem a C:/ meghajtón, hanem más (pl. hordozható Winchester, Pendrive adathordozón van a két adatfájl, akkor értelemszerűen az airledprogram.txt programban a sárgával jelölt két helyen az útvonalat meg kell adni. A következő fejezetben megadjuk a statisztikai programot az R szintaktikájában. 8
III. III. AZ R PROGRAM ###################### # Begin airled Model # ###################### ############################################## # 1. A Céltelepülés idősorainak a beolvasása # ############################################## Ker18time <- read.table("c:/timeseries.csv", header=true, sep=";", na.strings="na", dec=".", strip.white=true ############################################################ # 2. Az előrejelzési időpont (2014 proxy érték megadása a # # kvadratikus trendhez, a konstans taggal: 1_2014_2014^2 # ############################################################ quad.time.point <- c(1,(ker18time$obs[13]+1,(ker18time$obs[13]+1^2 quad.time.point ################################################################## # 3. Kvadratikus trend-előrejelzés a D2_10 Utasforgalom és D3_10 # # Cargoteljesítmény Repülőtéri forgalmakra # ################################################################## D2_10 <- lm( D2_10 ~ obs + I(obs^2, data = summary(d2_10 D3_10 <- lm( D3_10 ~ obs + I(obs^2, data = summary(d3_10 pred.d2_10_2014 <- crossprod(quad.time.point, D2_10$coeff pred.d3_10_2014 <- crossprod(quad.time.point, D3_10$coeff pred.d2_10_2014 pred.d3_10_2014 predictor.point <- c(quad.time.point, pred.d2_10_2014,pred.d3_10_2014 predictor.point ########################################################### # 4. A keresztmetszeti prediktorok időbeli előrejelzése a # # 2014. évre, alapvetően kvadratikus trend és Repülőtéri # # forgalom alapján ha az adatsűrűség megengedi, egyébként # # az előrejelzés szakértői, szubjektív # ########################################################### D4_1 <- lm( D4_1 ~ obs + I(obs^2 + D2_10 + D3_10, data = Ker18time 9
summary(d4_1 pred.d4_1_2014 <- crossprod(predictor.point, D4_1$coeff pred.d4_1_2014 D1_2 <- lm( D1_2 ~ obs + I(obs^2 + D2_10 + D3_10, data = Ker18time summary(d1_2 pred.d1_2_2014 <- crossprod(predictor.point, D1_2$coeff pred.d1_2_2014 pred.d1_2_2014 <- 43207 # szakértői becsléssel felülírva pred.d1_2_2014 D2_3 <- lm( D2_3 ~ obs + I(obs^2 + D2_10 + D3_10, data = Ker18time summary(d2_3 pred.d2_3_2014 <- crossprod(predictor.point, D2_3$coeff pred.d2_3_2014 D3_3 <- lm( D3_3 ~ obs + I(obs^2 + D2_10 + D3_10, data = Ker18time summary(d3_3 pred.d3_3_2014 <- crossprod(predictor.point, D3_3$coeff pred.d3_3_2014 D1_4 <- lm( D1_4 ~ obs + I(obs^2 + D2_10 + D3_10, data = Ker18time summary(d1_4 pred.d1_4_2014 <- crossprod(predictor.point, D1_4$coeff pred.d1_4_2014 D2_4 <- lm( D2_4 ~ obs + I(obs^2 + D2_10 + D3_10, data = Ker18time summary(d2_4 pred.d2_4_2014 <- crossprod(predictor.point, D2_4$coeff pred.d2_4_2014 D1_5 <- lm( D1_5 ~ obs + I(obs^2 + D2_10 + D3_10, data = Ker18time summary(d1_5 pred.d1_5_2014 <- crossprod(predictor.point, D1_5$coeff pred.d1_5_2014 D3_5 <- lm( D3_5 ~ obs + I(obs^2 + D2_10 + D3_10, data = Ker18time summary(d3_5 pred.d3_5_2014 <- crossprod(predictor.point, D3_5$coeff pred.d3_5_2014 pred.d3_5_2014 <- 195 # szakértői becsléssel felülírva pred.d3_5_2014 D4_5 <- lm( D4_5 ~ obs + I(obs^2 + D2_10 + D3_10, data = Ker18time 10
summary(d4_5 pred.d4_5_2014 <- crossprod(predictor.point, D4_5$coeff pred.d4_5_2014 pred.d4_5_2014 <- 16356 # szakértői becsléssel felülírva pred.d4_5_2014 D8_5 <- lm( D8_5 ~ obs + I(obs^2 + D2_10 + D3_10, data = Ker18time summary(d8_5 pred.d8_5_2014 <- crossprod(predictor.point, D8_5$coeff pred.d8_5_2014 D2_6 <- lm( D2_6 ~ obs + I(obs^2 + D2_10 + D3_10, data = Ker18time summary(d2_6 pred.d2_6_2014 <- crossprod(predictor.point, D2_6$coeff pred.d2_6_2014 D3_6 <- lm( D3_6 ~ obs + I(obs^2 + D2_10 + D3_10, data = Ker18time summary(d3_6 pred.d3_6_2014 <- crossprod(predictor.point, D3_6$coeff pred.d3_6_2014 D4_6 <- lm( D4_6 ~ obs + I(obs^2 + D2_10 + D3_10, data = Ker18time summary(d4_6 pred.d4_6_2014 <- crossprod(predictor.point, D4_6$coeff pred.d4_6_2014 D5_6 <- lm( D5_6 ~ obs + I(obs^2 + D2_10 + D3_10, data = Ker18time summary(d5_6 pred.d5_6_2014 <- crossprod(predictor.point, D5_6$coeff pred.d5_6_2014 D6_6 <- lm( D6_6 ~ obs + I(obs^2 + D2_10 + D3_10, data = Ker18time summary(d6_6 pred.d6_6_2014 <- crossprod(predictor.point, D6_6$coeff pred.d6_6_2014 D9_6 <- lm( D9_6 ~ obs + I(obs^2 + D2_10 + D3_10, data = Ker18time summary(d9_6 pred.d9_6_2014 <- crossprod(predictor.point, D9_6$coeff pred.d9_6_2014 D10_6 <- lm( D10_6 ~ obs + I(obs^2 + D2_10 + D3_10, data = summary(d10_6 11
pred.d10_6_2014 <- crossprod(predictor.point, D10_6$coeff pred.d10_6_2014 D2_7 <- lm( D2_7 ~ obs + I(obs^2 + D2_10 + D3_10, data = Ker18time summary(d2_7 pred.d2_7_2014 <- crossprod(predictor.point, D2_7$coeff pred.d2_7_2014 D3_7 <- lm( D3_7 ~ obs + I(obs^2 + D2_10 + D3_10, data = Ker18time summary(d3_7 pred.d3_7_2014 <- crossprod(predictor.point, D3_7$coeff pred.d3_7_2014 D4_7 <- lm( D4_7 ~ obs + I(obs^2 + D2_10 + D3_10, data = Ker18time summary(d4_7 pred.d4_7_2014 <- crossprod(predictor.point, D4_7$coeff pred.d4_7_2014 D1_8 <- lm( D1_8 ~ obs + I(obs^2 + D2_10 + D3_10, data = Ker18time summary(d1_8 pred.d1_8_2014 <- crossprod(predictor.point, D1_8$coeff pred.d1_8_2014 D4_8 <- lm( D4_8 ~ obs + I(obs^2 + D2_10 + D3_10, data = Ker18time summary(d4_8 pred.d4_8_2014 <- crossprod(predictor.point, D4_8$coeff pred.d4_8_2014 D5_8 <- lm( D5_8 ~ obs + I(obs^2 + D2_10 + D3_10, data = Ker18time summary(d5_8 pred.d5_8_2014 <- crossprod(predictor.point, D5_8$coeff pred.d5_8_2014 D6_8 <- lm( D6_8 ~ obs + I(obs^2 + D2_10 + D3_10, data = Ker18time summary(d6_8 pred.d6_8_2014 <- crossprod(predictor.point, D6_8$coeff pred.d6_8_2014 D7_8 <- lm( D7_8 ~ obs + I(obs^2 + D2_10 + D3_10, data = Ker18time summary(d7_8 pred.d7_8_2014 <- crossprod(predictor.point, D7_8$coeff pred.d7_8_2014 12
D1_9 <- lm( D1_9 ~ obs + I(obs^2 + D2_10 + D3_10, data = Ker18time summary(d1_9 pred.d1_9_2014 <- crossprod(predictor.point, D1_9$coeff pred.d1_9_2014 D4_9 <- lm( D4_9 ~ obs + I(obs^2 + D2_10 + D3_10, data = Ker18time summary(d4_9 pred.d4_9_2014 <- crossprod(predictor.point, D4_9$coeff pred.d4_9_2014 pred.d4_9_2014 <- 1612218 # szakértői becsléssel felülírva pred.d4_9_2014 D5_9 <- lm( D5_9 ~ obs + I(obs^2 + D2_10 + D3_10, data = Ker18time summary(d5_9 pred.d5_9_2014 <- crossprod(predictor.point, D5_9$coeff pred.d5_9_2014 D6_9 <- lm( D6_9 ~ obs + I(obs^2 + D2_10 + D3_10, data = Ker18time summary(d6_9 pred.d6_9_2014 <- crossprod(predictor.point, D6_9$coeff pred.d6_9_2014 ################################################################### # 5. A "pred.regressors" vektorban vannak a prediktorok 2014. évi # # előrejelzései tárolva # ################################################################### pred.regressors <- c ( pred.d4_1_2014, pred.d1_2_2014, pred.d2_3_2014, pred.d3_3_2014, pred.d1_4_2014, pred.d2_4_2014, pred.d1_5_2014, pred.d3_5_2014, pred.d4_5_2014, pred.d8_5_2014, pred.d2_6_2014, pred.d3_6_2014, pred.d4_6_2014, pred.d5_6_2014, 13
pred.d6_6_2014, pred.d9_6_2014, pred.d10_6_2014, pred.d2_7_2014, pred.d3_7_2014, pred.d4_7_2014, pred.d1_8_2014, pred.d4_8_2014, pred.d5_8_2014, pred.d6_8_2014, pred.d7_8_2014, pred.d1_9_2014, pred.d4_9_2014, pred.d5_9_2014, pred.d6_9_2014 pred.regressors ################################################################ # 6. A három célváltozó előrejelzése a 2014. évre, a 2011. évi # # település soros (keresztmetszeti adatokon úgy, hogy a # # Céltelepülés (a 18. Kerületi Önkormányzat prediktor # # változó adatait az adatállományban helyettesítjük azok # # 2014. évi előrejelzett értékeivel, amely előrejelzés # # egyfelől időbeli trendeken, másfelől a Repülőtér utas és # # Cargo forgalmának időbeli alakulásán is alapul. # ################################################################ ########################################### # 6.1. A településsoros adatok beolvasása # ########################################### Settlements <- read.table("c:/crosssection.csv", header=true, sep=";", na.strings="na", dec=".",row.names=1, strip.white=true ################################################################ # 6.2. A Budapest 18. Kerület adatainak felülírása a 2014. évi # # előrejelzésével # ################################################################ Settlements[4,] <- pred.regressors Settlements[4,] ############################################################# # 6.3. A D2_3 prediktorok 2014. adatainak listába foglalása # ############################################################# Settlements.pred.points.D2.3 <- c( 14
1, pred.d4_1_2014, pred.d1_2_2014, pred.d1_4_2014,pred.d2_4_2014, pred.d1_5_2014,pred.d3_5_2014, pred.d2_6_2014,pred.d4_6_2014,pred.d5_6_2014,pred.d9_6_2014, pred.d2_7_2014,pred.d3_7_2014, pred.d1_8_2014,pred.d6_8_2014,pred.d7_8_2014, pred.d1_9_2014,pred.d4_9_2014,pred.d5_9_2014 Settlements.pred.points.D2.3[is.na(Settlements.pred.points.D2.3] <- 0 ############################### # 6.4. A D2_3 lineáris modell # ############################### Settlements.D2.3 <- lm(d2_3 ~ D4_1+ D1_2+ D1_4+D2_4+ D1_5+D3_5+ D2_6+D4_6+D5_6+D9_6+ D2_7+D3_7+ D1_8+D6_8+D7_8+ D1_9+D4_9+D5_9, data=settlements summary(settlements.d2.3 ################################################## # 6.5. D2_3 előrejelzés a 18. Kerületre, 2014-re # ################################################## Predict.D2_3.18Ker <- crossprod( Settlements.D2.3$coeff, Settlements.pred.points.D2.3 # Az előrejelzett D2_3 Önkormányzat saját folyó bevételei értéke: Predict.D2_3.18Ker ############################################################# # 6.6. A D3_3 prediktorok 2014. adatainak listába foglalása # ############################################################# Settlements.pred.points.D3.3 <- c( 1, pred.d4_1_2014, pred.d1_2_2014, pred.d1_4_2014,pred.d2_4_2014, pred.d3_5_2014,pred.d4_5_2014,pred.d8_5_2014, pred.d2_6_2014,pred.d9_6_2014,pred.d10_6_2014, pred.d3_7_2014,pred.d4_7_2014, pred.d1_8_2014,pred.d4_8_2014,pred.d6_8_2014,pred.d7_8_2014, pred.d1_9_2014,pred.d4_9_2014,pred.d5_9_2014,pred.d6_9_2014 15
Settlements.pred.points.D3.3[is.na(Settlements.pred.points.D3.3] <- 0 ############################### # 6.7. A D3_3 lineáris modell # ############################### Settlements.D3.3 <- lm(d3_3 ~ D4_1+ D1_2+ D1_4+D2_4+ D3_5+D4_5+D8_5+ D2_6+D9_6+D10_6+ D3_7+D4_7+ D1_8+D4_8+D6_8+D7_8+ D1_9+D4_9+D5_9+D6_9, data=settlements summary(settlements.d3.3 ################################################## # 6.8. D3_3 előrejelzés a 18. Kerületre, 2014-re # ################################################## Predict.D3_3.18Ker <- crossprod( Settlements.D3.3$coeff, Settlements.pred.points.D3.3 # Az előrejelzett D3_3 Önkormányzat helyi adó bevételei értéke: Predict.D3_3.18Ker ############################################################# # 6.9. A D1_2 prediktorok 2014. adatainak listába foglalása # ############################################################# Settlements.pred.points.D1.2 <- c( 1, pred.d2_4_2014, pred.d1_5_2014,pred.d4_5_2014,pred.d8_5_2014, pred.d2_6_2014,pred.d3_6_2014,pred.d4_6_2014,pred.d5_6_2014,pred.d6_ 6_2014,pred.D9_6_2014,pred.D10_6_2014, pred.d2_7_2014,pred.d3_7_2014,pred.d4_7_2014, pred.d4_8_2014,pred.d5_8_2014,pred.d6_8_2014,pred.d7_8_2014, pred.d4_9_2014,pred.d5_9_2014 Settlements.pred.points.D1.2[is.na(Settlements.pred.points.D1.2] <- 0 ################################ # 6.10. A D1_2 lineáris modell # ################################ Settlements.D1.2 <- lm(d1_2 ~ D2_4+ D1_5+D4_5+D8_5+ 16
D2_6+D3_6+D4_6+D5_6+D6_6+D9_6+D10_6+ D2_7+D3_7+D4_7+ D4_8+D5_8+D6_8+D7_8+ D4_9+D5_9, data=settlements summary(settlements.d1.2 ################################################### # 6.11. D1_2 előrejelzés a 18. Kerületre, 2014-re # ################################################### Predict.D1_2.18Ker <- crossprod( Settlements.D1.2$coeff, Settlements.pred.points.D1.2 # Az előrejelzett D1_2 Foglalkoztatottak értéke: Predict.D1_2.18Ker #################### # End airled Model # #################### 17
IV. IV. AZ OUTPUT Az előző fejezetben megadott program az adatfájlok útvonalának helyes megadása esetén az R programban lefut és a jelenleg rendelkezésre álló két adatfájl (TimeSeries.csv és CrossSection.csv alkalmazásával az alábbi outputot állítja elő. R version 3.1.1 (2014-07-10 -- "Sock it to Me" Copyright (C 2014 The R Foundation for Statistical Computing Platform: i386-w64-mingw32/i386 (32-bit R is free software and comes with ABSOLUTELY NO WARRANTY. You are welcome to redistribute it under certain conditions. Type 'license(' or 'licence(' for distribution details. R is a collaborative project with many contributors. Type 'contributors(' for more information and 'citation(' on how to cite R or R packages in publications. Type 'demo(' for some demos, 'help(' for on-line help, or 'help.start(' for an HTML browser interface to help. Type 'q(' to quit R. ###################### # Begin airled Model # ###################### ############################################## # 1. A Céltelepülés idősorainak a beolvasása # ############################################## Ker18time <- read.table("c:/timeseries.csv", header=true, sep=";", na.strings="na", dec=".", strip.white=true ############################################################ # 2. Az előrejelzési időpont (2014 proxy érték megadása a # # kvadratikus trendhez, a konstans taggal: 1_2014_2014^2 # ############################################################ quad.time.point <- c(1,(ker18time$obs[13]+1,(ker18time$obs[13]+1^2 quad.time.point [1] 1 2014 4056196 ################################################################## # 3. Kvadratikus trend-előrejelzés a D2_10 Utasforgalom és D3_10 # # Cargoteljesítmény Repülőtéri forgalmakra # ################################################################## 18
D2_10 <- lm( D2_10 ~ obs + I(obs^2, data = summary(d2_10 lm(formula = D2_10 ~ obs + I(obs^2, data = -816054-496710 -20714 435637 709951 Estimate Std. Error t value Pr( t (Intercept -2.250e+11 4.901e+10-4.592 0.000992 *** obs 2.239e+08 4.884e+07 4.585 0.001003 ** I(obs^2-5.569e+04 1.217e+04-4.578 0.001015 ** --- Signif. codes: 0 *** 0.001 ** 0.01 * 0.05. 0.1 1 Residual standard error: 544400 on 10 degrees of freedom Multiple R-squared: 0.9088, Adjusted R-squared: 0.8906 F-statistic: 49.82 on 2 and 10 DF, p-value: 6.309e-06 D3_10 <- lm( D3_10 ~ obs + I(obs^2, data = summary(d3_10 lm(formula = D3_10 ~ obs + I(obs^2, data = -10450.3-2185.2 433.6 4185.9 5396.3 Estimate Std. Error t value Pr( t (Intercept -1.015e+09 4.306e+08-2.357 0.0402 * obs 1.010e+06 4.291e+05 2.354 0.0404 * I(obs^2-2.512e+02 1.069e+02-2.350 0.0406 * --- Signif. codes: 0 *** 0.001 ** 0.01 * 0.05. 0.1 1 Residual standard error: 4784 on 10 degrees of freedom Multiple R-squared: 0.7074, Adjusted R-squared: 0.6488 F-statistic: 12.09 on 2 and 10 DF, p-value: 0.002146 pred.d2_10_2014 <- crossprod(quad.time.point, D2_10$coeff pred.d3_10_2014 <- crossprod(quad.time.point, D3_10$coeff pred.d2_10_2014 [1,] 7938306 19
pred.d3_10_2014 [1,] 61156.18 predictor.point <- c(quad.time.point, pred.d2_10_2014,pred.d3_10_2014 predictor.point [1] 1.00 2014.00 4056196.00 7938305.69 61156.18 ########################################################### # 4. A keresztmetszeti prediktorok időbeli előrejelzése a # # 2014. évre, alapvetően kvadratikus trend és Repülőtéri # # forgalom alapján ha az adatsűrűség megengedi, egyébként # # az előrejelzés szakértői, szubjektív # ########################################################### D4_1 <- lm( D4_1 ~ obs + I(obs^2 + D2_10 + D3_10, data = summary(d4_1 lm(formula = D4_1 ~ obs + I(obs^2 + D2_10 + D3_10, data = 5 6 7 8 9 10 11 12 3.404-103.578 68.709 76.654 52.742-5.246-18.070-256.803 13 182.187 Estimate Std. Error t value Pr( t (Intercept -6.258e+07 4.113e+07-1.521 0.203 obs 6.227e+04 4.095e+04 1.521 0.203 I(obs^2-1.548e+01 1.019e+01-1.519 0.203 D2_10 5.846e-05 4.103e-04 0.142 0.894 D3_10-2.092e-03 2.070e-02-0.101 0.924 Residual standard error: 175.8 on 4 degrees of freedom (4 observations deleted due to missingness Multiple R-squared: 0.8155, Adjusted R-squared: 0.6309 F-statistic: 4.419 on 4 and 4 DF, p-value: 0.0896 pred.d4_1_2014 <- crossprod(predictor.point, D4_1$coeff pred.d4_1_2014 [1,] 65688.28 D1_2 <- lm( D1_2 ~ obs + I(obs^2 + D2_10 + D3_10, data = 20
summary(d1_2 lm(formula = D1_2 ~ obs + I(obs^2 + D2_10 + D3_10, data = ALL 3 residuals are 0: no residual degrees of freedom! (2 not defined because of singularities Estimate Std. Error t value Pr( t (Intercept -4.525e+05 NA NA NA obs 2.630e+02 NA NA NA I(obs^2-8.333e-03 NA NA NA D2_10 NA NA NA NA D3_10 NA NA NA NA Residual standard error: NaN on 0 degrees of freedom (10 observations deleted due to missingness Multiple R-squared: 1, Adjusted R-squared: NaN F-statistic: NaN on 2 and 0 DF, p-value: NA pred.d1_2_2014 <- crossprod(predictor.point, D1_2$coeff pred.d1_2_2014 [1,] NA pred.d1_2_2014 <- 43207 # szakértői becsléssel felülírva pred.d1_2_2014 [1] 43207 D2_3 <- lm( D2_3 ~ obs + I(obs^2 + D2_10 + D3_10, data = summary(d2_3 lm(formula = D2_3 ~ obs + I(obs^2 + D2_10 + D3_10, data = -804201-141312 69100 229266 406756 Estimate Std. Error t value Pr( t (Intercept -2.525e+11 7.148e+10-3.533 0.00770 ** obs 2.511e+08 7.115e+07 3.529 0.00774 ** I(obs^2-6.242e+04 1.771e+04-3.525 0.00779 ** D2_10-2.868e-01 2.927e-01-0.980 0.35587 D3_10 2.023e+01 3.330e+01 0.607 0.56040 --- Signif. codes: 0 *** 0.001 ** 0.01 * 0.05. 0.1 1 21
Residual standard error: 449600 on 8 degrees of freedom Multiple R-squared: 0.9664, Adjusted R-squared: 0.9496 F-statistic: 57.47 on 4 and 8 DF, p-value: 6.223e-06 pred.d2_3_2014 <- crossprod(predictor.point, D2_3$coeff pred.d2_3_2014 [1,] 9964094 D3_3 <- lm( D3_3 ~ obs + I(obs^2 + D2_10 + D3_10, data = summary(d3_3 lm(formula = D3_3 ~ obs + I(obs^2 + D2_10 + D3_10, data = -771556-95201 96238 262996 451230 Estimate Std. Error t value Pr( t (Intercept -2.116e+11 7.284e+10-2.905 0.0197 * obs 2.104e+08 7.251e+07 2.901 0.0199 * I(obs^2-5.227e+04 1.805e+04-2.897 0.0200 * D2_10-2.422e-01 2.983e-01-0.812 0.4403 D3_10 1.423e+01 3.394e+01 0.419 0.6861 --- Signif. codes: 0 *** 0.001 ** 0.01 * 0.05. 0.1 1 Residual standard error: 458200 on 8 degrees of freedom Multiple R-squared: 0.9618, Adjusted R-squared: 0.9428 F-statistic: 50.42 on 4 and 8 DF, p-value: 1.027e-05 pred.d3_3_2014 <- crossprod(predictor.point, D3_3$coeff pred.d3_3_2014 [1,] 8639160 D1_4 <- lm( D1_4 ~ obs + I(obs^2 + D2_10 + D3_10, data = summary(d1_4 lm(formula = D1_4 ~ obs + I(obs^2 + D2_10 + D3_10, data = -131.579-18.539-3.288 28.247 84.838 22
Estimate Std. Error t value Pr( t (Intercept 1.580e+07 1.050e+07 1.505 0.171 obs -1.580e+04 1.046e+04-1.511 0.169 I(obs^2 3.951e+00 2.602e+00 1.518 0.167 D2_10 3.379e-05 4.301e-05 0.786 0.455 D3_10 3.876e-03 4.894e-03 0.792 0.451 Residual standard error: 66.06 on 8 degrees of freedom Multiple R-squared: 0.9659, Adjusted R-squared: 0.9488 F-statistic: 56.63 on 4 and 8 DF, p-value: 6.586e-06 pred.d1_4_2014 <- crossprod(predictor.point, D1_4$coeff pred.d1_4_2014 [1,] 2124.629 D2_4 <- lm( D2_4 ~ obs + I(obs^2 + D2_10 + D3_10, data = summary(d2_4 lm(formula = D2_4 ~ obs + I(obs^2 + D2_10 + D3_10, data = -10.0917-2.1517 0.0342 2.1328 9.0128 Estimate Std. Error t value Pr( t (Intercept -5.678e+06 1.533e+06-3.704 0.00762 ** obs 5.650e+03 1.526e+03 3.703 0.00763 ** I(obs^2-1.405e+00 3.797e-01-3.701 0.00764 ** D2_10-4.852e-06 5.370e-06-0.904 0.39625 D3_10-7.134e-04 5.340e-04-1.336 0.22338 --- Signif. codes: 0 *** 0.001 ** 0.01 * 0.05. 0.1 1 Residual standard error: 7.065 on 7 degrees of freedom (1 observation deleted due to missingness Multiple R-squared: 0.9197, Adjusted R-squared: 0.8738 F-statistic: 20.04 on 4 and 7 DF, p-value: 0.0006191 pred.d2_4_2014 <- crossprod(predictor.point, D2_4$coeff pred.d2_4_2014 [1,] 134.406 D1_5 <- lm( D1_5 ~ obs + I(obs^2 + D2_10 + D3_10, data = summary(d1_5 23
lm(formula = D1_5 ~ obs + I(obs^2 + D2_10 + D3_10, data = 8 9 10 11 12 13 1269.0-1944.7 165.5-1518.3 3973.9-1945.4 Estimate Std. Error t value Pr( t (Intercept 1.226e+09 3.609e+09 0.340 0.792 obs -1.215e+06 3.591e+06-0.338 0.792 I(obs^2 3.012e+02 8.929e+02 0.337 0.793 D2_10-2.808e-02 1.297e-02-2.165 0.275 D3_10 1.288e+00 7.403e-01 1.740 0.332 Residual standard error: 5225 on 1 degrees of freedom (7 observations deleted due to missingness Multiple R-squared: 0.9467, Adjusted R-squared: 0.7334 F-statistic: 4.438 on 4 and 1 DF, p-value: 0.3402 pred.d1_5_2014 <- crossprod(predictor.point, D1_5$coeff pred.d1_5_2014 [1,] 192498 D3_5 <- lm( D3_5 ~ obs + I(obs^2 + D2_10 + D3_10, data = summary(d3_5 lm(formula = D3_5 ~ obs + I(obs^2 + D2_10 + D3_10, data = -292.391-111.910-7.239 118.292 259.676 Estimate Std. Error t value Pr( t (Intercept -1.214e+08 3.333e+07-3.644 0.00655 ** obs 1.210e+05 3.318e+04 3.646 0.00654 ** I(obs^2-3.012e+01 8.257e+00-3.647 0.00652 ** D2_10-1.123e-04 1.365e-04-0.823 0.43438 D3_10-3.626e-02 1.553e-02-2.335 0.04779 * --- Signif. codes: 0 *** 0.001 ** 0.01 * 0.05. 0.1 1 Residual standard error: 209.6 on 8 degrees of freedom Multiple R-squared: 0.7369, Adjusted R-squared: 0.6054 F-statistic: 5.602 on 4 and 8 DF, p-value: 0.01891 24