STATISZTIKAI SZEMLE A KÖZPONTI STATISZTIKAI HIVATAL FOLYÓIRATA SZERKESZTŐBIZOTTSÁG:



Hasonló dokumentumok
Statisztikai A KÖZPONTI STATISZTIKAI HIVATAL TUDOMÁNYOS FOLYÓIRATA SZERKESZTŐBIZOTTSÁG:

A nemzetközi statisztikai élet utóbbi két évtizedét bízvást nevezhetjük a kodifikáció

STATISZTIKAI SZEMLE A KÖZPONTI STATISZTIKAI HIVATAL FOLYÓIRATA SZERKESZTŐBIZOTTSÁG:

Statisztikai A KÖZPONTI STATISZTIKAI HIVATAL TUDOMÁNYOS FOLYÓIRATA SZERKESZTŐBIZOTTSÁG:

A NEMZETI ÉS KÖZÖSSÉGI STATISZTIKAI SZERVEZETEK SZÁMÁRA

STATISZTIKAI SZEMLE A KÖZPONTI STATISZTIKAI HIVATAL FOLYÓIRATA SZERKESZTŐBIZOTTSÁG:

STATISZTIKAI SZEMLE A KÖZPONTI STATISZTIKAI HIVATAL FOLYÓIRATA SZERKESZTŐBIZOTTSÁG:

SZEMLE A STATISZTIKAI TÁJÉKOZTATÁS EURÓPAI KÖVETELMÉNYEI

STATISZTIKAI SZEMLE A KÖZPONTI STATISZTIKAI HIVATAL FOLYÓIRATA SZERKESZTŐBIZOTTSÁG:

Matematika 9. évfolyam

Könyvszemle. Szakirodalom

(Eötvös József Könyvkiadó, Budapest 2012) A könyvet tárgyánál fogva és szerzőjére való tekintettel is ajánlom azoknak az olvasóknak a

J/3359. B E S Z Á M O L Ó

STATISZTIKAI SZEMLE A KÖZPONTI STATISZTIKAI HIVATAL FOLYÓIRATA SZERKESZTŐBIZOTTSÁG:

Statisztikai Módszertani Füzetek, 51. A munkaerő-piaci politikák (LMP) adatbázisa (módszertan)

Jobbak a nők esélyei a közszférában?

UNIÓS BELSŐ POLITIKÁK FŐIGAZGATÓSÁGA B. TEMATIKUS FŐOSZTÁLY: STRUKTURÁLIS ÉS KOHÉZIÓS POLITIKÁK REGIONÁLIS FEJLESZTÉS

A felsôoktatás lehetséges létszámpályái Magyarországon*

Hivatali Tájékoztató. Tartalom. III. évfolyam évi 2. szám

Juhász Zsolt. A bibliográfiáról és a tudománymetriáról általánosságban

Köznevelés-fejlesztés Végzettség nélküli iskolaelhagyás ESL Egész életen át tartó tanulás LLL

JELENTÉS A MAGYAR STATISZTIKA EURÓPAI UNIÓS AUDITJÁRÓL

A évi költségvetési beszámoló szöveges indoklása. Összefoglaló

PHD ÉRTEKEZÉS TÉZISEI

KÖZPONTI STATISZTIKAI HIVATAL JELENTÉS A KSH-STRATÉGIÁRÓL (2006)

KOLESZÁR ÁGNES A VÁLLALKOZÓ EGYETEM BELSŐ IRÁNYÍTÁSÁNAK PH.D. ÉRTEKEZÉS TÉZISEI MISKOLC MISKOLCI EGYETEM GAZDASÁGTUDOMÁNYI KAR

Molnár Katalin A rendészettudósok új generációja? Kiemelkedő szakdolgozatok a Rendőrtiszti Főiskola MA szakának első évfolyamán

Bocz János Jéghegyek. Tévhitek, avagy a magyar nonprofit szektor mélyrétegei

A nyugdíjban, nyugdíjszerű ellátásban részesülők halandósága főbb ellátástípusok szerint

Nemzetközi ügyletek ÁFA-ja és számlázása előadás Kapcsolódó anyag

A bioinformatika oldaláról a Human Protein Szervezet (Human Protein Organization HUPO) alelnöke bemutatta, hogy az ő szakterületükön.

Vári Péter-Rábainé Szabó Annamária-Szepesi Ildikó-Szabó Vilmos-Takács Szabolcs KOMPETENCIAMÉRÉS 2004

MÛHELY. A nemek és generációk jellegzetességei az információs technológiák használatában és megítélésében*

LAKÁSVISZONYOK,

Szubszidiaritás az EU és tagállamai regionális politikájában

Fogyatékossággal élő emberek életminősége és ellátási költségei különböző lakhatási formákban

Technológiai Elôretekintési Program EMBERI ERÔFORRÁSOK

Emlékeztető az MST Választmányi üléséről

A szórakoztató, az irodalmi és a mûvészeti alkotások elszámolása a nemzeti számlákban

Növelhető-e a csőd-előrejelző modellek előre jelző képessége az új klasszifikációs módszerek nélkül?

Statisztikai A KÖZPONTI STATISZTIKAI HIVATAL TUDOMÁNYOS FOLYÓIRATA SZERKESZTŐBIZOTTSÁG:

KÖZPONTI STATISZTIKAI HIVATAL ÉVI MIKROCENZUS 7. Lakások, lakáskörülmények

Nemzeti Turizmusfejlesztési Stratégia április 26.

NÉHÁNY GONDOLAT A MAGYARORSZÁGI DEMOGRÁFIAI KUTATÁSOK JÖVŐJÉRŐL1

A legnagyobb cél pedig itt, e földi létben ember lenni mindég, minden körülményben (Arany János) Az igazat mondd, ne csak a valódit.

Központi Statisztikai Hivatal. A gazdaság szerkezete az ágazati kapcsolati. mérlegek alapján

Budapest Főváros Települési Esélyegyenlőségi Programja ( ) Munkaanyag Munkaanyag zárása első társadalmi egyeztetés előtt:

Európai Gazdasági és Szociális Bizottság vélemény Tárgy: Európai logisztikai politika (2007/C 97/08)

Bírálat. Mastalir Ágnes: "Rétegszerkezetű és mezopórusos katalizátorok alkalmazása szerves kémiai reakciókban" című MTA doktori értekezéséről

A REJTETT GAZDASÁG KITERJEDÉSE 1997-BEN*

Energiaszegénység Magyarországon

Tõkeállomány, megtakarítás és gazdasági növekedés

Opponensi vélemény. Kézdi Gábor: Heterogeneity in Stock Market Expectation. and Portfolio Choice of American Households

SZENT ISTVÁN EGYETEM GÖDÖLLŐ. DOKTORI (PhD) ÉRTEKEZÉS - TÉZISFÜZET

A (szak)képzés hazai rendszere, működési zavarai és megújítása

szerepet tölt be. A nagy evolúciós átmenetek szinte minden esetben tekinthetők

1. SZÁMÚ MELLÉKLET. EURÓPAI MODELL EDI MEGÁLLAPODÁS JOGI RENDELKEZÉSEK MAGYARÁZAT Bevezető

CCI-szám: 2007HU16UPO001. EGYSÉGES SZERKEZETBE FOGLALT MÓDOSÍTÁS november

A HÁZTARTÁSI KÖLTSÉGVETÉSI ADATFELVÉTELEK HÉT ÉVTIZEDE

Kutatási infrastruktúrák Magyarországon

JÓLÉTI ÉS SZOCIÁLIS PROGRAMOK

AZ EURÓPAI KÖZÖSSÉGEK BIZOTTSÁGA

Nők a munkaerőpiacon. Frey Mária

Könczöl Erzsébet. A vállalati értéknövelés helye a magyar középvállalatok stratégiai célrendszerében

HELYI TANTERV BIOLÓGIA Tantárgy

Általános statisztika II. Kriszt, Éva Varga, Edit Kenyeres, Erika Korpás, Attiláné Csernyák, László

A STATISZTIKA: TUDOMÁNY ÉS SZAKMA*

Hírek, események. Györgyöt a Szolgáltatás- és külkereskedelemstatisztikai. osztálya vezetőjévé nevezte ki.

A FELVIDÉKI MEZŐGAZDASÁGI BETEGSÉGI BIZTOSÍTÁS TANULSÁGAI ÍRTA: ILLÉS GYÖRGY

WageIndicator adatbázisok eredményeinek disszeminációja H005 EQUAL projekt. WageIndicator és BérBarométer adatbázisok eredményeinek disszeminációja

A SZAKÉRTŐI ÉRTÉKELÉS JELENTŐSÉGÉRŐL 1

Tatai Kistérségi Többcélú Társulás Esélyegyenlőségi Programja

Szociális párbeszéd új keretek között

HELYI KONFLIKTUSOK AZ ÍROTT MÉDIÁBAN

Eötvös Loránd Tudományegyetem Bölcsészettudományi Kar DOKTORI ÉRTEKEZÉS TÉZISEI BARTHA KRISZTINA

KÖZPONTI STATISZTIKAI HIVATAL NÉPESSÉGTUDOMÁNYI KUTATÓINTÉZETÉNEK KUTATÁSI JELENTÉSEI 91.

EMLÉKEZTETŐ. az Országos Statisztikai Tanács október 10-i üléséről

A CSALÁDOK ÉS HÁZTARTÁSOK ELŐRESZÁMÍTÁSA, BUDAPEST 1988/2

A romániai magyarság termékenysége között, regionális összehasonlításban

Társadalmunk jövedelmi munkaerõ-piaci helyzete

Regressziószámítás alkalmazása kistérségi adatokon

Vállalkozás alapítás és vállalkozóvá válás kutatás zárójelentés

STATISZTIKAI SZEMLE TARTALOM ÁLTALÁNOS ELMÉLET A STATISZTIKA TÖRTÉNETE ÉS SZERVEZETE

60. ÉVFOLYAM 12. SZÁM KÖZLEKEDÉSÉPÍTÉSI SZEMLE DECEMBER

Pécsi Tudományegyetem Természettudományi Kar Földrajzi Intézet Földtudományok Doktori Iskola

A TESZTÜZEMEK FŐBB ÁGAZATAINAK KÖLTSÉG- ÉS JÖVEDELEMHELYZETE 2002-BEN

munkaerőpiaci tükör 2005

VI. DÖNTÉSHOZATAL KÉZIKÖNYVE

Írásunkban a kutatás legfontosabb eredményeit kívánjuk közreadni.

HUMÁNTUDOMÁNYI INTÉZET. TDK TÉMAJAVASLATOK Részletes bemutatása év

Akikért a törvény szól

A karbantartási stratégiák és a vállalati kultúra szerepe a szervezeti üzleti folyamatokban

P. Lakatos Ilona T. Károlyi Margit Iglai Edit, Változó nyelvhasználat a hármas határ mentén

Veres Judit. Az amortizáció és a pénzügyi lízingfinanszírozás kapcsolatának elemzése a lízingbeadó szempontjából. Témavezető:

KÜLKERESKEDELMI FŐISKOLAI KAR

NEMZETI KÖZSZOLGÁLATI EGYETEM KÖZIGAZGATÁS-TUDOMÁNYI DOKTORI ISKOLA

Alkotmánybíróság. a Fővárosi Közigazgatási és Munkaügyi Bíróság útján. Tárgy: alkotmányjogi panasz. Tisztelt Alkotmánybíróság!

ÜGYLETEK A KERESKEDELMI JOGBAN

KÖNYVEK A TÁRSADALMI RÉTEGZÕDÉS ASPEKTUSAIRÓL. BLASKÓ Zsuzsa

A munkaviszonyból keletkező kötelmek szabályozásáról

Átírás:

STATISZTIKAI SZEMLE A KÖZPONTI STATISZTIKAI HIVATAL FOLYÓIRATA SZERKESZTŐBIZOTTSÁG: DR. BELYÓ PÁL, ÉLTETŐ ÖDÖN, DR. HARCSA ISTVÁN, DR. HUNYADI LÁSZLÓ (főszerkesztő), DR. JÓZAN PÉTER, DR. MÁTYÁS LÁSZLÓ, NYITRAI FERENCNÉ DR., DR. OBLATH GÁBOR, OROS IVÁN, DR. PUKLI PÉTER (a Szerkesztőbizottság elnöke), DR. RAPPAI GÁBOR, DR. SIPOS BÉLA, DR. SPÉDER ZSOLT, DR. SZÉP KATALIN, DR. SZILÁGYI GYÖRGY, DR. VITA LÁSZLÓ 83. ÉVFOLYAM 10 11. SZÁM 2005. OKTÓBER NOVEMBER

E SZÁM SZERZŐI: Dr. Benedek Gábor PhD, a Budapesti Corvinus Egyetem tudományos munkatársa; Bozsó Dávid PhD-hallgató; Dr. Forgon Mária, a Központi Statisztikai Hivatal osztályvezetője; Futó Péter, a Budapesti Corvinus Egyetem tudományos munkatársa, az Ariosz Kft. tanácsadója; Dr. Gyöngyösi István c. egyetemi docens, a Központi Statisztikai Hivatal főtanácsosa; Dr. Horváth Csilla PhD, a Budapesti Corvinus Egyetem tanársegéde, a Magyar Nemzeti Bank kutatója; Karajannisz Manolisz, az Ariosz Kft. tanácsadója; Dr. Köves Pál professor emeritus, Budapesti Corvinus Egyetem; Polt Rita, a Budapesti Corvinus Egyetem adjunktusa; Rakonczai Pál PhD-hallgató; Dr. Szalai Sándor kandidátus, az Országos Meteorológiai Szolgálat főtanácsosa; Dr. Szentimrey Tamás, az Országos Meteorológiai Szolgálat főtanácsosa; Dr. Szilágyi György, a közgazdaság-tudomány doktora, egyetemi tanár, a Hivatalos Statisztika Tudományos Tanácsának elnöke; Dr. Szilágyi Nóra, az Eötvös Loránd Tudományegyetem főmunkatársa; Tardos Ádám, az Ariosz Kft. tanácsadója; Zempléni András kandidátus, az Eötvös Loránd Tudományegyetem docense. * Földházi Erzsébet, a KSH Népességtudományi Kutató Intézet tudományos kutatója; Nándudvari Zoltán, a KSH főtanácsosa; Sághi Tamás, szociológus; Tűű Lászlóné kandidátus, a KSH ny. osztályvezetője; Waffenschmidt Jánosné, a KSH főosztályvezetője. ISSN 0039 0690 Megjelenik havonta egyszer Főszerkesztő: dr. Hunyadi László Osztályvezető: Dobokayné Szabó Orsolya Kiadja: a Központi Statisztikai Hivatal A kiadásért felel: dr. Pukli Péter 4352 Akadémiai Nyomda Martonvásár, 2005 Felelős vezető: Reisenleitner Lajos Szerkesztők: Várady Soma, Visi Lakatos Mária Tördelőszerkesztők: Bartha Éva, Simonné Káli Ágnes Szerkesztőség: Budapest II., Keleti Károly utca 5 7. Postacím: Budapest, 1525. Postafiók 51. Telefon: 345-6908, 345-6546 Telefax: 345-6594 Internet: www.ksh.hu/statszemle E-mail: statszemle@ksh.hu Kiadóhivatal: Központi Statisztikai Hivatal, Budapest II., Keleti Károly utca 5 7. Postacím: Postafiók 51. Budapest, 1525. Telefon: 345-6000 Előfizetésben terjeszti a Magyar Posta Rt. Hírlap Üzletág (1008 Budapest, Orczy tér 1). Előfizethető közvetlen a postai kézbesítőknél, az ország bármely postáján, valamint e-mailen (hirlapelofizetes@posta.hu) és faxon (303-3440). További információ: 06-80-444-444 Előfizetési díj: fél évre 3000 Ft, egy évre 5400 Ft Beszerezhető a KSH Könyvesboltban. Budapest II., Keleti Károly u. 10. Telefon: 212-4348

TARTALOM Bevezető... 909 Gyakorlati kódex az európai statisztikában. Dr. Szilágyi György... 911 Árvizek a Tiszán és néhány mellékfolyóján. Extrémértékmodellezés a gyakorlatban. Bozsó Dávid Rakonczai Pál Zempléni András... 919 Zenei hangok pótlása neurális hálók segítségével. Benedek Gábor Horváth Csilla... 937 A születéskor induló bioritmusciklusokról. Köves Pál... 948 Melegedett-e Magyarország éghajlata a XX. században? Szalai Sándor Szentimrey Tamás... 978 Levegőkereskedelem A Nemzeti Kiosztási Terv kialakítása. Polt Rita... 990 Statisztika a neurobiológiában. Dr. Szilágyi Nóra...1010 A lakosság internethasználatának befolyásoló tényezői. Futó Péter Karajannisz Manolisz Tardos Ádám...1020 A statisztikai törvények értéke a fizikában és a társadalomtudományokban. Ettore Majorana...1037 SZEMLE A Nemzetközi Input-Output Társaság (IIOA) 15. konferenciája. Forgon Mária...1046 XLII. Statisztikatörténeti Vándorülés, 2005. Dr. Gyöngyösi István...1047 STATISZTIKAI HÍRADÓ Személyi hírek...1054 Szervezeti hírek Közlemények...1054 STATISZTIKAI IRODALMI FIGYELŐ Külföldi statisztikai irodalom Russel, M. Takac, P. Usher, L.: Az észak-amerikai ágazati osztályozáson alapuló termelékenységi trendek az Egyesült Államokban. (Tűű Lászlóné dr.)...1057

Ehling, M. Linz, S. Minkel, H.: A statisztika nemzetközi harmonizációja alapelvek és példák a háztartási felvételek területéről. (Waffenschmidt Jánosné)...1059 Körner, T. Nimmergut, A.: Az access panel mint az önkéntes háztartási felvétel mintavételi kerete. (Sághi Tamás)...1062 Lee, E. Spitze, G. Logan, J. R.: A házastárs szüleinek nyújtott társas támogatás: a nem és a rokonsági hierarchia szerepe. (Földházi Erzsébet)...1064 Christiansen, H. Bertrand, A.: Irányzatok a külföldiek működőtőke-beruházásainak alakulásában. (Nádudvari Zoltán)...1066 Külföldi folyóiratszemle...1067 Bibliográfia...1073 A Statisztikai Szemlében megjelenő tanulmányok kutatói véleményeket tükröznek, amelyek nem esnek szükségképp egybe a KSH vagy a szerzők által képviselt intézmények hivatalos álláspontjával. Utánnyomás csak a forrás megjelölésével!

BEVEZETŐ Szokatlan számot tart kezében az Olvasó. Szerkesztőségünk régi vágya, hogy legalább egyetlen szám erejéig megmutassuk a statisztika tudományának sokrétűségét, sokszínűségét azt, hogy az alkalmazások mennyire eltérő területeken jelennek meg és azt, hogy a statisztika sokkal több annál, mint amit a hétköznapi ember, de akár a valamely (még oly fontos) területre specializálódott szakember is gondol róla. Ezért megpróbáltunk egy olyan számot összeállítani, amely bepillantást enged távoli világokba, melyeket a statisztika köt össze. Mivel olvasóink nagy része a hivatalos statisztika, ezen belül a társadalom- és gazdaságstatisztika művelője és elkötelezettje, úgy gondoltuk, némi bevezető magyarázatot kell fűznünk az egyes, egymástól sokszor eléggé távol álló szakterületek publikációihoz. Az első tanulmány, Szilágyi György munkája, még szorosan véve a hivatalos statisztika területén mozog. Szándékosan indítottuk számunkat evvel a dolgozattal, így kívánjuk hangsúlyozni a hivatalos statisztika kiemelkedő fontosságát, a statisztika gyakorlatában betöltött kulcsszerepét. Összeállításunk második tanulmánya azonban már egészen más jellegű. Zempléni András és szerzőtársai a matematikai statisztika kiváló művelői, akik elsősorban egy módszer, az extrémérték-modellezés gyakorlati alkalmazását mutatják be cikkükben. Ez a tanulmány, amellett, hogy nagy súlyt helyez a módszer bemutatására, igen fontos és aktuális kérdést vizsgál, nevezetesen azt, hogy az utóbbi évek (évtizedek) sokasodó árvizei miképpen modellezhetők, és a jelenséget jól leíró modellek segítségével hogyan prognosztizálhatók. Bár egy ilyen kutatás csak feltételes és óvatos eredményeket adhat, már az itt közölt eredmények is, de a várható további kutatások kiváltképp fontos háttérinformációkat szolgáltathatnak az árvízvédelem tervezéséhez és megszervezéséhez. Arra, hogy a statisztika nem csupán az egzaktnak tekintett természettudományokban találhat alkalmazásokat, jó példát szolgáltat Benedek Gábor és Horváth Csilla dolgozata. Jóllehet ezt a munkát is tekinthetjük módszertani indíttatásúnak, mégis sokak számára meglepő lehet az a terület, amire alkalmazzák, hiszen ez a zenetudomány. A konkrét feladat hiányzó hangok pótlása magyar népdalokban módszertanilag viszonylag egyszerű, ám eredményei annál meggyőzőbbek: a bemutatott (és a részletesen be nem mutatott, de hivatkozott) vizsgálatokban az ellenőrzött tesztkísérletek meglepően jó eredményt hoztak: az esetek nagy részében elenyésző hibával tudták rekonstruálni a hiányzó hangokat, illetve dallamokat. E dolgozat értékelésekor feltétlen meg kell említeni, hogy az itt használt statisztikai módszer, a neurális hálók alkalmazása, a modern statisztika egyik legtöbbet ígérő metódusa, hiszen az emberi agy egyes funkcióit szimulálva kivételesen bonyolult feladatok megoldására is képes. Ezzel kapcsolatban megemlítendő még, hogy ezt a módszert a közelmúltban sikeresen alkalmazták egyes gazdasági feladatok (például csődelőrejelzés) megoldására, és igen bíztató kísérletek folynak felhasználásával a statisztikai alapokon nyugvó mesterséges fordítások terén is. Különlegességnek számít Köves Pál tanulmánya. A vizsgált téma, a születéskor induló bioritmusok léte, lassan száz éve vitatéma, és az illetékes szakterületek képviselői a mai napig sem értenek egyet abban, hogy léteznek-e ilyen ciklusok, vagy az egész csak véletlenek egybeesésén alapuló játék. A szerző statisztikai eszközök segítségével próbálja meg igazolni a ciklusok létét. Az írás második fele az álmokat és a párválasztást próbálja meg bioritmusok segítségével magyarázni. Bár a Szerkesztőség véleménye szerint ez a rész az egyedi esetek és kicsi, nem véletlen minták bemutatásával meglehetősen távol esik a statisztika tömegjelenségeket vizsgáló módszertanától, mégis teljes terjedelmében közöljük a dolgozatot. Ennek oka a Szerző határozott kérése mellett egyrészt az, hogy számos,

megfontolásra érdemes gondolat található benne, ami esetleg felkelti más szakterületek kutatóinak érdeklődését, másrészt az, hogy sok érdekes kultúrtörténeti ismeretet tartalmaz. Arról az alapkérdésről pedig, hogy léteznek-e bioritmusciklusok, a végső szót a szaktudományoknak kell kimondaniuk. Szalay Sándor és Szentimrey Tamás tanulmánya azt a mostanában gyakori kérdést boncolja, hogy a meteorológiai adatok alátámasztják-e azt a közfelfogást, miszerint Magyarország (és az egész északi félteke) átlaghőmérséklete az elmúlt száz évben melegedett. A cikk érdekessége, hogy nagy súlyt helyez az adatok összehasonlíthatóságának vizsgálatára, részletesen bemutatva a homogenizálás eszközeit és eredményeit. Aligha kell hangsúlyozni, hogy a dolgozat központi módszertani eleme, a homogenizálás más tudományokban alkalmazott statisztikai idősorelemzések esetén is életbevágó fontosságú, ezért ez a dolgozat is túlmutat saját alkalmazási területén. Polt Rita egy igen érdekes környezetvédelmi problémát vizsgál. Ismeretes, hogy a gazdasági fejlődés egyik nem kívánt mellékhatása az üvegházhatást előidéző gázok kibocsátása, ami tartós és kedvezőtlen irányú klímaváltozást indukálhat. Ezért a fejlett országok önkéntesen, egyezményekbe foglalt módon korlátozzák saját emissziójukat, így az az ország, ahol ez a káros kibocsátás kisebb, illetve ezt az átlagosnál jobban csökkenti, gazdasági előnyökhöz juthat. Ezért fontos a kibocsátás minél pontosabb középtávú prognosztizálása, ami a Nemzeti Kiosztási Tervben ölt testet. A dolgozat bemutatja a Nemzeti Kiosztási Terv kialakításának folyamatát és az azokat leíró, illetve regressziós modelleken alapuló statisztikai eszközöket, amelyek segítségével ez a Terv megalapozható. A neurobiológia területén alkalmazott statisztikai elemzésekről készített tanulmányt Szilágyi Nóra. Amellett, hogy érdekes és fontos gondolatokat ad közre az interdiszciplináris kutatásokkal (jelen esetben a statisztikával és a biológiával) kapcsolatban, egy esettanulmányt is bemutat, melyben azt vizsgálja, hogy az emberi agy egyes régióiban miként oszlik meg a különböző kémiai anyagok koncentrációja. A vizsgálat egy alaposan megtervezett mintavételen alapul, és az alakfelismerés, valamint a klaszteranalízis módszereit használja fel. Futó Péter és szerzőtársai a magyar lakosság információs és kommunikáció-technikai ellátottságát és ismereteit elemzik egy e célra készített mintavételes adatfelvétel alapján. Eredményeik, melyeket a gondos mintavétel és az átsúlyozás okán országosan reprezentatívnak értékelnek, segítséget nyújthatnak a kormányzati és társadalmi szerveknek a tudásalapú társadalom felépítésében. A tanulmányok sorát egy ugyancsak különleges cikk zárja. Szerzője Ettore Majorana, a már fiatalon is kiváló eredményeket elért olasz fizikus, aki még 1938-ban nyomtalanul eltűnt és félbemaradt életművet hagyott maga után. Ez az írása, mely a fizika és a társadalomtudományok statisztikus jellegének egyes közös vonásait vázolja, eltűnése után, 1941-ben jelent meg a Scienzia c. lapban az itt közzétett cikk ennek fordítása. Hangsúlyoznunk kell, hogy az írás 1935 körül született, így megállapításai az akkori idők fizikájának, társadalomtudományának és statisztikájának helyzetét tükrözik, így néhány megállapítása mára túlhaladottá vált. Alapvető mondanivalója azonban az ugyanis, hogy ez a két terület egyebek közt, éppen a közös statisztikai törvényszerűségek kapcsán módszertanilag és a kutatás eszközeit tekintve egymást erősítheti ma is aktuális. Ennek élő példája, hogy a közgazdaságtudomány több területén (például mikroökonómia, pénzügy) mára intenzív átjárás valósult meg fizikusok és közgazdászok közt. A nehéz, olykor filozófiai mélységű szakmai szöveg magyar változatának ellenőrzésében és korrekciójában a fordítót két fizikus kolléga, Martinás Katalin és Nagy Dénes Lajos segítette, akiknek ehelyütt mondunk köszönetet munkájukért. Ez az összeállítás természetesen távolról sem teljes: sok fontos és érdekes terület maradt ki a statisztika alkalmazásának köréből. Vártunk tanulmányt a szerencsejátékok tervezése és szervezése területéről, kerestünk pszichológiai, földrajzi, nyelv- és irodalomtudományi alkalmazásokat, sportstatisztikát, de ezekből itt és most nem születtek közölhető cikkek. A különböző tudományágakban és a hétköznapi életben egyaránt bizonyára van még egy sor olyan terület, ahol érdekes és hasznos statisztikai alkalmazásokkal találkozhatnánk. Ennek ellenére bízunk abban, hogy elérjük célunkat, azt ugyanis, hogy megmutassuk a statisztika sokféle arcát, még akkor is, ha az egyes tanulmányok szakmai mondanivalója sokak számára nehezen megközelíthető. Bízunk abban is, hogy az itt bemutatott alkalmazási területekkel a statisztikus közvélemény számára felmutatjuk a statisztikának mint módszernek gazdagságát és ez ösztönzően hathat a különböző területeken dolgozó statisztikusok munkájára. A Szerkesztőség

GYAKORLATI KÓDEX AZ EURÓPAI STATISZTIKÁBAN DR. SZILÁGYI GYÖRGY Az Európai Unió Statisztikai Programbizottsága 2005 februárjában elfogadta Az európai statisztika gyakorlati kódexét, avval a céllal, hogy erősítse a hivatalos statisztika függetlenségét, integritását és ellenőrizhetőségét. A cikk e gyakorlati kódexet mutatja be formai és tartalmi szempontból. A kódex négyszintű struktúra, melyben tizenöt elv és mintegy nyolcvan ismérv tartalmazza a fő mondanivalót. A cikk ezek válogatásán és helyenként kritikai kommentálásán keresztül világítja meg, hogy az Unió milyen eszközöket állít az európai statisztika továbbfejlesztésének szolgálatába. TÁRGYSZÓ: Etikai kódex. Hivatalos statisztika. A nemzetközi statisztikai élet utóbbi két évtizedét bízvást nevezhetjük a kodifikáció korszakának, amennyiben e húsz év alatt, a statisztika széles körét lefedő három dokumentum látott napvilágot. A sort 1985-ben a Nemzetközi Statisztikai Intézet (ISI) kezdte A szakmai etikáról szóló deklarációval (ISI [1986]; KSH [1984], Szilágyi [2002]); ezt követtte A hivatalos statisztika alapelvei című dokumentum, amelyet az Európai Statisztikusok Értekezlete dolgozott ki és amelyet 1992-ben fogadott el az ENSZ Európai Gazdasági Bizottsága, 1994-ben pedig az ENSZ Statisztikai Bizottsága (Határozat [1991], UN [1993], Szilágyi [2004]). A sorozat legfrissebb tagja pedig az Európai Unió által 2005-ben kiadott Az európai statisztika gyakorlati kódexe (Eurostat [2005], KSH [2005]). 1 A továbbiakban ez utóbbival, a Gyakorlati kódexszel foglakozunk, előbb azonban érdemes a három dokumentumot abból a szempontból összehasonlítani, hogy a statisztika, illetve a statisztikusok mely körére vonatkoznak. 1. Az Etikai deklaráció minden ország minden statisztikusához szól, tehát a hivatalos és az ún. akadémiai statisztikusokhoz egyaránt. 2. A Hivatalos statisztika alapelveinek is az egész világ az országköre, de az elvek már csak a hivatalos statisztikára vonatkoznak. 3. A Gyakorlati kódex szintén a hivatalos statisztikával foglalkozik, az országok köre azonban szűkebb, mint az előbb említett két dokumentum esetében: a gyakorlati kódex az Európai Unió tagországait érinti. Ennél is fontosabb azonban, hogy ellentétben a másik 1 European Statistics Code of Practice. Az Országos Statisztikai Tanács 2005. június 1-jén tárgyalta meg a Gyakorlati kódexet, melyről jelen cikk szerzője tartott előadást. A cikk az előadás bővített és szerkesztett változata. Statisztikai Szemle, 83. évfolyam, 2005. 10 11. szám

912 DR. SZILÁGYI GYÖRGY két dokumentummal a Gyakorlati kódex kötelező erővel bír. Az EU ellenőrizni fogja az abban foglaltak érvényesülését. A GYAKORLATI KÓDEX JELLEGE ÉS FELÉPÍTÉSE A Gyakorlati kódexet néhány éves előkészítés után 2005 februárjában fogadta el az Európai Unió legmagasabb statisztikai döntéshozó szerve, a Statisztikai Programbizottság. A dokumentum három vezérgondolata a hivatalos statisztika függetlensége, integritása és ellenőrizhetősége. A kódexben a statisztika iránti bizalom jut kifejezésre abban az értelemben, hogy az Unió szinte fenntartás nélkül támaszkodik a statisztikai információra (amennyiben a statisztika eleget tesz a gyakorlati kódex követelményeinek.) A Gyakorlati kódexszel legegyszerűbben úgy ismerkedhetünk meg, hogy a dokumentumot felépítése, szerkezete oldaláról közelítjük. Ebben az értelemben a kódex négyszintes építményként fogható fel. ELSŐ SZINT: Fejezetek (számszerint három: az intézményi környezet, a statisztikai folyamatok és e folyamatok eredménye). MÁSODIK SZINT: Elvek 2 (amelyek a helyes gyakorlati munka követelményeit rögzítik, például szakmai függetlenség; felhatalmazás adatgyűjtésre stb). A kódex tizenöt elvet tartalmaz. HARMADIK SZINT: Magyarázatok (amelyek egy-két mondatban értelmezik az elveket). Ennek megfelelően a magyarázatok száma ugyanannyi, mint az elveké, azaz tizenöt. NEGYEDIK SZINT: Ismérvek 3 (melyek mintegy aprópénzre váltják és ezáltal konkretizálják és magyarázzák a második és harmadik szinten megfogalmazott elvet, másrészt ezek mentén történik a szóban forgó elv érvényesülésének ellenőrzése). Minden elvhez legalább három, legfeljebb hét ismérv járul, így közel nyolcvan ilyen ismérvvel van dolgunk. A SZERKEZETTŐL A TARTALOMIG A következőkben megvilágítjuk az eddig elmondottakat. Mindenekelőtt bemutatjuk az első két szint tételeit, ily módon láthatóvá válik a rendszer belső logikája. A gyakorlati kódex első két szintje Intézményi környezet 1. Szakmai függetlenség 2. Felhatalmazás adatgyűjtésre 3. Megfelelő anyagi források 4. Minőségi kötelezettségek 5. Adatvédelem 6. Pártatlanság 2 Kissé ellentmondásosnak tűnik egy gyakorlati kódexnek elvekből ( principles ) való felépítése, de mivel láthatólag ez eddig senkit sem zavart, megtartom ezt a terminológiát. Szabadabb fordításban talán tételekkel lehetne helyettesíteni az elveket. A tartalmat illetően azonban ennek nincs jelentősége. 3 A dokumentum az indicators (mutatók) terminust használja; ez azonban a magyarban zavaróan hatna, hiszen, mutató alatt általában statisztikai mutatót értünk.

GYAKORLATI KÓDEX AZ EURÓPAI STATISZTIKÁBAN 913 Statisztikai folyamatok 7. Stabil módszertan 8. Megfelelő eljárások 9. Az adatszolgáltatók terheinek csökkentése 10. Költséghatékonyság A statisztikai folyamatok eredménye ( statisztikai output ) 11. Relevancia 12. Pontosság és megbízhatóság 13. Gyorsaság 14. Koherencia és összehasonlíthatóság 15. Hozzáférhetőség és érthetőség Még közelebb jutunk a tartalomhoz, ha tételesen ismertetjük az egyik alapelv teljes szövegét. Választásunk az 1. elvre, a Szakmai függetlenségre esik, mert ez az elv nem véletlenül került a kódex élére. Definíciói és ismérvei tulajdonképpen magukban foglalják a kódex vezérgondolatait. 1. alapelv. Szakmai függetlenség Magyarázat: A statisztika vezető intézményeinek szakmai függetlensége bármely más hatóságtól, valamint a magánszektor szereplőitől, biztosítja az európai statisztikák hitelességét. Az ismérvek: A statisztika vezető intézményeinek szakmai függetlensége a hivatalos statisztikák összeállításában és közzétételében törvény által szabályozott. A nemzeti statisztikai hivatal vezetője kellően magas posztot foglal el a hierarchiában ahhoz, ami a szakpolitikákat felügyelő hatóságokkal és a közigazgatás felső szintjével való kapcsolattartáshoz szükséges. E vezetőnek a legmagasabb szakmai szintet kell képviselnie. A nemzeti statisztikai hivatal vezetője és ahol ilyen van a többi statisztikai szerv vezetője is felelősséggel tartozik azért, hogy az európai statisztikák előállítása és közzététele független módon menjen végbe. A nemzeti statisztikai hivatal vezetője és ahol ilyen van a többi statisztikai szerv vezetője kizárólagos felelősséggel tartozik a statisztikai módszerek, szabványok és eljárások megválasztásáért, valamint a statisztikai közlések tartalmáért és közzétételének időzítéséért. A statisztikai munkaprogramok nyilvánosak és időszakos jelentések számolnak be ennek előrehaladásáról. A statisztikai kiadványok világosan különböznek a politikai megállapításoktól és azoktól elkülönítve jelennek meg. A vezető statisztikai intézmény, ha szükséges, nyilvánosan állást foglal statisztikai kérdésekben, ideértve a hivatalos statisztikát ért kritikákat és a rosszhiszemű felhasználást.

914 DR. SZILÁGYI GYÖRGY A KÓDEX ELVEI AZ ISMÉRVEK TÜKRÉBEN Ezek után némileg lazíthatunk tárgyalásunk módján úgy, hogy a további elvekhez tartozó ismérveket nem teljeskörűen vizsgáljuk, hanem egy-két jellegzetes ismérvet, vagy megfogalmazást emelünk ki. A figyelmes olvasó számára ki fog tűnni, vagy már kitűnt, hogy sem a fejezetek nem tekinthetők az elvek diszjunkt halmazának, sem az elvek az ismérvekének. Az átfedések azonban nem annyira szerkesztésbeli fogyatékosságok, mint inkább a fogalmak kölcsönös kapcsolatainak következményei. Ennek tudatában lépjünk közelebb az egyes elvekhez, most már nem a szerkezet, hanem a tartalom szempontjából. Reménytelen vállalkozás és nehézkes olvasmány lenne azonban a közel nyolcvan ismérv egyenkénti felsorolása és méltatása, ezért némi szelekcióra lesz szükség. Az Intézményi környezet fejezet 2. elve, az Adatgyűjtésre való felhatalmazás mintegy folytatása az 1. elvnek, amennyiben törvényi és más biztosítékokat ír elő annak érdekében, hogy a hivatalos statisztika zavartalanul láthassa el egyik alapfeladatát, az adatgyűjtést. E zavartalansághoz, illetve az adatgyűjtésre való felhatalmazáshoz hozzátartozik az adminisztratív nyilvántartások statisztikai célú felhasználása, mellyel többször is találkozunk a kódexben. Szintén a feltételeket biztosítja a 3. elv, a statisztikai feladatok ellátásához szükséges anyagi források biztosítása. Szembetűnő az itt használt, némileg önző megfogalmazás, amennyiben csak az európai statisztikához szükséges forrásokról esik szó, mintha sajátos nemzeti statisztikai igények nem is lennének. A minőségi kötelezettségeket tárgyaló 4. elv még nem a statisztikai adatok minőségére vonatkozik (avval majd az elvek harmadik csoportjában, a statisztikai output tárgyalásánál találkozunk), hanem a minőségbiztosítás feltételeivel. Jellegzetes mutató pl. a legfontosabb statisztikai eredmények rendszeres és alapos felülvizsgálata, szükség esetén külső szakértők bevonásával. Az adatvédelem (5. elv) kifejezetten az egyedi adatok védelméről 4, más szóval az adatszolgáltatók integritásáról gondoskodik és ennek érdekében épít be garanciákat a rendszerbe; például Szigorú eljárásrend azokra az esetekre, amikor külső felhasználók kutatási célból statisztikai mikroadatokhoz férhetnek hozzá. A pártatlanságról és objektivitásról szóló 6. elv majdnem olyan körültekintő, mint a szakmai függetlenséget tárgyaló első. Fő mondanivalója: valamennyi felhasználó egyenlő kezelése. Ízelítőül az ismérvek egyike: Valamennyi felhasználó egyidejűleg férhet hozzá az adatokhoz és bármilyen privilegizált külső felhasználó ennél korábbi hozzáférése erősen korlátozott, ellenőrzött és nyilvános. A Gyakorlati kódex második fejezete (7 10. elv) a statisztikai folyamatokkal, a statisztika készítésének különböző aspektusaival foglalkozik. Ha az első fejezet a statisztika intézményi feltételeit írta le, akkor a másodikat a szakmai feltételek felsorolásának tekinthetjük. A stabil módszertan (7. elv) zálogát a kódex mindenekelőtt a nemzetközi szabványok alkalmazásában látja, de itt sorolja fel a munkavállalói állomány frissítését, új generációk bevonását és a rendszeres továbbképzést is. A megfelelő statisztikai eljárások (8. elv) ismérvei számos technikai részletet konkretizálnak az adatfelvételek tervezésétől, a mintavétel mikéntjén keresztül az editálási és 4 Tehát nem a statisztikai adatok titkosságával foglalkozik, hiszen az egész kódexen végigvonul a nyilvánosság gondolata.

GYAKORLATI KÓDEX AZ EURÓPAI STATISZTIKÁBAN 915 imputációs eljárások rendszeres felülvizsgálatáig és aktualizálásáig. Olyan részletekbe hatol itt a szöveg, mint például A kérdőívek szisztematikus tesztelése a statisztikai adatfelvételek előtt. Ismét találkozunk az adminisztratív nyilvántartásokkal, mint statisztikai forrásokkal, de más felfogásban mint eddig: itt a kódex nem elégszik meg e forrásokhoz való hozzáféréssel, hanem megköveteli, hogy e források alkalmazkodjanak a statisztika igényeihez. A gyakorlati kódex mint eddig is láttuk a nemzeti statisztikai intézmények számára szab feladatokat. Az ezeket előíró mutatók között az olvasó különös megelégedéssel talán némi kajánsággal is fedez fel olyanokat, amelyek címzettje maga az Eurostat. Ilyen Az adatszolgáltatók terheinek csökkentéséről szóló 9. elv, melyben a következő majd hogy nem szívet melengető szavakat találjuk: Az európai statisztikák terjedelmének és részletezettségének a feltétlenül szükségesre való korlátozása. E fejezet végén szereplő Költséghatékonyság (10. elv) a források észszerű felhasználását célozza. Ez kiterjed a forrásfelhasználás ellenőrzésére, a rutin irodai műveletek (például kódolás) automatizálására és a költséges összeírások elkerülését szolgáló módozatokra. Az intézményi környezet és a statisztikai eljárások tulajdonképpen feltételei a statisztikai munka termékének, az adatoknak és elemzéseknek. Ez utóbbiakkal, a statisztikai folyamatok Eredményével ( statisztikai output ) foglalkozik a harmadik fejezet (11 15. elv) Ennek a fejezetnek mind az öt elve a statisztika minőségének egy-egy aspektusát tárgyalja. A statisztika minőségére vonatkozó fogalmak napjainkban igen kifinomultak és sokrétűek (lásd például Szép Vigh [2004]). 5 Az Eurostat nagyszámú és terjedelmes dokumentumaiból csak néhány összefoglaló gondolat került a Gyakorlati kódexbe. A relevancia (11. elv) legfontosabb ismérve szerint a statisztika megfelel a felhasználói szükségleteknek, azaz avval foglalkozik, amire a felhasználók kíváncsiak és ennek érdekében rendszeresen figyelemmel kíséri a felhasználók igényeit. A szoros értelemben vett minőségről a 12. elv (Pontosság és megbízhatóság) intézkedik, olyan ismérvekkel, mint az adatforrások, a köztes és végső eredmények viszonyának értelmezése, vagy a mintavételi és nem mintavételi hibák mérése. A gyorsaság és pontosság (13. elv); amelyen itt az időbeli pontosságot kell érteni) jellegzetes követelménye a tájékoztatási naptár megléte és betartása. A 14. elv (Koherencia és összehasonlíthatóság) az idő- és térbeli összehasonlíthatóságot hangsúlyozza. A különböző statisztikák nem elszigeteltek, hanem szoros kölcsönhatás áll fenn közöttük. Vonatkozik ez a különböző források körére, definíciókra és osztályozásokra. A sorban utolsó helyen álló (15. elv) Hozzáférhetőség és érthetőség tipikus minőségi tulajdonság, amely a statisztikának az értelmezést megkönnyítő prezentációs formáját állítja középpontba; de ide tartozik a felhasználók tájékoztatása az alkalmazott módszertanról és az eredmények minőségéről is. IMPLICIT ELVEK Vázlatosan végighaladva a Gyakorlati kódexen, nyilvánvaló, hogy a rendszer magvát az ismérvek képezik. Bár ezek a hierarchia legalsó szintjén helyezkednek el, ők tartal- 5 Az Országos Statisztikai Tanács említett ülésén dr. Szép Katalin éppen erről, az EU-statisztika minőségi elvárásairól tartott előadást.

916 DR. SZILÁGYI GYÖRGY mazzák a tényleges tennivalókat, a statisztikai szolgálattal szemben felállított követelményeket. Hozzájuk képest a három felső szint inkább keretként és orientációként szolgál, amelyek nélkül nehéz lenne eligazodni a nagyszámú mutató között. Ennek megfelelően az ismérveket illetve azok válogatását eddig az elveknek alárendelve tárgyaltuk. Ha azonban a Gyakorlati kódexet valóban a gyakorlat útmutatójának tekintjük, akkor érdemes a rendszert az ismérvek oldaláról, belőlük kiindulva is szemügyre venni. Ez sem jelenti a közel nyolcvan ismérv felsorolását, de akad néhány olyan, amely a kódex több helyén is előfordul, mintegy irányító fonalként húzódik végig a rendszeren; érdemes ezekre külön felfigyelni, mert evvel kiegészítő ismereteket nyerünk a Gyakorlati kódexről. Sőt, ennél többet is állíthatunk: a több helyen előforduló ismérvek halmaza nagyjából ugyanolyan rangú, mint egy-egy elv a tizenöt közül. Ezért az ilyen halmazt implicit elvnek nevezem. A következőkben tehát ilyen implicit elvekkel foglakozunk (anélkül hogy teljes listát állítanánk össze a több helyen is szereplő ismérvekről.) Ezek az implicit elvek a hivatalos statisztika törvényi garanciái, az adminisztratív nyilvántartások felhasználása, lefektetett és dokumentált eljárások, a nyilvánosság. Az implicit elveket azoknak az ismérveknek egyszerű felsorolásával mutatom be, amelyek tartalmilag beleillenek, zárójelben feltüntetve annak az elvnek a sorszámát, amelyből a mutató származik (például 1. A szakmai függetlenséget jelzi). 6 A hivatalos statisztika törvényi garanciái A statisztika vezető intézményének politikai és bármilyen külső beavatkozástól való függetlensége a hivatalos statisztikák összeállításában és közzétételében törvény által szabályozott. (1.) A hivatalos statisztikák készítése és közzététele érdekében végzett információgyűjtés joga törvény által szabályozott. (2.) A statisztikai adatvédelem törvény által garantált. (5.) Az adminisztratív nyilvántartások felhasználása 7 A vezető statisztikai intézménynek a nemzeti jogalkotás keretében felhatalmazása van adminisztratív nyilvántartások adataihoz való, statisztikai célú hozzáférésre. (2.) Ahol az európai statisztikák adminisztratív nyilvántartásokon alapulnak, ott az adminisztratív célú alkalmazások definíciói és fogalmai jól közelítik a statisztikai célú követelményeket. (8.) A költséges közvetlen összeírások elkerülése érdekében előtérbe kerül az adminisztratív nyilvántartások fokozott kihasználása. (10.) 6 E mutatók egy része elkerülhetetlenül ismétlésként kerül a listába, mert a cikk korábbi része már foglalkozott vele; a többség azonban nem ilyen. 7 Az Országos Statisztikai Tanács említett ülésén dr. Lakatos Miklós tartott előadást az adminisztratív nyilvántartások és a statisztika kapcsolatáról.

GYAKORLATI KÓDEX AZ EURÓPAI STATISZTIKÁBAN 917 Lefektetett és dokumentált eljárások A Gyakorlati kódex szövegének szinte leggyakrabban olvasható kitétele: Léteznek eljárások.; azaz a rendszer nemcsak azt követeli meg, hogy a statisztikai szolgálat foglalkozzék például a minőségellenőrzéssel, hanem azt is, hogy ezek az eljárások eleve, standardizált módon le legyenek fektetve és ellenőrizhetők legyenek. Ez az implicit elv feltűnően sokszor jelenik meg a dokumentumban. Léteznek olyan eljárások, amelyek értékelik az új statisztikai igényeket ezek költségeinek tükrében. (3.) Léteznek eljárások az európai statisztika folyamatos igényeinek értékelésére és annak megállapítására, hogy források felszabadítása érdekében melyek csökkenthetők vagy szüntethetők meg. (3.) Léteznek eljárások az adatgyűjtés, -feldolgozás és -közlés minőségének ellenőrzésére. (4.) Léteznek eljárások a minőségi elvárások elbírálására, beleértve a minőségi ismérvek közötti mérlegelést. (4.) A minőségi eljárások dokumentáltak. (4.) Léteznek és dokumentáltak az adatelőállítás és -közzététel teljes folyamatára érvényes adatvédelmi előírások. (5.) Szigorú eljárásrend érvényes azokra az esetekre, amikor külső felhasználók kutatási célból mikroadatokhoz férhetnek hozzá. (5. és 15.) A statisztikai adatközlések előre közölt tájékoztatási naptár szerint történnek. (6.) A standard fogalmak, definíciók és osztályozások konzisztens alkalmazását eljárási szabályok biztosítják. (7.) A revíziók szabványos, jól bejáratott és átlátható eljárásokat követnek. (8.) A mintavételi és nemmintavételi hibák mérése és rendszeres dokumentálása az európai minőségellenőrzés rendszerében történik. (12.) A metaadatok dokumentálása szabványosított metaadatrendszerek szerint valósul meg. (15.) Nyilvánosság A Gyakorlati kódex a következő esetekre, illetve dokumentumokra vonatkozóan írja elő a nyilvánosságot. A statisztikai munkaprogramok. (1.) A minőségi útmutatók. (4.) Az adatvédelmi előírások. (5.) A publikált statisztikákban felfedezett hibák korrekciója. (6.) Az alkalmazott módszerekről és eljárásokról szóló tájékoztató. (6.) A tájékoztatási naptár (6.) és az attól való eltérés, magyarázattal és az új időpont megjelölésével (13.).

918 DR. SZILÁGYI: GYAKORLATI KÓDEX AZ EURÓPAI STATISZTIKÁBAN Ellenőrzés Az eddigiekben felsorolt tizenöt elv és nagyszámú követelmény teljesítése részben új feladatokat jelent a hivatalos statisztika számára, részben a hagyományos tennivalók kapnak új hangsúlyt. Mindenesetre szükség van ezek teljesítésnek ellenőrzésére. A Gyakorlati kódex bevezető része szerint az Európai Unió kormányzati és statisztikai intézményei kötelezettséget vállalnak, hogy e kódexben rögzített elvekhez tartják magukat és végrehajtásukat időről időre áttekintik, referenciaként felhasználva 15 elv ismérveit. A Gyakorlati kódex végrehajtásának ellenőrzésére ( monitoringjára ) az Eurostat olyan rendszert alakított ki, melynek első lépése az önellenőrzés. Ennek során a hivatalos statisztika intézményei maguk állítják szembe saját rendszerüket avval a tükörrel, amelyet a rendszer ismérvei alkotnak. A későbbiekben már az Eurostat is bekapcsolódik az ellenőrzésbe, részben az önellenőrzéssel párhuzamosan, részben attól függetlenül. A tervek szerint az EU ehhez speciális és széles jogkörű ellenőrző testületet hoz létre. IRODALOM Eurostat [2005]: European Statistics Code of Practice. Kézirat. Határozat a hivatalos statisztika alapelveiről [1991]. Statisztikai Szemle. 69. évf. 10. sz. 836 837. old. ISI [1986]: Declaration on professional ethics. International Statistical Review. 54. évf. 2. sz. 227 242. old. KSH [1984]: A Nemzetközi Statisztikai Intézet Etikai Kódexe. Statisztikai hivatalok és nemzetközi intézmények statisztikai tevékenységéről. 66. sz. Központi Statisztikai Hivatal. Budapest. KSH [2005]: Az Európai Statisztika Gyakorlati Kódexe. Kézirat. SZÉP K. VIGH J. [2004]: A minőség a hivatalos statisztikában. Statisztikai Szemle. 82. évf. 8. sz. 773 798. old. SZILÁGYI GY. [2002]: Gondolatok a statisztika szakmai etikájáról. Statisztikai Szemle. 80. évf. 3. sz. 205 214. old. SZILÁGYI GY. [2004]: A hivatalos statisztika érvényesülése és etikája. Statisztikai Szemle. 82. évf. 5. sz. 453 461. old. UN [1993]: Fundamental Principles of Official Statistics. E/CN.3/1993/26 SUMMARY In early 2005 the Statistical Programme Committee of the European Union adopted the European Statistics Code of Practice, with the objective of enforcing independence, integrity and accountability of the European official statistics. The article puts forward the principal features of this document, both in terms of its structure and its professional requirements. The Code constitutes a four-level structure, with 15 principles and about 80 indicators as the levels carrying the core of the document. A selection among the indicators enables a sometimes critical analysis of the ways and methods designed for the development of European Statistics.

ÁRVIZEK A TISZÁN ÉS NÉHÁNY MELLÉKFOLYÓJÁN EXTRÉMÉRTÉK-MODELLEZÉS A GYAKORLATBAN BOZSÓ DÁVID RAKONCZAI PÁL ZEMPLÉNI ANDRÁS A tanulmányban bemutatjuk az extrémérték-elemzés módszereit, így különösen a blokkmaximumok vizsgálatánál használatos GEV- (általánosított extrémérték) eloszlásokat és a szint feletti adatok elemzésére alkalmas GP- (általánosított Pareto) eloszlásokat. Ismertetjük a paraméterbecsléshez nélkülözhetetlen maximum likelihood eljárást és a konfidenciaintervallumok konstrukciójára, valamint modellszelekcióra használt profillikelihood módszert. Az extrémérték modellek illeszkedésének vizsgálatára alkalmas statisztikai próbákat is bemutatunk. Mindezeket felhasználva becsléseket adunk a Tisza vízgyűjtőjéből származó vízállás- és vízhozam adatok alapján az eloszlások kvantiliseire (ezek éppen az adott visszatérési idejű árvizek) és vizsgáljuk az eredményeink időfüggését. TÁRGYSZÓ: Extrémérték-modellezés. Maximum likelihood becslés. Visszatérési szintek. Illeszkedésvizsgálat. Az Eötvös Loránd Tudományegyetem Természettudományi Karának Valószínűségelméleti és Statisztika Tanszéke aktív résztvevője a Az árvízi kockázatok meghatározásához szükséges műszaki és tudományos alapok megteremtése, új árvízi gyakorisági- és kockázatbecslési módszerek kidolgozása c. FKFP (Felsőoktatási Kutatási és Fejlesztési Pályázat) projektnek, melynek koordinátora a Vízgazdálkodási Tudományos Kutató Részvénytársaság (VITUKI Rt). Ennek keretében nagyrészt tiszai, kisebb részben a Tisza mellékfolyóira vonatkozó adatsorokat dolgoztunk fel. A projektnek külön aktualitást adtak az elmúlt öt évben előfordult árvizek. Így az elemzéseink során arra is megpróbáltunk választ adni, hogy vajon megfigyelhető-e az árvizek magasságának emelkedése az utóbbi évtizedekben. Az elemzések módszere az elméleti tételekkel is alátámasztott extrémérték-modellezés, melynek fő eszköze az extrémérték- (Extreme Value EV) eloszlások, illetve az általánosított Pareto- (Generalized Pareto GP) eloszlások illesztése. A következőkben először az elméleti eredményeket foglaljuk össze a modellektől a becslési módszereken át az illeszkedés vizsgálatáig. Ezután pedig a kapott eredményeket mutatjuk be. Statisztikai Szemle, 83. évfolyam, 2005. 10 11. szám

920 BOZSÓ DÁVID RAKONCZAI PÁL ZEMPLÉNI ANDRÁS 1. MODELLEK Először a vizsgálat elméleti kereteként szolgáló modelleket, nevezetesen a blokkmaximumok, illetve a szint feletti maximumok módszerét mutatjuk be. 1.1. Blokkmaximumok Ennek a megközelítésnek nagy előnye az egyszerűség, valamint az, hogy rendelkezésre állnak független azonos eloszlású megfigyelések maximumainak határeloszlására vonatkozó elméleti eredmények. Ezzel indokolható az ún. általánosított extrémérték- (Generalized Extreme Value GEV) eloszlások alkalmazása az eredeti megfigyeléseinkből képzett blokkok maximumaira. (A tétel első megjelenése Fisher Tippett [1928].) Tétel (Fisher Tippett): Legyenek X 1, X 2, K, X n független, azonos eloszlású valószínűségi változók. Ha vannak an, b n normáló konstansok, amelyek esetén igaz az, hogy [max( X 1, X 2, K, X n ) an]/b n nem-elfajuló határeloszláshoz közelít, akkor ez a határeloszlás szükségképpen max-stabilis vagy ún. extrémérték-eloszlás. A három extrémérték-eloszlás eloszlásfüggvénye: 1. Frechet-eloszlás: α α ( x) = ( x ) F exp, (x > 0), és α pozitív paraméter. 2. Weibull-eloszlás: α α ( ) ( x) = ( x) F exp, ahol x < 0, és α ugyancsak pozitív paraméter. 3. Gumbel-eloszlás: F α ( x) = ( exp( x) ) exp. Megjegyzendő, hogy nem minden esetben lehet normálni: diszkrét eloszlásokra is oszcillálhat a maximum eloszlása. Folytonos eloszlásokra az eloszlásfüggvény reguláris viselkedése szükséges a felső végpont közelében (teljesül minden fontos eloszlásra). A részletes feltételek megtalálhatók például Embrechts Klüppelberg Mikosch [1997] monográfiájában, ahol szinte az egész anyagunkkal kapcsolatosan bőségesen találhatók további információk is. A három extrémérték-eloszlást közös paraméteres formába is írhatjuk: 1 ξ x µ F α( x) = exp 1 + ξ, /1/ σ

ÁRVIZEK A TISZÁN 921 ha µ 1 + ξ x > 0. σ (Feltéve, hogy ξ 0. Az előző paraméterezésnél szereplő α -t most 1/ξ alakba írtuk át.) ξ=0 esetén határértékként éppen a Gumbel-eloszlást kapjuk. Az /1/-ben már az általános esetet írtuk fel, ahol µ az eltolás-, σ skála-, és ξ az alakparaméter. A modellezésnél tehát három paraméter illesztésére van szükség. Ezt az eloszláscsaládot nevezzük általánosított extrémérték-eloszlásnak (Jenkinson [1955]). A becslésekhez feltétlenül javasoljuk konfidenciaintervallumok hozzárendelését is, hiszen ezek alapján tudjuk legalább közelítőleg számszerűsíteni a becslésünkben rejlő bizonytalanságot. A konfidenciaintervallumok konstrukciójára a 2. pontban térünk vissza. A gyakorlatban az évi maximum értékekre illeszthetjük a GEV-eloszlást, feltételezve, hogy alkalmazható rájuk a tétel, azaz tekinthetők független azonos eloszlású megfigyelések maximumainak. Bár ezen tanulmány kereteit meghaladja, megjegyezzük, hogy a tétel állítása a függetlenségnél gyengébb feltételek teljesülése esetén is bizonyítható (például Leadbetter Lindgren Rootzen [1983]). Ugyanakkor az évi maximumok használatával elveszíthetünk fontos információkat, hiszen ha egy évben például két vagy több jelentős árvíz is volt, akkor azok közül csak a legnagyobb szerepel ebben az elemzésben. Ezért lehet érdekes az alábbi alternatív megközelítés. 1.2. Szint fölötti maximumok A módszer lényege az, hogy egy magas u küszöb feletti megfigyeléseket tekintve, a kapott meghaladási értékek a 1.1. pontban leírt feltételek teljesülése esetén általánosított Pareto- (GP) eloszlással modellezhetők. Ennek eloszlásfüggvénye: ha y > 0, továbbá 1 ξ ξ y P ( X u < y X > u) 1 1+ σ ~ /2/ 1 + ξ y σ ~ > 0 és ξ 0. ξ = 0 esetén határértékként éppen az exponenciális eloszlást kapjuk. A Pareto-eloszlás paraméterei az alábbi összefüggés alapján határozhatók meg az előző pontban ismertetett GEV-eloszlás paramétereiből: σ ~ = σ + ξ( µ u) Ha ξ < 0, akkor az eloszlás jobb oldali végpontja véges, egyébként pedig végtelen. Ez a módszer, és a legnagyobb elem mellett további mintaelemek alkalmazásának ötlete is először Pickands [1975] cikkében jelent meg.

922 BOZSÓ DÁVID RAKONCZAI PÁL ZEMPLÉNI ANDRÁS Mivel az eredeti (például naponkénti) megfigyelések természetesen erősen összefüggők, ezért a modellezésnél az u szintet meghaladó blokkokból csak a legnagyobb elemet vesszük figyelembe. Ez is mutatja, hogy a GP-eloszlások alkalmazásakor több probléma merül fel, mint a 1.1. esetben. Különösen azért, mert az elméleti eredmény duplán aszimptotikus, azaz nemcsak a minta elemszámának, hanem a küszöbnek is végtelenhez kell tartania. A célszerű kompromisszumot jelentő szint (ahol már elég jó közelítéssel érvényes az aszimptotikus eredmény, de a szórás még nem túl nagy, tehát kellő számú adaton alapul a becslés) megtalálása nem mindig lehetséges egyértelműen. Ezt a küszöbértéket, aminél nagyobb értékekre már megfelelően illeszkedik az eloszlás, hagyományos illeszkedésvizsgálati eljárásokkal tesztelhetjük (5. pont). A gyakorlatban a becsült értékek értelemszerűen függnek a küszöb választásától. Erre a kérdésre az alkalmazási részben még visszatérünk. Már itt megjegyezzük azonban, hogy adott küszöbérték esetén a becslés maximum likelihood módszerrel (2. pont) könnyen elvégezhető. A pontbecslés mellett GEVeloszlás illesztéséhez hasonlóan itt is célszerű konfidenciaintervallumok hozzárendelése az egyes becslésekhez További probléma, hogy milyen távoli csúcsokat tekintsünk független megfigyeléseknek. Ezzel a kérdéssel az elemzéseket bemutató részben foglalkozunk. Egy lehetséges, automatikus deklaszterezési eljárást ad Ferro és Segers [2003] cikke. Némi könnyebbséget jelent ugyanakkor az, hogy nem kell bármely két egymást követő megfigyelésnek függetlennek lennie (ez várhatóan nem is teljesül a gyakorlatban), az elméleti eredmény teljesüléséhez elég az is, hogy ha időben elég távol vannak egymástól, hiszen akkor az összefüggés közöttük kicsi. 2. MAXIMUM LIKELIHOOD BECSLÉS A szakirodalomban leginkább elterjedt módszer a maximum likelihood, melynek lényege, hogy azt a paraméterértéket tekintjük becslésnek, melyre a megfigyelésvektor együttes sűrűségfüggvénye maximális. Az elmélete részletesen kidolgozott, és reguláris esetekben aszimptotikusan hatásos és aszimptotikusan normális eloszlású a becslés. A becslés tulajdonságai nemreguláris esetekben természetesen mások; ezekről Smith [1985] cikkében olvashatunk részletesen. Ebből kiderül, hogy vannak ugyan a vizsgált eloszláscsaládban irreguláris elemek (ha ξ< 1), de ezek igen ritkán fordulnak elő a gyakorlatban. Az 1. pontban vizsgált esetekben nem adható ugyan meg zárt alakban a maximum likelihood becslés, de numerikus maximalizálás révén könnyen megkaphatjuk a sűrűségfüggvény maximumhelyét. Nagy előnye ennek a becslési eljárásnak, hogy az aszimptotikus tulajdonságai ismertek, és így segítségével a pontbecslés mellett konfidenciaintervallumok is konstruálhatók, erről részletesebben a 3. pontban lesz szó. 3. KONFIDENCIAINTERVALLUMOK KONSTRUKCIÓJA A legáltalánosabban használt módszer a maximum likelihood becslés aszimptotikus viselkedése alapján határozza meg a konfidenciaintervallumokat. Ezúttal azonban mégsem ezt alkalmaztuk, mert úgy tapasztaltuk, hogy a normális határeloszláson alapuló szimmetrikus konfidenciaintervallumok nem a legalkalmasabbak az extrémérték-

ÁRVIZEK A TISZÁN 923 1 K X n ( ) elemzésre. Ezt a hátrányt kiküszöböli a következő, ún. profil-likelihood eljárás, mely ugyancsak aszimptotikus, és a likelihood függvény regularitása esetén érvényes. Legyenek X, X 2,, független valószínűségi változók, l θ pedig a loglikelihood függvény. θ a paramétervektor, melyet = ( θ θ ) θ,, alakba írhatunk, azaz különvesszük a vizsgálandó paramétert (θ i ). A módszer elméleti hátterét kissé általánosabban fogalmazzuk meg, megengedve, hogy ne csak egydimenziós paraméterre keressünk konfidenciatartományt: legyen tehát θ=(θ (1), θ (2) ) és itt a θ (1) k dimenziós paramétervektor a vizsgálatunk tárgya. Tétel: Ha X 1, X 2, K, X n független megfigyelések, a maximum likelihood becslésre vonatkozó regularitási feltételek mellett, nagy n-re { ( θˆ ) l ( ( ))} 1 2 l p ~ χ k, 2 θ i i azaz az ún. devianciastatisztika közelítőleg k szabadságfokú eloszlású, ahol likelihood becslés, ( () 1 θ ) pedig az ún. profil-likelihood értéke: l p θˆ a (1) (1) (2) ( 2) θ θ l p ( θ ) = max l( θ, ). Következmény: Az egydimenziós esetben θi -re a C α = { θi : 2{ l(ˆ) θ l p( θi )} cα} 2 ( 1 α)megbízhatósági szintű konfidenciaintervallum, ahol c α a χ 1 eloszlás ( 1 α) - kvantilise. Ez az eljárás egymásba ágyazott modellek esetén alkalmas a modellválasztásra is, az alábbiak szerint. Legyen M 1 modell θ paramétervektorral, M 0 modell pedig ennek része: M 0 esetén a θ paramétervektor első k komponense 0. Legyenek l 1 ( M 1 ), illetve l 0 (M 0 ) a maximalizált log-likelihood értékek és D = 2{l 1 ( M 1 ) l 0 (M 0 )} /3/ az eltérésstatisztika (devianciastatisztika). Az M 0 modellt a szignifikanciaszinten 2 elutasítjuk az M 1 modellel szemben, ha > c α, ahol c a χ eloszlás (1 α) kvantilise. D α k 4. VISSZATÉRÉSI SZINTEK A visszatérési szintek a gyakorlati szempontból talán legfontosabb számított mennyiségek. Ha megkaptuk az évi maximum-adatsorra illesztett paraméteres modellt, akkor ennek a magas kvantilisei (azaz azok az értékek, amelyeket adott, kicsi p valószínűséggel halad meg az adott eloszlás) úgy is tekinthetők, mint olyan értékek, amelyeket meghaladó árvíznek az első bekövetkezése 1/p év múlva várható. Az éves maximumoknál például a

924 BOZSÓ DÁVID RAKONCZAI PÁL ZEMPLÉNI ANDRÁS 99/100-os kvantilis (a 99. percentilis) az az érték, amelynél nagyobbat várható értékben száz év múlva kapunk. Megjegyzendő, hogy ebben az esetben is, a geometriai (Pascal-) eloszlás tulajdonságaiból adódóan, ½-nél nagyobb annak a valószínűsége, hogy az adott szintet meghaladó első árvíz a konkrét időpont (például száz év) előtt bekövetkezzék. A vizsgált két modell esetében ezek a visszatérési szintek a következőképp számíthatók. 4.1. GEV-eloszlások Az 1. pontban bemutatott GEV- (általánosított extrémérték) eloszlások ( 1 p) kvantilisei: ha ξ 0, és ha ξ=0, ahol σ ξ z p = µ (1 y p ), ξ µ σlog y p, y p = log( 1 p). 4.2. GP-eloszlások A szint fölötti meghaladásokra alkalmazható GP (általánosított Pareto) -eloszlás ( 1 p) kvantilise az alábbiak szerint kapható meg: σ 1 = u + ξ p ξ 1 x p, ha ξ 0, 1 x p = u + σlog, p ha ξ = 0. Itt is, mint korábban, u az a küszöb, ami feletti adatokra a GP-eloszlást illesztettük. Ha az n elemből álló, m év alapján kapott adatsorra általánosított Paretoeloszlást illesztettünk, akkor ennek az eloszlásnak az 1 1 k kvantilise (tehát az az érték, amelyet egy véletlenszerűen kiválasztott mintaelem is tekinthető, mint az az érték, amelyet először várhatóan az árvíz. (Coles, [2001]) 1 k valószínűséggel halad meg) úgy km év múlva fog meghaladni n

ÁRVIZEK A TISZÁN 925 5. ILLESZKEDÉSVIZSGÁLAT Számos klasszikus statisztikai teszt foglalkozik az illeszkedésvizsgálattal. Az egyik legrészletesebb mű a témában D Agostino és Stephens [1986] munkája. Az ebben a könyvben bemutatott teszteket természetesen itt nem részletezzük, csak megemlítjük legfontosabb tulajdonságaikat. A Kolmogorov Szmirnov-próba, mely az elméleti és a tapasztalati eloszlásfüggvény közötti maximális eltérést vizsgálja, pontosan specifikált nullhipotézis vizsgálatára alkalmas. A mi esetünk becsléses, hiszen csak az eloszlás típusát képzeljük adottnak. Ekkor szimulációval lehet meghatározni a közelítő kritikus értékeket, de a próba közismerten nem túl erős, így mi ezúttal nem alkalmaztuk. A χ 2 -próba talán a leggyakoribb, illeszkedésvizsgálatra használt eljárás. Előnye, hogy a becsléses esetre is alkalmazható, és noha aszimptotikus, az adatok mennyisége az árvízi elemzéseknél nem lehet akadálya alkalmazásának. Ugyanakkor ez, hasonlóan a Kolmogorov Szmirnov-próbához, nem érzékeny az extrémumoknál megfigyelhető esetleges eltérésekre. Ráadásul a χ 2 -próbánál az osztályok meghatározása nem egyértelmű, így az eredmények sem azok. A klasszikus statisztikai tesztek közül a mi céljainknak leginkább az Anderson Darling-teszt felel meg, amely az A 2 = ( Fn ( x) F( x)) df( x) F( x)(1 F( x)) statisztikára épül, ahol F az illesztett eloszlás, F n pedig a tapasztalati eloszlásfüggvény. Ennek alkalmazása esetünkben azért előnyös, mert az extrémumok esetében megjelenő eltérések nagy súllyal szerepelnek a képletben. Kiszámítása a következő módon történhet: ( i ) A 2 = n n ( 2i 1)(log zi + log(1 zn+ 1 i )) / n, i= 1 ahol z i = F X (Xi a rendezett minta i-edik eleme). A próba aszimptotikus kritikus értékeit ismert F esetére a határeloszlásból könnyen meg lehet határozni, Choulakian Stephens [2001] cikkükben a Pareto-eloszlás becsléses esetére is megadták. Ugyanakkor szimulációval a kisebb mintaelemszámokra is megkaphatjuk a kritikus értékeket, melyek függnek az alakparaméter becsült értékétől. Hasonló, egyoldalon érzékeny próbát ismertet Zempléni [2004]. Mindenképpen célszerű grafikusan is vizsgálni, hogy a kapott becslés valóban megfelelő-e. Erre a leggyakrabban használt módszer az adatok hisztogramjának és a kapott modell sűrűségfüggvényének összevetése. Ennek korlátja azonban az, hogy a hisztogram függ az osztályok számától és a végpontjaiktól, valamint nehezen ábrázolható kiugró értékek fellépése esetén. Ezért, ezen hagyományos ábrák mellett, érdemes a Q-Q k ábra elkészítése is, melyen az n elemű adathalmaz pontjait a tapasztalati eloszlás n +1 2