Közbeszerzési eljárások dokumentumainak adatfeldolgozása 1998-2004



Hasonló dokumentumok
Adatközlés a magyar állampolgárok számára I. A magyar közbeszerzések alapadatai a MaKAB alapján

Magyarország-Budapest: Vérzés elleni szerek 2014/S Tájékoztató az eljárás eredményéről. Árubeszerzés

EH - A TÁMOP B-12/ kódszámú kiemelt projekt keretében irodaszerek beszerzése (eredménytelen)

1. melléklet az 5/2009. (III.31.) IRM rendelethez KÖZBESZERZÉSI ÉRTESÍTŐ A Közbeszerzések Tanácsának Hivatalos Lapja1024 Budapest, Margit krt. 85.

Tájékoztató az eljárás eredményéről - Gyógyszerek és infúziós oldatok szállítása

Szerződésmódosítás 1. - A TÁMOP B-12/ kódszámú kiemelt projekt keretében megvalósuló képzésekhez kertészeti eszközök beszerzése

Irányítószám Település 1011 Budapest 1012 Budapest 1013 Budapest 1014 Budapest 1015 Budapest 1016 Budapest 1021 Budapest 1022 Budapest 1023 Budapest

Budapest Főváros XI. kerület Újbuda Önkormányzata

2 Mbit/-s-os bérelt összeköttetések megrendelése

TÁJÉKOZTATÓ A SZERZŐDÉS TELJESÍTÉSÉRŐL

Szerződésmódosítás 1. - A TÁMOP B-12/ kódszámú kiemelt projekt keretében megvalósuló képzésekhez építőipari alapanyagok beszerzése

Hirdetmény Közbeszerzési Értesítő száma: 2010 / 145 Tomori Pál Városi és Főiskolai Könyvtár

Közbeszerzési Értesítő száma: 2015/108 Építési beruházás Kivitelezés, bármilyen eszközzel, Beszerzés tárgya:

Különböző orvosi-gép műszerek javítása és karbantartása 18 hónap időtartamra vállalkozási szerződés keretében.

Tájékoztató az eljárás eredményéről - Villámhárító rendszerek javítása és túlfeszültség védelmi berendezések beépítése

Képviseleti jogosultság megléte [x] Egyéb közlemény: 2. melléklet a 2/2006. (I.13.) IM rendelethez

8. melléklet a 2/2006. (I.13.) IM rendelethez KÖZBESZERZÉSI ÉRTESÍTŐ A Közbeszerzések Tanácsának Hivatalos Lapja1024 Budapest, Margit krt. 85.

14. melléklet a 44/2015. (XI. 2.) MvM rendelethez

2. melléklet a 2/2006. (I.13.) IM rendelethez KÖZBESZERZÉSI ÉRTESÍTŐ A Közbeszerzések Tanácsának Hivatalos Lapja1024 Budapest, Margit krt. 85.

8/OVSZ/2009. számú szoftverbeszerzés tájékoztató (nemzeti)

2. melléklet a 2/2006. (I.13.) IM rendelethez KÖZBESZERZÉSI ÉRTESÍTŐ A Közbeszerzések Tanácsának Hivatalos Lapja1024 Budapest, Margit krt. 85.

14. melléklet a 44/2015. (XI. 2.) MvM rendelethez

Körmend Város Önkormányzata Nyertes ajánlattevő:

2. melléklet a 2/2006. (I. 13.) IM rendelethez

2. melléklet a 2/2006. (I.13.) IM rendelethez KÖZBESZERZÉSI ÉRTESÍTŐ A Közbeszerzések Tanácsának Hivatalos Lapja1024 Budapest, Margit krt. 85.

1. melléklet az 5/2009. (III.31.) IRM rendelethez KÖZBESZERZÉSI ÉRTESÍTŐ A Közbeszerzések Tanácsának Hivatalos Lapja1024 Budapest, Margit krt. 85.

Ajánlatkérő fő tevékenységi köre: folyószámla-hitelkeret szerződés 300 millió forintra Tartalom letöltése PDF-ben

2. melléklet a 2/2006. (I.13.) IM rendelethez KÖZBESZERZÉSI ÉRTESÍTŐ A Közbeszerzések Tanácsának Hivatalos Lapja1024 Budapest, Margit krt. 85.

I.1) NÉV, CÍM ÉS KAPCSOLATTARTÁSI PONT(OK) Hivatalos név: Nyírvv Nyíregyházi Városüzemeltető és Vagyonkezelő Nonprofit Kft.

9. melléklet a 92./2011. (XII.30.) NFM rendelethez

A Gottsegen György Országos Kardiológiai Intézet külső. Biomedica Hundária Kft

On-line értesítés: A Közbeszerzések Tanácsa (Szerkesztőbizottsága) tölti ki

2. melléklet a 2/2006. (I.13.) IM rendelethez KÖZBESZERZÉSI ÉRTESÍTŐ A Közbeszerzések Tanácsának Hivatalos Lapja1024 Budapest, Margit krt. 85.

Labor eszköz és műszer csomag beszerzése A Szent István Egyetem Akvakultúra és Környezetbiztonsági Intézet részére műszaki specifikáció szerint

Közbeszerzési Értesítő száma: 2009 / 140 Csanádpalota Város Önkormányzata

Mátrai Gyógyintézet Mátraházai egységének élelmezési üzem (konyha)rekonstrukciója

tájékoztató az eljárás eredményéről (2-es minta) KÉ

2. melléklet a 14/2010. (X. 29.) NFM rendelethez KÖZBESZERZÉSI ÉRTESÍTŐ A Közbeszerzések Tanácsának Hivatalos Lapja1024 Budapest, Margit krt. 85.

Hirdetmény Közbeszerzési Értesítő száma: 2010 / 80 Ajánlatkérő: Önkormányzat Nyertes ajánlattevő: Budapest Főváros XIX. kerület

Hirdetmény Közbeszerzési Értesítő száma: Ajánlatkérő: Nyertes ajánlattevő: 2011 / 91

Magyarország-Budapest: Biztosítási szolgáltatások 2014/S Tájékoztató az eljárás eredményéről. Szolgáltatásmegrendelés

Versenyerősség és korrupciós kockázatok A magyar közbeszerzések statisztikai elemzése Adatok és leíró statisztikák

8. melléklet a 2/2006. (I.13.) IM rendelethez KÖZBESZERZÉSI ÉRTESÍTŐ A Közbeszerzések Tanácsának Hivatalos Lapja1024 Budapest, Margit krt. 85.

A Közbeszerzések Tanácsa (Szerkesztőbizottsága) tölti ki. A hirdetmény kézhezvételének dátuma KÉ nyilvántartási szám. Postai irányítószám: 1089

Az OEP és Területi Hivatalai részére papír közbeszerzése

1. számú melléklet az 5/2009. (III.31.) IRM rendelethez TÁJÉKOZTATÓ AZ ELJÁRÁS EREDMÉNYÉRŐL I. SZAKASZ: AJÁNLATKÉRŐ

IrányítószámTelepülés 1011 Budapest 1012 Budapest 1013 Budapest 1014 Budapest 1015 Budapest 1016 Budapest 1021 Budapest 1022 Budapest 1023 Budapest

1. oldal, összesen: 7 oldal

1. melléklet az 5/2009. (III.31.) IRM rendelethez KÖZBESZERZÉSI ÉRTESÍTŐ A Közbeszerzések Tanácsának Hivatalos Lapja1024 Budapest, Margit krt. 85.

1. melléklet az 5/2009. (III.31.) IRM rendelethez KÖZBESZERZÉSI ÉRTESÍTŐ A Közbeszerzések Tanácsának Hivatalos Lapja1024 Budapest, Margit krt. 85.

1. melléklet az 5/2009. (III.31.) IRM rendelethez KÖZBESZERZÉSI ÉRTESÍTŐ A Közbeszerzések Tanácsának Hivatalos Lapja1024 Budapest, Margit krt. 85.

Hirdetmény Közbeszerzési Értesítő száma: 2010 / 77 Nyírbátor Város Önkormányzata

Tata Város Önkormányzata tájékoztatója az eljárás eredményéről (26890/2006)

Biztonságtechnikai rendszerfelügyelet és recepciós feladatok ellátása

Ajánlatkérő költségvetési elszámolási számlája

22/OVSZ/ Járműkarbantartás

Társasági kompetencia-térkép és szótár kialakítása

Nyertes ajánlattevő: Teljesítés helye: Győri Fellebbviteli Főügyészség 9021 Győr, Domb u. 10.

I. SZAKASZ: AJÁNLATKÉRŐ

IBM vagy azzal egyenértékű fejlesztői platform szerinti adatbázis-kezelő szoftverlicencek IBM szoftver licencek követése és bővítése.

K/5 79/ melléklet a 2/2006. (I. 13.) IM rendelethez

I.1) NÉV, CÍM ÉS KAPCSOLATTARTÁSI PONT(OK) Hivatalos név: Salgótarján Megyei Jogú Város Önkormányzata

Fő tárgy: További tárgyak: III. SZAKASZ: ELJÁRÁS III.1) Adminisztratív információk

1. 5/2009. (III.31.) IRM

1. melléklet az 5/2009. (III.31.) IRM rendelethez KÖZBESZERZÉSI ÉRTESÍTŐ A Közbeszerzések Tanácsának Hivatalos Lapja1024 Budapest, Margit krt. 85.

1. melléklet az 5/2009. (III.31.) IRM rendelethez KÖZBESZERZÉSI ÉRTESÍTŐ A Közbeszerzések Tanácsának Hivatalos Lapja1024 Budapest, Margit krt. 85.

4db új, első alkalommal forgalomba helyezett 8+1 fő szállítására alkalmas, azonos márkájú és típusú gépkocsi beszerzése a kapcsolódó szolgáltatásokkal


útszakaszok, továbbá az ajánlatkérő, illetve a nyertes ajánlattevő székhelye. Ajánlattételi/részvételi jelentkezési határidő: Nyertes ajánlattevő:

1. melléklet az 5/2009. (III.31.) IRM rendelethez KÖZBESZERZÉSI ÉRTESÍTŐ A Közbeszerzések Tanácsának Hivatalos Lapja1024 Budapest, Margit krt. 85.

42/ Fax: 42/

EM-325, 1.főszínpad, beépített forgóval, 2.mozgatható zenekari árok, 3.hátsószínpad rámpával Tartalom letöltése PDF-ben

Nemzeti, Kbt Nyílt eljárás - EKR

Sebészeti varrógépek és tartozékaik beszerzése

1. melléklet az 5/2009. (III.31.) IRM rendelethez KÖZBESZERZÉSI ÉRTESÍTŐ A Közbeszerzések Tanácsának Hivatalos Lapja1024 Budapest, Margit krt. 85.

K1398 Aluljáró takarítógépek beszerzése

Hidrofor konténer beszerzés

2. melléklet a 2/2006. (I.13.) IM rendelethez KÖZBESZERZÉSI ÉRTESÍTŐ A Közbeszerzések Tanácsának Hivatalos Lapja1024 Budapest, Margit krt. 85.

Hirdetménnyel induló, tárgyalás nélküli

Általános keresés: OK

3D Nyomtató - eredmény

Főoldal Kapcsolat Honlaptérkép Súgó 2009 / Tájékoztató az eljárás eredményéről (1. melléklet) KÉ

TÁJÉKOZTATÓ A SZERZŐDÉS TELJESÍTÉSÉRŐL

1. melléklet az 5/2009. (III.31.) IRM rendelethez KÖZBESZERZÉSI ÉRTESÍTŐ A Közbeszerzések Tanácsának Hivatalos Lapja1024 Budapest, Margit krt. 85.

1. melléklet az 5/2009. (III.31.) IRM rendelethez KÖZBESZERZÉSI ÉRTESÍTŐ A Közbeszerzések Tanácsának Hivatalos Lapja1024 Budapest, Margit krt. 85.

Nyomtató karbantartási és üzemeltetési szolgáltatások beszerzése

1. melléklet az 5/2009. (III.31.) IRM rendelethez KÖZBESZERZÉSI ÉRTESÍTŐ A Közbeszerzések Tanácsának Hivatalos Lapja1024 Budapest, Margit krt. 85.

8. melléklet a 2/2006. (I.13.) IM rendelethez KÖZBESZERZÉSI ÉRTESÍTŐ A Közbeszerzések Tanácsának Hivatalos Lapja1024 Budapest, Margit krt. 85.

TÁJÉKOZTATÓ AZ ELJÁRÁS EREDMÉNYÉRŐL I. SZAKASZ: AJÁNLATKÉRŐ

3D Torony-szimulátor beszerzése és telepítése.

Közbeszerzési Értesítő száma: 2013/80 Beszerzés tárgya: Szolgáltatás megrendelés Hirdetmény típusa:

Közbeszerzési Értesítő száma: 2015/133. Tájékoztató az eljárás eredményéről (1-es minta)/ké/ KÉ. Hirdetmény típusa:

2. melléklet az 5/2009. (III.31.) IRM rendelethez KÖZBESZERZÉSI ÉRTESÍTŐ A Közbeszerzések Tanácsának Hivatalos Lapja1024 Budapest, Margit krt. 85.

Polgármesteri hivatal felújítása - Tímár

1. melléklet az 5/2009. (III.31.) IRM rendelethez KÖZBESZERZÉSI ÉRTESÍTŐ A Közbeszerzések Tanácsának Hivatalos Lapja1024 Budapest, Margit krt. 85.

1. melléklet az 5/2009. (III.31.) IRM rendelethez

2. melléklet a 14/2010. (X. 29.) NFM rendelethez KÖZBESZERZÉSI ÉRTESÍTŐ A Közbeszerzések Tanácsának Hivatalos Lapja1024 Budapest, Margit krt. 85.

Tájékoztató az eljárás eredményéről: "Fúró és egyéb szerszámgép adásvétele MÁV Zrt. részére adásvételi szerződés keretében"

Zalaegerszeg Megyei Jogú Város Önkormányzata. Zalaegerszeg, Kosztolányi Dezső tér 1., hrsz.:2361

Főoldal Kapcsolat Honlaptérkép Súgó. Általános keresés: OK

Átírás:

Közbeszerzési eljárások dokumentumainak adatfeldolgozása 1998-2004 Módszertani elemzés Public Procurement 4 You 8. Riport Budapest, 2014. március

A riportot a Korrupciókutató-központ Budapest (CRCB) kutatócsoportja készítette. A kutatás folytatását a központ pénzügyi erőforrásai, és a résztvevők önkéntes munkája tette lehetővé. A kutatás folytatásához minden anyagi segítséget szívesen fogadunk, illetve várjuk önkéntesek jelentkezését (info@crcb.eu). Közbeszerzési eljárások dokumentumainak adatfeldolgozása 1998-2004 / Data extraction from public procurement documents 1998-2004 Nyolcadik riport / 8th Report Együttműködő partnerek: Erőforrástérkép projekt (MTA KRTK KTI): http://regionaldata.org Átlátható Állam: http://www.atlathatoallam.hu/ 3gteam: http://www.3gteam.hu/ A riportot írta: Fóra Gyula Munkatársak: Czibik Ágnes Fazekas Mihály Fóra Gyula Orbán Júlia Tóth Bence Tóth István János közgazdász Ph.D. hallgató, University of Cambridge egyetemi hallgató közgazdász közgazdász Ph.D, tudományos főmunkatárs, MTA KRTK KTI Külső szakértők: Dr. Kelemen Zoltán Gyenese Jenő Nagy Zoltán Siposs Zoltán Uhrin Tamás Dr. Volford Anita Adrienn ügyvéd programtervező matematikus közgazdász újságíró programtervező matematikus ügyvédjelölt Corruption Research Center Budapest e-mail: info@crcb.eu internet: http://www.crcb.eu/ A kézirat lezárva: 2014. március 28.

Tartalomjegyzék Tartalomjegyzék... 3 Abstract... 4 Bevezetés... 5 Fejlesztési környezet... 5 Közbeszerzési adatok letöltése... 5 Előkészítő műveletek... 5 Információk kinyerése... 6 Kinyert változók... 7 Kategorikus változók leírása... 8 Alapinformációk a létrehozott adatbázisról... 9 3

Abstract Although the Hungarian Public Procurement Authority has made all the information publicly available online for the public procurement tenders between 1998 and 2004, the data format is inappropriate for statistical analysis. The information is stored in basic HTML files which does not provide any interface for sorting and searching among the data. In this technical paper we will describe our data extraction process which we used to turn the HTML based information into database format by extracting relevant fields of information. The Python programming language was used for data cleaning and extraction, which resulted in a database suitable for further analysis. At the end of the paper, basic statistics about the dataset is shown to provide some examples for the usability of this dataset. 4

Bevezetés A Közbeszerzési Hatóság által nyilvánosságra bocsátott 1998 és 2004 közötti közbeszerzési adatok eddig csak elemzési célra alkalmatlan formában voltak elérhetőek. A HTML formátumban tárolt pályázati adatok nem biztosítottak semmilyen kézenfekvő lehetőséget az adatok rendszerezésére, keresésére és akármilyen jellegű statisztikai vizsgálatára. A következőkben bemutatott adatfeldolgozó eljárás célja, hogy az elérhető HTML dokumentumokból a lehető legtöbb releváns információt kinyerjük és egy rendszerezett adatbázisba rögzítsük, ami utána lehetővé teszi a további elemző munkát. Fejlesztési környezet Az adatok letöltéséhez és az adatkinyeréshez is Python programnyelv 2.7-es verzióját használtam. Felhasznált nem standard könyvtárak urrlib: weboldalak letöltése nltk: Natural Language Processing Toolkit, alapvető nyelvfeldolgozási funkciók pl. szótövek levágása, valamint HTML szöveggé alakítás numpy: Gyors tömbműveletek pandas: DataFrame adatstruktúra (Fejlécezett tömb) sok hasznos feldolgozási funkcióval, pl. mentés Excel formátumba, adatelemző funkciók sklearn: Szöveg kategorizáláshoz adatbányászati eszközök, valamint függvények python objektumok lemezre mentéséhez(joblib) unidecode: Ékezetes szövegek ékezet mentessé alakítása Közbeszerzési adatok letöltése A régi közbeszerzési honlapon (http://regi.kozbeszerzes.hu/static/kearchiv/index.html) elérhető adatokat mappákba rendezve töltöttem le. A HTML fájlok letöltését a download_data(folder,year) függvény végzi, ami bejárja az évhez tartozó linkeket és letölti a megfelelő dokumentumokat mappákba rendezve. Az adatokat HTML formátumban mentettem el a sorszámok alapján. A 2004-es adatok letöltésére külön a download_data2004() függvény használható az eltérő weblap struktúra miatt. Előkészítő műveletek Mielőtt lehetséges lenne, a változók kinyerése, fel kell darabolni a szöveges fájlokat mezők szerint. Ezt egyértelműen megtehetjük az eredményhirdetések alapvető formai tulajdonságai alapján. Ezt a műveletet az extract_fields(folder, fout, year) függvény végzi, ami egy adott mappában található eredményhirdetéseket mezőkre bontva eltárolja. A függvény felülről lefelé halad a fájlokban és soronként keresi az előre megadott kulcsszavakat (vagy mondatrészeket) amik egyértelműen beazonosítják az eredményhirdetés különböző részeit. Ezek alapján feldarabolja a szöveges fájl a mezőknek megfelelő darabokra, amit ez után arra használhatunk, hogy kinyerjük a megfelelő információt. A mezőket egy Python szótárban tároljuk ahol a kulcsok a megfelelő mezők nevei és az elemek a hozzá tartotó szövegdarabok. Ezeket a Python objektumokat is külön elmentettem ezzel is szétbontva a feldolgozási műveleteket. 5

Pl: { ajanlsz : tizenegy, nyertesn : Renault Trucks Hungária Kft., 2046 Törökbálint, Tó Park. } Információk kinyerése A mezők kinyeréséhez ezután végigmegyünk az egyes eredményhirdetésekhez készített szótárakon és a megfelelő kulcs alatt található szövegekre alkalmazzuk a feldolgozó függvényeket. A szöveges mezők feldolgozására használt legfontosabb függvények: extract_writtennums(field) Egy mezőben található szöveggel kiírt számot, rendes számmá alakít, elsősorban az ajánlatok számának kinyeréséhez. A szöveget feldarabolja, majd a szavakat egyenként megvizsgálja, hogy számok-e (read_num()). to_datetime(field) Szöveges magyar dátumokat alakít a Python által kezelhető dátum formátummá. Megkeresi az első dátumot a megadott karakterláncban Regular Expression segítségével, majd ezt a megfelelő formátumra alakítja. extract_address(field) Egy mezőben található címeket keresi meg Regular Expression (előre meghatározott szövegmintázatok)-ök segítségével, majd a címeket (isz, város, utca házszám) bontásban visszaadja. Elsősorban a településre és irányítószámra pontos az utcanevek sok esetben hiányoznak. A nem budapesti irányítószám nélküli címeket nem tudja kezelni. extract_nevekcimek(field) A mezőt sorokra bontva megkeresi azokat a sorokat, amelyek egy cég nevét és címét tartalmazzák. A cégnevek beazonosításához először címeket keres mivel ezek sokkal könnyebben beazonosíthatók és mindig ott vannak a cégnév mellett vagy alatt. A nyerteseket és ajánlattevőket tartalmazó mezőben ilyen formában vannak tárolva az információk. extract_nums(field) A mezőből Regular Expression-ök segítségével megtalálja, majd összeadja a forint összegeket. Pl.: 500 ezer FT, 20 300 ft, 3 m ft stb. Külön megnézi a függvény, hogy valószínűleg db-áras termékről van e szó, ezt a leírásból próbáltam kikövetkeztetni. Darab-ár esetén -1-et ad vissza értéknek. extract_targy(field) A mezőben található szöveget egy kategorizáló eljárás segítségével az előre megadott kategóriák valamelyikébe sorolja. A feladat nagyon nehéz és automatikusan nem nagyon lehet 70% pontosság fölé kerülni, ezért mindenképpen kézzel kell átnézni, ha erre az információra szükség van. extract_eredmeny(field) Az eredményességet mutató szavakat keresi a mezőben, ezek alapján három kategória egyikébe sorolja: eredményes, eredménytelen, részben eredményes extract_eljaras(field) A különböző eljárástípusokat mutató szavakat keresi a mezőben. (Pl. Nyílt, Előminősítési, Zárt, stb.) extract_aktip(field) A különböző vállalati formákat nyeri ki a megadott vállalat nevéből.(pl. Önkormányzat, részvénytársaság stb.) Igény szerint bővíthető a lista. 6

Az imént felsorolt függvények segítségével miután kinyertük a szükséges információkat, az adatokat egy DataFrame objektumban helyezzük el. Ez gyakorlatilag egy fejlécezett táblázatnak feleltethető meg, aminek sorai az egyes rekordok. A statisztikai elemzés során érdemes lehet ezt az objektumot használni a remek kezelhetősége miatt. A létrehozott DataFrame objektumokat is külön a lemezre mentettem, ez gyakorlatilag megfelel az Excel táblázatoknak (azok ebből lettek generálva) de már egy Pythonban kezelhető formában, ami összetettebb elemzési célokra alkalmasabb lehet. Kinyert változók Mezőnév AKN (Ajánlatkérő neve) Felhasznált függvények 7 Megjegyzés A megfelelő mező első vagy első két sora. Előfordulhat, hogy több mint egy ajánlatkérő volt, de ez nagyon kevés esetet érint és nehezen kezelhető. Ebben az esetben az elsőt láthatjuk. Státusz AKTIP extract_aktip() Megfelelően működik 100% AKC (T,IRSZ,UT) (Ajánlatkérő cím részei) AJSZ (Ajánlatok száma) ELJ_TIPUS (Eljárás típusa) ELB_SZ (Elbírálás szempontjai) ATN (Ajánlattevők nevei) AT_TIP (Ajánlattevők típusa) ATC(T,IRSZ,UT) (Ajánlattevők címe) AT_SZ (Ajánlattevők száma) NYN (Nyertes neve) NY_TIP (Nyertes típusa) NYC (T,IRSZ,UT) extract_address() extract_writtennum s() Nem-konvencionális címzésnél probléma lehet (adatok nagyon kis részét érinti). 95% 90% Megfelelően működik 100% extract_eljaras() Megfelelően működik 100% extract_nevekcimek () Ez a mező a nyers szöveget tartalmazza 100% Nagyon ritkán eltérő formátum miatt problémák, csak manuális kezelhető + nem-konvencionális címzés 95% extract_aktip() Megfelelően működik 100% extract_nevekcimek () Nagyon ritkán eltérő formátum miatt problémák, csak manuális kezelhető + nem-konvencionális címzés 95% A nevekből triviális Megfelelően működik. 100% extract_nevekcimek () Nagyon ritkán eltérő formátum miatt problémák, csak manuális kezelhető + nem-konvencionális címzés 95% extract_aktip() Megfelelően működik. 95% extract_nevekcimek () Nagyon ritkán eltérő formátum miatt problémák, csak manuális kezelhető + nem-konvencionális címzés NY_SZ A nyertesek (Nyertesek száma) neveiből triviális Megfelelően működik. 100% URL 100% 95%

TARGY A kategorizálás pontosságán múlik. Csak extract_targy() (Beszerzés tárgya) manuálisan kezelhető. 60% T_raw A tárgy teljes szövege 100% Óra/napi/éves esetén -1, sok hiba. Nem OSSZEG extract_nums() egyértelmű sok helyen, manuálisan (Beszerzés értéke) kezelhető. 85% EREDMENYES (Eljárás extract_eredmeny() Megfelelően működik 100% eredményessége) EH_D (EV,HO,NAP) (Eredményhirdetés napja) to_datetime() 100% FELAD_D(EV,HO,NAP) (Ajánlat feladása) to_datetime() Megfelelően működik 100% KVETEL_D(EV,HO,NAP) (Ajánlat kézhezvétele) to_datetime() Megfelelően működik 100% KOZZT_D(EV,HO,NAP) (Közzététel) to_datetime() Megfelelően működik 100% ELB_D(EV,HO,NAP) (Elbírálás) to_datetime() Megfelelően működik 100% ALV (Alvállalkozó adatok) A mező a nyers szöveget tartalmazza YEAR (Az eljárás éve) 100% Kategorikus változók leírása AKTIP 'alapitvany': 1 'birosag': 2 'bt': 3 'egyeb': 4 'egyetem': 5 'kft': 6 'kht': 7 'konzorcium': 8 'korhaz': 9 'miniszterium': 10 'onkormanyzat': 11 'rt': 12 'vallalkozo': 13 NY_TIP, AT_TIP 'alapitvany': 1 'bt': 2 'egyeb': 3 'egyetem': 4 'kft': 5 'kht': 6 'konzorcium': 7 'korhaz': 8 'miniszterium': 9 'onkormanyzat': 10 'rt': 11 'vallalkozo': 12 ELJ_TIP 'gyorsított tárgyalásos': 1 'közzététel n tárgyalásos': 2 'k.n.t előmin : 3 'közzétét. tárgyalásos': 4 'nyílt': 5 'nyílt előmin.': 6 'tárgyalásos': 7 'tárgyalásos előmin: 8 TARGY 'it beszerzes': 1 'epites': 2 'etkeztetes': 3 'gepbeszerzes': 4 'orvosi beszerzes': 5 'szolgaltatas': 6 'targybeszerzes': 7 'tisztitas': 8 8

Alapinformációk a létrehozott adatbázisról A kinyert adatbázis összesen 22.051 rekordot és 28 változót (mezőt) tartalmaz. 1. tábla: Kitöltött rekordok száma változónként AJTSZAMA 21759 ELJ_TIP 21912 AKC_ISZ 21477 EREDMENYES 17433 AKC_T 21477 FELAD_D 21923 AKC_UT 21477 ID 22051 AKN 21798 KOZZT_D 17621 AKTIP 21798 KVETEL_D 21905 ALV 279 NYC 18641 ATC 20820 NYN 21922 ATN 21884 NY_SZ 18641 AT_SZ 20820 NY_TIP 18641 AT_TIP 20820 OSSZEG 18792 EH_D 17379 TARGY 21888 ELBSZ 4382 T_raw 21888 ELB_D 4399 URL 22051 A hiányzó adatok legtöbb esetben az eredményhirdetésről hiányoznak, nem azért mert nem sikerült a feldolgozás. 1. ábra: A beérkezett ajánlatok számának megoszlása: 9

2. tábla: Az ajánlatkérők, ajánlatok és nyertesek város szerint (top10) Ajánlatkérő Ajánlatok Nyertes BUDAPEST 51604 SZEGED 2260 DEBRECEN 2193 MISKOLC 2084 SZÉKESFEHÉRVÁR 1934 GYŐR 1868 NYÍREGYHÁZA 1704 ZALAEGERSZEG 1623 PÉCS 1561 KECSKEMÉT 1169 BUDAPEST 11615 MISKOLC 660 GYŐR 599 DEBRECEN 581 SZEGED 575 PÉCS 521 KECSKEMÉT 311 SZOMBATHELY 293 NYÍREGYHÁZA 276 SZÉKESFEHÉRVÁR 240 BUDAPEST 20746 DEBRECEN 789 MISKOLC 764 GYŐR 691 SZEGED 634 SZÉKESFEHÉRVÁR 621 NYÍREGYHÁZA 528 PÉCS 485 GÖDÖLLŐ 482 TÖRÖKBÁLINT 379 3. Tábla: Ajánlatok és nyertesek név szerint (top10) Ajánlatok STRABAG ÉPÍTŐ KFT. 569 JOHNSON & JOHNSON KFT. 401 SIEMENS RT. 374 BETONÚT RT. 356 MASZER RT. 348 B.BRAUN MEDICAL KFT. 347 HOFFMANN RT. 342 STRABAG RT. 315 BETONÚT SZOLGÁLTATÓ ÉS ÉPÍTŐ RT. 315 MÉLYÉPÍTŐ BUDAPEST KFT. 313 Nyertes JOHNSON & JOHNSON KFT. 381 B.BRAUN MEDICAL KFT. 314 HUMANTRADE KFT. 226 HUNGAROPHARMA RT. 225 ALLEGRO KFT. 164 STRABAG ÉPÍTŐ KFT. 164 SIEMENS RT. 162 INTERIMPORT KFT. 151 EUROMEDIC PHARMA RT. 125 DIAGNOSTICUM RT. 125 Top 10 ajánlatkérő Magyar Távközlési Rt. 282 Magyar Turizmus Rt. 200 Budapesti Elektromos Művek Rt. 195 Országos Egészségbiztosítási Pénztár 194 Semmelweis Egyetem 178 Honvédelmi Minisztérium 156 Nemzeti Szakképzési Intézet 151 Kincstári Vagyoni Igazgatóság (KVI) 140 Adó- és Pénzügyi Ellenőrzési Hivatal 126 Budapest Főváros Önkormányzata Főpolgármesteri Hivatal 126 Az esetek 47%-ban a nyertes és ajánlatkérő városa megegyezik. Az esetek 43%-ban az ajánlattevők és ajánlatkérők városa megegyezik. 10