Crawler.NET: Elosztott webrobotok koordinálása és vezérlése



Hasonló dokumentumok
Crawler.NET: Komponensalapú elosztott keretrendszer a web bejárására

eseményvezérelt megoldások Vizuális programozás 5. előadás

WebSphere Adapters. 6. változat 2. alváltozat. WebSphere Adapter for SAP Software felhasználói kézikönyv 6. változat 2. kiadás

Gáti Tamás. EASYBUS tűzvédelmi és légtechnikai vezérlő rendszer

IT biztonsági szintek és biztonsági kategorizálási minta

Java Servlet technológia

EMTP, EGY ÚJ LEVELEZÕ PROTOKOLL ÉS IMPLEMENTÁCIÓJA

2. fejezet Hálózati szoftver

Digitális bemenetek: 2 darab 0-5V jelszintű digitális bemenet Pl. nyitásérzékelők, risztóközpontok, mozgásérzékelők, átjelzők, stb.

Számítógépes Hálózatok Felhasználói réteg DNS, , http, P2P

Felhasználói réteg. Számítógépes Hálózatok Domain Name System (DNS) DNS. Domain Name System

Webes alkalmazások fejlesztése 8. előadás. Webszolgáltatások megvalósítása (ASP.NET WebAPI)


.NET Microsoft.Net Framework

1. ábra Mester oldal alapján különböző témákkal létrehozott webhely oldalai

Gyôztes minden ipari rendszerben

Üdvözli Önöket A PGY3 tantárgy! Bakay Árpád dr. NETvisor kft (30) arpad.bakay@netvisor.hu

Tűzfal megoldások. ComNETWORX nap, I. 30. ComNETWORX Rt.

OEP Betegéletút lekérdezés háziorvosok és vénytörténet lekérdezés patikák számára. API dokumentáció. verzió: 2.01

A földi ellenôrzô berendezésekben alkalmazott programozási technikák

Automatizálási alkalmazásokhoz. Modicon Quantum Optimális teljesítmény afolyamatirányításban

Osztott alkalmazások fejlesztési technológiái Áttekintés

!!" KÉSZÍTK: ERDÉLYI LAJOS KOLLÁR NÁNDOR WD6OGW BUK8Y7

Vektorugrás védelmi funkció blokk

PANNON EGYETEM Műszaki Informatikai Kar Villamosmérnöki és Információs Rendszerek Tanszék

Üzleti kritikus alkalmazások Novell Open Enterprise Serveren

Tartalom. Történeti áttekintés. Történeti áttekintés Architektúra DCOM vs CORBA. Szoftvertechnológia

Alap protokollok. NetBT: NetBIOS over TCP/IP: Name, Datagram és Session szolgáltatás.

Adatbázisok biztonsága

Tartományi környezet

Tartalomjegyzék 5 TARTALOMJEGYZÉK

20. Tétel 1.0 Internet felépítése, OSI modell, TCP/IP modell szintjenek bemutatása, protokollok Pozsonyi ; Szemenyei

Dr. Illés Zoltán

Bevezetés és gyakorlati tanácsok Az első lépés minden tudomány elsajátítása felé az, hogy megértjük az alapjait, és megbízható tudást szerzünk

Béta Software számlázó programok adóhatósági ellenőrzési adatszolgáltatása (AEA)

Bosch Video Client. Kezelési útmutató

4-1. ábra. A tipikus jelformáló áramkörök (4-17. ábra):

Tartalomjegyzék 3 TARTALOMJEGYZÉK

X. Szigetelésdiagnosztikai Konferencia

MATIX LENGYEL AUTOMATA FA+FABRIKETT+PELLET+SZÉN KAZÁNOK

Huawei Cisco Interworking Szolgáltatói környezetben

Beléptetésvezérlésről általában

rendszerszemlélető, adatközpontú funkcionális

EC Digitális csoportaggregát vezérlő

Stratégiai Fttx hálózat tervező. Smart Strategic Planner

3. előadás. A TCP/IP modell jelentősége

MultiCONT TÖBBCSATORNÁS FOLYAMATVEZÉRLŐ

A megfelelő IP védelem biztosításával, alkalmasak a kültéri alkalmazások kialakítására.

(11) Lajstromszám: E (13) T2 EURÓPAI SZABADALOM SZÖVEGÉNEK FORDÍTÁSA

Az EU Közbeszerzési politikája

A SZOFTVERTECHNOLÓGIA ALAPJAI

Tűzfalak működése és összehasonlításuk

SAP vállalatirányítási rendszer alapjai

DSI működésre. tervezve. Hogyan fog kinézni a jövő informatikai infrastruktúrája? Egész szoftverrendszerek egy

ESSOLUBE XTS 5 10W-40 KERESKEDELMI KFT. Utolsó felülvizsgálat: október 15. Magyar nyelvű kiadás utolsó felülvizsgálata: január 30.

Webszolgáltatások kommunikációs overhead-jének becslése

Tesztelés és hibajavítás Microsoft Visual Studio 2005 fejlesztőkörnyezetben

Használati útmutató. 1.1 verzió április

Adatbázis-elérés: dbexpress, helyi adatok és egyéb lehetõségek A dbexpress könyvtár A Borland Database Engine...

SLA Suite. Új generációs informatikai és kommunikációs megoldások

Java Business Integration szolgáltatásalapú architektúra JavaEE környezetben. Simon Géza Zsemlye Tamás

Realtek HD Audio Manager Felhasználói útmutató a Vista operációs rendszerhez

Original-Gebrauchsanleitung V1/0116

Wilarm 2 és 3 távjelző GSM modulok felhasználói leírása

Adatbázis használat I. 5. gyakorlat

Ezeket a kiemelkedı sebességő számítógépeket nevezzük szuperszámítógépeknek.

DUÁLIS FELSŐFOKÚ KÉPZÉS KÉPZÉSSZERVEZÉSI JELLEMZŐI. dr. Rádli Katalin EMMI Felsőoktatás-politikai Főosztály

Biztonság java web alkalmazásokban

átvitt bitek számával jellemezhetjük. Ezt bit/s-ban mérjük (bps) vagy ennek többszöröseiben (kbps, Mbps).

Mit csinálnak a PCB gyártók mielőtt gyártani kezdik az ÖN NYÁKját? Miért nem tudjuk használni az Ön gerber- és fúrófájljait ahogyan feltöltötte?

A Videotorium aggregációs szolgáltatásának kialakítása szabványos eszközökkel (OAI-PMH)

Informatika szintmérő-érettségi tételek február

DWL-G520 AirPlus Xtreme G 2,4GHz Vezeték nélküli PCI Adapter

Novell Nterprise Branch Office: a távoli iroda felügyeletének leegyszerűsítése

BorderManager Enterprise Edition

hp pro webkamera felhasználói útmutató

Lineáris. Soros. Okozati FIFO. Belépő

Hálózati Technológiák és Alkalmazások. Vida Rolland, BME TMIT október 29. HSNLab SINCE 1992

PannErgy Nyrt. Előzetes tájékoztató a évi gazdálkodásról március 11.

Egyetemi Számítóközpont

Kaspersky Internet Security Felhasználói útmutató

Operációs rendszerek. A Windows NT felépítése

Definiciók. Definiciók. Európa e-gazdaságának fejlődése. Szélessávú hozzáférés-ezer. Web felhasználók- Európa-fejlett része

SZENT ISTVÁN EGYETEM

Digitális terminológus

PROGRAMOZHATÓ LOGIKAI VEZÉRLİK

Tartalomjegyzék. Áttekintés A mobil kliens első ránézésre. Fő nézetek A kezelőfelület elemei Első lépések

Konfigurációkezelés (2B)

Az alábbi áttekintés Délkelet-Európa (a volt Jugoszlávia országai

A JAVA FUTTATÁSAKOR ELŐFORDULÓ HIBA-

Digitális tananyag, e-learning, különbségek, definíciók

A szóbeli vizsgán nem kap pontot lásd az első oszlopot! A szóbeli vizsgán nem kap pontot. A szóbeli vizsgán nem kap pontot lásd az első oszlopot!

Az adott eszköz IP címét viszont az adott hálózat üzemeltetői határozzákmeg.

Szoftver-technológia II. Tervezési minták. Irodalom. Szoftver-technológia II.

LOGalyze Telepítési és Frissítési Dokumentáció Verzió 3.0

Piackutatás? Szükséges és megtérülő befektetés a KKV-k számára is. TNS-Hoffmann

Informatika 10. évf.

Ásotthalom Község Polgármesterétől 5/2010.

Alapfogalmak. Mikron (1 mikrométer): a mikrométer a méter egy milliomod része, a leggyakrabban használt mértékegysége a szűréstechnikának.

A MAGYAR POLITIKAI FOGLYOK SZÖVETSÉGE os HAGYOMÁNYŐRZŐI

Átírás:

: Elosztott webrobotok koordinálása és vezérlése Hunyadi Levente 2007. június 19.

Motiváció Célok

Motiváció Motiváció Célok a web: szórt formában jelenlévő információ gyorsan változó tartalom friss indexadatbázishoz a web gyakori bejárása szükséges

Motiváció Motiváció Célok Központosított + átlátható modell + könnyű vezérlés szűk keresztmetszetek gyenge hibatűrés Elosztott + csökkenő távolság a bejárandó tartalomtól + kisebb hálózati terhelés + skálázható összetettebb együttműködést igényel

Tervezési célok Motiváció Célok kihasználni az elosztott rendszerből fakadó előnyöket elrejteni a komplexitást

Felépítés Laza csatolás

A rendszer felépítése Felépítés Laza csatolás Kétrétegű: Keretrendszer Általános feladatok kommunikáció illesztés konfigurálás életciklus-kezelés felügyelet Ráépülő alkalmazás Konkrét feladatok dokumentumok letöltése hivatkozások kinyerése hivatkozáskapcsolatok nyilvántartása

A keretrendszer építőkövei Felépítés Laza csatolás Komponensek: a rendszer műveletvégző egységei Illesztők: üzenetalapú kommunikációt tesznek lehetővé Szolgáltatók: azerőforrásokhoz történő hozzáférést szabályozzák = az építőkövek között laza csatolás, kötés futási időben

Laza csatolás Felépítés Laza csatolás Előnyök: deklaratív szemlélet: rendszer = komponensek + szolgáltatók + összekapcsolási mód + paraméterezés nincs kötött elemkészlet, könnyen kiterjeszthető egyszerűbb és gyorsabb fejlesztés, csak funkcionális aspektusok

Illesztők Komponensek Szolgáltatók

Illesztők Illesztők Komponensek Szolgáltatók a laza csatolást biztosítják típusos (FIFO) sorok absztrakciói, üzeneteket továbbítanak bemeneti és kimeneti illesztők, adatáramlás: bemeneti illesztő fogyasztó komponens termelő komponens kimeneti illesztő több-több kapcsolat a komponensek és az illesztők között = azonosítás szerepek segítségével

Illesztők megvalósítása Illesztők Komponensek Szolgáltatók Helyi illesztő adatáramlás referencia szerinti átadással Távoli illesztő adatáramlás sorosítással (TCP protokollon keresztül)

Komponensek Illesztők Általános viselkedés az ősosztályban, specifikus viselkedés származtatással GenericComponent Komponensek Szolgáltatók Simple- Producer Simple- Consumer Simple- Filter Complex- Filter Synchronous- OutputFilter Asynchronous- ComplexFilter Synchronous- CompexFilter SemiSynchronous- ComplexFilter

Komponensek Illesztők Komponensek Szolgáltatók Alapszolgáltatások: példányosítás és kötés XML leíró alapján beállítások módosítása külső (grafikus) felületről adatáramlás-vezérlés életciklus-kezelés: leállítás és újraindítás

Szolgáltatók Illesztők Komponensek Szolgáltatók feladatuk: komponensek közötti adatmegosztás csomagolók: szabályozzák az erőforrásokhoz való hozzáférés fajtái: service provider: folyamat-szintű erőforrások data provider: hátterében állomány vagy adatbázis többszintű gyorsítótárazási mechanizmus átlátszó beépítése

Felépítés Vezénylés Grafikus felület

Felépítés Felépítés Vezénylés Grafikus felület Mester szolga (master worker) architektúra: a mester particionálja a webet és az egyes részleteinek bejárását egy-egy szolgának utalja ki a szolga bejárja a web rábízott szeletét, a kifelé mutató hivatkozásokat visszaküldi a mesternek Megvalósítás a keretrendszer alaposztályainak segítségével = elrejtett elosztott megvalósítás

Felépítés Master process Recently seen cache Domain constraints Domain assignment Felépítés Marshaller Vezénylés Grafikus felület Communicator User interface Worker process Worker process Worker process

Vezénylő komponens Felépítés Vezénylés Grafikus felület a mester legfontosabb alkotóeleme a beérkező URL-eket reguláris kifejezésekhez hasonló szabályok alapján szűri aszűrt URL-eket tartomány alapján továbbítja szükség esetén kijelöl új felelős szolgát tárolja a nemrég továbbított URL-eket, kiszűrve a gyakori ismétlődéseket

Vezénylő komponens Felépítés Vezénylés Grafikus felület Korlátozott kicserélt adatmennyiség: lokalitási elv: a hivatkozások kb. 10%-a mutat csak hoszton kívülre kötegelt átvitel: az ismeretlen hoszthoz tartozó URL-eket a szolga csoportosan küldi át a mesternek és fordítva nemrég látott URL-ek automatikus eldobása A mestert és a szolgákat tipikusan egy-egy gépcsoport realizálja.

Grafikus felület site browser identifier browser instance index Felépítés Vezénylés Grafikus felület modify site data start and suspend auto-arrangement property browser topology visualizer update modified unit settings requery unit settings and metrics

Összefoglalás

Összefoglalás Összefoglalás keretrendszer az általános feladatokra laza csatolású, feladatspecifikus komponensek nyitott, kiterjeszthető, skálázható architektúra deklaratív konfigurálhatóság, testreszabhatóság átlátszó gyorsítótárazási mechanizmusok támogatása grafikus felület A megvalósított rendszer forráskódja elérhető a SourceForge.net-en

Összefoglalás Köszönöm a figyelmet!