Adatkinyerés weblapokból

Hasonló dokumentumok
Árfolyamtábla jelentés

Árfolyamtábla jelentés

Árfolyamtábla jelentés

Árfolyamtábla jelentés

Árfolyamtábla jelentés

HTML kódok. A www jelentése World Wide Web.

HTML alapok. A HTML az Internetes oldalak nyelve.

Memória játék. Felhasználói dokumentáció

Multimédia 2017/2018 II.

4 ÉVFOLYAMOS FELVÉTELI EREDMÉNYEK

Webprogramozás HTML alapok előadás

Informatika 1. Informatika el adás. Kovács Kristóf, Pálovics Róbert. Budapesti M szaki Egyetem november 5.

Képek a HTML oldalon

Számológép. Bármilyen számítógépen működik, amin található böngésző és Java alkalmazás. Indító képernyő

Árfolyamtábla jelentés

HTML kódolás Web-lap felépítése. Az egész törzsre érvényes utasítás. <HTML> web-lap kezdő utasítás: a dokumentum kezdődik, a böngészőnek szól

Weblap készítése. Fapados módszer

HTML, XML szerkesztés


HTML alapok 1. Minimális HTML file: <HTML> <HEAD> <TITLE> cím </TITLE> </HEAD> <BODY>... </BODY> </HTML> Formátum parancsok:

Árfolyamtábla jelentés

Árfolyamtábla jelentés

8. Gyakorlat AWK 1, CSS

Árfolyamtábla jelentés

Árfolyamtábla jelentés

Árfolyamtábla jelentés

Árfolyamtábla jelentés

WAP. A Wireless Application Protocol (WAP) a vezetéknélküli eszközök (pl. mobiltelefonok, PDA-k) számára készített alkalmazások nemzetközi szabványa.

Hasznos gyűjtemények:

HTML. Dr. Nyéki Lajos 2016

Lássuk, mik azok a szempontok, amelyeket be kell tartanunk egy HTML kód írásánál:

Informatikus, Webfejlesztő. Nagy Gusztáv

Oktatási azonosító Vizsga idıpontja Vizsga típusa Tantárgy Elért pontszám

WCSS (Wap CSS), Wireless CSS

Internet, Az internet főbb szolgáltatásai web keresőszolgáltatásokkal Keresőrendszerek: Kulcsszavas 2) Egyéb keresők: Metakeresők gyűjtőkörű keresők

Neumann János Számítógép-tudományi Társaság Programozás, robotprogramozás szakkör Három félév 3 * 8 foglalkozás

WEBSZERKESZTÉS ELMÉLETI VIZSGAKÉRDÉSEK

Kelda WebGrafika Iroda Példa HTML, CSS formázásra

Honlapkészítés. 1. Előadás Bevezető, HTML. Paksy Patrik

(statikus) HTML (XHTML) oldalak, stíluslapok

Árfolyamtábla jelentés

Árfolyamtábla jelentés

Árfolyamtábla jelentés

Árfolyamtábla jelentés

Webshop készítése ASP.NET 3.5 ben I.

Sakk játék. Feladat: JavaScript segítségével olyan programot kell írni, ami egy sakktáblát szimulál. Kiválasztásra változtatják a helyüket.

Gazdasági informatika

Oktatási azonosító Tantárgy Elért pontszám Magyar nyelv Matematika Magyar nyelv Matematika

Sakk-játék. Bármilyen számítógépen működik, amin található böngésző és Java alkalmazás. Indító képernyő

Árfolyamtábla jelentés

Készítette: Gál Tamás. A tananyag programozott változata itt érhető el: Webfejlesztés

Táblázatok. Utolsó módosítás: 11/22/ :07:23

HTML é s wéblapféjlészté s

Weblapszerkesztési alapok

Kő, Papír, Olló. Felhasználói dokumentáció

A KELER Zrt. Díjszabályzata


INFO1 WEB, HTML, CSS

INFO1 Tartalom közlése a Weben: HTML, CSS

Kiknek szól ez a könyv? Miről szól a könyv? Hogyan épül fel a könyv? Mire van szükség a könyv használatához? Szokások Forráskód Hibajegyzék

12.óra jquery Framework #1. Gyimesi Ákos

WEB TECHNOLÓGIÁK 2.ELŐADÁS

Árfolyamtábla jelentés

XHTML XHTML. HTML nyelv. webprogramozó. Az XHTML nyelv. XHTML dokumentumok szerkezete, HTML 4.0 W3C javaslat 1997 dec., 1998 ápr továbbfejleszt

HTML sablon készítése a MailMaster szoftver beépített HTML szerkesztőjével

Saját website A HTML. HTML nyelv alkalmazása. HTML dokumentum. HTML nyelv alkalmazása. Mit választunk mi?

<C15. lista> Árfolyam lista. Nem archivált idıszak: lap. TKSZ technikai központ Idıpont: :56:54

HIRDETMÉNY VÉGZÉS KÖZLÉSÉRŐL

Képnézeget. Gépigény: Bármilyen számítógépen m ködik, amin található böngész és Internet elérés.

HTML szerkesztés. HTML bevezetés

qwertzuiopőúasdfghjkléáűíyxcvbnmq wertzuiopőúasdfghjkléáűíyxcvbnmq wertzuiopőúasdfghjkléáűíyxcvbnmq wertzuiopőúasdfghjkléáűíyxcvbnmq

Javascript dátum, idő, számláló megjelenítő Használati útmutató

A WEB programozása - Bevezetés őszi félév Dr. Gál Tibor

Az image objektum. Az image eseménykezel i. Képek el zetes betöltése. Feladat. Váltóképek készítése

Megoldás (HTML) <!DOCTYPE HTML> <html>

Árfolyamtábla jelentés

Árfolyamtábla jelentés

Árfolyamtábla jelentés

Webszerkesztés stílusosan. Készítette: Csécsy László Virgina DeBolt hasonló c. könyve alapján

Weblapok az érettségin. 2. feladat: weblap vagy prezentáció és grafika 30 pont

Endrıdi Tamás: Internet alapú alkalmazásfejlesztés c.

XML-HMTL Beadandó Dolgozat. Avagy, mit sikerült validálnunk fél év alatt

Gazdasági informatika






(statikus) (X)HTML oldalak, stíluslapok. Mi a HTML? HTML (HyperText Markup Language) - Hiperszöveges

ÁLTALÁNOS WEBLAPSZERKESZTÉSI TUDNIVALÓK ÁLTALÁNOS HTML KÓDOLÁSI TUDNIVALÓK

4. rész. HÁTTÉR BEÁLLÍTÁSA Egy pillanat alatt meg lehet változtatni egy oldal arculatát, ha megváltoztatjuk a háttérszínét.

Ismétlés Érdemes megjegyezni: a HTML nyelv nem azért készült, hogy segítségével formázzuk a kinézetét/stílusát az oldalunknak, hanem azért, hogy leírj

5-ös lottó játék. Felhasználói dokumentáció

XSLT ( XSL Transformations)

Intelligens, adaptív felhasználói felülettel rendelkez webalkalmazások fejlesztése

Árfolyamtábla jelentés

Árfolyamtábla jelentés

2009. évi árfolyamok.txt

TUDNIVALÓK A WEB-FEJLESZTÉS I. KURZUSRÓL

Átírás:

Adatkinyerés weblapokból Gergi Miklós BME Matematika Intézet 2008. szeptember 17. Ruby meetup Adatkinyerés weblapokból 1 / 7

Mivel csináljuk? Mivel csináljuk? Hpricot MNB html IMDB html IMDB ruby grep, tr, sed, awk Ruby meetup Adatkinyerés weblapokból 2 / 7

Mivel csináljuk? Mivel csináljuk? Hpricot MNB html IMDB html IMDB ruby grep, tr, sed, awk HTML::Parser, HTML::TreeBuilder, and HTML::Element Ruby meetup Adatkinyerés weblapokból 2 / 7

Mivel csináljuk? Mivel csináljuk? Hpricot MNB html IMDB html IMDB ruby grep, tr, sed, awk HTML::Parser, HTML::TreeBuilder, and HTML::Element Ruby Hpricot Ruby meetup Adatkinyerés weblapokból 2 / 7

Hpricot Mivel csináljuk? Hpricot MNB html IMDB html IMDB ruby XPath selector CSS selector jquery Ruby meetup Adatkinyerés weblapokból 3 / 7

MNB html <tr class="mnbinternet FS MNBInternet DgRowBG2 MNBInternet DgText2"> <td class="mnbinternet DgBorder" align="center"> <span class="mnbinternet Heading4">CHF</span></td> <td align="center" class="mnbinternet DgBorder">svájci frank</td> <td class="mnbinternet DgBorder" align="right"> <span class="mnbinternet Heading5">1</span></td> <td class="mnbinternet DgBorder" align="right"> <span class="mnbinternet Heading5">149,00 </span></td> <td class="mnbinternet DgBorder"> </td> <td class="mnbinternet DgBorder" align="center"> <span class="mnbinternet Heading4">NZD</span></td> <td align="center" class="mnbinternet DgBorder">új-z. dollár</td> <td class="mnbinternet DgBorder" align="right"> <span class="mnbinternet Heading5">1</span></td> <td class="mnbinternet DgBorder" align="right"> <span class="mnbinternet Heading5">111,51 </span></td> </tr> Ruby meetup Adatkinyerés weblapokból 4 / 7

MNB html <tr class="mnbinternet FS MNBInternet DgRowBG2 MNBInternet DgText2"> <td class="mnbinternet DgBorder" align="center"> <span class="mnbinternet Heading4"> CHF </span></td> <td align="center" class="mnbinternet DgBorder">svájci frank</td> <td class="mnbinternet DgBorder" align="right"> <span class="mnbinternet Heading5">1</span></td> <td class="mnbinternet DgBorder" align="right"> <span class="mnbinternet Heading5"> 149,00 </span></td> <td class="mnbinternet DgBorder"> </td> <td class="mnbinternet DgBorder" align="center"> <span class="mnbinternet Heading4">NZD</span></td> <td align="center" class="mnbinternet DgBorder">új-z. dollár</td> <td class="mnbinternet DgBorder" align="right"> <span class="mnbinternet Heading5">1</span></td> <td class="mnbinternet DgBorder" align="right"> <span class="mnbinternet Heading5">111,51 </span></td> </tr> Ruby meetup Adatkinyerés weblapokból 4 / 7

Ruby meetup Adatkinyerés weblapokból 5 / 7

mnb = Hpricot(open( http://mnb.hu/engine.aspx?page=napiarfolyamok )) Ruby meetup Adatkinyerés weblapokból 5 / 7

mnb = Hpricot(open( http://mnb.hu/engine.aspx?page=napiarfolyamok )) puts mnb.at("span[text()= CHF ]").html.strip Ruby meetup Adatkinyerés weblapokból 5 / 7

mnb = Hpricot(open( http://mnb.hu/engine.aspx?page=napiarfolyamok )) puts mnb.at("span[text()= CHF ]/../..").html.strip Ruby meetup Adatkinyerés weblapokból 5 / 7

mnb = Hpricot(open( http://mnb.hu/engine.aspx?page=napiarfolyamok )) puts mnb.at("span[text()= CHF ]/../../td[4]").html.strip Ruby meetup Adatkinyerés weblapokból 5 / 7

mnb = Hpricot(open( http://mnb.hu/engine.aspx?page=napiarfolyamok )) puts mnb.at("span[text()= CHF ]/../../td[4]/span").html.strip Ruby meetup Adatkinyerés weblapokból 5 / 7

mnb = Hpricot(open( http://mnb.hu/engine.aspx?page=napiarfolyamok )) puts mnb.at("span[text()= CHF ]/../../td[4]/span").html.strip puts mnb.at("span[text()= NZD ]/..~td~td~td/span").html.strip Ruby meetup Adatkinyerés weblapokból 5 / 7

IMDB html <table class="cast"> <tr class="odd"> <td class="hs"> <a href="/name/nm0000136/"... > <img src=... > </a> <br> </td> <td class="nm"> <a href="/name/nm0000136/">johnny Depp</a> </td> <td class="ddd">... </td> <td class="char"> <a href="/character/ch0001274/">jack Sparrow</a> </td> </tr> <tr class="even">......... Ruby meetup Adatkinyerés weblapokból 6 / 7

IMDB ruby doc = Hpricot(open("http://www.imdb.com/title/tt0325980/")) Ruby meetup Adatkinyerés weblapokból 7 / 7

IMDB ruby doc = Hpricot(open("http://www.imdb.com/title/tt0325980/")) doc.search("table[@class= cast ]//td[@class= nm ]") Ruby meetup Adatkinyerés weblapokból 7 / 7

IMDB ruby doc = Hpricot(open("http://www.imdb.com/title/tt0325980/")) doc.search("table.cast//td.nm") Ruby meetup Adatkinyerés weblapokból 7 / 7

IMDB ruby doc = Hpricot(open("http://www.imdb.com/title/tt0325980/")) doc.search("table.cast//td.nm").map{ x puts x.at("a").html} Ruby meetup Adatkinyerés weblapokból 7 / 7