INTERNETES KERESÉS Szórád László Óbudai Egyetem TMPK
AZ INTERNET
INTERNET = WEB? - NEM! A web csak egy (bár az egyik legismertebb) részhalmazát jelenti az interneten használt alkalmazásoknak és protokolloknak.
SZOLGÁLTATÁSOK Információ Kommunikáció Adatátvitel
INFORMÁCIÓ Dokumentumok, képek, egyéb erőforrások, amiket hivatkozások segítségével érhetünk el => Böngésző programok Keresőrendszerek (Google, MSN/Bing, Yahoo!) Blogok Enciklopédiák Irodai alkalmazások Közösségi oldalak Játékok
KOMMUNIKÁCIÓ E-mail Internet telefon (VoIP = Voice over Internet Protocol) Csevegő alkalmazások (Chat) IRC ICQ Google Talk Yahoo! Messenger MSN/Windows Live Messenger Skype
ADATÁTVITEL Fájlmegosztás FTP szerver P2P alkalmazások (BitTorrent, DC++, Kazaa) Streaming media ( adatfolyamok ) Élő tévé-, rádióadás Webkamerák nyújtotta adás (http://madarlesok.lapunk.hu) Videótárak (YouTube, Videa)
AZ INTERNETET ALKOTÓ SZOLGÁLTATÁSOK Szolgáltatás neve Protokoll(ok) Alkalmazás Web HTTP Firefox, Chrome, Internet Explorer E-mail POP3, SMTP, IMAP Mozilla Thunderbird, Outlook, The Bat! Chat XMPP, IRC, Skype, MSNM Google Talk, IRC, Skype, Yahoo! Messenger, Pidgin (Gaim), Trillian FTP FTP Total Commander, FileZilla Fájlmegosztó rendszerek (P2P) FastTrack, ADC, BitTorrent Kazaa, DC++, BitTorrent Távoli bejelentkezés Telnet, SSH, RDP Telnet, PuTTY, WinSCP, Távoli asztali kapcsolat
BÖNGÉSZŐ PROGRAMOK Mire valók? Weboldalak megjelenítésére. Közöttük való közlekedés (navigáció, szörfölés ). Például: Mozilla Firefox Google Chrome Safari Internet Explorer Opera
KERESÉS AZ INTERNETEN Az Interneten nincs központi katalógus Okok (kb. : nem lehet megoldani) Következmények: A böngésző önállóan nem képes keresni. Keresőoldalakra van szükség!
KERESÉSSEL FOGLALKOZÓ SZOLGÁLTATÓK Különbségek: Különböző keresési módszerek. A találati lista eltérő rendezése. A keresőoldalak típusai: Szabadszavas keresők Kategória szerinti keresők
A KERESETT INFORMÁCIÓ TÍPUSA Szöveg Kép Zene Videó Speciális
MITŐL FÜGG A KERESÉS SIKERESSÉGE? A keresőmotor képességeitől. Az általunk megadott kereső kifejezéstől.
SZÖVEGES INFORMÁCIÓ KERESÉSE Szabadszavas keresők: Automatizáltan felépített adatbázist használnak. Rangsorolják a találatokat a kereső-kifejezés és a saját rangsorolási mechanizmusuk alapján. => Különböző kulcsszavakra a találati halmaz és a rangsorolás is más lesz. => A különböző keresők ugyanarra a kereső-kifejezésre is más találati listát adnak. Tematikus katalógusban való keresés: Témakörök alapján tájékozódhatunk a felhalmozott anyagok, linkek között.
A SZABADSZAVAS KERESŐK LEGFONTOSABB JELLEMZŐI A kereső adatbázis mérete. Az adatbázis frissessége. A találati rangsor kialakítása. Segédeszközök (kereső eszköztár böngészőhöz). Találatok csoportosítása (klaszterezés).
A WEB MÉRETE A keresőszolgáltatások szempontjából a Web az oldalak láthatósága alapján két részre osztható: látható (indexelhető) oldalakra és láthatatlan (nem indexelhető) oldalakra.
LÁTHATÓ WEB A Web azon része, amelyet a kereső szolgáltatások motorjai megtalálnak. Mérete becslések alapján meghaladja a 20,22 milliárd oldalt (2010. április)! Ez a szám 2005-ben még 11,5 milliárd volt. Az oldalak száma folyamatosan nő. A teljes Web 16%-ára becsülik.
A KERESŐK PIACI RÉSZESEDÉSE
A WEB LÁTHATATLAN RÉSZE A Webnek az a része, melyet a háttérben működő kereső robotok nem találnak meg. A láthatatlanság oka lehet: Ha az oldal dinamikusan jön létre, eléréséhez adatbázis-lekérdezésre van szükség. Csak regisztráció útján elérhető oldalak. Nem szöveges formátumban lévő dokumentumok (vannak kivételek!). Dokumentumszigetek. A kereső motorok által kizárt oldalak.
A KERESŐ ADATBÁZISOK MÉRETE A legnagyobb kereső adatbázisokkal rendelkező szolgáltatók a látható Web indexelésének %-ban (2005): Google: 76.16% Yahoo!: 69.32% MSN kereső: 61.90% Ask Jeeves/Teoma: 57.62% Az átfedés a négy kereső adatbázisaiban nem haladja meg a 29%-ot.
PROBLÉMÁK A KERESÉS SORÁN Túl sok a találat Túl kevés a találat A találatok nem megfelelőek Spam jellegű oldalak (általában nagy gazdasági jelentőségű témaköröknél). Több témakörhöz is kapcsolódó kulcsszó, mi a kevésbé ismertre keresünk.
HA TÚL SOK A TALÁLAT Szűkíthetjük a találatok számát: Több kulcsszó megadásával. Az összetartozó kulcsszavak idézőjelbe tételével. Speciális keresési beállítások használatával (pl. szavak kizárása a keresési feltételben). Nyelv(ek) megadásával. Ország megadásával (pl. site:hu).
HA TÚL KEVÉS A TALÁLAT A találati lista bővíthető: Más keresési kulcsszavak megadásával. Kevesebb kulcsszó megadásával. Más kereső használatával. Más nyelv megadásával.
HA NEM MEGFELELŐEK A TALÁLATOK A keresési kifejezés módosítása: Nyelvtani jellegű finomítás (egyes, többes szám, ragozás, toldalékolás). Helyesírás jellegű változtatás (egybeírás, különírás, kötőjeles írásmód(ok)). Idegen nyelvekből átvett szavak különböző alakjai (eredeti forma, fonetikus írásmód). Fogalmi, jelentésbeli változatok (bizonyos dolgokkal kapcsolatban idővel változik a szóhasználat).
KERESÉS TÉMAKÖR ALAPJÁN Ha a kulcsszavas kifejezés nem vezet eredményre. Ha nem tudunk pontos kifejezést adni. Tematikus katalógusok használata (linkgyűjtemények). Webes lexikonok felkeresése (pl. Wikipedia). Pontos kifejezés helyett a témakörre keresés egy szabadszavas keresőben.
IRODALOMJEGYZÉK http://webni.innen.hu/szabadszavaskeres_c5_91k http://nws.niif.hu/ncd2003/docs/ehu/ehu-61.htm http://www.cs.uiowa.edu/~asignori/web-size/ http://www.google.com/support http://hu.wikipedia.org/wiki/cloaking http://marketshare.hitslink.com/search-enginemarket-share.aspx?qprid=4 http://www.worldwidewebsize.com/