6. előadás Internet, WWW Dr. Kallós Gábor 2014 2015 1
Tartalom Internet WWW Általános áttekintés Történelem Szervezés Internetes protokollok TCP/IP http, https E-levelezés Protokollok Keresés az interneten Keresőrobotok Page rank Egyéb lehetőségek Cloud felhő szolgáltatások E-kereskedelem, e-üzlet, e-közigazgatás Biztonsági kérdések Az internetes információk hitelessége 2
Internet általános áttekintés Az internet egy egész világot körülölelő hatalmas rendszer, amely számítógép-hálózatokat fog össze Az internet sokféle információs forrást és szolgáltatást nyújt, mint pl. a World Wide Web (WWW, hipertext dokumentumok, adatbázisok), fájl transzfer és megosztás, online chat és játék, elektronikus levelezés, cloud tároló A szó eredete: Internetwork (hálózatok hálózata) A globális hálózatot helyi hálózatok, intranetek, különböző távolsági hálózatok alkotják Az adatok a többféle fizikai közegekben utazhatnak telefonvonalak, különböző hálózati kábelek vagy kommunikációs műholdak segítségével Az internetet felépítő és szabályozó protokollok (főként: TCP/IP) mindenki számára hozzáférhetőek, ezeket rengeteg gyártó támogatja Az internet sok elemző szerint olyan forradalmi változást hozott az életünkben, amely a könyvnyomtatás feltalálásához hasonlítható Egykor a hálózat kizárólag csak a kutatók, oktatók és katonai intézmények számára volt elérhető, de kommercializálódott 3
Internet történelem 1946: egy novellában (A Logic Named Joe) egy sci-fi író részletesen ír egy világméretű számítógépes hálózatról 1958, USA: felmerült egy olyan számítógép-hálózat létrehozásának szükségessége, amelynek megmaradó részei egy esetleges atomtámadás után is működőképesek maradnak Defense Advanced Research Project Agency (DARPA) Kidolgozták az NCP protokollt, amely egy csomagkapcsolt hálózati kommunikációs rendszer (az adatok továbbítása kisebb csomagokban történik) Ez a mai TCP/IP szabvány ősének tekinthető Ezen az elven kezdett működni 1969-ben az ARPANET (ARPA Network) A katonai felhasználásokon kívül egyes egyetemek és kormányzati laboratóriumok kutatói is használhatták 1971-től lehetséges az elektronikus levelezés, az ftp és a telnet Az Internet kifejezést először 1974-ben használták, egy TCP protokollról szóló tanulmányban 1976: az X.25 hálózati szabvány kidolgozása (CCITT) 1978: az első nemzetközi hálózati összeköttetés az ARPANET, a brit posta, a Telenet, és más USA hálózatok között 4
Internet történelem 1981: (Nyugat-)Európa és az USA mellett Kanada, Hong-Kong és Ausztrália is be lett csatlakoztatva 1983: az addig szigorúan ellenőrzött az ARPANET-ből leválasztották a hadászati szegmenst (MILNET, Military Network), ezzel megszületett a polgári, nyílt internet A National Science Foundation (NSF, USA) felismerte, hogy a hálózat döntő fontosságú lehet a tudományos kutatásban, ezért igen nagy szerepet vállalt az internet bővítésében 1985 86 között építették ki az NSF szuperszámítógép-központjaira alapozott hálózatot (NSFNET, NSF Network), és összekapcsolták az ARPANET-tel Az összeköttetést feljavítva (optikai kábelek, új vonalak) a hálózat sebessége rövid idő alatti 56 kbps-ról 1.5 Mbps-ra emelkedett Az egyetemeknek meghatározó szerepük volt a fejlesztésben, sok sikeres, eredeti ötlet oktatóktól, diákoktól ill. vegyes kutató csoportoktól származik 1988: a szélesebb körű kereskedelmi alkalmazás kezdete, a céges levelező rendszerek beolvasztása 1989: formálisan megszűnt az ARPANET, helyét addigra már átvették a fejlettebb gerinchálózatok 1989, USA: három kereskedelmi internet szolgáltató alakult (UUNET, PSINET, CERFNET) 5
Informatika I. Internet történelem 1989: Tim Berners-Lee angol tudós egy tanulmányban összeötvözte a 60-as évektől már létező hipertext ötletét az internettel (URL-rendszer), így jött létre a Világháló Fontos változás a korábbi hipertext rendszerekhez képest, hogy elég egyirányú linkeket használni, ez jelentősen csökkentette a megvalósítás bonyolultságát 1990: A CERN-ben (Organisation Européenne pour la Recherche Nucléaire, OERN- CERN) beindult az első Web szerver (NeXTcube, Berners-Lee) Ő készítette el az első weblapot és az első böngészőt is 1991 (dec.): Az első Web szerver Európán kívül (SLAC, Stanford Linear Accelerator Center, Stanford Egyetem) 1993.04: a CERN bejelentette, hogy a Világháló mindenki számára szabad és ingyenes Innentől tekinthetjük az internetet igazán populárisnak Magyarországon is 1993-ban állították üzembe az első WWW szervert (www.fsz.bme.hu) Az első népszerű böngészőprogram a ViolaWWW volt, X-Window környezetben, később ezt váltotta a Mosaic Az 1990-es években az internet átlagosan évi 100%-kal bővült, leszámítva egy még dinamikusabb rövid időszakot (1996-97) A fejlődés spontán, szerves, nincs igazi központi szervezés 2009.09: 1,73 milliárd felhasználója van az internetnek 2014.01: 2,80 milliárd felhasználó 6
Internet történelem 7
Internet történelem 8
Internet szervezés Az internet szerkezetét fizikai és logikai kapcsolatok alapján elemezhetjük (pl. direkt összeköttetések, ill. domain nevek, IP-címek és WWW- vagy URL-címek kapcsolatai) (Létezik olyan nemzetközi nonprofit hatóság (ICANN, Internet Corporation for Assigned Names and Numbers), amely az internetes azonosítók (domain nevek, IP címek, egyéb paraméterek) felső szintű kiosztását, szervezését koordinálja) Hatalmas alhálózatok alakultak ki, pl. GÉANT a fő európai multi-gigabit hálózat, kutatási és oktatási célra GLORIAD (Global Ring Network for Advanced Application Development) nagy sebességű hálózat, amely az USA Oroszország, Kína, Korea, Kanada és Hollandia tudományos szervezeteit köti össze Internet2 vagy UCAID (University Corporation for Advanced Internet Development) nonprofit szervezet, haladó hálózati technológiák fejlesztésére és alkalmazására JANET Anglia, a kormány által létrehozott oktatási-kutatási hálózat HBONE a magyar háló, a NIIF (Nemzeti Információs Infrastruktúra Fejlesztési) program keretében építették ki, az 1980-as évek közepétől 9
Internet szervezés 10
Internet szervezés/ip-címek (Már nagyrészt tanultuk) IP-cím: (egyedi) hálózati azonosító, amelyet az internet protokoll (IP) segítségével kommunikáló számítógépek egymás azonosítására használnak A DARPA eredeti leírásából (1981): "A name indicates what we seek. An address indicates where it is. A route indicates how to get there." Az IP-címek 32 biten ábrázolt egész számok (jelenleg még: IPv4 szabvány, Internet Protocol Version 4) Ezeket (hagyományosan) négy darab egybájtos (0..255), ponttal elválasztott számmal írjuk le a könnyebb olvashatóság érdekében (pl: 192.168.42.1) A címek felépítése hierarchikus, a legnagyobb helyi értékű bájt a legfelső szint Elvileg 2^32 darab különböző cím adható ki (kb. 4,3 milliárd), de az IPv4 szabvány bizonyos címeket fenntart speciális célokra A címrendszert a gépek és a hálózatok számának bővülése miatt többször is átszervezték Kezdetben egy 8 bites hálózati azonosító volt az első pozícióban, de ez hamarosan nem bizonyult elégnek 11
Internet szervezés 12
Informatika I. Internet szervezés IP-címrendszer tört. folyt. 1981-ben a kezdő bitek alapján öt csoportot vezettek be (Classful Network szabvány, 0 A, 10 B, 110 C, 1110 D, 1111 E) a hálózatok számát és a beköthető gépek számát azonosító bitek száma is rögzített volt, pl. A típus: 0.0.0.0-tól 127.255.255.255-ig, 8 bit a hálózatokra (24 marad), 127 hálózat, mindegyikben 16.777.214 lehetséges gép B típus: 128.0.0.0-tól 191.255.255.255-ig, 16 bit a hálózatokra, 16.384 hálózat, mindegyikben 65.534 lehetséges gép C típus: 192.0.0.0-tól 223.255.255.255-ig, 24 bit a hálózatokra, 2.097.152 hálózat, mindegyikben 254 lehetséges gép A lokális hálózatokba kapcsolt gépek számának gyors növekedésével túl kevésnek bizonyult az A és B típusú hálózat, ezért 1993-ban új rendszert vezettek be (Classless Inter-Domain Routing, CIDR) Itt a (hálózatot azonosító) kezdőbitek száma egyedileg megadható, a cím végén pl. 192.168.0.0/16 A kiosztás így rugalmasabb, a helyi viszonyokhoz alakítható, de vigyázni kell, mert egyes címek nem használhatóak (abban a hálózatban)! Napjainkban: trükközéssel egyes címcsoportok többször is kiadhatók (lokálisan) Az internet név terének extrém növekedése miatt az eredeti szabvány mellett egy új, 128 bites címrendszert is megalkottak (IPv6) ezt a modern gépek és op. rendszerek fizikailag és logikailag már ismerik, de: még nem ez az aktív (2014.10.) A távoli gépek elérésének fontos kérdései (pl.) Alternatív utak száma Legrövidebb út megtalálása Legrövidebbnél nem sokkal hosszabb út 13
Internet szervezés 14
Internet szervezés/domain nevek Az internet működéséhez szükséges a korrekt, globálisan egységesített névrendszer (pl. minden lehetséges név csak egyszer legyen kiadva) Domain név (tartománynév): hálózati eszközök valamilyen közös tulajdonsággal rendelkező csoportjához (tartomány) hozzárendelt azonosító, amely csoportos kezelést tesz lehetővé A domain névrendszer (Domain Name System, DNS) tekinthető úgy is, mint egyfajta telefonkönyv az interneten, amely emberközeli azonosítókat használ a gép közeliek (pl. IP-címek) helyett A domain név sokféle azonosító része lehet Használható pl. WWW oldalak címében, e-mail címekben ill. más hozzáférésekben Pl. a sze.hu domain sok szolgáltatást nyújt konkrét címekkel és gépeken, www.sze.hu, rs1.sze.hu, mail.sze.hu stb. A domain nevek felépítése hierarchikus, jobbról balra haladva Végződésük alapján két nagy csoportba oszthatók: nemzetközi fődomain és nemzeti domain, pl. com üzleti, általános; net hálózati szolgáltatók; org nonprofit szerveződések; name magánszemélyek; gov kormányzati szervek.hu Magyarország,.at Ausztria,.de Németország,.ro Románia,.sk Szlovákia,.fr Franciaország,.jp Japán Ezalatt a második szintű tartomány helyezkedik el, amely általában a tartománynév tulajdonosára jellemző (cégnév, személynév, terméknév, védjegy stb.), pl. sze, bme A harmadik szinten általában egy konkrét kiszolgáló/szolgáltató található (pl. ftp, www vagy mail szerver) 15
Internet szervezés A domain névrendszer menedzselése Az általános, felső szintű menedzselést az ICANN végzi Az alsóbb szintű névadás felelősségét általában a név szerverekhez (Name Server) osztják le egy-egy tartományon belül A domain nevek regisztrációjával (jogi, üzleti szempontok) egyes speciális szervezetek foglalkoznak (pl. Network Solutions, ill. nemzeti hatóságok) Értékes domain nevek A kereskedelmi szolgáltatók számára azok a nevek értékesek, amelyek rövidek, könnyen megjegyezhetők, határozottan utalnak a tevékenységre és a kereső programok is magas prioritással találják meg őket (sokan keresik azokat a kulcsszavakat, amelyek a névben szerepelnek) Egyes esetekben akár napi több 10.000 $ is múlhat a név jó megválasztásán Ennek megfelelően egyes domain nevek konkrét, és akár nagyon magas piaci értékkel bírnak (pl. üzlet, szerencsejáték, szex), és az előre regisztrált domain nevek eladásával egy speciális üzletág alakult ki ( domain aftermarket, kb. 1995 2005) Néhány korábbi nagy üzlet: Business.com, 7,5 millió $, 1999; AsSeenOnTv.com, 5,1 millió $, 2000; Altavista.com 3,3 millió $, 1998; Wine.com, 2,9 millió $, 1999; CreditCards.com, 2,75 millió $, 2004; Autos.com, 2,2 millió $, 1999 Manapság ez a terület már nem túl kurrens, mert a fontos nevek elkeltek A mostanában lefoglalt nevek sokszor nem kellenek már senkinek, napi átlag 1-2 tízezer felesleges nevet törölnek a jegyzékből 16
Internet szervezés 17
WWW WWW (World Wide Web vagy magyarul sokszor: Világháló) egymással hiperlinkekkel összekötött dokumentumok rendszere az interneten Az alapötlet egy globális információs hálózat létrehozása volt a számítógépek, a számítógépes hálózat és a hipertext képességeinek ötvözésével (eml. CERN, 1990) A WWW projekt a felhasználói kényelem biztosítása miatt lett igazán sikeres, jól követték az igényeket és a lehetőségeket Kezdeti világháló: statikus tartalom, egyszerű grafikával A rendszert webböngésző program segítségével lehet elérni, ez képes megjeleníteni az egyes dokumentumokat, a weblapokat (hiperlinkek segítségével lehet továbblépni az újabb lapokra) Ez adja a rendszer háló-jellegét; a dokumentumok a háló csomópontjai, míg a hiperlinkek a háló szálai, amelyeken keresztül más csomóponthoz eljuthatunk Napjainkban: a weblapokat nagy arányban programok állítják elő dinamikusan 18
WWW A Világháló több fontos szabványra/ajánlásra épül, ezeket a WWW Consortium (1993 ) fejleszti és menedzseli (itt dolgozik a WWWalapító Berners-Lee is) URL (Uniform Resource Locator), szabvány leírja, hogy milyen egyedi címmel kell rendelkeznie az egyes oldalaknak Hipertext átviteli protokoll (Hyper Text Transfer Protocol, HTTP), szabvány megadja, hogy hogyan küld egymásnak információt a böngésző és a kiszolgáló Hipertext leíró nyelv (Hyper Text Markup Language, HTML), szabvány az információkódolás eljárása, amellyel a WWW oldal megjeleníthetővé válik Stíluslap, ajánlás hogyan nézzen ki egy weboldal (formai elrendezés, színek), pl. CSS (Cascading Style Sheets) Script nyelv, ajánlás, szabványosítás alatt elsősorban dinamikus tartalom megjelenítésére, pl. JavaScript Dokumentum objektum modell, szabvány nyelvfüggetlen objektummodell a HTML, XML és más rokon formátumok szerkezetének leírására 19
WWW/URL Webcím (eml.: URL szabvány) megadja a weblap (dokumentum) megtalálásához szükséges négy alapvető információt: A protokollt, amit a célgéppel való kommunikációhoz használunk (http, https, ill: telnet, ftp, gopher, mailto) Sok böngészőnél a http rész elhagyható, mert ez az alapértelmezés A szóban forgó gép/kiszolgáló/tartomány nevét A hálózati port számát, amin az igényelt szolgáltatás elérhető a célgépen Gyakran ez a rész is elhagyható, pl. a http protokoll alapértelmezett portszáma a 80 A könyvtárhoz/fájlhoz vezető elérési utat a célgépen belül Példák: http://hu.wikipedia.org:80/wiki, http://rs1.szif.hu/sz, http://www.sze.hu/~corona/ A webcímek egyéb részeket is tartalmazhatnak Pl. az elérési út után, egy kérdőjel mögé helyezve keresési kérdés szerepelhet http://ivi.sze.hu/main.php?fajl=munkatars&szervegys=sz&sid Ill. az elérési út után, kettős kereszttel (#) elválasztva szerepelhet a szöveg egy részére hivatkozó azonosító http://hu.wikipedia.org/wiki/1999#események 20
WWW A weblapok részei Bemutatott, érzékelhető információ Szöveges információ, változatos bemutatási lehetőséggel Nem szöveges információ Statikus képek, bitmap ill. vektor formátumban (pl. GIF, JPG, PNG ill. SVG) Animációs képek (pl. GIF, vagy Flash ill. Java Applet) Zenék (pl. MIDI, WAV, ill. Java Applet) Videók (WMV Windows, RM Real Media, FLV Flash Video, MPG, MOV) Interaktív információ, dinamikus weblapokon Lapon belüli kommunikációra: interaktív szöveg, illusztrációk, gombok (DHTML, pl. legördülő menükre) Lapok közötti kommunikációra: hiperlinkek, formok Belső (rejtett) információ Kommentek (HTML), stílusinformációk (CSS) Metadata információk, DTD leírások (Document Type Definition) Scriptek (általában JavaScript), az interaktivitás növelésére A weblapok egyéb rejtett, dinamikusan beillesztett információs elemeket is tartalmazhatnak (létrehozhatnak), pl. cookie-süti 21
Informatika I. WWW/protokollok (Eml.) Protokoll: a csomópontok egymással történő kommunikációjának a szabályrendszere, tartalmazza pl., hogy Milyen címzést használnak a csomópontok egymás azonosítására Milyen formában küldik az adatokat Milyen redundáns infókkal egészítik ki a továbbítandó adatokat az esetleges hibák felismerése és javítása érdekében Az alkalmazandó protokoll típusa a hálózat típusától függ Más-más protokollok működnek hatékonyan széles sávszélességű és megbízható átviteli közegben, mint lassú és kevésbé megbízhatató adatátvitel esetén WAN-ok esetén a TCP/IP protokollok a legelterjedtebbek Ezek a fizikai átvitel fölé épülnek, a csomópontok címzési módját ill. a hálózaton továbbított adatcsomagok méretét és formátumát rögzítik Az IP (Internet protokoll) a család legalacsonyabb szintű protokollja Az IP nem garantálja a megbízható átvitelt, az adatcsomagok késhetnek, sérülhetnek, elveszhetnek ha az IP által használt hálózat hibázik Az IP adatcsomagok mindig egy header résszel kezdődnek, amely tartalmazza a küldő és a címzett csomópont IP címét Az üzenet ezen része redundáns, és így védett a sérülések ellen, ezzel az IP-t megvalósító szoftver fel tudja ismerni az esetleges hibákat Az adatcsomagot a protokollt megvalósító szoftver ezután a helyi hálózatban (alkalmas módosításokkal: cím, adat) továbbküldi a megfelelő helyre A TCP (Transport Control Protocol) az IP-re épülve megbízható hálózati átvitelt garantál A TCP-t használó ismertebb szolgáltatások: ftp (file transfer, fájlok hordozása távoli gépekre), telnet (távoli gépekre történő belépés), e-mail szolgáltatás, és nagy részben a http is 22
A http protokoll A HTTP (HyperText Transfer Protocol) egy hálózati információátviteli protokoll elosztott, együttműködő, hipermédiás elosztott rendszerekhez Ez a Web talán legfontosabb protokollja A kiszolgálók és a böngészők a HTTP-t használják arra, hogy Webdokumentumokat küldjenek az Interneten keresztül A HTTP leggyakrabban (de nem kizárólag) a TCP/IP-re épül A HTTP fejlesztését a WWW konzorcium koordinálta, 1999-ben adták ki a HTTP/1.1-es verziót, a 2010-es évek elején is ez a legelterjedtebb A HTTP kérés-válasz alapú protokoll kliens és szerver között, a kliens jellemzően, de nem feltétlenül egy webböngésző A kérésekben metódusok szerepelnek (leggyakrabban a get) A HTTP biztonságosan továbbítja a szövegeket, képeket, zene és videóállományokat Multimédiás fájlok továbbításához a HTTP a MIME (Multipurpose Internet Mail Extension) specifikációt használja. A HTTP lehetővé teszi, hogy az alkalmazások fontos információkat közöljenek azokról az adatokról, amelyeket ügyfelek és kiszolgálók részére küldenek az Interneten keresztül 23
A https kapcsolat Ha titkosítatlan csatornán kommunikálunk az interneten, akkor bármely küldött vagy fogadott információ (személyes adatok, jelszavak, bankkártya-információk, stb.) lehallgatható, és egy esetleges rosszindulatú harmadik fél által tudtunk nélkül felhasználható és/vagy módosítható A HTTPS a HTTP protokoll biztonságos, titkosított, SSL csatornán keresztül üzemeltetett változata (HyperText Transfer Protocol over Secure Socket Layer), a biztonságos webböngészés megvalósítására alkalmazzák Használatát látjuk az URL-ben A HTTPS kommunikáció általában a 443-as TCP porton zajlik 24
E-levelezés E-mail (electronic mail) elektronikus levél, írása és továbbítása elektronikus A hagyományos levélküldést csigaposta (snail mail) néven emlegetik internetes körökben A mai e-mail rendszerek leggyakrabban az internetet használják közvetítőnek, így az e-mail az internet használatának egyik legkedveltebb formája lett Története Az e-mail ötlete az 1960-as években az időosztásos nagygépes (mainframe) környezetben merült fel, hogy a felhasználók közötti kommunikációt biztosítsa Az első e-maileket 1965-ben küldték el CTSS (MIT) és Q32 (SDC) gépeken (ekkor még nem működött az ARPANET!), ezután jött létre a hálózati e-mail Az ARPANET nagyon megnövelte az e-mail népszerűségét, és a fejlődésre is jelentősen hatott A @ jel használatát Ray Tomlinson 1971-ben vetette fel, a felhasználó neve ill. gépe azonosítójának elválasztására Korai levelezőprogramjai (SNDMSG és READMAIL) nagyon fontosak voltak a mai e-mail forma kialakulásában Ekkoriban még a különböző hálózatok (pl. ARPANET, BITNET, NSFNET) között a mainál sokkal nehézkesebb volt az összeköttetés Az e-mailhez csatolni kellett az üzenet útjának kézi megadását (a küldő és a fogadó gépe közötti útleírást), ez sok (akár 8-10) ugrásból állt A bizonytalan telefonos kapcsolatok miatt sokszor előfordult, hogy az e-mail akár egy héttel később érkezett csak meg, sőt az üzenetek el is veszhettek az ugrások útvesztőjében 25
E-levelezés Az e-mail küldése és fogadása modern környezetben (általában): 1. Alice (most: alice@a.org) megírja az üzenetet a levelezőrendszerében (Mail User Agent, MUA, pl. Mozilla), begépeli Bob címét vagy kiválasztja az adress-book tárból (most: bob@b.org), és elküldi az üzenetet 2. A levelezőrendszer internetes e-mail formára alakítja az üzenetet, és elküldi a helyi levélküldő szolgáltatónak/szervernek (Mail Transfer Agent, MTA, most: smtp.a.org) az SMTP (Simple Mail Transfer Protocol) protokoll segítségével 3. Az MTA megkeresi a cél/címdomain nevét (most: b.org) a DNS-ben (Domain Name System), hogy beazonosítsa az adott domain levélfogadó szerverét (Mail Exchange Server) 4. A címdomain DNS szervere (most: ns.b.org) válaszként elküldi a címdomain MX szervereinek listáját (most: mx.b.org) a hívó MTA-nak 5. A helyi levélküldő szolgáltató (smtp.a.org) elküldi az üzenetet a címdomain MX szerverének (mx.b.org), az pedig kézbesíti a levelet Bob postafiókjába 6. Bob rákattint az új üzenetre, és azt levelezőrendszere megjeleníti a képernyőn a POP3 (Post Office Protocol) protokoll használatával 26
E-levelezés Az e-mail rendszer máshogy is megvalósítható, ilyenkor a folyamat nem pontosan az előző forgatókönyv szerint zajlik, pl. Alice és Bob webmail szolgáltatást is használhat, ekkor nem kell (MUA) levelezőrendszer Egyes más jellegű programok tartalmazhatnak beépített levelezéstámogatást, ilyenkor más konverziók történnek a lépések során Manapság szinte minden e-mail közvetlenül az internethez kapcsolódó gépekre érkezik (DNS, MX rekord és SMTP segítségével) Nagyon kevés mail kiszolgáló engedélyezi az útdefiniálást (routing), sem az automatikust, sem pedig a kézit, az ezzel való visszaélések miatt (spam-ek) 27
E-levelezés Levelezésre használatos fontosabb protokollok SMTP (Simple Mail Transfer Protocol) Egyszerű kommunikációs protokoll az e-mailek interneten történő továbbítására (a TCP-re épül rá) IMAP (Internet Message Access Protocol) A levelek nem töltődnek le a szerverről (alapbeállítás szerint), a kliens csak átmeneti információkat tárol róluk A szerveren tárolt levelek szinkronban vannak a helyi gép adataival (a levelező kliens a kiszolgálón direkt módon manipulálja a leveleket) Több eszközre is beállítható ugyanez POP3 (Post Office Protocol version 3) A leveleket a kiszolgáló letölti a szerverről és onnan gyakran törli is őket (alapbeállítás szerint) Régen: korlátozott kapcsolódási idő A változtatások csak a helyi gépen lépnek érvénybe 28
E-levelezés Levelezésre használatos fontosabb protokollok (beállítás) 29
E-levelezés Spam (levélszemét): kéretlen, rosszindulatú, ill. téves levél Mivel az e-levelezés költségei igen alacsonyak, a szemetelők akár napi több száz millió e-mailt is szétküldhetnek Fajtái: Leggyakrabban kéretlen kereskedelmi hirdetéseket kapunk (szoros értelemben vett spam, pl. egy cégnek megadtuk a címünket vagy megszerezte valahogy ) Férgek, vírusok (önmagukban vagy csatolt állományként) Levelező listáról érkező, általunk nem várt levelek Előfordulhat az is, hogy valakinek a címe hasonlít egy népszerű címre, így neki egyszerűen tévedésből küldenek leveleket Védekezés: spam-szűrés, ill. azonnali törlés 30
E-levelezés A modern internetes e-mail üzenetek tipikusan két fő részből állnak: Fejléc (header) és törzs (body) A fejléc fontosabb részei: Az üzenet rövid tartalma (tárgy, subject), a küldő/feladó címe (from), a fogadó/címzett címe (to), a küldés dátuma és ideje Másolat (cc, carbon copy) ki kapja még meg a levelet Titkos címzett/másolat (bcc, blink carbon copy) Válaszcím (reply-to) egyes levelezőprogramok megengedik a feladóétól eltérő e-mail cím megadását is Típusmező (content-type) az üzenet típusát tartalmazza (karakterkészlet, kódolás) Csatolt fájlok (attachments) felsorolásszerűen helyezkednek el, általában látszik a típusuk A törzsben helyezkedik el maga az üzenet Különösen hivatalos jellegű levél esetében fontos a hagyományos levélírásban megszokott konvenciók alkalmazása Udvarias megszólítás, búcsúzás, megfelelő hangnem A levélhez fájlok csatolhatók (képek, további dokumentumok) Lásd még: netikett (gyakorlat) 31
Informatika I. Keresés az interneten Keresőrendszer: az interneten megtalálható dokumentumok, adatbázisok, multimédiás tartalmak megadott szempontok szerinti nyomon követését és az eredmény megjelenítését végrehajtó szoftver Címszavas keresés (leggyakrabban): a rendszer megjeleníti azokat a tartalmi egységeket, találatokat, amelyek megítélése szerint az adott címszóhoz kapcsolódnak Kereső kifejezés is megadható (ez szavakat, logikai műveleteket és egyéb attribútumokat tartalmazhat), ilyenkor a rendszer a megadott feltételek szerinti összetett keresést végez Túl sok találat esetén szűkítést kell alkalmazni, a feltételek pontosításával (pl. milyen szó ne szerepeljen a dokumentumban) Nem megfelelő találatok esetén helyesírási, nyelvtani és fogalmi módosítással érdemes folytatni Elgépelés esetén javítási lehetőségeket is javasolnak Látható és láthatatlan web A rendelkezésre álló össznépi tudásnak csak kisebb része van fent a weben, és a keresők ennek is csak kisebb hányadát tudják megtalálni (!) Weblapok szándékosan is elrejthetők a keresőrobotok elől Kicsit máshogy megfogalmazott keresőkérdés más releváns találatokat is kiadhat Általában angolul vagy németül több hasznos találatot kaphatunk Problémás keresések Nagy bevételt hozó témák esetén sok webmaster érdekelt abban, hogy oldala lehetőleg minél előrébb kerüljön a találati rangsorokban, akkor is, ha az adott keresésben nem releváns (web-spam) Ha nem ismerjük a kulcsszavakat sem, akkor tematikus közelítést kell alkalmazni (pl. a Wikipediából indulva) 32
Keresés az interneten Keresők összehasonlítása Adatbázisok mérete, használhatósága, frissessége alapján Általában a Google szerepel ezekben a felmérésekben a legjobban Google a legnépszerűbb netes kereső napjainkban, előnyös tulajdonságai: Fejlesztése 1996 97-ben kezdődött (Stanford, PhD hallgatók) Egyszerű (minimalista) alap kezelőfelület ünnepi logókkal, meglepetésekkel :-) Több mint 100 nyelven elérhető, többnyelvű országokban nemzetiségi változatokban is (pl. szlovákiai magyar Google) Nemcsak weblapok között keres, hanem sok más állományban is (pl. pdf, doc, xls, ppt, rtf, txt fájlokban) Újabban: egyéb keresési lehetőségek és kapcsolódó szolgáltatások (lásd lent) 33
Keresés az interneten Keresőrobot: olyan program, amely egy keresőrendszer számára információkat gyűjt a weblapokról, és bizonyos szabályok szerint követi az egyes weboldalakon található linkeket A keresőrobotok működése Felgöngyölítés: a keresőrobot meglátogatja a weboldalt, letölti az ott található adatokat, majd az adatközpont a gyors kereshetőségnek megfelelően feldolgozza a letöltött információt Beindexelés: az oldal helyezésének kialakítása a találati listában (ez több látogatás után alakulhat ki) Kulcsszavak megjelenése, bejövő linkek (Google), weblapok értéke alapján (Érdekes következmény: sok esetben már törölt oldalakra is rá tudunk keresni (még egy ideig), és tartalmukat (esetleg korlátozottan) meg tudjuk nézni) Kiegészítő technikák a háttérben: oldaltérkép létrehozása, régiós központi adatbázisok, stopszavak rögzítése (amikre nem érdemes keresést végrehajtani, nem minden keresőben), redundancia biztosítása (!) (egy adatbázis kiesése esetén ) 34
Keresés az interneten 35
Keresés az interneten 36
Keresés az interneten A keresés egyéb lehetőségei (lásd még: gyakorlat) Digitális archívumok Scholar Médiafájlok Művek címrészletei és szerzők alapján kereshetünk Relevancia (hivatkozások) szerint rendezett a válaszlista A hivatkozó és a hasonló műveket is listáztathatjuk A szerzők hivatkozás-index (Hirsch-index) szerinti értékelésére is lehetőséget nyújt Books 2004-ben indult a szolgáltatás a Google-nél Egyes egyetemek beszkennelt állományát böngészhetjük Volt vita a szerzőkkel Megoldás lehet: nem teljes az elérés Képek A Google 2003-ban vezette be Különösen szerzői jogi kérdéseink esetén hasznos Zenék A Google 2009-ben indította el a szolgáltatást Fő profil: ingyenesen elérhető/letölthető zenék Eredeti terv: üzlet is, lehetőség a számok (fizetős) letöltésére 37
Keresés az interneten A keresés egyéb lehetőségei (folyt.) Kapcsolódó szolgáltatások Térképszolgáltatás A Google-nél 2005 elején indult el Kezdetben csak: USA, Kanada, Egyesült királyság, de már 2005 közepétől kibővítették Műholdas nézet is tartozik hozzá A legfontosabb böngészők támogatják Érdekesség: 2005 végétől a Holdra és a Marsra is kiterjesztették Útvonaltervezés Street view Egyéb (válogatás) Plágiumkeresés Mo-on jelenleg vsz. a legjobb: a Sztaki oldalán Még csak korlátozott lehetőségekkel (2014.10) Az eredményre akár 1-2 napot is várunk kell Fordító Automatikus fordítás is kérhető, folyamatosan javítják Számológép Helymeghatározás Közösségi oldal 38
Keresés az interneten A keresés egyéb lehetőségei Scholar 39
Keresés az interneten A keresés egyéb lehetőségei térképszolgáltatás 40
Cloud felhő szolgáltatások Olyan programokkal, szolgáltatásokkal dolgozunk, amelyek fizikailag tőlünk távol, nem pontosan beazonosítható helyeken találhatók ( felhő ) A szolgáltatások csoportjai Szoftver (pl. Google Docs) Maga a szoftver a szolgáltatás Ezeket az alkalmazásokat általában egy böngészővel lehet elérni Platform (pl. Google App Engine) A környezetet kapjuk szolgáltatásként, terheléselosztással, feladatátvétellel Infrastruktúra (pl. Google Compute Engine) Számítási kapacitást, szervert szolgáltat Tárhely (pl. icloud, Dropbox) Biztonsági mentések (archiválás), szinkronizációs szolgáltatások (tipikus jellemző: nagy redundancia) Az icloud pl. a készülékek (iphone) összes adatát képes tárolni (fotók, zenék, videók, alkalmazások, egyéb fájlok) Hozzáférhetőség szerint Előnyök Hátrányok Publikus (az ügyfeleket izolálni kell), privát (az üzemeltetésről a tulajdonosnak kell gondoskodnia) és hibrid felhő Helyfüggetlen, skálázható (méretezhető), gyors (nagy teljesítmény) Nagy rendelkezésre állás (minimális kiesés), költségkímélő Biztonsági problémák, adatok feletti kontroll elvesztése 41
Cloud felhő szolgáltatások Szolgáltatások, előnyök és hátrányok 42
E-kereskedelem Elektronikus kereskedelem (e-kereskedelem): árucikkek interneten történő eladása, vásárlása, illetve cseréje Webáruház: olyan honlap, amelynek fő profilja bizonyos árucikkek értékesítése Az e-kereskedelem sajátosságai A webáruházakban csak közvetett módon találkozhatunk a termékekkel (kép + valamilyen szintű leírás) Ugyanakkor az emberek szívesebben vesznek olyan termékeket, amiket élőben meg tudnak nézni, érezhetik az anyagát, felpróbálhatják stb. Ezért általában (pl. nálunk is) azokat a termékeket rendelik meg a vásárlók (esetleg) az internetről, ahol az előző szempontok nem lényegesek a vásárlás szempontjából (pl. dvd-k, könyvek, egyszerűbb háztartási cikkek) Fejlettebb internetes kultúrával rendelkező országokban az e-vásárlás más régóta népszerű, nagy a vásárlási fegyelem, nagyobb bizalommal fizetnek az emberek a neten keresztül A vásárlás történhet postai utánvéttel, bankkártyával, készpénzzel és átutalással A szállítás történhet postával vagy futárszolgálattal, de lehetőség van az árut a boltban is átvenni, ha az adott webáruház rendelkezik ilyennel A webáruházak nagy részénél lehetőség van értékelni, véleményt írni a termékekről A vélemények általában vagy nagyon pozitívak, vagy nagyon negatívak :-) 43