INFORMATIKUS SZAKMAI ISMERETEK Informatikai statisztikus és gazdasági tervezı szak részére Dr. Gyurkó György 2011.
Szerzı: Dr. Gyurkó György Lektorálta: Dr. Gubán Ákos
Elıszó Ez a kötet kis különbséggel az informatikai statisztikus és gazdasági tervezı szak által két féléves informatikus szakmai ismeretek, ügyviteli ismeretek tantárgy két félévi (1 és 2. kurzus) tananyagát tartalmazza. A kis különbség abban áll, hogy e kötet mellé járul még egy, az ügyviteli folyamatmenedzsmentrıl szóló munkfüzet is. Elsıként magyarázatot érdemel, hogy a tantárgy nevével ellentétben a kötet címe miért nem tartalmazza az ügyviteli ismeretek tagot. Az ügyviteli ismeretek tartalmának széles körben utánanézve megállapítottam, hogy az azonosítható témák 90%-a a képzési szak tantervében felsorolt más tantárgyak szerves részét képezi. Nevezetesen olyan tantárgyak részét, mint: 1. Számítástechnikai ismeretek alkalmazása 2. Szoftverüzemeltetıi ismeretek 3. Prezentáció és íráskészség 4. Üzleti kommunikáció 5. Üzleti készség és személyiségfejlesztés 6. Irodaszervezés 7. Bevezetés az üzleti idegen nyelvbe 8. Gazdasági informatika alapjai Állításom részletesebb alátámasztására felsorolom az ügyvitel által jellemzıen megkövetelt készségeket és kompetenciákat mellettük zárójelben az azt tárgyaló más tantárgyak fentebb adott sorszámával: ügyiratok kezelése (6), szerzıdések elıkészítése (3,4,7), árajánlatkérés, adás, értékelés (3,4,7), jelentések írása (3,4,7), kapcsolattartás az ügyfelekkel (4,5,7), szakmai rendezvényeken való részvétel (4,5,7), irodatechnikai eszközök használata (1,6), multimédiás eszközök használata (1,6), számítógép kezelése (1,2,6), ügyviteli szoftverek (szövegszerkesztı, táblázatkezelı, adatbáziskezelı, vállalati/hivatali információs rendszer) használata (1,8). Az elıbbi bekezdésben azonosított ügyviteli ismereti témák közül csak a számítógép kezelése, az ügyviteli szoftverek és a szervezeti információs rendszerek használata kapcsolható szorosan az informatikus szakmai ismeretekkel. Mindent, amire ezekbıl a témákból az (1), (2) és (8) tantárgyak keretében tanultakon felül az ügyviteli készségek kialakítása céljából szükség lehet, a tankönyv anyaga anélkül is kielégítıen tartalmazza, hogy egy kitüntetetten ügyviteli ismeretek témájú fejezete lenne. A szerzı tisztában van vele, hogy nem csak a tantárgy neve, de a tankönyvnek ahhoz képest megkurtított címe is elég szerénytelenül hangzik (különösen ha a képzés két féléves idıtartamát is figyelembe vesszük): Az információs technológiák fejlesztéséhez, illetve használatához szükséges szaktudás ugyanis olyan sokszínő és kiterjedt, hogy nem férhet bele egyetlen tantárgyba, és fıleg nem két normál félévbe még akkor sem, ha az információtechnológia egy speciális célú alkalmazását feltételezzük. A realitásokkal számolva a címnek megfelelı témák sokaságából szelektálni kellett. A tankönyv azokra a témákra szorítkozik, amelyek ismeretére egy gazdasági irányultságú, statisztikus elemzınek legközvetlenebbül szüksége lehet.
A tapasztalatok alapján a kötet 1-3. fejezetét az 1. félévi kurzusra célszerő ütemezni. A 2. félévi kurzus anyaga a jegyzet 4. fejezete, valamint egy elkülönítetten mellékelt munkafüzet, amely az ügyviteli folyamatmenedzsmentrıl szól. Budapest, 2011. augusztus 2. A szerzı Az olvasó észrevételeit a következı címre küldheti: gyurko.gyorgy@pszfb.bgf.hu
TARTALOMJEGYZÉK 1. Informatikai alapismeretek... 9 1.1 Bevezetés... 10 1.1.1 Bevezetés a kötet egészéhez... 10 1.1.2 Bevezetés az 1. fejezethez... 10 1.2 Adat, ismeret, információ, kommunikáció... 12 1.2.1 Adat és jelentéstartalom... 12 1.2.2 Ismeret és információ... 14 1.2.3 Adat (közlemény, üzenet) információmennyisége és információtartalma... 16 1.2.4 Kommunikáció... 17 1.2.5 Ellenırzı kérdések az 1.2. alfejezethez... 19 1.3 Információs rendszer... 20 1.3.1 Az információs rendszer (IR) általános értelmezése... 20 1.3.2 A gazdasági szervezetek információs rendszerének sajátosságai... 21 1.3.3 Az adat és az információ minıségi jellemzıi. A hasznos információ... 25 1.3.4 Az IR adatkezelési mőveletei... 29 1.3.5 Ellenırzı kérdések az 1.3. alfejezethez... 31 1.4 Infrastruktúra Számítógéphálózatok... 33 1.4.1 Számítógéphálózat elemei, hálózatok fajtái, hálózati protokollok... 33 1.4.2 A hálózati kommunikáció kapcsán megoldandó fıbb problémák... 35 1.4.3 A hétrétegő ISO/OSI referenciamodell... 36 1.4.4 Ellenırzı kérdések az 1.4. alfejezethez... 40 FELHASZNÁLT ÉS AJÁNLOTT IRODALOM AZ 1. FEJEZETHEZ... 41 2 Adatszervezés, adatelérés, adatbáziskezelı rendszerek... 43 2.1 Bevezetés... 44 2.2 Adatszervezés: elemi adatok, összetett adatszerkezetek... 45 2.2.1 Adatábrázolás a számítógépeken Elemi adattípusok... 45 2.2.2 Összetett adatszerkezetek... 46 2.2.3 Ellenırzı kérdések a 2.2. alfejezethez... 50 2.3 Tárolási szerkezetek... 51 2.3.1 Vektor... 51 2.3.2 Lista... 51 2.3.3 Multilista... 53 2.3.4 Ellenırzı kérdések a 2.3. alfejezethez... 55 2.4 A háttértárakon, valamint az adatforgalomban alkalmazott adategységek... 56 2.4.1 Fizikai adategységek... 56 2.4.2 Logikai adategységek Strukturált adatok... 57 2.4.3 Nem strukturált komplex adatok Multimédia adatok... 58 2.4.4 Ellenırzı kérdések a 2.4. alfejezethez... 58 2.5 Tartalom szerinti adatelérés... 59 2.5.1 Tartalom szerinti adatelérés... 59 2.5.2 Az indexszekvenciális elérés mőködése... 60 2.5.3 Ellenırzı kérdések a 2.5. alfejezethez... 65
2.6 Adatbáziskezelı rendszerek... 66 2.6.1 Az adatbázis fogalma... 66 2.6.2 Az adatbázis szerkezete Adatbáziskoncepciók... 67 2.6.3 OLTP rendszerek adatbázisai és az adattárház... 74 2.6.4 Ellenırzı kérdések a 2.6. alfejezethez... 76 2.7 Adatbázistervezés adatmodellezés... 77 2.7.1 Az adatmodellezés tartalma és szintjei... 77 2.7.2 Az adatmodellezés alapfogalmai... 77 2.7.3 Az egyedtípusok szerkezetének kialakítása Normalizálás... 82 2.7.4 Normalizálás lebontással... 86 2.7.5 Normalizálás szintézissel... 89 2.7.6 Ellenırzı kérdések a 2.7. alfejezethez... 90 FELHASZNÁLT ÉS AJÁNLOTT IRODALOM A 2. FEJEZETHEZ... 92 3. Adatbázis definiálása és kezelése... 93 3.1 Bevezetés... 94 3.2 Tevékenységek és eszközök áttekintése... 95 3.2.1 Adatbázis létrehozásának és mőködtetésének tevékenységei... 95 3.2.2 Az SQL nyelv... 99 3.2.3 Interaktív adatbáziskezelı felületek... 103 3.2.4 Ellenırzı kérdések a 3.2. alfejezethez... 105 3.3 Adatbázis definiálása... 106 3.3.1 Adatbázis definiálása SQL nyelven... 106 3.3.2 Adatbázis definiálása az Access grafikus felületén... 109 3.3.3 Ellenırzı feladatok a 3.3. alfejezethez... 115 3.4 Adatkezelı SQL parancsok... 116 3.4.1 Adatok bevitele, törlése és módosítása SQL-ben... 116 3.4.2 Adatok lekérdezése SQL-ben... 117 3.4.3 Összetettebb feladatok megoldása SQL-ben... 121 3.4.4 Ellenırzı feladatok a 3.4. alfejezethez... 128 3.5 Adatkezelés az Access grafikus felületén... 130 3.5.1 Adatok bevitele, törlése és módosítása a grafikus felületen... 130 3.5.2 Adatok lekérdezése a grafikus felületen... 132 3.5.3 Ellenırzı feladatok a 3.5. alfejezethez... 139 FELHASZNÁLT ÉS AJÁNLOTT IRODALOM A 3. FEJEZETHEZ... 140 4. Információrendszer fejlesztése... 141 4.1 Bevezetés... 142 4.2 Szoftverrendszerek fejlesztésének folyamata és eszközei... 143 4.2.1 A fejlesztési folyamat tevékenységei... 143 4.2.2 Megközelítési módok és módszertanok... 147 4.2.3 Életciklusmodellek... 152 4.2.4 A szoftverfejlesztés eszközei... 157 4.2.5 Ellenırzı kérdések a 4.2. alfejezethez... 159 4.3 Célkitőzés, követelmények... 161 4.3.1 A szoftverfejlesztési projekt céljának meghatározása... 161 4.3.2 Szoftverek minıségi jellemzıi (MSZ ISO/IEC 9126)... 161 4.3.3 Követelményelemzés - követelményspecifikáció... 167 4.3.4 Rendszerszervezési változatok... 171 4.3.5 Ellenırzı kérdések a 4.3. alfejezethez... 172
4.4 Tervezés... 174 4.4.1 A szoftver mint komplex rendszer... 174 4.4.2 Az objektumorientált megközelítési mód... 179 4.4.3 A tervezés termékei... 187 4.4.4 Ellenırzı kérdések a 4.4. alfejezethez... 190 4.5 Modellezési technikák... 192 4.5.1 Az UML modellezési nyelv... 192 4.5.2 Sztereotípusok és megszorítások... 193 4.5.3 Sztatikus modellek... 195 4.5.4 Dinamikus modellek... 203 4.5.5 Csomagok és csomagdiagramok... 222 4.5.6 Ellenırzı kérdések a 4.5. alfejezethez... 225 4.6 Kivitelezés és bevezetés... 228 4.6.1 Kivitelezés, verifikáció és validáció... 228 4.6.2 Programegységek kódolása, tesztelése... 229 4.6.3 Szoftver- és rendszerintegráció, a szoftver és a rendszer validációja... 236 4.6.4 Programozási környezetek... 244 4.6.5 Használatba vétel - A rendszer bevezetésének módjai... 248 4.6.6 Ellenırzı kérdések a 4.6. alfejezethez... 250 FELHASZNÁLT ÉS AJÁNLOTT IRODALOM A 4. FEJEZETHEZ... 251
1. Informatikai alapismeretek 1.1. Bevezetés 1.2. Adat, ismeret, információ, kommunikáció 1.3. Információs rendszer 1.4. Infrastruktúra Számítógéphálózatok
10 INFORMATIKUS SZAKMAI ISMERETEK 1.1 Bevezetés 1.1.1 Bevezetés a kötet egészéhez A tankönyv minden fejezete egy bevezetı résszel indul, mint ez is. Azonban itt az olvasó kivételesen nem csak az 1. fejezet, hanem a teljes kötet bevezetéséül szánt tudnivalókkal is találkozik. Ez az elsı kötet az információs technológiák használatához, illetve fejlesztéséhez szükséges szaktudás olyan témáival foglalkozik, amelyek viszonylag általánosabbak, de ismeretükre egy gazdasági irányultságú, statisztikus elemzınek mégis közvetlenül szüksége lehet. A kötet négy fejezetbıl áll. Közülük az 1. Informatikai alapismeretek fejezet olyan alapfogalmakat ismertet, mint az adat, az információ, a kommunikáció és az információrendszer, de a számítógéphálózatokra vonatkozó ismeretek erejéig kitér az információrendszerek infrastruktúrájára is. A 2. Adatszervezés, adatelérés, adatbáziskezelı rendszerek fejezet elemi adatok számítógépi ábrázolásával, összetett adatszerkezetekkel, az adatszerkezetek reprezentálására alkalmas tárolási szerkezetekkel, valamint az adatbázisok szerkezetével és tervezésével foglalkozik. A 3. Adatbázis definiálása és kezelése fejezet elıbb az adatbázis létrehozásának és mőködtetésének tevékenységeit és eszközeit tekinti át, majd részletesen tárgyalja az adatbázisdefiniálás és az adatkezelés (adataktualizálás és lekérdezés) SQL nyelven, illetve az Access grafikus felületén alkalmazható megoldási módjait. A 4. Információrendszer fejlesztése fejezet egy tömör képet ad a szoftverek, szoftverrendszerek fejlesztésének folyamatáról, tevékenységeirıl, módszereirıl és eszközeirıl; ezzel készítve fel az olvasót, hogy értı és konstruktív partnere legyen a fejlesztıknek a majdani fejlesztési projektekben. 1.1.2 Bevezetés az 1. fejezethez A közbeszéd és a nem informatikai szakirodalom, de a mőkedvelı vagy botcsinálta informatikusok által szerkesztett írásmővek is nagyon pontatlanul bánnak az adat és az információ fogalmakkal, gyakran (helytelenül) szinonímaként használják a két szót. Hasonló hiba, amikor olyan állítások alanyaként is információról beszélnek, amelyekben helyesebb lenne inkább az ismeret szót alkalmazni, merthogy az adott állítás nem csak az információra (leegyszerősítve az új ismeretre, az ismeretek bıvülésére), hanem tágabb körben a már régóta birtokunkban lévı ismeretekre is igaz. Tulajdonképpen az általánosan elterjedt információrendszer kifejezés sem igazán pontos elnevezése annak a rendszernek, amely jelentıs részben korábbról felhalmozódott és megırzött ismereteket használ fel, tehát nem csak információt (új ismeretet). Elsısorban ebben a fogalmi káoszban kíván rendet teremteni az 1.2. alfejezet mindazon fogalmak tisztázásával, amelyek a következı alfejezetben tárgyalt információrendszer értelmezéséhez nélkülözhetetlenek.
INFORMATIKAI ALAPISMERETEK 11 Bár a tananyag érdemi részében az ember által létrehozott szervezetek információrendszereihez kapcsolódó megoldásokat tárgyal, az 1.3. alfejezet arra is kitér, hogy nem csak a társadalmi, de a biológiai szervezetek belsı rendjének fenntartása, mőködıképességük megırzése, hatékonyságuk fokozása, a környezethez való dinamikus alkalmazkodása is a természetben kialakult és az adott biológiai rendszerre jellemzı információrendszeren alapul. Ugyanebben az alfejezetben az olvasó megismerkedhet az adat, az ismeret (és vele az információ) olyan minıségi jellemzıivel, amelyek pontos értelmezése és tudatosítása nélkülözhetetlen az ember által létrehozott információrendszerek fejlesztési célkitőzéseinek megértéséhez, illetve egy konkrét fejlesztési projekt eredményességének megítéléséhez. A társadalmi-gazdasági informáciorendszer infrastruktúráját különféle hardver- és szoftverelemek képezik. Azonban e tantárgy és a kötet egésze dominánsan szoftvermegoldások használatára és fejlesztésére vonatkozó ismereteket tartalmaz. Kivétel az 1.4. alfejezet, amely kitüntetett szerepe és más komplex rendszerek tervezésében is hasznosítható tanulságai miatt a számítógépekbıl felépülı hálózatokkal foglalkozik.
12 INFORMATIKUS SZAKMAI ISMERETEK 1.2 Adat, ismeret, információ, kommunikáció 1.2.1 Adat és jelentéstartalom A mindennapi beszédben gyakran szinonimaként használatosak az adat és az információ szavak, és az esetek többségében mást jelentenek, mint az informatikában (a matematikailag megalapozott információelméletben). Ráadásul még az informatikát alkalmazó szakterületek irodalmában is nagy bizonytalanság figyelhetı meg e szavak értelmezésében. Adat Az adat bármilyen anyagon, bármilyen hatással elıállított egyszerő vagy összetett jel. Az emberek közötti kommunikációban: ember által érzékelhetı vagy alkalmas eszközzel érzékelhetıvé tehetı jel. Ebbe az értelmezésbe belefér a bető, a szöveg, az élıbeszéd, a szám(sor), az ábra, a hang(felvétel), fénykép, film, videofelvétel, elektromos impulzus, de a hóban hagyott lábnyom is. A gazdasági szervezeteknél használatos nevezetes összetett adatok: dokumentum, bizonylat, irat, okirat, üzenet. A szöveg egy rögzített jelkészletbıl vett jelsorozat, azaz egy speciális összetett jel. Egy kép vagy hang felfogható egyetlen komplex jelnek, de számjelsorozattá is alakítható, ahogy azt képek, hangok digitalizálásakor meg is tesszük. Adat jelentéstartalma A jelentéstartalom az adatnak egy feltételezett szabályrendszer (megegyezés vagy tapasztalat) által meghatározott értelmezése. Az írásos adatok a közlés szándékával keletkezett adatok esetében az értelmezés alapja valamilyen megegyezés. Ez lehet olyan közmegegyezés is, ami akkor is alkalmazható, ha a közlı és az értelmezı sohasem találkoztak, nem is egy korban éltek. (Esetleg a megegyezés csak azt a feltételezést jelenti, hogy valamely nyelv szavait, nyelvi szabályait egy közösség azonos módon használja.) A nem közlési szándékkal keletkezett jel értelmezésében az értelmezı tapasztalatai játszanak szerepet, tehát ebben az esetben a jelentéstartalom esetleges és szubjektív, mert az értelmezı tapasztalatainak függvénye. Nem véletlen, hogy az adat definíciója nem kötötte ki, hogy az adat csak valamilyen közlési szándékkal jöhet létre; azaz nem zárta ki az adat fogalmából a nem szándékosan hagyott nyomokat, sem az emberi szándéktól független természeti jelenségeket mint jeleket: Egy nem közlési szándékkal keletkezett jel is hordozhat jelentéstartalmat, azaz az érzékelıje számára származhat belıle új ismeret (más szóval információ lásd késıbb). Dacára a birtokos szerkezetnek, az adat jelentéstartalma nem pusztán az adat sajátja. Az adat csak valamilyen feltételezett értelmezési szabályokkal együtt hordoz egy bizonyos jelentéstartalmat, illetve különbözı értelmezési szabályrendszereket alkalmazva más-más jelentéstartalmat hordozhat. Ez annak ellenére igaz, hogy az összetett adatok nagymértékben képesek utalni az alkalmazandó értelmezési szabályra is; például egy nemzeti nyelvre, azon
INFORMATIKAI ALAPISMERETEK 13 belül valamely szakterület speciális terminológiájára, továbbá az összetett adat közvetlenül is tartalmazhat értelmezési szabályokat. Az elıbbi mondatban vázolt kézenfekvı gondolatmenet azonban semmit sem ér, amikor egy adott nyelv szabályai szerint értelmes szöveg a közlés szándéka szerinti (teljesen más értelmő) szövegnek csupán a rejtjelezett változata. A következı keretezett rész arra példa, hogy a körülmények nagy mértékben befolyásolhatják, hogy az értelmezı milyen értelmezési szabályt fog alkalmazni az adott adatra (a példában egy levélre), és milyen különös helyzetek adódhatnak abból, ha egy közlést a címzettje nem olyan értelmezési szabállyal olvassa, mint amilyen feltételezésével a közlı azt szerkesztette. Levél a kedvesnek [McDermott-2007]: Az alábbi levél az 1920-as években íródott az Egyesült Államokban. Egy fiú elhatározta, hogy hogy ajándékkal lepi meg kedvesét. Szerelmének nıvérével titokban elment egy nagyáruházba, ahol végül egy hosszú, szırmebéléső selyemkesztyőt választottak. A csomagoláskor azonban összekeverték azzal a selyem alsónemővel, amit a nıvér vásárolt magának. A barátnı a következı ajándékkísérıvel kapta meg a neki szánt darabot: Drágaságom! Szeretnélek meglepni ezzel a ruhadarabbal, mert úgy vettem észre, hogy nem szoktál ilyet viselni, amikor esténként találkozunk. Ha a nıvéred nem lett volna velem, a hosszú gombosat választottam volna, de ı is rövidet visel, amit könnyebb levenni. Ez az árnyalat nagyon kényes, de az eladó hölgy megmutatta a sajátját, amit már 3 hete hordott, de még alig volt koszos. Felpróbáltattam vele a tiédet és igazán jól nézett ki benne Bárcsak ott lehetnék Veled, hogy én adjam Rád elsınek, mert gondolom, hogy így más kezek is érinteni fogják, mielıtt még találkozhatnánk. Amikor leveszed, ne felejts el egy kicsit belefújni, mert a viseléstıl természetszerőleg kicsit nedves lesz. Gondolj csak arra, hányszor fogom megcsókolni az elkövetkezı években. Remélem, szombaton is rajtad lesz. Szeretettel: Robert U.i: A legutolsó divat szerint vissza kell hajtani, hogy kilátsszon egy kicsit a szır. Adatot értelmezni egy gép is képes, ha a konstrukciója vagy a beletöltött program éppen valamilyen értelmezési szabályok érvényesítésére lett kitalálva. Azonban a gép csak azt az egy értelmezési szabályt alkalmazza, amit a hardverbe vagy a szoftverbe beleépítettek, vagy a tudásbázisába beletöltöttek 1, ellentétben az emberrel, aki a helyzetfelismeréstıl vagy éppen a pillanatnyi motivációjától függıen változatos szabályokat képes kombinálni. Gépi adatértelmezés: A beszkennelt (digitalizált) papírbizonylat, és az eleve a számítógép képernyıjén kitöltött elektronikus bizonylat a gépi értelmezhetıség szintjében különböznek egymástól. Az elıbbire a gép a képként való megjelenítés vagy a képként való szerkesztés mőveleteket tudja alkalmazni. Az utóbbi esetében viszont a gép az egyes rovatokba (név, dátum, mennyiség, ) írt értékeket is látja, a speciális jelentésüknek megfelelı mőveleteket képes végezni rajtuk, vagy a bizonylatokat képes megkeresni, csoportokba sorolni az ilyen értékek szerint. Adat gépi értelmezésének különbözı szintjei lehetnek. A legalacsonyabb szint, amikor a gép csak annyit tud, hogy az általa ismert mőveletek közül melyek alkalmazhatók a konkrét adatra. Ennél lényegesen magasabb szintő gépi értelmezést tesznek lehetıvé a specifikált adatok. Specifikált adat Olyan adat, amelyhez értelmezési szabályként valamilyen módon a következı négykomponenső specifikációt kapcsolják: az adat meghatározott kategóriába (1) tartozó objektumokra értelmezhetı tulajdonságnak (2) a kategória egy konkrét objektumára (3) vonatkozó értékét (4) jelöli. 1 Egyes mesterséges intelligencia alkalmazások korlátozott tanulási képességekkel is rendelkeznek.
14 INFORMATIKUS SZAKMAI ISMERETEK [Halassy-1965] szerint az adatnak négy dimenziója van: (1) a tárgy, jelenség általában (röviden: kategória); (2) tárgy, jelenség konkrétan (röviden: objektum); (3) tulajdonság (a tulajdonság neve, értékkészlete) és a (4) tulajdonság értéke. Ez a gondolat jelenik meg a specifikált adat fenti definíciójában is. Azonban az idézett szerzıvel ellentétben az említett négy dimenziót nem az adatnak, hanem az adathoz kapcsolt értelmezési szabálynak tulajdonítjuk; továbbá nem minden adatról, csak a számítógéppel (vagy bizonylatokon) nyilvántartott strukturált adatokról állítjuk, hogy ilyen értelmezés tartozik hozzájuk. A specifikált adat értelmezésének négy komponensébıl a kategória és a tulajdonság az adat típusszintő meghatározói, az objektum és az érték pedig elıfordulásszintő meghatározói. A számítógépes rendszerek tervezése az adatfogalmakat általában típusszinten határozza meg, azaz ezt értik az adatfogalmak specifikációján. Általában egy adatra vonatkozó értelmezési szabályt az a körülmény valószínősíti, hogy az adat milyen környezetben milyen más adatokkal együtt fordul elı. A specifikált adatok értelmezése is ilyen mechanizmusra épül, de a specifikáció által az adat és az értelmezése közötti kapcsolat valószínősíthetıbıl határozottá válik. A specifikált adat értelmezésének dimenziói: A "25000 Ft" magában álló adat értelmezése igen bizonytalan, ezzel szemben "az 120CX02 cikkszámú termék ÁFÁ-val növelt ára 25000 Ft" összetett adat kézenfekvıen azt az értelmezést feltételezi, hogy a termék kategóriába tartozó 120CX02 cikkszámmal azonosítható objektum ÁFÁ-val növelt ár tulajdonságának értéke 25000 Ft. A kategóriát a számítógépes adatkezelés során általában az jelöli, hogy az adat milyen bizonylaton (pl. gépjármő forgalmi engedély) vagy képernyıőrlapon vagy az adatbázis melyik táblájában, rekordtípusában szerepel. Tehát a kategória mindig tulajdonságok egy kombinációja (gépkocsi esetén a gépkocsit jellemzı tulajdonságok együttese). A tulajdonságot a számítógépes adatkezelés során egy bizonylat (egy képernyıőrlap) adott rovata vagy a számítógépen tárolt adatrekord adott mezıje vagy egyszerően (az érték elıtt/mellett) a tulajdonság neve jelzi (pl. szín=zöld). A tulajdonság behatárolja a lehetséges értékeinek készletét, valamint az értékein elvégezhetı mőveletek készletét. Egy konkrét objektum legkönnyebben egyik tulajdonságának az azonosító tulajdonságnak az értékével határozható meg (pl. XXX-375 rendszámú gépkocsi). Az, hogy más (nem azonosító) tulajdonság értéke konkrétan melyik objektumra vonatkozik, szintén azzal jelezhetı, hogy mellette az érintett objektum azonosító tulajdonságnak az értékét is feltüntetik. Némely specifikált adat értelmezése egy ötödik dimenzióval is rendelkezik: az idıvel. Másképpen szólva az ilyen adat értelmezési szabályának része egy idıpont vagy egy idıintervallum, amely meghatározza, hogy az adattal jelölt érték az adott objektumnak mely idıpontban történt állapotváltozását vagy mely idıpontban vagy idıszakban fennálló állapotát jellemzi. Az adat idıdimenziója az objektum-dimenzióhoz hasonlóan egy idıpont vagy idıintervallum értékő társadattal jelezhetı. 1.2.2 Ismeret és információ Ismereteinket, tudásunkat vagy saját tapasztalás által, vagy mások közléseibıl, azaz adatokból merítjük. Tehát az adat jelentéstartalma, amennyiben felhasználható (vagy legalább annak vélelmezik), akkor ismeretet (tudást) képez. Az ismeret pedig azért került itt szóba, mert rá alapozva definiáljuk az információ fogalmát.
Információ INFORMATIKAI ALAPISMERETEK 15 Az információ az adat értelmezése által szerzett új ismeret az értelmezı számára megszüntetett bizonytalanság. Megjegyzés: Itt az információra nem informatikai (információelméleti), hanem informatikaalkalmazási meghatározást adtunk. Ugyanis az információ az informatikában alapfogalom, azaz ott nem definiálható, de különbözı állításokban vagy más fogalmak definíciójában felhasznált fogalom 2. Lényeges, hogy ahogy a jelentéstartalom, úgy az információ sem sajátja, annak az adatnak, amelynek az értelmezésébıl keletkezett; hiszen az adaton felül függ a konkrét értelmezıtıl (annak korábban megszerzett ismereteitıl), az értelmezés körülményeitıl. Az információ több okból különbözik a jelentéstartalomtól is: (1) A jelentéstartalom nem képez feltétlenül új ismeretet. Pontosabban az új ismeret minısítés nem is alkalmazható rá, mivel a jelentéstartalom esetében az értelmezésben nem csak egy konkrét értelmezı fél (lehet esetleg egy gép is), hanem a feltételezett értelmezési szabályrendszert ismerık közössége (absztrakt személy) az érintett, az információ pedig egy konkrét személy (vagy szervezet) ismereteinek bıvülését jelenti, ily módon szubjektív kategória. (2) A jelentéstartalom az adat értelmezésének mozzanatához, az információ pedig mint a használható ismeretek bıvülése az adat felhasználásának, a döntési, reagálási képesség megváltozásának a mozzanatához kapcsolódó fogalom. Az információ és az adat közötti különbséget világítsák meg a következı tények: Azonos információt nyerhetünk különbözı jelkészletbıl vett, különbözı hosszúságú jelsorozatból (adatból, közleménybıl). Pl.: I'm so bored with it all. Úgy untat ez az egész. Egy adatból csak bizonyos körülmények között szőrhetı le az információ. Az elıbbi két közlemény értelmezéséhez történetesen tudni kell angolul, illetve magyarul. Máskor meg valamit látni is kell, nemcsak hallani a közlést: Erre való a középsı ujjad. Más körülmények között azonos adatnak (közleménynek) más lehet az információtartalma(!), illetve más az információmennyisége(!). Az itt használt információtartalom és információmennyiség fogalmakat az 1.2.3. szakaszban fogjuk értelmezni. Különbözı személyek (kommunikációban: vevık) számára azonos körülmények között is ugyanannak az adatnak (közleménynek) más az információtartalma, illetve más az információmennyisége. Az adat megismétlésével a közölt információmennyiség nem növekszik. Információt önmagában elıállítani, továbbítani lehetetlenség. Ha a szakirodalomban információ elıállításáról olvasunk, annak ilyen okai lehetnek: Szakszerőtlen fogalmazás: az író az egyik adatból a döntéshozó számára könnyebben értelmezhetı másik adat képzését, származtatását tévesen információ-elıállításnak tekinti. 2 Az olvasó hasonló megoldással találkozhatott a matematikában: az sem definiálja a pontot, az egyenest vagy a síkot, mégis megadja ezek lehetséges relációit. A matematika alkalmazójának a dolga, hogy milyen a matematikában adott relációkat kielégítı objektumot vagy absztrakciót feleltet meg a pontnak, az egyenesnek, a síknak. Itt ugyanúgy jártunk el, mint amikor a matematika alkalmazója azt mondja, hogy a pont egy kiterjedés nélkülinek képzelt (absztrakt) objektum
16 INFORMATIKUS SZAKMAI ISMERETEK Metafora, mellyel a szerzı arra utal, hogy a tényleges adatfeldolgozó mővelet által elıállított adat helyett annak jelentéstartalmára és lehetséges felhasználására teszi a hangsúlyt. Metafora, mellyel a szerzı a számítógépes adatfeldolgozás kapcsán arra utal, hogy egy adat még egy gép számára is jelenthet információt, amennyiben a gép az adat hatására (programozott) döntést hoz, automatikusan változtat a mőködésén. Ez lehet a külvilág számára is azonnal érzékelhetı reagálás, vagy a számítógépes rendszer egy olyan belsı állapotváltozása (az adatbázis tartalmának olyan változása), ami által a rendszer egy késıbbi idıpontban másképpen fog reagálni, mint ahogy az adat hiányában tette volna. Mivel az információrendszerek nem csak új ismereteket, hanem régóta birtokolt ismereteket is kezelnek, használnak, esetükben információkezelés helyett helyesebb volna ismeretkezelésrıl beszélni. Összefoglalva: Az adat magában sem jelentéstartalommal, sem információval nem bír. A jelentéstartalom az adatra vonatkozó valamilyen értelmezési szabályokat feltételez, és az adat ilyen szabályok szerinti értelmezése vezet a jelentéstartalomhoz. A jelentéstartalom csak akkor szolgál információval az értelmezı számára, ha azzal ı új ismeret birtokába került. 1.2.3 Adat (közlemény, üzenet) információmennyisége és információtartalma A címben szereplı információtartalom és információmennyiség kifejezések nem azonos fogalmakat jelölnek. Egy adatnak, közlésnek annyiféle információtartalma lehet, ahány különbözı kérdésre képes választ adni. Az információmennyiség fogalomról pedig egyelıre annyit jegyezzünk meg, hogy többféle információtartalommal rendelkezı közlésnek az egyes tartalmak szerint is különbözı lehet az információmennyisége. Azonos adat a különbözı értelmezık számára különbözı információtartalom miatt lehet érdekes: A címzett számára a levél az írójának gondolataira, a közölt tényekre vonatkozó információtartalmat hordoz; egy grafológus számára viszont, ha a levelet kézzel írták, az író jellemére vonatkozó információtartalommal is bír. Azonos adatnak azonos értelmezı számára is többféle különbözı információtartalma lehet: Ezt szemléltesse a következı grafiti. Békés álomba szenderülve szeretnék meghalni, mint a nagyapám. Nem a félelemtıl üvöltve, mint az utasai. Kevés bárgyúbb dolog van, mint megmagyarázni, hogy egy szövegben mi a poén. Ezúttal mégis nézze el nekem az olvasó, hogy utalok rá, milyen információtartalmakkal bír a fenti idézet (a teljesség igénye nélkül): Békés álomba szenderülve szeretnék meghalni. (Az egyik) nagyapám békés álomba szenderülve halt meg. Ez a nagyapám egy utasszállító jármő vezetése közben halt meg. A szóban forgó jármővön utasok is tartózkodtak. İk a félelemtıl üvöltve haltak meg. Az információmennyiség fogalmát elıbb csak intuitíven próbáljuk megközelíteni, az exakt értelmezésére néhány bevezetı példa után kerítünk sort. Azonos adat különbözı információmennyiség [Ashby-1972]: Két katona fogságba esik két különbözı A és B ellenséges országban, és késıbb mindkettıjük felesége ezt a rövid üzenetet kapja: "Jól vagyok". Azonban ismeretes, hogy az A országban egy fogoly a következı üzenetek valamelyikét küldheti: Jól vagyok. Múló betegségben szenvedek. Komolyan beteg vagyok.
INFORMATIKAI ALAPISMERETEK 17 Ugyanekkor a B ország csak a Jól vagyok üzenet küldését engedélyezi. (Mindkét sorozathoz hozzátartozik a "nincs üzenet" elem is.) Azonos-e az üzenetek információmennyisége a két feleség számára? Megoldás: Az a feleség, aki B-bıl kapta a "Jól vagyok" üzenetet, csak abban lehet biztos, hogy férje életben van; aki A-ból kapta ugyanezt az üzenetet, még azt is tudja, hogy férje tényleg jól van: az azonos üzenet számára nagyobb információmennyiséget tartalmaz, másképpen: több bizonytalanságot szüntet meg. A fogságból üzenı katonák példájában megmutatkozik az információ két sajátossága: (1) Értelmezhetı egy mérhetı (számítható) információmennyiség. (2) Ha egy üzenet (egy adat) információmennyiségét mérni akarjuk, figyelmünket az egyedi üzenetrıl az üzenetlehetıségek sokaságára és az üzenet értelmezıjére kell fordítanunk. Ahogyan pl. a hosszúságnak is többféle mértékegysége lehet (méter, láb, inch), úgy az információmennyiségnek is többféle mértékegysége létezhetne, de csak egy terjedt el általánosan, a bit. Információmennyiség bitben mérve: Ha egy adat egy p valószínőségő kimenetel bekövetkezésérıl értesít, akkor az információmennyisége: H = log 2 p bit. (Shannon képlet) A p valószínőség 0 és 1 között mértéket jelent. Ha összesen két üzenet lehetséges, mindkettı azonos eséllyel, akkor egy üzenet valószínősége ½. Tehát egy ilyen üzenet érkezése esetén a kapott információ mennyisége éppen 1 bit. Ugyanis -log 2 (1/2) = log 2 2 = 1. Még egy speciális eset: Ha a lehetséges üzenetek száma k, és mindegyik azonos valószínőséggel fordulhat elı, akkor e sokaságból való üzenet információmennyisége: H = log 2 k bit. Az információmennyiség egy hibás értelmezése: A szakirodalomban is találkozhatunk olyan állítással, hogy "a négybetős magyar szavak információmennyisége 20,52 bit". Ez bizony pongyola megfogalmazás, hiszen az adat magában nem határozza meg az információmennyiséget. Az állítás a következı pontosítással értelmessé tehetı: A négybetős magyar szavak információmennyisége legfeljebb 20,52 bit. Az ilyen becsléseknek az a gyakorlati jelentısége, hogy az adattípus bitben kifejezett információmennyiségének felsı korlátja egyben korlátja a tárolásához szükséges jelsorozat (bitsorozat) hosszának is. Az adat és az információ nem csak mennyiségi, hanem minıségi jellemzıkkel is bírnak. Ezeket az 1.3.3 szakasz tárgyalja speciálisan a gazdasági szervezetek információs rendszere nézıpontjából. 1.2.4 Kommunikáció Az információs rendszer fogalmát elıkészítı úton nem kerülhetı ki a kommunikáció fogalma. A kommunikáció annak eszköze, hogy az adatot ne csak akkor és ne csak ott használhassuk fel, amikor és ahol az keletkezett; hogy az ismereteket megoszthassuk egymással. Kommunikáció: Azt a folyamatot, amely során az információt hordozó hír (közlés szándékával keletkezett adat) eljut az adótól (közlıtıl, forrástól) a vevıhöz (címzetthez), kommunikációnak nevezzük.
18 INFORMATIKUS SZAKMAI ISMERETEK A kommunikáció elemei: az adatforrás vagy másképpen az adó; az adat (az üzenet) hordozására, továbbítására alkalmas anyag, közeg, amit csatornának szokás nevezni; a vevı az üzenet címzettje, aki / ami fogadja, értelmezi 3 az üzenetet; a kódolási eljárás, ami az adó által közölt adatot (üzenetet) a csatorna anyagában (közegében) ábrázolt jellé (jelsorozattá) alakítja át; a dekódolási eljárás, amely a csatorna anyagában (közegében) hordozott jelsorozatot a vevı által értelmezhetı adattá alakítja át. Az elıbbiekben említett csatornát tágan kell értelmezni, nemcsak fizikai adatátviteli vonalakat, hírközlési eszközöket, hanem a közvetítı közeg magasabb szintjeit, pl. a beszélt nyelvet, a társasági érintkezés különbözı formáit, is jelenti. A hírközlési hálózatok (a jel véges terjedési sebességébıl eredı idıigényt leszámítva) térbeli csatornák. Történelmi események köveken, érméken, fóliánsokon, papíron, hangfelvételen, filmen, mágneslemezen stb. megörökítése idıbeli csatornának tekinthetı. (A papírra vetett, filmre vett vagy mágneslemezen rögzített adat számla, levél, mőalkotás stb. önmagában idıbeli csatorna, de az azt mozgató, kézbesítı szervezet vagy technika már térbeli csatorna.) A fizikai csatornák anyagában (közegében) történı változások a hordozott üzenet torzulását, a jelsorozat részben vagy egészben való elvesztését okozhatják. A kommunikáció magasabb szintjén egy emberi közösség tagjai közötti párbeszédben hasonló zavaró körülmény a közlésre alkalmatlan szituáció, a pontatlan fogalmazás, az elfogultság, a hamísítás vagy éppen a paranoid mértékő bizalmatlanság. Mindezeket a jelenségeket a csatorna zajának nevezik. A csatornát érintı zajhatások mérséklésére (a csatorna kikapcsolásának esetétıl eltekintve 4 ) a redundancia különbözı változatait alkalmazzák. Redundancia: A redundancia az adat többszörözése, megismétlése vagy az adathoz a közlési szándékkal össze nem függı (a közlési szándék tekintetében felesleges) másik adat hozzákapcsolása. Tehát a redundancia eseteinek számítanak a következı megoldások: több kommunikációs csatornát használunk; több közlési alkalommal élünk; az adathoz (üzenethez) plusz elemeket kapcsolunk, amik lehetıvé teszik a jelvesztés és jelmutáció érzékelését, a hitelesség megállapítását, esetleg az eredeti üzenet visszaállítását. A redundancia az informatikában nemcsak a kommunikációval kapcsolatban jut szerephez; célszerően alkalmazott változatai többféle elınnyel járhatnak, más elıfordulásai viszont kifejezetten hátrányosak lehetnek. A redundancia elınyös alkalmazásai: a zajhatások elleni védekezés: hibafelismerés, hibajavítás (amirıl éppen itt esett szó); az adat érthetıségének javítása az értelmezési szabály azonosítását megkönnyítı más adat hozzákapcsolásával (lásd az 1.2.1 és az 1.3.3 szakaszban); 3 Tulajdonképpen az értelmezés is dekódolás, mert lényegében egy adat átalakítása egy másik adattá; de a dekódolásnak / értelmezésnek nyilvánvalóan különbözı szintjei egy elektromos jelsorozat átalakítása szöveggé, illetve egy szöveg átalakítása az értelmezı személy képzeletében megjelenı képekké, gondolatokká. 4 Ha a zajhatások jelentkezése idıben behatárolható, bizony az is megfontolandó megoldás, hogy arra az idıtartamra a csatornát kikapcsolják. Gondoljon a Csupasz pisztoly effektusokra (ha látta a filmet).
INFORMATIKAI ALAPISMERETEK 19 az adathoz a hitelességének megállapítását lehetıvé tevı másik adat hozzákapcsolása, ami részben átfed a zajhatás elleni védekezéssel is (lásd az 1.3.3 szakaszban); az adat térbeli, idıbeli elérthetıségének javítása az adat több csatornán elérhetıvé tételével, az elérési idıt (válaszidıt) csökkentı más adatok hozzákapcsolásával (lásd a 2.5. alfejezetben az indextáblákat vagy a 2.6. alfejezetben az aggregált adatok letárolását); összefüggések kifejezése az adatkapcsolatokat hordozó redundancia alkalmazásával (lásd a 2.6. alfejezetben az idegen kulcsokat, illetve a mutatókat); (és derültség keltése, mint a következı hidetés esetében: Padlófényezést vállalok. Házhoz megyek. ) A redundancia hátrányos elıfordulásai: a nem célszerő redundancia, a vevı (a címzett, a hallgatóság) felesleges közlésekkel, lényegtelen részletekkel való túlterhelése maga is zajnak számít; az aktualizálási (karbantartási) mőveleteknek intenzíven kitett tranzakciókezelı adatbázisok esetében a redundancia rontja a tranzakciófeldolgozás teljesítményét, és fokozza az inkonzisztens (ellentmondásos) adatbázistartalom kialakulásának esélyét (lásd a 2.6. alfejezetben). 1.2.5 Ellenırzı kérdések az 1.2 alfejezethez 1. Mi a különbség az adat, a jelentéstartalom, az információ és az ismeret között? 2. Adjon példákat arra, hogy különbözı adatokból származhat azonos információ! 3. Adjon példákat arra, hogy az adat magában nem határozza meg egyértelmően a belıle nyerhetı jelentéstartalmat és az információt! 4. Mi a különbség az információmennyiség és az információtartalom között? Világítsa meg példával! 5. Mennyi az információmennyisége annak közlésnek, hogy egy pénzérmével történt dobás eredménye fej? 6. Információelméleti szempontból hogyan pontosítaná a következı állítást? A négybetős magyar szavak információmennyisége 20,52 bit. 7. Azonosítsa a specifikált adat dimenzióit a következı mondatban! A 466 számú fıkönyvi számla neve»elızetesen felszámított ÁFA«8. Milyen összetevıi vannak a kommunikációnak? 9. Értelmezze a térbeli és az idıbeli (kommunikációs) csatornát! 10. Milyen elınyös alkalmazásai lehetnek a redundanciának? 11. Milyen hátrányos elıfordulásai lehetnek a redundanciának?
20 INFORMATIKUS SZAKMAI ISMERETEK 1.3 Információs rendszer 1.3.1 Az információs rendszer (IR) általános értelmezése A különféle (biológiai, társadalmi) szervezetek akármennyi anyagot, energiát emésztenének is el, képtelenek lennének belsı rendjük fenntartására, sıt fejlesztésére, ha a környezetük és a maguk belsı állapotáról nem szerezhetnének és nem használnának fel újabb és újabb ismereteket, azaz információt; ha a részeik mőködését nem hangolná össze valamilyen fizikai (kémiai) elven mőködı belsı kommunikációs hálózat. Biológusok, genetikusok szerint az élet nem más, mint információ(rendszer). A szervezetek belsı rendjének fenntartása, mőködıképességük megırzése, hatékonyságuk fokozása a környezethez való dinamikus alkalmazkodást igényli. Ennek az alkalmazkodásnak nélkülözhetetlen feltétele a szervezet információs rendszere (továbbiakban IR) Információs rendszer: Az információs rendszer alatt a következı jellemzıkkel bíró rendszert értünk: a környezet és a saját állapotváltozásait érzékelni, észlelni képes; az érzékelt, észlelt jeleket (adatokat) a belsı (térbeli) kommunikációs hálózatán keresztül továbbítja a szervezet alkotóelemei között; a hosszabb távú alkalmazkodás céljából idıbeli csatornával is rendelkezik: adatokat, mőködési szabályokat rögzít, tárol; az érzékelt jelek (adatok) és mőködési szabályok felhasználásával (azoktól befolyásoltan) reagál az állapotváltozásokra, alkalmazkodik az elıállt állapothoz. Az IR nem feltétlenül öntanuló rendszer, de ha mégis, akkor az azt jelenti, hogy képes felülírni (módosítani) a saját mőködési szabályait. Az IR funkciói természetesen eltérı realizációval bírnak élılények, illetve gazdasági szervezet esetén. Errıl szól a következı táblázat. IR funkció Állat vagy az ember esetén Érzékelés, észlelés Érzékszervi funkciók Mérés, adatgyőjtés Gazdasági szervezet esetén Térbeli csatorna Idegrendszeri funkciók Tárgyalás, levél, adatközlı hálózat (kábel, rádióhullám) Idıbeli csatorna Reagálás Ösztön, feltételes reflex, emlékezet Érzékelt jeleken, valamint ösztönös vagy racionális szabályok szerinti döntésen alapuló állapotváltoztatás, cselekvés Nyilvántartott (tárolt) adatok, dokumentumok. Irattár, adatbázis, adattárház, Jogszabályokon, szabványokon; szervezeti célokon, szabályokon, tudáson; a problémára vonatkozó adatokon; emberi vagy automatizált döntésen alapuló szervezeti cselekvés 1.1. táblázat: Az IR funkcióinak megvalósítása élılény és gazdasági szervezet esetén