1.BEVEZETÉS. Subecz Zoltán 1. Információkinyerés természetes nyelvű szövegekből

Méret: px
Mutatás kezdődik a ... oldaltól:

Download "1.BEVEZETÉS. Subecz Zoltán 1. Információkinyerés természetes nyelvű szövegekből"

Átírás

1 Szolnoki Tudományos Közlemények XV. Szolnok, Subecz Zoltán 1 Információkinyerés természetes nyelvű szövegekből STOPSZÓ SZŰRÉS, LEMMATIZÁLÁS HATÁSA ÉS OSZTÁLYOZÁS A VEKTORTÉR MODELLEL A természetes nyelvi feldolgozás egy új interdiszciplináris terület. Ennek a területnek a célja a számítógép segítségül hívása olyan feladatokban, mint a természetes szövegek feldolgozása, az ember-gép közötti kommunikáció elősegítése és egyéb szöveg feldolgozási feladatok. Az Interneten több millió természetes nyelven írt oldal található, amelyek nincsenek feldolgozva. Enne az új kutatási területnek az egyik célja olyan programozási módszerek kidolgozása, amelyek segítségével ezen oldalak szövegéből minél több információ kinyerhető és táblázatokba, adatbázisokba lementhető. A táblázatokból és adatbázisokból a ez az információ a későbbiekben már könynyen lekérdezhető. Jelen publikációban bemutatom a stopszó szűrést és a lemmatizálást és ezek hatását a Vektortér modellre, valamint a szövegek osztályozását a Vektortér modell segítségével. THE EFFECT OF THE STOPWORD FILTERING AND LEMMATIZATION TO THE VECTORSPACE MODEL AND ITS USAGE IN A CLASSIFICATION TASK The natural language processing is a new interdisciplinary field. The goal of this new field is to get computers to perform useful tasks involving human language, tasks like enabling human-machine communication, improving human-human communication, or simply doing useful processing of text or speech. What distinguishes language processing applications from other data processing systems is their use of knowledge of language. The natural language processing uses some formal models or theories. These models and theories are all drawn from the standard toolkits of computer science, mathematics, and linguistics. Among these models is the Vectorspace model. In a classification task, we are given some observations and our job is to determine which of a set of classes a document belongs to. In this article, I rewieved the effect of the stopword filtering and lemmatization to the Vectorspace model and I created a program for text classification and I tested it in a multi-thousand document environment. [1] 1.BEVEZETÉS Kutatási témám: Információkinyerés természetes nyelvű szövegekből. Előző és jelen publikációban is az Interneten megtalálható Ingatlanközvetítői hirdetések természetes nyelvű szövegein vizsgáltam meg az információkinyerés adott módszereit. 1 Szolnoki Főiskola, Gazdaságelemzési és Módszertani Tanszék, főiskolai tanársegéd, subecz@szolf.hu A cikket lektorálta: Madaras Lászlóné Dr., Szolnoki Főiskola, főiskolai tanár, PhD.

2 Előző publikációmban áttekintettem a szöveg-feldolgozási lépéseket a Vektortér modellig. [3] Ebben a publikációban bemutatom a stopszó szűrést és a lemmatizálást és ezek hatását a Vektortér modellre, valamint a szövegek osztályozását a Vektortér modell segítségével. A megvalósítás során a következő lépéseket végeztem el: Stopszó szűrés vizsgálata Lemmatizálás vizsgálata Osztályozás a Vektortér modellel A stopszó szűrés és a lemmatizálás hatása az osztályozás eredményére Ezekhez a feladatokhoz Java programozási nyelven írtam programokat. A kutatási anyag a következő weboldalon megtalálható: Ez tartalmazza az alábbiakat: Java nyelven írt forrásprogramok, a programok kimeneti és bemeneti fájljai, a programok részletes leírásai Az információkinyerés és szövegbányászat Az információkinyerés (IE, Information Extraction) technológiájának kutatása dinamikusan fejlődő terület a természetesnyelv-feldolgozásban. Az interneten megjelenő hatalmas információtömeg gépi feldolgozása és a kívánt információ tömör formában történő összegyűjtése napi szükséglet, amelyre a gazdaság, a tudomány, a politika területén is van igény. Míg az információ visszakeresés (IR, Information Retrieval), amely a webes kereső programok jellemző tevékenysége, arra irányul, hogy a felhasználó igényeinek megfelelő dokumentumokat változatlan formában bocsássa rendelkezésre, addig az információkinyerés célja a megtalált dokumentumokban a lényeges információ megjelölése, majd összegyűjtése. Az utóbbi években az informatika egyik leggyorsabban fejlődő részterülete az adatbányászat lett. Ez az új tudományág szolgál a nagy mennyiségű adatokban rejlő információk automatikus feltárására mesterséges intelligencia algoritmusok alkalmazásával (például neurális hálók, szabálygenerálók, asszociációs modellek). Az adatbányászat egyik igen fontos részterülete a szövegbányászat, amely a strukturálatlan (vagy részben strukturált), elektronikus szöveges állományokban megbúvó, nem triviális információk kinyerését jelenti. Az új alkalmazási lehetőségek közül a web-bányászat az egyik legígéretesebb, mivel a világ legnagyobb és leggyorsabban bővülő adattárát, az internetet használja. A web-bányászat célja, hogy az internethez kapcsolható dokumentumokból (honlapok, ek, blogok, fórumok stb.) hasznos információkat automatikus összegyűjtsön. Ilyen feladat lehet például állásajánlatok automatikus összegyűjtése vállalati honlapokról, vagy újsághírekben egy vállalkozásról fellelhető információk kinyerése. Az így nyert információ strukturált szerkezetű (mezőértékekből áll), azaz például betölthető egy adatbázisba A Java programozási nyelv A szövegbányászati feladatokra programokat kell írni valamilyen programozási nyelven. Ehhez a feladathoz a Java programozási nyelvet választott am, mert a Számítógépes Nyelvészet alkalmazásainak nagy része ezen a nyelven íródott. Így a modulok jól illeszthetők egymáshoz. 2

3 A Java általános célú, objektumorientált programozási nyelv, amelyet a Sun Microsystems fejleszt a 90-es évek elejétől kezdve napjainkig. A Java nyelv szintaxisát főleg a C és a C++ nyelvektől örökölte, viszont a Java sokkal egyszerűbb objektummodellel rendelkezik, mint a C A VEKTORTÉR MODELL A szövegbányászatban a tartalmak tömör reprezentációjára a vektortér modell (VTM) nyújtja a legszélesebb körben használt megoldást. A modell minden egyes dokumentumot egy vektorral ír le, amelyben minden elem az egyes termek (általában szavak) előfordulását jelenti. Termek alatt a reprezentáció egységeit, alapesetben az írásjelek által határolt szavakat (unigram) értjük. Adva van egy dokumentumgyűjtemény, amelynek elemein valamilyen rendszerezési műveletet kívánunk végrehajtani. Ehhez olyan modellt kell felépítenünk, amiben a dokumentumok távolságát, vagy hasonlóságát egyszerűen meg tudjuk határozni. Intuitív módon nyilván azok a dokumentumok hasonlítanak egymásra, amelyeknek a szókészlete átfedi egymást, és a hasonlóság mértéke az átfedéssel arányos. Ezt a megfigyelést használja fel az információvisszakeresésben (information retrieval IR) széles körben használt vektortér modell. A vektortér modellben a D={d 1,,d N } dokumentumgyűjteményt a szó-dokumentum mátrixszal (term-document mátrix) reprezentáljuk (D Є R MxN ), ahol a mátrix d ki eleme a k-adik szó(t k ) relevanciáját reprezentálja az i-edik dokumentumban, d i -ben. A d i dokumentumot reprezentáló dokumentumvektort d i =<d 1i,,d Mi >- vel jelöljük. A D mátrixban a sorok száma, M megegyezik az egyedi szavak számával. N pedig a dokumentumok száma. D = d 11 d 12 d 1N d 21 d 22 d 2N d M1 d M2 d MN (1) A dokumentumvektorok tehát a mátrix oszlopai lesznek. A mátrix egy sora azon pozíciókban tartalmaz nullától különböző értéket, amelyekhez tartozó dokumentumokban a szó nem nulla relevanciájú. Ez általában ekvivalens azzal, hogy a szó nem szerepel a dokumentumban, de ettől eltérő esetekben is lehet a relevancia nulla. Az egyedi szavak összességét szótárnak, vagy lexikonnak nevezzük, jelölése: T. A szótár mérete tehát T =M. Mivel általában egy dokumentumban a szótár szavainak csak egy kis töredéke fordul elő, ezért a D mátrix ritka. Ugyanakkor az egyedi szavak száma rendkívül nagy lehet, akár a milliós nagyságrendet is elérheti. 3. BEVEZETŐ LÉPÉSEK A stopszó szűrés és a lemmatizálás vizsgálatához 1000 ingatlanközvetítői oldalt töltöttem le az Internetről. Az 1000 dokumentumhoz elkészítettem a Vektortér mátrixot a következő lépések segítségével. (A lépéshez Java nyelven írtam programokat. Azok részletes leírása megtalálható az előző publikációban [3]) HTML oldalakról szöveg kivétele 3

4 A jelen kutatás szempontjából csak az oldalakon lévő természetes nyelvi szövegek az érdekesek. Azokból kell az információt kigyűjteni. Egy hirdetési oldalon a hirdetési szövegen kívül sok egyéb adat, található. Szövegek szavakra bontása A hirdetési szövegekből kigyűjti a szövegben található szavakat egy másik szövegfájlba egymás alá. Átalakítás - Fölösleges karakterek kiszűrése - Szövegek kisbetűssé alakítása Fájlok egymáshoz fűzése (egyutt.txt) fájl szavait összefűzi 1 szöveges fájllá szót tartalmaz a fájl Ez a fájl tartalmazza az 1000 dokumentum minden szavát. Statisztika az előző összefűzött fájlról (4 darab szövegfájl) - Minden szó kigyűjtése, de minden szót csak egyszer. Vannak szavak, amelyek sokszor előfordulnak az 1000 dokumentumban - Minden szó mellé kiírtam, hogy hányszor fordul elő a dokumentumokban összesen. - Készítettem egy olyan szövegfájlt is, amelyikben az előző az előfordulások szerint csökkenően van kigyűjtve. Így a listában előre kerültek a gyakori szavak. Szavak rendezése, egyediek megtartása (rendezett.txt) szó Így abc sorrendbe megkapjuk az 1000 dokumentum egyedi szavait. A Vektortér mátrix elkészítése a feldolgozás során elkészített dokumentumok alapján. 4. STOPSZÓ SZŰRÉS A szövegbányászati feladatok többségénél a gyakran előforduló, tartalmi információt egyáltalán nem tartalmazó, megkülönböztető képesség nélküli un. stop szavakat már a szavakra bontás után elhagyják. A szótárból való elhagyásukkal csökkenthető a szó-dokumentum mátrix bejegyzéseinek a száma. [2] 4.1 A stopszó szűrés bemutatása a saját 1000 dokumentumból álló korpuszon Az előző fejezetben készítettem egy olyan statisztikai fájlt, amiben kiírattam, hogy az egyes szavak hányszor szerepeltek. (Darabszám szerint csökkenően) Ebből az első 50 szó: a: db az: 3730 db és: 3405 db egy: 2005 db es: 1736 db is: 1708 db ház: 1539 db található: 1398 db van: 1156 db lakás: 850 db 2: 811 db nm: 802 db családi: 734 db ingatlan: 726 db épült: 625 db két: 606 db m2: 603 db eladó: 601 db konyha: 570 db 3: 566 db szoba: 550 db fürdőszoba: 543 db nappali: 509 db csendes: 453 db jó: 448 db külön: 412 db ben: 408 db nagy: 396 db garázs: 390 db épület: 359 db telken: 352 db de: 347 db valamint: 339 db perc: 337 db minden: 328 db el: 324 db 1: 319 db wc: 317 db 5: 309 db szinten: 297 db szobás: 290 db tartozik: 290 db m: 287 db megközelíthető: 275 db 4: 274 db belső: 271 db még: 268 db 10: 264 db étkező: 261 db alkalmas: 258 db 1. táblázat. A leggyakoribb szavak 4

5 Azoknak a szavaknak, amelyek sokszor szerepelnek (pl. névelők) kevés a jelentősége. Ezért ezeket kihagyhatjuk a vektortér modellből. Olyan szavakat érdemes csak kihagyni a vektortér modellből, amelyek nem hordoznak információt a későbbi feldolgozáshoz. Igaz, hogy a ház szó sok dokumentumban szerepel (ház: 1539 db), de majd egy olyan osztályozási feladatban, ahol pl. két csoportra kell kigyűjteni a családi házakat és a lakásokat, akkor a ház szónak lesz jelentősége Így látjuk, hogy a stopszavak kiválasztása nem egyszerű feladat. A kiválasztás gyakran az adott feladattól függ: - pl. az épült: 625 db szó nem hordoz önmagában sok információt - De ha azokat a hirdetéseket keresem, amelyek tartalmazzák, hogy mikor épült az épület, akkor már megnő a jelentősége. Így van olyan feladat ahol csak néhány szó hagyható el, de van ahol akár több száz, vagy több ezer is. A leggyakoribb 50 szóból a pirossal jelzettek általában elhagyhatóak. Az osztályozásnál majd megvizsgáljuk a Stopszó szűrés hatását. A Szegedi Tudományegyetem Mesterséges Intelligencia Kutatócsoportja a következő szavakat használja a Stopszó szűréshez: (stopword.txt: 219 db szó) a abban ahhoz ahogy ahol aki akik akkor akár alatt amely amelyek amelyekben amelyeket amelyet amelynek ami amikor amit amolyan amíg annak arra arról az azok azon azonban azt aztán azután azzal azért be belül benne bár cikk cikkek cikkeket csak de e ebben eddig egy egyes egyetlen egyik egyre egyéb egész ehhez ekkor el ellen elő először előtt első elég előtt emilyen ennek erre ez ezek ezen ezt ezzel ezért fel felé ha hanem hiszen hogy hogyan hát ide igen ill ill. illetve ilyen ilyenkor inkább is ismét ison itt jobban jó jól kell kellett keressünk keresztül ki kívül között közül le legalább legyen lehet lehetett lenne lenni lesz lett ma maga magát majd meg mellett mely melyek mert mi miatt mikor milyen minden mindenki mindent mindig mint mintha mit mivel miért mondta most már más másik még míg nagy nagyobb nagyon ne nekem neki nem nincs néha néhány nélkül o oda ők őket olyan ott pedig persze például rá s saját sem semmi sok sokat sokkal stb. szemben szerint szinte számára szét talán te tehát teljes ti tovább továbbá több túl ugyanis utolsó után utána vagy vagyis vagyok valaki valami valamint való van vannak vele vissza viszont volna volt voltak voltam voltunk által általában át én éppen és így ön össze úgy új újabb újra ő őket 2. táblázat Stop szavak gyűjteménye 5

6 A további feladatokban én is ezt a szógyűjteményt fogom használni. 5. LEMMATIZÁLÁS A legtöbb nyelvben a szavaknak vannak toldalékolt vagy módosított alakjai is. Ez különösen jellemző a magyar nyelvre. A vektortér-modell kialakításánál kézenfekvő ötlet, hogy az azonos szavaknak a különböző szóalakú előfordulásait közös kanonikus alakba vonjuk össze, és összesítve reprezentáljuk. Ezzel ugyan a szóalakra vonatkozó információt elveszítjük, de a vektortér modell méretét jelentősen csökkenthetjük. [2] 5.2 A lemmatizálás bemutatása a saját 1000 dokumentumból álló korpuszon A 3. fejezetben készítettem egy olyan statisztikai fájlt, amiben kiírattam az egyedi szavakat abc sorrendben. A következő szavak kezdődtek a ház szótővel: ház háza házacskával házak házakat házakból házakhoz házakkal házaktól házas házasok házasoknak házaspár házat házba házban házból házhoz házi háziasszony háziasszonynak háziasszonyok házigazda házikertben házikó házikót házimozi háziállatok házként házközponti házmesterlakást háznak háznyira háznál házon házra házrésszé házrész házrészhez házrésznek házrészt házról háztartás háztartáshelyiség háztartási háztetők háztól háztömb házukat házvezetőnőnek házzal házzá házát házé 3. táblázat. A ház szótővel kezdődő szavak A szavak lemmájának megtalálása sem mindig egyértelmű feladat. A pirossal bejelölt szavak lemmája lehet a ház szó. A Szegedi Tudományegyetem Mesterséges Intelligencia Kutatócsoportja is használ lemmatizálásra egy fájlt (corpus.lex) mérete: 4,6 MB, Sorainak száma: Ebben a fájlban a következő szavakhoz rendeli a ház lemmát: ház háza házai házaiba házaiban házaiból házait házak házakat házakban házakból házakhoz házakkal házaknak házam házamat házat házba házban házból házhoz háznak háznál házon házra házról háztól házuk házukat házukba házukból házukhoz házunk házunkat házunkba házunkban házunktól házzal házába házában házából házán házának házát házától házával 4. táblázat. A ház lemmához tartozó szavak A további feladatokban én is ezt a fájlt fogom használni lemmatizálásra. 6

7 6. STOPSZÓ SZŰRÉS HATÁSA A VEKTORTÉR MÁTRIXRA A következőkben megvizsgáltam a stopszó szűrés hatását a Vektortér mátrixra. A rendezett.txt fájlból azokat másoltam át a stopszavaknelkul.txt fájlba, amelyek nem szerepeltek a stopword.txt fájlban. A vizsgálat eredménye: Stopszavak száma: 219 (stopword.txt) Beolvasott sorok száma: (rendezett.txt) Kiírt sorok száma: (stopszavaknelkul.txt) A Vektortér mátrix mérete nem csökkent jelentősen. (1%-os csökkenés), de a jelentéssel nem bíró szavak kikerültek a további vizsgálatokból. Szerepelt stop szavak száma: 181 ( ) (megtalált-stopszavak.txt) Nem szerepelt stopszavak száma: 32 ( ) A következő stopszavak szerepeltek a kiindulási (rendezett.txt) fájlban: a csak ha ma ne ugyanis ahhoz de hanem maga nem utolsó ahogy e hiszen magát nincs után ahol ebben hogy majd néhány vagy aki eddig hogyan meg nélkül vagyis akik egy hát mellett oda valaki akkor egyes ide mely olyan valami akár egyetlen igen melyek ott valamint alatt egyik ill mert pedig való amely egyre illetve mi persze van amelyek egyéb ilyen miatt például vannak amelyet egész inkább mikor rá vele amelynek ehhez is milyen s viszont ami ekkor ismét minden saját volna amikor el itt mindenki sem volt amit ellen jó mindent sok voltak amíg első jól mindig sokat által annak elég kell mint sokkal általában arra elő keresztül mintha szemben át az először kívül mit szerint én azok előtt között miért szinte éppen azon ennek közül most számára és azonban erre le már szét így azt ezek legalább más talán ön azzal ezen legyen másik tehát össze be ezt lehet még teljes úgy belül ezzel lenne míg tovább új benne ezért lenni nagy továbbá újabb bár fel lesz nagyobb több újra 7

8 cikk felé lett nagyon túl ő ők 5. táblázat. A dokumentumokban szereplő stop szavak A következő stopszavak nem szerepeltek a fájlban: abban emilyen mivel te amelyekben ez mondta ti amelyeket ill. nekem utána amolyan ilyenkor neki vagyok arról ison néha vissza aztán jobban ő voltam azután kellett ők voltunk azért keressünk őket őket cikkek ki semmi cikkeket lehetett stb. 6. táblázat. A dokumentumokban nem szereplő stop szavak 7. LEMMATIZÁLÁS HATÁSA A VEKTORTÉR MÁTRIXRA A stopszavaknelkul.txt fájlban lévő szavakra ( darab szó) megnéztem, hogy melyik szerepel a corpus.lex fájlban. Amelyik szerepelt, azt a lemmájával helyettesítettem. (Lemmatizált-nyers.txt) A vizsgálat eredménye: corpus.lex fájl sorainak a száma: stopszavaknelkul.txt-ből beolvasott sorok száma: Ennyi szóhoz talált lemmát: 7069 Vagyis a szóból 7069 szóhoz talált lemmát. (42%) Kimeneti fájl: Lemmatizált-nyers.txt (Ez is természetesen db sort tartalmaz.) Szavak rendezése-egyediek megtartása: Mivel több szónak is van azonos lemmája, pl. házakban, házakból, házakhoz, házakkal,. => ház ezért a Lemmatizált-nyers.txt fájlban vannak azonos sorok. Ezért ezt a fájlt rendeztem, és az egyedi szavakat magtartottam. (Lemmatizált.txt) Ennek eredménye: A stopszavaknelkul.txt és a Lemmatizált-nyers.txt fájlok sorainak a száma: Lemmatizált.txt sorainak a száma: A kettő aránya vezet a lemmatizálás hatásfokához: / = 0,82 Így a Lemmatizálás 18%-al csökkentette a Vektortér mátrix sorainak a számát. 8

9 8. DOKUMENTUMOK OSZTÁLYOZÁSA A VEKTORTÉR MODELL SEGÍTSÉGÉVEL 8.1 Az osztályozás elmélete A dokumentumok visszakereshetőségét nagy mértékben segíti, ha rendszerezve tároljuk őket. Például, ha hierarchikus rendszerbe, un. taxonómiába rendszerezzük. Itt a tartalom szerinti besorolást vizsgáljuk. A dokumentumok tartalom szerinti rendszerezésének automatizálása az egyik legalapvetőbb szövegbányászati feladat, amelyet osztályozásnak neveznek. Az osztályozás célja szöveges dokumentumok előre definiált halmazból vett tematikus kategóriacímkékkel való ellátása. Az alkalmazások spektruma igen széles, pl. a rögzített tárgyszó-halmaz alapú dokumentumannotálás, a dokumentumszűrés (pl. kéretlen leveleké), webes dokumentumgyűjtemények feltöltése, vélemények értékelése stb. A gépi tanulási (machine learning) módszernél tanítóadatok alapján készül el a kategóriák jellegzetességeit felismerni képes osztályozó. Az emberi erőforrásra csak a kategóriákból és a hozzájuk rendelt dokumentumokból álló tanító környezet előállításánál van szükség, ettől eltekintve az osztályozó létrehozása teljesen automatizálható. A szövegosztályozás bármely területen való sikeres alkalmazásának előfeltétele a megfelelő minőségű tanítókörnyezet megteremtése. Az osztályozás feladata dokumentumok kategóriacímkékkel való ellátása. Formálisan egy Ф: D 2 C osztályozófüggvény megalkotása a cél, amely a D dokumentumtér elemeihez a C={ c 1,,c C } kategóriarendszerből vett kategóriák (más néven osztályok) halmazát rendeli. A Ф függvényt osztályozónak nevezzük. Az osztályozót ismert kategóriájú dokumentumokból kinyert információk alapján építjük fel. Ezeket tanítódokumentumoknak nevezik. A tanítódokumentumok a hozzájuk rendelt osztályokat jól jellemző mintaadatok. Az osztályozó tanulóalgoritmusa a tanítódokumentumok alapján megtanulja az egyes osztályok jellegzetességeit, ebből modellt készít, amellyel becslés adható ismeretlen kategóriájú dokumentumok címkéjére. A tanulásnak ezt a fajtáját felügyelt tanulásnak (supervised learning) nevezik, ahol a szakértő az általa megadott tanítóadatokon keresztül felügyeli a tanulás folyamatát. A bináris osztályozás esetén csak két osztályunk van. Ahhoz, hogy a felépített osztályozó hatékonyságát meghatározhassuk, szükség van tesztadatokra. Ennek érdekében a kiinduló D dokumentumgyűjteményt két diszjunkt halmazra bontjuk, tanító- és teszthalmazra (training/test set). D Train D Test =0, és D Train U D Test =D Az osztályozót a D Train dokumentumain megfigyelt jellemzők alapján induktív következtetéssel hozzuk létre. A D Test teszthalmaz elemeit az osztályozó hatékonyságának megállapítására használjuk. A tesztadatok nem használhatóak fel az osztályozó felépítésénél. 8.2 Rocchio osztályozó A lineáris osztályozók építésének egyik módja a kategóriát reprezentáló c j kategóriavektornak a dokumentumtér elemeként való meghatározása. A dokumentum és a kategória hasonlósága ekkor egyszerűen meghatározható a két vektor koszinusz-távolságaként. 9

10 s d i, c j = M k =1 w ik w jk M w 2 M k =1 ik w 2 k =1 jk (2) Ez az érték a dokumentum- és a kategóriavektorok által bezárt szög koszinuszát adja meg. A koszinusz távolság kiszámítása a két vektor skaláris szorzatából következik: a*b = a * b *cos α (3) cos α = Két vektor távolságának jellemzésére koszinusz-távolság pontosabb értéket ad, mint a Manhattan vagy az Euklidészi távolság: a b a b N Manhattan távolság (x, y) = i=1 x i y i (5) Euklidészi távolság (x, y) = N i=1 (x i y i ) 2 (6) Az osztályozás folyamata a következőképpen történik: Minden dokumentumot ahhoz a kategóriához rendelünk,a melyikre a koszinusz-távolság nagyobb lesz. Mivel cos 0 = 1 és cos 90 = 0, ezért minél kisebb a távolság két dokumentum között, annál nagyobb a bezárt szög koszinusza. A legegyszerűbb módszer a c j kategóriavektorok meghatározására a centroidok használata. A c j osztály centroidját az osztályba tartozó dokumentumvektorok átlagaként definiáljuk: (4) c j = 1 Pos j di Pos d i (7) j d i : a dokumentumvektorok Pos j : a c j kategóriába tartozó tanítódokumentumok Az osztályozás lépései tehát az alábbiak lesznek: tanulás: a tanítóadatok átlagaként határozzuk meg minden c j kategória centroidját. tesztelés: a d i dokumentum osztályozásakor számítsuk ki a koszinusztávolságot a dokumentum és a centroid között az összes kategóriára, és válasszuk ki azt a kategóriát, amelyikre a koszinusz-távolság a legnagyobb. [2] 8.3 Az osztályozás megvalósítása a Vektortér mátrixszal Kiválasztottam az Ingatlanhirdetések közül 1000 darabot, ami családi házakra és 1000 darabot, ami panel-lakásokra vonatkozott. Ennek módszere: Ezekben az Internetes hirdetési fájlokban van egy kis táblázat, amiben az ingatlan fontosabb adatai össze vannak foglalva. Például: 10

11 Az ingatlan típusa (pl. Családi ház, Panel, Társasházi) is itt található a Típus szó után. A HTML fájlban ennek a helyét megkeresve látható, hogy a Típus a <th>típus</th> kódrészletben van, amit követ pl. a <td>családi ház</td> kódrészlet. Így először meg kell keresni a <th>típus</th> kódrészletet. Majd az ezt követő <td> és </td> közötti részt kell kiválasztani. Erre a dokumentumra is elvégeztem a 3. fejezet lépéseit. Aminek segítségével megkaptam a Vektortér mátrixot. a mátrix sorainak száma: oszlopainak száma: 2000 Így a mátrixnak *2000 = cellája van Vektorter-tomb.t mérete: nagyobb, mint 167 MB A fájlt becsomagolva: kb. 600 KB Ez is mutatja, hogy a Vektortér mátrix egy ritkán kitöltött mátrix: elemeinek nagy része = Centroidok meghatározása (lásd 8.1 fejezet) Tanulás: meghatározzuk mindkét kategória centroidját a tanító adatok alapján Osztályozás: minden új, ismeretlen dokumentumra meghatározzuk a dokumentum a centroidtól való távolságát. Két dokumentum (vektor) távolságának egyik meghatározási lehetősége: a két vektor koszinusz-távolságával. A 2000 dokumentum így 2 osztályra osztható: : Családi házak : Panel-lakások Ez a 2000 dokumentum a tanító adat. Az új dokumentumok lesznek a teszt adatok. 11

12 Mindkét osztályra meghatároztam az osztály centroidját. A Vektortér mátrix sorainak száma: Így mindkét centroid egy elemű vektor (tömb). A centroid jól jellemzi az adott osztályt. Egy új, a rendszernek ismeretlen dokumentum esetén a két centroiddal hasonlítja öszsze a dokumentum vektorát. Amelyikhez közelebb van, abba az osztályba sorolja a dokumentumot. 8.5 Tesztelés az eredeti 2000 dokumentummal Először megnéztem, hogy a program által ismert 2000 dokumentumra hogyan működik az Osztályozás. Ennél csak rosszabb eredmény várható új, ismeretlen dokumentumokra. A dokumentum vektorához kiszámítottam a koszinusz értéket a két centroidhoz képest. amelyikhez nagyobb a koszinusz érték, abba az Osztályba soroltam az adott dokumentumot. A vizsgálat eredménye: jo1= 991; rossz1= 9; jo2= 991; rossz2= 9 Az 1000 családi házból 991-et jól besorolt a családi házak közé. 9-et rosszul a panellakások közé. Az 1000 panel-lakásból 991-et jól besorolt a panel-lakások közé. 9-et rosszul a családi házak közé. (A rossz1= 9.0 és rossz2= 9.0 egybeesés véletlen.) 8.6 Tesztelés új dokumentumokkal Kiválasztottam új, a rendszer számára ismeretlen dokumentumot. Elvégeztem ezekre a dokumentumokra is a 3. fejezetben leírt átalakításokat. Elvégeztem a 8.4 pontban leírt tesztelést mind a 2000 új dokumentumra. A vizsgálat eredménye: jo1= 969; rossz1= 31; jo2= 989; rossz2= 11 Az 1000 családi házból 969-et jól besorolt a családi házak közé. 31-et rosszul a panellakások közé. Az 1000 panel-lakásból 989-et jól besorolt a panel-lakások közé. 11-et rosszul a családi házak közé. Az osztályozás eredményei jók lettek! A felidézés a pontosság értékek jól jellemzik egy osztályozás hatékonyságát: Családi házakra: Recall (Felidézés) R= 969 / ( ) = 969 / 1000 =0,969 Precision (Pontosság) P = 969 / ( ) = 969 /980 = 0,988 Panel lakásokra: Recall (Feidézés) R= 989 / (989+11) = 989 / 1000 = 0,989 Precision (Pontosság) P = 989 / (989+31) = 989 / 1020 = 0,970 12

13 9. A STOPSZÓ SZŰRÉS ÉS LEMMATIZÁLÁS HATÁSA AZ OSZTÁLYOZÁSRA Megvizsgáltam még azt, hogy milyen hatása van annak, ha a bemeneti fájlokra először elvégzem a stopszó szűrést és a lemmatizálást és utána végzem el az osztályozás folyamatát. Azt kaptam, hogy a stopszó szűrés és a lemmatizálás javította az osztályozás eredményét: A Vektortér mátrix mérete most így alakult: Sorok száma: ; Oszlopok száma: 2000 A vizsgálat eredménye: jo1= 991; rossz1= 9, jo2= 990; rossz2= 10 A stopszó szűrés és lemmatizálás nélkül a következő eredmény volt: (lásd 8.5 fejezet ) jo1= 969; rossz1= 31; jo2= 989; rossz2= 11 Családi házakra: Recall (Felidézés) R= 991 / ( ) = 991 / 1000 =0,991 Precision (pontosság) P = 991 / ( ) = 991 /1001 = 0,990 Panel lakásokra: Recall (Felidézés) R= 990 / (990+10) = 990 / 1000 = 0,99 Precision (Pontosság) P = 990 / (990+9) = 990 / 999 = 0,991 Vagyis a stopszó szűrés és a lemmatizálás javította az osztályozás eredményét. 10. ÖSSZEFOGLALÁS TOVÁBBLÉPÉSI LEHETŐSÉGEK Ebben a publikációban először megvizsgáltam a stopszó szűrés és a lemmatizálás hatását a Vektortér modellre. Azt tapasztaltam, hogy segítségükkel ki lehet szűrni a jelentéssel nem bíró szavakat (pl. névelőket) és felhasználásukkal jelentősen csökkenthető a Vektortér mátrix mérete. Majd készítettem egy programot szövegek osztályozására. Az osztályozó tesztelése azt mutatta, hogy a programot jól lehet használni szövegek bináris osztályozására. Majd megvizsgáltam a stopszó szűrés és a lemmatizálás hatását az osztályozásra. Láttuk, hogy felhasználásukkal javult az osztályozás eredménye. Egy következő publikációban tervezem más osztályozó algoritmusok, módszerek vizsgálatát. FELHASZNÁLT IRODALOM [1] Martin Daniel JURAFSKY, James H. MARTIN: Speech and Language Processing: An introduction to natural language processing, computational linguistics, and speech recognition. Stanford, CA: Pearson Prentice Hall, [2] TIKK Domonkos: Szövegbányászat. Typotex, Budapest, [3] SUBECZ Zoltán: Szövegfeldolgozási lépések a Vektortér modellig, Economica, A Szolnoki Főiskola Tudományos Közleményei, Szolnok,

A VEKTORTÉR MODEL HASZNÁLATA A SZÖVEGBÁNYÁSZATBAN THE USAGE OF THE VECTOR-SPACE MODEL IN TEXT MINING

A VEKTORTÉR MODEL HASZNÁLATA A SZÖVEGBÁNYÁSZATBAN THE USAGE OF THE VECTOR-SPACE MODEL IN TEXT MINING Gradus Vol 3, No 2 (2016) 73-79 ISSN 2064-8014 A VEKTORTÉR MODEL HASZNÁLATA A SZÖVEGBÁNYÁSZATBAN THE USAGE OF THE VECTOR-SPACE MODEL IN TEXT MINING Subecz Zoltán 1* 1 Informatika Tanszék, Gépipari és Automatizálási

Részletesebben

ACTA CAROLUS ROBERTUS

ACTA CAROLUS ROBERTUS ACTA CAROLUS ROBERTUS Károly Róbert Főiskola tudományos közleményei Alapítva: 2011 3 (1) ACTA CAROLUS ROBERTUS 3 (1) Informatika szekció SZÖVEGOSZTÁLYOZÁSI MÓDSZEREK A WEKA ADATBÁNYÁSZATI SZOFTVER SEGÍTSÉGÉVEL

Részletesebben

ADATBÁNYÁSZATI SZOFTVER HASZNÁLATA SZÖVEGOSZTÁLYOZÁSHOZ DATA MINING SOFTWARE FOR TEXT CLASSIFICATION

ADATBÁNYÁSZATI SZOFTVER HASZNÁLATA SZÖVEGOSZTÁLYOZÁSHOZ DATA MINING SOFTWARE FOR TEXT CLASSIFICATION Gradus Vol 4, No 2 (2017) 444-452 ISSN 2064-8014 ADATBÁNYÁSZATI SZOFTVER HASZNÁLATA SZÖVEGOSZTÁLYOZÁSHOZ DATA MINING SOFTWARE FOR TEXT CLASSIFICATION Subecz Zoltán 1*, Nagyné Dr. Csák Éva 2 1 Informatika

Részletesebben

15. LINEÁRIS EGYENLETRENDSZEREK

15. LINEÁRIS EGYENLETRENDSZEREK 15 LINEÁRIS EGYENLETRENDSZEREK 151 Lineáris egyenletrendszer, Gauss elimináció 1 Definíció Lineáris egyenletrendszernek nevezzük az (1) a 11 x 1 + a 12 x 2 + + a 1n x n = b 1 a 21 x 1 + a 22 x 2 + + a

Részletesebben

Gépi tanulás a gyakorlatban. Bevezetés

Gépi tanulás a gyakorlatban. Bevezetés Gépi tanulás a gyakorlatban Bevezetés Motiváció Nagyon gyakran találkozunk gépi tanuló alkalmazásokkal Spam detekció Karakter felismerés Fotó címkézés Szociális háló elemzés Piaci szegmentáció analízis

Részletesebben

SZTE Eötvös Loránd Kollégium. 2. Móra György: Információkinyerés természetes nyelvű szövegekből

SZTE Eötvös Loránd Kollégium. 2. Móra György: Információkinyerés természetes nyelvű szövegekből 2010/2011 tavaszi félév SZTE Eötvös Loránd Kollégium 1. Dombi József: Fuzzy elmélet és alkalmazásai 2011. március 3. 19:00 2. Móra György: Információkinyerés természetes nyelvű szövegekből 2011. március

Részletesebben

Dodé Réka (ELTE BTK Nyelvtudomány Doktori IskolaAlkalmazott Alknyelvdok 2017 nyelvészet program) február 3. 1 / 17

Dodé Réka (ELTE BTK Nyelvtudomány Doktori IskolaAlkalmazott Alknyelvdok 2017 nyelvészet program) február 3. 1 / 17 Doménspecifikus korpusz építése és validálása Dodé Réka ELTE BTK Nyelvtudomány Doktori Iskola Alkalmazott nyelvészet program 2017. február 3. Dodé Réka (ELTE BTK Nyelvtudomány Doktori IskolaAlkalmazott

Részletesebben

Gépi tanulás és Mintafelismerés

Gépi tanulás és Mintafelismerés Gépi tanulás és Mintafelismerés jegyzet Csató Lehel Matematika-Informatika Tanszék BabesBolyai Tudományegyetem, Kolozsvár 2007 Aug. 20 2 1. fejezet Bevezet A mesterséges intelligencia azon módszereit,

Részletesebben

Gépi tanulás a Rapidminer programmal. Stubendek Attila

Gépi tanulás a Rapidminer programmal. Stubendek Attila Gépi tanulás a Rapidminer programmal Stubendek Attila Rapidminer letöltése Google: download rapidminer Rendszer kiválasztása (iskolai gépeken Other Systems java) Kicsomagolás lib/rapidminer.jar elindítása

Részletesebben

Szövegbányászat Információ Visszakeresés és egyéb alkalmazások

Szövegbányászat Információ Visszakeresés és egyéb alkalmazások Szövegbányászat Információ Visszakeresés és egyéb alkalmazások A diák nagyban támaszkodnak a Stanford Egyetem Information Retrieval and Web-mining kurzusának anyagára: http://www-csli.stanford.edu/~schuetze/information-retrieval-book.html

Részletesebben

Írjon olyan programot a standard könyvtár alkalmazásával, amely konzolról megadott valós adatokból meghatározza és kiírja a minimális értékűt!

Írjon olyan programot a standard könyvtár alkalmazásával, amely konzolról megadott valós adatokból meghatározza és kiírja a minimális értékűt! Írjon olyan programot a standard könyvtár alkalmazásával, amely konzolról megadott valós adatokból meghatározza és kiírja a minimális értékűt! valós adatokat növekvő sorrendbe rendezi és egy sorba kiírja

Részletesebben

Keresés képi jellemzők alapján. Dr. Balázs Péter SZTE, Képfeldolgozás és Számítógépes Grafika Tanszék

Keresés képi jellemzők alapján. Dr. Balázs Péter SZTE, Képfeldolgozás és Számítógépes Grafika Tanszék Keresés képi jellemzők alapján Dr. Balázs Péter SZTE, Képfeldolgozás és Számítógépes Grafika Tanszék Lusta gépi tanulási algoritmusok Osztályozás: k=1: piros k=5: kék k-legközelebbi szomszéd (k=1,3,5,7)

Részletesebben

Tartalom Keresés és rendezés. Vektoralgoritmusok. 1. fejezet. Keresés adatvektorban. A programozás alapjai I.

Tartalom Keresés és rendezés. Vektoralgoritmusok. 1. fejezet. Keresés adatvektorban. A programozás alapjai I. Keresés Rendezés Feladat Keresés Rendezés Feladat Tartalom Keresés és rendezés A programozás alapjai I. Hálózati Rendszerek és Szolgáltatások Tanszék Farkas Balázs, Fiala Péter, Vitéz András, Zsóka Zoltán

Részletesebben

2. Készítsen awk szkriptet, amely kiírja az aktuális könyvtár összes alkönyvtárának nevét, amely februári keltezésű (bármely év).

2. Készítsen awk szkriptet, amely kiírja az aktuális könyvtár összes alkönyvtárának nevét, amely februári keltezésű (bármely év). 1. fejezet AWK 1.1. Szűrési feladatok 1. Készítsen awk szkriptet, ami kiírja egy állomány leghosszabb szavát. 2. Készítsen awk szkriptet, amely kiírja az aktuális könyvtár összes alkönyvtárának nevét,

Részletesebben

Szövegbányászati rendszer fejlesztése a Magyar Elektronikus Könyvtár számára

Szövegbányászati rendszer fejlesztése a Magyar Elektronikus Könyvtár számára Szövegbányászati rendszer fejlesztése a Magyar Elektronikus Könyvtár számára Vázsonyi Miklós VÁZSONYI Informatikai és Tanácsadó Kft. BME Információ- és Tudásmenedzsment Tanszék 1/23 Tartalom A MEK jelenlegi

Részletesebben

Keresés és rendezés. A programozás alapjai I. Hálózati Rendszerek és Szolgáltatások Tanszék Farkas Balázs, Fiala Péter, Vitéz András, Zsóka Zoltán

Keresés és rendezés. A programozás alapjai I. Hálózati Rendszerek és Szolgáltatások Tanszék Farkas Balázs, Fiala Péter, Vitéz András, Zsóka Zoltán Keresés Rendezés Feladat Keresés és rendezés A programozás alapjai I. Hálózati Rendszerek és Szolgáltatások Tanszék Farkas Balázs, Fiala Péter, Vitéz András, Zsóka Zoltán 2016. november 7. Farkas B., Fiala

Részletesebben

Mesterséges intelligencia, 7. előadás 2008. október 13. Készítette: Masa Tibor (KPM V.)

Mesterséges intelligencia, 7. előadás 2008. október 13. Készítette: Masa Tibor (KPM V.) Mesterséges intelligencia, 7. előadás 2008. október 13. Készítette: Masa Tibor (KPM V.) Bizonytalanságkezelés: Az eddig vizsgáltakhoz képest teljesen más világ. A korábbi problémák nagy része logikai,

Részletesebben

Általános algoritmustervezési módszerek

Általános algoritmustervezési módszerek Általános algoritmustervezési módszerek Ebben a részben arra mutatunk példát, hogy miként használhatóak olyan általános algoritmustervezési módszerek mint a dinamikus programozás és a korlátozás és szétválasztás

Részletesebben

Tudásalapú információ-kereső rendszerek elemzése és kifejlesztése

Tudásalapú információ-kereső rendszerek elemzése és kifejlesztése Tudásalapú információ-kereső rendszerek elemzése és kifejlesztése 1 Tudásalapú információ-kereső rendszerek elemzése és kifejlesztése Természetes nyelv feldolgozás 2 Tudásalapú információ-kereső rendszerek

Részletesebben

KOPI. Fordítási plágiumok keresése MTA SZTAKI DSD. Pataki Máté MSZNY 2011. Department of Distributed Systems

KOPI. Fordítási plágiumok keresése MTA SZTAKI DSD. Pataki Máté MSZNY 2011. Department of Distributed Systems KOPI MTA SZTAKI Department of Distributed Systems Fordítási plágiumok keresése MSZNY 2011 Pataki Máté Probléma 1. Sok a diák 2. Hasznos anyagok az interneten 3. Digitális szakdolgozatok 4. Jó nyelvtudás

Részletesebben

Felvételi tematika INFORMATIKA

Felvételi tematika INFORMATIKA Felvételi tematika INFORMATIKA 2016 FEJEZETEK 1. Természetes számok feldolgozása számjegyenként. 2. Számsorozatok feldolgozása elemenként. Egydimenziós tömbök. 3. Mátrixok feldolgozása elemenként/soronként/oszloponként.

Részletesebben

Bevezetés az informatikába

Bevezetés az informatikába Bevezetés az informatikába 6. előadás Dr. Istenes Zoltán Eötvös Loránd Tudományegyetem Informatikai Kar Programozáselmélet és Szoftvertechnológiai Tanszék Matematikus BSc - I. félév / 2008 / Budapest Dr.

Részletesebben

1. Olvassuk be két pont koordinátáit: (x1, y1) és (x2, y2). Határozzuk meg a két pont távolságát és nyomtassuk ki.

1. Olvassuk be két pont koordinátáit: (x1, y1) és (x2, y2). Határozzuk meg a két pont távolságát és nyomtassuk ki. Számítás:. Olvassuk be két pont koordinátáit: (, y) és (2, y2). Határozzuk meg a két pont távolságát és nyomtassuk ki. 2. Olvassuk be két darab két dimenziós vektor komponenseit: (a, ay) és (b, by). Határozzuk

Részletesebben

Reguláris kifejezések 1.

Reguláris kifejezések 1. Reguláris kifejezések 1. A nyelvtechnológia eszközei és nyersanyagai 1. gyakorlat A beadandó feladatok be vannak keretezve! 1.1. Miért hívják reguláris kifejezésnek? (!) Az elméleti és a gyakorlati reguláris

Részletesebben

end function Az A vektorban elõforduló legnagyobb és legkisebb értékek indexeinek különbségét.. (1.5 pont) Ha üres a vektor, akkor 0-t..

end function Az A vektorban elõforduló legnagyobb és legkisebb értékek indexeinek különbségét.. (1.5 pont) Ha üres a vektor, akkor 0-t.. A Név: l 2014.04.09 Neptun kód: Gyakorlat vezető: HG BP MN l 1. Adott egy (12 nem nulla értékû elemmel rendelkezõ) 6x7 méretû ritka mátrix hiányos 4+2 soros reprezentációja. SOR: 1 1 2 2 2 3 3 4 4 5 6

Részletesebben

Érdekes informatika feladatok

Érdekes informatika feladatok A keres,kkel és adatbázissal ellátott lengyel honlap számos díjat kapott: Spirit of Delphi '98, Delphi Community Award, Poland on the Internet, Golden Bagel Award stb. Az itt megtalálható komponenseket

Részletesebben

Gyakorló feladatok adatbányászati technikák tantárgyhoz

Gyakorló feladatok adatbányászati technikák tantárgyhoz Gyakorló feladatok adatbányászati technikák tantárgyhoz Buza Krisztián Számítástudományi és Információelméleti Tanszék Budapesti Műszaki és Gazdaságtudományi Egyetem Klaszterezés kiértékelése Feladat:

Részletesebben

Regresszió. Csorba János. Nagyméretű adathalmazok kezelése március 31.

Regresszió. Csorba János. Nagyméretű adathalmazok kezelése március 31. Regresszió Csorba János Nagyméretű adathalmazok kezelése 2010. március 31. A feladat X magyarázó attribútumok halmaza Y magyarázandó attribútumok) Kérdés: f : X -> Y a kapcsolat pár tanítópontban ismert

Részletesebben

Döntési fák. (Klasszifikációs és regressziós fák: (Classification And Regression Trees: CART ))

Döntési fák. (Klasszifikációs és regressziós fák: (Classification And Regression Trees: CART )) Döntési fák (Klasszifikációs és regressziós fák: (Classification And Regression Trees: CART )) Rekurzív osztályozó módszer, Klasszifikációs és regressziós fák folytonos, kategóriás, illetve túlélés adatok

Részletesebben

AZ ÜGYFÉL KOMMUNIKÁCIÓ ÚJ FORMÁI POZITÍV ÜGYFÉLÉLMÉNY SZÖVEGBÁNYÁSZATI MEGOLDÁSOK

AZ ÜGYFÉL KOMMUNIKÁCIÓ ÚJ FORMÁI POZITÍV ÜGYFÉLÉLMÉNY SZÖVEGBÁNYÁSZATI MEGOLDÁSOK AZ ÜGYFÉL KOMMUNIKÁCIÓ ÚJ FORMÁI POZITÍV ÜGYFÉLÉLMÉNY SZÖVEGBÁNYÁSZATI MEGOLDÁSOK HOFGESANG PÉTER ÜZLETI INTELLIGENCIA A JÖVŐ, AHOGY MI LÁTJUK Hagyományos és új kommunikációs formák Szöveges adatok Szöveganalitika

Részletesebben

Hadamard-mátrixok Előadó: Hajnal Péter február 23.

Hadamard-mátrixok Előadó: Hajnal Péter február 23. Szimmetrikus kombinatorikus struktúrák MSc hallgatók számára Hadamard-mátrixok Előadó: Hajnal Péter 2012. február 23. 1. Hadamard-mátrixok Ezen az előadáson látásra a blokkrendszerektől független kombinatorikus

Részletesebben

Hogyan fogalmazzuk meg egyszerűen, egyértelműen a programozóknak, hogy milyen lekérdezésre, kimutatásra, jelentésre van szükségünk?

Hogyan fogalmazzuk meg egyszerűen, egyértelműen a programozóknak, hogy milyen lekérdezésre, kimutatásra, jelentésre van szükségünk? Hogyan fogalmazzuk meg egyszerűen, egyértelműen a programozóknak, hogy milyen lekérdezésre, kimutatásra, jelentésre van szükségünk? Nem szükséges informatikusnak lennünk, vagy mélységében átlátnunk az

Részletesebben

Adaptív dinamikus szegmentálás idősorok indexeléséhez

Adaptív dinamikus szegmentálás idősorok indexeléséhez Adaptív dinamikus szegmentálás idősorok indexeléséhez IPM-08irAREAE kurzus cikkfeldolgozás Balassi Márton 1 Englert Péter 1 Tömösy Péter 1 1 Eötvös Loránd Tudományegyetem Informatikai Kar 2013. november

Részletesebben

Brósch Zoltán (Debreceni Egyetem Kossuth Lajos Gyakorló Gimnáziuma) Számelmélet I.

Brósch Zoltán (Debreceni Egyetem Kossuth Lajos Gyakorló Gimnáziuma) Számelmélet I. Számelmélet I. DEFINÍCIÓ: (Osztó, többszörös) Ha egy a szám felírható egy b szám és egy másik egész szám szorzataként, akkor a b számot az a osztójának, az a számot a b többszörösének nevezzük. Megjegyzés:

Részletesebben

Megjegyzés: A programnak tartalmaznia kell legalább egy felhasználói alprogramot. Példa:

Megjegyzés: A programnak tartalmaznia kell legalább egy felhasználói alprogramot. Példa: 1. Tétel Az állomány két sort tartalmaz. Az első sorában egy nem nulla természetes szám van, n-el jelöljük (5

Részletesebben

Függvények növekedési korlátainak jellemzése

Függvények növekedési korlátainak jellemzése 17 Függvények növekedési korlátainak jellemzése A jellemzés jól bevált eszközei az Ω, O, Θ, o és ω jelölések. Mivel az igények általában nemnegatívak, ezért az alábbi meghatározásokban mindenütt feltesszük,

Részletesebben

Közösség detektálás gráfokban

Közösség detektálás gráfokban Közösség detektálás gráfokban Önszervező rendszerek Hegedűs István Célkitűzés: valamilyen objektumok halmaza felett minták, csoportok detektálása csakis az egyedek közötti kapcsolatok struktúrájának a

Részletesebben

Számítógépes képelemzés 7. előadás. Dr. Balázs Péter SZTE, Képfeldolgozás és Számítógépes Grafika Tanszék

Számítógépes képelemzés 7. előadás. Dr. Balázs Péter SZTE, Képfeldolgozás és Számítógépes Grafika Tanszék Számítógépes képelemzés 7. előadás Dr. Balázs Péter SZTE, Képfeldolgozás és Számítógépes Grafika Tanszék Momentumok Momentum-alapú jellemzők Tömegközéppont Irányultáság 1 2 tan 2 1 2,0 1,1 0, 2 Befoglaló

Részletesebben

Diszkrét matematika I., 12. előadás Dr. Takách Géza NyME FMK Informatikai Intézet takach november 30.

Diszkrét matematika I., 12. előadás Dr. Takách Géza NyME FMK Informatikai Intézet   takach november 30. 1 Diszkrét matematika I, 12 előadás Dr Takách Géza NyME FMK Informatikai Intézet takach@infnymehu http://infnymehu/ takach 2005 november 30 Vektorok Definíció Egy tetszőleges n pozitív egész számra n-komponensű

Részletesebben

Programozási segédlet

Programozási segédlet Programozási segédlet Programozási tételek Az alábbiakban leírtam néhány alap algoritmust, amit ismernie kell annak, aki programozásra adja a fejét. A lista korántsem teljes, ám ennyi elég kell legyen

Részletesebben

BEKE ANDRÁS, FONETIKAI OSZTÁLY BESZÉDVIZSGÁLATOK GYAKORLATI ALKALMAZÁSA

BEKE ANDRÁS, FONETIKAI OSZTÁLY BESZÉDVIZSGÁLATOK GYAKORLATI ALKALMAZÁSA BEKE ANDRÁS, FONETIKAI OSZTÁLY BESZÉDVIZSGÁLATOK GYAKORLATI ALKALMAZÁSA BESZÉDTUDOMÁNY Az emberi kommunikáció egyik leggyakrabban használt eszköze a nyelv. A nyelv hangzó változta, a beszéd a nyelvi kommunikáció

Részletesebben

Multimédiás adatbázisok

Multimédiás adatbázisok Multimédiás adatbázisok Multimédiás adatbázis kezelő Olyan adatbázis kezelő, mely támogatja multimédiás adatok (dokumentum, kép, hang, videó) tárolását, módosítását és visszakeresését Minimális elvárás

Részletesebben

Mesterséges Intelligencia. Csató Lehel. Csató Lehel. Matematika-Informatika Tanszék Babeş Bolyai Tudományegyetem, Kolozsvár 2007/2008

Mesterséges Intelligencia. Csató Lehel. Csató Lehel. Matematika-Informatika Tanszék Babeş Bolyai Tudományegyetem, Kolozsvár 2007/2008 Matematika-Informatika Tanszék Babeş Bolyai Tudományegyetem, Kolozsvár 007/008 Az Előadások Témái Bevezető: mi a mesterséges intelligencia... Tudás reprezentáció i stratégiák Szemantikus hálók / Keretrendszerek

Részletesebben

Felvételi vizsga mintatételsor Informatika írásbeli vizsga

Felvételi vizsga mintatételsor Informatika írásbeli vizsga BABEȘ BOLYAI TUDOMÁNYEGYETEM MATEMATIKA ÉS INFORMATIKA KAR A. tételsor (30 pont) Felvételi vizsga mintatételsor Informatika írásbeli vizsga 1. (5p) Egy x biten tárolt egész adattípus (x szigorúan pozitív

Részletesebben

1. Az informatikai eszközök használata

1. Az informatikai eszközök használata 5 6. évfolyam A tanulók az informatikai eszközök használata során megismerik a számítógépet, annak főbb egységeit, a perifériákat. Kezdetben tanári segítséggel, később önállóan használják a legfontosabb

Részletesebben

Lineáris egyenletrendszerek

Lineáris egyenletrendszerek Lineáris egyenletrendszerek Lineáris egyenletrendszernek nevezzük az a 11 x 1 + a 12 x 2 +... +a 1n x n = b 1 a 21 x 1 + a 22 x 2 +... +a 2n x n = b 2.. a k1 x 1 + a k2 x 2 +... +a kn x n = b k n ismeretlenes,

Részletesebben

Hash-alapú keresések

Hash-alapú keresések 1/16 az információ-visszakeresésben Babeş Bolyai Tudományegyetem Magyar Matematika és Informatika Intézet A Magyar Tudomány Napja Erdélyben Kolozsvár, 2012 2/16 Tartalom Információ-visszakeresés Információ-visszakeresés

Részletesebben

II. Mérés SZÉCHENYI ISTVÁN EGYETEM GYŐR TÁVKÖZLÉSI TANSZÉK

II. Mérés SZÉCHENYI ISTVÁN EGYETEM GYŐR TÁVKÖZLÉSI TANSZÉK Mérési Utasítás Linux/Unix jogosultságok és fájlok kezelése Linux fájlrendszerek és jogosultságok Linux alatt, az egyes fájlokhoz való hozzáférések szabályozása érdekében a fájlokhoz tulajdonost, csoportot

Részletesebben

Országos Rendezési Tervkataszter

Országos Rendezési Tervkataszter TeIR Országos Rendezési Tervkataszter Felhasználói útmutató Budapest, 2015. április Tartalomjegyzék 1. BEVEZETŐ... 3 2. LEKÉRDEZÉSEK... 3 2.1 TERV ELLÁTOTTSÁG LEKÉRDEZÉS... 4 2.1.1. Kördiagram... 5 2.1.2.

Részletesebben

9. Entitás modulok. Nagy Gusztáv: Drupal 7 alapismeretek Fejlesztői verzió: 2011. október 6.

9. Entitás modulok. Nagy Gusztáv: Drupal 7 alapismeretek Fejlesztői verzió: 2011. október 6. 9 9. Entitás modulok A szerző véleménye szerint a Drupal legnagyobb erősségei közé tartozik a magas szintű, absztrakt fogalmak mentén történő építkezés. A korábbiakban már megismerkedtünk a tartalmak és

Részletesebben

Digitális kultúra, avagy hová lett az informatika az új NAT-ban? Farkas Csaba

Digitális kultúra, avagy hová lett az informatika az új NAT-ban? Farkas Csaba Digitális kultúra, avagy hová lett az informatika az új NAT-ban? Farkas Csaba farkas.csaba@uni-eszterhazy.hu Áttekintés A digitális átalakulás nem választás kérdése: olyan elkerülhetetlen jelenség, amelyre

Részletesebben

Gépi tanulás a gyakorlatban. Kiértékelés és Klaszterezés

Gépi tanulás a gyakorlatban. Kiértékelés és Klaszterezés Gépi tanulás a gyakorlatban Kiértékelés és Klaszterezés Hogyan alkalmazzuk sikeresen a gépi tanuló módszereket? Hogyan válasszuk az algoritmusokat? Hogyan hangoljuk a paramétereiket? Precízebben: Tegyük

Részletesebben

A PiFast program használata. Nagy Lajos

A PiFast program használata. Nagy Lajos A PiFast program használata Nagy Lajos Tartalomjegyzék 1. Bevezetés 3 2. Bináris kimenet létrehozása. 3 2.1. Beépített konstans esete.............................. 3 2.2. Felhasználói konstans esete............................

Részletesebben

A szegénység fogalmának megjelenése a magyar online médiában

A szegénység fogalmának megjelenése a magyar online médiában A szegénység fogalmának megjelenése a magyar online médiában Tartalomelemzés 2000 január és 2015 március között megjelent cikkek alapján Bevezetés Elemzésünk célja, hogy áttekintő képet adjunk a szegénység

Részletesebben

Robotok inverz geometriája

Robotok inverz geometriája Robotok inverz geometriája. A gyakorlat célja Inverz geometriai feladatot megvalósító függvények implementálása. A megvalósított függvénycsomag tesztelése egy kétszabadságfokú kar előírt végberendezés

Részletesebben

Önálló labor feladatkiírásaim tavasz

Önálló labor feladatkiírásaim tavasz Önálló labor feladatkiírásaim 2016. tavasz (ezekhez kapcsolódó saját témával is megkereshetnek) Mészáros Tamás http://www.mit.bme.hu/~meszaros/ Budapesti Műszaki és Gazdaságtudományi Egyetem Méréstechnika

Részletesebben

Valasek Gábor valasek@inf.elte.hu

Valasek Gábor valasek@inf.elte.hu Számítógépes Grafika Valasek Gábor valasek@inf.elte.hu Eötvös Loránd Tudományegyetem Informatikai Kar 2013/2014. őszi félév ( Eötvös LorándSzámítógépes TudományegyetemInformatikai Grafika Kar) 2013/2014.

Részletesebben

Statisztikai eljárások a mintafelismerésben és a gépi tanulásban

Statisztikai eljárások a mintafelismerésben és a gépi tanulásban Statisztikai eljárások a mintafelismerésben és a gépi tanulásban Varga Domonkos (I.évf. PhD hallgató) 2014 május A prezentáció felépítése 1) Alapfogalmak 2) A gépi tanulás, mintafelismerés alkalmazási

Részletesebben

Feladat. Bemenő adatok. Bemenő adatfájlok elvárt formája. Berezvai Dániel 1. beadandó/4. feladat 2012. április 13. Például (bemenet/pelda.

Feladat. Bemenő adatok. Bemenő adatfájlok elvárt formája. Berezvai Dániel 1. beadandó/4. feladat 2012. április 13. Például (bemenet/pelda. Berezvai Dániel 1. beadandó/4. feladat 2012. április 13. BEDTACI.ELTE Programozás 3ice@3ice.hu 11. csoport Feladat Madarak életének kutatásával foglalkozó szakemberek különböző településen különböző madárfaj

Részletesebben

Szöveges feladatok a mátrixaritmetika alkalmazására

Szöveges feladatok a mátrixaritmetika alkalmazására Szöveges feladatok a mátrixaritmetika alkalmazására Bevezetés: Tekintsük az alábbi -es mátrixot: A. Szorozzuk meg ezt jobbról egy alkalmas méretű (azaz -es) oszlopvektorral, amely az R tér kanonikus bázisának

Részletesebben

KOPI. KOPI A fordítási plágiumok keresője MTA SZTAKI DSD. Pataki Máté Kovács László. Department of Distributed Systems

KOPI. KOPI A fordítási plágiumok keresője MTA SZTAKI DSD. Pataki Máté Kovács László. Department of Distributed Systems KOPI MTA SZTAKI Department of Distributed Systems KOPI A fordítási plágiumok keresője Pataki Máté Kovács László MTA SZTAKI MTA SZTAKI Elosztott Rendszerek Osztály 1995. óta létezik 12 teljes állású munkatárs,

Részletesebben

Számítógépes döntéstámogatás. Genetikus algoritmusok

Számítógépes döntéstámogatás. Genetikus algoritmusok BLSZM-10 p. 1/18 Számítógépes döntéstámogatás Genetikus algoritmusok Werner Ágnes Villamosmérnöki és Információs Rendszerek Tanszék e-mail: werner.agnes@virt.uni-pannon.hu BLSZM-10 p. 2/18 Bevezetés 1950-60-as

Részletesebben

Statisztikai szoftverek esszé

Statisztikai szoftverek esszé Statisztikai szoftverek esszé Csillag Renáta 2011. Helyzetfelmérés Egy internetszolgáltató egy havi adatforgalmát vizsgáltam. A táblázatok az előfizetők letöltési forgalmát tartalmazzák, napi bontásban,

Részletesebben

Szomszédság alapú ajánló rendszerek

Szomszédság alapú ajánló rendszerek Nagyméretű adathalmazok kezelése Szomszédság alapú ajánló rendszerek Készítette: Szabó Máté A rendelkezésre álló adatmennyiség növelésével egyre nehezebb kiválogatni a hasznos információkat Megoldás: ajánló

Részletesebben

I. LABOR -Mesterséges neuron

I. LABOR -Mesterséges neuron I. LABOR -Mesterséges neuron A GYAKORLAT CÉLJA: A mesterséges neuron struktúrájának az ismertetése, neuronhálókkal kapcsolatos elemek, alapfogalmak bemutatása, aktivációs függvénytípusok szemléltetése,

Részletesebben

Matematikai alapok és valószínőségszámítás. Valószínőségi eloszlások Binomiális eloszlás

Matematikai alapok és valószínőségszámítás. Valószínőségi eloszlások Binomiális eloszlás Matematikai alapok és valószínőségszámítás Valószínőségi eloszlások Binomiális eloszlás Bevezetés A tudományos életben megfigyeléseket teszünk, kísérleteket végzünk. Ezek többféle különbözı eredményre

Részletesebben

Diverzifikáció Markowitz-modell MAD modell CAPM modell 2017/ Szegedi Tudományegyetem Informatikai Intézet

Diverzifikáció Markowitz-modell MAD modell CAPM modell 2017/ Szegedi Tudományegyetem Informatikai Intézet Operációkutatás I. 2017/2018-2. Szegedi Tudományegyetem Informatikai Intézet Számítógépes Optimalizálás Tanszék 11. Előadás Portfólió probléma Portfólió probléma Portfólió probléma Adott részvények (kötvények,tevékenységek,

Részletesebben

Nagyméretű adathalmazok kezelése (BMEVISZM144) Reinhardt Gábor április 5.

Nagyméretű adathalmazok kezelése (BMEVISZM144) Reinhardt Gábor április 5. Asszociációs szabályok Budapesti Műszaki- és Gazdaságtudományi Egyetem 2012. április 5. Tartalom 1 2 3 4 5 6 7 ismétlés A feladat Gyakran együtt vásárolt termékek meghatározása Tanultunk rá hatékony algoritmusokat

Részletesebben

Matematika feladatbank I. Statisztika. és feladatgyűjtemény középiskolásoknak

Matematika feladatbank I. Statisztika. és feladatgyűjtemény középiskolásoknak Matematika feladatbank I. Statisztika Elméleti összefoglaló és feladatgyűjtemény középiskolásoknak ÍRTA ÉS ÖSSZEÁLLÍTOTTA: Dugasz János 2011 Fapadoskonyv.hu Kft. Dugasz János Tartalom Bevezető 7 Adatok

Részletesebben

Mátrixok, mátrixműveletek

Mátrixok, mátrixműveletek Mátrixok, mátrixműveletek 1 előadás Farkas István DE ATC Gazdaságelemzési és Statisztikai Tanszék Mátrixok, mátrixműveletek p 1/1 Mátrixok definíciója Definíció Helyezzünk el n m elemet egy olyan téglalap

Részletesebben

Programozás alapjai Bevezetés

Programozás alapjai Bevezetés Programozás alapjai Bevezetés Miskolci Egyetem Általános Informatikai Tanszék Programozás alapjai Bevezetés SWF1 / 1 Tartalom A gépi kódú programozás és hátrányai A magas szintÿ programozási nyelv fogalma

Részletesebben

Matematika A1a Analízis

Matematika A1a Analízis B U D A P E S T I M Ű S Z A K I M A T E M A T I K A É S G A Z D A S Á G T U D O M Á N Y I I N T É Z E T E G Y E T E M Matematika A1a Analízis BMETE90AX00 Vektorok StKis, EIC 2019-02-12 Wettl Ferenc ALGEBRA

Részletesebben

Aromo Szöveges Értékelés

Aromo Szöveges Értékelés Aromo Szöveges Értékelés AROMO Iskolaadminisztrációs Szoftver v2.50 - Felhasználói kézikönyv- Szöveges értékelés 1 Tartalomjegyzék Aromo Szöveges Értékelés 1 Bevezetés 3 A Szöveges Értékelés modul koncepciója

Részletesebben

Novell GroupWise levelező rendszer alapok Kiadványunk célja, hogy a Nemzeti Közszolgálati Egyetemen használt Novell GroupWise (a továbbiakban GW)

Novell GroupWise levelező rendszer alapok Kiadványunk célja, hogy a Nemzeti Közszolgálati Egyetemen használt Novell GroupWise (a továbbiakban GW) 1 Novell GroupWise levelező rendszer alapok Kiadványunk célja, hogy a Nemzeti Közszolgálati Egyetemen használt Novell GroupWise (a továbbiakban GW) levelező rendszer 8. verziójának alap szolgáltatásait

Részletesebben

17. előadás: Vektorok a térben

17. előadás: Vektorok a térben 17. előadás: Vektorok a térben Szabó Szilárd A vektor fogalma A mai előadásban n 1 tetszőleges egész szám lehet, de az egyszerűség kedvéért a képletek az n = 2 esetben szerepelnek. Vektorok: rendezett

Részletesebben

Struktúra nélküli adatszerkezetek

Struktúra nélküli adatszerkezetek Struktúra nélküli adatszerkezetek Homogén adatszerkezetek (minden adatelem azonos típusú) osztályozása Struktúra nélküli (Nincs kapcsolat az adatelemek között.) Halmaz Multihalmaz Asszociatív 20:24 1 A

Részletesebben

Angol szótár V2.0.0.0

Angol szótár V2.0.0.0 Angol szótár V2.0.0.0 Bemutató Verzió Felhasználói Kézikönyv Készítette: Szűcs Zoltán. 2536 Nyergesújfalu, Pala u. 7. Tel \ Fax: 33-355 - 712. Mobil: 30-529-12-87. E-mail: info@szis.hu. Internet: www.szis.hu.

Részletesebben

DÖNTÉSI MODELL KIALAKÍTÁSA KÖZBESZERZÉSI ELJÁRÁS SORÁN ELŐSZÓ

DÖNTÉSI MODELL KIALAKÍTÁSA KÖZBESZERZÉSI ELJÁRÁS SORÁN ELŐSZÓ Dr. Gyarmati József mk. őrnagy ZMNE BJKMK Katonai Logisztikai Minőségügyi és Közlekedésmérnöki Tanszék DÖNTÉSI MODELL KIALAKÍTÁSA KÖZBESZERZÉSI ELJÁRÁS SORÁN Absztrakt A cikk egy olyan algoritmust mutat

Részletesebben

Leggyakrabban használt adatbányászási technikák. Vezetői információs rendszerek

Leggyakrabban használt adatbányászási technikák. Vezetői információs rendszerek Leggyakrabban használt adatbányászási technikák ADATBÁNYÁSZÁS II. 1. A társításelemzés társítási szabályok (asszociációs szabályok) feltárását jelenti. Azt vizsgájuk, hogy az adatbázis elemei között létezik-e

Részletesebben

KOPI. KOPI Online Plágiumkereső és Információs Portál DSD. Pataki Máté MTA SZTAKI. Elosztott Rendszerek Osztály

KOPI. KOPI Online Plágiumkereső és Információs Portál DSD. Pataki Máté MTA SZTAKI. Elosztott Rendszerek Osztály KOPI Rendszerek Osztály KOPI Online Plágiumkereső és Információs Portál Pataki Máté MA SZAKI émakörök Bemutatkozás A KOPI projekt célja A rendszer működése A KOPI portál bemutatása ovábbfejlesztési lehetőségek

Részletesebben

OPTEN Online használati útmutató

OPTEN Online használati útmutató OPTEN Online használati útmutató www.opten.hu opten@opten.hu 2016. április - 1 - Tartalomjegyzék Bevezetés... - 4 - CÉGTÁR ALAP és KIEGÉSZÍTŐ szolgáltatások... - 7-1. Keresés / Leválogatás... - 8 - a)

Részletesebben

A szemantikus elemzés elmélete. Szemantikus elemzés (attribútum fordítási grammatikák) A szemantikus elemzés elmélete. A szemantikus elemzés elmélete

A szemantikus elemzés elmélete. Szemantikus elemzés (attribútum fordítási grammatikák) A szemantikus elemzés elmélete. A szemantikus elemzés elmélete A szemantikus elemzés elmélete Szemantikus elemzés (attribútum fordítási grammatikák) a nyelvtan szabályait kiegészítjük a szemantikus elemzés tevékenységeivel fordítási grammatikák Fordítóprogramok előadás

Részletesebben

Gráfok, definíciók. Gráfok ábrázolása. Az adott probléma megoldásához ténylegesen mely műveletek szükségesek. Ábrázolások. Példa:

Gráfok, definíciók. Gráfok ábrázolása. Az adott probléma megoldásához ténylegesen mely műveletek szükségesek. Ábrázolások. Példa: Gráfok, definíciók Irányítatlan gráf: G = (V,E), ahol E rendezetlen (a,b),a,b V párok halmaza. Irányított gráf: G = (V,E) E rendezett (a,b) párok halmaza; E V V. Címkézett (súlyozott) gráf: G = (V,E,C)

Részletesebben

1. JELENTKEZŐ ADATBÁZIS MODUL

1. JELENTKEZŐ ADATBÁZIS MODUL A toborzást-kiválasztást támogató humáninformatikai megoldásunk, a nexonjob, rugalmasan a vállalati egyedi igények alapján testre szabható. A rendszer webes felületén keresztül jelentkezhetnek a pályázók

Részletesebben

AKTUÁTOR MODELLEK KIVÁLASZTÁSA ÉS OBJEKTÍV ÖSSZEHASONLÍTÁSA

AKTUÁTOR MODELLEK KIVÁLASZTÁSA ÉS OBJEKTÍV ÖSSZEHASONLÍTÁSA AKTUÁTOR MODELLEK KIVÁLASZTÁSA ÉS OBJEKTÍV ÖSSZEHASONLÍTÁSA Kovács Ernő 1, Füvesi Viktor 2 1 Egyetemi docens, PhD; 2 tudományos segédmunkatárs 1 Eletrotechnikai és Elektronikai Tanszék, Miskolci Egyetem

Részletesebben

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 9 IX. ROBUsZTUs statisztika 1. ROBUsZTUssÁG Az eddig kidolgozott módszerek főleg olyanok voltak, amelyek valamilyen értelemben optimálisak,

Részletesebben

Adatbányászati technikák (VISZM185) 2015 tavasz

Adatbányászati technikák (VISZM185) 2015 tavasz Adatbányászati technikák (VISZM185) 2015 tavasz Csima Judit BME, VIK, Számítástudományi és Információelméleti Tanszék 2015. február 11. Csima Judit Adatbányászati technikák (VISZM185) 2015 tavasz 1 / 27

Részletesebben

Műveletek makrókkal. Makró futtatása párbeszédpanelről. A Színezés makró futtatása a Makró párbeszédpanelről

Műveletek makrókkal. Makró futtatása párbeszédpanelről. A Színezés makró futtatása a Makró párbeszédpanelről Műveletek makrókkal A munkafüzettel együtt tárolt, minden munkalapon elérhető makrót a Fejlesztőeszközök szalag Makrók párbeszédpanelje segítségével nyithatjuk meg, innen végezhetjük el a makrókkal megoldandó

Részletesebben

Diszkrét matematika II., 5. előadás. Lineáris egyenletrendszerek

Diszkrét matematika II., 5. előadás. Lineáris egyenletrendszerek 1 Diszkrét matematika II, 5 előadás Lineáris egyenletrendszerek Dr Takách Géza NyME FMK Informatikai Intézet takach@infnymehu http://infnymehu/ takach/ 2007 március 8 Egyenletrendszerek Középiskolás módszerek:

Részletesebben

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 10 X. SZIMULÁCIÓ 1. VÉLETLEN számok A véletlen számok fontos szerepet játszanak a véletlen helyzetek generálásában (pénzérme, dobókocka,

Részletesebben

ElektrO-ParT elektronikai alkatrész nyilvántartó program leírás.

ElektrO-ParT elektronikai alkatrész nyilvántartó program leírás. ElektrO-ParT elektronikai alkatrész nyilvántartó program leírás. 1. ábra A program, indítás után az 1. ábra szerint fog megjelenni. Ebben az ablakban tudunk új alkatrészt felvinni vagy meglévőt módosítani.

Részletesebben

MKVK Informatikai Tagozat. Elnökségi beszámoló 2012

MKVK Informatikai Tagozat. Elnökségi beszámoló 2012 MKVK Informatikai Tagozat Elnökségi beszámoló 2012 1 1/17/2013 Működik ez a tagozat egyáltalán? 2 1/17/2013 A MKVK Informatikai Tagozatának Ügyrendje 1. A Tagozat céljai: A Tagozat önkéntes alapon, a szakmai

Részletesebben

Gyorsjelentés. az informatikai eszközök iskolafejlesztő célú alkalmazásának országos helyzetéről 2011. február 28-án, elemér napján KÉSZÍTETTÉK:

Gyorsjelentés. az informatikai eszközök iskolafejlesztő célú alkalmazásának országos helyzetéről 2011. február 28-án, elemér napján KÉSZÍTETTÉK: Gyorsjelentés az informatikai eszközök iskolafejlesztő célú alkalmazásának országos helyzetéről 2011. február 28-án, elemér napján KÉSZÍTETTÉK: Hunya Márta PhD Kőrösné dr. Mikis Márta Tartsayné Németh

Részletesebben

Közfoglalkoztatás támogatás megállapítását segítő segédtábla használati útmutatója

Közfoglalkoztatás támogatás megállapítását segítő segédtábla használati útmutatója Közfoglalkoztatás támogatás megállapítását segítő segédtábla használati útmutatója 1.) Általános tudnivalók: A segédtábla két méretben készül, 10, és 50 sort lehet kitölteni. A tábla megnevezéséből amit

Részletesebben

dr.xlsx A programról Szövegműveletekhez használható függvények

dr.xlsx A programról Szövegműveletekhez használható függvények dr.xlsx A programról A CD struktúrája A CD 9 munkafüzetben mutatja be a Microsoft Excel 2003, 2007 és 2010 függvényeit. Az egyes munkafüzetek a "tartalom" munkafüzetből érhetők el a munkafüzet nevére kattintással.

Részletesebben

Skalárszorzat, norma, szög, távolság. Dr. Takách Géza NyME FMK Informatikai Intézet takach@inf.nyme.hu http://inf.nyme.hu/ takach/ 2005.

Skalárszorzat, norma, szög, távolság. Dr. Takách Géza NyME FMK Informatikai Intézet takach@inf.nyme.hu http://inf.nyme.hu/ takach/ 2005. 1 Diszkrét matematika II., 4. el adás Skalárszorzat, norma, szög, távolság Dr. Takách Géza NyME FMK Informatikai Intézet takach@inf.nyme.hu http://inf.nyme.hu/ takach/ 2005. március 1 A téma jelent sége

Részletesebben

A lineáris programozás alapfeladata Standard alak Az LP feladat megoldása Az LP megoldása: a szimplex algoritmus 2018/

A lineáris programozás alapfeladata Standard alak Az LP feladat megoldása Az LP megoldása: a szimplex algoritmus 2018/ Operációkutatás I. 2018/2019-2. Szegedi Tudományegyetem Informatika Intézet Számítógépes Optimalizálás Tanszék 2. Előadás LP alapfeladat A lineáris programozás (LP) alapfeladata standard formában Max c

Részletesebben

Informatika 5 8. évfolyama számára heti 1 óra. Óraterv 5 8. évfolyam 5. évf. 6. évf. 7. évf. 8. évf. Informatika heti 1 óra 1 1 1 1.

Informatika 5 8. évfolyama számára heti 1 óra. Óraterv 5 8. évfolyam 5. évf. 6. évf. 7. évf. 8. évf. Informatika heti 1 óra 1 1 1 1. Informatika 5 8. évfolyama számára heti 1 óra Óraterv 5 8. évfolyam 5. évf. 6. évf. 7. évf. 8. évf. Informatika heti 1 óra 1 1 1 1 Az óraszámok megadásánál 36 tanítási héttel számoltunk. Bevezető Az informatikaórákon

Részletesebben

Algoritmusok Tervezése. 6. Előadás Algoritmusok 101 Dr. Bécsi Tamás

Algoritmusok Tervezése. 6. Előadás Algoritmusok 101 Dr. Bécsi Tamás Algoritmusok Tervezése 6. Előadás Algoritmusok 101 Dr. Bécsi Tamás Mi az algoritmus? Lépések sorozata egy feladat elvégzéséhez (legáltalánosabban) Informálisan algoritmusnak nevezünk bármilyen jól definiált

Részletesebben

Amortizációs költségelemzés

Amortizációs költségelemzés Amortizációs költségelemzés Amennyiben műveleteknek egy M 1,...,M m sorozatának a futási idejét akarjuk meghatározni, akkor egy lehetőség, hogy külön-külön minden egyes művelet futási idejét kifejezzük

Részletesebben