Szövegbányászat és dokumentum kezelés
|
|
- Ödön Kozma
- 9 évvel ezelőtt
- Látták:
Átírás
1 Szövegbányászat és dokumentum kezelés 3. Előfeldolgozás, klaszterezés A dokumentumok reprezentálása A dokumentum a szavak együttese A dokumentum rendszerben különböző szavak eltérő súlyúak a téma azonosításában atomreaktor valamint Adott a szó-dokumentum mátrix: K (BOW modellre igazodik) Antony and Cleopatra Julius Caesar The Tempest Hamlet Othello Macbeth Antony Brutus Caesar Calpurnia Cleopatra mercy worser
2 A dokumentumok reprezentálása A szó-dokumentum mátrixból dokumentum reprezentációs vektorok képezhetők A legegyszerűbb eset a bináris reprezentáció: di ( di1,..., dim ) ahol d 1, ha K > 0 = 0 A bináris reprezentáció előnye: - kis költség (gyors, helyigény) - közelítésre alkalmas - a lényeges különbséget meg tudja fogni A dokumentumok reprezentálása A pontosabb mérőszám a súlyozott reprezentáció: di ( di1,..., dim ) d = K Nem pontos a lényegi különbségek kiemelésében túl nagy súly a nagy gyakorisághoz Sokszor a gyűjteménytámogatottságot is szokás vizsgálni: cf i = K j Tompítani kell a nagy értékek szerepét, logaritmikus súlyozás: d 1+ log K ha K > 0 = 0 2
3 A dokumentumok reprezentálása Az eddigi modellek nem veszik figyelembe a dokumentum hosszát, pedig a df=2 érték szerepe más lesz L=6 vagy L=655 esetében Normalizált súlyozás d 1+ log K = K i 0 ha K > 0 d = tf = K i K Ezt a mérőszámot nevezik szó gyakoriságnak is (frequency) (TF) A szavak fontosságának mérése A szónak a dokumentumbeli fontosságát csak részleges mutatja TF vagy CF. Fontos a szavak eloszlásának ismerete is (minden dokumentumban szerepel vagy csak néhányban) Dokumentum számosság (a befoglaló dokumentumok darabszáma) df i TF IDF mérőszám A fontosság mérése: w = tf n log( df j ) Jól jellemezze az adott szó megkülönböztető szerepét a dokumentumhalmazban 3
4 A szavak fontosságának mérése A TF-IDF súlyozás előnyei: - magas lesz azon szavaknál amelyek csak néhány dokumentumban fordulnak elő nagy súllyal - kicsi lesz ott az értéke, ahol a tartalmazó dokumentumok darabszáma igen magas - kicsi lesz ott, ahol a szó csak nagyon ritkán fordul elő a dokumentumban Normalizált TF-IDF w = tf n log( df n ( tf i log( df j ) j 2 )) A lényegtelen szavak eliminálása A feladat szempontjából nem releváns szavak elhagyhatók a rendszerből Stopword: az elhagyható szavakat jelenti A stopword lista témától függően változhat: - egzakt keresés : kis lista (kb 100) - tartalom alapú keresés, kivonatolás: nagy lista (kb. 1000) a,able,about,across,after,all,almost,also,am,among,an,and,any,are,as,at, be,because,been,but,by,can,cannot,could,dear,did,do,does,either,else,ever,every, for,from,get,got,had,has,have,he,her,hers,him,his,how,however,i,if,in,into, is,it,its,just, least,let,like, likely,may,me,might,most,must,my,neither,no,nor,not,of,off,often,on, only,or,other,our,own, rather,said,say,says,she,should,since,so,some,than,that,the, their, them,then,there,these,they,this,tis,to,too,twas, us,wants,was,we,were,what, when,where,which,while,who,whom,why, will,with,would,yet,you,your Az angol stopword lista 4
5 A dokumentum tagolása Az értelmezésnél, a keresésnél lényeges lehet a dokumentum szerkezetének ismerete is - lehet egy megadott részre vonatkoztatni a keresést - lehet az eltérő részeket másképp súlyozni A szerkezet egy hierarchia A szerkezet feltárásának költsége jelentősen függ a formátumtól - LATEX, XML : önleíró szerkezet - PDF: nagyobb munka a darabolás - TXT : tartalom megértés kell hozzá A dokumentum tagolása Igen eltérő dokumentum modellek léteznek 5
6 A dokumentum tagolása Egyszerűsített szerkezeti hierarchia dokumentum készlet dokumentum metadata törzs bekezdés szekció mondat kifejezés szó A dokumentum tagolása Szekciókra tagolás Szeparátor elemek: - metaadat tagok - formátum jelek - séma Témakör függő algoritmus Mondatokra tagolás Egyszerűbb feladatnak tűnik, de itt is több buktató léphet fel: - a pont mondat közben is megjelenhet (rövidítések) - nagybetű a mondat közben is megjelenhet - az almondatot nem pont határolja - hiányozhatnak a mondathatároló jelek Következő megálló a Margit krt. Moszkva tér felőli oldalén lesz Következő megálló a Margit krt. Moszkva térnél van a végállomás. 6
7 A dokumentum tagolása Kifejezésekre tagolás Token: egy kifejezés a mondatban Típus: az azonos karaktersorozatot alkotó tokenek csoportja Szeparátor elemek: - szóköz karakterek - mondatvég karakter - soremelés karakter Nehézséget okoznak: - kötőjel (elválasztó jel vagy nem: adatbázis-kezelés) - aposztróf (nemt om) - egyéb írásjelek (W.C.) - többszavas kifejezések A HUNTOKEN projekt A 2000-es évek elején elkészült magyar nyelvre adaptált tokenizáló program Magyar projket (BME), Unix alapú környezet (v. cygwin) A bemenő txt file-ból xml kimenetet állít elő <s> mondat </s> <w> szo </w> <c> irasjel </c> A Flex és C nyelven implementált A szegedi korpuszt 98% pontossággal tokenizálja mondatból csak 1071 a hibás 7
8 A HUNTOKEN projekt A Huntoken program Flex nyelven írt, csőbe (pipe) kötött szűrőprogramokból áll. A csővezetéket a Huntoken parancs indítja el. A cs!be kötött szűrőprogramok: hun_clean hun_sentence hun_abbrev hun_sentclean hun_token hun_head karaktereket törli, illetve átalakító szűrő mondatra bontó szűrő a mondatra bontást javító szűrő mondatra bontás eredményét formázó szűrő szavakra bontó és nyitott tokeneket felismerő szűrő XML fej- és láblécet kiíró héjprogram A HUNTOKEN projekt A HUN_CLEAN szűrő A szűrő normalizálja a bemenő szöveges állományokat a következő műveletek elvégzésével: - ismétlődő szóköz értékű karakterek törlése - ismétlődő üres sorok és közbeékelt szóközök törlése - sor eleji és sor végi szóközök törlése - nem törő szóközök szóközzé alakítása - Windows-1250 karakterek ISO es HTML entitássokká alakítása - decimális karakterkódok esetén az alsó ASCII, és a magyar!, ", #, $ karakterré alakítása < és > átalakítása < és &t;-re (a kés!bbi XML kimenet miatt) -...-tá alakítása - az összes ISO ben szerepl! ISO es entitás karakterré alakítása (például á á) A HUN_SENTENCE szűrő A szűrő <s> nyitó- és </s> zárócímke közé zárja a felismert mondatokat, vagyis elvégzi a mondatra bontást. 8
9 A HUN_ABBREV szűrő A HUNTOKEN projekt A megadott rövidítések,és más beépített szabályok alapján felülbírálja, és szükség esetén módosítja a Hun_sentence által megállapított mondathatárokat, valamint a Hun_token által megállapított szóhatárokat. A következ! helyeken szünteti meg a mondathatárt: - sorszám és nagy kezdőbetűs szavak között - sorszám és utána zárójeles, római számos dátum esetén - ügyiratszám és az azt követő zárójeles dátum esetén - sorszám és paragrafusjel között - monogramok esetén - A megadott rövidítések esetén. (A stb. nincs megadva.) A HUN_SENTCLEAN szűrő A szűrő paragrafushatárokat illeszt be az üres sorok helyére, illetve minden mondatot külön sorba helyez el. A HUN_TOKEN szűrő A HUNTOKEN projekt A szavakat <w> nyitó- és </w> zárócímke közé helyezi. Az eredeti mondatokat meghagyja a <s> nyitócímkével egy sorban is. Az írásjelek a,,c'' elembe kerülnek. A nyitott tokenosztályba eső tokenek MSD kódja az,,anav'' elembe kerül. A következ! nyitott tokenek felismerésére kerül sor: - m = toldalékmorfémák (-ság, -t!l/-t!l) - e = elektronikus címek, , webhely, útvonal, fájlkiterjesztés, egyéb - indexek (trade mark, registered trade mark) - számok: (sport)eredmények, el!jeles egész számok, id!pont, dátum, pontot tartalmazó számok, százalékjelet tartalmazó számok, fokjelet tartalmazó számok, arány (SI mértékegységgel), méret jellel, képletek - azonosítók (szabvány jelzete, telefonszám, írásm" része,isbn kód, rendszám - egyéb köt!jellel kezd!d!, vagy végz!d! szavak - számmal és bet"vel jelölt számok 9
10 Java Tokenizer edu.northwestern.at.utils.swing Class DocumentTokenizer java.lang.object edu.northwestern.at.utils.swing.documenttokenizer implements java.util.iterator Tokenizes document text. A token is defined as text between word separator characters. The separator characters are defined below in the WORD_SEPARATOR_CHARACTERS array. Document document = textpane.getdocument(); DocumentTokenizer tokenizer = new DocumentTokenizer( document, 0 ); while ( tokenizer.hasnext() ) { String word = tokenizer.next(); System.out.println( word + " starts at " + tokenizer.getstartpos() + ", ends at " + tokenizer.getendpos() ); } 10
Szövegbányászat Információ Visszakeresés és egyéb alkalmazások
Szövegbányászat Információ Visszakeresés és egyéb alkalmazások A diák nagyban támaszkodnak a Stanford Egyetem Information Retrieval and Web-mining kurzusának anyagára: http://www-csli.stanford.edu/~schuetze/information-retrieval-book.html
Szövegbányászat és dokumentum kezelés
Szövegbányászat és dokumentum kezelés 1. Szöveg bányászat alapfogalmai Szövegbányászat Szövegbányászat = szöveg + bányászat Rövid történeti áttekintés: 1958 (Luhn): lényeges szavak kiemelése a szövegből
3. modul - Szövegszerkesztés
3. modul - Szövegszerkesztés Érvényes: 2009. február 1-jétől Az alábbiakban ismertetjük a 3. modul (Szövegszerkesztés) syllabusát, amely a gyakorlati vizsga alapját képezi. A modul célja Ezen a vizsgán
XML / CSV specifikáció
Ajánlatok átadása az rendszerébe Termékeinek az Olcsóbbat.hu rendszerében történő megjelenítéséhez termékadatbázisát az ebben a dokumentumban megfogalmazott szabályoknak megfelelően kell formáznia, legyen
Kaszás Tímea: Corvina OPAC az SZTE Mez gazdasági Könyvtárában
Kaszás Tímea: Corvina OPAC az SZTE Mez gazdasági Könyvtárában Bevezetés Az amerikai Voyager integrált könyvtári rendszer magyar installálásának eredménye a Corvina rendszer. A Corvina-t használó könyvtárak
Témák. Bevezetés az informatikába 7. Előadás. Szövegfile-ok típusai. Szövegszerkesztők típusai. Mértékegységek. Szövegszerkesztők szolgáltatásai
Bevezetés az informatikába 7. Előadás Számítógépes dokumentumkészítés I Témák Szövegfile-ok típusai Szövegszerkesztők típusai Szövegszerkesztők szolgáltatásai Microsoft Word szövegszerkesztők Szövegfile-ok
Bevezetés a számítástechnikába
Bevezetés a számítástechnikába Beadandó feladat, kódrendszerek Fodor Attila Pannon Egyetem Műszaki Informatikai Kar Villamosmérnöki és Információs Rendszerek Tanszék foa@almos.vein.hu 2010 október 12.
Tranzakció import funkció import fájl formátumai
K&H Bank Zrt. 1095 Budapest, Lechner Ödön fasor 9. telefon: (06 1) 328 9000 fax: (06 1) 328 9696 Budapest 1851 www.kh.hu bank@kh.hu Tranzakció import funkció import fájl formátumai K&H vállalkozói e-bankban
7. Laboratóriumi gyakorlat: Vezérlési szerkezetek II.
7. Laboratóriumi gyakorlat: Vezérlési szerkezetek II. A gyakorlat célja: 1. A shell vezérlő szerkezetei használatának gyakorlása. A használt vezérlő szerkezetek: if/else/fi, for, while while, select, case,
8. Laboratóriumi gyakorlat: Bevezetés a reguláris kifejezések használatába
8. Laboratóriumi gyakorlat: Bevezetés a reguláris kifejezések használatába A gyakorlat célja: 1. A gyakorlat célja a reguláris kifejezések használatának megismerése. A grep parancs használatának elsajátítása
3. modul - Szövegszerkesztés
3. modul - Szövegszerkesztés - 1-3. modul - Szövegszerkesztés Az alábbiakban ismertetjük a 3. modul (Szövegszerkesztés) syllabusát, amely a modulvizsga követelményrendszere. A modul célja Ezen a vizsgán
Írásjelek helyes szedése. Szabó Csaba. Mondatvégi írásjelek. Központozás. Kötőjelfélék. Szabó Csaba november 18.
2008. november 18. A magyar nyelvben a mondatok modalitásának kifejezésére mondatvégi et használunk. Kijelentő mondat esetén pontot (.). A magyar nyelvben a mondatok modalitásának kifejezésére mondatvégi
BASH script programozás II. Vezérlési szerkezetek
06 BASH script programozás II. Vezérlési szerkezetek Emlékeztető Jelölésbeli különbség van parancs végrehajtása és a parancs kimenetére való hivatkozás között PARANCS $(PARANCS) Jelölésbeli különbség van
XML / CSV specifikáció
Ajánlatok átadása az rendszerébe Termékeinek az Olcsóbbat.hu rendszerében történő megjelenítéséhez termékadatbázisát az ebben a dokumentumban megfogalmazott szabályoknak megfelelően kell formáznia, legyen
AWK programozás, minták, vezérlési szerkezetek
10 AWK programozás, minták, vezérlési szerkezetek AWK adatvezérelt szkriptnyelv text processing, adat kiterjesztés, tagolt adatok automatizált soronkénti feldolgozása a forrásállományt soronként beolvassa
Szövegbányászati rendszer fejlesztése a Magyar Elektronikus Könyvtár számára
Szövegbányászati rendszer fejlesztése a Magyar Elektronikus Könyvtár számára Vázsonyi Miklós VÁZSONYI Informatikai és Tanácsadó Kft. BME Információ- és Tudásmenedzsment Tanszék 1/23 Tartalom A MEK jelenlegi
AWK programozás, minták, vezérlési szerkezetek
10 AWK programozás, minták, vezérlési szerkezetek AWK futtatási módok AWK parancs, közvetlen programkódmegadás: awk 'PROGRAMKÓD' FILE példa: ls -l awk '{print $1, $5}' a programkód helyére minden indentálás
2. Készítsen awk szkriptet, amely kiírja az aktuális könyvtár összes alkönyvtárának nevét, amely februári keltezésű (bármely év).
1. fejezet AWK 1.1. Szűrési feladatok 1. Készítsen awk szkriptet, ami kiírja egy állomány leghosszabb szavát. 2. Készítsen awk szkriptet, amely kiírja az aktuális könyvtár összes alkönyvtárának nevét,
4. Javítás és jegyzetek
és jegyzetek Schulcz Róbert schulcz@hit.bme.hu A tananyagot kizárólag a BME hallgatói használhatják fel tanulási céllal. Minden egyéb felhasználáshoz a szerző engedélye szükséges! 1 Automatikus javítás
8. Laboratóriumi gyakorlat: Bevezetés a reguláris kifejezések használatába
8. Laboratóriumi gyakorlat: Bevezetés a reguláris kifejezések használatába A gyakorlat célja: 1. A gyakorlat célja a reguláris kifejezések használatának megismerése. A grep parancs használatának elsajátítása
AWK programozás Bevezetés
09 AWK programozás Bevezetés AWK adatvezérelt szkriptnyelv text processing, adat kiterjesztés, tagolt adatok automatizált soronkénti feldolgozása a forrásállományt soronként beolvassa és feldolgozhatóvá
Szoftver alapfogalmak
Szoftver alapfogalmak Azon a programok algoritmusok, eljárások, és hozzájuk tartozó dokumentációk összessége, melyek a számítógép működéséhez szükségesek. (nem kézzel fogható, szellemi termékek) Algoritmus
Tájékoztató. Használható segédeszköz: -
A 12/2013. (III. 29.) NFM rendelet szakmai és vizsgakövetelménye alapján. Szakképesítés, azonosítószáma és megnevezése 54 481 06 Informatikai rendszerüzemeltető Tájékoztató A vizsgázó az első lapra írja
13. Fájlformátumok. Schulcz Róbert schulcz@hit.bme.hu Madarassy László lmadarassy@mik.bme.hu. 13. Fájlformátumok v2011.05.04.
Schulcz Róbert schulcz@hit.bme.hu Madarassy László lmadarassy@mik.bme.hu A tananyagot kizárólag a BME hallgatói használhatják fel tanulási céllal. Minden egyéb felhasználáshoz a szerzı engedélye szükséges!
Globalizáció, Lokalizáció
Globalizáció, Lokalizáció Tóth Zsolt Miskolci Egyetem 2013 Tóth Zsolt (Miskolci Egyetem) Globalizáció, Lokalizáció 2013 1 / 19 Tartalomjegyzék 1 Bevezetés 2 System.Globalization 3 System.Resources Tóth
Flex tutorial. Dévai Gergely
Flex tutorial Dévai Gergely A Flex (Fast Lexical Analyser) egy lexikáliselemz -generátor: reguláris kifejezések sorozatából egy C/C++ programot generál, ami szövegfájlokat képes lexikai elemek sorozatára
Érdekes informatika feladatok
A keres,kkel és adatbázissal ellátott lengyel honlap számos díjat kapott: Spirit of Delphi '98, Delphi Community Award, Poland on the Internet, Golden Bagel Award stb. Az itt megtalálható komponenseket
HORVÁTH ZSÓFIA 1. Beadandó feladat (HOZSAAI.ELTE) ápr 7. 8-as csoport
10-es Keressünk egy egész számokat tartalmazó négyzetes mátrixban olyan oszlopot, ahol a főátló alatti elemek mind nullák! Megolda si terv: Specifika cio : A = (mat: Z n m,ind: N, l: L) Ef =(mat = mat`)
emberi kivonatolás Lengyelné dr. Molnár Tünde
Kivonatoló program kontra emberi kivonatolás Lengyelné dr. Molnár Tünde Eszterházy Károly Főiskola Kivonatoló program Magyar nyelvű offline kivonatoló program kvantitatív tartalomelemzés l egységeit a
A Magyar Nemzeti Szövegtár új változatáról Váradi Tamás
A Magyar Nemzeti Szövegtár új változatáról Váradi Tamás varadi@nytud.mta.hu MTA Nyelvtudományi Intézet Nyelvtechnológiai és Alkalmazott Nyelvészeti Osztály Tartalom Előzmény Motiváció Cél Fejlesztés Eredmény
Forráskód formázási szabályok
Forráskód formázási szabályok Írta: Halmai Csongor, Webcenter Bt. A php és html kódrészletek Ugyanazon fájlon belül nem szerepelhet php kód és html tartalom. E kettő különválasztására smarty-t vagy más
Büki András UNIX/Linux héjprogramozás Büki András: UNIX/Linux héjprogramozás Büki András Felelõs kiadó a Kiskapu Kft. ügyvezetõ igazgatója 2002 Kiskapu Kft. 1081 Budapest Népszínház u. 29. Tel: (+36-1)
Bár a szoftverleltárt elsősorban magamnak készítettem, de ha már itt van, miért is ne használhatná más is.
SZOFTVERLELTÁR FREE Amennyiben önnek vállalkozása van, akkor pontosan tudnia kell, hogy milyen programok és alkalmazások vannak telepítve cége, vállalkozása számítógépeire, és ezekhez milyen engedélyeik,
ELEMI PROGRAMOZÁSI TÉTELEK
ELEMI PROGRAMOZÁSI TÉTELEK 1. FELADATMEGOLDÁS PROGRAMOZÁSI TÉTELEKKEL 1.1 A programozási tétel fogalma A programozási tételek típusalgoritmusok, amelyek alkalmazásával garantáltan helyes megoldást adhatunk
Témák. Informatika I Eladás. Szövegfile-ok típusai. Szövegszerkesztk típusai. Mértékegységek. Szövegszerkesztk szolgáltatásai
Informatika I Eladás Számítógépes dokumentumkészítés I Témák Szövegfile-ok típusai Szövegszerkesztk típusai Szövegszerkesztk szolgáltatásai Microsoft Word szövegszerkesztk Szövegfile-ok típusai Formázatlan
BME MOGI Gépészeti informatika 13.
BME MOGI Gépészeti informatika 13. 1. feladat Készítsen alkalmazást, mely elvégzi a következő feladatokat! a. Állítson elő adott intervallumba eső, adott számú véletlen számot, és írja ki a számokat egy
Programozás alapjai. 6. gyakorlat Futásidő, rekurzió, feladatmegoldás
Programozás alapjai 6. gyakorlat Futásidő, rekurzió, feladatmegoldás Háziellenőrzés Egészítsd ki úgy a simplemaths.c programot, hogy megfelelően működjön. A program feladata az inputon soronként megadott
Írjon olyan programot a standard könyvtár alkalmazásával, amely konzolról megadott valós adatokból meghatározza és kiírja a minimális értékűt!
Írjon olyan programot a standard könyvtár alkalmazásával, amely konzolról megadott valós adatokból meghatározza és kiírja a minimális értékűt! valós adatokat növekvő sorrendbe rendezi és egy sorba kiírja
Mintaillesztő algoritmusok. Ölvedi Tibor OLTQAAI.ELTE
Mintaillesztő algoritmusok Ölvedi Tibor OLTQAAI.ELTE Mintaillesztő algoritmusok Amiről szó lesz: Bruteforce algoritmus Knuth-Morris-Pratt algoritmus Rabin-Karp algoritmus Boyer-Moore algoritmus Boyer-Moore-Horspool
Regionális forduló november 19.
Regionális forduló 2016. november 19. 9-10. osztályosok feladata Feladat Írjatok Markdown HTML konvertert! A markdown egy nagyon népszerű, nyílt forráskódú projektekben gyakran használt, jól olvasható
Regionális forduló november 19.
Regionális forduló 2016. november 19. 11-13. osztályosok feladata Feladat Írjatok Markdown HTML konvertert! A markdown egy nagyon népszerű, nyílt forráskódú projektekben gyakran használt, jól olvasható
Operációs Rendszerek II. labor. 2. alkalom
Operációs Rendszerek II. labor 2. alkalom Mai témák (e)grep Shell programozás (részletesebben, példákon keresztül) grep Alapvető működés: mintákat keres a bemeneti csatorna (STDIN vagy fájl) soraiban,
BUJDOSO GYÖNGYI FAZEKAS ATTILA // / / KEZDOLEPESEK TERTIA KIADÓ
BUJDOSO GYÖNGYI FAZEKAS ATTILA // / / KEZDOLEPESEK TERTIA KIADÓ Tartalomjegyzék Előszó 13 1. A plaintex 19 Bevezető 21 1. Alapvető tudnivalók 23 1.1. A TgK használata vázlatosan 23 1.2. Betűk és jelek
ECDL Táblázatkezelés. www.nomina3p.hu 1. 4.1.1 A táblázatkezelés első lépései. 4.1.2 Beállítások elvégzése
4.1 Az alkalmazás 4.1.1 A táblázatkezelés első lépései 4.1.2 Beállítások elvégzése 4.1.1.1 A táblázatkezelő alkalmazás megnyitása és bezárása. 4.1.1.2 Egy és több munkafüzet (dokumentum) megnyitása. 4.1.1.3
ÁSZF. 1. számú Melléklete. Postai Számlabefizetési Megbízás
ÁSZF 1. számú Melléklete Postai Számlabefizetési Megbízás elszámolásforgalmi rendszere és szabályai, az alkalmazott elszámolásforgalmi összesítők, valamint rekordszerkezetek leírása 1 / 11 Jelen Melléklet
Minta felvételi feladatsor programozásból
. feladat: Rendezés (2 pont) A Comenius Logo egyik játékprogramjában békákat kell sorba rakni úgy, hogy lépésenként kijelölhetjük, hogy melyik béka ugorjon. gorni vagy csak szomszédos zsombékra lehet,
A LOGSYS GUI. Fehér Béla Raikovich Tamás, Laczkó Péter BME MIT FPGA laboratórium
BUDAPESTI MŐSZAKI ÉS GAZDASÁGTUDOMÁNYI EGYETEM VILLAMOSMÉRNÖKI ÉS INFORMATIKAI KAR MÉRÉSTECHNIKA ÉS INFORMÁCIÓS RENDSZEREK TANSZÉK A LOGSYS GUI Fehér Béla Raikovich Tamás, Laczkó Péter BME MIT atórium
Tipikus hibák a szövegszerkesztésben. Dr. Nyéki Lajos 2017
Tipikus hibák a szövegszerkesztésben Dr. Nyéki Lajos 2017 Szóközök vagy tabulátor helytelen használata a bekezdés első sorában Ne használjunk szóközöket vagy tabulátort a bekezdés első sorának behúzására!
Bináris egység: bit (binary unit) bit ~ b; byte ~ B (Gb Gigabit;GB Gigabyte) Gb;GB;Gib;GiB mind más. Elnevezés Jele Értéke Elnevezés Jele Értéke
Kódolások Adatok kódolása Bináris egység: bit (binary unit) bit ~ b; byte ~ B (Gb Gigabit;GB Gigabyte) Gb;GB;Gib;GiB mind más. Elnevezés Jele Értéke Elnevezés Jele Értéke Kilo K 1 000 Kibi Ki 1 024 Mega
Angol szótár V2.0.0.0
Angol szótár V2.0.0.0 Bemutató Verzió Felhasználói Kézikönyv Készítette: Szűcs Zoltán. 2536 Nyergesújfalu, Pala u. 7. Tel \ Fax: 33-355 - 712. Mobil: 30-529-12-87. E-mail: info@szis.hu. Internet: www.szis.hu.
QBE Édes Otthon lakásbiztosítás tarifáló webservice. Fejlesztői dokumentáció 1.0.2
QBE Édes Otthon lakásbiztosítás tarifáló webservice Fejlesztői dokumentáció 1.0.2 Az ebben a dokumentumban található információ a FoxArt Kft. tulajdona, és bizalmas anyagként került átadásra. Az anyag
Belföldi Termékosztályozás V2.0.0.0
Belföldi Termékosztályozás V2.0.0.0 Bemutató Verzió Felhasználói Kézikönyv Készítette: Szűcs Zoltán. 2536 Nyergesújfalu, Pala u. 7. Tel \ Fax: 33-355 - 712. Mobil: 30-529-12-87. E-mail: info@szis.hu Internet:
Szövegszerkesztés alapok
Szövegszerkesztés alapok Libre Office Writer http://szabadut.fsf.hu/ Szöveg szerkesztő programok Editorok Szövegszerkesztők (Word processor) Kiadványszerkesztők (DTP) Fájlformátumok TXT fájlok editorok
Regisztrálási útmutató
Regisztrálási útmutató Az első feladat a FONIO szolgáltatás igénybevételéhez, hogy adatait megadva beregisztrál a weboldalunkon: www.fonio.hu. a. A weboldalunk ( www.fonio.hu ) elindítása után válassza
TestLine - GINOP teszt Minta feladatsor
GINOP képzés szintfelmérő tesztje Mit lehet a HTML-el csinálni 1. 1:10 Könnyű emutatót készíteni Weblapot készíteni Jósolni Szöveget szerkeszteni Melyek tartoznak az operációs rendszer alapvető feladatai
S z á m í t ó g é p e s a l a p i s m e r e t e k
S z á m í t ó g é p e s a l a p i s m e r e t e k 7. előadás Ami eddig volt Számítógépek architektúrája Alapvető alkotóelemek Hardver elemek Szoftver Gépi kódtól az operációs rendszerig Unix alapok Ami
length (s): Az s karaklerlánc hossza, substr(s,m,n): Az s mezőben levő karakterláncnak az m-edik karakterétől kezdődő, n darab karaktert vágja ki.
9. Gyakorlat AWK 2 length (s): Az s karaklerlánc hossza, substr(s,m,n): Az s mezőben levő karakterláncnak az m-edik karakterétől kezdődő, n darab karaktert vágja ki. Ha az n-et elhagyjuk, akkor az m-ediktől
I. Internetes keresési feladatok (ajánlott idő: 20 perc)
I. Internetes keresési feladatok (ajánlott idő: 20 perc) A talált oldalak internet címét (URL) másold ki egy szöveges dokumentumba és mentsd Csapatnev_internet néven! A konkrét válaszokat ide a papírra
A Békés Megyei Könyvtár Elektronikus Könyvtárának kialakítása
A Békés Megyei Könyvtár Elektronikus Könyvtárának kialakítása Előadók: Toldi Klára Vincze Andrea 1 Előzmények 1997-2002 A nemzetközi könyvtári trendek hatására a hazai könyvtárügyben is megjelenik az informatika
2. A Közvetlen Elektronikus Adatkapcsolatba bevont bizonylatok típusai. Okmány megnevezése Kódja Továbbítás helye
3004 H I V A T A L O S É R T E S Í T Õ 2010. évi 14. szám A pénzügyminiszter 2/2010. (II. 26.) PM tájékoztatója a jövedéki adatszolgáltatásokhoz kapcsolódó közvetlen elektronikus számítógépes kapcsolati
Web-programozó Web-programozó
Az Országos Képzési Jegyzékről és az Országos Képzési Jegyzékbe történő felvétel és törlés eljárási rendjéről szóló 133/2010. (IV. 22.) Korm. rendelet alapján. Szakképesítés, szakképesítés-elágazás, rész-szakképesítés,
Logikai adatmodell kialakítása
Logikai adatmodell kialakítása A logikai adatmodellezés célja: Segít az alkalmazási terület megértésében. Diagramjai révén világosan, pontosan és egyértelműen írja le a kommunikációs rendszert. lősegíti
Számítógépes Számítógépes Nyelvészet nyelvi nyelvi adatbázisok é s éés használatuk
Számítógépes Nyelvészet nyelvi adatbázisok és használatuk Középiskolás szakkör előadás fóliák http://www.inf.u-szeged.hu/hlt 2008.12.04. 1 Tartalom A számítógépes szövegfeldolgozás célja Nyelvi adatbázisok
Kitöltési útmutató 1.0 Verzió
Kitöltési útmutató 1.0 Verzió Az ABEV J16 számú 1.0 verzió számú KITÖLTŐ PROGRAM használatához 2009.03.01-től alkalmazandó Sorszámtartományok elszámolása című J16 számú nyomtatvány számítógéppel történő
Algoritmusok Tervezése. 6. Előadás Algoritmusok 101 Dr. Bécsi Tamás
Algoritmusok Tervezése 6. Előadás Algoritmusok 101 Dr. Bécsi Tamás Mi az algoritmus? Lépések sorozata egy feladat elvégzéséhez (legáltalánosabban) Informálisan algoritmusnak nevezünk bármilyen jól definiált
A HG-1 Treebank és keresőfelület fejlesztői munkái, használata és felhasználhatósága
A HG-1 Treebank és keresőfelület fejlesztői munkái, használata és felhasználhatósága Az elemzésektől a keresőfelületig DELITE Angol Nyelvészeti Tanszék 2014. 03. 12. Csernyi Gábor 1 Célok, előzmények Mit?
Egyirányban láncolt lista
Egyirányban láncolt lista A tárhely (listaelem) az adatelem értékén kívül egy mutatót tartalmaz, amely a következő listaelem címét tartalmazza. A láncolt lista első elemének címét egy, a láncszerkezeten
Gépi tanulás a gyakorlatban. Bevezetés
Gépi tanulás a gyakorlatban Bevezetés Motiváció Nagyon gyakran találkozunk gépi tanuló alkalmazásokkal Spam detekció Karakter felismerés Fotó címkézés Szociális háló elemzés Piaci szegmentáció analízis
Reguláris kifejezések 1.
Reguláris kifejezések 1. A nyelvtechnológia eszközei és nyersanyagai 1. gyakorlat A beadandó feladatok be vannak keretezve! 1.1. Miért hívják reguláris kifejezésnek? (!) Az elméleti és a gyakorlati reguláris
Országos Betétbiztosítási Alap
Országos Betétbiztosítási Alap Konszolidált Adat rekordszerkezetének leírása Változat: 3.1 verzió Hatályba lépés: 2013. augusztus 7. Készült: 2013. július 25-én A dokumentum története Változat Dátum (kiadás)
ECDL Információ és kommunikáció
1. rész: Információ 7.1 Az internet 7.1.1 Fogalmak és szakkifejezések 7.1.2 Biztonsági megfontolások 7.1.3 Első lépések a webböngésző használatában 7.1.4 A beállítások elévégzése 7.1.1.1 Az internet és
Operációs rendszerek gyakorlat
Operációs rendszerek gyakorlat 10. Gyakorlat Vakulya Gergely Az alapértelmezett változó - I. Sok függvény és vezérlési szerkezet alapértelmezett változóval tömörebbé tehető $_ while, , print, stb. 2
A normaszöveg Wordben történő szerkesztése során a következőkre figyelemmel lenni:
Melléklet A ParLex lehetőséget teremt arra, hogy megfelelően szerkesztett Worddokumentumok tartalmát a legtöbb esetben a rendszerben importálással is lehessen rögzíteni. Az importáláshoz szükséges, hogy
Mérés és modellezés 1
Mérés és modellezés 1 Mérés és modellezés A mérnöki tevékenység alapeleme a mérés. A mérés célja valamely jelenség megismerése, vizsgálata. A mérés tervszerűen végzett tevékenység: azaz rögzíteni kell
Jelentés fájl struktúra a TXT formában készülő jelentések részére
- 1 - Jelentés fájl struktúra a TXT formában készülő jelentések részére A jelentés fájl struktúrája két részből tevődik össze, az első rész a fejsor, amely a foglalkoztató - jelentő aktuális törzsadatait
dr.xlsx A programról Szövegműveletekhez használható függvények
dr.xlsx A programról A CD struktúrája A CD 9 munkafüzetben mutatja be a Microsoft Excel 2003, 2007 és 2010 függvényeit. Az egyes munkafüzetek a "tartalom" munkafüzetből érhetők el a munkafüzet nevére kattintással.
Országos Betétbiztosítási Alap
Országos Betétbiztosítási Alap Konszolidált Adat rekordszerkezetének leírása Készült: 2009. december 15-én IQSYS Zrt. H-1135 Budapest, Hun u. 2. Telefon: (1)-236-6400 Fax: (1)-236-6464 info@iqsys.hu www.iqsys.hu
Multimédiás adatbázisok
Multimédiás adatbázisok Multimédiás adatbázis kezelő Olyan adatbázis kezelő, mely támogatja multimédiás adatok (dokumentum, kép, hang, videó) tárolását, módosítását és visszakeresését Minimális elvárás
H N S A d a t K a p c s o l a t
HNS AdatKapcsolat HNS AdatKapcsolat 2009 március 31 HNS SPC Statisztikai folyamatszabályozó és minőségellenőrző program Copyright 1995-2009 HNS Műszaki Fejlesztő Kft. 9027 Győr, Gesztenyefa u. 4. Tel.:
OKTATÁSI MINISZTÉRIUM
OKTATÁSI MINISZTÉRIUM Szakmai írásbeli vizsgatétel Szakképesítés: 54 4641 01 Gazdasági informatikus I. (azonosító száma, megnevezése) Tantárgy: informatikai ismeretek Jóváhagyta: Az írásbeli vizsga időtartama:
Objektum Orientált Programozás IV.
Objektum Orientált Programozás IV. Műveletek karaktersorozatokkal Feladatok 1 Hallgatói Tájékoztató A jelen bemutatóban található adatok, tudnivalók és információk a számonkérendő anyag vázlatát képezik.
1. Alapok. #!/bin/bash
1. oldal 1.1. A programfájlok szerkezete 1. Alapok A bash programok tulajnképpen egyszerű szöveges fájlok, amelyeket bármely szövegszerkesztő programmal megírhatunk. Alapvetően ugyanazokat a at használhatjuk
Szkriptnyelvek. 1. UNIX shell
Szkriptnyelvek 1. UNIX shell Szkriptek futtatása Parancsértelmez ő shell script neve paraméterek shell script neve paraméterek Ebben az esetben a szkript tartalmazza a parancsértelmezőt: #!/bin/bash Szkriptek
MŰSZAKI DOKUMENTÁCIÓ. Aleph WebOPAC elérhetővé tétele okostelefonon. Eötvös József Főiskola 6500 Baja, Szegedi út 2.
Telefon: Fax: E-mail: (+36-1) 269-1642 (+36-1) 331 8479 info@ex-lh.hu www.ex-lh.hu Eötvös József Főiskola 6500 Baja, Szegedi út 2. MŰSZAKI DOKUMENTÁCIÓ Aleph WebOPAC elérhetővé tétele okostelefonon Pályázati
SABLONOZÓ KERETRENDSZER
SABRE SABLONOZÓ KERETRENDSZER 2014 1 FELHASZNÁLÓK Számtalan olyan vállalat és állami szervezet létezik, akik ügyfeleikkel sablonlevelek segítségével kommunikálnak, vagy sablonlevelekben értesítik partnereiket
file./script.sh > Bourne-Again shell script text executable << tartalmat néz >>
I. Alapok Interaktív shell-ben vagy shell-scriptben megadott karaktersorozat feldolgozásakor az első lépés a szavakra tördelés. A szavakra tördelés a következő metakarakterek mentén zajlik: & ; ( ) < >
Nyíregyházi Egyetem Matematika és Informatika Intézete. Fájl rendszer
1 Fájl rendszer Terminológia Fájl és könyvtár (mappa) koncepció Elérési módok Fájlattribútumok Fájlműveletek, fájlszerkezetek ----------------------------------------- Könyvtár szerkezet -----------------------------------------
PwC EKAER Tool felhasználói leírás. 2015. május
www.pwc.com/hu/ekaer PwC EKAER Tool felhasználói leírás 2015. május Tartalom Bejelentések létrehozása 3 1. A forrás Excel állomány kitöltése 3 2. A forrás Excel állomány mentése 4 A szükséges mezők kitöltését
end function Az A vektorban elõforduló legnagyobb és legkisebb értékek indexeinek különbségét.. (1.5 pont) Ha üres a vektor, akkor 0-t..
A Név: l 2014.04.09 Neptun kód: Gyakorlat vezető: HG BP MN l 1. Adott egy (12 nem nulla értékû elemmel rendelkezõ) 6x7 méretû ritka mátrix hiányos 4+2 soros reprezentációja. SOR: 1 1 2 2 2 3 3 4 4 5 6
1.1. A forrásprogramok felépítése Nevek és kulcsszavak Alapvető típusok. C programozás 3
Darvay Zsolt Típusok és nevek a forráskódban Állandók és változók Hatókörök és az előfeldolgozó Bevitel és kivitel Kifejezések Utasítások Mutatók Függvények Struktúrák és típusok Állománykezelés C programozás
Enterprise extended Output Management. exom - Greendoc Systems Kft. 1
Enterprise extended Output Management exom - Greendoc Systems Kft. 1 exom - Greendoc Systems Kft. 2 Sokféle bementi adatformátum kezelése Adatok fogadása különböző csatornákon Előfeldolgozás: típus meghatározás,
2. Algebrai átalakítások
I. Nulladik ZH-ban láttuk: 2. Algebrai átalakítások 1. Mi az alábbi kifejezés legegyszerűbb alakja a változó lehetséges értékei esetén? (A) x + 1 x 1 (x 1)(x 2 + 3x + 2) (1 x 2 )(x + 2) (B) 1 (C) 2 (D)
Adóhátralék kezelés egyszerűen. Használati útmutató
Használati útmutató Program indítása: A telepítés utáni első indításkor a program a szükséges alapbeállításokat elvégzi, és automatikusan újra indul. A főképernyőn a bejelentkezéshez mindig meg kell adni
Archivált tanulmányi adatok importálása. Felhasználói dokumentáció verzió 2.0.
Archivált tanulmányi adatok importálása Felhasználói dokumentáció verzió 2.0. Budapest, 2006 Változáskezelés Verzió Dátum Változás Pont Cím Oldal Kiadás: 2006.07.27. Verzió: 2.0. Oldalszám: 2 / 26 Tartalomjegyzék
ACTA CAROLUS ROBERTUS
ACTA CAROLUS ROBERTUS Károly Róbert Főiskola tudományos közleményei Alapítva: 2011 3 (1) ACTA CAROLUS ROBERTUS 3 (1) Informatika szekció SZÖVEGOSZTÁLYOZÁSI MÓDSZEREK A WEKA ADATBÁNYÁSZATI SZOFTVER SEGÍTSÉGÉVEL
11. Balra zárt igazítás A bekezdés sorai a bal oldali margóhoz igazodnak. 12. Beillesztés
1. Ablak A képernyő azon része, amelyben programok futhatnak. 2. Aláhúzott A karakter egyszeres vonallal történő aláhúzása a szövegben. 3. Algoritmus Egy feladat megoldását eredményező, véges számú lépések
Enterprise Content Governance
ECM Consulting Kft. 1119 Budapest, Puskás Tivadar u. 33. Fax: +36 (1) 999 7496 Enterprise Content Governance 2013.03.29. Bemutató tartalma 1. Kiinduló állapot 2. Megoldás bemutatása 3. Elért eredmények
Országos Betétbiztosítási Alap
Országos Betétbiztosítási Alap Konszolidált Adat rekordszerkezetének leírása Változat: 4.0 verzió Hatályba lépés: 2015. július 3. Készült: 2015. május 22-én IQSYS Zrt. H-1135 Budapest, Hun u. 2. Telefon:
NETFIT modul Tanári felület Felhasználói útmutató. Magyar Diáksport Szövetség
NETFIT modul Tanári felület Felhasználói útmutató Magyar Diáksport Szövetség 2014 2 Tartalom 1 Alap működési jellemzők... 4 1.1 Dátum kitöltés... 4 1.2 Irányítószám / Település kitöltése... 4 1.3 Belföldi
Operációs rendszerek. 11. gyakorlat. AWK - szintaxis, vezérlési szerkezetek UNIVERSITAS SCIENTIARUM SZEGEDIENSIS UNIVERSITY OF SZEGED
UNIVERSITAS SCIENTIARUM SZEGEDIENSIS UNIVERSITY OF SZEGED AWK - szintaxis, vezérlési szerkezetek Operációs rendszerek 11. gyakorlat Szegedi Tudományegyetem Természettudományi és Informatikai Kar Csuvik