Textplore felhasználói kézikönyv 1.0



Hasonló dokumentumok
Közoktatási Statisztika Tájékoztató 2012/2013. Használati útmutató

A szegénység fogalmának megjelenése a magyar online médiában

Vihar 2.0 rendszer Felhasználói kézikönyv

Fukusima: a megkerülhetetlen mérföldkő A hírcunami statisztikai elemzése

Parlagfű Bejelentő Rendszer

DKÜ ZRT. A Portál rendszer felületének általános bemutatása. Felhasználói útmutató. Támogatott böngészők. Felületek felépítése. Információs kártyák

ADATSZOLGÁLTATÁS központi honlap használata esetén

Az alábbiakban a portál felépítéséről, illetve az egyes lekérdező funkciókról kaphat részletes információkat.

Kifizetések kezelése. 1 Kifizetési dátumok megadása pénzügyi kódokhoz

Gyorsított jegybeírás. Felhasználói dokumentáció verzió 2.0.

Playlist.hu Kiadói kézikönyv

A WEBOPAC (online elektronikus katalógus) használata. 1. Keresés az adatbázisban (összetett):

FELHASZNÁLÓI KÉZIKÖNYV

Felhasználói Kézikönyv

HVK Adminisztrátori használati útmutató

AZ N-WARE KFT. ÁLTAL ELEKTRONIKUSAN ALÁÍRT PDF DOKUMENTUMOK HITELESSÉGÉNEK ELLENŐRZÉSE VERZIÓ SZÁM: 1.3 KELT:

EDInet Connector telepítési segédlet

MÉRY Android Alkalmazás

Felhasználói kézikönyv

ESZR - Feltáró hálózat

Felhasználói segédlet a Web of Knowledge / Web of Science adatbázis használatához

A szakképzett pályakezdők munkaerő-piaci helyzete és elhelyezkedési esélyei

BODROGKOZ.COM / HASZNÁLATI ÚTMUTATÓ

VELUX VIKI-Online rendelés és árajánlat készítés Rendelés rögzítés

TERKA Törvényességi Ellenőrzési Rendszer Kiegészítő Alkalmazás

AZ N-WARE KFT. ÁLTAL ELEKTRONIKUSAN ALÁÍRT PDF DOKUMENTUMOK HITELESSÉGÉNEK ELLENŐRZÉSE VERZIÓ SZÁM: 1.1 KELT:

Felhasználói kézikönyv a WEB EDInet rendszer használatához

KÖNYVTÁRI KATALÓGUS HASZNÁLATI ÚTMUTATÓ

Pázmány Péter Katolikus Egyetem

Nemzeti LEADER Kézikönyv LEADER HELYI FEJLESZTÉSI STRATÉGIA FELHASZNÁLÓI KÉZIKÖNYV szeptember

Bóra Adatcsere. A webes modul működésének részletesebb leírását a csatolt dokumentum tartalmazza.

Erıforrástérkép felhasználói kézikönyv 1.0

FELHASZNÁLÓI SEGÉDLET

Aromo Szöveges Értékelés

SZOLGÁLTATÓI NYILVÁNTARTÁSI RENDSZER FELHASZNÁLÓI KÉZIKÖNYV

FELHASZNÁLÓI KÉZIKÖNYV XMAP (EXTENDED MAP) KEZELÉSI ÚTMUTATÓ (TATABÁNYA VÁROS KÖZLEKEDÉSE)

Duál Reklám weboldal Adminisztrátor kézikönyv

ANONIMIZÁLT HATÁROZATOK KERESÉSE

KTI Közlekedéstudományi Intézet Nonprofit Kft. Vasúti Vizsgaközpont

CÍMLISTA HASZNÁLATA. Címlista alapok

OBO TS használati útmutató. OBO TS online. használati útmutató. Verzió: 3.0. Dátum: január 16.

Tartalom jegyzék 1 BEVEZETŐ SZOFTVER ÉS HARDVER KÖVETELMÉNYEK 2 2 TELEPÍTÉS 2 3 KEZELÉS 5

Felhasználói segédlet a Scopus adatbázis használatához

Felhasználói dokumentáció a teljesítményadó állományok letöltéséhez v1.0

I-SZÁMLA KFT. VEVŐI FELHASZNÁLÓI FIÓK HASZNÁLATI ÚTMUTATÓ

Szeged Megyei Jogú Város Integrált e-önkormányzati Rendszerének Térinformatikai Modul felhasználói kézikönyve. Internetes verzió

Adatintegritás ellenőrzés Felhasználói dokumentáció verzió 2.0 Budapest, 2008.

Fukusima: a megkerülhetetlen mérföldkő A hírcunami sta;sz;kai elemzése

QB-Suli Felhasználói útmutató verziószám: március 4.

Az alábbiakban szeretnénk segítséget nyújtani Önnek a CIB Internet Bankból történő nyomtatáshoz szükséges böngésző beállítások végrehajtásában.

Hiteles elektronikus postafiók Perkapu

Egyszerűbb a Google keresőbe beírni a Sharepoint Designer 2007 letöltés kulcsszavakat és az első találat erre a címre mutat.

A mobil alkalmazás. Felhasználói útmutató - ios

Útmutató a évi szabadidősportos pályázatok elektronikus beadásához

Új Nemzedék Központ. EFOP pályázatok online beszámoló felülete. Felhasználói útmutató

Órarendkészítő szoftver

A tankönyvvé nyilvánítás folyamatát elektronikusan támogató rendszer az OKÉV számára

SYNLAB ONLINE LELETPORTÁL FELHASZNÁLÓI ÚTMUTATÓ A SYNLAB HUNGARY KFT. PARTNEREI SZÁMÁRA

Segédlet az Eger Megyei Jogú Város Polgármesteri Hivatal által kiadott, EGERPH_1431-es építményadó bevallásához használt elektronikus nyomtatványhoz.

FELHASZNÁLÓI ÚTMUTATÓ

TÁJÉKOZTATÓ A SZAKIRÁNYÚ TOVÁBBKÉPZÉSI SZAKOK JELENTKEZÉSI FELÜLETÉHEZ

SportinvazioClub felhasználói kézikönyv v

Tartalomjegyzék. 1. Rövid áttekintés Az alkalmazás bemutatása Vonalak Részletes lista... 5

Segédlet az Eger Megyei Jogú Város Polgármesteri Hivatal által kiadott, PHEGER_1231-es építményadó bevallásához használt elektronikus nyomtatványhoz.

Mikroszámla. Interneten működő számlázóprogram. Kézikönyv

POSZEIDON dokumentáció (1.2)

OTP ADLAK Adómentes Lakáshitel-támogatás. Alapszolgáltatás KÉZIKÖNYV. OTP ADLAK alapszolgáltatás - munkáltatói portál

Online naptár használata

Angol szótár V

Könyvtárellátó Nonprofit Kft. KIADÓI RENDSZER

FELHASZNÁLÓI KÉZIKÖNYV

ÖNKORMÁNYZATOK ÉS KISTÉRSÉGI TÁRSULÁSOK RÉSZÉRE

Energiainformációs Adattár Adatgyűjtő alrendszer felhasználói dokumentáció

FELHASZNÁLÓI KÉZIKÖNYV SCHEDULEDETAIL KEZELÉSI ÚTMUTATÓ (DEBRECEN VÁROS KÖZLEKEDÉSE) 1.00 verzió Dátum:

A Statisztikai adatszolgáltatás menüpont alatt végezhető el az adatlap kitöltése. 3 Statisztikai adatszolgáltatás menetének részletes bemutatása

A. Webes metaadat szerkesztő

Csavarda mobil áruház

ElektrO-ParT elektronikai alkatrész nyilvántartó program leírás.

Magyar Kereskedelmi és Iparkamara HelpDesk rendszer. Felhasználói útmutató

cím létrehozása

Tantárgyfelosztás. I. Ellenőrzés. Mielőtt hozzákezd a tantárgyfelosztás tervezéséhez, ellenőrizze le, illetve állítsa be a következőket:

ADATSZOLGÁLTATÁS webes metaadat-szerkesztővel

PwC EKAER Tool felhasználói leírás május

Táblázatos adatok használata

WebAromo elindítása, bejelentkezés

ALEPH Elektronikus Katalógus rövid útmutató

A Szoftvert a Start menü Programok QGSM7 mappából lehet elindítani.

Védőnői jelentés összesítője modul. eform Felhasználói kézikönyv

Kezdő lépések Outlook Web Access

FELHASZNÁLÓI KÉZIKÖNYV SCHEDULEDETAIL KEZELÉSI ÚTMUTATÓ (TATABÁNYA VÁROS KÖZLEKEDÉSE) 1.00 verzió Dátum:

POSZEIDON dokumentáció (2.2)

Dokumentum létrehozása/módosítása a portálon:

Felhasználói kézikönyv. omunáldata

Internethasználat a magyar kis- és középvállalkozások körében

Belföldi Termékosztályozás V

Felhasználói kézikönyv

Az online sajtó elemzése segít a beruházások előrejelzésében Tartalomelemzés 2010 január és 2013 december között megjelent cikkek alapján

A webáruház kezdőlapján háromféle diavetítés beállítására van lehetőség:

Az importálás folyamata Felhasználói dokumentáció verzió 2.1.

Késedelmes fizetés a magyar vállalkozások körében

Átírás:

Textplore felhasználói kézikönyv 1.0 Budapest, 2012. július 18.

Az MKIK Gazdaság- és Vállalkozáskutató Intézet olyan non-profit kutatóműhely, amely elsősorban alkalmazott közgazdasági kutatásokat folytat. Célja, hogy elméletileg és empirikusan megalapozott ismereteket és elemzéseket nyújtson a magyar gazdaság és a magyar vállalkozások helyzetét és kilátásait befolyásoló gazdasági és társadalmi folyamatokról. MKIK GVI Institute for Economic and Enterprise Research Hungarian Chamber of Commerce and Industry Textplore felhasználói kézikönyv Szerző: Czibik Ágnes e-mail: agnes.czibik@gvi.hu A Textplore szoftvert az MKIK Gazdaság- és Vállalkozáskutató Intézet fejleszti 2008 óta a Nemzeti Innovációs Hivatal - volt Nemzeti Kutatási és Technológiai Hivatal - támogatásával a Textrend projekt keretében. A Textplore fejlesztésében közreműködők: Számítástechnikai fejlesztés, programozás: Farkas Richárd, SZTE, Mesterséges Intelligencia Kutatócsoport Gyenese Jenő Uhrin Tamás, Starlight Plus Bt. Zsibrita János, SZTE, Mesterséges Intelligencia Kutatócsoport Projektvezető: Czibik Ágnes, elemző, MKIK GVI Kutatásvezető: Tóth István János, PhD Igazgató, GVI e-mail: istvan.janos.toth@gvi.hu 2012. július 11. MKIK Gazdaság- és Vállalkozáskutató Intézet Cím: 1034 Budapest, Bécsi út 120. Tel: 235-0584 Fax: 235-0713 e-mail: gvi@gvi.hu internet: http://www.gvi.hu MKIK GVI 1034 Budapest, Bécsi út 126-128. tel: 235-05-84 fax: 235-07-13 e-mail: gvi@gvi.hu Internet: www.gvi.hu 2/15

Tartalom 1. A Textplore bemutatása... 4 1.1 A Textplore általános leírása... 4 1.2. A Textplore létrehozásának céljai... 4 1.2.1. Rejtett tartalmak objektív vizsgálata... 4 1.2.2. Online elérhetőség... 5 1.2.3. Egyedülálló sajtó-elemzési lehetőség: a Textplore-ban tárolt dokumentumok... 5 1.2.4. Kiinduló adatok más szoftverekhez... 5 2. Az Textplore használatáról általában... 6 2.1. Rendszerkövetelmények és beállítások... 6 2.2. Beviteli mezők... 7 2.3. Keresők... 8 3. Dokumentumkezelés a Textplore-ban... 9 3.1. Saját dokumentumok feltöltése... 9 3.2. Az előfeldolgozásról... 9 3.3. A Textplore gyűjtemény használata kereséssel... 10 3.4. Dokumentumcsoportok... 11 3.5. Meta-adatok szerkesztése... 11 4. Kategória-szótárak használata... 11 5. Elemzési lehetőségek... 12 5.1. Listák... 12 5.2. Szókörnyezet... 12 5.3. Szókörnyezet-statisztika... 13 5.4. Szóstatisztika... 13 5.5. Meta-adatok... 13 5.6. Kereszttábla... 14 5.7. Korreláció... 14 5.8. Átlagok... 14 5.9. Eredmények mentése... 15 5.10. Lehetőség további elemzésekre más szoftverekkel... 15 MKIK GVI 1034 Budapest, Bécsi út 126-128. tel: 235-05-84 fax: 235-07-13 e-mail: gvi@gvi.hu Internet: www.gvi.hu 3/15

1. A Textplore bemutatása 1.1 A Textplore általános leírása A Textplore a Gazdaság- és Vállalkozáskutató Intézet által, a TEXTrend projekt keretében 1 fejlesztett online alkalmazás, amely elsősorban kvantitatív tartalomelemzésre ad módot. A Textplore segítségével egyaránt elemezhetjük saját dokumentumainkat illetve a Textplore dokumentum-gyűjteményt, amely magyar és külföldi hírportálok cikkeit valamint kutatóintézetek és más intézmények honlapjain található, letölthető dokumentumokat tartalmaz. Az elemzések alapvetően szógyakoriságokon és szókörnyezeteken alapulnak. Az egyszerű szóelőfordulások mellett szavak előfordulásainak összefüggéseit is vizsgálhatjuk kereszttáblákkal, korreláció mérésével. A Textplore bizonyos korlátozások mellett ingyenesen hozzáférhető. A korlátozás nélküli használat díjfizetéshez kötött. Az ingyenes változat korlátai: a cikkgyűjtemény 5%-os mintája elemezhető a regisztráció két hónapig érvényes a feltöltött saját dokumentumok összesített méretének korlátja 10Mb 1.2. A Textplore létrehozásának céljai 1.2.1. Rejtett tartalmak objektív vizsgálata Tartalomelemzéssel a vizsgált dokumentumok olyan jellemzőit tárhatjuk fel, amelyeket bár intuitív módon érzékelünk olvasás közben, de igazolásuk csak ennél objektívebb módon, rendszerezetten, számszerűsítve történhet. Feltárhatjuk, hogy a szövegeknek a szerző szándéka szerint hordozott tartalma mellett milyen plusz jelentések jelennek meg a szóhasználat jellegzetességein keresztül. Bár tartalomelemzést végezhetünk kézzel is, vagyis a szövegeket végigolvasva megszámolhatjuk a keresett kulcsszavak előfordulásait, azonban ez nagyobb mennyiségű információ esetén nagyon időigényes, és a hibák például félreolvasás - előfordulásával is számolnunk kell. A számítógépes szövegelemzés segítségével jelentősen felgyorsul a szövegek feldolgozása, és az is elkerülhető, hogy a számítógép véletlenül átugorjon egyes szavakat. A gépi elemzés korlátai közé tartozik ugyanakkor, hogy a szoftver nem tudja értelmezni a szöveget, amit olvas, például nem ismeri fel az iróniát, vagy bizonyos 1 A projekt a Nemzeti Kutatási és Technológiai Hivatal (jelenleg Nemzeti Innovációs Hivatal) Jedlik Ányos programjának támogatásával valósult meg. Pályázat azonosítója: NKFP-07-A2-TEXTREND, szerződésszám: OM/00002/2008-4/15 -

nyelvtani szerkezetek megfelelő kezelése is problémát okozhat. A gépi szövegelemzés előnyei úgy tudnak leginkább érvényesülni, ha körültekintően fogalmazzuk meg elemzési céljainkat, és olyan kérdéseket teszünk fel, amelyekre valóban választ kaphatunk szógyakoriság-alapú eredményekkel. 1.2.2. Online elérhetőség A Textplore fejlesztése során fontos szempont volt, hogy telepítés nélkül, bárhonnan elérhető legyen, ahol van Internet. Így minden körülmény között könnyen hozzáférhetőek maradnak az egyszer már elvégzett elemzések eredményei és a felhasználó által feltöltött dokumentumok. 1.2.3. Egyedülálló sajtó-elemzési lehetőség: a Textplore-ban tárolt dokumentumok A Textplore egyedülálló lehetőséget biztosít a magyar sajtó elemzésére: amellett, hogy elemzési eszközöket bocsát a felhasználók rendelkezésére, tartalmaz egy egyedülálló dokumentum-gyűjteményt is, amely a magyar online sajtó meghatározó szeletét foglalja magában. Ilyen módon anélkül vizsgálhatjuk meg a hazai sajtóban megmutatkozó egyes tendenciákat, hogy több portál cikkeit letöltenénk és rendszereznénk saját magunk számára. 1.2.4. Kiinduló adatok más szoftverekhez A Textplore elemzési lehetőségei magukban foglalják azokat az alapvető módszereket, amelyekkel bizonyos szavak, kifejezések előfordulását, időbeli megoszlását, vagy együtt járását vizsgálhatjuk meg. Ez már önmagában értékes információt nyújt a vizsgált dokumentumokról, de emellett azt is érdemes szem előtt tartani, hogy a szavak előfordulásait bemutató táblázatok kisebb átalakítások után - kiindulópontjai lehetnek további, más szoftverekkel végzett elemzéseknek, például kapcsolatháló vizsgálatnak. - 5/15 -

2. Az Textplore használatáról általában Ebben a fejezetben a Textplore működésével kapcsolatos általános információkat találhatunk. Az egyes menüpontokról szóló részletes leírások előtt kérjük, olvassa el az alábbiakat is. 2.1. Rendszerkövetelmények és beállítások Támogatott operációs rendszerek A Textplore nem operációs rendszer-függő, azonban a letöltött eredménytáblák megtekintéséhez Microsoft Excel program szükséges. Támogatott internetes böngészők Microsoft Internet Explorer 5.5 vagy újabb verzió Mozilla Firefox 3 vagy újabb verzió Chrome Opera Ajánlott internet-kapcsolat típus min. 1 Mbit/s letöltési és 512 Kbit/s feltöltési sebesség ajánlott Ajánlott képernyő-beállítás 1024 x 768 pixeles felbontás vagy nagyobb Egyéb beállítások Internet beállítások: A böngészőprogramot úgy állítsuk be, hogy a tárolt lapok újabb verzióinak keresése a webhely minden felkeresésekor megtörténjen. - 6/15 -

2.2. Beviteli mezők A Textplore-ban a következő beviteli mezőkkel találkozhatunk: Szövegmezők A szövegmezők tetszőleges gépelt szöveg bevitelére szolgálnak. A szövegmező felületének szélessége nem jelent korlátot a beírt karakterek számának. A mező melletti nyilakkal vihetjük be a kiválasztott szavak közé a begépelt szót. A kiválasztott szavak közül is a megfelelő irányú nyíllal távolíthatunk el egy szót, a billentyűzet Delete gombjának használatával nem. Legördülő menük - 7/15 -

A legördülő menük két részből állnak: egy választéklistából és egy, a panel jobb oldalán található nyitógombból. A választéklista elemei alapesetben nem láthatóak, megjelenítésükhöz a nyitógomb megnyomása szükséges. A listaelemek közül egyrészt úgy választhatunk ki egyet, vagy cserélhetjük ki az aktuálisan beállított elemet egy másik elemre, ha rákattintunk a kiválasztandóra. Legördülő menü használatára például akkor kerül sor, amikor kiválasztjuk, hogy melyik kategóriaszótárt szeretnénk használni egy elemzéshez. Jelölőnégyzet A jelölőnégyzet felsoroláselemek közti választást tesz lehetővé. Az üres négyzet azt jelzi, hogy a hozzá tartozó elem nincs kiválasztva. Ha rákattintunk a kiválasztani kívánt elemre vagy a hozzá tartozó négyzetre, egy pipa jelenik meg a négyzetben, ami a kiválasztást jelzi. Második kattintásra a pipa eltűnik, a kijelölés megszűnik. Jelölőnégyzettel a lista tetszőleges számú eleme kiválasztható. 2.3. Keresők A Textplore használata során keresőfelülettel találkozhatunk a Dokumentumcsoportok, a Kategória-szótárak, a Keresés menüpontokban, és egyfajta keresőként foghatóak fel a Leíró statisztika és Elemzés menüpontokban található szövegbeviteli mezők is, amelyekkel megadhatjuk, hogy mely szavak előfordulásait vagy környezetét szeretnénk megvizsgálni. A Dokumentumcsoportok és a Kategória-szótárak keresői arra szolgálnak, hogy ha már elsőre áttekinthetetlenül sok dokumentumcsoportot vagy kategória-szótárt hoztunk létre, akkor is gyorsan megtaláljuk azt, amelyiket használni szeretnénk. Ezekre a keresőkre jellemző, hogy a kis és nagy betűk között nem tesznek különbséget, viszont az ékezetes és nem ékezetes betű között igen. Használhatunk szótöredékeket is, például az eg szótöredékre rákeresve meg fog jelenni a találati listában az egér szó is. A Keresés menüpont keresője arra szolgál, hogy megtaláljuk azokat a dokumentumokat a Textplore dokumentumgyűjteményben vagy saját feltöltött dokumentumaink között, amelyeket elemezni szeretnénk. Ez a kereső is megkülönbözteti az ékezetes és nem ékezetes betűket, de a kis és nagy betűket nem. Szótöredékre is kereshetünk, és a Részletes keresés használatával kifejezésekre, több szóra is. A Pontos kifejezésre beállítás használatával csak olyan dokumentumokat kapunk eredményül, amelyek pontosan úgy, egymás mellett tartalmazzák az általunk megadott szavakat, ahogyan beírtuk. Például ha arra keresünk rá, hogy zöld párt, akkor csak ezt a szóösszetételt tartalmazó cikkeket fogunk kapni a találati listában. Ugyanerre a kereső-kifejezésre a Bármely szóra beállítással minden cikket megkapunk, amely tartalmazza vagy a zöld, vagy a párt - 8/15 -

szavakat. A Minden szóra beállítással olyan cikkeket fogunk kapni, amelyekben szerepel a zöld és a párt szó is, de nem feltétlenül egymás mellett, és így valószínűleg más értelemben, mint amire kíváncsiak vagyunk feltételezve, hogy zöld pártokról szóló cikkeket keresünk. Az elemzések során használt szókereső - a Leíró statisztika és az Elemzés menüpontban eltérő módon működik a többi keresőhöz képest. Ebben az esetben a keresés a már előfeldolgozott (lásd: 3.2. Az előfeldolgozásról) szövegeken fut le, így csak a szavak toldalék nélküli alakjára fogunk találatot kapni. Ha bizonytalanok vagyunk benne, hogy az előfeldolgozás során az általunk keresett szó milyen alakúvá vált, a Leíró statisztika/listák/szólista menüpont segítségével ellenőrizhetjük. (Lásd: 5.1. Listák) 3. Dokumentumkezelés a Textplore-ban A Textplore segítségével elemezhetőek saját dokumentumaink, amelyeket a "Dokumentumok/Új dokumentum feltöltése" menüpontban tölthetünk fel, és elemezhetjük a Textplore szöveggyűjtemény elemeit, amelyeket a "Dokumentumok/Keresés" menüpontban választhatunk ki. 3.1. Saját dokumentumok feltöltése A "Dokumentumok/Új dokumentum feltöltése" menüpontban tölthetünk fel új dokumentumot. A feltölthető formátumok: doc, pdf, txt, rtf. Több dokumentum feltöltése úgy lehetséges, ha egy zip file-ba tömörítjük őket, és ezt a file-t töltjük fel. A Textplore csak a zip tömörítést tudja feldolgozni, más formátumot (pl. rar) nem. Ha bejelöljük a "megosztott" lehetőséget, akkor más felhasználók is elérhetik dokumentumunkat a "Keresés" menüponton keresztül. A dokumentum nyelvét a Textplore automatikusan azonosítja az angol és magyar nyelvek közül. Ha nem szeretnénk használni az automatikus felismerés lehetőségét, akkor a legördülő menü segítségével beállíthatjuk kézzel, hogy angol vagy magyar dokumentumot töltöttünk-e fel. Az "URL" és "Publikálás dátuma" legördülő menük szerepe az, hogy ha internetes újságok cikkeit töltjük fel, akkor megadhatjuk megjelenésük dátumát és a forrást, ahonnan származnak, így később elemezhetővé válnak ezek az adatok is. 3.2. Az előfeldolgozásról A dokumentumok - mielőtt elemezhetővé válnak - végigmennek egy előfeldolgozási folyamaton, aminek központi eleme a szótövezés. Ez azt jelenti, hogy a szoftver minden szót visszabont a szótövéig, vagyis a "fák", "fából", "fáig" stb. szavakból "fa" lesz. Ennek jelentősége az, hogy később, ha rákeresünk a "fa" szóra, akkor a szoftver az összes toldalékolt formát is meg fogja találni, még akkor is, ha toldalékolás közben megváltozott a szótő (pl. fa-ból vagy fá- lesz). Ugyanakkor a szótövezés nem változtatja meg a szó szófaját, vagyis a főnevek főnevek maradnak, az igék igék, a melléknevek melléknevek. Vagyis a "fából", "fák", - 9/15 -

"fáig" szavakból "fa" lesz, de a "fás" szó "fás" marad, és a "fásít" is "fásít" marad. Ezt figyelembe kell venni, amikor az elemzéseknél megadjuk a szavakat, amelyeket keresünk a szövegekben. A "fából" szóra nem fogunk találatot kapni, csak a "fa"-ra. Fontos tudni az előfeldolgozásról, hogy hosszú szövegek esetén jelentős időbe telhet, több száz tanulmány hosszúságú dokumentum több napig is futhat. A "Dokumentumok/Előfeldolgozás állapota" menüpontban tekinthetjük meg, hogy mely dokumentumok állnak az adott pillanatban előfeldolgozás alatt. 3.3. A Textplore gyűjtemény használata kereséssel A "Dokumentumok/Keresés" menüpontban érhető el a Textplore gyűjteményének tartalma. Szerzői jogi korlátok miatt itt nem tekinthetjük meg a cikkek, tanulmányok teljes szövegét, hanem csak a találati listát kapjuk meg, vagyis, hogy mely cikkekben szerepel az a szó, amelyet keresőszóként megadtunk. Feltüntetjük ugyanakkor a cikkek URL-jét, amelyet követve elolvashatjuk a cikket az eredeti helyén, ha az ott még megtalálható. A következő forrásokból tartalmaz cikkeket a Textplore: index.hu (2000-től), origo.hu (2000-től), hvg.hu (2010-től), mno.hu (2001-től), nol.hu (2001-től), hetivalasz.hu (2001-től), vg.hu (2010-től), fn.hu (2001-től), Washington Post (2010-től), New York Times (2010-től), BBC Online (2010-től), valamint a következő intézmények honlapjainak dokumentumait: Gazdaság- és Vállalkozáskutató Intézet (gvi.hu), Magyar Nemzeti Bank (mnb.hu), MTA KRTK Közgazdaságtudományi Intézet (econ.core.hu) és az öt magyar ítélőtábla. A "Dokumentumok/Keresés" menüpont segítségével választhatjuk ki az elemzendő dokumentumokat a Textplore szöveggyűjteményből. A Részletes keresés segítségével pontosan beállíthatjuk, hogy milyen találatokat szeretnénk kapni (dátum, forrás, szöveghossz szerint). A találati listán legfeljebb 1000 találat jelenik meg, tehát ha pontosan ennyi sort kaptunk eredményül, akkor valószínűleg több találat is van, amelyeket már nem jelenített meg a Kereső, így érdemes kisebb egységekre keresni, hogy minden találatot megkapjunk. Például forrás vagy időszakok szerint bonthatjuk csoportokra a találatokat. A találati listán kijelölhetjük, hogy mely dokumentumok vegyenek részt az elemzésben, majd a "Kijelöltek hozzáadása csoporthoz" gomb segítségével helyezhetjük át őket a megfelelő csoportba. A csoport kiválasztása a legördülő menüvel történik. Amely dokumentumokat beleteszünk az "Elemzésre kiválasztott dokumentumok"-ba, azokat tudjuk elemezni az elemzési menüpontokban. Ha párhozamosan több elemzendő csoporton szeretnénk dolgozni, vagy szeretnénk, hogy később is könnyen elérhetőek legyenek korábbi dokumentum-csoportjaink, érdemes a "Dokumentumok/Dokumentumcsoportok" menüpontban saját dokumentumcsoportokat létrehozni, és ebbe tenni az oda tartozó szövegeket. A dokumentumcsoportok egyben is kijelölhetőek elemzésre. Az "Elemzésre kiválasztott dokumentumok" csoportot ki kell üríteni, mielőtt új dokumentumokat teszünk bele, ha egy új adag dokumentummal szeretnénk dolgozni, mivel az éppen ott található szövegek nem törlődnek maguktól. A törlés a Keresés és a Dokumentumcsoportok menüben is történhet. a törlés módja mindkét helyen ugyanaz: kiválasztjuk a legördülő menüből az "Elemzésre kiválasztott dokumentumok" csoportot, majd megnyomjuk a megjelenő "Minden törlése a csoportból" gombot. - 10/15 -

3.4. Dokumentumcsoportok A "Dokumentumok/Dokumentumcsoportok" menüpontban létrehozhatunk saját dokumentumcsoportot az Új felvitel opcióval. Később a keresési találatainkat elmenthetjük ide, ez megkönnyítheti a későbbi elemzést. Ugyanígy törölhetünk már meglévő dokumentumcsoportot, ha már nincs szükségünk rá. A dokumentumcsoport mellett lévő ikon kipipálásával a Kijelölt(ek) kiválasztása elemzésre opcióval pedig beletehetjük a kiválasztott csoportot az "Elemzésre kiválasztott dokumentumok" csoportjába. Figyeljünk rá, hogy ez nem törli ki azokat a dokumentumokat, amelyek korábban az elemzendő csoportban voltak, hanem hozzáadja az új dokumentumokat. 3.5. Meta-adatok szerkesztése Metaadatoknak hívjuk azokat a kiegészítő információkat, amelyek nem (feltétlenül) szerepelnek a dokumentum szövegében, de tudjuk őket a dokumentumról, keletkezésének körülményeiről. Ilyen lehet például a dokumentum forrása, szerzője, dátuma. Ezek az információk fontosak lehetnek az elemzéshez. A Textplore szöveg-gyűjteményben a cikkek esetében rendelkezésre állnak ilyen információk, azonban a feltöltött saját dokumentumok esetében a szoftver nem tudja automatikusan kinyerni a szövegből ezeket az információkat. Ezért lehetőség van kézzel beírni ezeket a Dokumentumcsoportok és a Keresés menüpontban. Ennek menete mindkét menüpontban ugyanaz: az oldalon található második táblázat legördülő menüjében kiválasztjuk a kívánt dokumentumcsoportot, így megkapjuk az abban szereplő dokumentumok listáját. A dokumentumok címe és URL-je alatt látható kis füzet-ikonra kattintva érhetjük el a metaadat szerkesztő felületet. 4. Kategória-szótárak használata A Szótárak/Kategóriaszótárak menüpontban létrehozhatunk olyan saját szótárat, mely az általunk megadott kulcsszavakat tartalmazza, ez könnyítheti a későbbi elemzést, mivel nem kell egyesével bevinni minden szót, amit keresni szeretnénk. Gyakran előfordul ugyanis, hogy nem egy szó előfordulására vagyunk kíváncsiak, hanem egy szócsoportéra. Például ha azt vizsgáljuk, hogy milyen gyakran jelennek meg különböző közlekedési módokról szóló cikkek egy portálon, akkor a gépkocsis közlekedés vizsgálatára egyaránt rá akarunk keresni a gépkocsi, autó, személyautó szavakra. A saját kategóriaszótárunkat az "Új felvitel" gombbal hozhatjuk létre. Az így megjelenő szerkesztőfelület felső részén található legördülő menüvel adhatjuk meg, hogy új kategóriát akarunk begépelni a már meglevők mellé, vagy egy új szó szeretnénk bevinni egy már létező kategóriába. Beépített kategória-szótárak A Textplore szoftverben három általános, egy-egy tudományterületet lefedő kategóriaszótár kapott helyet. Ezek a Közgazdasági, a Közpolitikai és Szociológiai kategóriaszótár. E szótárak a tudományterületek egy-egy alaptankönyvének - 11/15 -

tárgymutatója alapján álltak össze, és megkönnyítik az ilyen területek elemzését készen nyújtott szókészletükkel. 5. Elemzési lehetőségek A Textplore elemzési lehetőségei elsősorban szógyakoriságokra alapulnak, vagyis arra az információra, hogy melyik dokumentumban hányszor fordul elő egy meghatározott szó. 5.1. Listák A Szólista opció kilistázza a kiválasztott dokumentumok összes szavát, előfordulásaik számával együtt. Ezt nem dokumentumonként különválasztva teszi, hanem összesítve. Konkrét elemzésben ritkán használjuk, viszont segíti a mélyebb elemzéseket: segítségével gyorsan át lehet tekinteni a teljes dokumentumok elolvasása nélkül, hogy milyen szavak szerepelnek a szövegekben, így képesek leszünk pontosabban meghatározni, hogy mely szavakra akarunk rákeresni a továbbiakban. A szólista arra is használható, hogy leellenőrizzük, hogy egyes toldalékolt szavakat milyen szótőre alakított át az előfeldolgozó mechanizmus, így nem fordulhat elő, hogy azért nem kapunk találatot, mert olyan formára keresünk rá, amely nem szerepel az előfeldolgozott szöveg-változatban. Mivel esetenként az eredményül kapott táblázat nagyon nagyméretű lehet, és ennek megjelenítése jelentősen lelassítja az eredmények megjelenítését, lehetőség van csak letölthető formában kérni az eredményeket. Ekkor a képernyőn nem jelennek meg. ("Adatok csak letöltése opció) Az adatokat különféle módokon is megtekinthetjük: az Előfordulás a szavak összes előfordulásának számát adja meg. A Gyakoriság opció azt mutatja meg, hogy az összes szón belül mekkora részt tesznek ki az egyes szavak. A logaritmikus súlyozású előfordulás figyelembe veszi, hogy egy szó első megjelenése egy dokumentumon belül sokkal nagyobb jelentőséggel bír, mintha már szerepelt volna 10-szer, és még egy tizenegyedik előfordulást is találunk. Vagyis az újabb és újabb előfordulások egyre kisebb súlyt kapnak. A Logaritmikus súlyozású előfordulás normalizálva opció emellett figyelembe veszi a dokumentumok hosszát is. Egy rövidebb dokumentum esetén nagyobb súlya van egy szó előfordulásának, mint egy hosszabb dokumentum esetében. A Dokumentumszám azt mutatja, hogy mennyi dokumentumban jelenik meg a keresett szó. A Dokumentumarány azt, hogy a dokumentumok mekkora részében jelenik meg a szó. A Kategórialista opció kilistázza, hogy a kiválasztott dokumentumokban összesen mennyiszer szerepelnek a kiválasztott kategóriák. 5.2. Szókörnyezet A Szókörnyezet a Textplore kvalitatív elemzéshez legközelebb álló része. Segítségével megnézhetjük, hogy a kiválasztott szavak milyen környezetben jelennek meg a kiválasztott dokumentumokban. Több, különböző nagyságú - 12/15 -

környezet közül is választhatunk (10 szó, 20 szó, 50 szó, 1 mondat, 3 mondat, 5 mondat). Kézzel is begépelhetjük a keresett szavakat, de kategóriaszótárból is kiválaszthatjuk őket. Kategóriaszótár esetében teljes kategóriákat és egyes szavakat is kiválaszthatunk. Egy kategória kiválasztása esetében a kategória összes szavának környezeteit megmutatja a szoftver. A szókörnyezet eredményeképpen kapott táblázat lementhető saját számítógépünkre a gombok használatával is ("Ment" és a Mentett Eredmények menüpontból "Letölt"), de ekkor nem marad meg a szókörnyezeteken belül a keresett szó kék kiemelése. Ezt a kiemelést úgy tarthatjuk meg, ha az eredményül kapott táblázatot kijelöljük egérrel, és ctrl+c és ctrl+v billentyűkombináció segítségével Excelbe másoljuk. 5.3. Szókörnyezet-statisztika A Szókörnyezet-statisztika megmutatja egy táblázatban, hogy a kiválasztott szavak környezetében milyen szavak és mennyiszer szerepelnek a kiválasztott dokumentumokon belül. Itt is kiválaszthatjuk a vizsgált környezet nagyságát. Ez az elemzés-típus használható például annak elemzésére, hogy egyes személynevek, országok milyen környezetben kerülnek említésre a szövegekben. Például inkább pozitív vagy inkább negatív jelzők mellett. 5.4. Szóstatisztika A "Leíró statisztika/szóstatisztika" menüpontban megadhatunk egy vagy több kulcsszót is, melyek előfordulásainak számát dokumentumonként külön-külön listázza ki a Textplore szoftver. Kiválaszthatjuk, hogy az eredménytáblában csak az jelenjen meg, hogy szerepel-e egy szó a dokumentumban vagy nem (0/1), vagy az, hogy mennyiszer szerepel. Mivel esetenként az eredményül kapott táblázat nagyon nagyméretű lehet, és ennek megjelenítése jelentősen lelassítja az eredmények megjelenítését, lehetőség van csak letölthető formában kérni az eredményeket. Ekkor a képernyőn nem jelennek meg. ("Adatok csak letöltése opció) 5.5. Meta-adatok A "Leíró statisztika/metaadatok" menüpontban lekérhetjük az általunk kiválasztott dokumentumcsoport dokumentumainak alapadatait. Leggyakrabban az Elemzésre kiválasztott dokumentumok alapadatait szükséges lekérni egy elemzéshez, de más dokumentumcsoportokba tartozó dokumentumok adatait is lekérhetjük. A lementett táblázatban az ID változó jelzi azt a sorszámot, amely alapján a dokumentumok azonosíthatóak a Textplore rendszerén belül, ezek segítségével lehetséges más elemzések eredményeit is hozzáfűzni a dokumentumok alapadataihoz. A Szerző és Cím oszlopok azokat az adatokat tartalmazzák, amelyek az eredeti file tulajdonságai közt szerepeltek. Ha ezek nem voltak megfelelően kitöltve, akkor ebben a táblázatban sem tudnak jól megjelenni. A Létrehozás dátuma változók azt mutatják, hogy mikor került fel a dokumentum a Textplore rendszerébe. Ez nem feltétlenül egyezik meg a dokumentum megjelenésének dátumával. Ez az internetről letöltött cikkek esetében a leginkább - 13/15 -

fontos: a Publikálás dátuma változók mutatják, hogy mikor jelent meg a portálon a cikk, és a Létrehozás dátuma azt, hogy mikor töltöttük le a portálról, és töltöttük fel a Textplore gyűjteménybe. 5.6. Kereszttábla A Kereszttábla opció megmutatja, hogy egy kiemelt szóval mennyi dokumentumban fordul elő együtt bizonyos másik szavakkal, vagyis mennyi dokumentum van, amelyben csak az egyik szó szerepel, mindkettő szó szerepel, vagy egyik szó sem szerepel. Ebben az esetben nem számít, hogy egy szó mennyiszer fordul elő egy dokumentumban, csak az, hogy előfordul-e. Ilyen módon szavak megjelenésének összefüggéseit vizsgálhatjuk meg, vagyis hogy van-e olyan összefüggés két szó között, hogy az átlagosnál gyakrabban fordulnak elő együtt, esetleg éppen kizárják egymás megjelenését. A "szignifikancia" érték mutatja meg, hogy valóban létezik-e összefüggés a két szó megjelenése között. A 0,05 alatti érték nagy valószínűséggel létező, nem véletlenszerű összefüggést mutat. A Cramer-féle asszociációs együttható egy kapcsolatszorosság-mérő mutató, két, diszkrét értékeket felvevő változó kapcsolatának vizsgálatára használjuk. Értékei 0 és 1 között helyezkednek el. Minél nagyobb értéket vesz fel, annál szorosabb a két változó kapcsolata. Tökéletes függetlenség esetén értéke nulla. 5.7. Korreláció Az "Elemzések/Korreláció" menüpont megmutatja, hogy két szó előfordulásai között van-e pozitív vagy negatív összefüggés, vagyis ha az egyik szó átlag feletti számban szerepel egy dokumentumban, akkor a másikra is igaz-e ez, vagy éppen átlag alatti számban fog előfordulni, esetleg a két szó előfordulásainak száma független egymástól. Míg a Kereszttábla esetén csak azt vizsgáljuk, hogy egy dokumentumban szerepel-e egy adott szó, addig a Korreláció esetében számít az is, hogy mennyiszer fordul elő a szó. A vizsgált szavak megadásánál nem kell kiemelt szót választani, egyszerűen írjuk be a kettő vagy több szót a beviteli mezőbe. A "szignifikancia" érték mutatja meg, hogy valóban létezik-e összefüggés a két szó megjelenése között. A 0,05 alatti érték nagy valószínűséggel létező, nem véletlenszerű összefüggést mutat. A korrelációs együttható mutatója azt jelzi, hogy mennyire erős az összefüggés a két szó előfordulásai között. Értéke 1 és -1 között lehet. A pozitív értékek pozitív összefüggést, a negatívak negatív összefüggést mutatnak, 0 érték esetén pedig nincs összefüggés a két szó előfordulásai között. Minél nagyobb a mutató abszolút értéke, annál erősebb az összefüggés a két szó előfordulásai között. 5.8. Átlagok Az Átlagok menüpontban megnézhetjük, hogy dokumentumok egyes csoportjaiban eltér-e egy szó előfordulása, például megvizsgálhatjuk, hogy mennyiszer fordul elő a 2006-os, a 2007-es és a 2008-as cikkekben a "válság" szó, és hogy ezek az előfordulási értékek szignifikánsan eltérnek-e évente. - 14/15 -

Az is lehet csoportképző jellemző, hogy szerepel-e egy kiemelt szó a dokumentumban vagy nem. 5.9. Eredmények mentése Az összes Textplore-ral készült elemzés eredménytáblája lementhető a "Mentett eredmények" közé. Ezek a későbbiekben megtekinthetők, és saját gépre is lementhetőek Excel vagy.csv formátumban. 5.10. Lehetőség további elemzésekre más szoftverekkel A lementett eredmények alkalmasak lehetnek más szoftverekkel való további elemzésre. Ilyen lehet az SPSS és a STATA statisztikai programcsomag. Ez legegyszerűbben úgy tehető meg, hogy a szóstatisztika eredmény-tábláját mentjük le Excelbe, és ezt olvassuk be pl. az SPSS szoftverrel. Ekkor természetesen a táblázat első néhány sorában található kiegészítő információkat törölni kell előtte a file-ból, hogy csak az adatok és a változók nevei maradjanak a táblázatban. Érdemes lehet a változóneveket jelentő szavakat is átírni ékezet nélkülire vagy esetleg rövidebbre, mert általában ezeket könnyebben kezelik az angol kezelési nyelvű statisztikai szoftverek. - 15/15 -