emberi kivonatolás Lengyelné dr. Molnár Tünde

Hasonló dokumentumok
ó Ó ú ó ó ó Á ó ó ó Á ó ó ó ó Á ó ú ó ó ó

Czinki-Vietorisz Gabriella: A könyvtárhasználók igényeire szabott szolgáltatásfejlesztés az Egyetemi Könyvtárban

É Á Á Ö Á

Ó Ó ó ö ó

É É Ö

ö ő ü ö ő ő ü ü ő ő ő ü ö ü ü ő ú ő ő ő ü ő ő ő ő ő ú ő ő ü ő ő ő ü ö ü ú ő ő ő ő ü ü ő ő ú

ü ü Ü ü ü ü ü ü ü ü ü ü ü ü ü ü ü ü ü ü ü É ü ü

ä ä

ű Ö ű Ú ű ű ű Á ű

Ú ű É ű ű Ü Ü ű ű Ú É ű ű Ü ű ű ű ű ű ű ű Ú ű ű

ű ő ő ő

Á ű ó ó

ű ű ű Ú Ú Á ű Ö ű ű Ú Ő É

Á Ó ű ű Á É ű ű ű ű Ú Ú

ú Ó ú ú ú ú ú ú ú É Á

ű Ú ű ű É Ú ű ű

Á ó ó ó Ü Ü ó ó Ü ó ó ú ú ó ó Ü ó ó ó Ü ó ó

Á Ü É Ü Ú Ü É

Á Á ő ő Ö ő ő ö É ö ő ö ő ő ö ő ő ö ő ő ü ö

Ó é é Ó Ó ő ű Ó Ö ü Ó é Ó ő Ó Á Ö é Ö Ó Ó é Ó Ó Ó Ó ú Ó Ó Ó Ó ű Ö Ó Ó Ó é Ó Ó ö Ö Ó Ö Ö Ó Ó Ó é ö Ö é é Ü Ó Ö Ó é Ó é ö Ó Ú Ó ő Ö Ó é é Ö ú Ó Ö ö ű ő

Á Ö Ö Ö Ö ú ú Ö Ö Ó Ó ú ú Ü ú Ó Ö Ö Ü Ó Ö Ö Á Ó ú ú ú ű Ö Ö Ö Ö Á Ó Ö Ó ú ú Ö

Ó Ó ö ú ö ö ö ö ü ú ú ö ö ö ú ú ö ö ö ú ú ú ű ö ö ú ö ü ö ö ö ö ü ú Á ö ü Á ö ö ö ö ö ö

ö ö Á Á Ó Á ö ö ö ö ö ú ű ö ö Á Á ű ű ö ö ö ö ű

ó ő ő ó ő ö ő ő ó ó ó ö ő ó ó ó ö ő ó ő ő ö Ö ő ö ó ő ö ő ő ú ö ö ü ö ó ö ö ö ő ö ö Ö ú ü ó ü ő ő ő ő ó ő ü ó ü ö ő ö ó ő ö ő ö ü ö ü ő ö ö ó ö ő ő ö

ú ö ö ö ö ö ö Á ö ö ö á á á ű Ü ű ö ö Á á Á

ü ú ú ü ú ú ú ú

é ü ó ö é Ö é ü é é ó ö é ü ü é é ó ó ó é Á é é ü ó é ó ó é ö ö ö é é ü é ü é é ö ü ü é ó é é é é é é ö é é é é é é ö é ó ö ü é é é ü é é ó é ü ó ö é

Oktatói weboldalak vizsgálata hallgatói szemszögből

ü ű í ú ú ü ü ü ű ü ű ü ű ü ű ü í ü ű í í ü í í í í í ü í ű

Diplomás pályakövetés intézményi online kutatás, 2012

Jelentés a 2013-as Educatio kiállításról

ú ű ú ú ű ú ű ű ú ű ú ű Á ű ű Á ű ű ú ú ú ú ú ú ű ú ú ú ú ú ú ú ú

ű ú Í Ó Á ú Ű ű Ő Ö Á ú Ű Ü ú ú Á ú ű

Í Ó ü ü í ü ü ü í Í í É í í Í Í ü ü ü í Í ü

ú Ü Í ú ú ú ú ú ú

ü É ö É É ö ö ö ü ö ö Á ű ö ű ű ű Á Í ö ö Ó ö

É Í Á Á É Ü Ó É É É É Í Ó Ó Ő Á Á É Á É É É É Á É É Á Á É É Á É Í

ő ő ő ő ú É ü ú ú ű ú ű ő ő ő ő Á Á ü ő É É É É É É Á Ú Á Á ő ő ő ő ő É Á Á Á ő ő ő Á ü ő ő ü

Í Ú É ő ő ú ö Ö ú ú ú ö ö ú ö ö ű ö ő ö ö ú ö ő ő ö ö ö ő ő ú ő ú ö ö ö ú ö ö ú ő ö ú ö ű ö ő Ó ő Á ö ő ö ö

É Ö Á Í Á Ó Ö ü

Ö Ö Ú Ó Ö ű Ő Ő ű ű Ü Ő Ó Ő

ú ú ö ö ü ü ü ü ű ü ü

ő ő Ű ü ú ú Ú ü ű ő ő ő ő Á Á Í ü É ő ő ő ő ő É ő ú ú ú ő Á Ö ő

Ö Ö ú

ú ú ü ü Á ú ú ü ű ű ú ü ü ü ü

Ü

É ú É ö ö ű ö ö ö ú ú ú ű ű ú ö ű ö ű ű ü ö ö ü ű ö ü ö ö ö ö ú ü ö ö ö ú ö ö ú ö ö ú ü ú ú ú ű ü ö ö ű ú ű ű ü ö ű ö ö ö ű ú ö ö ü ú ü ö ö ö ü ú ö ű

Ó ű ű Á ú ű ű ú ú ú ű ű É ú É Á Á ú ű Ü Á Ü Á ű Ö Ú É Ó É Á Á Á Ű Á úá Á Ö É Ö É Ü

Ü ű ö Á Ü ü ö ö

Á Á Ö Ö Ü É Ö É É Á Ú É É É É Á Á Ö Ö Ő

É ő ő ű ú Á ő Á ő ű ő ő ő ő ő ő ő ő ű ú ű ű ő ő ő ű

Ö Ö ű ű ű Ú Ú ű ű ű Ú ű

ü ö ú ö ú ü ö ü Á Ó ö ö ö ö ú ü ú ü ü ú ú ö ö ü ü ú ü ü ö ö ű ö ü ü ü ü ö ö

ö ő ő ü ü Ó ü ö ű Á ő ő ö ő Á Ó ű ö ü ő ő ű

é ú é é é é é é é é é é é é ú é ö é é é ö Ő é é é ú é é é é é é é é ö é é é ö é Ö é é ö é ö é é é ű é ö ö é ö é é ö ö é é ö ö é ö é Ö é ú é é é é é é

Í Í Í Ü Ó Ó Ö Á Ü Ü Ó Ü Ü Ó Ö Í É Ö

í Ó ó ó í ó ó ó ő í ó ó ó ó

É ö Ű ő ű ő ő ű ű

ő ö ő ú ő ö ö ő ó ő ö ü ú ö ö ó ő ö ü ó ó ó ó ő ő ő ó ó ú ő ü ő ö ö ó ü ö ö ő ű ö ö ő ú ú ó ö ő ű ö ó

ó É ó í ó ó í í ö í ó í ö ö ö ü ö ó ó ó ü ú ö ü ó ó ö ö ü ü ü ö ö ó ö í ó ű Ü ó í ú í ö í ö í Í ó ó í í ö ü ö ö í ö í ö ö ö ü ó í ö ö ó í ú ü ó ö

ű ű ű ű Ü ű ű ű Ó ű Á ű Á Ö É É É Á É É É É Ü Á Á Á ű

ö ö ö ö ö ö ö ü ö ü ö ű ö ú ü ű ö ü Í ö ú ü ü ű ö ú ü Á ü


ú ű ű É ü ű ü ű ű í ü í ő í Ü ő ő ü ú Í ő ő í ú ü ü ő ü

ő ő ő ő ő ő ú ő ü Á ü ü ő ő ő ő ő ő ő ő ő ő Ö Ó ő ő ő Ö ő ő ő

Í ö ö ű ú ö ö Í ö ü ö ü


é ö é Ö é é ő í ó í é ő ö ú é ó é ő ü ü é ó ö é é ó é é ö é ő í é é ő é é ö é ű ö é í ó é é í ö í ó í ó é é ö ó í ó ó í ó é é ö ő í ó ó í ó ü é í ü

É Í ü ú É ü ő ő ő ő ú ő ú ü ü ő ü ú ü ű ú ú ü ü Í ü ű ő ő É ő

í ó ő í é ö ő é í ó é é ó é í é é í é í íí é é é í é ö é ő é ó ő ő é ö é Ö ü é ó ö ü ö ö é é é ő í ő í ő ö é ő ú é ö é é é í é é í é é ü é é ö é ó í é

ó ú ú ü ú ő ó ő ő ó ó ó ö ó ü ő ó ő ö ü ü ó ö ő É ó ö ö ö ó ó ö ü ü ö ü ó ó ő ó ü ó ü ü ö ö É ú ó ó ö ú ö ü ü ó ó ó ü Á ö ö ü ó ö ó ö ö ö ö ó ó ö ó ó

ű Á ü ő ö í ö ö ő ő ő ő ö

ű í ú ü ü ü ü ü Ó í ü í í í É Á

ö ö ó ú ö ö ú ü ó ö ö Í ö ö ö ü ó ö ö ú ú ö ü ó ü ó ü ö ú ü ó ü ö ó Á Á ö ü ú ó ö ü ü ö ó ü ü Á ü ö ü ö ü ö ö ö ü ö ú ö ö ö ü ú ö ú ö ű ú ú ü ö ó ö ö

ő ö ő ű ó ö ó ű Í Ö Ö Á Í Ó Ö Ü É Ö Ö Ö Á Á Ö É Á Ö

Í Í Ó ű Ü Ó Ó Ü ü Ö Í Ü Í Í ú Ö Ó Í ú ú Ö Ó É Í ű ú

í í É í ó ó É ö í ó í ó í ó ó í ó í í ó ó ó í ö ö ö ö í í í ó ó ö ó

ú ü ü ú Ö ú ü ü ü ü ü ú ü ú ü ű Í ü ü ű ü ű Ó ü Ü ű ú ú Á ü ű ű ü ü Ö ü ű ü Í ü ü

ü ő ő ü ü ő ő ű í í ű ő ő ő ü ő ő í í ő ő ő ő ő ő ü ü í ő Ö ő ü í ő ü í í ő ü ő í ő ő í í ő ü ü í ő ü í ő í ő í ő ü í ő í ü í í ő

ö ö Ö ó ó ö ó ó ó ü ö í ü ú ó ó í ö ö ö ó ö ü ú ó ü ö ü ö ö Ö ü ö ö Ö ó

Ö Ö Ö Ö Ö Á Ű É Ö Ö Ö

Ü ü Ü Ö Ó ö ü ö Ó Ú Ó ü Ó ö ö Á ö ö ö ö ü

ű ú ú Ö ó Ö ó ó ó Ö ű ó ű ű ü Á ó ó ó ó ü ó ü Ö ó ó ó Ö ű ű ü Ö ű Á ú ú ú ó ű í í Ő ú Á É Ö í ó ü ű í ó ű ó Ö ú Ő ú ó í ú ó

ö ü ü ú ó í ó ü ú ö ó ű ö ó ö í ó ö í ö ű ö ó Ú ú ö ü É ó í ö Ó Á í ó í í Ú ö ú ö ű ü ó

Oktatást és tanulást támogató elektronikus Szakkönyvtári Partner Portál (e-szapport)

ö Ó ű ö ó í ó ü ö Ó ó í ö ö ó Ö ó ö í ó í ó Á í ó Á Á Ő ú ü ó Í ü ú ü

í í ü í í í í í Ó ő ő í í í Ú ü Ú í í Ú ő ü Ú ü ő

Ö ő ü Ö Ö Ő ü ő Ö Ö ü ű Á Í Ö ű ü ő ő ő Ö ü ü ő ő ő Ü ü ő ő ő ü ő ő ü ü

í ü í ü ő ő ü Í ő ő ő ú í ő ő ö ö ö ű ü í ő ő í ú ö ö ú ő ő ú í ő í ő ö ö í ő ü ü í ő ö ü ü ú í í ü ő í ü Í í í í ö ő ö ü ő í ő ő ü ű ő ő í ő í í ő ő

ö ö ö Ö ö ú Ö í Ö ű ö í Ö í ö ü ö í ú Ö Ö ö í ű ö ö í ö ö Ő ö í ü ö ö í Ö ö ö í ö í Ő í ű ű í Ö Ó í ö ö ö ö Ö Ö ö í ü ö ö Ö í ü Ö ö í ö ö ö ö ö Ö ö í

í ó í ó ó ó í í ü ú í ú ó ó ü ü í ó ü ú ó ü í í ü ü ü ó í ü í ü ü í ü ü í ó ó ó í ó í ü ó í Á

Ö Ö ö Ó Ó Ó Ó Ü ú ü Ű Ö Ö Ö ö Ü ö Í ü ű

Az informatika mint kihívás : a falak nélküli könyvtár jövője. Dr. Dani Erzsébet EJF NIIF-konferencia, Kaposvár április 28.

ű ú ü ü ü Í ü ö ü ö ü ö ü Ó ü ö ü ö ö ü ű ű ú ü ö ö ü Ó ö ű ü ö ú ö ö ü ü ű ü ü ö ö ü ü ú ö ö ü ü ú ü

ü ö ö ő ü ó ó ú ó

í í í í ó í ó ö ö í ű ü ó ó ü ú Á Á ó ó ó ó ó ó í ó ö ö ü Ó ö ü í ö ó ö í í ö í ó ó í ö í ú ó ú í ö ú ö ö ö í ó ó ó ú ó ü ó ö í ó ó í í í Á í ó ó ó

ó ö í í ü Ű Ö ó ó ű ö ü Í í í ö Ö Ó ö Ű Ö ú ó ó í í ű ö ö ö ö í ó ö ö í ö ű ö ű ö ö ö ö ö í ó Ö Ö ü ú ö ó ü ö Ö ű ö Ö ü ó ö ö ó ö ö Ó í ű ö ű ö ö ű í

ű ö ú ö ö ö ö í ű ö ö ö ű ö ö ö í ü ú í ű í ö í ú ű í ü ö ö ú ö í ö ű ú ü ö ö í ö ü ö ú ű ö ö ö í Á í ü í ö ü ö í ü ö Ő ü ö í ű ü ö í í í í í

ű ú ó ó ü í Á Á ú ó ó ó ó ó ó ó ó ó ó ó ó ó ó í ó ü É ű ü ó í ü í í í í í ó í ü í í ó ó Á

VERSENYFELHÍVÁS VERSENYFELHÍVÁS. EBC*L Champions League gazdasági verseny Az EBC*L Champions League

Átírás:

Kivonatoló program kontra emberi kivonatolás Lengyelné dr. Molnár Tünde Eszterházy Károly Főiskola

Kivonatoló program Magyar nyelvű offline kivonatoló program kvantitatív tartalomelemzés l egységeit a szöveg szavai képezik, az output: a szöveg mondatai Jelenlegi állapot: elkészült a program első verziója Tesztelés: emberi kivonatokkalvaló való összevetéssel

Szótár használat

Output

Felmérés

A felmérés alapja KOLTAY Tibor: Szöveg, információ, relevancia: néhány adalék a témakörhöz PROKNÉ Palik Mária: A tartalmi feltárás problémái online könyvtári katalógusokban Kitöltés módja: online papír alapú Feladat: ld 20% s tömörítés 17 17 releváns mondat kiválasztása á és rangsorolása Kulcsszó megjelölés (korlát nélkül)

Súlyozás Borda módszer alapján A rangsorbeli első helyezetteket n súllyal vettem figyelembe, a másodikat n 1 s s értékkel,. az utolsó lóhl helyezett 1 s súllyal l fog szerepelni az értékelésben.

KOLTAY Tibor Szöveg információ relevancia KOLTAY Tibor: Szöveg, információ, relevancia: néhány adalék a témakörhöz

Sorrend A főiskolások legrelevánsabb mondatai Az egyetemisták legrelevánsabb mondatai 1. 1. mondat 1. mondat 2. 3. mondat 14. mondat 3. 31. mondat 26. mondat 4. 14. mondat 15. mondat 5. 26. mondat 11. mondat 6. 24. mondat 3. mondat 7. 37. mondat 31. mondat 8. 15. mondat 50. mondat 9. 50. mondat 24. mondat 10. 23. mondat 18. mondat 11. 13. mondat 2. mondat 12. 10. mondat 10. mondat 13. 16. mondat 13. mondat 14. 11. mondat 9. mondat 15. 19. mondat 16. mondat 16. 18. mondat 12. mondat 17. 9. mondat 37. mondat

14,00 12,00 10,00 8,00 6,00 4,00 2,00 0,00 A kivonat mondatai a négy mintacsoportnál Magyar szakos Egyetemista informatikus könyvtáros Főiskolás informatikus könyvtáros Szakemberek Átlagos súlyozott pontszám 1. mondat 2. mondat 3. mondat 9. mondat 10. mondat 11. mondat 12. mondat 13. mondat 14. mondat 15. mondat 16. mondat 18. mondat 19. mondat 23. mondat 24. mondat 26. mondat 31. mondat 32. mondat 37. mondat 42. mondat 47. mondat 50. mondat 51. mondat 55. mondat 65. mondat 67. mondat 70. mondat 76. mondat

Súlyozott pontszámokból képzett korrelációs mátrix Informatikus könyvtáros egyetemista Informatikus könyvtáros egyetemista 1 Informatikus könyvtáros főiskolás Informatikus könyvtáros főiskolás 0,917 1 Szakemberek Szakemberek 0,486 0,445 1 Magyar szakos Magyar szakos 0,872 0,856 0,441 1

Kivonatok mondatainak eloszlása A kivonat eloszlása Koltay Tibor cikke esetén A szöveg Egyetemista informatikus könyvtáros Főiskolás informatikus könyvtáros Szakemberek Magyar szakos Szerző I. negyede 70,59% 64,71% 35,29% 70,59% 46,67% II. negyede 23,53% 29,41% 23,53% 23,53% 40,00% III. negyede 5,88% 5,88% 23,53% 5,88% 6,67% IV. negyede - - 17,65% - 6,67% 67%

Egyezés a szerző kivonatával A minta 340 tagja közül 7 fő jelölte meg ugyanazon mondatokat mint a szerző A mintacsoportok súlyozott kivonatait alapul véve az egyezés: Egyetemista informatikus könyvtáros esetén 8 mondat Főiskolás informatikus könyvtáros esetén 8 mondat Szakemberek esetén 5 mondat Magyar szakos esetén 7 mondat

Számítógépes output A két módszer esetén 10 mondat egyezik meg. A mintacsoportokkal az egyezés: Luhn módszere alapján Szószablya szótár alapján Mintacsoportok Egyező ő monda- Egyezés Egyező ő monda- Egyezés tok száma aránya tok száma aránya Informatikus könyvtáros egyetemista Informatikus könyvtáros főiskolás 3 17,65% 3 17,65% 4 23,53% 3 17,65% Szakemberek 4 23,53% 6 35,29% Magyar szakos 3 17,65% 3 17,65% Szerző kivonata 5 29,41% 3 17,65%

PROKNÉ Palik Mária: A tartalmi feltárás problémái online könyvtári katalógusokban

Sajátosságok Az egyetemista t és főiskolás klá informatikuskönyvtáros kivonata 94% ban megegyezik Az első bekezdés 4 44 illetve 3 33 mondata megtalálható a mintacsoportok kivonatában A szakembereknél k eltérőek léő a vélemények: é 52 szakember 37 különböző mondatot tett első helyre egyetlen mondat kapott 25% feletti jelölést egyetlen mondat kapott 25% feletti jelölést (a nál 80, illetve 70% 70% fölötti)

12,00 10,00 8,00 6,00 4,00 2,00 0,00 A kivonat mondatai a négy mintacsoportnál Magyar szakos Egyetemista informatikus könyvtáros Főiskolás informatikus könyvtáros Szakemberek Átlagos súl lyozott pont szám 1. mondat 2. mondat 3. mondat 4. mondat 5. mondat 7. mondat 8. mondat 9. mondat 10. mondat 16. mondat 18. mondat 19. mondat 23. mondat 27. mondat 28. mondat 30. mondat 31. mondat 36. mondat 37. mondat 38. mondat 39. mondat 41. mondat 42. mondat 47. mondat 51. mondat 6. mondat 63. mondat 65. mondat 72. mondat 81. mondat

Korrelációs mátrix a megjelölt mondatok alapján Informatikus könyvtáros egyetemista Informatikus könyvtáros főiskolás hll Informatikus könyvtáros egyetemista 1 Informatikus könyvtáros főiskolás 0,936 1 Szakemberek Szakemberek 0,526 0,471 1 Magyar szakos Magyar szakos 0,878 0,849 0,576 1

Kivonatok mondatainak eloszlása A szöveg A kivonat eloszlása Prokné Palik Mária cikke esetén Egyetemista informatikus könyvtáros Főiskolás informatikus könyvtáros Szakemberek Magyar szakos Szerző I. negyede 47,06% 47,06% 47,06% 58,82% 5,88% II. negyede 23,53% 29,41% 23,53% 29,41% 29,41% III. negyede 11,76% 11,76% 17,65% 11,76% 23,53% IV. negyede 17,65% 11,76% 11,76% 0,00% 41,18% A szerző többször nem 1-1 mondatot jelöl meg, hanem 1-1 bekezdésnyi részt.

Egyezés a szerző kivonatával Összesen 7 olyan fő van a 340 mintatag közül, akiknek a kivonata 9 mondatban megegyezik a szerző kivonatának mondataival (sorrend elhagyásával) A mintacsoportok súlyozott kivonatait alapul véve az egyezés: Egyetemista informatikus könyvtáros kivonatával 6 mondat Főiskolás informatikus könyvtáros kivonatával 6 mondat Szakemberek kivonatával 2 mondat Magyar szakos kivonatával 4 mondat

Számítógépes output A két módszer esetén 11 mondat egyezik meg. A mintacsoportokkal az egyezés: Mintacsoportok Informatikus könyvtáros könyvtáros egyetemista Informatikus könyvtáros főiskolás Luhn módszere alapján Egyező mondatok száma Egyezés aránya A Szószablya szótár alapján Egyező mondatok száma Egyezés aránya 6 35,29% 2 11,76% 6 35,29% 3 17,75% 75% Szakemberek 8 47,06% 4 23,53% Magyar szakos 8 47,06% 5 29,41% A szerző kivonata 4 23,53% 2 11,76%

Végkövetkeztetés Nincs két ember, aki ugyanazt a referátumot állítaná elő. Bár a 340 felmérésben részt vevő személy közül 7 illetve 6 személy van, akinek mondatai megegyeznek, de eltérő sorrendben kijelenthető, hogy nagyon kevés személy ítéli meg egyformán a cikkek lényeges mondatait. Nincs nagy betűs KIVONAT Kivonatoló program kontra emberi kivonatolás: DÖNTETLEN

Köszönöm a figyelmet! mtunde@ektf.hu