Egy kvantitatív szemiotika felé? Takács Boglárka

Hasonló dokumentumok
Orosz állami befolyás a magyar online hírportálokra

Szeleteljük fel úgy a tulajdonságteret, hogy az egyes szeletekbe lehetőleg egyfajta objektumok kerüljenek, de túl sok szelet se legyen.

Adat (data), információ (information), ismeret/tudás (knowledge)

Programozás 1. 2.gyakorlat

6. AZ EREDMÉNYEK ÉRTELMEZÉSE

Bizonytalanság. Mesterséges intelligencia április 4.

Klaszterezés, 2. rész

Az első számjegyek Benford törvénye

Alapfogalmak a Diszkrét matematika II. tárgyból

BÖLCS BAGOLY LEVELEZŐS MATEMATIKAVERSENY III. forduló MEGOLDÁSOK

Mi az? Többértelműség Kutatás NYELVTECHNOLÓGIA. Sass Bálint Pázmány Nap október 17.

Információs rendszerek elméleti alapjai. Információelmélet

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Bevezető feldatok. Elágazás és összegzés tétele

Big Data az adattárházban

Mesterséges Intelligencia MI

AZ ORSZÁGOS KOMPETENCIA MÉRÉS EREDMÉNYEINEK ÉRTELMEZÉSE 4. osztály AZ OLVASÁSKÉSZSÉG KIÉPÜLÉSE

Fizika. Fizika. Nyitray Gergely (PhD) PTE PMMIK március 27.

Közösség detektálás gráfokban

Mesterséges Intelligencia MI

KONYHABÚTOR FELSŐK ELEMJEGYZÉKE

Csima Judit április 9.

gyógypedagógus, SZT Bárczi Gusztáv Egységes Gyógypedagógiai Módszertani Intézmény 2

Nagy Gábor compalg.inf.elte.hu/ nagy

Lövedékálló védőmellényekben alkalmazható ballisztikai kerámia megfelelőségének vizsgálata röntgendiffrakciós (XRD) módszerrel

OKM 2012 ISKOLAI JELENTÉS A 4. ÉVFOLYAMOS ORSZÁGOS KÉSZSÉG ÉS KÉPESSÉGMÉRÉS EREDMÉNYEIRÕL. Százhalombattai Kõrösi Csoma Sándor Általános Iskola

Döntéshozatal a klinikai gyakorlatban. Fülep Zoltán Bács-Kiskun Megyei Kórház, Szegedi Egyetem Általános Orvostudományi Kar Oktató Kórháza Kecskemét

9. előadás Környezetfüggetlen nyelvek

Adatbázisok 1. Rekurzió a Datalogban és SQL-99

Gondold ki, beszéld meg, osszad meg. Párbeszéd folytatása

Statisztikai módszerek gyakorlat - paraméteres próbák

1/50. Teljes indukció 1. Back Close

Valószínűség számítási feladatok és megoldásaik

Forráskód formázási szabályok

Elemi matematika szakkör

Adattípusok, vezérlési szerkezetek. Informatika Szabó Adrienn szeptember 14.

Dodé Réka (ELTE BTK Nyelvtudomány Doktori IskolaAlkalmazott Alknyelvdok 2017 nyelvészet program) február 3. 1 / 17

A proteomika új tudománya és alkalmazása a rákdiagnosztikában

A társadalomkutatás módszerei I. Outline. Ismétlés. Notes. Notes. Notes. 6. hét. Daróczi Gergely október. 20.

Broadlink RM mini 3 infra vezérlő integrálása az inels rendszerbe

A klímamodellek eredményei mint a hatásvizsgálatok kiindulási adatai

TERMÉSZETISMERET 5-6. ÉVFOLYAM DEMETER LÁSZLÓ

Adatok és tények. Dr. Karner Orsolya: Álláskeresőknek nyújtott tréning utánkövetéses hatékonyságvizsgálata. Adatok és tények

SZTE Eötvös Loránd Kollégium. 2. Móra György: Információkinyerés természetes nyelvű szövegekből

STATISZTIKA. A maradék független a kezelés és blokk hatástól. Maradékok leíró statisztikája. 4. A modell érvényességének ellenőrzése

A számítógépes nyelvészet elmélete és gyakorlata. Formális nyelvek elmélete

Teljesítménymodellezés

Nagy Gábor compalg.inf.elte.hu/ nagy

Meddig tart egy nyelv?

Kérdıívek, tesztek I. Kérdıívek

A társadalomkutatás módszerei I.

A Budapest Főváros Kormányhivatala Fogyasztóvédelmi Felügyelőségének tanácsai a karácsonyi vásárlásokhoz

Kalapácsvetés 2016 szöveges

A tudományos bizonytalanságra adott jogi válaszok a környezeti döntéshozatalban

Robotjog? Hogyan viszonyuljon a jog a robotokhoz és a mesterséges intelligenciához? Pódiumbeszélgetések a minőségről Június 5.

TAGOZATÁN SATU MARE EXTENSION. Baranyai Tünde, Stark Gabriella

Fordított és szkript nyelvek összehasonlító elemzése. Sergyán Szabolcs

Statisztika. Politológus képzés. Daróczi Gergely április 17. Politológia Tanszék

TI és MI Alkalmazott nyelvészet és interdiszciplinaritás

Közösségi kezdeményezéseket megalapozó szükségletfeltárás módszertana. Domokos Tamás, módszertani igazgató

Az Országos kompetenciamérés (OKM) tartalmi kerete. a 20/2012. (VIII. 31.) EMMI rendelet 3. melléklete alapján

Klinikai és Bírósági Alkalmazások Valószínűségszámítási Modellek BREUER-LÁBADY PÉTER

Változók. Mennyiség, érték (v. objektum) szimbolikus jelölése, jelentése Tulajdonságai (attribútumai):

FIZIKA JAVÍTÁSI-ÉRTÉKELÉSI ÚTMUTATÓ

HU-Budapest: Vízelvezetés és felszíni munka 2010/S AJÁNLATI/RÉSZVÉTELI FELHÍVÁS. Építési beruházás

Gazdasági matematika II. vizsgadolgozat, megoldással,

BASH script programozás II. Vezérlési szerkezetek

Az igekötők gépi annotálásának problémái Kalivoda Ágnes

Főnévi csoportok azonosítása szabályalapú és hibrid módszerekkel

Az informatika részterületei. Az információ. Dr. Bacsó Zsolt

A helyi hurok átengedés versenyt stimuláló szerepe. Jusztin Tamás szabályozáspolitikai tanácsadó GTS-Datanet

Marlok Ferenc: A CHÊNEAU-KORZETT Kulcsszavak Key words Összefoglalás Summary

Adatvédelem, adatnyilvánosság, információszabadság. Dr. Jóri András (jori[at]mail.datanet.hu)

PARADIGMS FOR THE NEW TESTAMENT S HAPAX LEGOMENA

Algoritmusok és adatszerkezetek gyakorlat 03 Oszd meg és uralkodj. Nagy

MarketingMánia - A kisvállalkozók marketingasszisztense

Időjárási légnyomásváltozás regressziós analízise

b. Ha R16-os felnit és 55-ös oldalfalmagasságot választunk, akkor legfeljebb mennyi lehet a gumi szélessége? (10 pont) MEGOLDÁS:

Informatika a felsőoktatásban 2008 Debrecen, augusztus JAVA PROGRAMOZÁSI NYELV OKTATÁSA C# ALAPOKON

A leíró statisztikák

A PEDAGÓGIAI HOZZÁADOTT ÉRTÉK KONCEPCIÓJÁRÓL

Szerzőinknek A folyóiratunkba szánt kéziratok tartalmi és formai követelményei

Érdekességek az elemi matematika köréből

Téma 2: Genetikai alapelvek, a monogénes öröklődés -hez szakirodalom: (Plomin: Viselekedésgenetika 2. fejezet) *

TERMÉSZETISMERET 5. ÉVFOLYAM

3. Az indukció szerepe

Statisztikai eljárások a mintafelismerésben és a gépi tanulásban

A matematikai feladatok és megoldások konvenciói

A teljes elektromágneses spektrum

Szerzők: Kmetty Zoltán Lektor: Fokasz Nikosz TÁMOP A/1-11/ INFORMÁCIÓ - TUDÁS ÉRVÉNYESÜLÉS

FELADATMEGOLDÁSI SZOKÁSAINAK VIZSGÁLATA. Baranyai Tünde

HITELESÍTÉSI ELŐÍRÁS TERÜLETMÉRŐK HE

S atisztika 2. előadás

Civil szektor fejlesztők politikán innen, politikán túl

Exact Synergy Enterprise Időtervezés & Számlázás

On The Number Of Slim Semimodular Lattices

INFORMATIKAI ALAPISMERETEK

Nagy Gábor compalg.inf.elte.hu/ nagy ősz

Matematikai geodéziai számítások 6.

Átírás:

ב ה Egy kvantitatív szemiotika felé? Takács Boglárka http://www.prezzey.net Medizinische Universität Wien Mikata Kft.

Így merült fel a probléma: Hogyan lehet megállapítani egy jelsorozatról, hogy természetes nyelvi jellegű-e? (Meg lehet-e?) Sokan azt gondolják, ez egy megoldott kérdés. If we apply [signal entropy] to dolphin records, we get values similar to human languages, a new fact to support the idea that these animals possess a sophisticated language (Ballesteros, 2010) Akár nyelvészeti cikkekben is: Using the technique on the Pictish symbols established that it is unlikely that they are random or sematographic (heraldic) characters, but that they exhibit the characteristics of written languages. (Lee et al, 2010)

(Ilyesmikről szól a második idézet... )

Sokáig nem érdekelt senkit a téma, de a közelmúltban több új cikk. Elsősorban Rao és mtsai, cél: igazolni, hogy az Indus-völgyi civilizáció által hátrahagyott feliratok szövegesek és nem csak valamilyen képnyelvet tartalmaznak

Innen indult a vita: Rao et al (2009). Entropic Evidence for Linguistic Structure in the Indus Script. Science, 324: 1165. Hol is jelent meg? Miért ott? (Sproat 2010) Miért is ez a címe? Állításuk: a szimbólumsorozatok feltételes entrópiája hasonlít a természetes nyelvek feltételes entrópiájához, de nem hasonlít másfajta jelsorozatokéhoz. Mint például a: * Fortran * DNS bázissorrend * Mesterséges, nem nyelvi jelsorokat modellező adatsorok

Hogyan definiáljuk azt, hogy hasonlít? (Az nem érv, hogy ránézünk a grafikonra.) Még súlyosabb probléma: A kritikusok (Sproat, Shalizi, Liberman) rögtön előálltak olyan jelsorozatokkal, amelyeknek ugyanolyan a feltételes entrópiája, mint a nyelveké, de nem nyelviek. (Python, R scriptek mindenki utánuk csinálhatja) Tehát ez továbbra sem döntő bizonyíték az Indus-völgyi feliratokról De minket most nem is elsősorban azok érdekelnek, hanem a kontroll minták...

Honnan tudjuk, hogy a mesterséges jelsorok tényleg nem nyelvi szimbólumrendszereket modelleznek-e? (Milyenek azok?) Amikor valós adatokat vesznek, kisebb a különbség:. o O ( akkor most vagy a szanszkrit nem nyelv, vagy a Fortran is az? )

Hogy okosabbak lehessünk, többet kellene tudni a nem nyelvi jellegű, de attól még strukturált szimbólumrendszerekről. Nem az a valós ellentét, hogy: természetes nyelv véletlen sorozatok (ezt a kettőt azért elég jól el tudjuk különíteni...) Hanem egy kontinuumról van szó: (minden esetben a biztos megoldás ;) ) Term. nyelv - nyelvszerű dolgok - nagyon nem nyelv Minket most (kivételesen?) a középső rész érdekel. - Milyen tekintetben nyelvszerűek (több dimenzió?) - Hogyan viselkednek leíró - Tudunk-e előrejelzéseket tenni róluk a nyelvészet eszközeivel magyarázó

Azért van néhány érdekes összefüggés. Zipf-törvény (1935!): Minél gyakoribb egy elem, annál rövidebb Természetes nyelvekre igaz szokott lenni, de sok más emberi tevékenységre is. Pl. számokra (Benford-törvény): az első számjegy a leggyakoribb Alkalmazása: pl. pénzügyi csalások felderítése! (Varian, 1972) Mi lenne egy Univerzális Szemiotikában - egyáltalán lehetséges ilyen?

Van-e már ilyesmi? Egyesek szerint a mesterséges intelligencia tulajdonképpen ugyanez lenne. Sokminden, ami magát kvantitatív, komputációs, stb szemiotikának nevezi, tulajdonképpen szemantika vagy nyelvi alapú narratívakutatás + van egy ergonómiai irányzat is, amit így hívnak. A maradék nagyon sokféle, nincs egységes paradigma. Lesz-e a jövőben? Sproat tervez gyűjteni korpuszokat kiindulásul A többi rajtunk áll!

Köszönöm a figyelmet! Ha valakit érdekel az Indus-völgy vita: http://www.prezzey.net/irasok-magyarul/

Mi az a feltételes entrópia? (nagyon köznyelvien) Információelméleti entrópia (Shannon): szövegekre alkalmazva akkor maximális, ha minden jel egyforma valószínűséggel fordulhat elő, és akkor minimális, ha mindig ugyanaz a jel jelenik meg. Feltételes entrópia: ha ismerjük az első jelet (például egy A betűt), mit tudunk mondani a következőről. Ha az A betű után mindig W betű fordul elő és hasonlóképpen minden jel után egyértelmű, hogy mi jön, akkor a feltételes entrópia minimális. Maximális pedig akkor, ha az első betű ismeretében továbbra is akármi következhet. A nyelvek feltételes entrópiája a két szélsőség között helyezkedik el