Idegennyelv-tanulás támogatása statisztikai és nyelvi eszközökkel

Hasonló dokumentumok
Hipotézis, sejtés STATISZTIKA. Kétmintás hipotézisek. Tudományos hipotézis. Munkahipotézis (H a ) Nullhipotézis (H 0 ) 11. Előadás

Normális eloszlás paramétereire vonatkozó próbák

Asszociációs szabályok

Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok

Két diszkrét változó függetlenségének vizsgálata, illeszkedésvizsgálat

Véletlen jelenség: okok rendszere hozza létre - nem ismerhetjük mind, ezért sztochasztikus.

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

2. A ξ valószín ségi változó eloszlásfüggvénye a következ : x 4 81 F (x) = x 4 ha 3 < x 0 különben

biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás

Valószín ségszámítás és statisztika Gyakorlat (Kétmintás próbák)

Gyakori elemhalmazok kinyerése

Online algoritmusok. Algoritmusok és bonyolultságuk. Horváth Bálint március 30. Horváth Bálint Online algoritmusok március 30.

Nemparametrikus tesztek december 3.

Kabos: Statisztika II. t-próba 9.1. Ha ismert a doboz szórása de nem ismerjük a

értékel függvény: rátermettségi függvény (tness function)

Kabos: Statisztika II. ROC elemzések Szenzitivitás és specificitás a jelfeldolgozás. és ilyenkor riaszt. Máskor nem.

22. GRÁFOK ÁBRÁZOLÁSA

STATISZTIKA I. Centrális mutatók. Helyzeti középértékek. Középértékek. Bimodális eloszlás, U. Módusz, Mo. 4. Előadás.

Nagyméretű adathalmazok kezelése (BMEVISZM144) Reinhardt Gábor április 5.

BIOMETRIA (H 0 ) 5. Előad. zisvizsgálatok. Hipotézisvizsg. Nullhipotézis

GVMST22GNC Statisztika II. Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet

Matematikai statisztika

Vizsgáljuk elôször, hogy egy embernek mekkora esélye van, hogy a saját

1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása

A konfidencia intervallum képlete: x± t( α /2, df )

MATEMATIKA évfolyam

Véletlenszám generátorok és tesztelésük HORVÁTH BÁLINT

Leíró és matematikai statisztika el adásnapló Matematika alapszak, matematikai elemz szakirány 2016/2017. tavaszi félév

LOGIKA ÉS ÉRVELÉSTECHNIKA

értékel függvény: rátermettségi függvény (tness function)

Osztályozóvizsga követelményei

Hipotézis vizsgálatok

[Biomatematika 2] Orvosi biometria

Valószín ségszámítás és statisztika

Elméleti összefoglaló a Sztochasztika alapjai kurzushoz

Matematika A3 Valószínűségszámítás, 6. gyakorlat 2013/14. tavaszi félév

Függetlenségvizsgálat, Illeszkedésvizsgálat

Gráfok 2. Legrövidebb utak, feszítőfák. Szoftvertervezés és -fejlesztés II. előadás. Szénási Sándor

Bevezetés a hipotézisvizsgálatokba

VALÓSZÍNŰSÉG, STATISZTIKA TANÍTÁSA

Statisztika I. 9. előadás. Előadó: Dr. Ertsey Imre

Bevezetés a programozásba. 12. Előadás: 8 királynő

Társadalmi és gazdasági hálózatok modellezése

( 1) i 2 i. megbízhatóságú a levont következtetése? A matematikai statisztika eszközeivel értékelje a kapott eredményeket!

Statisztikai alapismeretek (folytatás) 4. elıadás (7-8. lecke) Becslések, Hipotézis vizsgálat

Eloszlás-független módszerek (folytatás) 14. elıadás ( lecke) 27. lecke khí-négyzet eloszlású statisztikák esetszámtáblázatok

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1

Adatok statisztikai értékelésének főbb lehetőségei

13. Oldja meg a valós számok halmazán az alábbi egyenleteket!

Számítógépes döntéstámogatás OPTIMALIZÁLÁSI FELADATOK A SOLVER HASZNÁLATA

2. A ξ valószín ségi változó s r ségfüggvénye a következ : c f(x) =

Adatbányászat. Gyakori elemhalmazok Asszociációs és döntési szabályok. Szegedi Tudományegyetem. Vásárlói kosarak Gyakori elemhalmazok FP-growth

A spontán beszéd kísérőjelenségei

Valószín ségszámítás. Survey statisztika mesterszak és földtudomány alapszak Backhausz Ágnes 2018/2019.

Matematikai statisztika c. tárgy oktatásának célja és tematikája

Adatszerkezetek 2. Dr. Iványi Péter

Statisztikai csalások és paradoxonok. Matematikai statisztika Gazdaságinformatikus MSc november 26. 1/31

Vérsejtszámlálás. Bürker kamra

Intelligens Rendszerek Elmélete. Versengéses és önszervező tanulás neurális hálózatokban

A Mazsola KORPUSZLEKÉRDEZŐ

ALÁÍRÁS NÉLKÜL A TESZT ÉRVÉNYTELEN!

Programozás I. zárthelyi dolgozat

Közösség detektálás gráfokban

Véletlen gráfok. Backhausz Ágnes Eötvös Loránd Tudományegyetem és MTA Rényi Alfréd Matematikai Kutatóintézet december 2.

e (t µ) 2 f (t) = 1 F (t) = 1 Normális eloszlás negyedik centrális momentuma:

Gazdasági matematika II. tanmenet

MATEMATIKA 5 8. ALAPELVEK, CÉLOK

Kérdésfelvetés Alapmódszer Finomítás További lehetőségek. Sass Bálint

1. Bevezet példák, síbérlés

0653. MODUL TÖRTEK. Szorzás törttel, osztás törttel KÉSZÍTETTE: BENCZÉDY LACZKA KRISZTINA, MALMOS KATALIN

Keresés és rendezés. A programozás alapjai I. Hálózati Rendszerek és Szolgáltatások Tanszék Farkas Balázs, Fiala Péter, Vitéz András, Zsóka Zoltán

Az első számjegyek Benford törvénye

Képfeldolgozás. 1. el adás. A képfeldolgozás m veletei. Mechatronikai mérnök szak BME, 2008

Adatszerkezetek 1. előadás

SAVARIAI ISEUM TERÜLETÉN ELŐKERÜLT EGYIPTOMI KÉK PIGMENT LABDACSOK ÉS FESTÉKMARADVÁNYOK OPTIKAI MIKROSZKÓPOS VIZSGÁLATA HARSÁNYI ESZTER

Valószín ségszámítás és statisztika Gyakorlat (Statisztika alapjai)

Statisztikai módszerek 7. gyakorlat

Szövegértés évfolyam

Populációbecslés és monitoring. Eloszlások és alapstatisztikák

A szülők pedagógiai érdeklődésének vizsgálata és annak andragógiai tanulságai

Ellátási lánc optimalizálás P-gráf módszertan alkalmazásával mennyiségi és min ségi paraméterek gyelembevételével

Biomatematika 13. Varianciaanaĺızis (ANOVA)

A foglalkoztatást előseg. Fejér Megyei Kormányhivatal Munkaügyi Központja Székesfehérvár, március

Lineáris egyenletrendszerek

Gyakornoki program pályakezdők támogatására

Hipotézis vizsgálatok

I. LABOR -Mesterséges neuron

GY.I.K. Kérdések és válaszok a távirányítókkal kapcsolatban

Korreláció és lineáris regresszió

Abszolút folytonos valószín ségi változó (4. el adás)

A leíró statisztikák

API-MÁGIA MILLIÓ SORNYI ADAT ÚJRARENDEZÉSE. Előadó: Jaksa Zsombor, drungli.com

Az SPC alapjai. Az SPC alapjai SPC Az SPC (Statistic Process Control) módszer. Dr. Illés Balázs

Kiválasztás. A változó szerint. Rangok. Nem-paraméteres eljárások. Rang: Egy valamilyen szabály szerint felállított sorban elfoglalt hely.

Hipotéziselmélet - paraméteres próbák. eloszlások. Matematikai statisztika Gazdaságinformatikus MSc szeptember 10. 1/58

MATEMATIKA ÉRETTSÉGI VIZSGA ÁLTALÁNOS KÖVETELMÉNYEI

Biometria, haladó biostatisztika EA+GY biometub17vm Szerda 8:00-9:00, 9:00-11:00 Déli Tömb 0-804, Lóczy Lajos terem

Mutatók és mutató-aritmetika C-ben március 19.

Általános statisztika II. Kriszt, Éva Varga, Edit Kenyeres, Erika Korpás, Attiláné Csernyák, László

Valószín ségszámítás és statisztika

Átírás:

statisztikai és nyelvi eszközökkel Témalabor 2. beszámoló Témavezet : Vámos Gábor 2009. január 9.

Mir l lesz szó? A cél: tesztelni és tanítani 1 A cél: tesztelni és tanítani Eszközök és célok Szókincs fejlesztése 2 El -gráf építése El -gráf sz rése 3 Információértékek és szócsoportok

Eszközök és célok Szókincs fejlesztése Eszközök és célok Milyen célt lehet kit zni? Mit lehet elvárni? Mik a lehetséges eszközök?

Eszközök és célok Szókincs fejlesztése Eszközök és célok Milyen célt lehet kit zni? Mit lehet elvárni? Mik a lehetséges eszközök? Eszközök: internet korpusz (rendelkezésre áll) szavak, szófajuk, ragozatlan alakjuk (például: megy/ige/menni) statisztika (szavak gyakorisága) adatbányászat (összefüggések kinyerése)

Eszközök és célok Szókincs fejlesztése Eszközök és célok Milyen célt lehet kit zni? Mit lehet elvárni? Mik a lehetséges eszközök? Eszközök: Célok: internet korpusz (rendelkezésre áll) szavak, szófajuk, ragozatlan alakjuk (például: megy/ige/menni) statisztika (szavak gyakorisága) adatbányászat (összefüggések kinyerése) alkalmazkodni a tanuló tudásszintjéhez szavak tanítása szókapcsolatok, szószerkezetek tanítása a nyelv egy lehetséges modellje: kész mondatsémák

Eszközök és célok Szókincs fejlesztése Szókincs fejlesztése Két lépésben valósul meg: szótesztel és szótanító. Ma az els t mutatom be.

Eszközök és célok Szókincs fejlesztése Szókincs fejlesztése Két lépésben valósul meg: szótesztel és szótanító. Ma az els t mutatom be. Mit kezdünk az információval, hogy az adott szót tudja-e vagy sem? ha ismeretlen megtanítani ha ismert mely szavakat ismerheti még, amiket nem kell megkérdezni?

Eszközök és célok Szókincs fejlesztése Szókincs fejlesztése Két lépésben valósul meg: szótesztel és szótanító. Ma az els t mutatom be. Mit kezdünk az információval, hogy az adott szót tudja-e vagy sem? ha ismeretlen megtanítani ha ismert mely szavakat ismerheti még, amiket nem kell megkérdezni? Ehhez kell: szavak struktúráját, kapcsolatrendszerét feltárni véletlenített kérdez eljárás, mely tudja, hogy mikor kell megállni (statisztika, hipotézisvizsgálat)

El -gráf építése El -gráf sz rése Naiv módszer: a gyakori szavak az érdekesek. Minden szóhoz kigy jtjük a gyakoriságát.

El -gráf építése El -gráf sz rése Naiv módszer: a gyakori szavak az érdekesek. Minden szóhoz kigy jtjük a gyakoriságát. De ez nem elég! aki ismer néhányat a leggyakoribb szavak közül, az feltehet leg ismeri az alapszókincset

El -gráf építése El -gráf sz rése Naiv módszer: a gyakori szavak az érdekesek. Minden szóhoz kigy jtjük a gyakoriságát. De ez nem elég! aki ismer néhányat a leggyakoribb szavak közül, az feltehet leg ismeri az alapszókincset megoldás: szócsoportok kialakítása szócsoporton belül az ismert szavak arányának megállapítása

El -gráf építése El -gráf sz rése Naiv módszer: a gyakori szavak az érdekesek. Minden szóhoz kigy jtjük a gyakoriságát. De ez nem elég! aki ismer néhányat a leggyakoribb szavak közül, az feltehet leg ismeri az alapszókincset megoldás: szócsoportok kialakítása szócsoporton belül az ismert szavak arányának megállapítása bizonyos szavak összetartoznak. Pl.: globális...

El -gráf építése El -gráf sz rése Naiv módszer: a gyakori szavak az érdekesek. Minden szóhoz kigy jtjük a gyakoriságát. De ez nem elég! aki ismer néhányat a leggyakoribb szavak közül, az feltehet leg ismeri az alapszókincset megoldás: szócsoportok kialakítása szócsoporton belül az ismert szavak arányának megállapítása bizonyos szavak összetartoznak. Pl.: globális... kéne egy gráfszerkezet súlyokkal, következési valószín ségekkel a gráf pontjai a szavak, élei a következtetések ha ismeri ezt a szót, p valószín séggel ismeri a másikat is, hiszen feltehet, hogy szövegb l tanulta is, akárcsak a gép

El -gráf építése El -gráf sz rése Naiv módszer: a gyakori szavak az érdekesek. Minden szóhoz kigy jtjük a gyakoriságát. De ez nem elég! aki ismer néhányat a leggyakoribb szavak közül, az feltehet leg ismeri az alapszókincset megoldás: szócsoportok kialakítása szócsoporton belül az ismert szavak arányának megállapítása bizonyos szavak összetartoznak. Pl.: globális... kéne egy gráfszerkezet súlyokkal, következési valószín ségekkel a gráf pontjai a szavak, élei a következtetések ha ismeri ezt a szót, p valószín séggel ismeri a másikat is, hiszen feltehet, hogy szövegb l tanulta is, akárcsak a gép Ilyen típusú szabályokat keresünk: A p B (ahol A, B egy-egy szó, p [0, 1] egy valószín ség). Példa: globális 0.6 felmelegedés.

El -gráf építése A cél: tesztelni és tanítani El -gráf építése El -gráf sz rése Az adatbázis nagy (2 GB). Egy tesztfuttatás rövid. Egy menetben feldolgozunk 1-2 véletlenszer en választott szöveget.

El -gráf építése A cél: tesztelni és tanítani El -gráf építése El -gráf sz rése Az adatbázis nagy (2 GB). Egy tesztfuttatás rövid. Egy menetben feldolgozunk 1-2 véletlenszer en választott szöveget. Feldolgozás = minden szóra (pont) és szópárra (él) eltároljuk a gyakoriságukat, vagy hozzáadjuk a meglév khöz.

El -gráf építése A cél: tesztelni és tanítani El -gráf építése El -gráf sz rése Az adatbázis nagy (2 GB). Egy tesztfuttatás rövid. Egy menetben feldolgozunk 1-2 véletlenszer en választott szöveget. Feldolgozás = minden szóra (pont) és szópárra (él) eltároljuk a gyakoriságukat, vagy hozzáadjuk a meglév khöz. Probléma: memóriakorlát. A gráf építéséhez gyors hozzáférés kéne.

El -gráf építése A cél: tesztelni és tanítani El -gráf építése El -gráf sz rése Az adatbázis nagy (2 GB). Egy tesztfuttatás rövid. Egy menetben feldolgozunk 1-2 véletlenszer en választott szöveget. Feldolgozás = minden szóra (pont) és szópárra (él) eltároljuk a gyakoriságukat, vagy hozzáadjuk a meglév khöz. Probléma: memóriakorlát. A gráf építéséhez gyors hozzáférés kéne. Megoldás: sejtekben tároljuk az adatokat (pont-sejtek és él-sejtek). fels korlát a méretre. Ha megtelik, osztódik. sejten belül a tömb rendezett, így a sejteknek egymáshoz képest is kialakul egy sorrendjük sejtkatalógus - vö. Révai Nagy Lexikonból ami a könyvespolcról látszik

El -gráf sz rése A cél: tesztelni és tanítani El -gráf építése El -gráf sz rése Hány szó, hány szópár lesz? Ha a gráfban n pont van, akkor az élek száma n 2.

El -gráf sz rése A cél: tesztelni és tanítani El -gráf építése El -gráf sz rése Hány szó, hány szópár lesz? Ha a gráfban n pont van, akkor az élek száma n 2. Végeredmény: 8 pont-sejt, 382 (!) él-sejt. Pedig minden sejt fels korláta 100 KB. Oka?

El -gráf sz rése A cél: tesztelni és tanítani El -gráf építése El -gráf sz rése Hány szó, hány szópár lesz? Ha a gráfban n pont van, akkor az élek száma n 2. Végeredmény: 8 pont-sejt, 382 (!) él-sejt. Pedig minden sejt fels korláta 100 KB. Oka? a szavak közül mindig ugyanazok a gyakoriak kerülnek el, nagy többségben, csak az számlálójukat növeltem viszont minden mondatban újabb és újabb szópárok keletkeznek, melyek az egész világon csak ebben az egy mondatban szerepelnek rengeteg szópár gyakorisága 1, ill. 2

El -gráf sz rése A cél: tesztelni és tanítani El -gráf építése El -gráf sz rése Hány szó, hány szópár lesz? Ha a gráfban n pont van, akkor az élek száma n 2. Végeredmény: 8 pont-sejt, 382 (!) él-sejt. Pedig minden sejt fels korláta 100 KB. Oka? a szavak közül mindig ugyanazok a gyakoriak kerülnek el, nagy többségben, csak az számlálójukat növeltem viszont minden mondatban újabb és újabb szópárok keletkeznek, melyek az egész világon csak ebben az egy mondatban szerepelnek rengeteg szópár gyakorisága 1, ill. 2 Ha ezeket töröljük, elférnek a memóriában. A szavak közül csak a leggyakoribbakat hagyom meg, annyit, amennyi még éppen elfér.

El -gráf építése El -gráf sz rése Mikor vezessen él egy szóból a másikba a végleges gráfban?

El -gráf építése El -gráf sz rése Mikor vezessen él egy szóból a másikba a végleges gráfban? Ha a két szó egymással összefügg. Ha függetlenek, akkor ne vezessen él, ekkor ugyanis a kapott eredmény megtéveszt lenne. (Hasonló a helyzet: adatbányászat, asszociációs szabályok.)

El -gráf építése El -gráf sz rése Mikor vezessen él egy szóból a másikba a végleges gráfban? Ha a két szó egymással összefügg. Ha függetlenek, akkor ne vezessen él, ekkor ugyanis a kapott eredmény megtéveszt lenne. (Hasonló a helyzet: adatbányászat, asszociációs szabályok.) Függetlenségvizsgálatot hajtunk végre. A és B két szót jelöl. A A B a 11 a 12 a 11 + a 12 B a 21 a 22 a 21 + a 22 a 11 + a 21 a 12 + a 22 n

El -gráf építése El -gráf sz rése Mikor vezessen él egy szóból a másikba a végleges gráfban? Ha a két szó egymással összefügg. Ha függetlenek, akkor ne vezessen él, ekkor ugyanis a kapott eredmény megtéveszt lenne. (Hasonló a helyzet: adatbányászat, asszociációs szabályok.) Függetlenségvizsgálatot hajtunk végre. A és B két szót jelöl. A A B a 11 a 12 a 11 + a 12 B a 21 a 22 a 21 + a 22 a 11 + a 21 a 12 + a 22 n Ha a kontingenciatáblázat minden eleme nagyobb tíznél, χ 2 -próbát alkalmazunk. Ha nem, binomiális próbát. Ha elvetjük a nullhipotézist (függetlenség), akkor az oda-élet és vissza-élet is behúzzuk. Az A p B él súlya: p = gyak(a,b) gyak(a).

Információértékek és szócsoportok Információértékek és szócsoportok Minden pontnak és minden élnek van egy súlya. A pontok súlya: a megfelel szó gyakorisága (hányszor fordul el ). Az élek súlya: a következési valószín ség.

Információértékek és szócsoportok Információértékek és szócsoportok Minden pontnak és minden élnek van egy súlya. A pontok súlya: a megfelel szó gyakorisága (hányszor fordul el ). Az élek súlya: a következési valószín ség. Egy pont információértéke nulladik közelítésben: a pont súlya. Els közelítésben: a pont súlya, plusz a leszármazottainak élsúlyokkal súlyozott információértékeinek összege.

Információértékek és szócsoportok Információértékek és szócsoportok Minden pontnak és minden élnek van egy súlya. A pontok súlya: a megfelel szó gyakorisága (hányszor fordul el ). Az élek súlya: a következési valószín ség. Egy pont információértéke nulladik közelítésben: a pont súlya. Els közelítésben: a pont súlya, plusz a leszármazottainak élsúlyokkal súlyozott információértékeinek összege. Azaz: ha az ábrán pirossal jelölt pontot a tanuló ismeri (mint szót), akkor a megfelel valószín ségek szerint a bel le elérhet ket is ismeri. Ha nem, akkor a piros ponttal együtt (valószín leg) a bel le elérhet ket is megtanítjuk!

Információértékek és szócsoportok Információértékek és szócsoportok Minden pontnak és minden élnek van egy súlya. A pontok súlya: a megfelel szó gyakorisága (hányszor fordul el ). Az élek súlya: a következési valószín ség. Egy pont információértéke nulladik közelítésben: a pont súlya. Els közelítésben: a pont súlya, plusz a leszármazottainak élsúlyokkal súlyozott információértékeinek összege. Azaz: ha az ábrán pirossal jelölt pontot a tanuló ismeri (mint szót), akkor a megfelel valószín ségek szerint a bel le elérhet ket is ismeri. Ha nem, akkor a piros ponttal együtt (valószín leg) a bel le elérhet ket is megtanítjuk! Az információérték a szó gyakoriságának általánosítása. A szavakat információértékük alapján sorbarakjuk, majd a kapott listát egyenletesen n szócsoportra osztjuk.

Információértékek és szócsoportok Két céllal kérdezhetünk rá egy szóra: statisztikai vagy tanítási céllal.

Információértékek és szócsoportok Két céllal kérdezhetünk rá egy szóra: statisztikai vagy tanítási céllal. statisztikai cél: megtudni egy szócsoportban az ismert szavak eloszlását. Utána vizsgáljuk azt a hipotézist, hogy szignikáns-e már a minta (hipergeometrikus eloszlás). Így kétféle szócsoport alakul ki: amiben a minta már szignikáns, és amiben még nem.

Információértékek és szócsoportok Két céllal kérdezhetünk rá egy szóra: statisztikai vagy tanítási céllal. statisztikai cél: megtudni egy szócsoportban az ismert szavak eloszlását. Utána vizsgáljuk azt a hipotézist, hogy szignikáns-e már a minta (hipergeometrikus eloszlás). Így kétféle szócsoport alakul ki: amiben a minta már szignikáns, és amiben még nem. tanítási cél: olyan szót találni, ami gyakori (nagy információérték ), de még nem ismeri a tanuló.

Információértékek és szócsoportok Két céllal kérdezhetünk rá egy szóra: statisztikai vagy tanítási céllal. statisztikai cél: megtudni egy szócsoportban az ismert szavak eloszlását. Utána vizsgáljuk azt a hipotézist, hogy szignikáns-e már a minta (hipergeometrikus eloszlás). Így kétféle szócsoport alakul ki: amiben a minta már szignikáns, és amiben még nem. tanítási cél: olyan szót találni, ami gyakori (nagy információérték ), de még nem ismeri a tanuló. Ha egy szócsoportban a minta szignikáns lett, megszorozzuk az ott található szavak információértékét az ISMERETLEN szavak arányával. Az így kapott mér szám szemléletes jelentése: ha erre a szóra rákérdezünk, mi az ezáltal megtanítható szavak várható értéke.

Információértékek és szócsoportok Két céllal kérdezhetünk rá egy szóra: statisztikai vagy tanítási céllal. statisztikai cél: megtudni egy szócsoportban az ismert szavak eloszlását. Utána vizsgáljuk azt a hipotézist, hogy szignikáns-e már a minta (hipergeometrikus eloszlás). Így kétféle szócsoport alakul ki: amiben a minta már szignikáns, és amiben még nem. tanítási cél: olyan szót találni, ami gyakori (nagy információérték ), de még nem ismeri a tanuló. Ha egy szócsoportban a minta szignikáns lett, megszorozzuk az ott található szavak információértékét az ISMERETLEN szavak arányával. Az így kapott mér szám szemléletes jelentése: ha erre a szóra rákérdezünk, mi az ezáltal megtanítható szavak várható értéke. A végleges algoritmusban a kétféle kérdéstípust váltogatjuk.

Információértékek és szócsoportok Mennyiben függ a kérdés a tanulótól? Azaz: mennyire adaptív az algoritmus?

Információértékek és szócsoportok Mennyiben függ a kérdés a tanulótól? Azaz: mennyire adaptív az algoritmus? a gráf alapján: ha egy szóról kiderül, hogy ismert, valószín leg a leszármazottai is azok

Információértékek és szócsoportok Mennyiben függ a kérdés a tanulótól? Azaz: mennyire adaptív az algoritmus? a gráf alapján: ha egy szóról kiderül, hogy ismert, valószín leg a leszármazottai is azok csökkentem az információértéküket

Információértékek és szócsoportok Mennyiben függ a kérdés a tanulótól? Azaz: mennyire adaptív az algoritmus? a gráf alapján: ha egy szóról kiderül, hogy ismert, valószín leg a leszármazottai is azok csökkentem az információértéküket a szócsoportok alapján: ha egy szócsoportról kiderül, hogy magas szinten ismert, valószín leg a meg nem kérdezett elemei is azok

Információértékek és szócsoportok Mennyiben függ a kérdés a tanulótól? Azaz: mennyire adaptív az algoritmus? a gráf alapján: ha egy szóról kiderül, hogy ismert, valószín leg a leszármazottai is azok csökkentem az információértéküket a szócsoportok alapján: ha egy szócsoportról kiderül, hogy magas szinten ismert, valószín leg a meg nem kérdezett elemei is azok súlyozódik az információérték az ISMERETLENEK relatív gyakoriságával, így csökken

Információértékek és szócsoportok Köszönöm a gyelmet! Köszönöm a gyelmet!