Kooperáció és intelligencia

Hasonló dokumentumok

Kooperáció és intelligencia

Mágneses szuszceptibilitás vizsgálata

VÁLTOZÁSOK ÉS EREDMÉNYESSÉG: A DÉLUTÁNIG TARTÓ ISKOLA BEVEZETÉSÉNEK INTÉZMÉNYI TAPASZTALATAI

MATEMATIKA ÉRETTSÉGI TÍPUSFELADATOK MEGOLDÁSAI KÖZÉPSZINT Trigonometria

Algebra es sz amelm elet 3 el oad as Rel aci ok Waldhauser Tam as 2014 oszi f el ev

Az informatika oktatás téveszméi

KOVÁCS BÉLA, MATEMATIKA I.

Esti 11. A területi fejlettség különbség jellemzői, az eltérő gazdasági fejlettség okainak feltárása; a regionális politika lényegének megértése.

Források és társadalmi innováció - A hazai civil szervezetek hosszú távú fenntarthatóságának kérdései. Móra Veronika Ökotárs Alapítvány / MAF

Épületvillamosság laboratórium. Villámvédelemi felfogó-rendszer hatásosságának vizsgálata

Lineáris algebra gyakorlat

MATEMATIKA ÉRETTSÉGI TÍPUSFELADATOK KÖZÉPSZINT Függvények

Infó Rádió. Hírek

Dr. Schuster György február 21. Real-time operációs rendszerek RTOS

Számítógép hálózatok gyakorlat

VÁROS- ÉS INGATLANGAZDASÁGTAN Készült a TÁMOP /2/A/KMR pályázati projekt keretében Tartalomfejlesztés az ELTE TáTK

Vállalkozásfinanszírozás

1. Írja fel prímszámok szorzataként a 420-at! 2. Bontsa fel a et két részre úgy, hogy a részek aránya 5 : 4 legyen!

IFRS lexikon. IAS 17 Lízingek. Lízing. Pénzügyi lízing. Operatív lízing. Fel nem mondható lízing. A lízing kezdete. A lízing futamidő kezdete

Játékok (domináns stratégia, alkalmazása

A központi költségvetés és az államadósság finanszírozása 2015-ben

A SZÁMFOGALOM KIALAKÍTÁSA

HIEDELMEK A MOTIVÁCIÓRÓL

Áramlástechnikai gépek soros és párhuzamos üzeme, grafikus és numerikus megoldási módszerek (13. fejezet)

Bevezetés a lágy számítás módszereibe

JAVÍTÁSI-ÉRTÉKELÉSI ÚTMUTATÓ. Orvosi laboratóriumi technikai asszisztens szakképesítés Mikrobiológiai vizsgálatok modul. 1.

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Péliné Németh Csilla 1 Bartholy Judit 2 Pongrácz Rita 2 Radics Kornélia 3

Project Management

Párhuzamos programozás

paradoxonok a modern fizikában Dr. Héjjas István

Szellőző rács. Méretek. Leírás

Készítette: Bártol Csenge Témavezető: Radics Sándor - GEOHIDROTERV Kft. Egyetemi konzulens: Dr. Kovács József 2009

Az aktiválódásoknak azonban itt még nincs vége, ugyanis az aktiválódások 30 évenként ismétlődnek!

SZAKÁLL SÁNDOR, ÁsVÁNY- És kőzettan ALAPJAI

Vektorok összeadása, kivonása, szorzás számmal, koordináták, lineáris függetlenség

Növelhető-e a hazai szélerőmű kapacitás energiatárolás alkalmazása esetén?

Kruppa Attila MEE Tűzvédelmi Munkabizottság. A villamos berendezés és a villámvédelem felülvizsgálata

Tanulmányi keretrendszer az APPI-ban

MILYEN A HELYES TESTTARTÁS?

Milyen segítséget tud nyújtani a döntéshozatalban a nem-hagyományos jelfeldolgozás?

Átalakuló HR szervezet, változó Business Partneri szerepek

Tájékoztatató a pénztárak felügyeleti adatszolgáltatásával kapcsolatos változásokról

PÉNZÜGYI FOGYASZTÓVÉDELEM A MAGYAR NEMZETI BANK FELÜGYELETÉBEN

Kockázatkezelés és biztosítás

Programozható irányítóberendezések és szenzorrendszerek ZH. Távadók. Érdemjegy

Halmazok és függvények

proability projekt Tananyagfejlesztés Toarniczky Andrea, PhD Primecz Henriett PhD Csillag Sára PhD

Bár a digitális technológia nagyon sokat fejlődött, van még olyan dolog, amit a digitális fényképezőgépek nem tudnak: minden körülmények között

HITELESÍTÉSI ELŐÍRÁS ADATTÁROLÓS VITELDÍJJELZŐK ELLENÖRZŐ KÉSZÜLÉKEI HE

2011. március 9. Dr. Vincze Szilvia

Hallgatói Elégedettségi Kérdőív

A fiatalok pénzügyi kultúrája Számít-e a gazdasági oktatás?

Vasúti pálya függőleges elmozdulásának vizsgálata

KÖZLEKEDÉSI ALAPISMERETEK (KÖZLEKEDÉS - ÜZEMVITEL, KÖZLEKEDÉS-TECHNIKA) KÖZLEKEDÉSI ALAPISMERETEK ÉRETTSÉGI VIZSGA II.

Az affektív tényezők hatása a tanulmányi eredményességre Zsolnai Anikó

Azonosító jel: Matematika emelt szint

VASÚTI PÁLYA DINAMIKÁJA

JAVÍTÁSI-ÉRTÉKELÉSI ÚTMUTATÓ. Foglalkozásegészségügyi szakápoló szakképesítés Foglalkozásegészségügyi felmérés modul. 1.

Egységes jelátalakítók

Puskás Tivadar Távközlési Technikum

Makroökonómia. 11. hét

1. forduló. MEGOLDÁSOK Pontszerző Matematikaverseny 2015/2016-os tanév

Programozás I gyakorlat

Jelek tanulmányozása

KOVÁCS BÉLA, MATEMATIKA I.

2014. évi kukoricakísérlet

MBLK12: Relációk és műveletek (levelező) (előadásvázlat) Maróti Miklós, Kátai-Urbán Kamilla

Hőszivattyú. Zöldparázs Kft

Heterogén módszereket alkalmazó ágens alapú diagnosztikai rendszerek

Emelt szintű érettségi feladatsorok és megoldásaik Összeállította: Szászné Simon Judit; dátum: november. I. rész

észbontó ördöglakat Megoldófüzet a szétszedéshez Egyszemélyes játék 8 éves kortól

MOBIL CROWDSENSING ÉS BIG DATA TÁVKÖZLÉSI ÉS MÉDIAINFORMATIKAI TANSZÉK BUDAPESTI MŰSZAKI ÉS GAZDASÁGTUDOMÁNYI EGYETEM

Napenergia hasznosítási lehetőségek összehasonlító elemzése. Mayer Martin János Dr. Dán András

tartalmi szabályozók eredményesebb

Fábián Zoltán Hálózatok elmélet

[MECHANIKA- HAJLÍTÁS]

Kockázatelméleti alapfogalmak: bizonytalanság. Kovács Norbert SZE, Gazdálkodástudományi Tanszék

Minta 1. MATEMATIKA EMELT SZINTŰ ÍRÁSBELI FELADATSOR

Mértékegységrendszerek

Sz ekelyhidi L aszl o Val osz ın us egsz am ıt as es matematikai statisztika *************** Budapest, 1998

H A T Á S V I Z S G Á L A T I

Elektromos csatlakozások Multipol dugó Multipol csatlakozó kábellel. Katalógus füzetek

Minta programterv a 1. házi feladathoz

Autópálya matrica árak 2011

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Természettudomány témakör: Atomok, atommodellek Anyagok, gázok

MIKOR ÉLÜNK FIZIKAILAG AKTÍVAN?

A mechanika alapjai. A pontszerű testek dinamikája. Horváth András SZE, Fizika és Kémia Tsz szeptember 29.

LEASCENTER Befektetési és Kereskedelmi Kft.

HWDEV-02A GSM TERMOSZTÁT

Irányítástechnika Elıadás. Félvezetıs logikai áramkörök. Irodalom

Jarabin Kinga LÁBNYOMOK

Szervezeti formák bemutatása

Osztályozó és Javító vizsga témakörei matematikából 9. osztály 2. félév

Átírás:

Kooperáció és intelligencia Tanulás többágenses szervezetekben/2

Tanulás több ágensből álló környezetben -a mozgó cél tanulás problémája (alapvetően megerősítéses tanulás) Legyen az ágens közösség formalizált leírása az alábbi: N az ágensek halmaza, i N egy konkrét ágenst jelent, W a világ állapotainak halmaza, w W egy konkrét világot jelent, Ai az i-edik ágens cselekvéseinek halmaza, t i : W Ai az i-edik ágens döntési függvénye, hogy egy konkrét világállapotban milyen cselekvéshez folyamodjon, t i : W Ai az i-edik ágens cél (tanulandó ideális döntési) függvénye, e( t) = Pr ( i t(w) i t i (w) w D) az i-edik ágens hibája t-időben, annak a valószínűsége, hogy az ágens rossz döntést fog hozni, feltéve, hogy a környezeti állapotok egy D eloszlásból sorsolódnak,

A tanuló ágens környezete dinamikus, mert a benne lévő más ágensek is tanulnak és alakulnak át. Mivel az ágensünknek éppen más ágensek viselkedését ki kell tanulnia, hogy az együttműködés/ versengés miatt helyesen döntsön, azok tanulása a fő zavaró tényező.

A döntési függvény t i lehet helyes, vagy hibás: helyes volt hibás volt helyes lesz hibás lesz nem mozog mozog változik nem változik megtanulta a régit nem tanulta meg a régit új rácsúszott új nem csúszott rá t (w) = i t (w) i t (w) i t (w) i t+1 (w) = i t+1 (w) i t+1 i (w) t+1 i (w) t+1 (w) = i t (w) i t+1 i (w) t i (w) t+1 (w) i t (w) i t+1 i (w) = t i (w) t+1 (w) = i t (w) i t+1 i (w) t i (w) t (w) = i t+1 (w) i t i (w) t+1 i (w)

A függvény megváltozása - a tanulás - javíthat, de ronthat is a dolgon. A t i (w) idő közbeni változása a célpont elmozdulása a mozgó célpont. Legyen akkor az ágens tanulási (helyes célfüggvény követési) hibája: e( t i ) = w D(w) Pr(hibás volt) Konkrét tanuló algoritmus helyett próbáljuk a tanulás várható kivitelezhetőségét valószínűségi alapon modellezni. Mi a valószínűsége a sikeres megtanulásnak, ha bizonyos ráhatások valószínűsége adott. CLRI elmélet (Change, Learning, Retention, Impact)

Definiáljuk a tanuló viselkedésére jellemző alábbi mérőszámokat : - változékonyság (changing rate c(i)): a helytelen leképzés elmozdulása, de mi felé? A helytelen leképzés javítása (helyes irányba történő változás a tanulás), c(i) = Pr(változik hibás volt) -tanulás sebessége (learning rate l(i)): l(i) = Pr(megtanulta a régit hibás volt) l(i) c(i) mert a tanulás csak változással érhető el, ha az ágens cselekvéseinek választéka bináris, akkor l i = c i, mert a helytelen döntés alternatívája a helyes cselekvés, (1 l(i) ) az a valószínűség, hogy a helytelen leképezés nem javul.

- megtartás sebessége (retention r(i)): helyes volt, és helyes marad r(i) = Pr( nem változik helyes volt) - illó sebesség, illékonyság (volatility v(i)): v(i) = Pr( mozog)

Foglalkozunk most az ágens eredő hibájával: e( t) = D(w) Pr t (w) t (w) i w D i i A várható hiba t+1 időpontban függ attól, hogy a célfüggvény változik-e (a), vagy sem, illetve, hogy a döntési függvény t időpontban eredetileg helyes volt-e, vagy sem (b): Pr(E) = Pr(E a b) + Pr(E a b) + Pr(E a b) + Pr(E a b) = Pr(E a b) Pr(a b) + Pr(E a b) Pr(a b) + Pr(E a b) Pr( a b) + Pr(E a b) Pr( a b) E = hibás lesz a = nem mozog b = helyes volt

Pr(hibás lesz) = ahol az ilyen körülmények minden változatára meg kell vizsgálni a hiba alakulását (közben Bayes tételhez is folyamodtunk): A négy db valószínűség most: Pr(hibás lesz nem mozog helyes volt) = 1 r(i) Pr(hibás lesz nem mozog hibás volt) = 1 l(i) Pr(hibás lesz mozog helyes volt) = r(i) + (1 - r(i)) B B = Pr(hibás lesz mozog helyes volt nem tanulta meg a régit)

Pr(hibás lesz mozog hibás volt) = (1 - c(i)) D + l(i) + (c(i) - l(i)) F D = Pr(új nem csúszott rá mozog hibás volt) F = Pr(hibás lesz mozog hibás volt nem tanulta meg a régit változik)

Pr(a b) = Pr(a b) Pr(b) Az eredő várható hiba akkor:

t+1)) = i Pr (nem mozog helyes volt) Pr (helyes volt) (1 r(i)) + Pr (nem mozog hibás volt) Pr (hibás volt) (1 l(i)) + Pr (mozog helyes volt) Pr (helyes volt) r(i) + (1 r(i)) B + Pr (mozog hibás volt) Pr (hibás volt) (1 c(i)) D + l(i) + (c(i) l(i)) F ahol a kifejezések az ágens alábbi hiba problémáit jelentik: - a helyes leképzést megtartani nem tudja, - a helyes leképzést nem tanulja meg, - a hibás leképzést megtartja, ill. nem tartja meg, de rossz irányba változtatja, - rossz irányba tanul, nem változik, ill. változik, de nem a tanulás irányába.

Valószínűségek és a tényleges ágensek A valószínűségek ugyanúgy takarják a konkrét tanuló algoritmust, mint a konkrét architektúrát és ágensprogramot, ill. a környezetnek hatását is. További vizsgálathoz azokat a megfelelő valószínűségekbe kellene átönteni, melyek numerikusan az ágensek adottságainak felelnének meg. Így a valószínűségi (hiba) egyenletek akár nagyon bonyolult, akár igen egyszerű összefüggésekhez vezethetnek.

Egyszerű szimuláció ha a döntési, ill. a célfüggvény változik, akkor az új cselekvés megválasztása az A i felett értelmezett egyenletes eloszlásból történjen, azontúl az ágensek tanulása legyen független, ilyenkor: egy lineáris összefüggést takar (y = a x + b, ahol az x a hiba és az y a jövőbeli várható hiba).

Az ágens hibája beáll a körülményektől függő szintre, amely az alábbi diagramból kiolvasható (v i = 0.2, c i = 1, l i = 0.3, r i = 1, minden ágens 20 cselekvéssel rendelkezik, a beállt hiba színt jelen esetben kb. 0.4): Az összefüggésből és a diagramból meglátszik, hogy az ágens hibáját két erő formálja: - csökkenő irányba a tanulás (l), és y v + x (0.7 0.7 v) - növekvő irányba az illékonyság (v). [ 0.7x ] + [ -0.14x +.2 ] Mindkettő szempontjából a hiba kifejezés lineáris (tanulási egyenes pozitív, de m 1 meredekségű, az illékonysági egyenes negatív meredekségű). Az is látszik, hogy ha az ágens hibája nagyon kicsi, akkor a jósolt hibája majdnem egészében az illékonysággal magyarázható.

A tanulás mérsékli [ 0.7x ] + [ -0.14x +.2 ] A mozgó pont szétveri

További vizsgálathoz vezessük be az impakt fogalmát: azaz az j-edik ágens döntésváltozása (mozgása) milyen hatással van az i-edik ágens tanulására. Ennek segítségével meghatározható az eredő várható illékonyság, amivel viszont becsülhető a hiba várható alakulása az adott paraméterekkel (c i, r i, l i ) jellemzett ágensnél.