Budapesti Műszaki és Gazdaságtudományi Egyetem december 2.

Hasonló dokumentumok
1: Bevezetés: Internet, rétegmodell Alapok: aszimptótika, gráfok. HálózatokII, 2007

Számítógép hálózatok, osztott rendszerek 2009

11. Előadás. 11. előadás Bevezetés a lineáris programozásba

IP anycast. Jákó András BME TIO

További forgalomirányítási és szervezési játékok. 1. Nematomi forgalomirányítási játék

Idő-ütemterv hálók - I. t 5 4

Hálózati Folyamok Alkalmazásai. Mályusz Levente BME Építéskivitelezési és Szervezési Tanszék

Irányításelmélet és technika II.

Sorozatok és Sorozatok és / 18

Mesterséges Intelligencia MI

Teljesen elosztott adatbányászat pletyka algoritmusokkal. Jelasity Márk Ormándi Róbert, Hegedűs István

Statisztikai módszerek a skálafüggetlen hálózatok

IP alapú kommunikáció. 4. Előadás Routing 1 Kovács Ákos

Diszkrét idejű felújítási paradoxon

Adott: VPN topológia tervezés. Költségmodell: fix szakaszköltség VPN végpontok

A sorozat fogalma. függvényeket sorozatoknak nevezzük. Amennyiben az értékkészlet. az értékkészlet a komplex számok halmaza, akkor komplex

Diverzifikáció Markowitz-modell MAD modell CAPM modell 2017/ Szegedi Tudományegyetem Informatikai Intézet

Új módszerek és eszközök infokommunikációs hálózatok forgalmának vizsgálatához

Hálózati réteg. WSN topológia. Útvonalválasztás.

Idõ-ütemterv há lók - I. t 5 4

1. Mit jelent a /24 címmel azonosított alhálózat?

Megkülönböztetett kiszolgáló routerek az

Hálózati Technológiák és Alkalmazások

Csoportos üzenetszórás optimalizálása klaszter rendszerekben

Összefoglalás és gyakorlás

A maximum likelihood becslésről

Fine-Grained Network Time Synchronization using Reference Broadcast

minden x D esetén, akkor x 0 -at a függvény maximumhelyének mondjuk, f(x 0 )-at pedig az (abszolút) maximumértékének.

Intelligens Rendszerek Elmélete. Versengéses és önszervező tanulás neurális hálózatokban

Termelés- és szolgáltatásmenedzsment

Dr. Kalló Noémi. Termelés- és szolgáltatásmenedzsment. egyetemi adjunktus Menedzsment és Vállalatgazdaságtan Tanszék. Dr.

Biomatematika 2 Orvosi biometria

Mesterséges Intelligencia MI

Sapientia - Erdélyi Magyar TudományEgyetem (EMTE) Csíkszereda IRT- 4. kurzus. 3. Előadás: A mohó algoritmus

Valószínűségszámítás összefoglaló

A Markowitz modell: kvadratikus programozás

[Biomatematika 2] Orvosi biometria

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Online migrációs ütemezési modellek

Megoldott feladatok november 30. n+3 szigorúan monoton csökken, 5. n+3. lim a n = lim. n+3 = 2n+3 n+4 2n+1

Autoregresszív és mozgóátlag folyamatok. Géczi-Papp Renáta

Két típusú összeköttetés PVC Permanent Virtual Circuits Szolgáltató hozza létre Operátor manuálisan hozza létre a végpontok között (PVI,PCI)

Multiprotocol encapsulation (RFC1483) - IETF Classical IP over ATM (RFC1577) - IETF LAN Emulation (LANE) - ATM Forum Multiprotocol over ATM (MPOA) -

Kollektív tanulás milliós hálózatokban. Jelasity Márk

Valószínűségi modellellenőrzés Markov döntési folyamatokkal

2008 II. 19. Internetes alkalmazások forgalmának mérése és osztályozása. Február 19

egyenletesen, és c olyan színű golyót teszünk az urnába, amilyen színűt húztunk. Bizonyítsuk

Autoregresszív és mozgóátlag folyamatok

c adatpontok és az ismeretlen pont közötti kovariancia vektora

Hálózati Technológiák és Alkalmazások

Sorozatok, sorok, függvények határértéke és folytonossága Leindler Schipp - Analízis I. könyve + jegyzetek, kidolgozások alapján

Diszkrét matematika II., 8. előadás. Vektorterek

VIHIMA07 Mobil és vezeték nélküli hálózatok QoS alapok áttekintése

[Biomatematika 2] Orvosi biometria

Hálózati réteg. Feladata: a csomag eljusson a célig Több útválasztó Ez a legalacsonyabb rétek, mely a két végpont

Az adott eszköz IP címét viszont az adott hálózat üzemeltetői határozzákmeg.

1. Házi feladat. Határidő: I. Legyen f : R R, f(x) = x 2, valamint. d : R + 0 R+ 0

IBNR számítási módszerek áttekintése

Jelek és rendszerek 1. 10/9/2011 Dr. Buchman Attila Informatikai Rendszerek és Hálózatok Tanszék

Algoritmuselmélet. Katona Gyula Y. Számítástudományi és Információelméleti Tanszék Budapesti Műszaki és Gazdaságtudományi Egyetem. 13.

Fraktálok. Kontrakciók Affin leképezések. Czirbusz Sándor ELTE IK, Komputeralgebra Tanszék. TARTALOMJEGYZÉK Kontrakciók Affin transzformációk

Ellátási lánc optimalizálás P-gráf módszertan alkalmazásával mennyiségi és min ségi paraméterek gyelembevételével

Újdonságok Nexus Platformon

A szimplex tábla. p. 1

Regresszió. Csorba János. Nagyméretű adathalmazok kezelése március 31.

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Funkcionálanalízis. n=1. n=1. x n y n. n=1

V2V - routing. Intelligens közlekedési rendszerek. VITMMA10 Okos város MSc mellékspecializáció. Simon Csaba

Szolgáltatások és alkalmazások (VITMM131)

Ethernet/IP címzés - gyakorlat

Hálózati Folyamok Alkalmazásai. Mályusz Levente BME Építéskivitelezési és Szervezési Tanszék

GPK M1 (BME) Interpoláció / 16

Az optimális megoldást adó algoritmusok

Numerikus módszerek beugró kérdések

2. Reprezentáció-függvények, Erdős-Fuchs tétel

Routing. Számítógép-hálózatok. Dr. Lencse Gábor. egyetemi docens Széchenyi István Egyetem, Távközlési Tanszék

Hálózatok II. A hálózati réteg forgalomirányítása

út hosszát. Ha a két várost nem köti össze út, akkor legyen c ij = W, ahol W már az előzőekben is alkalmazott megfelelően nagy szám.

ANALÍZIS III. ELMÉLETI KÉRDÉSEK

Teljesen elosztott adatbányászat alprojekt

Hidraulikus hálózatok robusztusságának növelése

Mesterséges Intelligencia MI

A fontosabb definíciók

Kronecker-modulusok kombinatorikája és alkalmazások

Véletlenszám generátorok és tesztelésük. Tossenberger Tamás

Készítette: Fegyverneki Sándor

Döntéselőkészítés. VII. előadás. Döntéselőkészítés. Egyszerű Kőnig-feladat (házasság feladat)

Saj at ert ek-probl em ak febru ar 26.

JAVASLAT A TOP-K ELEMCSERÉK KERESÉSÉRE NAGY ONLINE KÖZÖSSÉGEKBEN

Min. , ha =, , ha = 0 egyébként. Forrás és cél csp-ra vonatkozó kényszerek Köztes csp-ra vonatozó, folyammegmaradási kényszer

A Markowitz modell: kvadratikus programozás

Sztöchiometriai egyenletrendszerek minimális számú aktív változót tartalmazó megoldásainak meghatározása a P-gráf módszertan alkalmazásával

Statisztikai következtetések Nemlineáris regresszió Feladatok Vége

Számítógépes Hálózatok

STATISZTIKA. A maradék független a kezelés és blokk hatástól. Maradékok leíró statisztikája. 4. A modell érvényességének ellenőrzése

Forgalmi tervezés az Interneten

10. Előadás. 1. Feltétel nélküli optimalizálás: Az eljárás alapjai

Tartalom. Router és routing. A 2. réteg és a 3. réteg működése. Forgalomirányító (router) A forgalomirányító összetevői

SzIP kompatibilis sávszélesség mérések

Függvények növekedési korlátainak jellemzése

Átírás:

Számítástudományi és Információelméleti Tanszék Budapesti Műszaki és Gazdaságtudományi Egyetem 2008. december 2.

Útvonalválasztás Cél egy hálózatban két csomópont között a legrövidebb útvonal kiválasztása. A hálózat lehet:

Útvonalválasztás Cél egy hálózatban két csomópont között a legrövidebb útvonal kiválasztása. A hálózat lehet: telefon hálózat

Útvonalválasztás Cél egy hálózatban két csomópont között a legrövidebb útvonal kiválasztása. A hálózat lehet: telefon hálózat elektronikus adat hálózat (pl: Internet)

Útvonalválasztás Cél egy hálózatban két csomópont között a legrövidebb útvonal kiválasztása. A hálózat lehet: telefon hálózat elektronikus adat hálózat (pl: Internet) úthálózat

Útvonalválasztás Cél egy hálózatban két csomópont között a legrövidebb útvonal kiválasztása. A hálózat lehet: telefon hálózat elektronikus adat hálózat (pl: Internet) úthálózat csomagkapcsolt hálózatok (pl:tcp/ip)

Útvonalválasztás Cél egy hálózatban két csomópont között a legrövidebb útvonal kiválasztása. A hálózat lehet: telefon hálózat elektronikus adat hálózat (pl: Internet) úthálózat csomagkapcsolt hálózatok (pl:tcp/ip) adatcsomagok

Útvonalválasztás Cél egy hálózatban két csomópont között a legrövidebb útvonal kiválasztása. A hálózat lehet: telefon hálózat elektronikus adat hálózat (pl: Internet) úthálózat csomagkapcsolt hálózatok (pl:tcp/ip) adatcsomagok csomópontok (routerek) routing táblával

Útvonalválasztás Cél egy hálózatban két csomópont között a legrövidebb útvonal kiválasztása. A hálózat lehet: telefon hálózat elektronikus adat hálózat (pl: Internet) úthálózat csomagkapcsolt hálózatok (pl:tcp/ip) adatcsomagok csomópontok (routerek) routing táblával linkek

Csomagkapcsolt hálózatok Küldés típusa szerint: unicast multicast anycast broadcast

Csomagkapcsolt hálózatok(2) Általános útvonalválasztó algoritmus felépítése: 1 linkek késleltetésének (késleltetés mátrix) megbecslése a rendelkezésre álló információk alapján

Csomagkapcsolt hálózatok(2) Általános útvonalválasztó algoritmus felépítése: 1 linkek késleltetésének (késleltetés mátrix) megbecslése a rendelkezésre álló információk alapján 2 optimális útvonalak kiszámítása minden lehetsége útvonalra (pl:dijkstra)

Csomagkapcsolt hálózatok(2) Általános útvonalválasztó algoritmus felépítése: 1 linkek késleltetésének (késleltetés mátrix) megbecslése a rendelkezésre álló információk alapján 2 optimális útvonalak kiszámítása minden lehetsége útvonalra (pl:dijkstra) 3 routing táblák frissítése

Célfüggvény és rendelkezésre álló információ Lehetséges célok: átlagos csomagkésleltetés minimalizálása átlagos csomagvesztési arány csökkentése más Quality of Service (QoS) mérték minimalizálás

Célfüggvény és rendelkezésre álló információ Lehetséges célok: átlagos csomagkésleltetés minimalizálása átlagos csomagvesztési arány csökkentése más Quality of Service (QoS) mérték minimalizálás Rendelkezésre álló információ teljes információ: centralizált útvonalválasztás;

Célfüggvény és rendelkezésre álló információ Lehetséges célok: átlagos csomagkésleltetés minimalizálása átlagos csomagvesztési arány csökkentése más Quality of Service (QoS) mérték minimalizálás Rendelkezésre álló információ teljes információ: centralizált útvonalválasztás; bandita probléma: QoS információ csak a csomag által használt útról (pl. ACK-ot használva, élenként);

Célfüggvény és rendelkezésre álló információ Lehetséges célok: átlagos csomagkésleltetés minimalizálása átlagos csomagvesztési arány csökkentése más Quality of Service (QoS) mérték minimalizálás Rendelkezésre álló információ teljes információ: centralizált útvonalválasztás; bandita probléma: QoS információ csak a csomag által használt útról (pl. ACK-ot használva, élenként); a label efficient és a bandita probléma kombinációja: QoS információ csak a csomag által használt útról, akkor ha az algoritmus lekérdezi azt.

Alkalmazás Extrém környezet (nincs sztochasztikus forgalmi modell, csak részleges információ) esetén a szokásos útvonalválasztási algoritmusok worst-case teljesítményére kevés felső korlát ismert: Denial of Service (DoS) támadások (csomópont túlterhelés, kieső csomópont, ellenséges környezet)

Alkalmazás Extrém környezet (nincs sztochasztikus forgalmi modell, csak részleges információ) esetén a szokásos útvonalválasztási algoritmusok worst-case teljesítményére kevés felső korlát ismert: Denial of Service (DoS) támadások (csomópont túlterhelés, kieső csomópont, ellenséges környezet) mobil ad-hoc hálózatok: gyorsan változó hálózati topológia

Alkalmazás Extrém környezet (nincs sztochasztikus forgalmi modell, csak részleges információ) esetén a szokásos útvonalválasztási algoritmusok worst-case teljesítményére kevés felső korlát ismert: Denial of Service (DoS) támadások (csomópont túlterhelés, kieső csomópont, ellenséges környezet) mobil ad-hoc hálózatok: gyorsan változó hálózati topológia Milyen erős álĺıtásokat lehet megfogalmazni ilyen kevés feltétel mellett?

Szekvenciális előrejelzési probléma kombinálása Algoritmus Szekvenciális előrejelzési (döntési) probléma Előrejelzési feladat: ismeretlen sorozat következő elemének a megbecslése.

Szekvenciális előrejelzési probléma kombinálása Algoritmus Szekvenciális előrejelzési (döntési) probléma Előrejelzési feladat: ismeretlen sorozat következő elemének a megbecslése. Sorozat: sztochasztikus folyamat relizációja

Szekvenciális előrejelzési probléma kombinálása Algoritmus Szekvenciális előrejelzési (döntési) probléma Előrejelzési feladat: ismeretlen sorozat következő elemének a megbecslése. Sorozat: sztochasztikus folyamat relizációja individuális sorozatok

Szekvenciális előrejelzési probléma kombinálása Algoritmus Szekvenciális előrejelzési (döntési) probléma Előrejelzési feladat: ismeretlen sorozat következő elemének a megbecslése. Sorozat: sztochasztikus folyamat relizációja individuális sorozatok Algoritmus célja: minimalizálni a kumulatív hibáját.

Szekvenciális előrejelzési probléma kombinálása Algoritmus Szekvenciális előrejelzési (döntési) probléma Előrejelzési feladat: ismeretlen sorozat következő elemének a megbecslése. Sorozat: sztochasztikus folyamat relizációja individuális sorozatok Algoritmus célja: minimalizálni a kumulatív hibáját. Kiértékelés: előrejelzők egy referencia osztályhoz (szakértőkhöz) viszonyítva.

Szekvenciális előrejelzési probléma kombinálása Algoritmus Szekvenciális előrejelzési (döntési) probléma Előrejelzési feladat: ismeretlen sorozat következő elemének a megbecslése. Sorozat: sztochasztikus folyamat relizációja individuális sorozatok Algoritmus célja: minimalizálni a kumulatív hibáját. Kiértékelés: előrejelzők egy referencia osztályhoz (szakértőkhöz) viszonyítva. legjobb szakértő és algoritmus kumulatív hibájának a különbsége regret

Szekvenciális előrejelzési probléma kombinálása Algoritmus Szekvenciális előrejelzési (döntési) probléma Előrejelzési feladat: ismeretlen sorozat következő elemének a megbecslése. Sorozat: sztochasztikus folyamat relizációja individuális sorozatok Algoritmus célja: minimalizálni a kumulatív hibáját. Kiértékelés: előrejelzők egy referencia osztályhoz (szakértőkhöz) viszonyítva. legjobb szakértő és algoritmus kumulatív hibájának a különbsége regret konkrét megválasztása függ az alkalmazástól.

Néhány alkalmazás Szekvenciális előrejelzési probléma kombinálása Algoritmus : minden egyes út egy szakértő hiba: QoS mérték (pl: csomagkésleltetés, csomagvesztési arány)

Néhány alkalmazás Szekvenciális előrejelzési probléma kombinálása Algoritmus : minden egyes út egy szakértő hiba: QoS mérték (pl: csomagkésleltetés, csomagvesztési arány) TCP variánsok paraméterbeálĺıtása: a szakértők különböző paraméterbeálĺıtású TCP variánsok hiba(nyereség): átvitel (throughput), fairség

Néhány alkalmazás Szekvenciális előrejelzési probléma kombinálása Algoritmus : minden egyes út egy szakértő hiba: QoS mérték (pl: csomagkésleltetés, csomagvesztési arány) TCP variánsok paraméterbeálĺıtása: a szakértők különböző paraméterbeálĺıtású TCP variánsok hiba(nyereség): átvitel (throughput), fairség Sávszélesség megbecslése nagy sebességű hálózatokban: minden egyes becslési technika egy szakértő hiba(nyereség): átvitel (throughput)

Néhány alkalmazás Szekvenciális előrejelzési probléma kombinálása Algoritmus : minden egyes út egy szakértő hiba: QoS mérték (pl: csomagkésleltetés, csomagvesztési arány) TCP variánsok paraméterbeálĺıtása: a szakértők különböző paraméterbeálĺıtású TCP variánsok hiba(nyereség): átvitel (throughput), fairség Sávszélesség megbecslése nagy sebességű hálózatokban: minden egyes becslési technika egy szakértő hiba(nyereség): átvitel (throughput) Portfólióválasztás: különböző befektetési stratégiák, pénzügyi szakértők hiba(nyereség): az elért hozam

Szekvenciális előrejelzési probléma kombinálása Algoritmus Szekvenciális előrejelzési (döntési) probléma Minden t = 1, 2,..., az y 1, y 2,... sorozat következő y t értékét akarjuk előrejelezni (megbecsülni).

Szekvenciális előrejelzési probléma kombinálása Algoritmus Szekvenciális előrejelzési (döntési) probléma Minden t = 1, 2,..., az y 1, y 2,... sorozat következő y t értékét akarjuk előrejelezni (megbecsülni). N darab szakértő áll rendelkezésünkre. Az algoritmus randomizáltan választ egy I t {1,...,N} szakértőt;

Szekvenciális előrejelzési probléma kombinálása Algoritmus Szekvenciális előrejelzési (döntési) probléma Minden t = 1, 2,..., az y 1, y 2,... sorozat következő y t értékét akarjuk előrejelezni (megbecsülni). N darab szakértő áll rendelkezésünkre. Az algoritmus randomizáltan választ egy I t {1,...,N} szakértőt; legenerálódik a sorozat következő y t Y eleme;

Szekvenciális előrejelzési probléma kombinálása Algoritmus Szekvenciális előrejelzési (döntési) probléma Minden t = 1, 2,..., az y 1, y 2,... sorozat következő y t értékét akarjuk előrejelezni (megbecsülni). N darab szakértő áll rendelkezésünkre. Az algoritmus randomizáltan választ egy I t {1,...,N} szakértőt; legenerálódik a sorozat következő y t Y eleme; az algoritmus elszenvedi l(i t, y t ) 0 hibáját és kaphat valamennyi információt a többi szakértő l(i, y t ) 0, i = 1,...,N hibájáról.

Szekvenciális előrejelzési probléma kombinálása Algoritmus Szekvenciális előrejelzési (döntési) probléma 2 A legjobb szakértő norm. kumulatív hibája (nem kauzális): 1 n 1 n min l(i, y t ) = min l i,t i N n i N n t=1 t=1

Szekvenciális előrejelzési probléma kombinálása Algoritmus Szekvenciális előrejelzési (döntési) probléma 2 A legjobb szakértő norm. kumulatív hibája (nem kauzális): 1 n 1 n min l(i, y t ) = min l i,t i N n i N n t=1 t=1 Az algoritmus normalizált kumulatív hibája : 1 n l(i t, y t ) = 1 n l It,t n n t=1 t=1

Szekvenciális előrejelzési probléma kombinálása Algoritmus Szekvenciális előrejelzési (döntési) probléma 2 A legjobb szakértő norm. kumulatív hibája (nem kauzális): 1 n 1 n min l(i, y t ) = min l i,t i N n i N n t=1 Az algoritmus normalizált kumulatív hibája : 1 n l(i t, y t ) = 1 n l It,t n n t=1 t=1 Cél: minimalizálni az algoritmus normalizált kumulatív hibáját a legjobb szakértőhöz viszonyítva 1 n 1 n l(i t, y t ) min l(i, y t ) = 1 n n i N n n L 1 n minl i,n. i N t=1 t=1 az algoritmus kumulatív hibájának az átlaga a legjobb szakértő kum. hibájának az átlaga t=1

Exponenciális súlyozású előrejelző Szekvenciális előrejelzési probléma kombinálása Algoritmus Paraméterek: Legyen η > 0. Inicializáció: Legyen w i,0 = 1 és p i,1 = 1/N mindens i = 1,...,N. Minden t = 1, 2,... körben 1 Véletlenszerűen választunk I t {1,...,N} szakértőt p t = (p 1,t,...,p N,t ) eloszlás szerint.

Exponenciális súlyozású előrejelző Szekvenciális előrejelzési probléma kombinálása Algoritmus Paraméterek: Legyen η > 0. Inicializáció: Legyen w i,0 = 1 és p i,1 = 1/N mindens i = 1,...,N. Minden t = 1, 2,... körben 1 Véletlenszerűen választunk I t {1,...,N} szakértőt p t = (p 1,t,...,p N,t ) eloszlás szerint. 2 Frissítjük a súlyokat w i,t = w i,t 1 e ηl i,t.

Exponenciális súlyozású előrejelző Szekvenciális előrejelzési probléma kombinálása Algoritmus Paraméterek: Legyen η > 0. Inicializáció: Legyen w i,0 = 1 és p i,1 = 1/N mindens i = 1,...,N. Minden t = 1, 2,... körben 1 Véletlenszerűen választunk I t {1,...,N} szakértőt p t = (p 1,t,...,p N,t ) eloszlás szerint. 2 Frissítjük a súlyokat w i,t = w i,t 1 e ηl i,t. 3 Kiszámoljuk az új valószínűségi eloszlást p i,t+1 = w i,t N j=1 w, for i = 1,...,N. j,t

Felső korlát: teljes információ esetén Szekvenciális előrejelzési probléma kombinálása Algoritmus Tétel (Littlestone és Warmuth 94) Legyen n, N 1, 0 < δ < 1 és l i,t [0, 1]. Ekkor az előző algoritmusra 1 δ valószínűséggel igaz, hogy ( ) ( ) 1 lnn Ln min n L i,n O i=1,...,n n ln 1, δ ahol η-t 8 lnn/n-nek választottuk.

Szekvenciális előrejelzési probléma kombinálása Algoritmus Paraméterek: Legyen η > 0, 0 < β < 1 és 0 < γ < 1. Inicalizáció: Legyen w i,0 = 1 és p i,1 = 1/N minden i = 1,...,N. Minden t = 1, 2,... körben 1 Választunk egy I t {1,...,N} szakértőt p t = (p 1,t,...,p N,t ) szerint.

Szekvenciális előrejelzési probléma kombinálása Algoritmus Paraméterek: Legyen η > 0, 0 < β < 1 és 0 < γ < 1. Inicalizáció: Legyen w i,0 = 1 és p i,1 = 1/N minden i = 1,...,N. Minden t = 1, 2,... körben 1 Választunk egy I t {1,...,N} szakértőt p t = (p 1,t,...,p N,t ) szerint. 2 Kiszámljuk a becsült nyereséget g i,t = { gi,t +β p i,t, if I t = i; különben. β p i,t,

Szekvenciális előrejelzési probléma kombinálása Algoritmus Paraméterek: Legyen η > 0, 0 < β < 1 és 0 < γ < 1. Inicalizáció: Legyen w i,0 = 1 és p i,1 = 1/N minden i = 1,...,N. Minden t = 1, 2,... körben 1 Választunk egy I t {1,...,N} szakértőt p t = (p 1,t,...,p N,t ) szerint. 2 Kiszámljuk a becsült nyereséget g i,t = { gi,t +β p i,t, if I t = i; különben. β p i,t, 3 Frissítjük a súlyokat w i,t = w i,t 1 e η g i,t.

Szekvenciális előrejelzési probléma kombinálása Algoritmus Paraméterek: Legyen η > 0, 0 < β < 1 és 0 < γ < 1. Inicalizáció: Legyen w i,0 = 1 és p i,1 = 1/N minden i = 1,...,N. Minden t = 1, 2,... körben 1 Választunk egy I t {1,...,N} szakértőt p t = (p 1,t,...,p N,t ) szerint. 2 Kiszámljuk a becsült nyereséget g i,t = { gi,t +β p i,t, if I t = i; különben. β p i,t, 3 Frissítjük a súlyokat w i,t = w i,t 1 e η g i,t. 4 Frissítjük a valószínűségeket w i,t p i,t+1 = (1 γ) N j=1 w j,t + γ, i = 1,...,N. N

Felső korlát:bandita beálĺıtás esetén Szekvenciális előrejelzési probléma kombinálása Algoritmus Tétel (Auer95) Legyen n, N 1, 0 < δ < 1 és l i,t [0, 1]. Ekkor az előző algoritmusra 1 δ valószínűséggel igaz, hogy ( ) ( ) 1 N lnn Ln min n L i,n O ln 1, i=1,...,n n δ az algoritmus optimális paramétereinek a megválasztásával.

probléma Bandita algoritmus LE + Bandita algoritmus Korlátozott bandita algoritmus v u v u Adott egy irányított gráf (V,E) és a gráf két pontja u és v. minden t időpontban minden e E élhez tartozik egy l e,t hiba

probléma Bandita algoritmus LE + Bandita algoritmus Korlátozott bandita algoritmus v u v u Adott egy irányított gráf (V,E) és a gráf két pontja u és v. minden t időpontban minden e E élhez tartozik egy l e,t hiba az u és v közötti i út hibája: l i,t = l e,t ; e i

probléma Bandita algoritmus LE + Bandita algoritmus Korlátozott bandita algoritmus v u v u Cél: minden t időpillanatban az algoritmus választ egy I t utat, úgy hogy a kumulatív hibája a legjobb fix útvonalhoz képest kicsi: ( n ) 1 n l It,t min l i,t, n i P t=1 ahol P halmaz az összes u és v pontok közötti utat tartalmazza és P = N. t=1

Alkalmazás: adaptív útvonalválasztás Bandita algoritmus LE + Bandita algoritmus Korlátozott bandita algoritmus A t időpillanatban egy csomagot küldünk az I t útvonalon u csomópontból v csomópontba.

Alkalmazás: adaptív útvonalválasztás Bandita algoritmus LE + Bandita algoritmus Korlátozott bandita algoritmus A t időpillanatban egy csomagot küldünk az I t útvonalon u csomópontból v csomópontba. l e,t hiba összefügg az e link valamilyen QoS mértékével (pl. késleltetlés vagy csomagvesztési arány).

Alkalmazás: adaptív útvonalválasztás Bandita algoritmus LE + Bandita algoritmus Korlátozott bandita algoritmus A t időpillanatban egy csomagot küldünk az I t útvonalon u csomópontból v csomópontba. l e,t hiba összefügg az e link valamilyen QoS mértékével (pl. késleltetlés vagy csomagvesztési arány). Cél: találjunk egy olyan {I t } útvonalat, hogy pl. az átlagos késleltetése, azaz 1 n n t=1 l I t,t kicsi legyen.

Alkalmazás: adaptív útvonalválasztás Bandita algoritmus LE + Bandita algoritmus Korlátozott bandita algoritmus A t időpillanatban egy csomagot küldünk az I t útvonalon u csomópontból v csomópontba. l e,t hiba összefügg az e link valamilyen QoS mértékével (pl. késleltetlés vagy csomagvesztési arány). Cél: találjunk egy olyan {I t } útvonalat, hogy pl. az átlagos késleltetése, azaz 1 n n t=1 l I t,t kicsi legyen. Rendelkezésre álló információ alapján:

Alkalmazás: adaptív útvonalválasztás Bandita algoritmus LE + Bandita algoritmus Korlátozott bandita algoritmus A t időpillanatban egy csomagot küldünk az I t útvonalon u csomópontból v csomópontba. l e,t hiba összefügg az e link valamilyen QoS mértékével (pl. késleltetlés vagy csomagvesztési arány). Cél: találjunk egy olyan {I t } útvonalat, hogy pl. az átlagos késleltetése, azaz 1 n n t=1 l I t,t kicsi legyen. Rendelkezésre álló információ alapján: teljes információ: centralizált útvonalválasztás;

Alkalmazás: adaptív útvonalválasztás Bandita algoritmus LE + Bandita algoritmus Korlátozott bandita algoritmus A t időpillanatban egy csomagot küldünk az I t útvonalon u csomópontból v csomópontba. l e,t hiba összefügg az e link valamilyen QoS mértékével (pl. késleltetlés vagy csomagvesztési arány). Cél: találjunk egy olyan {I t } útvonalat, hogy pl. az átlagos késleltetése, azaz 1 n n t=1 l I t,t kicsi legyen. Rendelkezésre álló információ alapján: teljes információ: centralizált útvonalválasztás; bandita probléma: QoS információ csak a csomag által használt útról (pl. ACK-ot használva, élenként);

Alkalmazás: adaptív útvonalválasztás Bandita algoritmus LE + Bandita algoritmus Korlátozott bandita algoritmus A t időpillanatban egy csomagot küldünk az I t útvonalon u csomópontból v csomópontba. l e,t hiba összefügg az e link valamilyen QoS mértékével (pl. késleltetlés vagy csomagvesztési arány). Cél: találjunk egy olyan {I t } útvonalat, hogy pl. az átlagos késleltetése, azaz 1 n n t=1 l I t,t kicsi legyen. Rendelkezésre álló információ alapján: teljes információ: centralizált útvonalválasztás; bandita probléma: QoS információ csak a csomag által használt útról (pl. ACK-ot használva, élenként); a label efficient és a bandita probléma kombinációja: QoS információ csak a csomag által használt útról, akkor ha az algoritmus lekérdezi azt.

Alkalmazás: adaptív útvonalválasztás Bandita algoritmus LE + Bandita algoritmus Korlátozott bandita algoritmus A t időpillanatban egy csomagot küldünk az I t útvonalon u csomópontból v csomópontba. l e,t hiba összefügg az e link valamilyen QoS mértékével (pl. késleltetlés vagy csomagvesztési arány). Cél: találjunk egy olyan {I t } útvonalat, hogy pl. az átlagos késleltetése, azaz 1 n n t=1 l I t,t kicsi legyen. Rendelkezésre álló információ alapján: teljes információ: centralizált útvonalválasztás; bandita probléma: QoS információ csak a csomag által használt útról (pl. ACK-ot használva, élenként); a label efficient és a bandita probléma kombinációja: QoS információ csak a csomag által használt útról, akkor ha az algoritmus lekérdezi azt. Alkalmazás: mobil ad-hoc hálózatok; DoS támadások.

Az algoritmus alapötletei Bandita algoritmus LE + Bandita algoritmus Korlátozott bandita algoritmus Problémák: A klasszikus felső korlátok ebben az esetben gyengék

Az algoritmus alapötletei Bandita algoritmus LE + Bandita algoritmus Korlátozott bandita algoritmus Problémák: A klasszikus felső korlátok ebben az esetben gyengék komplexitás

Az algoritmus alapötletei Bandita algoritmus LE + Bandita algoritmus Korlátozott bandita algoritmus Problémák: A klasszikus felső korlátok ebben az esetben gyengék komplexitás bandita probléma: felfedezés

Az algoritmus alapötletei Bandita algoritmus LE + Bandita algoritmus Korlátozott bandita algoritmus Alapötletek: Választott út hibája, a többi közös útról is ad információt.

Az algoritmus alapötletei Bandita algoritmus LE + Bandita algoritmus Korlátozott bandita algoritmus Alapötletek: Választott út hibája, a többi közös útról is ad információt. választott út 2 közös él 2 közös él 1 közös él 2 közös él 1 közös él 1 közös él 0 közös él

Az algoritmus alapötletei Bandita algoritmus LE + Bandita algoritmus Korlátozott bandita algoritmus Alapötletek: Választott út hibája, a többi közös útról is ad információt. Utak választási valószínűségei helyett az élekét tarjuk nyilván. u v

Az algoritmus alapötletei Bandita algoritmus LE + Bandita algoritmus Korlátozott bandita algoritmus Alapötletek: Választott út hibája, a többi közös útról is ad információt. Utak választási valószínűségei helyett az élekét tarjuk nyilván. u v

Az algoritmus alapötletei Bandita algoritmus LE + Bandita algoritmus Korlátozott bandita algoritmus Alapötletek: Választott út hibája, a többi közös útról is ad információt. Utak választási valószínűségei helyett az élekét tarjuk nyilván. u v

Az algoritmus alapötletei Bandita algoritmus LE + Bandita algoritmus Korlátozott bandita algoritmus Alapötletek: Választott út hibája, a többi közös útról is ad információt. Utak választási valószínűségei helyett az élekét tarjuk nyilván. u v

Az algoritmus alapötletei Bandita algoritmus LE + Bandita algoritmus Korlátozott bandita algoritmus Alapötletek: Választott út hibája, a többi közös útról is ad információt. Utak választási valószínűségei helyett az élekét tarjuk nyilván. A megfelelő számú mintavételezéshez az utak egy C lefedő halmazát használjuk.

Az algoritmus alapötletei Bandita algoritmus LE + Bandita algoritmus Korlátozott bandita algoritmus Alapötletek: Választott út hibája, a többi közös útról is ad információt. Utak választási valószínűségei helyett az élekét tarjuk nyilván. A megfelelő számú mintavételezéshez az utak egy C lefedő halmazát használjuk.

Bandita algoritmus LE + Bandita algoritmus Korlátozott bandita algoritmus Bandita algoritmus legrövidebb út problémára Paraméterek: Legyen β > 0 és 0 < η, γ < 1. Inicializáció: Legyen w e,0 = 1 minden e E élre, w i,0 = 1 minden i P útra és W 0 = N. Végül jelöljön C egy lefedő halmazt, ekkor minden t = 1, 2,... körben: (1) az algoritmus választ egy I t utat véletlenszerűen p t P-n definiált eloszlás szerint, ahol (1 γ) w i,t 1 + γ W p i,t = t 1 C, ha i C, (1 γ) w i,t 1, ha i C. W t 1 (2) Kiszámolja minden e él választásának valószínűségét: q e,t = i:e ip i:e i i,t = (1 γ) w i,t 1 {i C : e i} + γ. W t 1 C

Bandita algoritmus LE + Bandita algoritmus Korlátozott bandita algoritmus (3) Kiszámítja a becsült nyereséget: g e,t = { ge,t +β q e,t β q e,t ha e I t különben. (4) Frissíti a súlyokat: w e,t = w e,t 1 e ηg e,t w i,t = e i w e,t = w i,t 1 e ηg i,t, ahol g i,t = e i g e,t és az utak teljes súlyainak az összege W t = i P w i,t.

Felső korlát Bandita algoritmus LE + Bandita algoritmus Korlátozott bandita algoritmus Tétel (GyLO2006) Az algoritmust optimalizált paraméterekkel futtatjuk a legrövidebb út problémán a többkarú bandita modellben, akkor minden δ (0,1) paraméterre legalább 1 δ valószínűséggel ( ) 1 K L n min n L i,n 2 i P n ( 4K C lnn + E ln E δ { } K E minden n max ln,4 C lnn esetén, ahol K leghosszabb út. E δ Hatékonyan implementálható O(n E ) idő- és O( E ) tárkomplexitással. )

Felső korlát Bandita algoritmus LE + Bandita algoritmus Korlátozott bandita algoritmus Tétel (GyLO2006) Az algoritmust optimalizált paraméterekkel futtatjuk a legrövidebb út problémán a többkarú bandita modellben, akkor minden δ (0,1) paraméterre legalább 1 δ valószínűséggel ( ) 1 K L n min n L i,n 2 i P n ( 4K C lnn + E ln E δ { } K E minden n max ln,4 C lnn esetén, ahol K leghosszabb út. E δ Hatékonyan implementálható O(n E ) idő- és O( E ) tárkomplexitással. Korábbi korlátok ( csak a teljes út hibájához van hozzáférésük): ( ) Bandita probléma (Auer et al., 95): O K N ln(2n/δ) n )

Felső korlát Bandita algoritmus LE + Bandita algoritmus Korlátozott bandita algoritmus Tétel (GyLO2006) Az algoritmust optimalizált paraméterekkel futtatjuk a legrövidebb út problémán a többkarú bandita modellben, akkor minden δ (0,1) paraméterre legalább 1 δ valószínűséggel ( ) 1 K L n min n L i,n 2 i P n ( 4K C lnn + E ln E δ { } K E minden n max ln,4 C lnn esetén, ahol K leghosszabb út. E δ Hatékonyan implementálható O(n E ) idő- és O( E ) tárkomplexitással. Korábbi korlátok ( csak a teljes út hibájához van hozzáférésük): ( ) Bandita probléma (Auer et al., 95): O K N ln(2n/δ) n Bandita probléma gráfon ) (Awerbuch és Kleinberg, 04): O (K 2 ( E K log( E Kn)) 1/3 n 1/3 )

Szimuláció Bandita algoritmus LE + Bandita algoritmus Korlátozott bandita algoritmus v u v u Felső élek késleltetése U(0, 1), alsó éleké U(0.32, 1)

Szimuláció Bandita algoritmus LE + Bandita algoritmus Korlátozott bandita algoritmus v u v u Felső élek késleltetése U(0, 1), alsó éleké U(0.32, 1) n = 10000, δ = 0.001

Szimuláció Bandita algoritmus LE + Bandita algoritmus Korlátozott bandita algoritmus v u v u Felső élek késleltetése U(0, 1), alsó éleké U(0.32, 1) n = 10000, δ = 0.001 30x ismétlés

Bandita algoritmus LE + Bandita algoritmus Korlátozott bandita algoritmus 2 1.5 edge-bandit path-bandit AwKl AwKl tuned EXP3 bound for edge-bandit Normalized regret 1 0.5 0 0 2000 4000 6000 8000 10000 Number of packets

Bandita algoritmus LE + Bandita algoritmus Korlátozott bandita algoritmus A label efficient és a bandita algoritmus kombinációja QoS információ csak a csomag által használt útról, akkor ha az algoritmus lekérdezi

Bandita algoritmus LE + Bandita algoritmus Korlátozott bandita algoritmus A label efficient és a bandita algoritmus kombinációja QoS információ csak a csomag által használt útról, akkor ha az algoritmus lekérdezi Motiváció: Kognitív Csomag Hálózat (CPN) (Gelenbe et al. 2001, 2006; Linux kernel 2.2.x; amerikai szabadalom U.S. No. 6804201)

Bandita algoritmus LE + Bandita algoritmus Korlátozott bandita algoritmus A label efficient és a bandita algoritmus kombinációja QoS információ csak a csomag által használt útról, akkor ha az algoritmus lekérdezi Motiváció: Kognitív Csomag Hálózat (CPN) (Gelenbe et al. 2001, 2006; Linux kernel 2.2.x; amerikai szabadalom U.S. No. 6804201) Két fajta csomag: okos és adat csomag

Bandita algoritmus LE + Bandita algoritmus Korlátozott bandita algoritmus A label efficient és a bandita algoritmus kombinációja QoS információ csak a csomag által használt útról, akkor ha az algoritmus lekérdezi Motiváció: Kognitív Csomag Hálózat (CPN) (Gelenbe et al. 2001, 2006; Linux kernel 2.2.x; amerikai szabadalom U.S. No. 6804201) Két fajta csomag: okos és adat csomag okos csomag: hálózat állapotának feltérképezése, nem szálĺıtanak adatot

Bandita algoritmus LE + Bandita algoritmus Korlátozott bandita algoritmus A label efficient és a bandita algoritmus kombinációja QoS információ csak a csomag által használt útról, akkor ha az algoritmus lekérdezi Motiváció: Kognitív Csomag Hálózat (CPN) (Gelenbe et al. 2001, 2006; Linux kernel 2.2.x; amerikai szabadalom U.S. No. 6804201) Két fajta csomag: okos és adat csomag okos csomag: hálózat állapotának feltérképezése, nem szálĺıtanak adatot adat csomag: nem gyűjt információt az útvonaláról, adatot szálĺıt

Bandita algoritmus LE + Bandita algoritmus Korlátozott bandita algoritmus A label efficient és a bandita algoritmus kombinációja QoS információ csak a csomag által használt útról, akkor ha az algoritmus lekérdezi Motiváció: Kognitív Csomag Hálózat (CPN) (Gelenbe et al. 2001, 2006; Linux kernel 2.2.x; amerikai szabadalom U.S. No. 6804201) Két fajta csomag: okos és adat csomag okos csomag: hálózat állapotának feltérképezése, nem szálĺıtanak adatot adat csomag: nem gyűjt információt az útvonaláról, adatot szálĺıt Cél: adat csomagok küldése úgy, hogy a késleltetésük minél kisebb legyen.

Label efficient bandita algoritmus Bandita algoritmus LE + Bandita algoritmus Korlátozott bandita algoritmus (3 ) Választ egy S t Bernoulli valószínűségi változót, ahol P(S t = 1) = ε, és kiszámítja a becsült nyereségeket: g e,t = { ge,t +β εq e,t S t, ha e I t, β εq e,t S t, ha e / I t.

Bandita algoritmus LE + Bandita algoritmus Korlátozott bandita algoritmus Tétel (GyLLO2007) Minden δ (0,1) és ε (0,1] konstansokra η = εlnn 4nK 2 C, γ = 2ηK C K 2 E ε 1/2 and β = n E ε ln δ 1 and az algoritmust optimalizált paraméterekkel futtatva legalább 1 δ valószínűséggel igaz ( ) 1 n Ln min l i,t 27K E ln 2N δ, n i P 2 nε t=1 minden n 1 ε max { K 2 ln 2 (2 E /δ) E lnn, E ln(2 E /δ) },4 C ln N K esetén. Továbbá, a javasolt algoritmus hatékonyan implementálható O(n E ) idő- és O( E ) tárkomplexitással.

További variánsok Bandita algoritmus LE + Bandita algoritmus Korlátozott bandita algoritmus Tracking: Nem csak a legjobb fix útvonallal versenyzünk, hanem az utak m-szer változhatnak. (O(E 2 (m/n) 1/2 ) felső korlát)[gyllo2007]

További variánsok Bandita algoritmus LE + Bandita algoritmus Korlátozott bandita algoritmus Tracking: Nem csak a legjobb fix útvonallal versenyzünk, hanem az utak m-szer változhatnak. (O(E 2 (m/n) 1/2 ) felső korlát)[gyllo2007] Korlátozott bandita probléma: A választott útvonalnak csak az összhibája ismert, egyenként az éleké nem. (O(E 2 /n 1/3 ) felső korlát) [GyLLO2007]

Korlátozott bandita probléma Bandita algoritmus LE + Bandita algoritmus Korlátozott bandita algoritmus Bázis: P-nek egy részhalmazát bázisnak nevezzük, ha a benne lévő b darab út lineárisan független és minden P-beli elem kifejezhető a bázisban lévő utak lineáris kombinációjával.

Korlátozott bandita probléma Bandita algoritmus LE + Bandita algoritmus Korlátozott bandita algoritmus Bázis: P-nek egy részhalmazát bázisnak nevezzük, ha a benne lévő b darab út lineárisan független és minden P-beli elem kifejezhető a bázisban lévő utak lineáris kombinációjával. Ha α (i,b),...,α (i,b) jelöli az i P út leírásához használt bázisok b 1 b b lineáris kombinációjának együtthatóit, akkor a t időpillanatban l i,t = b j=1 α (i,b) b j l b j,t.

Korlátozott bandita probléma Bandita algoritmus LE + Bandita algoritmus Korlátozott bandita algoritmus Bázis: P-nek egy részhalmazát bázisnak nevezzük, ha a benne lévő b darab út lineárisan független és minden P-beli elem kifejezhető a bázisban lévő utak lineáris kombinációjával. Ha α (i,b),...,α (i,b) jelöli az i P út leírásához használt bázisok b 1 b b lineáris kombinációjának együtthatóit, akkor a t időpillanatban l i,t = b j=1 α (i,b) b j l b j,t. Baricentrikus feszítő: Egy B bázist C-baricentrikus feszítőnek nevezünk, ha α (i,b) C minden i P útra és j = 1,...,b. b j

Korlátozott bandita probléma Bandita algoritmus LE + Bandita algoritmus Korlátozott bandita algoritmus Bázis: P-nek egy részhalmazát bázisnak nevezzük, ha a benne lévő b darab út lineárisan független és minden P-beli elem kifejezhető a bázisban lévő utak lineáris kombinációjával. Ha α (i,b),...,α (i,b) jelöli az i P út leírásához használt bázisok b 1 b b lineáris kombinációjának együtthatóit, akkor a t időpillanatban l i,t = b j=1 α (i,b) b j l b j,t. Baricentrikus feszítő: Egy B bázist C-baricentrikus feszítőnek nevezünk, ha α (i,b) C minden i P útra és j = 1,...,b. b j Álĺıtás: Egy irányított körmentes gráfban két kiválasztott pont közötti összes út P halmazára létezik 1-baricentrikus feszítő és hatékonyonan adható egy 2-baricentrikus feszítő.

Korlátozott bandita probléma Bandita algoritmus LE + Bandita algoritmus Korlátozott bandita algoritmus Paraméterek: 0 < ε, η 1. Inicializáció: Legyen w e,0 = 1 minden e E élre, w i,0 = 1 minden egyes i P útra és W 0 = N. Rögzítsünk egy B bázist, amely 2-baricentrikus feszítő. Minden t = 1, 2,... körben: (1) az algoritmus választ egy S t Bernoulli valószínűségi változót, ahol P(S t = 1) = ε.

Korlátozott bandita probléma Bandita algoritmus LE + Bandita algoritmus Korlátozott bandita algoritmus Paraméterek: 0 < ε, η 1. Inicializáció: Legyen w e,0 = 1 minden e E élre, w i,0 = 1 minden egyes i P útra és W 0 = N. Rögzítsünk egy B bázist, amely 2-baricentrikus feszítő. Minden t = 1, 2,... körben: (1) az algoritmus választ egy S t Bernoulli valószínűségi változót, ahol P(S t = 1) = ε. (2) Ha S t = 1, akkor választ egyenletes eloszlás szerint egy I t utat B bázisból. Ha S t = 0, akkor I t utat {p i,t } eloszlás szerint választja véletlenszerűen, ahol p i,t = w i,t 1 W t 1.

Bandita algoritmus LE + Bandita algoritmus Korlátozott bandita algoritmus (3) Kiszámolja az összes él becsült hibáját l (E) t l(e) t ahol = { l (E) e,t } e E, és becsült hibáknak l (B) t (B) = B + l t, l b j,t = S t ε l b j,ti {It =b j }b minden j = 1,...,b indexre. = ( l (B) (B),..., l b 1,t b b,t ) vektorát a

Bandita algoritmus LE + Bandita algoritmus Korlátozott bandita algoritmus (3) Kiszámolja az összes él becsült hibáját l (E) t l(e) t ahol = { l (E) e,t } e E, és becsült hibáknak l (B) t (B) = B + l t, l b j,t = S t ε l b j,ti {It =b j }b minden j = 1,...,b indexre. (4) Frissíti a súlyokat: w e,t = w e,t 1 e η l e,t, = ( l (B) (B),..., l b 1,t b b,t ) vektorát a w i,t = e i w e,t = w i,t 1 e η e i l e,t, és az összegét az utak súlyának W t = i P w i,t.

Bandita algoritmus LE + Bandita algoritmus Korlátozott bandita algoritmus Tétel (GyLLO07) Jelölje K a leghosszabb utat egy gráfban két kijelölt csomópont között. Ekkor minden δ (0, 1), és optimalizált paraméterekre a korlátozott bandita algoritmust futtatva legalább 1 δ valószínűséggel 1 n ( Ln min i P L i,n ) 9.1K 2 b (Kb ln(4bn/δ)) 1/3 n 1/3, minden n 8b ln 4bN ε 2 δ esetén.

További eredmények, nyitott kérdések Korlátozott bandita problémára adott további felső korlátok (nem számolhatók kis komplexitással) Várható értékben O(n 1/2 ) [Dani, Hayes és Kakade 2007]

További eredmények, nyitott kérdések Korlátozott bandita problémára adott további felső korlátok (nem számolhatók kis komplexitással) Várható értékben O(n 1/2 ) [Dani, Hayes és Kakade 2007] Nagy valószínűségi felső korlát O(n 1/2 ) [Bartlett, Dani, Hayes, Kakade, Rakhlin és Tewari 2008]

További eredmények, nyitott kérdések Korlátozott bandita problémára adott további felső korlátok (nem számolhatók kis komplexitással) Várható értékben O(n 1/2 ) [Dani, Hayes és Kakade 2007] Nagy valószínűségi felső korlát O(n 1/2 ) [Bartlett, Dani, Hayes, Kakade, Rakhlin és Tewari 2008] Nyitott kérdések, feladatok: kis komplexitású jó konvergencia sebességű algoritmus

További eredmények, nyitott kérdések Korlátozott bandita problémára adott további felső korlátok (nem számolhatók kis komplexitással) Várható értékben O(n 1/2 ) [Dani, Hayes és Kakade 2007] Nagy valószínűségi felső korlát O(n 1/2 ) [Bartlett, Dani, Hayes, Kakade, Rakhlin és Tewari 2008] Nyitott kérdések, feladatok: kis komplexitású jó konvergencia sebességű algoritmus Az algoritmusok gyakorlatba való átültetése.

Hasznos irodalom Nicolò Cesa-Bianchi, Gábor Lugosi Prediction, Learning and Games Richard S. Sutton and Andrew G. Barto Reinforcement Learning: An Introduction