Információs rendszerek elméleti alapjai. Információelmélet

Hasonló dokumentumok
Információs rendszerek elméleti alapjai. Információelmélet

? közgazdasági statisztika

Statisztika. Eloszlásjellemzők

? közgazdasági statisztika

Tartalomjegyzék. 4.3 Alkalmazás: sorozatgyártású tűgörgő átmérőjének jellemzése

Nagy Gábor compalg.inf.elte.hu/ nagy

Mérési adatok feldolgozása Méréselmélet PE_MIK MI_BSc, VI_BSc 1

Matematikai statisztika

Azonos névleges értékű, hitelesített súlyokból alkotott csoportok együttes mérési bizonytalansága

Backtrack módszer (1.49)

Algoritmuselmélet 7. előadás

Feladatok és megoldások a 11. heti gyakorlathoz

ORVOSI STATISZTIKA. Az orvosi statisztika helye. Egyéb példák. Példa: test hőmérséklet. Lehet kérdés? Statisztika. Élettan Anatómia Kémia. Kérdések!

Függvénygörbe alatti terület a határozott integrál

GEOFIZIKA / 4. GRAVITÁCIÓS ANOMÁLIÁK PREDIKCIÓJA, ANALITIKAI FOLYTATÁSOK MÓDSZERE, GRAVITÁCIÓS ANOMÁLIATEREK SZŰRÉSE

A paramétereket kísérletileg meghatározott yi értékekre támaszkodva becsülik. Ha n darab kisérletet (megfigyelést, mérést) végeznek, n darab

Informatikai Rendszerek Alapjai

A pályázat címe: Rugalmas-képlékeny tartószerkezetek topológiai optimalizálásának néhány különleges feladata

V. GYAKORLATOK ÉS FELADATOK ALGEBRÁBÓL

Kvantum-tömörítés II.

Diszkrét matematika 2.C szakirány

Sorozatok, határérték fogalma. Függvények határértéke, folytonossága

Megállapítható változók elemzése Függetlenségvizsgálat, illeszkedésvizsgálat, homogenitásvizsgálat

A Sturm-módszer és alkalmazása

Előző óra összefoglalása. Programozás alapjai C nyelv 3. gyakorlat. Karakter típus (char) Karakter konstansok. Karaktersorozatot lezáró nulla

Informatikai Rendszerek Alapjai

13. Tárcsák számítása. 1. A felületszerkezetek. A felületszerkezetek típusai

Méréselmélet PE_MIK MI_BSc, VI_BSc 1

3. SOROZATOK. ( n N) a n+1 < a n. Egy sorozatot (szigorúan) monotonnak mondunk, ha (szigorúan) monoton növekvő vagy csökkenő.

5. Forráskódolás és hibavédő kódolás

LOGO. Kvantum-tömörítés. Gyöngyösi László BME Villamosmérnöki és Informatikai Kar

dolás, felbontható kód Prefix kód Blokk kódk Kódfa

Nevezetes sorozat-határértékek

i 0 egyébként ábra. Negyedfokú és ötödfokú Bernstein polinomok a [0,1] intervallumon.

2. Az együttműködő villamosenergia-rendszer teljesítmény-egyensúlya

Járattípusok. Kapcsolatok szerint: Sugaras, ingajárat: Vonaljárat: Körjárat:

Statisztika 1. zárthelyi dolgozat március 21.

Diszkrét Matematika 1. óra Fokszámsorozatok

AZ OPTIMÁLIS MINTANAGYSÁG A KAPCSOLÓDÓ KÖLTSÉGEK ÉS BEVÉTELEK RELÁCIÓJÁBAN

Szoldatics József, Dunakeszi

Számsorozatok. 1. Alapfeladatok december 22. sorozat határértékét, ha. 1. Feladat: Határozzuk meg az a n = 3n2 + 7n 5n létezik.

Kényszereknek alávetett rendszerek

MÉRÉSTECHNIKA. DR. HUBA ANTAL c. egy. tanár BME Mechatronika, Optika és Gépészeti Informatika Tanszék 2011

A Secretary problem. Optimális választás megtalálása.

Matematikai statisztika elıadás III. éves elemzı szakosoknak. Zempléni András 9. elıadásból (részlet)

KOMBINATORIKA ELŐADÁS osztatlan matematikatanár hallgatók számára. Szita formula J = S \R,

Valószínűségszámítás. Ketskeméty László

Tuzson Zoltán A Sturm-módszer és alkalmazása

Nagy Gábor compalg.inf.elte.hu/ nagy

A továbbiakban Y = {0, 1}, azaz minden szóhoz egy bináris sorozatot rendelünk

(A TÁMOP /2/A/KMR számú projekt keretében írt egyetemi jegyzetrészlet):

Ismérvek közötti kapcsolatok szorosságának vizsgálata. 1. Egy kis ismétlés: mérési skálák (Hunyadi-Vita: Statisztika I o)

f (M (ξ)) M (f (ξ)) Bizonyítás: Megjegyezzük, hogy konvex függvényekre mindig létezik a ± ben

2. fejezet. Számsorozatok, számsorok

1. előadás: Bevezetés. Irodalom. Számonkérés. A valószínűségszámítás és a statisztika tárgya. Cél

Matematika I. 9. előadás

Adatfeldolgozás, adatértékelés. Dr. Szűcs Péter, Dr. Madarász Tamás Miskolci Egyetem, Hidrogeológiai Mérnökgeológiai Tanszék

1. előadás: Bevezetés. Számonkérés. Irodalom. Valószínűségszámítás helye a tudományok között. Cél

MINTAVÉTEL A MARKETINGKUTATÁSBAN, KÜLÖNÖS TEKINTETTEL A DIVIZÍV ÉS AZ AGGLOMERATÍV RÉTEGZÉSRE

Az Informatika Elméleti Alapjai

ALGEBRA. egyenlet megoldásait, ha tudjuk, hogy egész számok, továbbá p + q = 198.

1. A radioaktivitás statisztikus jellege

Innen. 2. Az. s n = 1 + q + q q n 1 = 1 qn. és q n 0 akkor és csak akkor, ha q < 1. a a n végtelen sor konvergenciáján nem változtat az, ha

Az Informatika Elméleti Alapjai

Nagy Gábor compalg.inf.elte.hu/ nagy

2. METROLÓGIA ÉS HIBASZÁMíTÁS

Gyakorló feladatok II.

VII. A határozatlan esetek kiküszöbölése

Sorozatok A.: Sorozatok általában

Eötvös Loránd Tudományegyetem Informatikai Kar. Analízis 1. Írásbeli tételek. Készítette: Szántó Ádám Tavaszi félév

Miért pont úgy kombinálja kétfokozatú legkisebb négyzetek módszere (2SLS) az instrumentumokat, ahogy?

Az Informatika Elméleti Alapjai

Matematikai statisztika

Statisztikai próbák. Ugyanazon problémára sokszor megvan mindkét eljárás.

VÉLETLENÍTETT ALGORITMUSOK. 1.ea.

A matematikai statisztika elemei

Laboratóriumi mérések

Kalkulus I. Első zárthelyi dolgozat szeptember 16. MINTA. és q = k 2. k 2. = k 1l 2 k 2 l 1. l 1 l n 6n + 8

Kalkulus II., második házi feladat

( a b)( c d) 2 ab2 cd 2 abcd 2 Egyenlőség akkor és csak akkor áll fenn

Dr. Tóth Zsuzsanna Eszter Dr. Jónás Tamás Erdei János. Gazdaságstatisztika. II. rész A matematikai statisztika alapjai

ANALÍZIS I. TÉTELBIZONYÍTÁSOK ÍRÁSBELI VIZSGÁRA

Hiba! Nincs ilyen stílusú szöveg a dokumentumban.-86. ábra: A példa-feladat kódolási változatai

Sztochasztikus tartalékolás és a tartalék függése a kifutási háromszög időperiódusától

A statisztikai vizsgálat tárgyát képező egyedek összességét statisztikai sokaságnak nevezzük.

Ha n darab standard normális eloszlású változót négyzetesen összegzünk, akkor kapjuk a χ 2 - eloszlást: N

Hipotéziselmélet. Statisztikai próbák I. Statisztikai próbák II. Informatikai Tudományok Doktori Iskola

STATISZTIKA II. kötet

Statisztika I. 4. előadás. Előadó: Dr. Ertsey Imre

16. Az AVL-fa. (Adelszon-Velszkij és Landisz, 1962) Definíció: t kiegyensúlyozott (AVL-tulajdonságú) t minden x csúcsára: Pl.:

1 k < n(1 + log n) C 1n log n, d n. (1 1 r k + 1 ) = 1. = 0 és lim. lim n. f(n) < C 3

Mohó algoritmusok. Példa:

KOMBINATORIKA ELŐADÁS osztatlan matematika tanár hallgatók számára. Szita formula

A peremeloszlások. Valószínőségszámítás elıadás III. alk. matematikus szak. Példa. Valószínőségi vektorváltozók eloszlásfüggvénye.

24. tétel A valószínűségszámítás elemei. A valószínűség kiszámításának kombinatorikus modellje.

VASBETON ÉPÜLETEK MEREVÍTÉSE

Eseményalgebra, kombinatorika

2.6. Az ideális gáz fundamentális egyenlete

Bevezetés a hipotézis vizsgálatba. Hipotézisvizsgálatok. Próbák leírása. Kétoldali és egyoldali hipotézisek. Illeszkedésvizsgálatok

Diszkrét matematika 2.C szakirány

Átírás:

Iformácós redszerek elmélet alapja Iformácóelmélet

Glbert-Moore Szemléltetése hasoló a Shao kódhoz A felezőpotokra a felezős kódolás A felezőpot értéke bttel hosszabb kfejtést géyel /2 0 x x x p p 2 p x Ide kerüljö a felező leálláskor bttel hosszabb kód p /2 legye bee 0 0 0 0 Az tervallum felezőpotjára felezéses kódfa, leáll ha egyedül marad, 0 206.04.8. Molár Bált, Beczúr Adrás 2

p Q,,Q,, p p l cseek redezve az tervallumok felezőpotja A kódját (mt Shao - Fao kódál) felezésekkel építjük fel. H 2 206.04.8. Molár Bált, Beczúr Adrás 3

Molár Bált, Beczúr Adrás Glbert-Moore hosszba kfejtése bárs üzeetre voatkozó kód az Az 2 2 2 2 Legye 2 kódszó, val.szg.- ek szert em a pl. alfabetkus, tetszőleges sorredbe redezhetők jele A forrás kmeet 2 2 2 2 2 l -l l u u p u p u p u p, u p u p, u p u p l u legth u

Példa Glbert-Moore kódra Molár Bált, Beczúr Adrás

Huffma kód Optmáls kód: Rekurzív felépítés az eloszlás elemszáma szert q,,q p A a p,, p p s s, p s legye q kódja : 0, p s s kódja legye azoos hosszú, Huffma kódot, smerjük az eloszlást, p s p,, p s s re, legye p :, alakú. p s q s, p eloszlásra s a két legksebb készítjük el ω 0 P - P Molár Bált, Beczúr Adrás

Huffma kód A két legksebb val.szg-ű forráskód szmbólumot összevojuk, ezzel az üzeet abct egy szmbólummal csökketettük. Újra redezzük, majd megt a két legksebb val.szg-ű forráskód szmbólumot összevojuk. Ezt smételjük rekurzív módo, addg, amíg az üzeet abc két szmbólumra redukálódk, ezeket a szmbólumokat a bárs kód 0 lletve szmbólumával jelöljük meg. Ezek utá a rekurzív eljárást megfordítjuk, vsszafelé meve 0 lletve szmbólumokat kokateáluk a kódszavakhoz, azoko a potoko, ahol előbb két kódszót összevotuk. Molár Bált, Beczúr Adrás

Huffma kód Állítás: A prefx kódok között a Huffma kód optmáls Bzoyítás: dukcóval p l Bármely más prefx kód H Vegyük tetszőleges,,, prefx - metes kódot p,, p akkor cseréljük fel. Ezzel a Összevova p Ha em a leghosszab kódok tartozak hozzájuk, Átredezhetjük a leghosszabb p l p l, p, p kódja 0, legye. vezettük vssza. p Huffmakód - hez p p q -, p, legye a két legksebb érték kódhossz várható értéke em ő kódokat(párba vaak), hogy t, a feladatot eggyel rövdebb eloszlásra Molár Bált, Beczúr Adrás

Molár Bált, Beczúr Adrás Huffma kód N H ~ N H,, H N, H N,, H,, H,, l N m l m N x H jutó kódhossz, az egy szmbólumra Mvel várható értékű kódhossz. elérhető vagy a Shao - Fao kóddal Huffma kóddal, együttes eloszlásához a A elő szer fordul gyakorságok vaak : Ha - t. a - re közelít N várható értéke jutó kódhossz Egy szmbólumra eloszlás

Nevezetes kódok Tetszőleges közel tuduk me a C /H sebességgel, ha agyo sok hosszú kódsorozatot kódolok egybe. Nagyo agy kódok, valamlye tpkus halmazo való vselkedéshez hasolóa működek. Molár Bált, Beczúr Adrás

Uverzáls forráskódolás Adaptív kód: Ncs előre adott kódszó redszer, amt kostas kezdet költségű kódkét át kell külde. (mt pl. Shao-Fao. Huffma kód) Molár Bált, Beczúr Adrás

Uverzáls forráskódolás (Győrf,L.: Iformácó és kódelmélet) Az eddg vzsgált kódok alkalmazásakor az adó és a vevő között átvtelre kerülő btek két csoportot alkotak. Először átvsszük a blokk-kódot leíró formácót. Ez egy álladó költséget jelet, függetle az üzeet téyleges hosszától. Majd következek az üzeet kódszava. Molár Bált, Beczúr Adrás

Uverzáls forráskódolás Elmélet vzsgálatak sorá azzal a feltételezéssel éltük, hogy a továbbítadó üzeetük végtele hosszú. Ily módo, a kódok aszmptotkus vselkedését tektve, az álladó költség fajlagosa ullához tart, tehát elhayagolható. A gyakorlatba azoba véges forrásokkal va dolguk. Molár Bált, Beczúr Adrás

Uverzáls forráskódolás Ebbe az esetbe az álladó költség akár agyobb s lehet, mt az üzeet kódszavaak összhosszúsága. Ezt elkerüledő, jó lee, ha redelkezésükre álla egy olya techka, amelyek cs álladó költsége, de aszmptotkusa ugyaolya jó tömörítés aráyt ér el, mt a blokk-kódok. Az álladó költség abból adódk, hogy a kódot a forráso előzetese elvégzett statsztka vzsgálatok (a forrásszmbólumok gyakorsága) alapjá hozzuk létre, tehát ezek az adatok szükségesek a kód leírásához. Molár Bált, Beczúr Adrás

Uverzáls forráskódolás Ehelyett járjuk el úgy, hogy meet közbe gyűjtük formácót a forrásszmbólumokról, vagys az aktuáls szmbólumot az ezt megelőző szmbólumok alapjá kódoljuk. Az lye kódokat adaptív kódokak evezzük, alkalmazásuk sorá cs álladó költség. (Létezk pl. adaptív Huffma-kód). A most tárgyalásra kerülő Lempel Zv-kódok s ebbe a családba tartozak. Molár Bált, Beczúr Adrás

Uverzáls forráskódolás Az első LZ-algortmus az 977-be publkált LZ77. Molár Bált, Beczúr Adrás

Lempel-Zv kódok LZ77 algortmus Csúszóablakba éz a forrásszmbólumokat h a = h k + h e h a h k Már kódolt h e kódoladó Molár Bált, Beczúr Adrás

Az LZ77 algortmus (ld. Győrf) A kódoló a forrásszmbólumok sorozatát egy h a hosszú csúszó ablako keresztül vzsgálja. Az ablak két részből áll: egy kereső pufferből, amely a legutóbb kódolt h k darab forrásszmbólumot tartalmazza, és egy előretektő pufferből, amely a következő h e darab kódoladó szmbólumot tartalmazza (h a =h k +h e ). A kódoló a kereső pufferbe megkeres az előre tektő puffer első szmbólumával megegyező szmbólumokat. Ehhez egy hátrafelé haladó mutatót haszál. loghloghlogx *k e Molár Bált, Beczúr Adrás

Az LZ77 algortmus (ld. Győrf) Megéz, hogy a megtalált pozícókkal kezdődőe, a kereső pufferbe lévő szmbólumok mlye hossza egyezek meg az előretektő puffer szmbólumaval, és a találatok közül azt választja k, amelytől kezdve a leghosszabb az egyezés. A kódoló ezutá elküld egy <t h c > hármast, ahol t a kereső pufferbe megtalált szmbólum távolsága az előretektő puffertől (offset), h a kereső-és az előre- tektő puffer egyező szmbólumaak legagyobb hosszúsága, c pedg az első, az előretektő pufferbe lévő em egyező karakter kódszava. Azért küldjük el az első em egyező karakter kódját s, hogy kezeljük azt az esetet, amkor az előre tektő puffer szmbólumat em találjuk meg a kereső pufferbe. Ilyekor t és h értéke 0. Egy hármas kódolásához álladó hosszúságú kód haszálatával (*)bt szükséges, ahol X a forrásábécé mérete. Az egyező szmbólumok hosszúságáak átvteléhez em log h k, haem log h e bt szükséges. Eek oka, hogy az egyezés hossza meghaladhatja a kereső puffer hosszát,vagys az egyezőrész átlóghat az előretektő pufferbe. loghloghlogx *k e Molár Bált, Beczúr Adrás

LZ77 A LZ77 egy redkívül egyszerű adaptív algortmus, amely em géyel előzetes smeretet vagy feltevést a forrásról. Megmutatható, hogy az eljárás hatékoysága aszmptotkusa (h k, h e ) megközelít az optmáls algortmusét, amely előzetese smer a forrás eloszlást, azaz stacoárus és ergodkus forrás eseté az átlagos kód szóhossz kovergál H- hoz (bárs abc), ha (h k, h e ). Bár ez aszmptotkusa gaz, a gyakorlatba az LZ77 számos továbbfejlesztése smeretes, amelyek célja a hatékoyság övelése. A épszerű PKZIP és ARJ tömörítőkbe a hármasokat em fx, haem változó hosszúságú kóddal kódolják. Egy másk varácó változtatható méretű kereső és előretektő ablakot haszál. 206.04.8. Molár Bált, Beczúr Adrás 20

LZ77 Az LZ77 legegyszerűbb módosítása aak kküszöbölése, amkor egyetle karaktert kódoluk egy hármassal. Ez egy jelző bttel oldható meg. Ezzel jelezzük, hogy em egy hármast, haem csak egy kódszót küldük át. Az LZ77 alkalmazása sorá a forrásszmbólumok legutóbb kódolt sorozatát haszáljuk, így azzal a feltételezéssel élük, hogy a mták egymáshoz közel tervallumokba vsszatérek (a mozgó ablako belül). Szélsőséges esetbe, ha az smétlődés hossza éppe eggyel hosszabb a kereső puffer méretéél, em tuduk tömöríte. Az LZ-algortmus következő, 978-as verzójáál (LZ78) ezt a problémát egy másfajta, adaptív szótár alapú redszerrel oldják fel. http://cs.staford.edu/people/eroberts/co urses/soco/projects/datacompresso/lossless/lz77/example.htm http://www.strgology.org/datacompre sso/lz77/dex_e.html 206.04.8. Molár Bált, Beczúr Adrás 2

LZ77 206.04.8. Molár Bált, Beczúr Adrás 22

LZ77 206.04.8. Molár Bált, Beczúr Adrás 23

The_fat_cat_sat_o_the_mat. (0,0,t) (0,0,h) (0,0,e) (0, 0,_) (0, 0,f ) (0, 0, a) (0, 0, t) (0, 0, _) (0, 0, c); (4, 3, s) (4, 3, o); (0, 0, ) (0, 0, _); (l9, 4, m) (ll,2,.) 206.04.8. Molár Bált, Beczúr Adrás 24

206.04.8. Molár Bált, Beczúr Adrás 25

LZ78 Az LZ78 algortmus A kódoló és a dekódoló s szótárt épít az előzőleg elő fordult sorozatokból. A kódoló megkeres a forrásszmbólumok aktuáls pozícójától kezdődő leghosszabb egyezést a szótárba. Átküld egy <, c> párt, ahol az egyező karaktersorozat szótárbel dexét jelöl, c pedg az első em egyező karakter kódja, majd felvesz a szótárba az dexű egyező karaktersorozat és a c karakter kokateácójakét kapott strget ( karakter füzért ) (a következő szabad dexet adja ek). Ha em talál egyező karaktersorozatot a szótárba, akkor a <0, c> párost küld át, c tt s az első em egyező karakter kódja, amely ebbe az esetbe természetese az első feldolgozadó szmbólum. 206.04.8. Molár Bált, Beczúr Adrás 26

LZ78 206.04.8. Molár Bált, Beczúr Adrás 27

206.04.8. Molár Bált, Beczúr Adrás 28

LZ78 Megmutatható, hogy az LZ78 egy betűre jutó átlagos kódszó hossza kovergál H(X)/log s -hez mde stacoárus és ergodkus forrásra. X=X,X 2,, X ergodkus, stacoárus s a kódábécé elemszáma Az LZ78 algortmus egyk hbája, hogy a szótár folyamatosa, korlát élkül övekszk. A gyakorlatba egy bzoyos határo túl gátat szabuk a övekedések: vagy redszerese eltávolítjuk a felesleges vagy rtká haszált bejegyzéseket, vagy egy dő utá fx szótáraskét működk tovább az eljárás. 206.04.8. Molár Bált, Beczúr Adrás 29

Az LZW algortmus Terry Welch az LZ78 módosításával egy olya techkát dolgozott k, amellyel megtakarítható az < c> párból a c karakterkód átküldése. Ez az ú. LZW algortmus. A kódoló tehát csak szótárbel dexeket küld át. Ehhez szükséges, hogy a szótárba már a kduló állapotba s szerepelje az összes egybetűs szmbólum a forrásábécéből. A kódolás sorá az aktuáls pozícótól kezdve addg olvassuk be a forrásszmbólumokat a p pufferbe, amíg a sorozat szerepel a szótárba. Ha az a karakter az első olya, amelyre pa cs bee a szótárba (az egymás utá írással a kokateácót jelöltük), akkor átküldjük a p sorozat dexét, a pa sorozatot felvesszük a szótárba és az a karaktertől kezdve folytatjuk az eljárást. 206.04.8. Molár Bált, Beczúr Adrás 30

206.04.8. Molár Bált, Beczúr Adrás 3

206.04.8. Molár Bált, Beczúr Adrás 32

A Ux COMPRESS paracsa és a G I F (Graphcs Iterchage Format) képtömörítő eljárás s az LZW algortmust haszálja, 206.04.8. Molár Bált, Beczúr Adrás 33

Matematka ktérő 206.04.8. Molár Bált, Beczúr Adrás 34

Matematka ktérő 206.04.8. Molár Bált, Beczúr Adrás 35

Hvatkozás http://www.takoyvtar.hu/e/tartalom/tamop42 5/0046_formaco_es_kodelmelet/ch04s07.ht ml 206.04.8. Molár Bált, Beczúr Adrás 36

Stacoárus és ergodkus fogalom matematka meghatározása 206.04.8. Molár Bált, Beczúr Adrás 37