Az információelmélet alapjai, biológiai alkalmazások. 1. A logaritmusfüggvény és azonosságai

Hasonló dokumentumok
Valószínűségi változók. Várható érték és szórás

Kvantumcsatorna tulajdonságai

Adatok statisztikai értékelésének főbb lehetőségei

Elméleti összefoglaló a Valószín ségszámítás kurzushoz

[Biomatematika 2] Orvosi biometria

Az Informatika Elméleti Alapjai

Gazdasági matematika II. vizsgadolgozat megoldása A csoport

Informatikai Rendszerek Alapjai

Biomatematika 2 Orvosi biometria

4. Az A és B események egymást kizáró eseményeknek vagy idegen (diszjunkt)eseményeknek nevezzük, ha AB=O

Információs rendszerek elméleti alapjai. Információelmélet

Információelmélet Szemináriumi gyakorlatok

Matematikai alapok és valószínőségszámítás. Valószínőségi eloszlások Binomiális eloszlás

Nagy Gábor compalg.inf.elte.hu/ nagy

1. A kísérlet naiv fogalma. melyek közül a kísérlet minden végrehajtásakor pontosan egy következik be.

egyenletesen, és c olyan színű golyót teszünk az urnába, amilyen színűt húztunk. Bizonyítsuk

SZÁMÍTÁSTUDOMÁNY ALAPJAI

Készítette: Fegyverneki Sándor

Valószín ségszámítás és statisztika

1. tétel. Valószínűségszámítás vizsga Frissült: január 19. Valószínűségi mező, véletlen tömegjelenség.

(Diszkrét idejű Markov-láncok állapotainak

[Biomatematika 2] Orvosi biometria

Az Informatika Elméleti Alapjai

(Independence, dependence, random variables)

Relációk Függvények. A diákon megjelenő szövegek és képek csak a szerző (Kocsis Imre, DE MFK) engedélyével használhatók fel!

RE 1. Relációk Függvények. A diákon megjelenő szövegek és képek csak a szerző (Kocsis Imre, DE MFK) engedélyével használhatók fel!

Az Informatika Elméleti Alapjai

Osztályozóvizsga követelményei

Mi az adat? Az adat elemi ismeret. Az adatokból információkat

Eseményalgebra. Esemény: minden amirl a kísérlet elvégzése során eldönthet egyértelmen hogy a kísérlet során bekövetkezett-e vagy sem.

Elméleti összefoglaló a Sztochasztika alapjai kurzushoz

Zárthelyi dolgozat feladatainak megoldása õsz

2014. szeptember 24. és 26. Dr. Vincze Szilvia

Mérhetőség, σ-algebrák, Lebesgue Stieltjes-integrál, véletlen változók és eloszlásfüggvényeik

BIOMATEMATIKA ELŐADÁS

Markov-láncok stacionárius eloszlása

Matematika alapjai; Feladatok

x, x R, x rögzített esetén esemény. : ( ) x Valószínűségi Változó: Feltételes valószínűség: Teljes valószínűség Tétele: Bayes Tétel:

Nagy Gábor compalg.inf.elte.hu/ nagy

Matematika III. 2. Eseményalgebra Prof. Dr. Závoti, József

Készítette: Fegyverneki Sándor. Miskolci Egyetem, 2002.

A valószínűségszámítás elemei

Nagy András. Feladatok a logaritmus témaköréhez 11. osztály 2010.

Biometria az orvosi gyakorlatban. Számítógépes döntéstámogatás

Az Informatika Elméleti Alapjai

Valószínűségszámítás összefoglaló

A valószínűségszámítás elemei

Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1

Descartes-féle, derékszögű koordináta-rendszer

Osztályozóvizsga és javítóvizsga témakörei Matematika 9. évfolyam

Nyugat-magyarországi Egyetem Geoinformatikai Kara. Prof. Dr. Závoti József. Matematika III. 4. MA3-4 modul. A valószínűségi változó és jellemzői

Osztályozóvizsga követelményei

A Föld középpontja felé szabadon eső test sebessége növekszik, azaz, a

Valószín ségszámítás. Survey statisztika mesterszak és földtudomány alapszak Backhausz Ágnes 2018/2019.

Feladatok a logaritmus témaköréhez 11. osztály, középszint

Bevezető Adatok rendezése Adatok jellemzése Időbeli elemzés

Szeleteljük fel úgy a tulajdonságteret, hogy az egyes szeletekbe lehetőleg egyfajta objektumok kerüljenek, de túl sok szelet se legyen.

Itt és a továbbiakban a számhalmazokra az alábbi jelöléseket használjuk:

Hibajavító kódolás (előadásvázlat, november 14.) Maróti Miklós

Híradástechikai jelfeldolgozás

Nagy Gábor compalg.inf.elte.hu/ nagy

Abszolút folytonos valószín ségi változó (4. el adás)

Matematika 11. osztály

Diszkrét matematika I.

Matematika III. 4. A valószínűségi változó és jellemzői Prof. Dr. Závoti, József

BIOMATEMATIKA ELŐADÁS

Matematika A1a Analízis

A következő feladat célja az, hogy egyszerű módon konstruáljunk Poisson folyamatokat.

egyenlőtlenségnek kell teljesülnie.

További programozási esetek Hiperbolikus, kvadratikus, integer, bináris, többcélú programozás

6. Függvények. Legyen függvény és nem üreshalmaz. A függvényt az f K-ra való kiterjesztésének

Bevezetés. Valószínűségszámítás 2 előadás III. alk. matematikus szak. Irodalom. Egyéb info., számonkérés. Cél. Alapfogalmak (ismétlés)

Klasszikus algebra előadás. Waldhauser Tamás április 14.

GAZDASÁGI STATISZTIKA

Optimalizálási eljárások GYAKORLAT, MSc hallgatók számára. Analízis R d -ben

Az informatika részterületei. Az információ. Dr. Bacsó Zsolt

Új típusú döntési fa építés és annak alkalmazása többtényezős döntés területén

Gazdasági matematika II. tanmenet

1. tétel. 1. Egy derékszögű háromszög egyik szöge 50, a szög melletti befogója 7 cm. Mekkora a háromszög átfogója? (4 pont)

Diszkrét matematika I.

Fraktálok. Hausdorff távolság. Czirbusz Sándor ELTE IK, Komputeralgebra Tanszék március 14.

1. Alapfogalmak Algoritmus Számítási probléma Specifikáció Algoritmusok futási ideje

Biometria, haladó biostatisztika EA+GY biometub17vm Szerda 8:00-9:00, 9:00-11:00 Déli Tömb 0-804, Lóczy Lajos terem

Valószín ségszámítás és statisztika

Néhány fontosabb folytonosidejű jel

Miskolci Egyetem. Diszkrét matek I. Vizsga-jegyzet. Hegedűs Ádám Imre

Mindent olyan egyszerűvé kell tenni, amennyire csak lehet, de nem egyszerűbbé. (Albert Einstein) Halmazok 1

Országos Középiskolai Tanulmányi Verseny 2009/2010 Matematika I. kategória (SZAKKÖZÉPISKOLA) 2. forduló feladatainak megoldása

Matematika szóbeli érettségi témakörök 2016/2017-es tanév őszi vizsgaidőszak

1. tétel Halmazok és halmazok számossága. Halmazműveletek és logikai műveletek kapcsolata.

VALÓSZÍNŰSÉG, STATISZTIKA TANÍTÁSA

Niche. Tárgya a fajok koegzisztenciájának problémája A fogalom fejlődése: Toleranciahatárok! A hutchinsoni niche fogalom definíciója:

Általánosan, bármilyen mérés annyit jelent, mint meghatározni, hányszor van meg

Eloszlások jellemzése. Momentumok. Medián és kvantilis. Karakterisztikus függvény

HIVATALOS ÉRTESÍTÕ. 51. szám. A MAGYAR KÖZLÖNY MELLÉKLETE június 28., hétfõ. Tartalomjegyzék. III. Utasítások, jogi iránymutatások

Matematika tanmenet 11. évfolyam (középszintű csoport)

Bevezető Adatok rendezése Adatok jellemzése Időbeli elemzés. Gazdaságstatisztika KGK VMI

Nagy Gábor compalg.inf.elte.hu/ nagy ősz

MATEMATIKA EMELT SZINTŰ SZÓBELI VIZSGA TÉMAKÖREI (TÉTELEK) 2005

100% BIO Natur/Bio kozmetikumok és testápolás

Átírás:

Az információelmélet alapjai, biológiai alkalmazások 1. A logaritmusfüggvény és azonosságai 2 k = N log 2 N = k Például 2 3 = 8 log 2 8 = 3 10 4 = 10000 log 10 10000 = 4 log 2 2 = 1 log 2 1 = 0 log 2 0 nincs értelmezve 4 3 2 1 1 2 3 4 5 6 7 8

log 2 ab = log 2 a + log 2 b log 2 a/b = log 2 a log 2 b log 2 1/b = 0 log 2 b log 2 a b = b log 2 a 2. Történet Hírközlés: Hartley 1928 C. Shannon. 1948. AA Mathematical Theory of Communication Adó kódoló csatorna dekódoló vevő Zaj, torzítás

3. Alapvető fogalmak Diszkrét jelek mennek át bizonyos valószínűséggel. Kérdés: mennyi információt hordoznak a jelek? Az információ mérhető mennyiség. Minden információ kifejezhető 1 és 0 elemek sorozatával, a kódszóval. Ebből következik: a legkisebb információ az az, hogy 0 vagy 1. Ez az egységnyi információ (bit vö. kettős jelentés) ez átfordítható igen/nem re stb. Hány bit információt tartalmaz pl. a kihúzott magyar kártya megnevezése ez a megállapításhoz szükséges min. számú kérdések száma: log 2 32 = 5 általánosan log 2 N (Hartley)

Az információ a kimenetel megismerésével járó meglepődés mértéke, ami összefügg a kimenetelek számával, ill. azok valószínűségeivel. Hasonlítsuk össze a pénzfeldobást, a kockadobást stb. Általánosan: az információ valamely véges számú és előre ismert lehetőség valamelyikének megnevezése. Adott egy X = {x 1, x 2,.., x k,,x n } véges halmaz, ezek kiválasztásának egyenlő a valószínűsége (klasszikus val. mező). Mérés: legyen pl. n-féle tárgy a katalógusban I(x k ) = f(p k ) = f(1 / n) Ezek legyenek m féle színben, melyek egyformán valószínűek. Vagyis I(c i ) = f(p i ) = f(1/m)

Mi legyen f?? A szín majd a tárgy megállapítása egymástól függetlenül ugyanazzal az információval járjon, mint a tárgy és a szín együttes megismerése, vagyis: f(1/n) + f(1/m) = f(1/nm) További feltétel: ha nő a valószínűség, csökkenjen I. Ennek megfelel az f(x) = - log x (Shannon). Vagyis az egyedi információ: I(x k ) = - log p(x k ) = log 1/p(x k )

1. Példa: n = 8 féle tárgy, m = 8 féle szín. Ekkor mn = 64 I(x k és c i ) = I(x k ) + I(c i ) = -log 1/8 log 1/8 = log 8 + log 8 = = log 64 = - log 1/64 2. Példa: I = 6(-log 2 ½) = 6 log 2 2 = 6 = = log 2 64

4. Entrópia A figura helyével kapcsolatban a bizonytalanságot mérjük.. Általában azonban nem azonosak a valószínűségek, tehát az egyes kimenetelekhez tartozó valószínűségekkel súlyozni kell. H = Σ i p i log p i Ez tehát teljes eseményrendszerekre alkalmazható Tulajdonságai: 1. Folytonos 2. Nemnegatív, azaz 0 H(X) log 2 N 3. A maximumot egyenletes valószínűségekre kapjuk, a minimumot a biztos esetre 4. Szimmetrikus

Legyen Ω = {x 1, x 2 } és p(x 1 ) = 1 p(x 2 ) H 5. Együttes entrópia Tárgyak és színek példája Ω 1 = {x 1, x 2,,x k, x n } és Ω 1 = {c 1, c 2,,c i, c m } Descartes szorzat: c i x k x k c i A szorzattér elemei is teljes eseményrendszert alkotnak

H(X,C) = - Σ Σ p(x k,c i ) log p(x k,c i ) erre H(X,C) H(X) + H(C) Egyenlőség esetén független x és c. 1 Példa: c 1 c 2 x 1 4 4 x 2 4 4 H(X) = -2(½ log ½) = 1 H(C) = -2(½ log ½) = 1 H(X,C) = - 4 (¼ log ¼) = 2

2 Példa: c 1 c 2 x 1 2 8 x 2 8 2 H(X) = -2(½ log ½) = 1 H(C) = -2(½ log ½) = 1 H(X,C) = - 2 (2/20 log 2/20) - 2 (8/20 log 8/20) = 0.66 + 1.06 = 1.72 vagyis H(X,C) < H(X) + H(C)

6. Kölcsönös információ A szín ismeretében mi a bizonytalansága a tárgynak: H(X c 1 ) = - 2/10 log 2/10 8/10 log 8/10 =.46 +.26 =.72 Azaz H(X c 1 ) = H(X c 2 ) = H(C x 1 ) = H(C x 1 ) = 0.72 Az eredeti bizonytalanság 0.28-cal csökkent, ami pedig H(X) + H(C) - H(X,C) = I(X,C) = 0.28 Ábrázolása H(X) H(C) I(X,C)

Példák az ökológiából 1 Példa: A+ A- B+ 6 16 B- 0 58 A Adonis vernalis B Bupleurum falcatum H(A) = 0.38 H(B) = 0.84 H(A,B) = 1.06 I(A,B) = 0.16 2 Példa: A+ A- B+ 20 17 B- 18 25 A Thymus praecox B Helianthemum canum H(A) = 0.998 H(B) = 0.995 H(A,B) = 1.983 I(A,B) = 0.01

A kölcsönös információ tulajdonságai 1 I(A,B) mindig nemnegatív, csak akkor 0, ha A és B függetlenek 2 I(A,B)= H(A) csak akkor áll fenn, ha A és B között függvénykapcsolat van 3 I(A,B) = I(B,A) szimmetria 7. Súlyozott mennyiségek: Közvetlenül a gyakoriságokkal számolnak, ha m a kísérletek száma Entrópia H = Σ i p i log p i mh = mσ i p i log p i = m Σ k i /m log k i /m = Σ k i log k i /m = m log m Σ k i log k i

Együttes entrópia Y y j X x i k ij k i. k.j m=k.. mh(x,y) = m log m Σ Σ k ij log k ij Kölcsönös információ H(X) + H(Y) - H(X,Y) = I(X,Y) m log m Σ k i. log k i. + m log m Σ k.j log k.j {m log m Σ k ij log k ij } = m log m + Σ Σ k ij log k ij Σ k.j log k.j Σ k i. log k i.

vagyis + - - + Az Adonis / Bupleurum példa súlyozva mh(a)=30.4, mh(b)=67.2, mh(a,b)=84.8 I(A,B)=12.8

8. Biológiai alkalmazások Diverzitás sokféleség mérése, R. Margalef Intuitív értelmezés pl. faj, egyed a. Shannon-diverzitás H = Σ i p i log p i ezt voltaképpen becsüljük, azaz H = Σ i k i /m log k i /m b. Osztályozás Entrópia csökkentés, entrópia növekedésének minimalizálása, asszociáltság analízis