Az információ fogalomköre, adatbázisok/adatbankok szerepe az orvosi gyakorlatban és a kutatásban

Hasonló dokumentumok
Az információ fogalomköre, adatbázisok/adatbankok szerepe az orvosi gyakorlatban és a kutatásban

Az információ fogalomköre, adatbázisok/adatbankok szerepe az orvosi gyakorlatban és a kutatásban

Informatikai Rendszerek Alapjai

H=0 H=1. Legyen m pozitív egészre {a 1, a 2,, a m } különböző üzenetek halmaza. Ha az a i üzenetet k i -szer fordul elő az adásban,

Az informatika részterületei. Az információ. Dr. Bacsó Zsolt

Informatikai alapismeretek

Nagy Gábor compalg.inf.elte.hu/ nagy

A továbbiakban Y = {0, 1}, azaz minden szóhoz egy bináris sorozatot rendelünk

Ö Ö Ú Ó Ö ű Ő Ő ű ű Ü Ő Ó Ő

ö ö ö ö ö ö ö ü ö ü ö ű ö ú ü ű ö ü Í ö ú ü ü ű ö ú ü Á ü

ő ö ő ú ő ö ö ő ó ő ö ü ú ö ö ó ő ö ü ó ó ó ó ő ő ő ó ó ú ő ü ő ö ö ó ü ö ö ő ű ö ö ő ú ú ó ö ő ű ö ó

é ú é é é é é é é é é é é é ú é ö é é é ö Ő é é é ú é é é é é é é é ö é é é ö é Ö é é ö é ö é é é ű é ö ö é ö é é ö ö é é ö ö é ö é Ö é ú é é é é é é

ó ú ú ü ú ő ó ő ő ó ó ó ö ó ü ő ó ő ö ü ü ó ö ő É ó ö ö ö ó ó ö ü ü ö ü ó ó ő ó ü ó ü ü ö ö É ú ó ó ö ú ö ü ü ó ó ó ü Á ö ö ü ó ö ó ö ö ö ö ó ó ö ó ó

ö ö ó ú ö ö ú ü ó ö ö Í ö ö ö ü ó ö ö ú ú ö ü ó ü ó ü ö ú ü ó ü ö ó Á Á ö ü ú ó ö ü ü ö ó ü ü Á ü ö ü ö ü ö ö ö ü ö ú ö ö ö ü ú ö ú ö ű ú ú ü ö ó ö ö

é ö é Ö é é ő í ó í é ő ö ú é ó é ő ü ü é ó ö é é ó é é ö é ő í é é ő é é ö é ű ö é í ó é é í ö í ó í ó é é ö ó í ó ó í ó é é ö ő í ó ó í ó ü é í ü

ú ú ü ü Á ú ú ü ű ű ú ü ü ü ü

É ö Ű ő ű ő ő ű ű

í ó ő í é ö ő é í ó é é ó é í é é í é í íí é é é í é ö é ő é ó ő ő é ö é Ö ü é ó ö ü ö ö é é é ő í ő í ő ö é ő ú é ö é é é í é é í é é ü é é ö é ó í é

ő ő ő ő ú É ü ú ú ű ú ű ő ő ő ő Á Á ü ő É É É É É É Á Ú Á Á ő ő ő ő ő É Á Á Á ő ő ő Á ü ő ő ü

ü ö ú ö ú ü ö ü Á Ó ö ö ö ö ú ü ú ü ü ú ú ö ö ü ü ú ü ü ö ö ű ö ü ü ü ü ö ö

ú ú ö ö ü ü ü ü ű ü ü

Ö Ö ű ű ű Ú Ú ű ű ű Ú ű

É Í ü ú É ü ő ő ő ő ú ő ú ü ü ő ü ú ü ű ú ú ü ü Í ü ű ő ő É ő

ő ö ő ű ó ö ó ű Í Ö Ö Á Í Ó Ö Ü É Ö Ö Ö Á Á Ö É Á Ö

Í Í Í Ü Ó Ó Ö Á Ü Ü Ó Ü Ü Ó Ö Í É Ö

Ü ü Ü Ö Ó ö ü ö Ó Ú Ó ü Ó ö ö Á ö ö ö ö ü

ú ü ü ú Ö ú ü ü ü ü ü ú ü ú ü ű Í ü ü ű ü ű Ó ü Ü ű ú ú Á ü ű ű ü ü Ö ü ű ü Í ü ü

ű í ú ü ü ü ü ü Ó í ü í í í É Á

ö ö Ö ó ó ö ó ó ó ü ö í ü ú ó ó í ö ö ö ó ö ü ú ó ü ö ü ö ö Ö ü ö ö Ö ó

í Ó ó ó í ó ó ó ő í ó ó ó ó

Í Í Ó ű Ü Ó Ó Ü ü Ö Í Ü Í Í ú Ö Ó Í ú ú Ö Ó É Í ű ú

ő ő ő ő ő ő ú ő ü Á ü ü ő ő ő ő ő ő ő ő ő ő Ö Ó ő ő ő Ö ő ő ő

É ő ő ű ú Á ő Á ő ű ő ő ő ő ő ő ő ő ű ú ű ű ő ő ő ű

ű ú ú Ö ó Ö ó ó ó Ö ű ó ű ű ü Á ó ó ó ó ü ó ü Ö ó ó ó Ö ű ű ü Ö ű Á ú ú ú ó ű í í Ő ú Á É Ö í ó ü ű í ó ű ó Ö ú Ő ú ó í ú ó

ö ü ü ú ó í ó ü ú ö ó ű ö ó ö í ó ö í ö ű ö ó Ú ú ö ü É ó í ö Ó Á í ó í í Ú ö ú ö ű ü ó

ú Ü Í ú ú ú ú ú ú

ö Ó ű ö ó í ó ü ö Ó ó í ö ö ó Ö ó ö í ó í ó Á í ó Á Á Ő ú ü ó Í ü ú ü

Ö ő ü Ö Ö Ő ü ő Ö Ö ü ű Á Í Ö ű ü ő ő ő Ö ü ü ő ő ő Ü ü ő ő ő ü ő ő ü ü

ó É ó í ó ó í í ö í ó í ö ö ö ü ö ó ó ó ü ú ö ü ó ó ö ö ü ü ü ö ö ó ö í ó ű Ü ó í ú í ö í ö í Í ó ó í í ö ü ö ö í ö í ö ö ö ü ó í ö ö ó í ú ü ó ö

ű ú Í Ó Á ú Ű ű Ő Ö Á ú Ű Ü ú ú Á ú ű

Í Ú É ő ő ú ö Ö ú ú ú ö ö ú ö ö ű ö ő ö ö ú ö ő ő ö ö ö ő ő ú ő ú ö ö ö ú ö ö ú ő ö ú ö ű ö ő Ó ő Á ö ő ö ö

ú ű ú ú ű ú ű ű ú ű ú ű Á ű ű Á ű ű ú ú ú ú ú ú ű ú ú ú ú ú ú ú ú

í í É í ó ó É ö í ó í ó í ó ó í ó í í ó ó ó í ö ö ö ö í í í ó ó ö ó

Ö Ö Ö Ö Ö Á Ű É Ö Ö Ö

É Ö Á Í Á Ó Ö ü

Ü

Í ö ö ű ú ö ö Í ö ü ö ü


í ó í ó ó ó í í ü ú í ú ó ó ü ü í ó ü ú ó ü í í ü ü ü ó í ü í ü ü í ü ü í ó ó ó í ó í ü ó í Á

Ü ű ö Á Ü ü ö ö

Ö Ö ö Ó Ó Ó Ó Ü ú ü Ű Ö Ö Ö ö Ü ö Í ü ű

Ö Ö ú

ő ő Ű ü ú ú Ú ü ű ő ő ő ő Á Á Í ü É ő ő ő ő ő É ő ú ú ú ő Á Ö ő

ö ő ő ü ü Ó ü ö ű Á ő ő ö ő Á Ó ű ö ü ő ő ű

É Í Á Á É Ü Ó É É É É Í Ó Ó Ő Á Á É Á É É É É Á É É Á Á É É Á É Í

É ú É ö ö ű ö ö ö ú ú ú ű ű ú ö ű ö ű ű ü ö ö ü ű ö ü ö ö ö ö ú ü ö ö ö ú ö ö ú ö ö ú ü ú ú ú ű ü ö ö ű ú ű ű ü ö ű ö ö ö ű ú ö ö ü ú ü ö ö ö ü ú ö ű

ü ö ö ő ü ó ó ú ó

ű ú ü ü ü Í ü ö ü ö ü ö ü Ó ü ö ü ö ö ü ű ű ú ü ö ö ü Ó ö ű ü ö ú ö ö ü ü ű ü ü ö ö ü ü ú ö ö ü ü ú ü

ú ű ű É ü ű ü ű ű í ü í ő í Ü ő ő ü ú Í ő ő í ú ü ü ő ü

ü É ö É É ö ö ö ü ö ö Á ű ö ű ű ű Á Í ö ö Ó ö

ó ö í í ü Ű Ö ó ó ű ö ü Í í í ö Ö Ó ö Ű Ö ú ó ó í í ű ö ö ö ö í ó ö ö í ö ű ö ű ö ö ö ö ö í ó Ö Ö ü ú ö ó ü ö Ö ű ö Ö ü ó ö ö ó ö ö Ó í ű ö ű ö ö ű í

ű ö ú ö ö ö ö í ű ö ö ö ű ö ö ö í ü ú í ű í ö í ú ű í ü ö ö ú ö í ö ű ú ü ö ö í ö ü ö ú ű ö ö ö í Á í ü í ö ü ö í ü ö Ő ü ö í ű ü ö í í í í í

ö ö ö Ö ö ú Ö í Ö ű ö í Ö í ö ü ö í ú Ö Ö ö í ű ö ö í ö ö Ő ö í ü ö ö í Ö ö ö í ö í Ő í ű ű í Ö Ó í ö ö ö ö Ö Ö ö í ü ö ö Ö í ü Ö ö í ö ö ö ö ö Ö ö í

í í í í ó í ó ö ö í ű ü ó ó ü ú Á Á ó ó ó ó ó ó í ó ö ö ü Ó ö ü í ö ó ö í í ö í ó ó í ö í ú ó ú í ö ú ö ö ö í ó ó ó ú ó ü ó ö í ó ó í í í Á í ó ó ó

í ü í ü ő ő ü Í ő ő ő ú í ő ő ö ö ö ű ü í ő ő í ú ö ö ú ő ő ú í ő í ő ö ö í ő ü ü í ő ö ü ü ú í í ü ő í ü Í í í í ö ő ö ü ő í ő ő ü ű ő ő í ő í í ő ő

ű Á ü ő ö í ö ö ő ő ő ő ö

ű ú ó ó ü í Á Á ú ó ó ó ó ó ó ó ó ó ó ó ó ó ó í ó ü É ű ü ó í ü í í í í í ó í ü í í ó ó Á

í í ü í í í í í Ó ő ő í í í Ú ü Ú í í Ú ő ü Ú ü ő

Í Ó ü ü í ü ü ü í Í í É í í Í Í ü ü ü í Í ü

ü ő ő ü ü ő ő ű í í ű ő ő ő ü ő ő í í ő ő ő ő ő ő ü ü í ő Ö ő ü í ő ü í í ő ü ő í ő ő í í ő ü ü í ő ü í ő í ő í ő ü í ő í ü í í ő

Az Informatika Elméleti Alapjai

Az Informatika Elméleti Alapjai

Az Informatika Elméleti Alapjai

ő ű í ő ú í í Á ű í ő ő ő ő í É í í ő Ö Ö Ö Á Í Á ő ő ő ő É ő ő ú ú ú í ő Á Ö ő ő

í ű í í í ű ö ü ü ö ú ű ú ö ö í í í ű ö ü ü ö ö ö ö í í í ű ö ü ü ö ü ö í í í ű í ö í ö ö ű í ü ü ö í ö ö ö ü í í ű í ú ö ö ö ü ö ö ú ö ö ö ü ö ö ö ö

Í Á ő é é é é é ő é ő é ő é Í Á Ú Á Á é ő é ő é é é é é ű é é é é é é é é Á é é é é é ú ú é é é é é é é ú é é é é é é é é é é é ő é é é é é é é é ű é

ú ü ú ö ú í ü í ű ö ü ü ú ú ö ú ö íö í ú ü

Ú ú ö é ö é Ú ú ö ű ö ö ű ö é ö ö é í í Ö ö í í Á Á Ó é ű ü é é ü ú é ü é ű ü é

Á Ó É É Ú É ő í ő ő ö ő ö ő í ö ö ü í ő í ő ö ű ő í ü ü ő í ö ő ü ő ú ü í í ű ü ő ő ő í ö í ú ö ő ö ü ő ő ő É

Á ó ó ö ó ó ó ö ó ó ö ü ö ó ü ö ó ü ó ö ó ü ó űö ú ü ö ú ó ó ó ő ü ö ö ó ö ó ó ó ó ö ó ő ú ü ö ó ö Ú ü ó ü ő ö ü ö ö ó ó ü ő ő ó ő ü ó ó ó ö ű ő ő ű ü

ó ú ó ó ó ó ó ó ó ó ó ó ü ó ü ö ü ó Á Á Ő ű ü ó ó ó Í ó ü ú ü Á Á ű ö ó ó ó ó ö ü

Á ú ú ű ű ú ú Í ú ú Ö ű Ö ű Ö Ö ű ű ú ÍÍ Í ú Í Í Í Í Í ú ú

ö ű é é é é é é ü é é é é ű é é ü é é é é é ó ó é Í é í é é é é ó ö é ö ö ö ó é é í é é é é Ő é é é ü ü é é é ö ö ö é ü é é í é ó ü é é ü é ó é ó ó é

ü ű ü ó ő ó ű ú ő ó ő ű ü ó ő ó ő í ő ó ó ő ő í ó ő ő ü ó ű ü ó ő ő Ö ő ü íí ő í ű ü ó ő ü ő í ő ű ü ó ő ő

ő ő ó é ő ő ő é ú é ő é é ú ó é é é í é í í é ű é ö é é é Ö ó í é é é ő ő é ö ó é Í ö ö ő é é é ő ó ó ú ö ó í ó ő ő é é ő ü ö é é é Ö é í í é ú ü é ö

í ü ü ú í ü ú ú É Á í ű Á ú í ü í Ő Ű í Ó ű í ü í ű Ú ú É í ü í í

Á Á Á ö ö Á É É ö ú É Á É É ű ö ö ö Á É É É ö Á Í Á É ö ö ö Ö Ö ű ö Ö ű Ó ü ö ű ö Ó Ó ú ö ö Á É É ö ű É Á É É ö

íő ö Ú ö ö ő í ű í ű í í ű ö í ö Ü ö

ö í Á Á Á ö É É í É Á Á Á Á Á É ő ö í ő ö ő ö í ü ő ö ő ö ő ü ö ő ö í ő ő ő ö í ő ő ú ö ű ö ő ö í

Á ó ö í í ö í ö ö ó í ű ó í

Az Informatika Elméleti Alapjai

ó ú ő ö ö ó ó ó ó ó ő ő ö ú ö ő ú ó ú ó ö ö ő ő ö ö ó ú ő ő ö ó ő ö ö ö ö ö ö ó Á É ű ó ő ő ű ó ó ö ö ő ó ó ú ő Ű ö ö ó ó ö ő ö ö ö ö ő Ú ú ó ű ó ó ő

ó í ú ő ó ó ü ő í ú ó ü Ö Í ö ő ü ö ö ó ő ü Ü ö Ö ö ü ó ü ú ö Ö í í ő ö ü ú ü ü ó í ő ő ü í ü É ő ő Í ö ö ó ő ó ó ő ü ö ü ő ó ő ő ö Ö ő ü ő ő ő ü ö ö

é ú ó é í é é é é í é ő é é ő é é í é é é ó é í ó ö é ő ő ő é í ó Í ő í é ö ő é í ó é é ű ó é Ú é í é é í é í é ó é í é ö é ő é ó ó ó é ö é Ö ü é ő ö

ó Ó ó Ó Ő ó Ő Ó Í

É ö É ó Á É ó ü Á Ő Ö ü ö Ö ő ü ö ő Ü ű ő ó ő ó ő ő ő í ö ö ö í ő ü ü ő ü ü ő ö ó ő ő ú ő ő ö ö ő ő ő ú ő ő ü ú

ü í ű í ó ö ó ü ö ú ó í Á ó ö ú ü ó í ö ó ó ó Á ó ö ú ó ó ó íú ü ó ö ö í ü ó ö ú ó í í í í Ö í ö ú ó í í ú í ü ű ö Í í ó Ö Ö ö ű ö í ó í Í í ü í

Ó ö ü í ü ö ü ü ü ö ü ö ö í ü ü ü ü ö ö í ö ü ö É ü ü ü É ö ü ö ö ü ü ö ü í ü ö í

É É Í ú ú Ü ú ú ű

ő ő ó ő ö ú ű ő ó í ő í ő ó ő í ó ó ő í ő í Ü ú ó ő ö ő É ő ő ő Ü í ó í Ü í ó ó Ü Ü ó ő ó ó Ü Ü ó ó ó í ó Ü ű í Ü Ü ő Ü ó É ó ő í ú

Átírás:

1. Az információ fogalomköre, adatbázisok/adatbankok szerepe az orvosi gyakorlatban és a kutatásban 2. A orvosi-/bio-informatika mint interdiszciplina BIOLÓGIA BIOTECHNOLÓGIA FEJLŐDÉSTAN FIZIOMIKA (EGY ÉLŐ SZERVEZET GENOMJÁTÓL A SZERVEZET EGÉSZÉIG TERJEDŐ KAPCSOLATOT ÍRJA LE) GENOMIKA INFORMÁCIÓTECHNOLÓGIA MATEMATIKA MOLEKULAMODELLEZÉS PROTEOMIKA STATISZTIKA 1

3. Témakörök: I. Az információ fogalma, mértéke II. Kódolás. Kódolási hatásfok, redundancia III. A genetikai kód, információtartalma IV. Bioinformatikai adatbankok Az információ fogalma, mértéke 4. 2

Mi az információ? 5. informatio: későbbi latin értelmezés szerint: tanítás általi képzés; felvilágosítás, oktatás, tanítás a korábbi latin előadás, magyarázat -ból származtatva. Információ: tudás, ismeret valamiről/valakiről; egy hír által közölt ismeret; adott helyzetről, folyamatról nyújtott/szerzett ismeret; Informatikai fogalomként: Információ az a jelentés amit egy hír hordoz. 6. Az információ olyan új ismeret, ami a bizonytalanságot/határozatlanságot csökkenti. jeleknek olyan sorozata, elrendeződése amelyek meghatározott gyakorisággal lépnek fel; aminek jelentést tulajdoníthatunk; ami a címzettet egy meghatározott viselkedésre készteti 3

Az információ más definíció szerint - az "értelemmel bíró adat", és ennek megfelelően igen sokféle formában, különböző adathordozókon létezhet. 7. Az információ- szerzés folyamata tanulás hír kommunikáció adatgyűjtés jeleknek olyan sorozata, elrendeződése amelyek meghatározott gyakorisággal lépnek fel; 8. jelek (a példákban) hangok, szavak, hanglejtés; betűk, szavak, mondatok, kontextus fiziológiai állapotot leíró jellemzők/jelek Az információ forrása, tárolása: az "értelemmel bíró adat" igen sokféle formában, különböző adathordozókon létezhet 4

tárolás (pl.): számítógépeknél: mágneses tárolók, optikai tárolók, integrált áramkörök (ROM,RAM, stb.) stb. 9. páciens esetén: az elsődleges forrás a beteg; a kapott adatok tárolása különböző módon valósul meg. 10. Számrendszerek: tízes: 0,...,9; kettes: 0,1 2008 2 0 =1 2 1 =2 2 2 =4 2 3 =8 2 4 =16 2 5 =32 2 6 =64 2 7 =128 2 8 =256 2 9 =512 2 10 =1024 2 11 =2048 2008 3 2 1 0 10 2 10 0 10 0 10 8 10 10? 2 maradék kitevő(n) 2 n szorzótényező 2008 10 1024 1 984 9 512 1 472 8 256 1 216 7 128 1 88 6 64 1 24 5 32 0 24 4 16 1 8 3 8 1 0 2 4 0 0 1 2 0 0 0 1 0 5

2008 10 11111011000 2 11. 1 bit: egyetlen hely(iérték) a számítógépes tárolásban; 1 byte: nyolc bit SI: 1kbit=10 3 bit; (gyakran) számítástechnika: 1kbit = 1024 bit Kódolás dekódolás 12. színek halmaza piros zöld kék 形绿的形红的名天空色 színeket jelentő szavak kölcsönösen egyértelmű megfeleltetés két halmaz elemei között adó: információt tárol/küld kódolt formában vevő: információt fogad, dekódol 6

A kódolás feladata/szerepe 13. az információ tárolása, továbbítása egy adott jelrendszert alkalmazva pl. Morse-kód feromonok DNS-szekvencia hologramm Jelrendszer: adatok; számok; jelek (pl. piktogrammok, hieroglifák); betűk; aminosavak (fehérjék felépítésében); feltétel: megegyezés az információ megfogalmazásában, a szabályokban az adó és a vevő között (pl. a kék ugyanazt jelentse; a múlt idő jele a t ); a jel(hordozó) készletet mind az adó, mind a vevő ismerje; 14. Összefoglalás I. Információ kódolás egy jelenségnek, tulajdonságnak adott jelrendszeren (kódolás) alapuló leírása, tárolása, továbbítása; feltételezve az adó és a vevő egyidejű vagy egymásutáni jelenlétét (információ átadás/áramlás) információ önmagában nem létezik 7

15. Kérdések: Mekkora egy információ információtartalma? Hogyan lehet hatásosan kódolni? Hogyan lehetne általánosan leírni az információ továbbítását? Információtartalom a páciensnek egy foga lyukas a páciensnek minden foga lyukas Megérzés: a kisebb valószínűségű esemény információtartalma nagyobb Mekkora egy továbbított üzenet információtartalma? 16. Információelméleti definíció: Az információ a jeleknek olyan sorozata, elrendeződése amelyek meghatározott gyakorisággal lépnek fel. alma aalm az információtartalom ugyanaz 8

Statisztikailag független események információtartalma 17. Legyen p: az adott jel (esemény) kimenetelének valószínűsége A jelhez kapcsolódó információtartalom, I(p) Definíció 1.: I 1 p) log 2 log ( p) p ( 2 [I]=bit vagy sh sh: Claude Shannon, az információelmélet megalapozója Definíció 2.: 18. Azon biteknek a minimális száma (az információtartalom I, shannon egységekben), ami ahhoz szükséges, hogy egyetlen, p-valószínűséggel fellépő jelet kódoltan, minimális jelkészlettel hatásosan továbbítsunk: I( p) log 2( p) [ I] bit v. sh Minél kisebb a jel előfordulási valószínűsége, annál nagyobb az információtartalma 9

19. I(p=1)=-log 2 (1)=0 ha az üzenet csak egyetlen jelből áll, akkor annak az információtartalma nulla. pl.: legyen egy jel előfordulási valószínűsége p=0,0625. Hány biten kell kódolni a jelet a maximálisan hatásos továbbításért? I=-log 2 (0,0625)=4 bit Kísérletsorozat (jelsorozat) információtartalma 20. m: osztályok száma (m-féle kimenetel; pl. ábécé betűi, kockadobás kimenetele 1 6, stb.) p k : a k.-ik esemény valószínűsége/relatív gyakorisága N: az összes esemény száma (= n 1 +n 2 +...+n m ; gyakoriságok ) Definíció 3.: I m k 1 n k I k Továbbítandó: halandzsa m nk log 2 pk k 1 I=?; hány bit kell minimálisan a továbbításhoz? Hogyan kódoljunk/tároljunk hatásosan? 10

Továbbítandó/tárolandó: halandzsa N=7 (!DZS!) m=5 1 2 3 4 5 21. n k (gyak.) f k (rel.gyak) I k =- n k *log 2 (f k ) a 3 0.429 3.67 h 1 0.143 2.81 l 1 0.143 2.81 n 1 0.143 2.81 dzs 1 0.143 2.81 N= 7 SI= 14.90 halandzsa bitek száma 15 A hatásos kódoláshoz/tároláshoz 15 bit elegendő (a fenti példához!) Biostatisztika 2. A biostatisztika szerepe, feladatai, leíró statisztika: az adat fogalma, adattípusok, az adatgyűjtés, az adatok ábrázolása, táblázatos ábrázolás, grafikonok. 3. A valószínűségszámítás elemei, a valószínűségszámítás és a statisztika kapcsolata (független események, feltételes valószínűség, esélyérték, esélyarány). betű gyak. betű gyak. betű gyak. a 36 j 1 s 18 á 13 k 11 sz 10 b 5 l 14 t 25 c 0 ly 2 ty 0 cs 1 m 5 u 1 d 5 n 5 ú 0 e 18 ny 2 ü 1 é 11 o 11 ű 4 f 5 ó 4 v 3 g 7 ö 0 x 0 gy 1 ő 0 y 0 h 0 p 3 z 6 i 10 q 0 zs 0 í 7 r 7 n=252!dz,dzs! 22. 11

Hogyan lehet hatásosan kódolni? 23. Cél: tárolás továbbítás legkisebb befektetéssel (energia, idő) Megoldás: 1. Az információ információtartalmának megfelelően (minimálisan szükséges bitek száma) 2. A nagyobb gyakorisággal előforduló jelekhez a legegyszerűbb/legrövidebb kód hozzárendelésével. A redundancia szerepe 24. Redundanciának nevezzük azt a jelenséget, amikor egy jelsorozatban egyes jelek előfordulását korábbi, vagy későbbi jelek alapján meg lehet jósolni. pl.: q utáni u személyi/taj számokban az utolsó jegy Következmény: kisebb az információátvitel hatásossága lehetőség a dekódolás/az átvitel minőségének ellenőrzésére/javítására (zajos az átviteli csatorna; pl.: igen gyönge fényben nézünk valamit,...) 12

Az átlagos információtartalom 25. x N x i Definíció 4.: I m k nk Ik m 1 nk N log k 1 N H: a kísérlet/jelsorozat entrópiája; egysége bit H I m p k log 2 p k k 1 2 p H k A genetikai kód, információtartalma 26. Kérdések: 1. mennyi a minimális jelkészlet ~húsz aminosav kódolásához? 2. mennyi egy DNS-szekvencia információtartalma? Válasz 1 (lásd biológiai előismeretek is): négy féle nukleotid kódol ha párban kódolnának akkor a lehetséges variáció: 4 2 =16 ha tripletben: 4 3 =64 a tripletben való kódolás elegendő és minimális vannak aminosavak amit több kodon is kódol vannak különleges triplettek, amik más funkciót irányítanak 13

Válasz 2: (mennyi egy DNS-szekvencia információtartalma?) 27. Tf.: azonos valószínűséggel fordulnak elő a bázisok p k =p=0,25; I 1 =I 2 =I 3 =I 4 =I b Ha a szekvencia hossza N, akkor n k =n=n/4 4 I nk I k 1 k ni 1 ni 2 ni 3 ni I 4 N / 4 I N I N log b b 2 0,25 N bit I N log 2 1,6021 N=10 ~16 bit 4 4 n I p b N=10 6 ~1,6 10 6 bit 28. Összefoglalás II. Egy információ információtartalmát a Shannon által bevezetett (információs) entrópiával jellemezhetjük; Egy információs csatornára vonatkozó maximális kódolási hatásfokot az információtartalomnak megfelelő minimális kóddal érhetjük el. Fehérjék, DNS vagy más makromolekula által hordozott információt az aminosavak/bázisok/monomerek gyakorisága alapján számíthatjuk. 14

29. Bioinformatikai adatbankok Cél: a biológiai, orvosi gyakorlatban megszerzett ismeretek tárolása, rendszerezése, minőségellenőrzése, analizálása, elérhetővé tétele Követelmény: gyors, hatékony hozzáférhetőség; csak azoknak az információknak a kinyerése, amik az adott felhasználót érdeklik. Követelmény: gyors, hatékony hozzáférhetőség = = csak azoknak az információknak a kinyerése, amik az adott felhasználót érdeklik. 30. Specializált adatbankok: előny: rövidebb találati idő, részletes adatok hátrány: az összefüggések hiánya Kevésbé specializált adatbankok: előny: adatok/jelenségek közötti összefüggések kereshetők hátrány: több szempont szükséges adott ismeret megtalálásához 15

31. Kereső algoritmusok (kereső motorok): az adott adatbázisban keresett ismeret megtalálását célzó matematikai/informatikai eljárás Gyakorlati tudnivalók az adatbázisokban való kereséshez: I.) Józan paraszti ész : a keresett fogalomnak megfelelő adatokat tartalmazó adatbázisban keressünk 2.) túl általánosan definiált kérdés túl sok eredmény 3.) túl speciálisan feltett kérdés túl szűk eredményhalmaz 4.) a második módszert első kereséskor használjuk, a harmadikat majdnem ismert válasz esetén. pl.: cholesterol 182358 cholesterol transport 9055 cholesterol transport pediatrics 128 cholesterol transport pediatrics Chan T. 2 32. Jelinek D, Patrick SM, Kitt KN, Chan T, Francis GA, Garver WS.: Physiological and coordinate downregulation of the NPC1 and NPC2 genes are associated with the sequestration of LDL-derived cholesterol within endocytic compartments. J Cell Biochem. 2009 Sep 10. [Epub ahead of print] PMID: 19746448 Sahoo D, Trischuk TC, Chan T, Drover VA, Ho S, Chimini G, Agellon LB, Agnihotri R, Francis GA, Lehner R. ABCA1-dependent lipid efflux to apolipoprotein A-I mediates HDL particle formation and decreases VLDL secretion from murine hepatocytes. J Lipid Res. 2004 Jun;45(6):1122-31. Epub 2004 Mar 1. 16

GenBank from NCBI (National Center for Biotechnology Information) Genetic Sequence Databank; EMBL Nucleotide Sequence Database (European Molecular Biology Laboratory); SwissProt és PROSITE (protein sequence database ); EC-ENZYME (a már jellemzett enzimek adatbankja); RCSB PDB (3-D biológiai makromolekuláris szerkezetek Rtg-diffrakció-, NMR-, and Cryo-EM alapján); MEDLINE: humán medicina, fogászat, állatorvosi tudomány, kísérletes orvostudomány,... PUBMed (http://www.ncbi.nlm.nih.gov/sites/entrez): bibliográfiai adatbázis orvostudomány, biológia, biokémia, biofizika,... EISZ (http://www.eisz.hu): magyarországi főiskolák és egyetemek oktatói, hallgatói számára hozzáférés (internetcím alapján). 33. 34. SOTE-n belül: http://www.lib.sote.hu/ Források Adatbázisok EndNote szoftver!!! Tudományos cikkek Könyvek Tudománymetriai adatbázisok Gyógyszerészeti adatbázisok 17

35. C. Shannon (1916-2001) 18