A mai el!adás. Bioinformatika és genom analízis az orvostudományban (AOGENBIG_1M) Mi a bioinformatika? Pontosítjuk a definíciót

Hasonló dokumentumok
Bakteriális identifikáció 16S rrns gén szekvencia alapján

Orvosi Genomtudomány 2014 Medical Genomics Április 8 Május 22 8th April 22nd May

Semmelweis Egyetem / Élettani Intézet / Budapest. Bioinformatika és genomanalízis az orvostudományban. Bevezetés. Cserző Miklós 2018

Genomadatbázisok Ld. Entrez Genome: Összes ismert genom, hierarchikus szervezésben (kromoszóma, térképek, gének, stb.)

Gyakorlati bioinformatika

Milyen a modern matematika?

Bioinformatika és genomanalízis az orvostudományban. Biológiai adatbázisok. Cserző Miklós 2018

A tárgy címe: Bioinformatika

A genomikai oktatás helyzete a Debreceni Egyetemen

A mai el!adás témája: Miklós István Állapot Emisszió Útvonal Legvalószín!bb útvonal (Viterbi path) Szuboptimális útvonal

10. Genomika 2. Microarrayek és típusaik

TDK lehetőségek az MTA TTK Enzimológiai Intézetben

Miben különbözünk az egértől? Szabályozás a molekuláris biológiában

The nontrivial extraction of implicit, previously unknown, and potentially useful information from data.

Bevezetés a rendszerbiológiába

0. Kurzusok tudnivalók 1. Az anyag - csak az írott anyagban 2. Az élet molekulái - csak az írott anyagban 3. Mi az Élet? 4. A Világ keletkezése 5.

Bioinformatika előadás

Human genome project

Fehérjék rövid bevezetés

MOLEKULÁRIS FILOGENETIKAI ELEMZÉSEK EGY DISZKRÉT MATEMATIKAI

A Jövő Internet elméleti alapjai. Vaszil György Debreceni Egyetem, Informatikai Kar

Hálózati modellek alkalmazása a molekuláris biológia néhány problémájára. Doktori (PhD) értekezés tézisei. Ágoston Vilmos

Matematika MSc záróvizsgák (2015. június )

1. Az informatika alapjai (vezetője: Dr. Dömösi Pál, DSc, egyetemi tanár) Kredit

Problémák és megoldások a bioinformatikában. Válogatott fejezetek a bioinformatikából. Gyimesi Gergely, február 25.

A fő egészségügyi kihívások

Dobzhansky: In Biology nothing makes sense except in the light of Evolution.

Genetikai kölcsönhatások rendszerbiológiája

Az evolúció az adatok mögött

Semmelweis Egyetem / Élettani Intézet / Budapest. Bioinformatika és genomanalízis az orvostudományban. Szekvenciaelemzés. Cserző Miklós 2017

Bevezetés a bioinformatikába. Harangi János DE, TEK, TTK Biokémiai Tanszék

A HUMÁN GENOM PROJEKT Sasvári-Székely Mária* Semmelweis Egyetem, Orvosi Vegytani, Molekuláris Biológiai és Pathobiokémiai Intézet

Természetes szelekció és adaptáció

CLUSTALW Multiple Sequence Alignment

Az NMR és a bizonytalansági elv rejtélyes találkozása

Bioinformatika 2 6. előadás

IRODALOMJEGYZÉK 67: 181: 97: 229: 190: 39: 48: 32: 16: 103: 17: 25: 12:

Phenotype. Genotype. It is like any other experiment! What is a bioinformatics experiment? Remember the Goal. Infectious Disease Paradigm

Gerinces és növényi ortológ promóter adatbázisok fejlesztése és elemzése. Eötvös Loránd Tudományegyetem Természettudományi Kar Biológia Doktori Iskola

BIOINFORMATIKA Ungvári Ildikó

ADATBÁNYÁSZAT I. ÉS OMICS

Matematikai statisztika c. tárgy oktatásának célja és tematikája

Gépi tanulás és Mintafelismerés

Bioinformatika 2 10.el

Evolúcióbiológia. Biológus B.Sc tavaszi félév

A MOLEKULÁRIS BIOLÓGIA ISMERETÁBRÁZOLÁSI PROBLÉMÁI

Az orvosi biotechnológiai mesterképzés megfeleltetése az Európai Unió új társadalmi kihívásainak a Pécsi Tudományegyetemen és a Debreceni Egyetemen

III. ATK Tudományos Nap

Biomolekuláris nanotechnológia. Vonderviszt Ferenc PE MÜKKI Bio-Nanorendszerek Laboratórium

PROGRAMFÜZET. "GENETIKAI MŰHELYEK MAGYARORSZÁGON" XIII. Minikonferencia SZEPTEMBER 12.

Közösség detektálás gráfokban

Bioinformatika előadás

Biológiai rendszerek modellellenőrzése bayesi megközelítésben

EXKLUZÍV AJÁNDÉKANYAGOD A Phrasal Verb hadsereg! 2. rész

TSIMMIS egy lekérdezés centrikus megközelítés. TSIMMIS célok, technikák, megoldások TSIMMIS korlátai További lehetségek

0. Kurzusok tudnivalók 1. Az anyag - csak az írott anyagban 2. Az élet molekulái - csak az írott anyagban 3. Mi az Élet? 4. A Világ keletkezése 5.

A TANTÁRGY ADATLAPJA

Robusztusság és génkölcsönhatások rendszerbiológiája. Papp Balázs

Bioinformatics: Blending. Biology and Computer Science

Genetika. Tartárgyi adatlap: tantárgy adatai

Semmelweis Egyetem / Élettani Intézet / Budapest. Bioinformatika és genomanalízis az orvostudományban. Bioinformatikai modellek. Cserző Miklós 2017

Egy új DNS motívum típus in silico jellemzése és szerepe a génszabályozásban Zárójelentés - OTKA # PD73575, BIOIN Cserző Miklós

Etológia. a viselkedés biológiája. Barta Zoltán.

A funkcionális genomikai eszköztár szerepe az onkológiai kutatásokban

Humán genom variációk single nucleotide polymorphism (SNP)

Fehérjeszerkezet analízis. Fehérjeszerkezet analízis. Fehérjeszerkezet analízis. Fehérjeszerkezet analízis. Fehérjeszerkezet analízis

Bioinformatika az élelmiszergyártásban és a táplálkozástudományban

A programozás alapjai előadás. Amiről szólesz: A tárgy címe: A programozás alapjai

Tipizálási módszerek alkalmazása methicillin-rezisztens Staphylococcus aureus (MRSA) törzsek molekuláris epidemiológiai vizsgálatai során

5. modul: ARÁNYOSSÁG, SZÁZALÉKSZÁMÍTÁS

Klaszterezés, 2. rész

A humán mitokondriális genom: Evolúció, mutációk, polimorfizmusok, populációs vonatkozások. Egyed Balázs ELTE Genetikai Tanszék

Human Genome Project, évvel a tervezett befezés előtt The race is over, victory for Craig Venter. The genome is mapped* - now what?

Searching in an Unsorted Database

Rendezetlen fehérjék kölcsönhatásainak vizsgálata: elmélet, predikciók és alkalmazások

Bozóki Sándor. MTA SZTAKI, Budapesti Corvinus Egyetem. Vitaliy Tsyganok

Tudományközi beszélgetések

LOGISZTIKA A TUDOMÁNYBAN ÉS A GAZDASÁGBAN

A felgyorsult fehérje körforgás szerepe a transzlációs hibákkal szembeni alkalmazkodási folyamatokban

Juhász Angéla MTA ATK MI Alkalmazott Genomikai Osztály SZEKVENCIA ADATBÁZISOK

Ph.D. értekezés tézisei. Bioinformatikai analízis és digitális jelfeldolgozás. génexpressziós adatokon

Ahol a kvantum mechanika és az Internet találkozik

Etológia Emelt A viselkedés mérése. Miklósi Ádám egyetemi tanár ELTE TTK Etológia Tanszék 2018

Poligénes v. kantitatív öröklődés

Az új érettségi rendszer bevezetésének tapasztalatai

Cserző Miklós Bioinformatika és genomanalízis az orvostudományban. Integrált biológiai adatbázisok

A DNS szerkezete. Genom kromoszóma gén DNS genotípus - allél. Pontos méretek Watson genomja. J. D. Watson F. H. C. Crick. 2 nm C G.

ÉRZÉKELŐK ÉS BEAVATKOZÓK I. 3. MÉRÉSFELDOLGOZÁS

A bioinformatika mint oktatási feladat

Témák Tudományos DiákKöri munkákhoz

10. modul: FÜGGVÉNYEK, FÜGGVÉNYTULAJDONSÁGOK

Big Data az adattárházban

Hidraulikus hálózatok robusztusságának növelése

Hamar Péter. RNS világ. Lánczos Kornél Gimnázium, Székesfehérvár, október

MATEMATIKA 5 8. ALAPELVEK, CÉLOK

Supporting Information

A NIMROD SZUPERGÉNCSALÁD EVOLÚCIÓJA

2. Ismert térszerkezetű transzmembrán fehérjék adatbázisa: a PDBTM adatbázis. 3. A transzmembrán fehérje topológiai adatbázis, a TOPDB szerver

STATISZTIKUS TÖRVÉNYSZERŰSÉGEK EGYSZERŰ DEMONSTRÁLÁSA GALTON-DESZKÁVAL SIMPLE DEMONSTRATION OF STATISTICAL LAWS WITH GALTON-BOARD

Szakmai zárójelentés OTKA azonosító: NN 75255

Átírás:

Bioinformatika és genom analízis az orvostudományban (AOGENBIG_1M) Miklós István SOTE, 2008. szeptember 11. A mai eladás Mi a bioinformatika? Kik a bioinformatikusok? A bioinformatika oktatása a világban és Magyarországon A bioinformatika története A bioinformatikai gondolkodás A kurzus ismertetése Magamról Els definíció: Mi a bioinformatika? Bioinformatika = + informatika, azaz bioinformatika minden olyan biológiai kutatás, amely számítógép segítségével történik Problémák: Ma már mindenhol elterjedt a számítógépek használata, így gyakorlatilag minden biológiai kutatás bioinformatika lenne Miért külön tudományág? Miért nincs pl. hisztoinformatika? Pontosítjuk a definíciót A biológiában, és ezen belül különösképpen a biokémiában olyan mérték" adatmennyiség keletkezik, amelynek a feldolgozása, értelmezése, tárolása számítógépek nélkül lehetetlen lenne. Ezen feladatokat végzi el a bioinformatika Tény: A csillagászatban sokkal több mérési adat keletkezik, mint a biológiában. Kérdés: Miért nincs asztroinformatika? : pl.: Kepler törvények, Maxwell egyenletek : pl: Centrális dogma? : pl.: Kepler törvények, Maxwell egyenletek : pl: Centrális dogma?

: pl.: Kepler törvények, Maxwell egyenletek : pl: Centrális dogma? : pl.: Kepler törvények, Maxwell egyenletek : pl: Centrális dogma? : pl.: Kepler törvények, Maxwell egyenletek : pl: Centrális dogma? : pl.: Kepler törvények, Maxwell egyenletek : pl: Centrális dogma? Szabályozás Szabályozás : pl.: Kepler törvények, Maxwell egyenletek : pl: Centrális dogma? : pl.: Kepler törvények, Maxwell egyenletek : pl: Centrális dogma? Szabályozás Peptid Szabályozás ` Peptid + Epigenetika glikolizáció, stb.

Az adatok valós számokkal mérhetek Diszkrét, kombinatorikus adatok (zömével...) : Égitestek tömege, fényessége, sugárzás hullámhossza, stb. : Dönt többségében szekvenciális adatok Kisebb mértékben gráfok (biokémiai útvonalak, kölcsönhatásgráfok, leszármazási viszonyok) Egyre növekv mértékben valós számokkal leírható adatok, pl. expressziós mintázat. Az entitások közötti kölcsönhatások világosak Kismérték" perturbáció nem okoz dramatikus eltérést Klasszikus példa: Sarlós-sejtes vérszegénység: 1 VHLTP E EKSAVTALWGKVNVDEVGGE 26 V Sok kölcsönhatás nem ismert A kölcsönhatások bonyolultak, kis változás is okozhat nagy eltérést Mi tehát a bioinformatika? Kik a bioinformatikusok? A modern biokémia korszakában olyan mennyiség" és a hagyományos adatoktól eltér minség" adat keletkezik, amelynek a feldolgozására, értelmezésére és tárolására új matematikai, statisztikai, algoritmikai és számítástechnikai eljárásokat kellett kidolgozni. Ez a bioinformatika. It is hard for me to say confidently that, after fifty more years of explosive growth of computer science, there will still be a lot of fascinating unsolved problems at peoples' fingertips, that it won't be pretty much working on refinements of well-explored things. Maybe all of the simple stuff and the really great stuff has been discovered. It may not be true, but I can't predict an unending growth. I can't be as confident about computer science as I can about biology. Biology easily has 500 years of exciting problems to work on, it's at that level. Donald E. Knuth Bioinformatikus technikus A felhasználó Tudja a szoftvereket használni Értse, hogy mit csinál Legyen tisztában a módszerek korlátaival Interpretálni tudja a biológusok elvárásait az informatikusoknak Önállóan nem felsfokú végzettség, de lassan minden (biológus) felsfokú végzettséghez kell. Bioinformatikus mérnök Az új metódusok kidolgozója Írjon szoftvereket Gyártson algoritmusokat Legyen tisztában a matematikai modellek biológiai hátterével Legyen nyitott a biológusok új igényeire Önálló felsfokú végzettség, de alapkutatás alapja, kollaborációk nélkül haszontalan. A világban: A bioinformatika oktatása Bioinformatikus technikus képzések: Nagyon elterjedt Zömében egységes tananyag Biológus igényeknek megfelelen Bioinformatikus mérnök képzések: Spóradikus (persze világméretben ez is sok iskolát jelent) Minden iskola saját témára helyezi a hangsúlyt Általában informatikusok, matematikusok, statisztikusok Magyarországon: A bioinformatika oktatása Bioinformatikus technikus képzések, hivatalos kurzusok: Debrecen Szeged (Pongor S.,... ) Budapest, Pázmány P. (Závodszky P.,... ) Budapest, ELTE + Szent István egyetem (Pónyi T., Barta E., Tóth G.) SOTE: ez a kurzus stb... Bioinformatikus mérnök képzések, speciálkollégiumok: ELTE, i Fizika TSz. (hálózatok) ELTE, Növényrendszertani TSz. (evolúciógenetikai aspektusok, sztochasztikus modellek, Monte Carlo módszerek)???

A bioinformatika története A bioinformatika története 1941,Sturtevant, Novitski: The homologies of chromosome elements in the genus Drosophila. 1953: Watson-Crick, DNS szerkezete, 1965: Pauling, Molecules as Documents of Evolutionary History 1969: Jukes-Cantor modell 1970: Needleman-Wunch, biológiai szekvenciaillesztés 1973, 1975: Sankoff: többszörös szekvenciaillesztés 1978: Nussinov algoritmusa RNS térszerkezetekre 1984: Hogeweg and Hesper, The alignment of sets of sequences and the construction of phyletic trees: an integrated method. ; 1987: Profile szekvenciaillesztés, 1988: Clustal 1992: Sztochasztikus modellek, HMMs 1993: Fodor et al. DNS chip 1999: Barabási-Albert modell Wolfe KH, Li WH. (2003). Molecular evolution meets the genomics revolution. Nat Genet. 2003 Mar; 33 Suppl:255-65. A bioinformatikai gondolkodás I. Legegyszer"bb példa: keresés egy telefonkönyvben A bioinformatikai gondolkodás I. Szekvenciaillesztés Naív algoritmus Sorban haladunk... Aba Ágnes Aba Béla Aba Ferencné... Gyors algoritmus Intervallumfelez A-M vagy N-Z? A-F vagy G-M? Stb. 1 1 1 1 1 1 1 3 5 7 9 11 1 5 13 25 41 61 1 7 25 63 129 231 1 9 41 129 321 671 A lehetségek száma drámaian n A bioinformatikai gondolkodás I. Naív algoritmus: Megnézi az összes lehetséget. Szofisztikált algoritmus: Az optimális megoldást valamilyen cseles úton találja meg (az okos algoritmus sem nézi meg az összes nevet a telefonkönyben) Az algoritmusok futási idejét a bemen adatok függvényeként is megadhatjuk Gyors algoritmusok: O(n): Kétszer annyi adatot kétszer annyi id alatt elemez. O(n 2 ): Kétszer annyi datot négyszer annyi id alatt elemez. Lassú algoritmusok: O(2 n ): Eggyel növelve a bemen adat mennyiségét, a futási id kétszeresére n. A bioinformatikai gondolkodás I. Heurisztikus algoritmusok: Gyorsabb, mint a nem heurisztikus algoritmus. Nem garantált, hogy az optimális megoldást kapjuk meg, de általában értelmes megoldást kapunk. Példák: BLAST: Kb. O(n) futási id O(n 2 ) helyett (1000 aminosavból álló szekvenciák esetén ezerszer gyorsabb) Többszörös szekvenviaillesztés: Bizonyítottan nincs optimális gyors algoritmus Iteratív szekvenciaillesztés: Clustal, T-COFFEE, stb. Ez így inkább érthet, mint precíz megfogalmazás...

A bioinformatikai gondolkodás I. Mit kell egy bioinformatikus technikusnak (is) tudnia egy algoritmusról? Mennyi az algoritmus futási ideje Meg tudja becsülni hogyan változik a futási id az adatmennyiség növelésével Az algoritmus egzakt vagy heurisztikus megoldást jelent-e? Általában az algoritmikai problémákról tudni kell, hogy: Lehetségek száma " futási id Vannak olyan problémák, amelyek egzakt megoldására nem lehet gyors algoritmust megadni, csak heurisztikus algoritmust A bioinformatikai gondolkodás II. Egy marslakó embereket akar tanulmányozni. Kér egy modellt egy divatterveztl és egy gyógyszerkutatótól... A divattervez egy viaszbábut küld, a gyógyszerkutató egy egeret. A két modellben csak a bajszuk a közös... Miért nem fog semmit sem megtudni az emberekrl a marslakó? A bioinformatikai gondolkodás II. Egy marslakó embereket akar tanulmányozni. Kér egy modellt egy divatterveztl és egy gyógyszerkutatótól... A divattervez egy viaszbábut küld, a gyógyszerkutató egy egeret. A két modellben csak a bajszuk a közös... Miért nem fog semmit sem megtudni az emberekrl a marslakó? Mert nem tudja, hogy a modell a valóság mely aszpektusát modellezi A bioinformatikai gondolkodás II. Példa: Szekvenciaillesztés: 1 MRRLLICLMLTVLAGCAQQQQPPKDDSLYRDLGQRAGIQRIVEGMLMNVARDDRIVERFK 2 MLSTAHRDIIKATVPILETGGEALTTHFYRIMLN--DYPQVRP--LFNQANQANGAQPRA ::... :. : : :. :: :.:..: A mutációk egymástól függetlenek Nincs letális mutáció Nincsenek tiltott motívumok Nincsenek térbeli kölcsönhatások, korrelációk Nyílván ezen állítások egyike sem igaz, de ezt kell feltételezni ahhoz, hogy gyors algoritmusunk legyen. A bioinformatikai gondolkodás II. Minden modell rossz, de némelyik használható... Az örökké fejld tudomány és a bioinformatika kapcsolata Model Predikció Tesztelés A bioinformatikában a körforgás minden egyes lépésére önálló tudományág épül i megfigyel ések Tudásábrázolás Adatbázisok Predikciók Adatbányászat

A bioinformatikai gondolkodás III. A bioinformatikai gondolkodás III. A Rosetta-k Törvények három nyelven. Központi hipotézis: a struktúra konzervatívabb, mint a szekvencia Amikor megtalálták, csak az ógörög és az egyiptomi alfabetikus írás volt ismert, a hielográfiák nem. A hielografikus írást a különböz írások összehasonlításával fejtették meg. si szekvencia struktúrafügg evolúció A változásokból következtetünk a struktúrára modern szekvencia A bioinformatikai gondolkodás III. Központi hipotézis: a struktúra konzervatívabb, mint a szekvencia A bioinformatikai gondolkodás III. Központi hipotézis: a struktúra konzervatívabb, mint a szekvencia si szekvencia struktúrafügg evolúció modern szekvencia si szekvencia struktúrafügg evolúció modern szekvencia A változásokból következtetünk a struktúrára A változásokból következtetünk a struktúrára Egy szekvencia: Egy szekvencia: Két szekvencia: DEFYTHISPSQALISCAMPLETELYIHIDDENYWAE A bioinformatikai gondolkodás III. Központi hipotézis: a struktúra konzervatívabb, mint a szekvencia A bioinformatikai gondolkodás IV. Korunk paradigmaváltása Több tényez együtthatása si szekvencia struktúrafügg evolúció A változásokból következtetünk a struktúrára modern szekvencia D NS chip Lehetvé vált egyszerre sok gén expressziójának vizsgálata Barabási-Albert modell, scale-free gráfok Matematikusok érdekldnek a hálózatok iránt Egy szekvencia: Két szekvencia, elemezve DEFYTHISPSQALISCAMPLETELYIHIDDENYWAE Els genomprojectek befejezése, rájöttünk, hogy (majdnem) semmit sem értünk Igény új gyógyszertargetek iránt -> fel kell fedezni az ismeretlen fehérjéket

A bioinformatikai gondolkodás IV. Korunk paradigmaváltása A bioinformatikai gondolkodás IV. Korunk paradigmaváltása Hagyományos megközelítés: Hipotézis, prekoncepció Hagyományos megközelítés: Hipotézis, prekoncepció tudásanyag hagyomány divat grant-climate Kisérlet, eredmények tudásanyag hagyomány divat grant-climate Kisérlet, eredmények Genomikai megközelítés: Génvadászat prekoncepció-mentes A bioinformatikai gondolkodás IV. Korunk paradigmaváltása A kurzus tematikája http://ramet.elte.hu/~miklosi/bioinformatika/2005sote/ Tudományos eljárás prekoncepciók alapján 1. Állapot (egészséges) 2. Állapot (daganatos) Molekula A Molekula B Molekula C Molekula D Molekula E Molekula X Molekula A Molekula B Molekula C Molekula D Molekula E Molekula X Tudományos eljárás prekoncepciók nélkül: génhalászat 1. egészséges 2. daganatos (eltérés) Információkeresés az adatbázisokban I. Információkeresés az adatbázisokban II. Szekvencia-összehasonlítások. Hasonlósági keresések szekvencia-adatbázisokban Molekuláris filogenetikai elemzések Single Nucleotide Polymorphism Struktúrák predikciója biológiai szekvenciákban Genom szint" mutációk Hálózatok Génexpressziós elemzések. Betegséggének. Pathogének Genetikai adat- etikai, jogi aspektusok miklosi@ramet.elte.hu Algoritmuselmész: Magamról Lunter G.A., Miklós, I., Song, Y.S. & Hein, J. (2003) An efficient algorithm for statistical multiple alignment on arbitrary phylogenetic trees J. Comp. Biol. 10(6):869-889. Miklós, I. (2002) An improved algorithm for statistical alignment of sequences related by a star tree. Bul Math. Biol. 64(4):771-779. Sztochasztikus modellez, statisztikus: Miklós, I., Lunter, G. A. & Holmes, I. (2004) A 'long indel' model for evolutionary sequence alignment. Mol. Biol. Evol., 21(3):529-540. Miklós, I., Ittzés, P. & Hein, J. (2005) ParIS Genome Rearrangement Server Bioinformatics, 21(6):817-820. Lunter, G.A., Miklós, I., Drummond, A., Jensen, J.L., & Hein, J. (2005) Bayesian Coestimation of Phylogeny and Sequence Alignment BMC Bioinformatics, 6:83. RNS térszerkezetelemz: Meyer, I.M. & Miklós, I. (2004) Co-transcriptional folding is encoded within RNA genes. BMC Molecular Biology, 5:10 Miklós, I., Meyer, I.M. & Nagy, B. (2005) Moments of the Boltzmann distribution for RNA secondary structures Bul. Math. Biol., 67(5):1031-1047. Köszönetnyílvánítás Patthy László: Pevzner (2004) bioinformatics cikk, bioinformatikus technikus vs. mérnök Simon István: Asztroinformatika vs. Bioinformatika Richard Durbin: Komparatív bioinformatika Falus András: Korunk paradigmaváltása a bioinformatikában

Ajánlott olvasmányok Pevzner, P (2004) Educating biologists in the 21st century: bioinformatics scientists versus bioinformatics technicians. Bioinformatics 20(14):2159-2161. Wolfe, K. H. & Li, W-H. (2003) Molecular evolution meets the genomic revolution. Nature Genetics 33:255-265.