A tárgy címe: Bioinformatika



Hasonló dokumentumok
Bioinformatika 2 4. előadás

Gyakorlati bioinformatika

Bioinformatika és genomanalízis az orvostudományban. Biológiai adatbázisok. Cserző Miklós 2018

Semmelweis Egyetem / Élettani Intézet / Budapest. Bioinformatika és genomanalízis az orvostudományban. Szekvenciaelemzés. Cserző Miklós 2017

Cserző Miklós Bioinformatika és genomanalízis az orvostudományban. Integrált biológiai adatbázisok

Genomadatbázisok Ld. Entrez Genome: Összes ismert genom, hierarchikus szervezésben (kromoszóma, térképek, gének, stb.)

A genomikai oktatás helyzete a Debreceni Egyetemen

Bioinformatika 2 2. előadás

Bioinformatika 2 6. előadás

BIOINFORMATIKA Ungvári Ildikó

A bakteriális kommunikáció és kooperáció génjeinek elhelyezkedése ismert genomokban.

Juhász Angéla MTA ATK MI Alkalmazott Genomikai Osztály SZEKVENCIA ADATBÁZISOK

7. Fehérjeszekvenciák és térszerkezetek analízise.

TDK lehetőségek az MTA TTK Enzimológiai Intézetben

Bevezetés a bioinformatikába. Harangi János DE, TEK, TTK Biokémiai Tanszék

Molekuláris biológiai adatbázisok és adatbázis keresések. Barta Endre Tóth Gábor MBK Bioinformatikai Csoport

Az evolúció az adatok mögött

Problémák és megoldások a bioinformatikában. Válogatott fejezetek a bioinformatikából. Gyimesi Gergely, február 25.

Bioinformatika 2 5. előadás

Gerinces és növényi ortológ promóter adatbázisok fejlesztése és elemzése. Eötvös Loránd Tudományegyetem Természettudományi Kar Biológia Doktori Iskola

8. A fehérjék térszerkezetének jóslása

A fehérjék térszerkezetének jóslása

Bioinformatika előad

Fehérjeszerkezet analízis. Fehérjeszerkezet analízis. Fehérjeszerkezet analízis. Fehérjeszerkezet analízis. Fehérjeszerkezet analízis

5. Másodlagos adatbázisok

2. Ismert térszerkezetű transzmembrán fehérjék adatbázisa: a PDBTM adatbázis. 3. A transzmembrán fehérje topológiai adatbázis, a TOPDB szerver

DNS-szekvencia meghatározás

NÖVÉNYI GENOMIKA JÓRI BALÁZS

ÉRETTSÉGI TÉTELCÍMEK 2018 Informatika

The nontrivial extraction of implicit, previously unknown, and potentially useful information from data.

Semmelweis Egyetem / Élettani Intézet / Budapest. Bioinformatika és genomanalízis az orvostudományban. Bevezetés. Cserző Miklós 2018

Fehérjék rövid bevezetés

TEMATIKA Biokémia és molekuláris biológia IB kurzus (bb5t1301)

A nyomtatvány használata nem kötelező! TANMENET. az osztály INFORMATIKA tantárgyának tanításához. (tagintézmény igazgató)

Bioinformatika előad

INFORMATIKA ÉRETTSÉGI VIZSGA ÁLTALÁNOS KÖVETELMÉNYEI

Orvosi Genomtudomány 2014 Medical Genomics Április 8 Május 22 8th April 22nd May

Informatika szóbeli vizsga témakörök

10. Genomika 2. Microarrayek és típusaik

INFORMATIKA - VIZSGAKÖVETELMÉNYEK. - négy osztályos képzés. nyelvi és matematika speciális osztályok

Bioinformatika előadás

Fehérjék szerkezetének predikciója, szerkezeti adatok felhasználása adatbázisok segítségével, a számítógépes molekuladinamikai modellezés alapjai

A bioinformatika gyökerei

Informatika tanterv nyelvi előkészítő osztály heti 2 óra

A fehérjék szerkezeti hierarchiája. Fehérje-szerkezetek! Klasszikus szerkezet-funkció paradigma. szekvencia. funkció. szerkezet! Myoglobin.

INFORMATIKA TANMENET SZAKKÖZÉPISKOLA 9.NY OSZTÁLY HETI 4 ÓRA 37 HÉT/ ÖSSZ 148 ÓRA

A számítógépes feladatok a várt megoldáshoz egyértelmű utalásokat tartalmazzanak.

Semmelweis Egyetem / Élettani Intézet / Budapest. Bioinformatika és genomanalízis az orvostudományban. Bioinformatikai modellek. Cserző Miklós 2017

transzláció DNS RNS Fehérje A fehérjék jelenléte nélkülözhetetlen minden sejt számára: enzimek, szerkezeti fehérjék, transzportfehérjék

Mai témák. Fehérjék dinamikájának jelentősége. Számítógépes modellezés jelentősége

Rendezetlen fehérjék kölcsönhatásainak vizsgálata: elmélet, predikciók és alkalmazások

Bakteriális identifikáció 16S rrns gén szekvencia alapján

SZÁMÍTÓGÉP AZ IRODÁBAN KÉPZÉSI PROGRAM

AZ INFORMATIKA ÉRETTSÉGI VIZSGA ÁLTALÁNOS KÖVETELMÉNYEI

AZ Informatika érettségi VIZSGA ÁLTALÁNOS követelményei

3. Páronkénti szekvencia összerendezés

RÉSZLETES ÉRETTSÉGI VIZSGAKÖVETELMÉNYEK INFORMATIKÁBÓL

A fehérjék térszerkezetének jóslása (Szilágyi András, MTA Enzimológiai Intézete)

Filogenetikai analízis. Törzsfák szerkesztése

Az orvosi biotechnológiai mesterképzés megfeleltetése az Európai Unió új társadalmi kihívásainak a Pécsi Tudományegyetemen és a Debreceni Egyetemen

TOVÁBBKÉPZÉSI TÁJÉKOZTATÓ

ÉRETTSÉGI TÉTELCÍMEK 2012 Informatika

A MOLEKULÁRIS BIOLÓGIA ISMERETÁBRÁZOLÁSI PROBLÉMÁI

GEOSTATISZTIKA II. Geográfus MSc szak. 2019/2020 I. félév TANTÁRGYI KOMMUNIKÁCIÓS DOSSZIÉ

MOLEKULÁRIS FILOGENETIKAI ELEMZÉSEK EGY DISZKRÉT MATEMATIKAI

0. Kurzusok tudnivalók 1. Az anyag - csak az írott anyagban 2. Az élet molekulái - csak az írott anyagban 3. Mi az Élet? 4. A Világ keletkezése 5.

A bakteriális kommunikáció és kooperáció génjeinek elhelyezkedése ismert genomokban.

Bioinformatika - egészséges környezet, egészséges élelmiszer

Genetika. Tartárgyi adatlap: tantárgy adatai

A tantárgyelem kódja: KIT0101G. gyakorlat A tantárgyelem jellege: A tantárgyelem oktatásának ajánlott 1. félév

Bioinformatika előadás

KÉPZÉSI TÁJÉKOZTATÓ KIADVÁNY

trns-ek identitásvizsgálata új, in silico módszerrel

BIG DATA ELEMZÉSEK LEHETŐSÉGEI

Neurális hálózatok bemutató

Egy mezofil lomberdei faj, a szártalan kankalin (Primula vulgaris Huds.) európai léptékű filogeográfiája, különös tekintettel a Kárpát-medencére

0. Kurzusok tudnivalók 1. Az anyag - csak az írott anyagban 2. Az élet molekulái - csak az írott anyagban 3. Mi az Élet? 4. A Világ keletkezése 5.

A mai el!adás. Bioinformatika és genom analízis az orvostudományban (AOGENBIG_1M) Mi a bioinformatika? Pontosítjuk a definíciót

Genomikai Nemzeti Technológiai Platform (GNTP) Adatfeldolgozás, bioinformatika Munkacsoport STRATÉGIAI KUTATÁSI TERV.

Mi legyen az informatika tantárgyban?

Váci Mihály Kulturális Központ Cím: Telefon: Fax: Web: Nyilvántartásba vételi szám:

Informatika évfolyam

Etológia Emelt A viselkedés mérése. Miklósi Ádám egyetemi tanár ELTE TTK Etológia Tanszék 2018

PROKARIÓTA GENOMOK ÖSSZEHASONLÍTÓ ANALÍZISE BIOINFORMATIKAI MÓDSZEREKKEL. Doktori (Ph.D.) értekezés tézisei. Kassainé Jáger Edit Andrea

Dr. Máthéné Dr. Szigeti Zsuzsanna és munkatársai

Bioinformatika 2 1. előadás

A géntechnológiát megalapozó felfedezések

TÉRINFORMATIKA II. Dr. Kulcsár Balázs Ph.D. adjunktus. Debreceni Egyetem Műszaki Kar Műszaki Alaptárgyi Tanszék

Webmester képzés tematika oktatott modulok

Digitális írástudás kompetenciák: IT alpismeretek

TANTÁRGYI ADATLAP I. TANTÁRGYLEÍRÁS

Nem kódoló RNS-ekből potenciálisan keletkező de novo fehérjék azonosítása és elemzése DIPLOMAMUNKA

Mesterséges Intelligencia Elektronikus Almanach. Konzorciumi partnerek

Kromoszómák, Gének centromer

1A A A

A tananyag beosztása, informatika, szakközépiskola, 9. évfolyam 36

HELYI TANTERV. Informatika

Biomassza alapú bioalkohol előállítási technológia fejlesztése metagenomikai eljárással

Intelligens adatelemzés

Átírás:

A tárgy címe: Bioinformatika Kötelezően választható tárgy IV. és V. évfolyamos biológus hallgatók számára; heti 2+3 óra Előkövetelmény: Biokémia főkollégium; genetika főkollégium; alapszintű számítógépes ismeretek: szövegszerkesztés, táblázatkezelés, e-mail, web-böngésző használata Résztvevő oktatók: Dr. Patthy László, egyetemi magántanár Dr. Ponyi Tamás, egy. adjunktus, Genetikai Tanszék Dr. Tóth Gábor, tud. munkatárs, MBK Gödöllő Dr. Barta Endre, tud. munkatárs, MBK Gödöllő Elmélet Tantárgyi tematika 1. Bevezetés A bioinformatika története. A bioinformatika tárgya, alkalmazási területei ma. Genom projektek. Trendek. A molekuláris biológiában leggyakrabban használt bioinformatikai módszerek, programok, programcsomagok rövid áttekintése. Internet alapok: e-mail, telnet, ssh, ftp, WWW. Bioinformatika a világhálón. EMBnet, EBI, NCBI. 2. Bioinformatikai adatbázisok Molekuláris biológiai adatbázisok. Elsődleges szekvencia-adatbázisok. Nukleotidszekvencia adatbázisok: EMBL, GenBank, DDBJ. Fehérjeszekvencia adatbázisok: PIR, SWISS-PROT, TrEMBL. Összetett ( nem redundáns ) fehérjeszekvencia adatbázisok. Szekvencia-adatbázis formátumok. Másodlagos vagy származtatott adatbázisok. Komplex adatbázisok: térképezési genomikai adatbázisok (genomprojektek), taxonómiai filogenetikai adatbázisok (NCBI/Taxonomy, COG), funkcionális megközelítések ( Gene Ontology ), humángenetikai adatbázis (OMIM). Bibliográfiai adatbázis: PubMed. 3. Információkeresés az adatbázisokban Keresés az adatbázisok annotációiban: SRS. Integrált információkeresés: NCBI Entrez. Integrált keresés a genom-projektek eredményeiben. Genom-böngészők: Ensembl, UCSC. 4. A biológiai szekvenciaelemzés alapjai Szekvenálási adatok kezelése, ellenőrzése. Kontigok összeállítása. Restrikciós endonukleáz hasítóhelyek keresése. Primertervezés. Új szekvencia elhelyezése az elsődleges adatbázisban. 5. Szekvencia-összehasonlítások Páronkénti összehasonlítások: dot-plot. Pontozási módszerek, helyettesítési mátrixok. PAM, BLOSUM mátrixok. Páronkénti szekvenciaillesztések: optimális illesztések. Globális és lokális illesztés; dinamikus programozási algoritmusok: 1

Needleman Wunsch és Smith Waterman algoritmusok. Hézagok pontozása. 6. Hasonlósági keresések szekvencia-adatbázisokban Keresés optimális illesztési algoritmusokkal: webes implementációk. Heurisztikus keresési módszerek: FASTA és BLAST algoritmusok. Statisztikai alapok: a találatok szignifikanciájának becslése. A FASTA3 programcsomag programjai. A BLAST programok. Mikor melyik programot használjuk? A jel/zaj arány javítása. A fals pozitív találatok okai és kiszűrésük: kis összetételi komplexitású régiók, repetitív szekvenciák, vektorszennyezés. 7. Többszörös szekvenciaillesztés Módszerek. A progresszív illesztés módszere a ClustalW program példáján. Szegmens-alapú illesztés: dialign2. Motívum-alapú illesztés: MEME. Többszörös illesztések vizualizálása. 8. Molekuláris filogenetikai elemzések I. A filogenetikai elemzés áttekintése: filogenetikai szignál, filogenetikai fák. Evolúciós változások, távolságok becslése: szubsztitúciós modellek (aminosav és nukleotid). A filogenetikai rekonstrukció módszerei. Távolság-alapú módszerek: UPGMA, legkisebb négyzetek, minimum evolution, neighbor joining. 9. Molekuláris filogenetikai elemzések II. Karakter-alapú módszerek. Maximális parszimónia (MP) módszerek. Konszenzus fa. "Maximum likelihood" (ML) módszerek. MP- és ML-fák heurisztikus keresési módszerei: "branch-and-bound", NNI, SPR, TBR, SD. Statisztikai tesztek. Fák összehasonlítása, topológiai távolságok. A PHYLIP és PAUP programcsomagok. 10. Nukleinsav-szekvenciák alapján végzett predikciók Funkcionális helyek, régiók detektálása a DNS-ben. Kódoló régiók, exon intron határok predikciója. RNS másodlagos szerkezet predikciója. 11. Távoli fehérjeszekvencia-hasonlóságok kimutatása Fehérjecsalád, -domén, funkcionális hely adatbázisok és az azokban való homológiakeresés. Funkcionális predikció. Reguláris kifejezések, mintázatadatbázisok: PROSITE patterns. Motívum-adatbázisok: PRINTS, BLOCKS. Pozícióspecifikus pontozómátrixok (PSSM), profil módszerek. Iterációs keresések: PSI-BLAST, PHI-BLAST. Profil és profil-hmm (rejtett Markov modell) adatbázisok: PROSITE profile, Pfam, SMART. Klaszterező adatbázisok: ProDom. Integrált adatbázisok és keresőrendszerek: InterPro, DART. 12. Fehérjeszerkezet, fehérjeszerkezet előrejelzés I. A fehérjeszerkezet különböző szintjei. Fehérjegeometria. Fehérje családok, szupercsaládok. Feltekeredés (folding): szekvenciában kódolt információk, rejtett információk, fold családok. Strukturális osztályozás. Fehérjeszerkezet adatbázisok: PDB, MMDB, SCOP, CATH. Fehérje szerkezet összehasonlító módszerek: PRIDE, genetikus algoritmusok. Strukturális hasonlóság keresések, illesztés szerkezet alapján. A térszerkezeti adatok megjelenítése. Reprezentációs formák. A leggyakrabban használt megjelenítő szoftvercsomagok. 2

13. Fehérjeszerkezet előrejelzés II. Modellezés Modellezés a gyakorlatban. Statisztikai módszerek: Chou & Fasman előrejelzés; másodlagos szerkezet előrejelzés, ideghálózaton alapuló rendszerek; motívum és domén felismerés; kis komplexitású régiók felismerése; transzmembrán régiók keresése. Homológia modellezés. Molekula mechanikai/dinamikai módszerek. Ab initio módszerek. A modellek megbízhatósága. Alkalmazási terület. 14. Génexpressziós elemzések. Proteomika EST projektek, EST klaszterezés. DNS-chip adatok klaszteranalízise. Fehérjeazonosítás: 2D gélelektroforézis, tömegspektrometriai eredmények értékelése. Fehérjeinterakciós térképek. 3

Gyakorlat 1. A UNIX/Linux operációs rendszer használata Távoli elérés: ssh, telnet. Állománykezelés; állományok mozgatása számítógépek között: scp, sftp, ftp, e-mail. Programfuttatás; program be- és kimenetének átirányítása. Számítógéphálózati alapismeretek. 2. Bioinformatikai adatbázisok A három elsődleges adatbázis honlapjának a megismerése; mezőstruktúrák összehasonlítása. A fehérjeadatbázisok megismerése, összehasonlítása. A legjelentősebb doménkönyvtárak bemutatása. Példák komplex adatbázisokra. 3. Információkeresés az adatbázisokban I. Az NCBI-Entrez rendszer bemutatása. Keresés a PubMed bibliográfiai adatbázisban. Linkek a PubMed adatbázisból más Entrez adatbázisokba. Keresés egyéb Entrez adatbázisokban. 4. Információkeresés az adatbázisokban II. Az SRS keresőrendszer működésének bemutatása. Egyszerű keresések az SRS-ben. Bonyolultabb keresések az SRS-ben. Külső programok használata az SRS-ből. Szekvenciakinyerés az SRS segítségével. 5. A számítógépes szekvenciaelemzés alapjai Szekvenciakezelés, különböző szekvenciaformátumok. Számítógépes szekvenciaelemző programok, programcsomagok működésének bemutatása, indításuk, kezelésük. Szekvenciák kezelése az EMBOSS programcsomagban. 6. Szekvenáláshoz kapcsolódó számítógépes feladatok Számítógépes primertervezés bemutatása. Restrikciós hely meghatározó programok bemutatása. Automata szekvenátor adatainak feldolgozása. Szennyező szekvenciák eltávolítása. Szekvenciák összerakása. Új szekvenciák beküldése weben keresztül egy elsődleges adatbankba. 7. Genom-adatbankok használata Teljes genomszekvenciák a weben. Az Ensemble genom-böngésző rendszer bemutatása; Keresések teljes genomokban. Genom-régiók összehasonlítása. 8. Szekvencia-összehasonlítások, szekvenciaillesztések Dot-plot módszerek. Globális és lokális illesztések (DNS DNS ill. fehérje fehérje). Exon intron határok megállapítása cdns és genomi DNS illetve fehérje és genomi DNS illesztése révén. Programok az EMBOSS csomagban és a világhálón. 9. Hasonlósági keresések szekvencia-adatbázisokban A FASTA3 és BLAST programok használata, paraméterezése. Lokális BLAST adatbázis formázása. Pontozómátrixok, hézagbüntetések megválasztása. Kis komplexitású és ismétlődő szekvenciák maszkolása. Keresések lokális és távoli adatbázisokban. Az eredmények értékelése. 10. Többszörös szekvenciaillesztés. Fehérjék doménszerkezetének megállapítása A számítógépes programok bemutatása, alkalmazhatóságuk összehasonlítása. Nukleinsav- és fehérjeszekvenciák illesztése. Konzervált régiók keresése az illesztett 4

szekvenciákban. A fehérjedomén-, mintázat- és motívumadatbázisok használatának bemutatása. Ismert domének, motívumok keresése fehérjékben. Illesztett fehérjedomén szekvenciákból új profil-hmm készítése, az adott motívumot tartalmazó fehérjék keresése a SWISS-PROT adatbázisban. PSI-BLAST keresések. 11. Molekuláris filogenetikai elemzések A PHYLIP programcsomag és a PAUP program működésének bemutatása. Más filogenetikai programok megismertetése. Filogenetikai rekonstrukció elvégzése különböző (távolság-alapú, MP, ML) módszerekkel. Bootstrap elemzés. 12. Fehérjeszerkezet Ismerkedés a PDB adatbázissal: szerkezetkeresés, letöltés. Térszerkezeti adatok megjelenítésére alkalmas programok: ICMLite, SwissPDBViewer, Rasmol. Az egyes régiók, aminosavak, oldalláncok kiemelése. A gyakorlaton használt szoftverek: EMBOSS (Chou Fasman predikcióhoz), ICMLite (Linux), SwissPDBViewer (Linux), Rasmol (Windows). 13. Fehérjeszerkezet előrejelzés Szerkezet előrejelzés homológia modellezéssel: SwissPDBViewer alkalmazása homológia modell létrehozására; Ismeretlen fehérjeszekvenciából modell létrehozása; A modell minőségének jellemzése (Ramachandran plot). Szerkezet előrejelzés szekvencia homológia hiányában: Transzmembrán régió keresése DAS algoritmus alapján; Alacsony komplexitású részek keresése SEG programmal; Domén felismerés az SBASE programmal; Másodlagos szerkezet előrejelzés a PHD programmal; A fenti eredmények összevetésével a szekvencia és szerkezet illesztése; Fold felismerés (HOMSTRAP). A gyakorlaton használt szoftverek: SwissPDBViewer (ICMLite, Ramachandran), DAS (transzmembrán régió előrejelzés), SEG (alacsony komplexitású régió előrejelzés), SBASE (domén felismerés), PHD (másodlagos szerkezet előrejelzés), HOMSTRAP (fold felismerés). A gyakorlatok értékelése: Minden gyakorlatról jegyzőkönyv benyújtása elektronikus formában. 5