Bioinformatika 2 1. előad



Hasonló dokumentumok
Bioinformatika 2 1. előadás

Bevezetés a bioinformatikába. Harangi János DE, TEK, TTK Biokémiai Tanszék

Bioinformatika 2 6. előadás

Bioinformatika 2 2. előadás

Bioinformatika és genomanalízis az orvostudományban. Biológiai adatbázisok. Cserző Miklós 2018

Bioinformatika előadás

Bioinformatika előad

Bioinformatika 2 4. előadás

3. Sejtalkotó molekulák III.

A tárgy címe: Bioinformatika

Orvosi Genomtudomány 2014 Medical Genomics Április 8 Május 22 8th April 22nd May

Human genome project

Több oxigéntartalmú funkciós csoportot tartalmazó vegyületek

A fehérjék hierarchikus szerkezete

Bioinformatika 2 5. előadás

Juhász Angéla MTA ATK MI Alkalmazott Genomikai Osztály SZEKVENCIA ADATBÁZISOK

A genetikai lelet értelmezése monogénes betegségekben

Bioinformatika előadás

Bioinformatika előadás

MEDICINÁLIS ALAPISMERETEK AZ ÉLŐ SZERVEZETEK KÉMIAI ÉPÍTŐKÖVEI AZ AMINOSAVAK ÉS FEHÉRJÉK 1. kulcsszó cím: Aminosavak

BIOINFORMATIKA Ungvári Ildikó

NMR a peptid- és fehérje-kutatásban

Miben különbözünk az egértől? Szabályozás a molekuláris biológiában

Genomadatbázisok Ld. Entrez Genome: Összes ismert genom, hierarchikus szervezésben (kromoszóma, térképek, gének, stb.)

FEHÉRJÉK A MÁGNESEKBEN. Bodor Andrea ELTE, Szerkezeti Kémiai és Biológiai Laboratórium. Alkímia Ma, Budapest,

A DNS szerkezete. Genom kromoszóma gén DNS genotípus - allél. Pontos méretek Watson genomja. J. D. Watson F. H. C. Crick. 2 nm C G.

3. Sejtalkotó molekulák III. Fehérjék, enzimműködés, fehérjeszintézis (transzkripció, transzláció, poszt szintetikus módosítások)

TDK lehetőségek az MTA TTK Enzimológiai Intézetben

Bakteriális identifikáció 16S rrns gén szekvencia alapján

Fehérjeszerkezet analízis. Fehérjeszerkezet analízis. Fehérjeszerkezet analízis. Fehérjeszerkezet analízis. Fehérjeszerkezet analízis

10. Genomika 2. Microarrayek és típusaik

DNS-szekvencia meghatározás

A fehérjék hierarchikus szerkezete

Cserző Miklós Bioinformatika és genomanalízis az orvostudományban. Integrált biológiai adatbázisok

TEMATIKA Biokémia és molekuláris biológia IB kurzus (bb5t1301)

Semmelweis Egyetem / Élettani Intézet / Budapest. Bioinformatika és genomanalízis az orvostudományban. Bevezetés. Cserző Miklós 2018

Gerinces és növényi ortológ promóter adatbázisok fejlesztése és elemzése. Eötvös Loránd Tudományegyetem Természettudományi Kar Biológia Doktori Iskola

A MOLEKULÁRIS BIOLÓGIA ISMERETÁBRÁZOLÁSI PROBLÉMÁI

Fehérje expressziós rendszerek. Gyógyszerészi Biotechnológia

The nontrivial extraction of implicit, previously unknown, and potentially useful information from data.

12/4/2014. Genetika 7-8 ea. DNS szerkezete, replikáció és a rekombináció Hershey & Chase 1953!!!

2. Ismert térszerkezetű transzmembrán fehérjék adatbázisa: a PDBTM adatbázis. 3. A transzmembrán fehérje topológiai adatbázis, a TOPDB szerver

Fehérjeszerkezet, és tekeredés

A bioinformatika gyökerei

A HUMÁN GENOM PROJEKT Sasvári-Székely Mária* Semmelweis Egyetem, Orvosi Vegytani, Molekuláris Biológiai és Pathobiokémiai Intézet

Hamar Péter. RNS világ. Lánczos Kornél Gimnázium, Székesfehérvár, október

Gyakorlati bioinformatika

Bioinformatika 2 10.el

Phenotype. Genotype. It is like any other experiment! What is a bioinformatics experiment? Remember the Goal. Infectious Disease Paradigm

Biomassza alapú bioalkohol előállítási technológia fejlesztése metagenomikai eljárással


19.Budapest Nephrologiai Iskola/19th Budapest Nephrology School angol 44 6 napos rosivall@net.sote.hu

Szénhidrátkémiai kutatások bioinformatikai esetek. Dr. Harangi János DE, TTK, Biokémiai Tanszék

ADATBÁNYÁSZAT I. ÉS OMICS

Fehérjék rövid bevezetés

2. Aminosavak - Treonin

A genomikai oktatás helyzete a Debreceni Egyetemen

transzláció DNS RNS Fehérje A fehérjék jelenléte nélkülözhetetlen minden sejt számára: enzimek, szerkezeti fehérjék, transzportfehérjék

A géntechnológiát megalapozó felfedezések

Bioinformatika 2 9. előadás

ÚJ GENERÁCIÓS SZEKVENÁLÁS

Genetika. Tartárgyi adatlap: tantárgy adatai

INFORMATIKA EMELT SZINT%

Bevezetés a rendszerbiológiába

Mérnök informatikus (BSc) alapszak levelező tagozat (BIL) / BSc in Engineering Information Technology (Part Time)

A fehérjék hierarchikus szerkezete. Szerkezeti hierarchia. A fehérjék építőkövei az aminosavak. Fehérjék felosztása

13. RNS szintézis és splicing

SOLiD Technology. library preparation & Sequencing Chemistry (sequencing by ligation!) Imaging and analysis. Application specific sample preparation

Molekuláris genetikai vizsgáló. módszerek az immundefektusok. diagnosztikájában

ELTE Doktori Iskola Evolúciógenetika, evolúciós ökológia, konzervációbiológia program Programvezető: Dr. Szathmáry Eörs, akadémikus, egyetemi tanár

Hálózati modellek alkalmazása a molekuláris biológia néhány problémájára. Doktori (PhD) értekezés tézisei. Ágoston Vilmos

Bioinformatika előad

Dobzhansky: In Biology nothing makes sense except in the light of Evolution.

SZTE-ELTE PROTEOMIKAI INNOVÁCIÓ: KONCEPCIÓ, EREDMÉNYEK, JÖVŐKÉP

TÉMAKÖRÖK. Ősi RNS világ BEVEZETÉS. RNS-ek tradicionális szerepben

Biológus MSc. Molekuláris biológiai alapismeretek

NÖVÉNYGENETIKA. Az Agrármérnöki MSc szak tananyagfejlesztése TÁMOP /1/A

BEVEZETÉS AZ INTERNET ÉS A WORLD WIDE WEB VILÁGÁBA. Kvaszingerné Prantner Csilla, EKF

Aminosavak általános képlete NH 2. Csoportosítás: R oldallánc szerkezete alapján: Semleges. Esszenciális aminosavak

4. FEHÉRJÉK. 2. Vázanyagok. Az izmok alkotórésze (pl.: a miozin). Inak, izületek, csontok szerves komponensei, az ún. vázfehérjék (szkleroproteinek).

Szerződéses kutatások/contract research

7. Fehérjeszekvenciák és térszerkezetek analízise.

Transzláció. Szintetikus folyamatok Energiájának 90%-a

Elválasztástechnikai és bioinformatikai kutatások. Dr. Harangi János DE, TTK, Biokémiai Tanszék

A doktori értekezés tézisei. A növényi NRP fehérjék lehetséges szerepe a hiszton defoszforiláció szabályozásában, és a hőstressz válaszban.

Molekuláris biológiai módszerek alkalmazása a biológiai környezeti kármentesítésben

Conserved ortholog set (COS) markerek térképezése Aegilops kromoszómákon

NÖVÉNYI GENOMIKA JÓRI BALÁZS

A minimális sejt. Avagy hogyan alkalmazzuk a biológia több területét egy kérdés megválaszolására

Human Genome Project, évvel a tervezett befezés előtt The race is over, victory for Craig Venter. The genome is mapped* - now what?

Molekuláris biológiai eljárások alkalmazása a GMO analitikában és az élelmiszerbiztonság területén

Transzgénikus. nikus állatok. Transzgénikus nikus minden olyan állat, melynek genomja emberi közremk bejuttatott DNS-t t tartalmaz.

Felhő használata mindennapi alkalmazások futtatására. Németh Zsolt MTA SZTAKI

A sejtek élete. 5. Robotoló törpék és óriások Az aminosavak és fehérjék R C NH 2. C COOH 5.1. A fehérjeépítőaminosavak általános

ELIXIR-Magyarország: lehetőségek és kihívások: Bálint Bálint L, Debreceni Egyetem, ELIXIR-Magyarország oktatási koordinátor

fájl-szerver (file server) Az a számítógép a hálózatban, amelyen a távoli felhasználók (kliensek) adatállományait tárolják.

CHO H H H OH H OH OH H CH2OH HC OH HC OH HC OH CH 2

Gyakorlati tudnivalók nyertes pályázó és bíráló szemszögéből Prof. Dr. Dinnyés András,

Poligénes v. kantitatív öröklődés

Átírás:

1. előad adás Prof. Poppe László BME Szerves Kémia és Technológia Tsz. Bioinformatika proteomika Előadás és gyakorlat 2009. 02. 13.

Bioinformatika Mi az? Bioinformatika: Tágabb értelemben: biológiai információ tárolása, értelmezése és elemzése számítógépes módszerek felhasználásával. Szűkebb értelemben: biológiai szekvenciaadatok illetve térszerkezeti adatok kezelése és elemzése. 2 2009. 02. 13.

Bioinformatika Mi az? Bioinformatika Részletesebb definíció - Oxford English Dictionary: (Molecular) bio informatics: bioinformatics is conceptualising biology in terms of molecules (in the sense of physical chemistry) and applying "informatics techniques" (derived from disciplines such as applied maths, computer science and statistics) to understand and organise the information associated with these molecules, on a large scale. In short, bioinformatics is a management information system for molecular biology and has many practical applications. A bioinformatika a biológia (fizikai kémiai értelemben vett) molekulák segítségével történő értelmezése és (az alkalmazott matematikából, számítógépes tudományból, statisztikából származó) "informatikai módszerek" felhasználása az e molekulákkal kapcsolatos információ nagy léptékben történő megértésére és rendszerezésére. A bioinformatika röviden a molekuláris biológia sok gyakorlati alkalmazással bíró információkezelési rendszere. 3 2009. 02. 13.

Bioinformatika Mi az? Bioinformatika Számításos biológia Részletesebb definíciók - definition Committee, National Institute of Mental Health : Bioinformatics: Research, development, or application of computational tools and approaches for expanding the use of biological, medical, behavioral or health data,including those to acquire, store, organize, archive, analyze, or visualize such data. Bioinformatika: Számítógépes eszközök és módszerek kutatása, fejlesztése és alkalmazása biológiai, orvosi, viselkedéstudományi és orvosi adatok kinyerése, tárolása, rendszerezése, archiválása, elemzése ill. megjelenítése céljából Computational Biology: The development and application of data-analytical and theoretical methods, mathematical modeling and computational simulation techniques to the study of biological, behavioral, and social systems. Számításos biológia: Adatelemzési és elméleti módszerek fejlesztése és alkalmazása, matematikai modellezés és számítógépes szimulációs eljárások biológiai, viselkedéstudományi és szociális rendszerek tanulmányozására. 4 2009. 02. 13.

Rövid tematika A bioinformatika definíciója és története Szekvencia analízis nukleotid és fehérjeszekvenciák, az ezek közti összefüggések, páronkénti és többszörös összerendelés, filogenetikai analízis A szekunder szerkezet előrejelzése szekvencia alapján Domén analízis, funkció előrejelzése szekvencia alapján A genetikai és szerkezeti adatok összefüggése a molekuláris funkcióval és a metabolizmusban betöltött szereppel A fehérjék térszerkezetével összefüggő kérdések. A térszerkezet létrejöttéért felelős kölcsönhatások. A fehérjék szerkezeti osztályai. A térszerkezet meghatározás módszerei (proteinkrisztallográfia, NMR) A fehérjék 3D szerkezetének modellezésére alkalmas módszerek. Homológia modellezés alapmódszerei: templát alalpú és ab initio modellezési módszerek Fehérjék kölcsönhatása kis molekulákkal és biológiai makromolekulákkal, fehérjeszerkezetek dinamikája Proteomikai kérdésekkel összefüggő adatbázisok (nukleotid és fehérje szekvencia, szerkezeti adatbázisok, funkcionális adatbázisok) Bioinformatikai programok és programrendszerek proteomikai alkalmazásokhoz (önálló és Web alapú alkalmazások) Bioinformatika néhány gyakorlati alkalmazása 5 2009. 02. 13.

Bioinformatika Előzm zmények 1951 - Pauling & Corey: az alfa-hélix és beta-redő szerkezete 1953 - Watson & Crick: DNS kettős spirál (hélix) szerkezete (Franklin & Wilkins röntgenszerkezete alapján). 1954 - Perutz's csoport: nehéz atom módszer a protein krisztallográfia fázisproblémájára 1955 - F. Sanger: Az első protein szekvencia (bovine insulin). 1958 J. Kilby (Texas Instr.): Az első integrált áramkör / ARPA (Advanced Research Projects Agency, USA) megalakul 1962 - Pauling elmélete a molekuláris evolúcióról 1965 - Margaret Dayhoff : Atlas of Protein Sequences 1969 - ARPANET: az UCSB (Stanford) és az UCLA (University of Utah) számítógépeinek összekötése. 1970 - Needleman-Wunsch algoritmus: szekvencia összhasonlításra. 1971 - Ray Tomlinson (BBN): az e-mail 1972 - Paul Berg és csoportja: az első rekombináns DNS molekula 1973 - A Brookhaven Protein DataBank (PDB) bejelentése / Robert Metcalfe (Harvard University) - Ethernet. 1974 - Vint Cerf & Robert Khan: az "internet" és a Transmission Control Protocol (TCP). 1975 - Microsoft Co. (Bill Gates & Paul Allen) / 2D elektroforézis (P. H. O'Farrell) 1976 - Unix-To-Unix Copy Protocol (UUCP) - Bell Labs / Southern Blot technika (E. M. Southern). 1977 - A Brookhaven PDB teljes leírása / DNS szekvenálás (A. Maxam, W. Gilbert & F. Sanger) és szoftver (Staden) 1978 Az első Usenet kapcsolat (T. Truscott, J. Ellis & S. Bellovin). 6 2009. 02. 13.

Bioinformatika Kezdetek 1980 -Az első teljes gén szekvencia (FX174-5386 bázis pár / 9 protein) / Többdimenziós NMR protein szerkezet meghatározásra (Kumar, A.; Ernst, R.R.; Wüthrich, K.). 1981 - A Smith-Waterman algoritmus (szekvencia összerendelés) / IBM - Personal Computer (PC) / A szekvencia motívum koncepció (Doolittle) 1982 - Genetics Computer Group (GCG) - Wisconsin Suite molekuláris biológiai eszközök / GenBank Release 3 / Lambda fág genome szekvenálása 1983 - Compact Disk (CD) / Szekvencia adatbázis kereső algoritmus (Wilbur-Lipman) / DNS klón (cosmid) könyvtárak / PCR (Polymerase Chain Reaction) a DNS analízis lehetővé válik 1984 - Jon Postel: Domain Name System (DNS) / Macintosh (Apple Computer) 1985 - A FASTP/FASTN algoritmus / A Human Genome Initiative lehetőségének felvetése 1986 - A Human Genome Initiative kezdete / A "Genomics" elnevezés / A SWISS-PROT adatbázis megalapítása 1987 - Mesterséges élesztő kromoszóma (YAC) / Az E. coli feltérképezése / Perl (Practical Extraction Report Language) / NIH NIGMS - genome projektek finanszírozásának kezdete 1988 - National Center for Biotechnology Information (NCBI) megalakulása / EMBnet network az adatbázisok terjesztésére / A Human Genome Intiative elindul / A FASTA algoritmus (Pearson and Lupman) 1989 - Oxford Molceular Group,Ltd.(OMG) megalakul. Termékeik: Anaconds, Asp, Cameleon (molekula modellezés, drug design, protein design). 7 2009. 02. 13.

Bioinformatika Kibontakozás 1990 - A BLAST program (Altschul, et.al.) / (M. Levitt, C. Lee): Look & SegMod (molecular modeling and protein design) / HGP terv - USA Congress (15 éves projekt kezdete) 1991 - Genf (CERN) - World Wide Web / Expressed sequence tags (ESTs) / Humán kromoszóma térkép adattár (GDB) megalakulása 1992 - Humán genom - Kisfelbontású genetikai térkép 1993 - IMAGE konzorcium összehangolt cdna génszekvenálás és térképezés / LBNL - új transposonsegített kromoszóma-szekvenálás / GRAIL Internetes szekvencia-interpretáló szolgáltatás (ORNL) 1994 - Netscape Co (Navigator) / PRINTS database: protein motivumok (Attwood & Beck) / EMBL European Bioinformatics Institute / Másod-generációs DNS klón könyvtárak az összes humán kromoszómáról 1995 -Az első bakteriális (Haemophilus influenzea) genom (1.8) szekvenálása ( Fleischmann et al) / A legkisebb baktérium (Mycoplasma genitalium) szekvenálása - az önálló léthez szükséges legkevesebb gén 1996 -A sütőélesztő (Sacharomyces cerevisiae 12.1 Mb) genom / A Prosite adatbázis (Bairoch, et.al) / Affymetrix az első kereskedelmi DNS chip 1997 -Az E. coli (4.7 Mbp) genom / National Human Genome Research Institute (NHGRI) 1998 - A Swiss Institute of Bioinformatics megalakulása 1999 -Az első teljes humán kromoszóma szekvencia 8 2009. 02. 13.

Bioinformatika Közelmúltlt 2000 - Bakteriális (Pseudomonas aeruginosa, 6.3 Mbp), növényi (A. thaliana, 100 Mb) és rovar (Drosophila melanogaster, 180 Mbp) genom szekvenálása / További humán kromoszómák szekvenálása 2001 - A Humán genom (3000 Mbp) közlése / Több humán kromoszóma komplett szekvenálása a Human Genome Project magas minőségi követelményei szerint 2002 - Structural Bioinformatics és GeneFormatics egyesülnek / Mouse Genome Sequencing Consortium az egér genom nyers szekvenciája 2003 - A Human Genome Project befejezése: 2003 április 2004 - Rat Genome Sequencing Consortium: a barna norvég patkány (Rattus norvegicus) genom 9 2009. 02. 13.

Neutrális-Apoláris 3-betűs 1-betűs Glicin Gly G L-Alanin Ala A L-Valin Val V L-Izoleucin Ile I L-Leucin Leu L L-Fenilalanin Phe F L-Prolin Pro P L-Metionin Met M Neutrális-Poláris L-Szerin Ser S L-Treonin Thr T L-Tirozin Tyr Y L-Triptofán Trp W L-Aszparagin Asn N L-Glutamin Gln Q L-Cisztein Cys C Savas L-Aszparaginsav Asp D L-Glutaminsav Glu E Bázikus L-Lizine Lys K L-Arginin Arg R 10 2009. 02. L-Hisztidin 13. His H

Fehérj rjék Szerkezet - Feltekeredés Protein szerkezets - A fehérj rjék szerkezeti szintjei Primer szerkezet Szekunder szerkezet Tercier szerkezet Kvaterner szerkezet ( hajtogatás-mentes állapot) (α-hélix, β-redő) (domének, alegységek) (több fehérjelánc) Intra- és intermolekuláris diszulfid kötések 11 2009. 02. 13.

Fehérj rjék Primer és szekunder szerkezet Primer szerkezet MNKKEWEEKYVKPLLERSPERKKEFKTSSGIVVDRLYTPEDVEIDYENKL GYPGVYPFTRGVYPTMYRGRLWTMRQYAGFGTAEETNRRYRYLLEQGQTG LSVAFDLPTQIGYDSDHPMALGEVGKVGVAIDTIEDMEILFNGIPLGKVS TSMTINSTCAQILSMYVAVAEKQGVERANLRGTVQNDMLKEYIARGTYIF PPEPSLRLATDIIMFCAKEMPKWNSISISGYHMEEAGATPVQEVAFTLAD GITYVEKVIERGMDVDSFAPRLSFFFAAGNNFLEEIAKFRAARRLWARIM KERFNAKNPRSMMLRFHVQTAGCTLTAQQPENNIVRVALQALAAVLGGCQ SLHTNSFDEALCLPTEKAVRIALRTQQIIAEESGVADVVDPLGGSYYIEW LTDRIEEEAMKYIEKIDEMGGMIKAIESGYVQREIQKSAYEKQKAIDEGE ITVVGVNKYQIEEEIQIELLRVDKAVVEKQIRRLQEFRKNRDAKKVEEAL RLRKAAEKEDENLMPYVLDAVKARATLGEMTDALRDVFGEFRAPEIF (tk. az aminosav sorrend) Szekunder szerkezet 12 2009. 02. 13. DNS aminosav sorrend feltekeredés

Tercier Fehérj rjék cier és kvaterner szerkezet Tercier szerkezet Kvaterner szerkezet Tercier és kvaterner szerkezet aktív konform nformáció Enzimek (katalítikus fehérjék): pozitív katalízis (a szubsztrát illeszkedik az aktív hely katalítikus részeihez) negatív v katalízis (a szubsztrát védelme, biológiai védőcsoport ) 13 2009. 02. 13.

Fehérj rjék Az enzimek aktív v centruma A karboxipeptidáz A enzim aktív v centruma; (a) az aktív centrum sematikus megjelenítése; (b) a fehérje aktív centruma a Cbz-Gly-Phe szubsztráttal (abban a helyzetben ahogy az aktív centrumban feltehetóen elhelyezkedik). 14 2009. 02. 13.

A fehérje expressziót t követk vető folyamatok Proteinek feltekeredése és s lebomlása 15 2009. 02. 13.

A genetikai kódk A DNS szerkezete 16 2009. 02. 13.

A genetikai kódk A DNS szerkezete 17 2009. 02. 13.

Gén expresszi zió A központik dogma 18 2009. 02. 13.

Gén expresszi zió Transzk zkripció 19 2009. 02. 13.

A szabványos genetikai kódk A protein - DNS irányban a kódk redundáns ns 20 2009. 02. 13.

Gén expresszió Transzk zkripció transzláció folyamata 21 2009. 02. 13.

Gén n expresszió A transzláci ció folyamata 22 2009. 02. 13.

Gén expresszió Olvasási si keretek A start-stop stop kódok fontossága 23 2009. 02. 13.

Gén multiplikáci ció DNS in n vitro multiplikáci ciója PCR segíts tségével Primerek (nagy felesleg) és AS k+trna egyszálú DNS A PCR ciklus: 1. - DNS szétválás (~90 o C) 2. - Komplementer szál szintézis (~70 o C) hőstabil polimerázzal Eredmény: exponenciális sokszorozódás 24 2009. 02. 13.

Gén multiplikáci ció Gének klónoz nozása és multiplikáci ciója Desired gene Cleaved plasmid Wild type host cell Plasmid with the desired gene Recombinant cell 25 2009. 02. 13.

A bioinformatika céljaic Adatbázisok készítése és fenntartása. Az adatok elrendezése szervezése úgy, hogy a kutatók a meglévő információt könnyen elérjék és hozzáadhassanak újat. Eljárások, módszerek kidolgozása adatok elemzésére. Az adatok elemzés nélkül haszontalanok. A kidolgozott eszközök és módszerek alkalmazása az adatok elemzésére, és az eredmények biológiai értelmezése. 26 2009. 02. 13.

A biológiai információ típusai és a bioinformatikai módszerek Az adatok forrása Nyers DNS szekvenciák Fehérjeszekvenciák Makromolekuláris szerkezetek (DNS, RNS, protein) Az adathalmaz mérete 50 millió szekvencia, 60 milliárd bázis 1 600 000 szekvencia (egyenként kb. 300 aminosav) 50 000 szerkezet (egyenként kb. 1000 atom koordinátái) Bioinformatikai témák Kódoló és nem kódoló régiók Intronok és exonok Géntermékek predikciója Igazságügyi elemzések Szekvenciaösszehasonlítás Többszörös szekvenciaillesztés Konzerválódott szekvenciamotívumok 3D szerkezet illesztések Fehérjegeometriai mérések Felszín, térfogat alak számítás Intermolekuláris kölcsönhatás Molekulaszimulációk (energiafüggvény, molekuláris mozgások, dokkolás) 27 2009. 02. 13.

A biológiai információ típusai és a bioinformatikai módszerek Az adatok forrása Genomok Génexpressziós adatok Egyéb: Szakirodalom Anyagcsere útvonalak Az adathalmaz mérete Kb. 1000 teljes genom (egyenként 1,6 millió - 3 milliárd bázis) Legnagyobb: kb. 20 időpont az élesztő kb. 6000 génjénél Kb. 35 millió szakcikk Bioinformatikai témák Ismétlődések jellemzése Szerkezet - gén hozzárendelés Filogenetikai analízis Genom méretű felmérések (pl. anyagcsere útvonalak ) Betegségek és gének összefüggésének vizsgálata Expressziós mintázatok korrelációja Expresszió kapcsolata szerkezeti és biokémiai adatokkal Elektronikus könyvtárak / automatikus irodalmazás Tudásadatbázisok Reacióút szimulációk 28 2009. 02. 13.

Adatcsoportosítás hasonlóságok alapján Valós biológiai hasonlóságok alapján az információ nagy része csoportokba rendezhető ismétlődő szekvenciarészletek a genomban a gének funkció szerint csoportosíthatóak (pl. enzimhatás vagy anyagcsere útvonalak) különböző fehérjéknek gyakran hasonló a szekvenciájuk az alapvető fehérjeszerkezetek száma korlátos (becslések szerint 1000 és 10 000 között) A biológiai rendszerek véges számú alkotórészből állnak 29 2009. 02. 13.

Mintázatfelismerés és predikció A bioinformatika két alapvető művelete a mintafelismerés és a predikció Mintafelismerés: a hasonlóságok megtalálása A már ismert, hasonló funkciójú/szerkezetû fehérjéket megvizsgálva megkeresünk valamely, a funkcióra/szerkezetre jellemző, konzerválódott sajátosságot Ezt használjuk fel új szekvenciák funkciójának/szerkezetének azonosítására Feltétel: az új szekvencia olyan fehérjéhez tartozzon, amihez hasonlót már "láttunk" Predikció: A funkció vagy a térszerkezet megjóslása, hasonlóság alapján vagy ab initio módon A bioinformatika alapóhaja - szekvenciából megjósolt térszerkezet 30 2009. 02. 13.

Szekvenciából jósolt térszerkezet problémája MNKKEWEEKYVKPLLERSPERKKEFKTSSGIVVDRLYTPEDVEIDYENKL GYPGVYPFTRGVYPTMYRGRLWTMRQYAGFGTAEETNRRYRYLLEQGQTG LSVAFDLPTQIGYDSDHPMALGEVGKVGVAIDTIEDMEILFNGIPLGKVS TSMTINSTCAQILSMYVAVAEKQGVERANLRGTVQNDMLKEYIARGTYIF PPEPSLRLATDIIMFCAKEMPKWNSISISGYHMEEAGATPVQEVAFTLAD GITYVEKVIERGMDVDSFAPRLSFFFAAGNNFLEEIAKFRAARRLWARIM KERFNAKNPRSMMLRFHVQTAGCTLTAQQPENNIVRVALQALAAVLGGCQ SLHTNSFDEALCLPTEKAVRIALRTQQIIAEESGVADVVDPLGGSYYIEW LTDRIEEEAMKYIEKIDEMGGMIKAIESGYVQREIQKSAYEKQKAIDEGE ITVVGVNKYQIEEEIQIELLRVDKAVVEKQIRRLQEFRKNRDAKKVEEAL RLRKAAEKEDENLMPYVLDAVKARATLGEMTDALRDVFGEFRAPEIF Felgombolyodás: az aminosavsorrend meghatározza a térszerkezetet, de máig sem értjük, hogyan Csak a másodlagos szerkezet jósolható korlátozott megbízhatósággal Ez így marad még a közeli jövőben is 31 2009. 02. 13.

A 2D 3D adatok különbk nbözősége Az ismert fehérjeszekvenciák és az ismert fehérje térszerkezetek száma jelentősen eltérő arányban nő Nagy információs deficit fontos szerep jut a bioinformatikának Kb. 1000 több szekvencia, mint 3D szerkezet Kb. 50 000 000 ismert szekvencia, kb. 50 000 egyedi térszerkezet Az arány fokozatosan nő (genom programok) [percenként egy új szekvencia, míg max. napi 5 új szerkezetet] 32 2009. 02. 13.

Genom projektek Genom szekvenálás BAC to BAC szekvenálás Eukarioták (kb. 90 kész genom): Élesztő Caenorhabditis elegans (féreg) Drosophila melanogaster (muslica) Arabidopsis thaliana (lúdfû) Ember Egyéb: kb. 800 baktérium kb. 50 archeon >100 organellum több száz vírus és fág whole genom shotgun szekvenálás 33 2009. 02. 13.

Szekvenciaanalízis zis A bioinformatika legfontosabb eljárása: új (ismeretlen szerkezetû/funkciójú fehérjéhez tartozó) szekvenciához hasonló keresáse a már ismert szerkezetű / funkciójú fehérjék szekvenciái között. Szekvenciák összerendezése (vagy illesztése) (alignment): Szekvenciaazonosság: az összerendezésben az azonos aminosavpárok százalékos aránya A szekvenciaazonosság csökkenésével a funkció/szerkezet átvihetősége csökken 34 2009. 02. 13.

Szekvenciaanalízis zis 35 2009. 02. 13.

M. J. Foster: Micron 2002, 33, 365-384. Szekvencia egyezés s fokának jelentősége A szekvencia egyezés s foka: <30 %: nem megfelelő modellek 30-60 %: megfelelő modellek, amelyek megbízhatatlan régiókkal rendelkeznek >60 %: igen jó minőségű modellek, amelyeknél C α átlagos eltérése a kísérleti értéktől kisebb, mint 1Å A fibroblasz növekedési faktor modelljének (a patkány GF keratinocita szerkezete alapján, 40% egyezés) összehasonlítása kísérleti szerkezetével (röntgen). 36 2009. 02. 13.

A homológia típusait A homológia két k t típusat Ortológia: két gén ortológ, ha két különbözõ fajban találhatóak, és egy közös ős génből származnak, mely a két faj közös ősében volt jelen. Ugyanazt a funkciót szolgálják, a két fajban. Példa: karboxil észteráz (ill. génje) az emberben és a sertésben. Paralógia: két gén paralóg, ha ugyanabban az organizmusban találhatóak, és egy közös ős génből génduplikáció és azt követő divergens evolúció útján alakultak ki. Többnyire különböző, de egymással összefüggésben lévő funkciójuk van. Példa: a hisztidin bioszintézis enzimei (ill. ezek génjei) emberben (nagyon hasonló szerkezetûek, de más más reakciót katalizálnak). 37 2009. 02. 13.

M. J. Foster: Micron 2002, 33, 365-384. Az illesztési si (threading) probléma Szerkezet: konzervált régiók változó régiók Illesztési (alignment) módszerek Szerkezeti finomítás túlfinomítás (over-refinement) A szerkezet minőségének értékelése (PROCHECK / WhatIf...) 1CPC 2FAL Nagyfokú szerkezeti hasonlóság kis mértékű szekvencia egyezés esetében is megfigyelhető Összehasonlítás a C-fikociamin (1CPC) és a tengeri nyúl mioglobin (2FAL) megfelelő régiói között 38 2009. 02. 13.

Bioinformatikai webhelyek EMBL, SRS NCBI (Medline, Genbank, stb.) Expasy, Swissprot, Amos 39 2009. 02. 13.

Bioinformatikai adatbázisok http://www3.oup.co.uk/nar/database/c/ A Nucleic Acids Research 2009 évi adatbázis összesítője: Nucleotide Sequence Databases RNA sequence databases Protein sequence databases Structure Databases Genomics Databases (non-vertebrate) Metabolic and Signaling Pathways Human and other Vertebrate Genomes Human Genes and Diseases Microarray Data and other Gene Expression Databases Proteomics Resources Other Molecular Biology Databases Organelle databases Plant databases Immunological databases 40 2009. 02. 13.