Proteomika alapfogalmak, módszerek, példák a proteomika alkalmazására
Alapfogalmak és omikák : Genomika Teljes humán genom szekvenciájának meghatározása: 2001. február Genom: Winkler, 1920; GENes and chromosomes Egy szervezet, sejt, egy organellum vagy egy vírus teljes kromoszomális és kromoszómán kívüli génjeinek összessége, azaz a szervezet teljes DNS-állománya (IUPAC) - Genomika: Roderick, 1986 (Genomics, folyóirat) genom szekvenciájára vonatkozó adatállomány új gének felfedezése géntérképezés genomok összehasonlítása (fajok, evolúció) új, gén alapú eljárások
Alapfogalmak és omikák : Proteomika Proteom: M. Wilkins (1994) Conference on Genome and Protein Maps, Siena, Italy Protein complement expressed by a genome. Egy szervezet, egy sejt, egy organellum vagy egy vírus összes proteinje, a szervezet teljes fehérjeállománya If the genome is a list of the instruments in an orchestra, the proteome is the orchestra playing a symphony. (R. Simpson) Proteomika: 1. Proteomok kvalitatív és kvantitatív analízise, összehasonlítása különböző körülmények között (pl. beteg vs egészséges) 2. Azonosítás (szekvencia, 3D szerkezet) és fehérjemódosítások 3. Kísérleti megfigyelések összegyűjtése adatbázisban 4. A fehérjék alábbi tulajdonságainak meghatározása: - lokalizáció - módosítások (pl. poszttranszlációs módosítások) - kapcsolatok (pl. metabolikus és jelátviteli utak) - aktivitás - funkció (predikció és kísérleti eredmények alpján) 5. Betegségek megértése, diagnosztika, gyógyszerek fejlesztése
További omikák Bioinformatika Adat Adat Adat Adat Genomika Transcriptomika Proteomika Metabolomika Gének mrns Fehérjék Metabolitok
Összefoglaló Genom Proteom Genomika sejttérképezés" Funkcionális genomika Proteomika
Proteomika mint kulcsszó az irodalomban Darab közlemény 3000 2500 2000 1500 1000 500 0 2791 2484 2595 2100 1533 974 310 4 2001 2002 2003 2004 2005 2006 2007 2008 Év
Miért kell a proteomika? Az mrns expresszió nem mindig felel meg a fehérjeexpressziónak Biológiai minták (pl. szérum, vizelet stb.) nem alkalmas mrns expressziós analízisre Poszttranszlációs változások: nem lehet egyértelműen következtetni a DNS szekvencia alapján A fehérjék lokalizációjára és kölcsönhatásaira is lehet következtetni
Proteomikák Funkcionális Aktivitáson alapuló proteomika: Funkció összekapcsolása génexpressziós és/vagy fehérjefehérje interakciós adatokkal Kémia proteomika: Proteom-szintű vizsgálatok Enzimaktivitás meghatározására, sokféle kémiai könyvtár Toxikoproteomika: Specifikus fehérjék azonosítása és koncentrációváltozásuk mérése Integrált Mikrobiális proteomika Célzott proteomika: Szövetproteomika (Kezdeményezés: National Cancer Institute) Strukturális Filoproteomika: Ismeretlen bakteriális izolátumok azonosítása az adatbázisban szereplő fehérje biomarkerek hasonlósága alapján Statisztikus proteomika: High throughput 3D/4D fehérjeszerkezeti információ analízise és alkalmazása valamennyi élettudomány alapján
Az expressziótól az azonosításig és tovább... Eredet meghatározás (taxonómia) Sejtlizátum -Nukleinsav -Fehérje -Lipidek -Szénhidrátok Lízis Elválasztás Fehérje expresszió Izolált fehérje Primer szerkezet (aminosav sorrend) Alegységszerkezet Poszttranszlációs mód. Lokalizáció Térszerkezet (3D) Funkció Annotáció Rokonság más fehérjével Asszociáció betegséggel
Az expressziótól az azonosításig és tovább... Nehézségek Eredet (taxonomia) 1. Fehérje-expresszió expresszió 1. "Sokféle fehérje" : 30 000 gén - 500 000 fehérje 2. Eltérô expressziós profil : mennyiség, minôség - idô - hômérséklet - fény/részecske - kémiai szignál -- "természetes" -- "környezeti" (gyógyszer, szennyezés stb) Sejtlizátum - nukleinsavak - fehérjék - lipidek - szénhidrátok... Lízis 1. Nem teljes, molekuláris szintû dezintegráció. 2. Oldékonyság (hidrofób fehérjék). 3. Enzimaktivitás, degradáció.
Az expressziótól az azonosításig és tovább... Nehézségek Sejtlizátum - nukleinsavak - fehérjék - lipidek - szénhidrátok... Elválasztás - elekroforézis - kromatográfia - UC... Izolált fehérje 1. "Sokféle fehérje" : 500 000 fehérje; kb. 10000 fehérje/minta, de csak kb. 2000 választható el 2D gélelektroforézissel 2. Kicsi és nagy 3. Kis mennyiség ("ritka protein"). 4. Alacsony koncentráció. 5. Nagy mennyiség ("abundant protein"). 6. Magas koncentráció. 7. Membrán/hidrofób fehérje (oldékonysági problémák) Elôfrakcionálás pi 5 6 7 8 9 + _ Pl. Humán szérum : 600 folt, ebből 205 a pi 5-6 tartományban
Az expressziótól az azonosításig és tovább... Nehézségek Izolált fehérje Primer szerkezet - aminosavsorrend Szerkezetvizsgálat - kémiai, enzimatikus lebontás - MS - bioinformatika 1. Diszulfid híd - alegységszerkezet. 2. Oldallánc amidkötés. 3. Nem-kovalens komplex. 4. Poszt transzlációs változáson átesett fehérje. 5. Enzim "rezisztens" fehérje (lásd prion). 6. Adatbázisban nem szereplő fehérje Pl. Humán szérum : 600 folt, ebből 205 a pi 5-6 tartományban, ebből 105 található meg az adatbázisban.
Az expressziótól az azonosításig és tovább... Nehézségek Primer szerkezet - aminosavsorrend Annotáció Primer szerkezet - alegységek - poszttranszlációs modosulások Térszerkezet Lokalizáció Funkció(k) - Ca 2+ kötés - Zn finger - ATP kötés Rokonság más fehérjével Asszociáció betegséggel 1. Ismeretlen térszerkezet - izolálás, szintézis, X-ray/NMR - predikció. 2. Ismeretlen lokalizáció - sejtfrakcionálás, - radioaktiv izotópos bioszintézis 3. Ismeretlen funkció - kötődés - biológiai válasz mérése 4. Összehasonlító vizsgálatok - fajok, - "normál" vs "kezelt"
Proteomikai munkafolyamat Minta összegyűjtése Organellumok szétválasztása Tisztítás ellenanyag segítségével 1 és 2D gélelektroforézis RP-HPLC SCX HPLC (ioncserés) Fehérje gélek Fehérje(k) (pöttyök) kivágása minta Előkészítő lépések ESI-MS, MALDI-TOF Szerkezeti vagy tömeg információk MS peptidek Fehérje(k) Keresés adatbázisban Fehérje azonosítás SWISS-PROT TrEMBL RefSeq XPs Ensembl...
A médium összetételének hatása az E-coli fehérjeösszetételére Arg - Arg Farrell PHO (1978)
Humán plazma részleges proteintérképe 2D gélelektroforézis alapján (JC Sanchez et al. 1995). 8-200 kda méret pi = 4,0 6,0 izoelektromos pont tartományba eső fehérjekomponensek
Egészséges humán vastagbél epitélium fehérje térképe a sejtlizátum 2D gélelektroforézis alapján (MA Raymond et al. 1997).
Sejtmag fehérjék HeLa sejtekből Swiss-Prot
Sejtmag fehérjék HeLa sejtekből M w pi
Fibroblaszt lizátum fehérjéinek 2D gélelektroforézis képe A: egészséges, B: Down-kóros beteg mintája A B
Proteomikai munkafolyamat Minta összegyűjtése Organellumok szétválasztása Tisztítás ellenanyag segítségével 1 és 2D gélelektroforézis RP-HPLC SCX HPLC (ioncserés) Fehérje gélek Fehérje(k) (pöttyök) kivágása minta Előkészítő lépések ESI-MS, MALDI-TOF Szerkezeti vagy tömeg információk MS peptidek Fehérje(k) Keresés adatbázisban Fehérje azonosítás SWISS-PROT TrEMBL RefSeq XPs Ensembl...
Nem gél alapú elválasztási eljárások: kromatográfiás technikák peptidek, fehérjék analíziséhez Gélszűrés Hidrofób kölcsönhatás Ioncserés Fordított fázisú Affinitási
Multidimensional Protein Identification Technology (MudPIT) emésztés Denaturált fehérje komplex Peptidek Erős kationcserélő oszlop Fordított fázisú oszlop Peptidek 2D kromatográfiás elválasztása Peptid fragmentáció (MS/MS) Keresés adatbázisban A komplexben lévő fehérjék azonosítása
Keresés adatbázisban MS alapján MS-MS alapján Tömegspektrum MS/MS spektrum Peptide Mass Fingerprint (PMF) Fehérje azonosítás peptid tömeg alapján Szekvencia specifikus információ minden peptidre Fehérje azonosítás a peptidek szekvencia információja alapján Legalább 5 peptid tömegnek egyeznie kell Az azonosításhoz Legalább 2 fragmentációs mintázatnak egyeznie kell
Mit csinálnak a keresőmotorok? MS alapján történő keresés MS-MS alapján történő keresés A fehérjék elméleti emésztése Megkeresi a legjobb egyezést a kísérleti peptid tömeg és az elméleti peptid tömeg között A fehérjék elméleti emésztése Elméleti fragmens ionok generálása minden lehetséges triptikus peptidre, amely az emésztés során keletkezett Legjobb egyezés keresése peptid azonosításhoz Peptidek szekvenciáján alapuló fehérje azonosítás MASCOT: mindkét féle keresést tudja
TQTXT (X = 19 aminosav) peptidkönyvtár vizsgálata ESI- FTICR tömegspektrometriával I,L [TQT Q T+ H] + 578.2759 [TQT K T+ H ] + 578.3127 M calc. (TQTQT): 578.2708 M calc. (TQTK T): 578.3071 X = [TQTX T+H ] + - Signals m /z G A S P V T N Q, K D E M F R Y W H 510 530 550 570 590 610 630 TQTQT/TQTKT Ms különbség: 0,368 m /z
Adatbázisok International Protein Index (IPI) http://www.ebi.ac.uk/ipi/ipihelp.html (2001. október) Humán proteom leírása Humán fehérje szekvencia információk összegyűjtése 5 adatbázisból: SWISS-PROT TrEMBL RefSeq NPs RefSeq XPs Ensembl Fehérje szekvenciák magas színvonalú manuálisan annotált adatbázisa, melyet a Swiss Institute of Bioinformatics és a European Bioinformatics Institute tart fenn A SWISS-PROT automatikus annotációjú kiegészítése Fehérjeszekvenciák referenciagyűjteménye, melyet a National Center for Biotechnology Information tart fenn A genom annotáció során meghatározott Homo sapiens modell fehérjék szekvenciájának gyűjteménye, melynek fenntartója szintén az NCBI. Az EBI és a Sanger Centre közös vállalkozása egy olyan szoftverrendszer fejlesztésére, amely az eukarióta genomok automatikus annotációját hozza létre és tartja fenn.
International Protein Index (IPI) http://www.ebi.ac.uk/ipi/ipihelp.html Az IPI tartalma Összes bejegyzések száma, amelyre az IPI mutat 103 590 SWISS-PROT/TrEMBL bejegyzések száma 27 469 RefSeq NP-k száma 14 039 Ensembl bejegyzések száma 28 706 RefSeq XP-k száma 32 277 Elérhető: ftp://ftp.ebi.ac.uk/pub/databases/ipi/current/ipi.fasta
Protein Protein Sequence Databases: PIR, PRF, RefSeq, SwissProt, TrEMBL Protein Family Databases: InterPro, iproclass, Pfam, PIR-ALN, ProDom Protein Structure Databases: CSD, MMDB,NDH, PDB, Protein Structural Classification Databases: CATH, DSSP, FSSP, HSSP, SCOP, Post-translational Modification Databases: O-GlyBase, RESID, Protein-protein kölcsönhatás CuraGen: Portal.curagen.com DIP: Dipode-mbi.ucla.edu Interact: Bioinf.man.ac.uk/interactso.htm MIPS: mips.biochem.mpg.de ProNet: Pronet.doublewist.com
Ismert 3D szerkezettel rendelkező fehérjék száma (http://www.rcsb.org/pdb) 20000 Ismert 3D szerkezetek száma 10000 az évben megismert az addig megismert 0 1970 1980 1990 2000 Év 2010
NiceProt View of SWISS-PROT: P16070 Entry name CD44 HUMAN Primary accession number P16070 Entered in SWISS-PROT in Release 14, April 1990 Sequence was last modified in Release 35, November 1997 Annotations were last modified in Release 41, March 2002 Protein name CD44 antigen [Precursor] Synonyms Phagocytic glycoprotein I PGP-1 HUTCH-I Extracellular matrix receptor-iii ECMR-III GP90 lymphocyte homing/adhesion receptor Hermes antigen Hyaluronate receptor Heparan sulfate proteoglycan Epican CDw44 Gene name CD44 or LHR From Homo sapiens (Human) [TaxID: 9606] Taxonomy Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Mammalia; Eutheria; Primates; Catarrhini; Hominidae; Homo. References [1] SEQUENCE FROM NUCLEIC ACID (VARIOUS ISOFORMS). TISSUE=Lymphoblast; MEDLINE=93101687; PubMed=1465456; [NCBI, ExPASy, EBI, Israel, Japan] Screaton G.R., Bell M.V., Jackson D.G., Cornelis F.B., Gerth U., Bell J.I.; "Genomic structure of DNA encoding the lymphocyte homing receptor CD44 reveals at least 12 alternatively spliced exons." Proc. Natl. Acad. Sci. U.S.A. 89:12160-12164 (1992)
Apolipoprotein D: identification of fistula in perilymph Perilympha liquid Cerebrospinal liqued Human serum (clinical) Human serum (Sigma) Sun JP 1998
Apolipoprotein D: identification of fistula in perilymph - Neuraminidase + Neuraminidase
2D gelelectrophoresis map of proteins of fibroblast lysate from healthy (A) and from Down-diseased patient (B) A B
A proteomika alkalmazásai Sejt térkép Expressziós térkép Jelátvitel Proteom analízis Szerkezetmódisítás analízise Expressziós mechanizmus Gyógyszerek toxicitása Új gyógyszerek célbajuttatása Gyógyszerek mechanizmusai Proteomika (2DE, MS) Betegségek biomarkerei Az öregedés és metabolikus betegségek faktorai Ideg- és immunrendszer betegségeinek ellenőrzése Protein chip Különbségek kimutatása Nagy értékű termékek Ételek Búza, haszonállatok fehérje analízise stb. Mikrobiológia számára hasznos fehérjék felfedezése Strukturális genomika Bioinformatika
Összefoglalás Genom Proteom "Cell mapping" Genomika Proteomika Funkcionális genomika Tér és idő Interakciók
Kérdések Mi a proteomika? Irja le a proteomika gondolatmenetét! Milyen kapcsolat létesithető a proteomika és a gyógyszerkutatás között? Miért érdekes a proteomika az átlagos olvasó számára? Miként lehet ezt bizonyítani számára?