BIOINFORMATIKA Ungvári Ildikó



Hasonló dokumentumok
Többgénes jellegek. 1. Klasszikus (poligénes) mennyiségi jellegek. 2.Szinte minden jelleg több gén irányítása alatt áll

Genomadatbázisok Ld. Entrez Genome: Összes ismert genom, hierarchikus szervezésben (kromoszóma, térképek, gének, stb.)

Juhász Angéla MTA ATK MI Alkalmazott Genomikai Osztály SZEKVENCIA ADATBÁZISOK

A genomikai oktatás helyzete a Debreceni Egyetemen

A tárgy címe: Bioinformatika

Bioinformatika előadás

Az orvosi biotechnológiai mesterképzés megfeleltetése az Európai Unió új társadalmi kihívásainak a Pécsi Tudományegyetemen és a Debreceni Egyetemen

Humán genom variációk single nucleotide polymorphism (SNP)

TDK lehetőségek az MTA TTK Enzimológiai Intézetben

HAPMAP Nemzetközi HapMap Projekt. SNP GWA Haplotípus: egy kromoszóma szegmensen lévő SNP mintázat

ADATBÁNYÁSZAT I. ÉS OMICS

Bioinformatika 2 10.el

The nontrivial extraction of implicit, previously unknown, and potentially useful information from data.

Hazai méhészeti genomikai és genetikai vizsgálatok

10. Genomika 2. Microarrayek és típusaik

Bioinformatika előadás

Cserző Miklós Bioinformatika és genomanalízis az orvostudományban. Integrált biológiai adatbázisok

Bioinformatika előadás

Bevezetés a bioinformatikába. Harangi János DE, TEK, TTK Biokémiai Tanszék

Bioinformatika 2 4. előadás

A genetikai lelet értelmezése monogénes betegségekben

A proteomika új tudománya és alkalmazása a rákdiagnosztikában

Bioinformatika és genomanalízis az orvostudományban. Biológiai adatbázisok. Cserző Miklós 2018

Semmelweis Egyetem / Élettani Intézet / Budapest. Bioinformatika és genomanalízis az orvostudományban. Szekvenciaelemzés. Cserző Miklós 2017

A HUMÁNGENETIKA LEGÚJABB EREDMÉNYEI Péterfy Miklós

Prenatalis diagnosztika lehetőségei mikor, hogyan, miért? Dr. Almássy Zsuzsanna Heim Pál Kórház, Budapest Toxikológia és Anyagcsere Osztály

A preventív vakcináció lényege :

Genomikai Medicina és Ritka Betegségek Intézete Semmelweis Egyetem

Bioinformatika 2 6. előadás

Molekuláris genetikai vizsgáló. módszerek az immundefektusok. diagnosztikájában

DNS-szekvencia meghatározás

Új utak az antipszichotikus gyógyszerek fejlesztésében

Kromoszómák, Gének centromer

avagy az ipari alkalmazhatóság kérdése biotechnológiai tárgyú szabadalmi bejelentéseknél Dr. Győrffy Béla, Egis Nyrt., Budapest

Orvosi Genomtudomány 2014 Medical Genomics Április 8 Május 22 8th April 22nd May

Norvég Finanszírozási Mechanizmus által támogatott projekt HU-0115/NA/2008-3/ÖP-9 ÚJ TERÁPIÁS CÉLPONTOK AZONOSÍTÁSA GENOMIKAI MÓDSZEREKKEL

TEMATIKA Biokémia és molekuláris biológia IB kurzus (bb5t1301)

A korszerű infokommunikációs technológia (IKT) alkalmazásával csak kis mértékben javíthatjuk az emberi agy információ tároló és feldolgozó képességét.

MUTÁCIÓK. A mutáció az örökítő anyag spontán, maradandó megváltozása, amelynek során új genetikai tulajdonság keletkezik.

Human genome project

Bioinformatika - egészséges környezet, egészséges élelmiszer

Biobank Hálózat kialakításának minőségügyi kérdései a Semmelweis Egyetemen

Az emberi erőforrás értéke

Mit tud a genetika. Génterápiás lehetőségek MPS-ben. Dr. Varga Norbert

Semmelweis Egyetem / Élettani Intézet / Budapest. Bioinformatika és genomanalízis az orvostudományban. Bevezetés. Cserző Miklós 2018

I. A sejttől a génekig

3. Általános egészségügyi ismeretek az egyes témákhoz kapcsolódóan

Bioinformatika 2 2. előadás

Evolúcióelmélet és az evolúció mechanizmusai

Az X kromoszóma inaktívációja. A kromatin szerkezet befolyásolja a génexpressziót

12/4/2014. Genetika 7-8 ea. DNS szerkezete, replikáció és a rekombináció Hershey & Chase 1953!!!

Evolúció. Dr. Szemethy László egyetemi docens Szent István Egyetem VadVilág Megőrzési Intézet

Gyakorlati bioinformatika

Biotechnológia, egészség- és környezetvédelem. Műegyetem - Kutatóegyetem Biotechnológia, egészség-és környezetvédelem

Biomassza alapú bioalkohol előállítási technológia fejlesztése metagenomikai eljárással

Dobzhansky: In Biology nothing makes sense except in the light of Evolution.

7. SOKFÉLESÉG. Sokféleség

~ 1 ~ Ezek alapján a következő célokat valósítottuk meg a Ph.D. munkám során:

Evolúció. Dr. Szemethy László egyetemi docens Szent István Egyetem VadVilág Megőrzési Intézet

Biológiai feladatbank 12. évfolyam

Genetika. Tartárgyi adatlap: tantárgy adatai

Evolúcióbiológia. Biológus B.Sc tavaszi félév

Gépi tanulás és Mintafelismerés

Génkifejeződési vizsgálatok. Kocsy Gábor

NÖVÉNYGENETIKA. Az Agrármérnöki MSc szak tananyagfejlesztése TÁMOP /1/A

2008 IV. 22. Internetes alkalmazások forgalmának mérése és osztályozása. Április 22.

A gidrán fajta genetikai változatosságának jellemzése mitokondriális DNS polimorfizmusokkal Kusza Szilvia Sziszkosz Nikolett Mihók Sándor,

transzláció DNS RNS Fehérje A fehérjék jelenléte nélkülözhetetlen minden sejt számára: enzimek, szerkezeti fehérjék, transzportfehérjék

NUKLEINSAVAK. Nukleinsav: az élő szervezetek sejtmagvában és a citoplazmában található, az átöröklésben szerepet játszó, nagy molekulájú anyag

In vivo szövetanalízis. Különös tekintettel a biolumineszcens és fluoreszcens képalkotási eljárásokra

sejt működés jovo.notebook March 13, 2018

MOLEKULÁRIS GENETIKA A LABORATÓRIUMI MEDICINÁBAN. Laboratóriumi Medicina Intézet 2017.

A genomiális medicina szép új világa

Az omnipotens kutatónak, Dr. Apáti Ágotának ajánlva, egy hálás ex-őssejtje

BIOGÉN ELEMEK Azok a kémiai elemek, amelyek az élőlények számára létfontosságúak

BIOLÓGIA HÁZIVERSENY 1. FORDULÓ BIOKÉMIA, GENETIKA BIOKÉMIA, GENETIKA

Bioinformatika 2 9. előadás

Bakteriális identifikáció 16S rrns gén szekvencia alapján

Gerinces és növényi ortológ promóter adatbázisok fejlesztése és elemzése. Eötvös Loránd Tudományegyetem Természettudományi Kar Biológia Doktori Iskola

A DNS szerkezete. Genom kromoszóma gén DNS genotípus - allél. Pontos méretek Watson genomja. J. D. Watson F. H. C. Crick. 2 nm C G.

A kromoszómák kialakulása előtt a DNS állomány megkettőződik. A két azonos információ tartalmú DNS egymás mellé rendeződik és egy kromoszómát alkot.

Dr. Máthéné Dr. Szigeti Zsuzsanna és munkatársai

Tudománytörténeti visszatekintés

Mechatronika oktatásával kapcsolatban felmerülő kérdések

Genetikai panel kialakítása a hazai tejhasznú szarvasmarha állományok hasznos élettartamának növelésére

Számítógépes döntéstámogatás. Genetikus algoritmusok

Engedélyszám: /2011-EAHUF Verziószám: Humángenetikai vizsgálatok követelménymodul szóbeli vizsgafeladatai

A metabolikus szindróma genetikai háttere. Kappelmayer János, Balogh István (

A PET szerepe a gyógyszerfejlesztésben. Berecz Roland DE KK Pszichiátriai Tanszék

Biológus MSc. Molekuláris biológiai alapismeretek

Az evolúció folyamatos változások olyan sorozata, melynek során bizonyos populációk öröklődő jellegei nemzedékről nemzedékre változnak.

ALEPH Elektronikus Katalógus rövid útmutató

A nukleinsavak polimer vegyületek. Mint polimerek, monomerekből épülnek fel, melyeket nukleotidoknak nevezünk.

A rák, mint genetikai betegség

Poligénes v. kantitatív öröklődés

Hátterükben egyetlen gén áll, melynek általában számottevő a viselkedésre gyakorolt hatása, öröklési mintázata jellegzetes.

Taxonómiai kutatások jelene és jövője a bagolylepkészetben

ÉVES JELENTÉS Életminőséget Javító Gyógyszerek és Gyógyító Eljárások Fejlesztése

Egy mezofil lomberdei faj, a szártalan kankalin (Primula vulgaris Huds.) európai léptékű filogeográfiája, különös tekintettel a Kárpát-medencére

Átírás:

1 BIOINFORMATIKA Ungvári Ildikó Az elmúlt évtizedekben a molekuláris biológiai, genomikai technológiák robbanásszerű fejlődése a biológiai adatok mennyiségének exponenciális növekedéséhez vezetett. Ebben a folyamatban mérföldkőnek tekinthető a Sanger-féle nukleotidszekvenálás automatizálása, illetve ennek folyományaként az 1990 és 2004 között zajló Humán Genomprogram, melyek következtében nagyon gyorsan felszínre kerültek az adatok tárolására, rendszerezésére és analízisére irányuló megemelkedett igények. Ráadásul, az első genomprogram óta a szekvenálási (genom nukleotid-sorrendjét meghatározó) illetve genotipizálási (genetikai eltéréseket felfedő) eljárások a technika rohammértékű fejlődésével arányosan, napról napra egyre olcsóbbá válnak, olyannyira, hogy ma már talán az sem tűnik utópisztikus gondolatnak, hogy megismerjük minden egyes ember genetikai állományát, és ez által személyre szabott gyógyszereket, vakcinákat fejlesszünk. Ez a ma is zajló technológiai forradalom a számítógépeken tárolt biológiai információ már-már kezelhetetlen mértékű felhalmozódását eredményezi. A tudomány fejlődésével az is nyilvánvalóvá vált, hogy az élettani működések vagy a populáció nagy részét érintő komplex, multifaktoriális betegségek nem értelmezhetőek egy-egy gén vagy fehérje működése alapján, hanem nagyon sok, esetenként több száz gyenge (genetikai, epigenetikai vagy környezeti), kölcsönhatás, bonyolult hálózatokat alkotva játszik szerepet azok létrejöttében. A hagyományos, egy gén-egy betegség megközelítésünket a 20. század végén rendszerszemléletre (systems biology) váltottuk fel, és az emberi agy képességeit meghaladó, összetett hálózatokban kezdtünk el gondolkodni. Ezt az elképesztő technológiai és tudományos fellendülést nyilvánvalóan szorosan kellett kísérnie a bioinformatika fejlődésének, és ma a biológiai és orvostudományok már elképzelhetetlenek lennének bioinformatikai támogatás nélkül. Napjainkban az elméleti alapkutatással foglalkozó kutató és a klinikus sokféle genomikai, proteomikai eljárást alkalmaz, és folyamatos kapcsolatot tart az informatikusokkal, akik segítségével biobankokat hoz létre, mesterséges modelleket alkot és molekuláris hálózati útvonal-analízist alkalmaz. A bioinformatika feladata: - Molekuláris biológiai, genetikai, és biokémiai adatbázisok létrehozása illetve az azokban tárolt információk kinyerésére és analízisére szolgáló eszközök, módszerek fejlesztése; - a tudományos kísérlettervezés elősegítése; - a tudományos kísérletek eredményeinek vizsgálatára alkalmas statisztikai megoldások fejlesztése, illetve támogatás nyújtása az eredmények értelmezésében; - Döntéstámogatás a gyógyászatban (diagnózisban, kezelésben és előrejelzésben egyaránt). Biológiai adatbázisok A biológiai adatbázisok a tudományos kísérletek, a publikált tudományos irodalom, és a bioinformatikai elemzések eredményeinek legtöbbször ingyenesen elérhető tárházai. Az összetettebb, ún. relációs adatbázisokban nemcsak kereshetőek a tárolt adatok, hanem egyszerűen használható szoftverek segítségével különböző elemzéseket is elvégezhetünk rajtuk. A teljesség igénye nélkül beszélhetünk nukleotid-, fehérje-, útvonal- vagy akár betegség-adatbázisokról, mégpedig az organizmusok széles palettáján. Így az eukarióta adatbázisokon kívül számtalan vírus vagy baktérium adatbázissal is találkozhatunk. A Nucleic Acids Research újságban 2004 óta évenként megjelenik egy adatbázisokról szóló kötet (http://www.oxfordjournals.org/nar/database/c), ahol a 2010-es kiadásban 1230 kiemelt jelentőségű adatbázis gondosan összeállított listáját és rövid leírását találjuk meg. A főbb adatbázisok között találjuk az NCBI (National Center for Biotechnology Information http://www.ncbi.nlm.nih.gov/) számos adatbázisát, melyekből a központi szerepű Entrez (www.ncbi.nlm.nih.gov/entrez/) kereső rendszer segítségével integrált, azaz különböző adatbázisokból származó információt nyerhetünk ki. Például egy számunkra érdekes gén (az oxigén szállításáért felelős Hemoglobin molekula béta alegységét kódoló gén, HBB) nevét beírva a keresőfelületre, az NCBI különböző adatbázisainak

2 találati listáját kapjuk meg, melyek egymással is keresztkapcsolatban állnak. A különböző nukleotid adatbázisokban megismerhetjük a gén nukleotid-szekvenciáját, kromoszómális elhelyezkedését, de információt kapunk a génben található variációkról, azok Hemoglobin molekulában betöltött szerepéről és a variációk következtében kialakuló betegségekről is (pl. vérszegénységek). A fehérje adatbázisokban megtaláljuk a génről átíródó fehérje aminosav-sorrendjét, 3D térszerkezetét valamint a kisebb szerkezeti motívumokat, alegységeket. Emellett képet kaphatunk az eukarióta organizmusokban fellelhető homológiákról, vagyis olyan hemoglobin-b génterületekről, amik pl. a csimpánzban, egérben és emberben is nagyfokú szekvenciahasonlóságot mutatnak. Az NCBI PubMed adatbázisán keresztül pedig elérhetjük a hemoglobin molekulával kapcsolatos tudományos szakirodalmat. Az NCBI adatbázisait külön-külön linken is elérhetjük, például: - Genbank: DNS- és aminosav szekvencia adatbázis, 2009-ben több mint 100 milliárd bázispárt, illetve több mint 100 millió egyedi szekvenciát tartalmazott: http://www.ncbi.nlm.nih.gov/genbank/ A géneket/szekvenciákat megtekinthetjük szöveges formában, vagy a Map Viewer alkalmazás segítségével térképes megjelenítésben is, ahol nem csak a vizsgált génről, de az adott genomterületen elhelyezkedő további génekről, illetve azok egymáshoz viszonyított kromoszómális elhelyezkedéséről és távolságáról is információt kaphatunk. - Az egynukleotidos variációkat (SNP) tartalmazó dbsnp adatbázis: http://www.ncbi.nlm.nih.gov/projects/snp/ - A több mint 20 millió orvosi/orvosbiológiai cikket tartalmazó PubMed adatbázis: http://www.ncbi.nlm.nih.gov/pubmed - Az összes ismert, genetikai okokra visszavezethető humán megbetegedés internetes katalógusa, az OMIM (Online Mendelian Inheritance in Man), részletes szakirodalmi áttekintéssel a klinikai paramétereket és a meghatározó genomterületeket illetően: http://www.ncbi.nlm.nih.gov/omim Valamint, nem az NCBI által fenntartott, de említésre méltó a GO (Gene Ontology, http://www.geneontology.org/) adatbázis, ami tájékoztatást nyújt a génekről kifejeződő fehérjék molekuláris funkciójáról, valamint a különböző biológiai folyamatokban való részvételéről. Ezen kívül megtudhatjuk azt is, hogy az adott protein (ha szerkezeti elemről van szó például) milyen celluláris alkotórész kialakításában vesz részt. Például a Hemoglobin esetében a fehérje molekuláris funkciói közt találjuk többek között az oxigén-, fehérje- illetve fémion-kötést, biológiai folyamatai közt az oxigén-szállítást, a vérnyomás szabályozást, a hozzá tartozó celluláris komponens pedig a hemoglobin-komplex. Főbb bioinformatikai módszerek Szekvencia-analízis Az új technológiáknak köszönhetően ma már több mint hatezer különböző organizmus teljes genomiális szekvenciáját ismerjük. Ezen szekvenciák bioinformatikai elemzésével, az úgynevezett genom-annotáció során, fehérje- vagy RNS-kódoló géneket, szabályozó régiókat, szerkezeti motívumokat, vagy az egyes betegségekre jellemző repetitív szekvenciákat ismerhetünk meg. A szekvencia-analízis egyik metódusa a homológiakeresés, melynek során például egy új, ismeretlen funkciójú génhez/fehérjéhez tartozó szekvenciához próbálunk hasonlót találni a már ismert funkciójú gének/fehérjék szekvenciái között, majd a talált hasonló szekvenciák funkciójának ismeretében feltételezést teszünk a vizsgált gén vagy fehérje funkcióját illetően. Számítógépes szekvencia-illesztő programok (mint amilyen az NCBI BLAST elnevezésű szoftvere) segítenek minket abban, hogy felfedjük a vizsgált szekvenciánk és az NCBI adatbázisában tárolt szekvenciák, vagy a saját kérdéses szekvenciáink közti hasonlóságokat.

3 Ha például kíváncsiak vagyunk arra, hogy mennyiben egyezik meg egy általunk kiválasztott szekvenciarészlet a Hemoglobin B-t és Hemoglobin D-t kódoló génszakaszokon, a vizsgált szekvenciák 95%-os egyezését tapasztaljuk (1.ábra). Evolúció-biológia A bioinformatika segítségével ma már nem csak fenotípusbeli jellemzők alapján, hanem a genomikai/proteomikai adatbázisokban tárolt információk elemzésével is vizsgálhatjuk az evolúciós folyamatokat. A nukleotid- és fehérje szekvenciák illesztésével ugyanis felfedhetőek a különböző organizmusok közti evolúciós kapcsolatok. Az eddigi tapasztalataink alapján az egymással közelebbi rokonságban álló fajok szekvenciái nagyobb hasonlóságot mutatnak, mint az evolúcióban korábban szétvált fajoké. Míg két ember genetikai állománya 99,9%-ban azonos, ez az érték ember-csimpánz közt 97-99%, az ember és a szarvasmarha között pedig mintegy 80%. Ennek az az oka, hogy a génekben különböző mutációk halmozódnak fel, és minél több idő telik el a közös gén hordozása óta, annál inkább különbözni fog a két szekvencia. Ráadásul a hemoglobin esetében az aminosavak cseréjének mértéke nagyjából arányban is van az elválás óta eltelt idővel (bár ez a folyamat nem tekinthető törvényszerűnek, hiszen az aminosav cserék sebessége általában sok paraméter függvénye, így nem állandó). A többszörös szekvencia-illesztés (több mint 2 szekvencia illesztése) lehetőséget ad arra is, hogy a különböző szervezetekből származó, de azonos funkciójú fehérjék szekvenciáinak konzerválódott, funkcionálisan fontos és jellemző részleteit (pl. katalitikus helyeket, fehérje-fehérje kölcsönhatásban résztvevő motívumokat) felismerjük. Többek között, ezeket a konzervált motívumokat/doméneket használják fel a kutatók a fajok közti evolúciós kapcsolatok rekonstruálásához, és ezek alapján képesek megállapítani a fajok evolúciós eltávolodásának hozzávetőleges idejét. Az igen összetett analízis eredményeit filogenetikai fán szokás ábrázolni. Ezen túlmenően a konzervált domének felhasználhatóak a fehérjék klasszifikációjának, azaz a rokon fehérjéket tartalmazó osztályok kialakításának folyamatában is. Például a Hemoglobin-B molekula fehérjeszekvenciájában található 147 aminosav hosszúságú szakasz 99-100%-os egyezést mutat több száz különböző eukarióta szekvenciával. Ez a szakasz megtalálható a konzervált domének adatbázisában is (CDD, http://www.ncbi.nlm.nih.gov/structure/cdd/cdd.shtml), és azok a fehérjék, amelyek ezt a domént tartalmazzák, a globin-szupercsalád tagjai. Fehérje szerkezet predikció A szekvencia-illesztésnél leírt módon, a fehérje szerkezet ismeretének hiányában lehetőségünk van a 3D térszerkezet megjóslására, hasonló aminosav-sorrendű és ismert szerkezetű fehérjék, vagy fehérjealegységek (domének) felhasználásával. Számottevő szekvencia-azonosság hiányában a térszerkezet predikciót fizikai elvek figyelembevételével végezzük el. Génexpresszió vizsgálat A különböző kórképekben eltérő mértékben aktiválódó gének vizsgálatára alkalmasak a microarray (chip) módszerek, melyekben a génekről átíródó RNS mennyiségét (expressziójának mértékét) hasonlítjuk össze a különböző (pl. egészséges-kontroll) mintákban. Az expressziós eltérésekből következtethetünk az adott betegség kialakulásában szerepet játszó fontosabb génekre. Mivel egy-egy ilyen microarray lemezen több tízezer gént tudunk egyidejűleg vizsgálni, már egy mérés során akkora adathalmaz keletkezik, amit képtelenek lennénk informatikai támogatás nélkül feldolgozni és értelmezni. A kapott eredményeinket feltölthetjük génexpressziós adatbázisokba, és mások eredményei között is keresgélhetünk. Ilyen adatbázis például a GEO (Gene Expression Omnibus): http://www.ncbi.nlm.nih.gov/geoprofiles

4 Mivel akár több ezer gén expresszálódik különböző mértékben egy-egy ilyen mérés során, érdemes a már említett hálózatokba illesztve vizsgálnunk az eredményeinket. A különböző gének részvételét és kölcsönhatásait a metabolikus és jelátviteli útvonalakban illetve molekuláris hálózatokban az IPA (Ingenuity Pathway Analisis) programmal tanulmányozhatunk. http://www.ingenuity.com/ Az IPA támogatást nyújt egyrészt a gének egymáshoz való viszonyának értelmezésében, de segítségével - az új mérési eredményeink tükrében - bővíthetjük, módosíthatjuk a meglévő útvonalakat, folyamatosan bonyolítva ezzel a kutatók által feltárt összefüggéseket és hálózatokat. Az expressziós microarray vizsgálat példáján értelmezhető a bioinformatika alapvető szerepe az egyéb high throughput, azaz egy mérés során adatpontok ezreit generáló genetikai (pl. SNP, CNV), epigenetikai (pl. metilációs mintázat), és proteomikai vizsgálatoknál is. Szószedet Sanger-féle nukleotid szekvenálás: egy DNS-szakasz nukleotid-sorrendjének meghatározására használt módszer, mely során egy új DNS-szálat szintetizálunk, a szekvenálandó szakaszból származó egyszálú templátot és szabad nukleotidokat felhasználva. Az új szál szintézise bármikor megállítható úgy, hogy nem a hagyományos bázisokat (4 féle dntp-t), hanem azok didezoxi-származékát (ddntp) adják a rendszerhez. Radioaktív vagy fluoreszcens jelölést alkalmazva minden megállításnál leolvasható, hogy éppen melyik ddntp épült be, ami utal a kiindulási DNS szál bázissorrendjére. Első genomprogramok: a Bacteriophage MS2 RNS-genomjának megszekvenálását (1976), illetve a phi X 174 bakteriofág 5386 bázispár hosszúságú DNS-genomjának Sanger-módszerrel történt megszekvenálását (1977) értjük alatta. Genotipizálás: a vizsgált organizmusra jellemző genotípus meghatározása. A használt módszertől függően jelentheti egyetlen nukleotid meghatározását (SNP vizsgálat), ismétlődő elemek számának megállapítását, illetve az egyre terjedő teljes genom vizsgálatok esetében egyszerre több száz/több ezer SNP, vagy hosszabb-rövidebb DNS szakasz leolvasását is. A szekvenálás is a genotipizálás egyik robosztus módszere. Multifaktoriális betegség: Genetikai, epigenetikai, és környezeti hatásra kialakuló kórképek. Összesített populációs gyakoriságuk magas, a betegségek változó súlyosságúak lehetnek. Öröklésük nem hasonlít a monogénes kórképekéhez. Ide sorolható a magas vérnyomás, az elhízás, cukorbetegség, depresszió, skizofrénia, asztma, stb. Epigenetikai módosulás: Olyan DNS-szerkezetváltozást jelent, ami szemben a klasszikus mutációval nem jár a bázisszekvencia megváltozásával. Ismereteink szerint a leggyakoribb formája a DNS négy bázisa közül az egyiknek, a citozinnek a metilálódása. A metilálódás következtében az adott szakasz genetikailag inaktív lesz, vagyis a gén funkciója kiesik. A klasszikus mutációval ellentétben ez azonban reverzibilis folyamat, ami meghatározza a gének ki-be kapcsolását. A környezeti hatások, a táplálkozás, a magzati korban az anya dohányzása mind befolyásolják az epigenetikai mintázatot, ami a sejtosztódások során, akár generációkon keresztül is fennmaradhat! Proteomika: a proteom, vagyis az élő szervezetben előforduló összes fehérje megismerésével foglalkozó tudományterület. Biobankok: élőlényekből származó biológiai minták gyűjteményei. Típusát tekintve sok féle lehet, például: vér, tumoros szövetek, fehérje, DNS, RNS. A biobankokban felhalmozott minták tárolása és dokumentációja szigorúan szabályozott, melynek következtében a minták felhasználhatóak mind kutatási, mind pedig terápiás célra is (pl. vérátömlesztés). Homológia: nagyfokú szekvencia-hasonlóság, mely oka a közös evolúciós eredet. Genom-annotáció: a szekvencia adatbázisokban tárolt információ felruházása értelemmel, azaz a funkcionális szakaszok (gének, szabályozó elemek) meghatározása. Repetitív szekvencia: hosszabb-rövidebb ismétlődő szekvenciák a genomban, ahol az ismétlődések száma diagnosztikus értékű lehet. Például a Huntington-kór esetében egy trinukleotid repeat (CAG) kóros felszaporodása figyelhető meg. Egészséges személyeknél a CAG ismétlődés száma 9-36 között

váltakozik, a huntingtonos betegek esetében pedig ez 36-121 értékek közé esik, ami az adott gén funkcióváltozását okozza. High-throughput technikák: nagy áteresztőképességű mérési eljárások, egy vizsgálat során párhuzamosan több száz/több ezer mérést végeznek el. Például egy ember akár egymillió SNP-jét is tudjuk egyszerre (egy array lemezen), rövid idő alatt vizsgálni. 5

1.ábra Példa a páronkénti szekvencia-illesztésre, http://blast.ncbi.nlm.nih.gov/blast.cgi 6