HALADÓ GENETIKA. Jegyzet

Hasonló dokumentumok
Kromoszómák, Gének centromer

A kromoszómák kialakulása előtt a DNS állomány megkettőződik. A két azonos információ tartalmú DNS egymás mellé rendeződik és egy kromoszómát alkot.

Human genome project

Fehérje expressziós rendszerek. Gyógyszerészi Biotechnológia

Biomassza alapú bioalkohol előállítási technológia fejlesztése metagenomikai eljárással

Fehérje interakciók az ecetmuslica telomerének retrotranszpozonjain. Takács Sándor

Az evolúció folyamatos változások olyan sorozata, melynek során bizonyos populációk öröklődő jellegei nemzedékről nemzedékre változnak.

Tartalom. Javítóvizsga követelmények BIOLÓGIA...2 BIOLÓGIA FAKULTÁCIÓ...5 SPORTEGÉSZSÉGTAN évfolyam évfolyam évfolyam...

A molekuláris biológia eszközei

Hátterükben egyetlen gén áll, melynek általában számottevő a viselkedésre gyakorolt hatása, öröklési mintázata jellegzetes.

AZ EMBERI MIKROBIOM: AZ EGYÉN, MINT SAJÁTOS ÉLETKÖZÖSSÉG Duda Ernő

A genetikai lelet értelmezése monogénes betegségekben

Klónozás: tökéletesen egyforma szervezetek csoportjának előállítása, vagyis több genetikailag azonos egyed létrehozása.

A szamóca érése során izolált Spiral és Spermidin-szintáz gén jellemzése. Kiss Erzsébet Kovács László

Human Genome Project, évvel a tervezett befezés előtt The race is over, victory for Craig Venter. The genome is mapped* - now what?

Cserző Miklós Bioinformatika és genomanalízis az orvostudományban. Integrált biológiai adatbázisok

Transzgénikus állatok előállítása

Tudománytörténeti visszatekintés

TARTALOM. Előszó 9 BEVEZETÉS A BIOLÓGIÁBA

Az X kromoszóma inaktívációja. A kromatin szerkezet befolyásolja a génexpressziót

DNS-szekvencia meghatározás

I. A sejttől a génekig

NUKLEINSAVAK. Nukleinsav: az élő szervezetek sejtmagvában és a citoplazmában található, az átöröklésben szerepet játszó, nagy molekulájú anyag

Populációgenetikai. alapok

Többgénes jellegek. 1. Klasszikus (poligénes) mennyiségi jellegek. 2.Szinte minden jelleg több gén irányítása alatt áll

Genetika. Tartárgyi adatlap: tantárgy adatai

Bakteriális identifikáció 16S rrns gén szekvencia alapján

A termesztett búza diploid őseinek molekuláris citogenetikai elemzése: pachytén- és fiber-fish.

Prof. Dr. Szabad János Tantárgyfelelős beosztása

BIOLÓGIA HÁZIVERSENY 1. FORDULÓ BIOKÉMIA, GENETIKA BIOKÉMIA, GENETIKA

MODELLORGANIZMUSOK GENETIKÁJA. Drosophila melanogaster, muslica (borlégy)

Johann Gregor Mendel Az olmüci (Olomouc) és bécsi egyetem diákja Brünni ágostonrendi apát (nem szovjet tudós) Tudatos és nagyon alapos kutat

Bevezetés a rendszerbiológiába

A Hardy-Weinberg egyensúly. 2. gyakorlat

Biológiai feladatbank 12. évfolyam

Poligénes v. kantitatív öröklődés

Molekuláris genetikai vizsgáló. módszerek az immundefektusok. diagnosztikájában

Intelligens Rendszerek Elmélete. Párhuzamos keresés genetikus algoritmusokkal

transzláció DNS RNS Fehérje A fehérjék jelenléte nélkülözhetetlen minden sejt számára: enzimek, szerkezeti fehérjék, transzportfehérjék

10. Genomika 2. Microarrayek és típusaik

A növény inváziójában szerepet játszó bakteriális gének

A replikáció mechanizmusa

A preventív vakcináció lényege :

Evolúcióelmélet és az evolúció mechanizmusai

Molekuláris biológiai eljárások alkalmazása a GMO analitikában és az élelmiszerbiztonság területén

Bevezetés a biológiába. Környezettan Bsc. Szakos hallgatóknak

NÖVÉNYGENETIKA. Az Agrármérnöki MSc szak tananyagfejlesztése TÁMOP /1/A

A genomikai oktatás helyzete a Debreceni Egyetemen

3. Általános egészségügyi ismeretek az egyes témákhoz kapcsolódóan

ADATBÁNYÁSZAT I. ÉS OMICS

NANOTECHNOLOGIA 6. előadás

GENOMIKA TÖBBFÉLE MAKROMOLEKULA VIZSGÁLATA EGYIDŐBEN

A DNS szerkezete. Genom kromoszóma gén DNS genotípus - allél. Pontos méretek Watson genomja. J. D. Watson F. H. C. Crick. 2 nm C G.

Domináns-recesszív öröklődésmenet

Egy 10,3 kb méretű, lineáris, a mitokondriumban lokalizált DNS-plazmidot izoláltunk a

DNS klónozása DNS klóntárak előállítása és szűrése

Evolúció. Dr. Szemethy László egyetemi docens Szent István Egyetem VadVilág Megőrzési Intézet

A géntechnológiát megalapozó felfedezések

A PKU azért nem hal ki, mert gyógyítják, és ezzel növelik a mutáns allél gyakoriságát a Huntington kór pedig azért marad fenn, mert csak későn derül

Szelekció. Szelekció. A szelekció típusai. Az allélgyakoriságok változása 3/4/2013

RNS-ek. 1. Az ősi RNS Világ: - az élet hajnalán. 2. Egy már ismert RNS Világ: - a fehérjeszintézis ben résztvevő RNS-ek

Biológus MSc. Molekuláris biológiai alapismeretek

MODELLORGANIZMUSOK GENETIKÁJA. Saccharomyces cerevisiae, pékélesztő, yeast. Az 1950-es évektől kedvelt modellorganizmus a genetikában.

Mit tud a genetika. Génterápiás lehetőségek MPS-ben. Dr. Varga Norbert

TEMATIKA Biokémia és molekuláris biológia IB kurzus (bb5t1301)

avagy az ipari alkalmazhatóság kérdése biotechnológiai tárgyú szabadalmi bejelentéseknél Dr. Győrffy Béla, Egis Nyrt., Budapest

A genetikai sodródás

Az orvosi biotechnológiai mesterképzés megfeleltetése az Európai Unió új társadalmi kihívásainak a Pécsi Tudományegyetemen és a Debreceni Egyetemen

MUTÁCIÓK. A mutáció az örökítő anyag spontán, maradandó megváltozása, amelynek során új genetikai tulajdonság keletkezik.

TÉMAKÖRÖK. Ősi RNS világ BEVEZETÉS. RNS-ek tradicionális szerepben

Evolúció. Dr. Szemethy László egyetemi docens Szent István Egyetem VadVilág Megőrzési Intézet

III/3. Gének átvitele vektorokkal

A SEJTOSZTÓDÁS Halasy Katalin

HAPMAP Nemzetközi HapMap Projekt. SNP GWA Haplotípus: egy kromoszóma szegmensen lévő SNP mintázat

In Situ Hibridizáció a pathologiai diagnosztikában és ami mögötte van.

BIOLÓGIA osztályozó vizsga követelményei évfolyam

A géntechnológia genetikai alapjai (I./3.)

A HUMÁNGENETIKA LEGÚJABB EREDMÉNYEI Péterfy Miklós

12/4/2014. Genetika 7-8 ea. DNS szerkezete, replikáció és a rekombináció Hershey & Chase 1953!!!

Új genetikai stratégia kidolgozása az Arabidopsis stressz válaszát szabályzó gének azonosítására

9. előadás: Sejtosztódás és sejtciklus

Evolúcióbiológia. Biológus B.Sc tavaszi félév

Balázs Anna. Az importin-béta 1 szerepe a kromatin 2 szerveződésében. Abstract

Molekuláris biológiai technikák

Epigenetikai Szabályozás

A Drosophila melanogaster poszt-meiotikus spermatogenezisében szerepet játszó gének vizsgálata. Ph.D. értekezés tézisei.

A bioinformatika gyökerei

Zárójelentés. Állati rotavírusok összehasonlító genomvizsgálata. c. OTKA kutatási programról. Bányai Krisztián (MTA ATK ÁOTI)

Dr. Máthéné Dr. Szigeti Zsuzsanna és munkatársai

Az anafázis promoting complex (APC/C) katalitikus modulja Drosophila melanogasterben. Nagy Olga

Szakmai zárójelentés. 1. Strukturális genomika Az RPS13 gén szekvenciájához homológ régió deléciója M. sativa-ban

INCZÉDY GYÖRGY SZAKKÖZÉPISKOLA, SZAKISKOLA ÉS KOLLÉGIUM

Természetes szelekció és adaptáció

Genetikai kölcsönhatások rendszerbiológiája

GÉNKLÓNOZÁS ÉS GÉNMANIPULÁCIÓ

Újpesti Bródy Imre Gimnázium és Ál tal án os Isk ola

A nukleinsavak polimer vegyületek. Mint polimerek, monomerekből épülnek fel, melyeket nukleotidoknak nevezünk.

BIOLÓGIA 11. ÉVFOLYAM I. beszámoló. A genetika alaptörvényei

Prokarióták. A sejtmag tehát csak eukariótákra jellemző. A magok száma

Sejtciklus. A nyugalmi szakasz elején a sejt növekszik, tömege, térfogata gyarapodik, mert benne intenzív anyagcserefolyamatok

Átírás:

HALADÓ GENETIKA Jegyzet Maróy Péter 2008 1

Tartalomjegyzék 1. Genomok és sajátságaik, ahogy a genom projektek mutatják 2. Eukarióta genetikai modell szervezetek és használatuk 2.1. Az élesztő 2.2. A lúdfű 2.3. A fonálféreg, a C. elegans 2.4. A borlégy 2.5. Az egér 3. Spontán mutációk 4. Új mutációk előállítása 4.1. Mutációk kiváltása Röntgensugárzással 4.2. Mutációk indukálása mutagén vegyszerekkel 4.3. Új allélok indukálása mozgékony genetikai elemek felhasználásával 5. Mutánsizolálási sémák 6. Genetikai kölcsönhatások 7. Felhasznált és ajánlott irodalom 2

1. GENOMOK ÉS SAJÁTSÁGAIK, AHOGY A GENOM PROJEKTEK MUTATJÁK Egy élőlény teljes genotípusán, a genomján a lény fejlődéséhez, életéhez és szaporodásához szükséges összes genetikai információt értjük. A genom tartalma leírható az összes gén genetikai módszerekkel végzett azonosításával. Világossá vált azonban, hogy nem minden gén elrontása eredményez fenotípus változást. Például az élesztő genom nukleotid sorrendjének megállapítását követő elemzés kimutatta, hogy ennek a genetikailag alaposan ismert élőlény génjeinek csak 40%-ához rendelhető fenotípus. A genetikai analízis alapvetően a genetikai boncolás elve alapján végzett vizsgálatokra korlátozódik. A teljes genotípus sokkal könnyebben leírható azonban a genomot alkotó DNS nukleotid sorrendjével. A nukleotid sorrend azután elemezhető, és jó hatékonysággal meghatározhatók, annotálhatók az egyes gének. Ezekből az adatokból azután elkészíthető a vizsgált élőlény (faj) génjeinek listája. Az annotált genomból kiolvasható az egyes gének mérete és egyéb sajátságai. Ez a megközelítés az elmúlt évtizedekben sokat fejlődött. A teljes genotípus megállapításának ezt a módszerét genom projektek során végzik. Genom projektek A vírusok és a fágok kisméretű genomjainak nukleotid sorrendje átfedő klónozott DNS darabok közvetlen szevenálásával, majd a sorrendek összeillesztésével, minden elvi nehézség nélkül megoldható. Ma több ezer ilyen lény nukleotid sorrendje található a Génbankban, 1-I. táblázat. 1.I. Táblázat. Azon élőlények száma, amelyeken folyó genom projekt 2008-ban előrehaladott állapotú. plazmid viroid Archea Bacteria eukarióta vírus 38 39 67 923 1623 1997 A baktérium néhány millió nukleotid pár méretű genomjainak szekvenálása két különböző stratégiával kezdődött. A vírusokhoz hasonlóan, átfedő klónokból készült géntár, génkönyvtár egyes tagjai sorrendjének leolvasása a közvetlen stratégia. Ezt az eljárást klón alapú szekvenálásnak nevezik. Az átfedő klónok azonosításához az egyes klónok fizikai térképét kell elkészíteni és ezek egyezése alapján lehet a klónozott szakaszokat összefüggő egységekbe, kontigokba rendezni. Az eljárás lépéseit az 1.1a. ábra szemlélteti. 3

1.1. ábra. Genom szekvenálási stratégiák folyamatábrája. Egy másik, az informatika támogatására jóval nagyobb mértékben támaszkodó eljárást a whole genom shotgun (WGS) szekvenálási stratégia. Ez utóbbit talán legsikeresebben genomrobbantás módszerének fordítja a magyar nyelvű irodalom. Ez esetben a genomi DNS-t mechanikai módszerrel, véletlenszerűen kisméretű darabokra tördelik, olyan apró szakaszokra, amik a darab teljes sorrendje leolvasható. A darabokat azután szekvenálásra alkalmas vektorba klónozzák, majd a klónok átfedésének megállapítása nélkül leolvassák az egyes szakaszok sorrendjét (1.1b. ábra). Annyi szekvenciát olvasnak le, ami a teljes genom sokszori (4-14x) szekvenálását adja. A sorrendeket azután számítógéppel, az azonos szakaszok átfedése alapján, összeillesztik. A folyamatos sorrendé összeillesztést az teszi lehetővé, hogy a baktérium genomok nem tartalmaznak ismétlődő szakaszokat, valamint a leolvasott szakaszokat határoló töréspontok eloszlása véletlenszerű. Így a sorrendek elvi nehézség nélkül, folyamatos, az egész genomot kiadó nukleotid sorrenddé rakhatók össze. Mindkét stratégia jól működik. A technika fejlődése a baktérium genom projektekben a második módszer használatát tette általánossá. Az eukarióta genom nukleotid sorrendje nem csak jóval nagyobb a baktériumok genomjánál, hanem jelentős arányban tartalmaz ismétlődéseket is. Az eukarióta genom 4

ismétlődő szakaszait régóta ismerik, azokat több vizsgálat megerősítette. Az eukarióta genomi DNS renaturációs kinetikája, a szatellit DNS-ek léte, vagy citológiailag a heterokromatin kiterjedése mind-mind az ismétlődő szakaszok elterjedését jelzi az eukarióták genomjában. Az eukarióta genom ismétlődő DNS tartalma jelentős, akár a genomot alkotó DNS felét is kiteheti (például bizonyos erszényes fajok esetén). Kiterjedt ismétlődő szakaszok klónozása mind elméleti, mind gyakorlati szempontból nehézséget jelent. Ezeket alacsony komplexitásuk miatt a klónozáshoz használt restrikciós enzimek vagy nem hasítják klónozható méretű darabokra, vagy az ismétlődésekben előforduló hasító-helyek gyakorisága miatt túl rövid szakaszokra esnek szét az emésztés során. Még ha sikerül is ezeket klónozni, sorrendjeik összeillesztése ugyancsak súlyos nehézségekkel jár. Az eukarióták genom méretének nagysága és az evvel járó sokféleség ugyancsak nehézséget okoz. Bár a géntár készítés alapelvével ellentétes, mégsem igazolható, hogy minden eukariótákból származó genomi DNS szakasz sikerrel tartható fenn bakteriális klónként. Mindezek elvi nehézségeket okoznak a klónozási stratégiák kidolgozása során. Ezért kezdetben nem látszott biztonságos stratégia a magasabb rendű eukarióták teljes genom sorrendjének leolvasására. Magasabb rendű eukarióta teljes genom nukleotid sorrend leolvasását célként először a Humán Genom Projekt tűzte ki. A projektet nem biológusok, hanem az Amerikai Egyesült Államok adminisztrációja kezdeményezte. Az erre a célra előirányzott 3 milliárd dollár azonban jelentős eredményekhez vezetett. A program tervezésekor nagy, átfedő genomi klónok szisztematikus szekvenálását látták biztonságosan megvalósíthatónak. A projektet két lépésre bontották. Először térkép létrehozását tervezték, majd a térkép szakaszainak nukleotid sorrendjét tervezték meghatározni. A térkép, miután DNS-ről van szó, fizikai térképet, azaz restrikciós hasító helyek sorrendjét, azok egymástól való távolságait jelenti. Először tehát a teljes humán genom átfedő, nagy genomi klónok fizikai térkép elkészítéséhez fogtak hozzá. A kiindulási DNS anyag több mint 100, a különböző emberi rasszok mindegyikét képviselő, véletlenül kiválasztott populációból származott. A klónok átfedései felismerhetők, és a C. elegans genom klónozása során kidolgozott módszerrel átfedések alapján egységekbe, úgy nevezett kontigokba, egy- 5

mással átfedő klónok csoportjaiba, rendezhetők. A teljesen összeszerelt kontigok elvileg megadják az egyes kromoszómák, vagy kapcsoltsági csoportok teljes fizikai térképét. A fizikai térkép egyes rövid szakaszainak sorrendje szisztematikus munkával leolvasható. A projekt tervezésekor a megvalósítás legkevésbé hatékony, és ezért időben korlátozó lépése a nukleotid sorrend leolvasása volt. Az ember genomjának fizikai térképezése 1988-ban kezdődött, és 2001-re készült el. A biológiában gigantikus vállalkozásnak számító Humán Genom Projekt során számos technikai előrehaladás történt. Így a polimeráz láncreakció (PCR) a hő stabil polimerázok felfedezése és elterjedése révén általános lett, megbízható, olcsó módszerré vált. A DNS szekvenálást automatizálták, megjelentek a DNS szekvenátorok. Jelentősen előrehaladt a laborok automatizálása, ami lehetővé tette nagyszámú minta hibamentes feldolgozását. Új stratégiák is megjelentek. Nagyon hasznosnak bizonyult a cdns stratégia, vagyis az EST-k (Expressed Sequenced Tags) bevezetése a genom projektbe. Tudvalévő, hogy az eukarióta genomok csak kis része (néhány százalék) kódol hírvivő RNS-t (mrns). Az mrns-be átírt sorrendek ráadásul véletlenszerűen szóródnak a genomban. A mrns-ek stabil DNS másolatai (cdns) könnyen klónozhatók, és előállítható egy-egy szövetből, vagy akár az egész élőlényből cdns könyvtár. Megfelelő vektor használatával a cdns klónok széli szekvenciái könnyen leolvashatók. Ezek a sorrendek képezik az EST-ket. Az EST sorrendek ismerete lehetővé teszi az azokra specifikus PCR primerek tervezését. A primerek birtokában könnyen és egyszerűen azonosíthatók azok a nagyméretű genomi klónok, amelyek tartalmazzák ezeket a sorrendeket. A módszerrel feltárható, hogy az egyes genomi klónok milyen EST-ket hordoznak. Két, azonos EST-t tartalmazó genomi klón át kell, hogy fedjen. Vagyis az EST szekvenciák segítségével hatékonyan szerelhetők össze kontigok, még akkor is, ha a fizikai térképek adataiból ez nem látszik teljesen bizonyosnak (például részleges ismétlődések esetén). Az EST stratégia hatékonysága jelentősen felgyorsította a Humán Genom Projektet. A stratégia gyümölcsözőnek bizonyult, más kevésbé bonyolult genommal rendelkező eukarióták időközben elkezdett genom projektjeiben is. Az EST szekvenciák használatának másik haszna, hogy azok egyúttal belépési pontokat kínálnak a nukleotid sorrendek leolvasásához is. 6

Két genetikai modell organizmus, a pékélesztő (Saccharomyces cerevisiae) és a fonálféreg (Caenorhabditis elegans) genomokról ismert, hogy azok nem, vagy csak kevés heterokromatint tartalmaznak. Ezekből a genomokból mintegy 40 kb méretű genomi géntárakat készítettek kozmid vektorokban. A kozmid klónok kontigokba rendezése után az egyes klónok nukleotid sorrendjének leolvasásával elkészült mindkét organizmus teljes nukleotid sorrendje. A pékélesztő volt az első eukarióta, a C. elegans volt az első többsejtes eukarióta amelynek, teljes genom szekvenciája elkészült. Ezek a sikerek a nemzetközi együttműködés szép példái. A muslica genomja komplexebb a C. elegansénál. A 180 Mb méretű muslica genom mintegy egy-harmada heterokromatin. A muslica négy kromoszómájának centromer körüli részei, valamint a teljes Y kromoszóma heterokromatikus. Bár a heterokromatin citológiai terminológia, molekuláris munkák igazolták, hogy az főként rövid egyszerű ismétlődő szakaszokból áll, amelyek a szokásos módon nem klónozhatók. A muslica esetében ismertté vált, hogy a heterokromatin ismétlődései jelentős részben mozgékony genetikai elemekre emlékeztető szekvenciákból áll, amelyet a riboszóma RNS-t kódoló gének tandem sorozata szakít meg. A klónozás szempontjából a nem klónozható szakaszokat tekinthetjük heterokromatinnak, a klónozhatókat eukromatinnak. A muslica genom eukromatinjának kiterjedése DNS hosszban mérve 120 Mb-nak becsülhető. A muslica genomból P1 (90-120 kb), YAC (140 kb) majd BAC vektorokban készültek a genom projekt számára genomi könyvtárak. Érdemes megjegyezni, hogy minden a muslica genom projektben használt genomi könyvtár ugyanabból az izogén y, cn bw sp (=yellow; cinnabar brown speck) muslicatörzs DNS-éből készült. A nagy genomi klón méret miatt a géntár a heterokromatin jelentős hányadát is tartalmazza. A muslica eukromatin szekvenálása 1999-ben kezdődött kontigokba rendezett P1, majd BAC vektorba klónozott templáton, a klónalapú szekvenálás biztonságos stratégiájával. A projekt állami támogatással készült, és első szakaszában mintegy 30 Mb sorrendet olvastak le. A muslica citológiai különlegességét kihasználva a P1 géntár klónjai közül több százat lokalizáltak a muslica nyálmirigy óriás kromoszómáján úgynevezett in situ hibridizáció eljárással. Ezek citológiai markereket jelentenek a genomban, és összekapcsolják a citológiai és a molekuláris térképet. A citológiai térképezéshez használt genomikus klónok 7

végi szekvenciáit is meghatározták. Ezek képezik az STS-eket (Sequence Tag Site). Az STS sorrendek ismeretében PCR primereket terveztek, amellyel az EST stratégiában ismertetett módon lehetővé tette a genomi klónok kontigokba rendezését. A projekt ezen állapotában a genom klónnal fedettsége 75%-osnak bizonyult, ami magas érték, de hiányok, rések is maradtak. A C. elegans genom szekvenálása tapasztalataiból ismerté vált, hogy az átfedések hiányát rendszerint nem lehet mindig ugyanabban a vektorban készült klónokkal azonosítani. Ezért más, hosszú genomikus szakaszokat befogadó vektorban, BAC (Bacterial Artificial Chromosome; baktérium mesterséges kromoszóma)-ban is készítettek muslica genomi géntárt. Ezekkel sikerült átfedni a hiányok jelentős részét, és elkészítettek a minimális átfedő P1 és BAC klónokból álló, a teljes genomot lefedő géntárt, ami a későbbiekben a teljes genom vázaként (scaffold) szolgált. Az egyes BAC és P1 klónok szekvenciáit plazmidba szubklónozták (átlagosan 3 kb DNS mérettel), majd meghatározták azok széli sorrendjeit. Ezekből a PCR stratégiával újra összerendeztek egy minimális klóntárat, ami most már átfedő plazmid klónokból áll. Ezekbe bakteriális transzpozont (γδ) ugrattak be. A transzpozon és a vektor sorrendekből tervezett primerekkel végzett PCR segítségével kiválogatták a kb 400 bp távolságra elhelyezkedő inzerteket hordozó klónokat, és ezeket szekvenálták. A szekvenciákból összerakták az eredeti P1 inzert teljes sorrendjét. Időközben a genomrobbantás stratégiát 0,5-6 Mb méretű prokarióta genomok szekvenálására használták. A szekvenálási technológiában megjelentek a megaszekvenátorok, amik a korábbi egy reakcióban 400-600 nukleotidnál sokkal hoszszabb sorrendek leolvasására képes. Fejlődött az automatizálás is, amely emberi kéz érintése nélkül kezel teljes géntárakat a baktérium tenyésztéstől a szekvencia leolvasásáig. Az adatok kezelését végző informatika is hatalmasat fejlődött. Felmerült tehát, hogy akár olyan bonyolult genom, mint az emberi, is leolvasható a genomrobbantás stratégiával. A stratégia ötlet gazdája, és sikeres alkalmazója, Craig Venter, egy modell kísérletre szánta el magát. Elhatározta, hogy az ember genomjánál jóval kisebb, de hasonlóan komplex muslica genomot leolvassa a genomrobbantás stratégiával. A cél megvalósításához három különböző inzert méretű WGS (Whole Genom Sequencing = genomrobbantás) könyvtárat készítettek: 2 kb, 10 kb és 130 kb átlagos 8

inzert méretekkel. A könyvtár készítéséhez ugyanazt a y; cn bw sp törzsből származó DNS-t használták, mint az állami muslica genom projekt, hogy az adatok jó illeszthetőségét biztosítsák. A különböző inzert méretű könyvtárakat a következő megfontolások miatt hozták létre. A 130 kb méretű BAC klónok végi sorrendjei (STS) adják meg az öszszeszereléshez szükséges szerkezetet. A 10 kb méretű inzertek elég nagyok ahhoz, hogy a transzpozon szerű sorrendek ismétlődéseit áthidalják. A 2 kb hosszúságú inzertek végig szekvenálhatók az un. megaszekvenátorokkal. Több mint 3 millió reakcióban olvasták le a szekvenciát. Ezek kb. 2%-ban adtak heterokromatikus ismétlődéseket. A BAC alapú fizikai térkép a korábbi STS térkép több mint 95 %-át lefedte. Váz szekvenciaként 825 BAC klón sorrendjét határozták meg. Ezután a rések betöltésére két stratégiát használtak. Egyrészt az STS-eket próbálták összekötni, másrészt új, a réseket átfedő BAC klónokat azonosítottak, és az ezekből készült al-géntárakat szekvenálták. A WGS stratégia eredményezte sorrendek összerendezése a teljes genom öszszeszerelési algoritmussal 50 váz szekvenciát eredményezett, amelyik összes hossza 114,8 Mb. A klón alapú szekvenálás adatai 84 rövid váz szekvenciát adtak, amelyek hossza 1,4 Mb. Ha ezeket együtt rendezték a WGS sorrendekkel a teljes genom algoritmusban, az a rések számát tovább csökkentette. Az összeköthetetlen váz sorrendek különösen gyakran fordultak elő az eukromatin-heterokromatin határon. Többféle, célzott kísérlettel próbálták ezeket kitölteni, azonban nem mindegyiket sikerült. A hiányzó szekvenciákat ezért heterokromatikusnak tekintették. A muslica heterokromatin sorrendjét (legalábbis a heterokromatin 77%-át) 2007- re sikerült megfejteni. Ez elsősorban az ismétlődéseket feldolgozó programcsomagok kifejlesztésével sikerült. A heterokromatinban legfeljebb 254 gén található. Míg az átlagos gén sűrűség a muslica eukromatinban 13 gén 100 kb-ra, addig a heterokromatinban átlagosan 4-5 gén esik ekkora DNS szakaszra. A sorrend legnagyobb részét (több mint felét) LTR, LINE és retrotranszpozon; tandem ismétlődések és szatellit; valamint DNS transzpozonok; illetve az eukromatinban is előforduló ismétlődések teszik ki. Mindezek aránya a különböző centromerekhez tartozó hetrokromatinban valamelyest különböző. Mennyire teljes a muslica WGS szekvencia? Közleményekből 2783 muslica gén bázissorrendje ismert. Ha ezek előfordulását vizsgálták a WGS-ből eredő teljes genom 9

sorrendben, objektív mércét kaphatunk arról, hogy milyen mértékben írja le a szekvencia a genomot. A 2783 génből 2778, azaz 97,5 % található meg a teljes genom szekvenciában. A hiányzó 6 gén mindegyikét eredetileg degenerált PCR segítségével azonosították, ami eleve bizonytalanságot jelent. Végül az összehasonlítás eredményéből arra következtethetünk, hogy a WGS stratégiával készült sorrend elég jó megfelelője a valóságnak. A muslica genom leolvasása igazolta, hogy a WGS stratégia alkalmas komplex eukarióta genom, így akár az ember genom nukleotid sorrend megállapítására is. Venter cége, a Celara nekilátott a humán genom szekvenálásának. A WGS projekt, öt embertől származó DNS-t használt, mint utólag kiderült, az egyik genom Craig Venter DNS-e. A szekvenálást gyorsan elvégezték. A sorrendek összeállításánál felhasználták a Humán Genom Projek által közzétett szekvenciákat. Sikerült együttműködést létrehozni a két projekt között, és 2000 június 26-án Bill Clinton és Tony Blair bejelentették, hogy sikerült felderíteni a humán genom vázlatos szerkezetét. A szekvenciában maradt rések bepótlása, és az ellenőrzések további két évet vettek igénybe. 2003 évet, a DNS szerkezete megfejtésének ötvenedik évfordulóját tekintjük az évnek, amikorra a humán genom nukleotid sorrendje teljességében ismertté vált. Azóta több eukarióta genomjának vált ismertté a teljes nukleotid sorrendje. A genom projektek szakaszai megadhatók. Ezek a géntár készítés, a kontigok összeszerelése, a sorrendek leolvasása és a gének határainak kijelölése (annotálása). A bioinformatika ma már lehetővé teszi, hogy a kontigokat a sorrendekből a számítógépen, és nem kísérletesen, a laboratóriumban kell összeszerelni. A genom tartalma. A genom DNS sorrend leolvasása után a szekvencia adatokat értelmezni kell. Nézzük, hogyan történt ez a muslica genom projekt esetén. A teljes genom nukleotid sorrendjének megállapítása után, a muslica genomban a gének kijelölését, annotációját 40 szakértő végezte egy hét-hetes intenzív jamboree - n. A gének kijelöléséhez két számítógépes programot használtak, a Genescan-t és a Genie-t. A Genescan általános program, ami a legtöbb eukariótában érvényes szabá- 10

lyok szerint jelöli ki a nyitott leolvasási kereteket. A Genie viszont muslicára optimalizált algoritmuson alapszik. A Genescan 17.464, a Genie 13.189 gént talál. Az eredményeket ellenőrizni lehet, hiszen a muslica 2,9 Mb méretű Adh (=alkohol dehidrogenáz) szakasza mind genetikailag, mind a sorrend tekintetében alaposan ismert. Az összehasonlítás azt mutatta, hogy a Genescan túl sok gént jelöl ki, míg a Genie a valóshoz közelebbi génszámot jósol. A muslica genomban összesen 56,673 exont találtak, amelyek 24,1 Mb DNS-t fednek le a 120 Mb eukromatinból. Az átlagos transzkriptum méret 3058 bp-nak adódik. Egy muslica gén átlagosan négy exont tartalmaz. A programok előrejelzéseit a szakértők összevetették az EST sorrendekkel is. Az EST adatbázis különböző fejlődési állapotokból és szövetekből készült cdns klóntárak sorrendjeit, azaz valós transzkripciós eredmények adatait tartalmazzák. Ugyancsak figyelembe vették a fehérjék hasonlósági adatait. Mindezek egybeesését használták a gén kijelölés feltételének, és csak a teljes megfelelés esetén annotálták. Az eredmény 13.601 gén lett, 1-II. Táblázat. A becsült több mint tizenháromezer génről készülő transzkriptumok minimális számát legalább 14.113-ra becsülik. Az annotált géneket CG (=Computed Gene) előtaggal és rendszerint 6 digittel azonosították. 1.II.Táblázat. A Drosophila gén előrejelzés összegzése Eredmény Genie + Genescan Genie Genescan Program nélkül összes EST-fehérje egyezés Csak EST Csak fehérje egyezés Nincs egyezés összesen 6.040 1.357 2.541 1.980 11.918 288 143 157 307 895 239 107 220 0 627 49 34 78 0 161 6.616 1.641 2.996 2.348 13.601 A kijelölt, annotált géneket funkciójuk szerint is osztályozták. A muslica gén típusok eloszlása általános példaként szolgálhat a többsejtű eukarióták genomjaihoz. Az osztályozást célzó munkát Gene Ontology (GO) projektben végezték. A csoportosítást három szempont szerint végezték, a gén termék molekuláris funkciója, biológiai szerepe és sejten belüli lokalizációja. Az összehasonlításokat a Saccharomyces Genom Adatbázis és az Mouse Genome Informatics adataival végezték. A csoportosítást funkcionális 11

csoportok és folyamatok szerint is elvégezték. A muslica genom esetén 7400 gén termékét sikerült szerepük szerint 39 fő funkcionális csoportba sorolni, valamint 4500 gén termékét lehetett 47 fő biológiai folyamathoz rendelni, lásd 1-III. Táblázat. 1.III. Táblázat. Muslica géntermékek csoportosítása funkció és biológiai folyamat szerint. Fő funkcionális csoportok No. Főbb folyamatok No. Nukleinsav kötés 1387 Anyagcsere Tf kötés Jel továbbító Sejt ciklus szabályzó Tumor szupresszor Ubiquitin Apoptózis gátló Motor fehérje Aktin kötő Immunfehérje Enzim Enzim aktivátor Enzim gátló Dajkafehérje Transzporter Ligand kötő fehérje Raktározó fehérje Sejt kapcsolat Szerkezeti fehérje Ismeretlen 21 622 52 10 11 15 98 93 47 2422 9 68 159 665 327 12 216 303 7576 Sejt kommunikáció Fejlődési folyamat Fiziológia folyamat Érzékelés Viselkedés Ismeretlen 2274 211 486 201 64 54 8884 12

A muslica gének több mint fele, 51%-a mutat jelentős homológiát emlősök génjeivel, ami jóval nagyobb arány, mint amit a fonálféregnél tapasztaltak, ahol ez csak 33 %. A muslica és a fonálféreg génjei 48 %-a mutatnak homológiát. A genom projektek új irányai A WGS stratégia sikerei azon túl, hogy számos élőlény genom projektjében használják néhány új alkalmazást is nyert. Venter újabb, Enviromental Genomics (Környezeti genomika) névvel új projektet indított. Az óceánok vizéből kiszűrt vízmintákból kivont DNS-ek sorrendjét határozzák meg, és ezekből a sorrend adatokból rakták össze a vízben élő lények genomját. Darwin utazásához hasonlóan körbeutazták a Földet, közben különböző mélységekből gyűjtöttek mintákat. A mintákból a 20 m-nél kisebb lényeket szűrők segítségével méret szerinti csoportokra bontották, majd ezek DNS tartalmát vizsgálják. Hatalmas mennyiségű szekvencia adatot kaptak. Vizsgálataik során azon túl, hogy számos, talán sosem látott élőlény genomja nukleotid sorrendjét megállapították, az adatok elemzésével majdnem a duplájára növelték a Génbankba bejegyzett fehérje sorrendek számát. Egy másik irányzat az egyedi genotípus vizsgálat. Az ember genomon végzett WGS projekt kezdeti szakaszában kiszivárgott, hogy az egyik DNS donor, mint már utaltunk rá, maga Venter volt. 2007-ben közzétették Venter genomja DNS sorrendjét, HuRef azonosítóval, méghozzá úgy, hogy ahol a diploid genomjában a két sorrend között különbség mutatkozott, azt külön meghatározták. Ezzel példát szolgáltattak arra, hogy egy-egy ember egyedi DNS sorrendje is meghatározható, és elemezhető. A HuRef diploid sorrendjeit egymással és a Génbank adataival összehasonlítva több mint 4 millió eltérést mutattak ki. Ezek vizsgálata alapján két fontos megállapítás tehető. A HuRef-re jellemző eltérések nagyobbik hányada (78%) SNP (Single Nucleotid Polymorphism), kisebb része (22%) inszerció, duplikáció, deléció, közös néven "indel". Az indelek aránya a vártnál jelentősen magasabb érték. Az eltérések száma a várakozásnál jóval magasabb. Különböző adatok alapján végzett becslésekből az emberi populációban 99,9% értéknek tartják az egyedei közötti DNS sorrend azonosságot. A HuRef sorrend felhasználásával végzett összehasonlítás ezt az értéket jelentősen, mintegy 99,5% értékre csökkenti. Ebből levonható a következ- 2.1. Az élesztő 13

tetés, hogy az emberek egyedisége a DNS szintjén is nagyobb mértékű, mint azt előzőleg feltételeztük. Egy az emberéhez hasonló méretű genom sorrendjének megállapítása és elemzése költséges folyamat. Ma ezt hozzávetőleg 30.000 USD-ra becsülik. A költségek nagyobbik része a DNS sorrend megállapításából, a szekvenálás költségeiből származik. A szekvenálás technológiája is fejlődött azonban. Új, például a piroszekvenálásnak nevezett eljárást dolgoztak ki, ami olcsóbb és gyorsabb a Sanger módszeren alapuló, hagyományos eljárásnál. Továbbá más szekvenálási technológiát is kifejlesztettek. Ezek azonban, egyelőre fejlesztés vagy bevezetés alatt állnak. Azt jósolják, hogy néhány éven belül egy az ember genomhoz mérhető DNS tartalom sorrendjének megállapítása 1.000 USD költségre csökkenhet. Ha ez valóssá válik, ezt az összeget akár az utca embere is meg tudja fizetni, hogy megismerje saját genotípusát. Jó lenne, ha addigra az orvostudomány is felkészülne az adatok értelmezésére! 2008 júniusában közzétették a hírt, hogy a DNS szerkezetének egyik megfejtője, James Watson genomját egy új technológiával ugyancsak leolvasták. A hír szerint a Roche 454 Life Sciences névvel azonosított új technológiáját használták a leolvasáshoz. Ugyanezt a technológiát használták a neandervölgyi ember, vagy a mamut genomjának vizsgálatára is. A DNS sorrend megállapítása a jövőben minden bizonnyal a felgyorsul és olcsóbbá válik. 2.1. Az élesztő 14

2. Eukarióta genetikai modell szervezetek, és használatuk A genetikai modell szervezeteken hagyományosan olyan élőlényeket értettünk, amelyek alkalmasak arra, hogy a genetika törvényszerűségeit megismerjük. A genetikai vizsgálatok során az élőlényt úgy használjuk, mint a biokémikus a kémcsövet, azaz nem az élőlény a vizsgálat tárgya, hanem a gén, amelyek sajátságait, működését, változásait, egyik nemzedékből a másikra jutását vizsgáljuk. Az elsőként használt genetikai modell szervezet nyilvánvalóan a kerti borsó, amelyet Mendel arra használt, hogy a genetika alaptörvényeit kidolgozza. Később más élőlényeket használtak, amelyek valamilyen szempontból előnyösek voltak egy probléma megoldására. A tapasztalatok halmozódása során kiderült, hogy vannak élőlények, amelyek használata szerencsés, mert több folyamat megismerésére alkalmasak. Természetesen minél több tapasztalat és ismeret gyűlt össze egy élőlényről, annál több felhasználás vált lehetővé. A genetikai vizsgálatokhoz használt élőlények köre is bővült, hisz a szövetes eukarióták mellett a mikrobák és a vírusok is fontosak lettek. A múlt század ötvenes-hatvanas éveire, mikorra a DNS szerkezetét megfejtették, lényegében a muslicát, az élesztőt, az E. colit és néhány fágot tekinthettünk genetikai modell szervezetnek. Persze lehet genetikai kísérleteket végezni a többi élőlénnyel is. Például a haszon- és dísznövények és állatok mindegyikének jól ismert a biológiája, szaporodási viszonyai és sok öröklődéssel kapcsolatos adat gyűlt össze róluk, valamint ami még fontosabb, sok változatot állítottak elő. Ezek a szervezetek azonban mégsem váltak modellé. Ezek a termésmennyiség vagy díszítő tulajdonságuk szempontjából kimagaslók, de mint alapkutatási eszköz nem bizonyultak sokoldalúan használhatónak. Ennek persze lehet az is az oka, hogy az ezekkel az élőlényekkel foglakozó szakemberek érdekeltebbek a genetika fejlődése szempontjából rövidtávú, nem genetikai problémák megoldásában, mint alapkutatási kérdésekkel kapcsolatos kérdések válaszának keresésében. Mielőtt azonban kiérdemelném a növény- és állatnemesítők, valamint az ember- és állatorvosok tiltakozását, arra hívnám fel a figyelmet, hogy nagyon sok, nagyon hasznos adat és információ gyűlt össze azokról az élőlényekről, amelyeket az ember évezredek óta termeszt és szaporít. Ebbe a körbe tartozik természetesen maga az ember is. A legtöbb adatot az emberről ismerjük. Ezek az élőlények mind alkalmasak bizonyos genetikai problémák tanulmányozására, és ezek ismeretében sokkal könnyebben építhető ki 2.1. Az élesztő 15

sokoldalú genetikai modell rendszer, mint egy a természetből a laborba csak most behozott élőlény estén. Manapság egy genetikai modell szervezetnek a genetikai kísérletekre való alkalmassága mellett ismert kell, hogy legyen nukleotid sorrendje is. Mikor is alkalmas egy faj arra, hogy a genetikusok jól tudják használni, és modellé válhasson? A modell szervezetté válás nem valami, nehezen meghatározható bölcsességen alapul. Egyes esetekben (pl. ecetmuslica) mégis ezt feltételezik egyes kutatók. Azonban minden muslicával dolgozó genetikus, ha megkérdezzük erről, azonnal felsorolja, hogy a muslica milyen biológiai sajátságai azok, amelyek miatt törvényszerű, hogy a muslica a legjobban kidolgozott, és legsokoldalúbban használható genetikai kísérleti állat. De akkor mégis mi kell ahhoz, hogy egy élőlény alkalmas legyen genetikai modellnek? Elsősorban az, hogy alkalmas legyen genetikai kísérletek végzésére, mégpedig klasszikus és molekuláris genetikai kísérletekre egyaránt. Mit is jelent ez? Azt, hogy az élőlény könnyen és gyorsan tenyészthető és szaporítható a laboratóriumban. Ehhez az is kell, hogy kicsi legyen a helyigénye és rövid az életciklusa. A kísérletező szándéka szerint, különösebben bonyolult vagy időigényes eljárás nélkül tetszőlegesen keresztezhető kell, legyen. Egy genetikai modell élőlény egy egyedének utódszáma a teljes élete során százas vagy ezres nagyságrendbe kell, hogy essen. Nem központi szempont, de nem is lényegtelen, hogy a tenyésztés maga, a táptalaj és a tenyésztés körülményeit biztosító berendezések olcsók legyenek. 2.I.Táblázat. Az egyes eukarióta rendszertani csoportokba tartozó fajok száma, amelyek a folytatott genom projektek eljutottak az összerendezésig 2008-ig. Az adatok az NCBI 2008 szeptemberi adatait tartalmazzák. csoport fajszám Ascomiceta gomba 75 Basidiomiceta gomba 10 egyéb gomba 3 zöld alga 2 szárazföldi növény 9 2.1. Az élesztő 16

laposféreg 1 hengeres féreg 6 egyéb állat 10 rovar 31 hal 9 kétéltű 0 hüllő 0 madár 2 emlős 36 Manapság, amikor több mint harminc eukarióta élőlény teljes genomja ismert, fontos, hogy a szóban forgó faj teljes genomjának nukleotid sorrendje vagy legyen ismert, vagy ne álljon nagyon távol ettől. Ma közel kétszáz eukarióta genom projekt van előrehaladott állapotban 2.I. Táblázat. A technika, amellyel teljes eukarióta genom nukleotid sorrendje leolvasható, hatékony, biztos, és jól kipróbált. Nem lehet azonban mindezt egy fáskamrában megcsinálni. Erre csak specializálódott laboratóriumok képesek. A muslica genom nukleotid sorrend leolvasása idején elterjedt anekdoták szerint, a nukleotid sorrend megállapítása a Celera laboratóriumában mindössze kilenc napig tartott, annak ellenére, hogy a szekvenátorok nem egész nap, hanem csak két műszakban dolgoztak. Ez jól jelzi a technika hatékonyságát. Ez a kísérlet azonban meglehetősen drága. Különösen akkor, ha ezt egy vagy néhány laboratórium által elnyerhető tudományos támogatások összegéhez viszonyítjuk. Milyen alapon választják akkor ki, azt az élőlényt, amelynek a nukleotid sorrendjét meghatározzák? Elengedhetetlen szempont, hogy legyen kidolgozott és jó hatékonyságú genetikai transzformációs rendszer, amellett az illető faj egyedeiből transzgenikus élőlények állíthatók elő. Ez a feltétel elég szigorú, és sok-sok a laboratóriumi tenyésztés szempontjából problematikus fajt kizár. Mindezekből kitűnik, hogy pusztán a teljes genom szekvenciájának ismerete, bármilyen fontos információ is, nem tesz egy fajt genetikai modell szervezetté. Ma lényegében öt élőlényt tekintünk egybehangzóan genetikai modellnek: a pékélesztőt, Saccharomyces cerevisiae, a lúdfüvet, Arabidopsis thaliana-t, a Caenorhabditis 2.1. Az élesztő 17

elegans nevű fonálféreg fajt, a muslicát, vagy régebbi magyar nevén borlegyet, a Drosophila melanogastert és a házi egeret, a Mus musculust; 2.II. Táblázat. 2.II. Táblázat. A genetikai modell szervezetek és genomjaik jellemző adatai. Összehasonlításul az emberi genom megfelelő adatai is szerepelnek a táblázatban. név Genom mérete Gének Átlagos gén Genom nukleotid (Mb) száma méret (kb) sorrend elkészülé- sének dátuma Saccharomyces cerevisiae 12 6.200 1,5-2 1996 Arabidopsis thaliana 120 26.000 4 2000 Caenorhabditis elegans 97 18.400 5 1998 Drosophila melanogaster 170 13.600 8 2000 Mus musculus 3.000 38.000 35-45 2005 Homo sapiens 3.000 21.000 35-45 1999 A modell szervezetek genomjainak mérete két nagyságrendet ölel fel. Génjeik száma a néhány ezertől a néhányszor tízezerig terjed. Világosan látszik, hogy a genom DNS tartalma és a DNS-ben kódolt gének száma nem mutat egyenes összefüggést. A genom projekt teljesülését megelőzően az ember génjeinek számát 100.000-re becsülték. Ez a szám az annotálás befejezése után 40.000-re csökkent, ma úgy gondoljál, hogy az ember génjeinek száma mindössze 21.000-re tehető. A gének mérete, az élőlény bonyolultsági szintjével nő. Az élővilág változatosságából arra lehet következtetni, hogy minden rendszertani egység genomjának ismeretéből értékes tudás nyerhető. Vagyis jó lenne mindenféle evolúciós stratégiát sikeresen képviselő lény genomját mind strukturálisan, mind funkcionálisan ismerni. Az ember élete, egészsége szempontjából bizonyára az emlős genomok szolgáltatják majd a leghasznosabb információkat. A genom projektek elterjedésének azonban határt szabnak a tudományos kutatás finanszírozásának korlátai, és a genom projekteket megvalósító szakemberek száma. 2.1. Az élesztő 18

2.1. Az élesztő A pékélesztő, a Saccharomyces cerevisiae egysejtű eukarióta. Egyszerű táptalajon, a baktériumokhoz hasonló módon, jól tenyészhető, 1 ml tápoldatban akár 10 8 sejt is előállítható. Életciklusa rövidebb, mint akármelyik többsejtű eukariótáé. Az élesztősejtek genetikai tanulmányozásának egyik fontos oka, hogy az élesztő képes a differenciálódásra. Az élesztő differenciálódása a többsejtűekhez nagyon hasonló mechanizmusokkal történik. Az élesztő sejtek plazmidokkal könnyen transzformálhatók. Az első plazmiddal transzformált eukarióta az élesztő volt. Az élesztő egy további előnye, hogy haploid és diploid sejtként egyaránt tenyészthető. A diploid állapot lehetővé teszi a genetikai analízis módszereinek közvetlen alkalmazását. Lehetséges a komplementációs analízis, a rekombinációs térképezés és kiválóan alkalmas a génkölcsönhatások vizsgálatára is. Egy másik élesztő faj a hasadó élesztő Schizosaccharomyces pombe is gyakran használt modellszervezet. Bár a pékélesztővel nem áll közeli a rokonságban, módszertanilag hasonló eszközökkel és kísérleti logikával tanulmányozható. A hasadó élesztő nem tárgya ennek a fejezetnek. Az élesztő életciklusa Az élesztő sejtek lehetnek haploidok (1n) vagy diploidok (2n). Mindkét állapotban kedvező tenyésztési körülmények között mitózissal osztódnak, miközben a ploidia szintjük fennmarad (2.1.1. ábra). A Saccharomyces cerevisiae sejtosztódása a jellegzetes sarjadzás, az egyenetlen sejtosztódás egy példája. A mitózis két leánysejtjének mérete a sejtek önállóvá válása idején jelentősen különböző. A diploid sejtek tápanyaghiány, éheztetés hatására meiótikusan osztódnak és spórákat hoznak létre. A spórák rendezetlen tetrádot alkotnak. A spórák haploid sejtek, vagyis a sporuláció a diploid-haploid átalakulás formája. A sporuláció úgy is felfogható, hogy kedvezőtlen körülmények között az élesztő génjei meiózissal összekeverednek, és az új génkombinációkat tartalmazó spórákkal kísérli meg az alkalmazkodást a kedvezőtlen környezeti viszonyokhoz. A haploid-diploid átalakulás is természetes része az élesztő életciklusának. Az élesztő sejtek kétféle párosodási típusú állapotban lehetnek (a és ). Az ellentétes pá- 2.1. Az élesztő 19

rosodási típusú sejtek képesek csak párosodni, úgy, hogy sejtmagjaik is összeolvadnak. A zigóta ploidia szintje diploid. 2.1.1. ábra. Az élesztő életciklusa. Az élesztő vegetatívan diploidként vagy haploidként egyaránt szaporodik. A haploid diploid átalakulás párosodással történik, a diploid-haploid átalakulás a sporuláció során bekövetkező meiózissal történik. (Hartwell: Genetics: From Gene to Genomes, 2nd Ed. p.745, Fig A.8) Az élesztő genom A Saccharomyces cerevisiae sejtmagja 16 kromoszómát tartalmaz. Minden kromoszóma egyetlen centromert hordoz, amelyekhez egyetlen húzófonál kapcsolódik (2.1.2. ábra). Ismétlődő szekvenciákat a telomerek közelében találunk, ezek egy hosszabb telomer alatti (szubtelomerikus) és egy rövidebb telomer közeli (telomerikus) szakaszra tagolódnak, az utóbbi egészen a kromoszóma végéig nyúlik. 2.1. Az élesztő 20

2.1.2. ábra. Élesztő kromoszómák. (a) élesztő kromoszóma részei (b) élesztő kromoszómák molekuláris kariotípusai. Pulzáló terű elektroforézissel a kromoszómák méret szerint elválaszthatók. (Hartwell: Genetics: From Gene to Genomes, 2nd Ed. p.740, Fig A.2) Az élesztő kromoszómák replikációját a kromoszóma egész hosszában, 30-40 kb-ként szétszórt replikációs kezdőpontok biztosítják. A kromatin nukleoszómákba szerveződött. Fizikai térkép Az élesztő kromoszómák DNS tartalma abba a tartományba esik, amelyek mérete pulzáló terű elektroforézissel közvetlenül leolvasható. A legkisebb az I. kromoszóma 235, a legnagyobb pedig a XII., amely 2.060-3.060 kb méretű. A különböző törzsek XII. kromoszómái méret különbségeit a rdns okozza. Egyes törzsekben a XII. kromoszómán lévő riboszóma RNS gének ismétlődéseinek száma 100-200-al különbözik más törzsekétől. Az élesztő genom teljes hossza 12 Mb, amihez hozzájöhet még 2-3 Mb rdns. Az élesztő teljes genom DNS nukleotid sorrendjét 1996 áprilisában közölték. Az élesztő genom adatbázist Stanford egyetemen tartják fenn. http://www.yeastgenome.org/. Az élesztő genetikai térképe Részletes élesztő genetikai térkép készült, amelyen kb. 1000 marker szerepel. A genetikai térképezésre az élesztőben a tetrádok adnak lehetőséget. A genetikai térkép teljes hossza 4400 cm. Ez sokkal hosszabb, mint a többi gombáé. Az élesztő rekombinációs enzim rendszere rendkívül aktív. Ezért az élesztő genetikai térképe nagy felbontású. Ugyanez magyarázza, hogy az élesztő kromoszóma szakaszokat hordozó plazmidok homológ rekombinációval könnyen beékelődnek az élesztő kromoszómába, míg más élőlényekben ez csak rossz hatásfokkal, vagy illegitim (nem-homológ) rekombinációval történik meg. 1 cm genetikai térképtávolság fizikai hossza 3 kb DNS. A gének sorrendje és az azok közötti genetikai és fizikai távolságok kolineárisak, lényegében megfelelnek egymásnak (2.1.3. ábra). 2.1. Az élesztő 21

2.1.3. ábra. A genetikai és a fizikai térkép összehasonlítása. A III kromoszóma génjeinek távolságát rekombinációval, fizikai távolságaikat nukleotid sorrend leolvasásával határozták meg. A génsorrendek azonosak, bizonyos gének között a két módszer esetében különbségek találhatók. (Hartwell: Genetics: From Gene to Genomes, 2nd Ed. p.741, Fig A.3) Gének száma Az élesztő génjeinek számát 6.000-6.500-re becsülik. A teljes nukleotid sorrend leolvasása számítógépes programokkal lehetővé tette a nyitott olvasási keretek (ORF) megállapítását. Ezek a programok több feltétel (például azonos olvasási keretben lévő transzlációs start és stop kodon, jellegzetes promóter motívumok előfordulása a starthely előtt, stb.) alapján jelölik ki az ORF szekvenciákat. Ha az összes lehetséges ORF szekvenciák száma hatalmas, több mint negyedmillió. Ez a szám nyilvánvalóan túlbecslés. A program által kijelölt leggyakoribb olvasási keretek nagyon rövid, mindössze néhány aminosavat kódolnak. Az élesztő fehérjék mérete általában 100 aminosavnál nagyobb. A 100 aminosavnál hosszabb olvasási keretek száma 7.500 körüli. Ez az érték közeli a genetikai alapon becsült génszámhoz. Ezért a gének a legalább 100 aminosavat kódoló ORF-et tekintik. A küszöb érték azonban mesterséges, mivel néhány, 100 aminosavnál hosszabb fehérjét kódoló ORF-ről is igazolódott, hogy nem készül róla fehérje, és néhány 100 aminosavnál kisebb ORF-ről pedig készül géntermék. Pontosan nem tudjuk megmondani, hogy hány gén alkotja az élesztő genomot, a legjobb becslésnek a 6.000-6.500 értéket tartják. Legalább 2.000 élesztő gén funkciója ismeretlen, a nukleotid sorrenden kívül sem genetikai, sem biokémiai adat nem ismert ezekről, és elrontásuk nem eredményez fenotípus változást. Szisztematikus, kísérletben, amiben egyenként rontottál el a géneket, azt tapasztalták, hogy a gének 20%-ának elrontása megöli a haploid élesztő sejtet. Vagyis az élesztő gének 20% esszenciális. 2.1. Az élesztő 22

Az élesztő gének általában intron mentesek. A gének mindössze 5 % tartalmaz, általában csak egyetlen intront. A magasabb rendű eukariótákban nem ritka, szabályozó szakasz nélküli pszeudogének száma az élesztő genomban nagyon alacsony. A fehérjét nem kódoló gének közül az élesztőben a riboszómális RNS génjeit, majdnem 300 trns gént, néhány kis RNS-t kódoló gént, az RNaseP-t, az RNS érésben résztvevő endoribonukleáz MRP-t és a telomerázt találjuk. A genom szerveződése Az élesztő genom kevés többszörösen ismétlődő szakaszt tartalmaz. A leggyakoribb a rdns, amely 100-200 példányban fordul elő. A főbb ismétlődő szakaszok még a trns gének, a szubtelomerikus ismétlődések és a Ty retrotranszpozon. Az 5,4-6,3 kb hosszú Ty elem mintegy 50 példányban, a kromoszóma teljes hosszában szétszórva fordul elő. Ennél jóval gyakoribb, majdnem 400 példányban fordul elő a Ty elem végi ismétlődése. Ezek a szekvenciák jelzik a korábbi Ty inszerciók helyét. Ezek feltehetőleg az elem végi ismétlődései között lejátszódó, az Ty szekvencia belső, nem ismétlődő részét eltávolító rekombináció eredményei. A genom ismétlődéstől mentes részén a gének egyenletesen eloszolva helyezkednek el. Egy génre átlagosan 1,5-2 kb DNS jut az élesztőben. A genom tömör, 75%-a íródik át RNS-é. Az élesztő genom vizsgálatából az is kiderült, hogy az élesztő kromoszómák sok duplikációt (olyan szakaszt, több mint egy példányban fordul elő a genomban) hordoznak (2.1.4. ábra). 2.1. Az élesztő 23

2.1.4. ábra. Az élesztő genom kromoszóma duplikációi. Az ábra az élesztő 16, azonos centromer helyzetbe rendezett kromoszómáján (vízszintes vonalak) mutatja a duplikált szakaszokat. A duplikációkat színes négyszögek jelzik. (Hartwell: Genetics: From Gene to Genomes, 2nd Ed. p.743, Fig A.5) Az élesztő genom duplikációinak jelentős száma és kiterjedése meglepő. A duplikációk eredete azzal magyarázható, hogy a mai élesztő egy tetraploid őstől származik, amely mintegy 100 millió évvel ezelőtt élt. Az ősi élesztő genomjából sok szakasz elveszett, más részek átrendeződtek. Az élesztő fehérjéi között 15%-ra becsülik azok számát, amelyek duplikációval jöttek létre. Az élesztő genetika eszköztára Transzformáció és szelekciós markerek Az élesztő sejtek könnyen transzformálhatók plazmid DNS-el. A hatékony transzformációhoz szelekciós markerek szükségesek. Élesztő molekuláris rendszerekben az élesztő saját génjei használhatók markerként. Transzformációnál auxotrof/prototrof markerpárt használnak. A leggyakrabban használt markerek az ADE2 (adenin auxotrof), a LEU2 (leucin auxotrof), a URA3 (uracil auxotrof) és a TRP1(triptofán auxotrof). Ezek segítségével a gén vad allélját hordozó plazmid transzformációjára szelektálhatunk az illető gén null allélját hordozó sejtekben. 2.1. Az élesztő 24

A leggyakrabban használt markereknek más előnyös tulajdonságai is vannak. Az ADE2 mutáns sejtek például piros festéket termelnek. Ezzel a sajátsággal könnyen megkülönböztethetjük az ADE2 és az ADE2+ sejteket. Ez a tulajdonság szelekció nélkül is alkalmas a transzformáció sikerességének, vagy a plazmid vesztés követésére. Az URA3 és a TRP1 gének alléljai szelekcióra és ellenszelekcióra is alkalmasak. Amíg például az URA3 sejtek csak uracil jelenlétében nőnek, addig az URA3+ sejtek kiölhetők az uracil egy toxikus analógjával az 5 -fluor-orotsavval (5-FOA). A TRP1+ sejtek ellenszelektáló anyaga az 5 -fluor-antranilsav (5-FAA). Élesztő plazmidok Az élesztő transzformálására használt plazmidok kétfélék (2.1.5. ábra), egyik részük nem képes autonóm replikációra az élesztőben (YIp), másik részük önálló replikációra képes. Élesztő replikációs origót nem hordozó plazmidok nem replikálódnak. Ha azonban a plazmid tartalmaz élesztő kromoszóma szakaszt, akkor azon keresztül homológ rekombinációval beépül a gazda sejt genomjába, vagyis integrálódik (innen a neve Yeast Integrating plasmid, YIp). Az integráció ritka jelenség, ezért a stabil transzformánsok előállításánál szelekciót alkalmaznak. Az autonóm módon replikálódó élesztő plazmidok vagy plazmid replikációs origót, YEp vagy élesztő centromert, YCp tartalmaznak. Élesztő plazmid replikációs origóként általában az u.n. 2 természetes plazmid replikációs origóját használják. Ez a replikációs origó körülbelül 20 plazmidot eredményez sejtenként, ami a klónozott gén termékének túltermelését eredményezheti. Az élesztő centromert hordozó plazmidok sejtenként egyetlen példányban fordulnak elő, és a sejtosztódás során úgy viselkednek, mint a kromoszómák, azaz meiózis során szegregálnak. Hajlamosak a nondiszjunkcióra ezért használatuk odafigyelést igényel. 2.1. Az élesztő 25

2.1.5. ábra. Élesztő plazmidok. (Hartwell: Genetics: From Gene to Genomes, 2nd Ed. p.744, Fig A.6) Minden élesztőben használt vektor ingázó (shuttle) vektor, azaz élesztőben és E. coliban is fenntartható. A plazmidok az élesztő szelekciós markereken kívül baktérium szelekciós markereket, leggyakrabban ampicillin vagy tetraciklin rezisztencia markereket is hordoznak. A DNS manipulációt a baktériumban végezzük, majd a plazmidot izoláljuk, és bejuttatjuk az élesztő sejtbe. Géncsere A magas rekombinációs aktivitásnak köszönhetően az élesztőben a géncsere könnyen kivitelezhető. Géncserével, nagy biztonsággal állítható elő null allél. Allécserék is lehetségesek. A géncsere további előnye, hogy a sugárkezelés és a kémiai mutagenezissel szemben változatlanul hagyja a genetikai hátteret. A géncseréhez szükséges allélt in vitro készítik el nem integráló plazmidban, és transzformációval juttatják az élesztő sejtbe. Az élesztőben hatékonyan működik a transzformáció homológ lineáris DNS szakasszal is! Az új allél lehet a kicserélni kívánt gén deléciós, inszerciós, vagy egy bizonyos mutációt hordozó allélja. Null allél előállítása céljából gyakran építenek a génbe szelektálható élesztő gént (például URA3). A be- 2.1. Az élesztő 26

ékelt idegen szakasz megszakítja az eredeti gén kódoló részét és így inaktiválja azt. A sikeres géncsere után a fúziós gén termékek a beépített génre (URA3) specifikus ellenanyaggal, könnyen kinyerhetők. Ha diploid sejtben hajtjuk végre a géncserét, akkor az esszenciális gének null alléljai is előállíthatók. A transzformáció ritka esemény, ezért diploid élesztőben a géncsere után heterozigóta sejtek jönnek létre, amelyek egy kicserélt és egy vad alléllt tartalmaznak. Ha a null allél recesszív ez a kombináció életképes. Meiózis során azonban az allélok szegregálnak és külön vizsgálhatók, vagy ha az életképességük megengedi az új allélt hordozó törzs izolálható. Egy a géncsere lehetőségeit bemutató példa látható a 2.1.6. ábrán. A géndózis változtatása Az élesztő plazmidok többfélesége és az élesztő transzformáció megbízhatósága közvetlen lehetőséget nyújt a géndózis módosítására. Integrálódó plazmiddal és élesztő mesterséges kromoszómával az élesztő sejtbe, sejtenként egy számfeletti gén, vagy kromoszóma szakasz juttatható be. A plazmid transzformáció kihasználható arra is, hogy a fenotípus változást okozó mutáns gént azonosítsuk. A mutáns sejtekbe élesztő genomikus, vagy cdns génkönyvtárat transzformálunk. Abból a sejtből, amelyikben a mutáns fenotípus a transzformáció hatására komplementálódik (vad típussá változik) visszaizolálva a genomikus klónt, a klón DNS sorrendjének vizsgálatával azonosítható a keresett gén. Önálló replikációval rendelkező plazmidot használva a kiválasztott gén dózisa sokszorosára (pl. 20x) növelhető. Egy sor gén esetében a géndózis növelése önmagában fenotípus változást eredményez. A gén dózis fokozás lehetővé teszi funkciónyeréses, domináns fenotípusú mutánsok előállítását is. A legtöbbször ugyanis a domináns fenotípusú allél hatását kompenzálja a vad allél több példánya. 2.1. Az élesztő 27

2.1.6. ábra. Génkiütés és géncsere. A géncseréhez először a gén középső részét kicserélik az élesztő szelektálható URA3 génjével. Amikor a fragmentumot transzformáljuk egy diploid élesztő sejtbe, az szekvencia homológia alapján rekombinálódik a kromoszómális génnel és a gén vad típusú példánya kicserélődik mutáns változatra. A sporuláció során a heterozigóta diploid két a kicserélt gént hordozó, és két vad típusú spórát termel. Ha a gén esszenciális, a kicserélt gént hordozó sejtek elpusztulnak. (Hartwell: Genetics: From Gene to Genomes, 2nd Ed. p.745, Fig A.7) Differenciáció az élesztőben A sejttípus meghatározás Az eltérő, és a párosodási típusú haploid élesztő sejtek képesek párosodni, és ilyen módon diploid sejteket létrehozni. Mindkét sejttípus termel párosodási feromont, az a sejt a-feromont, az sejt - feromont. A feromonokat az ellentétes párosodási típusú sejt felszíni receptorai érzékelik. A feromon hatására az osztódás leáll, a sejt felületén egy kis kitüremkedés (shmoo) jön létre a feromon forrás irányában. Majd a sejtek egyesülnek, végül sejtmagjaik is öszszeolvadnak. Microarray kísérletek igazolták, hogy a feromon válasz során több mint 200 gén transzkripciója jelentős mértékben emelkedik, miközben másik, ennél valamivel kevesebb gén transzkripciója csökken. Az típusú sejtekben egy sor gén ( -specifikus gének) aktív, ugyanakkor ugyanezek a gének az a-típusú sejtekben kikapcsolt állapotban vannak. Az a-típusú sejtek- 2.1. Az élesztő 28

ben, viszont más, a-specifikus gének aktívak, és az -specifikus gének azonban inaktívak. A párosodási típus specifikus gének tipikus példái a megfelelő feromon termeléséért felelős és az ellentétes típusú feromon receptor génjei. A haploid specifikus gének mindkét haploid sejttípusban aktívak. Mind a feromonok mind a receptoraik különböző gének termékei. A párosodást érintő genetikai hiba steril fenotípust eredményez. A sterilitás ez esetben azt jelenti, hogy a mutáns sejt nem párosodik az ellenkező párosodási típusú sejttel. A számos steril élesztő mutáns egyik csoportja a MAT lókuszba térképeződik. Az élesztő párosodási képességének kialakításában a MAT lókusz játszik fő szerepet. A lókusz két (MATa és MAT formában fordul elő, az előző az a, az utóbbi az párosodási típusért felelős. A MATa és MAT rekombinációval nem hozható cisz helyzetbe, a heterozigóta diploid sejtek meiózisából létrejövő tetrádokban a két genotípus mindig 2:2 arányban hasad. Ezekből arra következtethetünk, hogy a két forma allélikus. Az a tény, hogy az egyes párosodási típusú sejtekben az ellentétes típusért felelős gének represszáltak, jól szemlélteti, hogy a MATa/MAT diploid heterozigóta steril, és párosodásra képtelen. Ezekben a heterozigótákban mind az a-, mind az -specifikus gének inaktívak. A MAT /MAT és a MATa/MATa homozigóta diploidok hatékonyan párosodnak mind haploid, mind diploid, ellenkező párosodási típusú sejtekkel, ami igazolja, hogy a sterilitásért nem a diploid állapot a felelős. A MAT lókusz két alléja tehát úgy tartja fenn a párosodási típusokat, hogy azokban aktiválja az illető típusra jellemző, és elnyomja az ellentétes típusra jellemző gének működését. A diploid heterozigótában a két különböző MAT allél mindkét párosodási típusának működéséhez szükséges gének represszáltak, ami sterilitáshoz vezet. Meglepő, és szokatlan, hogy egy lókusz két allélja több génre is ellentétes hatást fejt ki. A MAT amorf alléljai két steril komplementációs csoportot (MAT 1 és MAT 2) képeznek. Az amorf MAT 1 sejtek nem termelnek feromont, és a többi specifikus génjük is inaktív. MAT 1 szerepe tehát az specifikus gének aktiválása. MAT 2 mutáns sejtekben viszont mind az, mind az a specifikus gének aktívak. A MAT 2 funkciója tehát, az a-specifikus gének kikapcsolása. Kettős mutáns, 1 2 sejtek ugyanúgy 2.1. Az élesztő 29