Tusnády E. Gábor. Sztochasztikus modellek a fehérjekutatásban. Doktori (Ph.D.) értekezés. ELTE TTK Szerkezeti Biokémia Program

Méret: px
Mutatás kezdődik a ... oldaltól:

Download "Tusnády E. Gábor. Sztochasztikus modellek a fehérjekutatásban. Doktori (Ph.D.) értekezés. ELTE TTK Szerkezeti Biokémia Program"

Átírás

1 Tusnády E. Gábor Sztochasztikus modellek a fehérjekutatásban Doktori (Ph.D.) értekezés ELTE TTK Szerkezeti Biokémia Program Témavezető: Dr. Simon István Készült: a Magyar Tudományos kadémia Szegedi Biológiai Központjának Enzimológiai Intézetében Budapest 1999

2 Tartalomjegyzék TRTLOMJEGYZÉK 1. Bevezetés 4 2. Irodalmi áttekintés z aminosav szekvenciák jellemzése szekvenciák rendezettsége Hasonlósági mátrixok Transzmembrán fehérjék z integráns membránfehérjék általános felépítése Transzmembránhélix predikciók z BC transzporter család és az MRP rokon fehérjék Statisztikai eljárások a fehérje kutatásban Dinamikus programozási eljárások Rejtett Markov eljárások Célkitűzések Felhasznált módszerek és eszközök datbázisok, felhasznált adatok Szekvencia adatbázisok Transzmembrán fehérjék topológia adatai függetlenségi divergencia divergencia definíciója divergencia használata aminosav hasonlóságok becslésére Transzmembrán fehérjék topológiájának becslése becsléshez használt rejtett Markov modell becslés menete modell paraméterei becslés pontosságának mérése Programok, egyéb predikciós eljárások Eredmények z aminosavak kicserélhetősége a függetlenségi divergencia alapján z MRP rokon fehérjék és membrántopológiájuk Transzmembrán fehérjék topológiájának becslése rejtett Markov modell

3 TRTLOMJEGYZÉK predikció pontossága predikciós módszerek összehasonlítása hipotézis igazolása Összefoglalás Hivatkozások z értekezés alapjául szolgáló közlemények jegyzéke Egyéb közlemények jegyzéke Köszönetnyilvánítás Függelék Diszkrét Markov folyamatok diszkrét Markov folyamatok kiterjesztése rejtett Markov modell elemei rejtett Markov modell három alapfeladata z első feladat megoldása második feladat megoldása harmadik feladat megoldása

4 ÁBRÁK JEGYZÉKE Ábrák jegyzéke 1. Szekvencia és térszerkezeti adatbázisok mérete transzmembrán fehérjék három alaptípusa Bináris aminosav hasonlósági fák (I) Bináris aminosav hasonlósági fák (II) Bináris aminosav hasonlósági fák (III) z MRP1 és CFTR szekvenciaillesztett hidrofóbicitási görbéje z MRP alcsalád transzmembránhélixek közötti szekvenciadarabok hosszúságának eloszlása transzmembrán fehérjék tipikus szerkezeti elemei transzmembránhélix predikcióhoz használt rejtett Markov modell architektúrája Elsőrendű diszkrét Markov modell rejtett Markov modell forward-backward algoritmus rejtett Markov modell paramétereinek újrabecslése Táblázatok jegyzéke 1. PIR (34.0) adatbázis szűrése Transzmembránhélix topológia becslő programok URL címei z aminosavak távolság mátrixa z aminosav hasonlósági mátrixok korrelációja transzmembránhélix predikció pontossága Különböző topológia becslő eljárások pontossága

5 Bevezetés 1. Bevezetés z élő szervezetek legérdekesebb makromolekulái a fehérjék, amelyek néhány építőelemet felhasználva a legváltozatosabb szerkezeteket spontán módon képesek kialakítani. z építőkövek az aminosavak a fehérjékben láncszerűen kapcsolódnak össze, és az aminosavaknak a láncban való sorrendjének megadása elegendő a fehérje teljes szerkezetének és működésének megadásához. Ezt az információt az élőlények genomjában a DNS molekulák tárolják, amelyről bonyolult szabályozási rendszereken keresztül szintetizálódnak a fehérjék. hatvanas évek elején nfinsen most már klasszikusnak mondható kísérletével megmutatta, hogy a fehérjék polipeptidlánca spontán módon képes felcsavarodni, azaz a fehérjére jellemző háromdimenziós szerkezetet kialakítani. Kutatók ezreit foglalkoztatja azóta a kérdés, hogyan megy végbe ez a folyamat, valamint, hogy az aminosav sorrend mi módon határozza meg a térszerkezetet. fehérjék háromdimenziós szerkeze- tének kísérleti meghatározása lényegesen GENBNK (nukleotid) SWISS-PROT (fehérje) PDB (térszerkezet) nehezebb feladat, mint az aminosavak sorrendjének meghatározása. Ez utóbbi az automatizált DNS szekvenálás révén rutinfeladattá vált, és mostanra annyira felgyorsult, hogy ma már néhány alacsonyabb rendű élőlény teljes genomiális DNS-ének bázissorrendje ismertté vált. térszerkezet és az aminosav sorrend meghatározás ne- Darab Évek 1. ábra. szekvencia és térszerkezeti adatbázisokban levő fehérjék számának változása az évek függvényében hézsége közötti különbség eredményeképpen a szekvencia adatbankok mérete meszsze meghaladja a térszerkezeti adatokat tartalmazó adatbankok méretét, és a kettő különbsége évről évre exponenciálisan nő (1. ábra). szekvencia adatbázisok rohamos növekedésével lehetőség nyílt az aminosav szekvenciák statisztikai vizsgálatára. z első statisztikai eljárások a 70-es évek közepén jelentek meg, és már ezek a vizsgálatok is utaltak arra, hogy az aminosavak nem rendezetlen, véletlen módon következnek egymás után a szekvenciában. szekvencia és a térszerkezet közötti összefüggések feltárására több statisztikai eljárás látott napvilágot, ezek közül a legtöbb a szekvencia és a másodlagos szerkezet közötti kapcsolatot vizsgálta. Napjainkban egyre több olyan eljárást dolgoznak ki, amelyek önállóan tanulják meg a szekvenciákban rejlő szabályokat, és ezáltal a fehérjék egyes térszerkezeti tulajdonságait képesek predikálni 1. 1 z angol prediction szó az Országh szótár szerint jóslást, jövendölést jelent. Mivel el szeretném kerülni a magyar kifejezések okkult jelentését, ezért meghagyom predikció-nak, vagy a becslés szóval fordítom. 4

6 Bevezetés z aminosav szekvenciák vizsgálata két szintet érint. Egyrészt az eredményeket az ismert szekvenciájú, de ismeretlen tulajdonságú fehérjék szerkezet predikciójához használhatjuk fel, másrészt a statisztikai vizsgálatok célja a fehérjékre általánosan jellemző tulajdonságok feltárása, végső soron a háromdimenziós kód megfejtése. vizsgálatok során célszerű figyelembe venni a fehérje szerkezet kialakulásakor szerepet játszó, illetve a szerkezet fenntartásához szükséges kölcsönhatásokat, amelyeket alapvetően két osztályba sorolhatunk: az aminosavak közötti és az aminosavak és környezetük közötti kölcsönhatásokra. z egyes aminosavaknak a fehérjén belül valamely más aminosavval való kölcsönhatása létrejöhet a szekvenciában közeli aminosavak között (rövidtávú kölcsönhatás), vagy szekvenciálisan távoli, de térben közeli aminosavak között (hosszútávú kölcsönhatás). dolgozat első részében azt vizsgáltam, hogy a rövidtávú kölcsönhatások miatt kialakuló rendezettséget hogyan mérhetjük, illetve ennek alapján mely aminosavak cserélhetők ki a szekvenciában a szerkezet megváltozása nélkül. dolgozat következő részében egy konkrét fehérje esetében, az BC (TP Binding Casette) transzporterek családjába tartozó MRP1 (Multidrug Resistance-associated Protein) fehérjén mutatom meg a szekvencia vizsgálatok gyakorlati életben való felhasználását, és a kísérletek tervezéséhez való fontos hozzájárulását. Ezek a vizsgálatok irányították a figyelmemet az értekezés harmadik részében leírt transzmembrán fehérjék szerkezetének kialakításában fontos szerepet játszó tényezők kutatására, amely során a kölcsönhatások előbb említett második csoportja, a fehérje molekula és környezete között levő kölcsönhatások kerültek előtérbe. fehérje szekvenciák statisztikai vizsgálatai során ilyen kölcsönhatásokat eddig még nem vettek figyelembe. z aminosav szekvenciákat tekinthetjük időbeli folyamatoknak, ahol az idő az aminosavaknak a fehérje N-terminálisától számított sorszámának felel meg, ezért csak diszkrét, egységnyi értékeket vehet fel, az aminosavak pedig az adott időponthoz tartozó megfigyelést jelentik. Ebben az értelemben a szekvenciák sztochasztikusnak tekinthetők, ezért a statisztikusok által használt sztochasztikus modellek felhasználhatók a szekvencia vizsgálatoknál. Így bevezettem a vizsgálatok során a bioinformatika területén eddig még nem használt függetlenségi divergencia használatát, valamint megmutattam, hogyan alkalmazhatjuk a szekvenciák illesztésénél és a fehérjék térszerkezetének felismerésénél használt speciális eljárást a rejtett Markov modellt a transzmembrán fehérjék topológiájának becslésére. dolgozatban leírt eredmények egy része mivel az alkalmazott matematikai eljárásokat eddig még nem használták a szekvencia vizsgálatokban metodikai jellegű. Mivel el akartam kerülni a biokémikus szemszögéből száraz statisztikai módszerek leírását az eredmények ismertetése során, ezeket az általam kifejlesztett, tehát új eredménynek tekinthető eljárásokat a Módszerek című fejezetben írtam le (4.2.1., , és fejezet). rejtett Markov modell megértéséhez és használatához szükséges általános leírás a Függelékben található. 5

7 2. Irodalmi áttekintés Irodalmi áttekintés 2.1. z aminosav szekvenciák jellemzése szekvenciák rendezettsége természetes fehérjék aminosav szekvenciáit vizsgálva az egyik legfontosabb kérdés annak tisztázása, hogy az aminosavak a szekvenciákban véletlen sorrendben követik-e egymást, vagy valamilyen általánosan érvényes szabályok határozzák meg sorrendjüket. fehérjék a biológiai rendszerben és in vitro körülmények között is a másodpercek törtrésze alatt képesek kialakítani háromdimenziós szerkezetüket. feltekeredésnek ( folding ) még nem tisztázott minden részlete, annyit azonban már lehet tudni, hogy a két legfontosabb hajtóerő a hidrofób aminosav oldalláncok kizárása a víz számára hozzáférhető térrészből, illetve a szekvenciában közel levő aminosav oldalláncok közötti kölcsönhatások (Sali és mtsi., 1994; Dill és mtsi., 1995; Fersht, 1997; Baldwin és Rose, 1999a, 1999b). feltekeredés során kialakuló globuláris szerkezetben a fehérje belsejében többnyire apoláris, hidrofób aminosav oldalláncok találhatók, a fehérje felszínén pedig a poláris, hidrofil oldalláncok. zt is kimutatták, hogy a térszerkezetben az atomok pakoltsága, a fehérje sűrűsége majdnem olyan nagy, mint egyes molekulakristályok sűrűsége. Ezek alapján feltételezhető, hogy a biológiai fehérjék tulajdonságaival rendelkező polipeptidláncot tetszőleges aminosav szekvencia nem képes biztosítani. rendezettséget kétféleképpen jellemezhetjük. Egyrészt vizsgálhatjuk az aminosavak sorrendjét a szekvenciákban (rövidtávú kölcsönhatások), másrészt vizsgálhatjuk az aminosavak, illetve szekvenciadarabok térbeli egymás mellé kerülését a kialakult térszerkezetben (hosszútávú kölcsönhatások). Ez utóbbiban megmutatkozó rendezettséget felhasználták a cisztein aminosavak oxidációs állapotának a becsléséhez pusztán a szekvencia alapján (Fiser és mtsi., 1992), illetve a térben közel álló aminosavak egy speciális csoportját melyek valószínűleg fontos szerepet játszanak a fehérjék stabilitásában, a stabilitás centrumokat az aminosavak térbeli egymás mellé kerülésének nem véletlen jellege miatt fel lehet ismerni a szekvencia alapján (Gugolya és mtsi., 1997; Dosztányi és mtsi., 1997; Dosztányi és Simon, 1999). szekvencia mentén való rendezettséget először a szekvenciában közel levő aminosav párok vizsgálatával mutatták ki (Vonderviszt és mtsi., 1986). z aminosavak párpreferenciáinak távolság függésének vizsgálata alapján megállapították, hogy a rendezettség mértéke a szekvenciában egymástól tíz aminosavra álló aminosavak esetén már a véletlen esetben várt értékre esik (Cserző és Simon, 1989). z információs elméletben használt entrópia segítségével szintén igazolták az aminosav szekvenciák nem véletlen jellegét (Pincus és Singer, 1996), valamint az entrópia mérésével különbséget lehetett találni a genomokban levő ténylegesen fehérjét kódoló 6

8 z aminosav szekvenciák jellemzése és az olyan hosszabb, stop kodont nem tartalmazó nukleotid szekvencia darabok (ORF, Open Reading Frame) között, amelyekről fehérje nem íródik át (Rani és mtsi., 1995). z aminosavak valamilyen bináris fizikai-kémiai paramétereit felhasználva (pl. poláris-apoláris) a szekvenciában levő periodicitások jól kimutathatók, és azoknak a térszerkezet különböző elemeivel való korrelációját is megállapították (West és Hecht, 1995). szekvenciákban található periodicitások vizsgálatával Rackovsky (1998) a szekvenciák nem véletlen jellegén túlmenően kapcsolatot tudott kimutatni a periodicitás és a térszerkezet szimmetriája között Hasonlósági mátrixok z aminosav szekvenciák összehasonlítása a molekuláris biológia egyik alap-, és igen általánosan elterjedt feladata. Szükség van erre egy új fehérje szekvenciájának meghatározása után a szekvenciálisan rokon fehérjék adatbázisokban való keresésénél, és ezzel az új fehérje funkciójának és szerkezetének felderítésénél, továbbá a szekvenciák rendszerezésénél, a fehérjék családokba való sorolásánál, stb. szekvencia összehasonlítás alapfeladata a szekvenciák illesztése ( alignment ), amely eljárást a fejezetben részletesen ismertetek. z eljárás lényege az, hogy ha definiáljuk az aminosavak egymással való kicserélődésének mértékét, más szóval az aminosavak hasonlóságát vagy távolságát ( score matrix ), akkor a szekvenciákat úgy illesztjük össze, hogy az aminosav hasonlóságok összege az összerendezett szekvenciák mentén maximális legyen (Needleman és Wunsch, 1970). Nagy hasonlóságot mutató szekvenciák esetén (> ¼±) majdnem mindegy, hogy az aminosavak hasonlóságát hogyan definiáljuk. lacsonyabb szekvenciális hasonlóság esetében azonban az illesztés nagymértékben függ az alkalmazott hasonlósági mátrixtól (Risler és mtsi., 1988). z egyes illesztések pontosságát ismert térszerkezetű fehérjék esetében tudjuk ellenőrizni. fehérjék térszerkezetét egymásra illesztve úgy, hogy a megfelelő atomok térbeli koordinátái távolságának négyzetösszege ( rms value: root mean square ) minimális legyen (Greer, 1981), pontosan megmondható, hogy a szekvencia illesztésben melyik aminosavnak melyik felel meg. z elmúlt harminc év alatt több tucat aminosav hasonlósági mátrixot állítottak elő. Ezeket alapvetően három csoportba sorolhatjuk: (i) szekvenciális hasonlóságot mutató fehérjék illesztésén alapuló hasonlósági mátrixok, (ii) térszerkezeti hasonlóságot mutató fehérjék vizsgálatából adódó mátrixok, (iii) az aminosavak fizikai kémiai tulajdonságainak összevetésén alapuló hasonlósági mátrixok. z első aminosav hasonlósági mátrix az aminosavak genetikai kódjainak távolságán alapult (Fitch, 1966; Fitch és Margoliash, 1967), amelyben két aminosav hasonlóságát az egyik aminosav kodonjának a másik aminosav kodonjára való cseréhez szükséges minimális nukleotid mutációk számával mérték. Ez azonban helytelen következtetésekre vezethet, hiszen a konkrét fehérjékben bekövetkezett mutációk hatása a fehérje működésének megvál- 7

9 z aminosav szekvenciák jellemzése tozásában jelentkezik, és nem a DNS-ben. Éppen ezért ezt a fajta hasonlósági mátrixot csak közeli rokon szekvenciák esetében használhatjuk biztonsággal. Dayhoff és mtsi. (1968) alkalmazták először a szekvenciálisan hasonló aminosavak illesztésén alapuló eljárást az aminosav rokonságok megállapítására. z általuk javasolt PM mátrix(ok) ( PM: accepted point mutation ) (Dayhoff és mtsi., 1968, 1978) használata teljesen általánossá vált a szekvencia analízissel foglalkozók körében. Eljárásuk lényege az, hogy a nagy hasonlóságot mutató szekvenciák összerendezése után a szekvencia illesztés egy-egy pontjában levő aminosavak kicserélődését számolják, majd ezeket az értékeket egy elsőrendű Markov folyamatot feltételezve extrapolálják a kisebb hasonlóság esetén várt értékekre (nagyobb evolúciós távolságra). z extrapoláció jogosságát számosan megkérdőjelezték (Risler és mtsi., 1988; George és mtsi., 1990). Ennek az eljárásnak és általában a szekvencia illesztésen alapuló eljárásoknak a másik hibája, hogy a statisztikához használt szekvenciaillesztés önmaga determinálja, hogy melyik aminosav melyikkel lesz hasonló. További hátránya, hogy a térszerkezetileg nem releváns pozíciókban levő és a szerkezet konzervativitásában fontos szerepet játszó aminosavcseréket ugyanolyan súllyal veszi figyelembe (Risler és mtsi., 1988). PM mátrixokat ½fehérjecsaládban megfigyelt½ ¾aminosavcsere alapján számolták, amely számolást 1992-ben ismételtek meg a teljes (¾ Swiss-Prot adatbázist használva, több mint fehérje szekvenciáját figyelembe véve (Bairoch és Boeckmann, 1991; Jones és mtsi., 1992). z ismert térszerkezetű fehérjék vizsgálata alapján már a hatvanas évek közepén felvetették, hogy a térszerkezet konzervatívabb, mint az aminosav szekvencia, azaz egymással nagyon kis szekvenciális hasonlóságot mutató fehérjéknek ¼±) nagyon gyakran ugyanaz a térszerkezete (Perutz és mtsi., 1965). Ezt a feltevést a későbbi megfigyelések alátámasztották, és mára teljesen elfogadottá vált. térszerkezeti adatok birtokában tehát a kis szekvenciális hasonlóságot mutató rokon szekvenciákban vizsgálhatjuk az aminosavak kicserélődésének mértékét. McLachan (1971) készített először térszerkezeti adatokon nyugvó kicserélődési mátrixot, vizsgálata 16 fehérjecsalád elemzésén alapult. Risler és mtsi. (1988) 32 fehérje térszerkezetének illesztése után vizsgálta az aminosavak kicserélődését, de csak azokban a pozíciókban, amely aminosavak «atomjainak távolsága az illesztésben½ ¾Å-nál közelebb volt. Így a fehérjék felszíni hurkaiban levő a szerkezet stabilitásában és fenntartásában nem releváns aminosavcseréket nem vették figyelembe a hasonlóságok megállapításánál. z aminosavak fizikai-kémiai paramétereit felhasználva készített mutációs mátrixok nagyobb hasonlóságott mutattak a Dayhoff féle PM mátrixokkal, mint a genetikai pontmutációs mátrixok (Grantham, 1974). z immunoglobulinok hipervariábilis szakaszainak és az abnormális hemoglobinok vizsgálatával azt is sikerült kimutatni, hogy a fizikai-kémiai paraméterek konzervativitása csak azokban a pozíciókban várható, amelyek a szerkezet fenntartásáért felelő- 8

10 Transzmembrán fehérjék sek (Miyata és mtsi., 1979). z irodalomban számos hasonlósági mátrixot találunk, amelyek az alkalmazott fizikai-kémiai paraméterekben különböznek egymástól, illetve abban, hogy ezekből az adatokból hogyan származtatták a hasonlóságokat. leggyakrabban használt paraméterek a következők: az aminosavak polaritása, mérete, hidrofóbicitása, másodlagos szerkezet képző potenciálja (Grantham, 1974; Miyata és mtsi., 1979; Pongor, 1987; Rao, 1987). Ezeken a módszereken kívül számos egyedi eljárás is napvilágot látott. Levin és mtsi. (1986) a másodlagos szerkezeti elemek predikciójához fejlesztett ki egy mátrixot, amellyel a predikció hatékonyságát sikerült ¼±fölé vinni. z egymással nagy hasonlóságot mutató szekvencia blokkok felhasználásával (Henikoff és Henikoff, 1992), illetve szekvencia és térszerkezeti adatok vegyes alkalmazásával (Henikoff és Henikoff, 1993) is készítettek hasonlósági mátrixokat, amelyek közül az utóbbi szintén az egyik leggyakrabban alkalmazott hasonlósági mátrix. Tüdős és mtsi. (1990) először használtak teljes adatbázist felhasználó, nem szekvencia illesztésen alapuló eljárást a hasonlóságok megállapítására Transzmembrán fehérjék z integráns membránfehérjék általános felépítése z egyes sejtek és a sejteken belül az egyes térrészek féligáteresztő hártyával vannak körülvéve, amelyek biztosítják a környezettől való elválasztást. kettős lipidrétegen kisebb apoláris molekulák könnyen átjutnak diffúzióval, de a membrán az ionok és nagyobb molekulák számára átjárhatatlan. nagyobb molekulák transzportja, illetve diffúziója csak segítséggel mehet végbe, a kettős lipidrétegbe ágyazott fehérjemolekulák révén. z integráns membránfehérjék felelősek a legtöbb vegyület transzportjáért, a sejtek közötti komunikációért, az immunrendszer helyes működéséért, az ideg-ideg és ideg-izom kapcsolatok kialakításáért, a szervezet számára káros anyagok sejtekből való szelektív kipumpálásáért. membránfehérjék polipeptidlánca a membránon egyszer, vagy többször fűződik át. membránon áthaladó rész mindig rendezett, vagy«-hélix szerkezetű, vagy -szál. Ennek az a magyarázata, hogy az apoláris kettős lipidrétegben a szabad hidrogénhíd akceptor és donor atomok jelenléte kedvezőtlen, és a peptidgerinc amino- (donor) és karboxil- (akceptor) csoportja folytonosan csak akkor lekötött, ha szerkezete«-hélix, vagy ha több -szál alkot egy -hordót (2. ábra). z utóbbi esetben a membránba való beépülés előtt a teljes hordónak össze kell szerelődnie, míg az«-hélixek esetében az egyes hélixek egyesével is beépülhetnek a membránba (Booth és Curran, 1999). Ez lehet az oka annak, hogy az integráns memránfehérjék túlnyomó többségében a membránt átszelő szakasz«-hélix szerkezetű, míg a -hordó csak néhány bakteriális fehérjére, a baktériumok sejtfalában levő porinokra jellemző. 9

11 Transzmembrán fehérjék Külso oldal B C Belso oldal 2. ábra. transzmembrán fehérjék három alaptípusa., -hordó; B, rendezetlen«-csokor; C,«-hélixek gyűrű alakú elrendezésben membránok átlagos vastagsága ¼- ¼Å, amit½ -¾ aminosavból álló - menetű«-hélix ér át. Bár alig néhány transzmembrán fehérje szerkezete ismert atomi felbontásban, azokban a transzmembránhélixek többnyire a membrán síkjára merőlegesen helyezkednek el. receptor molekulákban a membránhélixek szorosan pakoltak, míg a csatorna és transzporter fehérjékben gyűrűt alkotnak (2. ábra). Érdemes megjegyezni, hogy amíg a prolin a globuláris fehérjékben levő«-hélixben szinte egyáltalán nem fordul elő, addig számos transzmembrán«-hélix közepén megtalálható és ezen a helyen konzervativitása is nagyobb, mint a globuláris fehérjékben (von Heijne, 1991; Woolfson és mtsi., 1991; Jones és mtsi., 1994a; Jacob és mtsi., 1999). z ionokat, poláris vegyületeket transzportáló és áteresztő fehérjék belső részének polárisnak kell lennie, ami a prolin beépítésével oldható meg úgy, hogy a csatorna belső átmérője a legkisebb mértékben csökkenjen, ugyanakkor poláris legyen. prolin aminocsoportja ugyanis nem képes hidrogénhíd kötésre, így a szekvenciában négy aminosavval előrébb levő aminosav gerinc karbonilcsoportja szabad marad, és ez biztosítja a csatorna polaritását. szerin és treonin szintén gyakrabban fordul elő a transzmembránhélixekben, mint a globuláris fehérjék«-hélixeiben, ami a kialakuló speciális hidrogénhíd szerkezettel magyarázható. Ezeknek az aminosavaknak az oldallánca«-hélix szerkezetben ugyanis visszahajlik a peptidgerincre, egy nem szabályos, három centrumú hidrogénhíd kötést alakítva ki (Gray és Matthews, 1984). 10

12 Transzmembrán fehérjék membránok minden tekintetben aszimmetrikusak. Különbözik az ionok, a kis molekulák, valamint a fehérjék koncentrációja a membrán két oldalán, aminek eredményeképpen potenciálkülönbség alakul ki az elválasztott térrészek között. Ugyancsak eltér a membránt alkotó kettős lipidréteg összetétele a membrán külső és belső rétege között (Bergelson és Barsukov, 1977; Rothman és Lenard, 1977). plazmamembránban levő fehérjék extracelluláris tér felé levő részeken glikozilálódhatnak megfelelő szekvenciális környezetben levő szerin és aszparagin oldalláncokon Transzmembránhélix predikciók z apoláris lipidréteggel kölcsönható aminosav oldalláncok nagy részének szintén apolárisnak kell lennie, és így a szekvencia alapján a membránt átszelő peptidszakaszok megkereshetők a szekvencia mentén az aminosavak valamilyen átlagos hidrofóbicitásának meghatározásával. Ezen az elven alapultak az első transzmembránhélix predikciók (Kyte és Doolittle, 1982; Eisenberg és mtsi., 1984; Engelman és mtsi., 1986; Cornette és mtsi., 1987; Esposti és mtsi., 1990; Ponnuswamy és Gromiha, 1993; Gromiha és Ponnuswamy, 1995), amelyek egymástól abban térnek el, hogyan határozták meg az aminosavak hidrofóbicitását és azt hogyan átlagolták a szekvencia mentén. z aminosavak hidrofóbicitása közvetlenül nem mérhető, és az a környezettől is függ (Ponnuswamy és Gromiha, 1993). z oldalláncok hidrofóbicitásának meghatározására a következő eljárásokat dolgozták ki: (i) az aminosavak oktanol és víz közötti egyensúlya alapján a Gibbs-féle szabadentalpia változás meghatározásával (Kyte és Doolittle, 1982; Eisenberg és mtsi., 1984), (ii) az egyes atomcsoportok számított hidrofób és hidrofil kölcsönhatásainak különbségéből, szintén az oktanolt és vizet tekintve oldószerként (Engelman és mtsi., 1986), (iii) a globuláris fehérjék belsejében található adott aminosav környezetében levő aminosavak átlagos hidrofóbicitása alapján (Ponnuswamy és Gromiha, 1993), illetve (iv) a bizonyított transzmembrán«-hélixek statisztikai vizsgálatával, az aminosavak gyakoriságának meghatározásával az«-hélixekben, illetve a teljes fehérjében (Esposti és mtsi., 1990). Egyes hidrofóbicitási skáláknak a predikciókban való pontossága azonban nemcsak a skálától függ, hanem a becsült fehérjétől is. Egyes skálák például a nem csatorna tipusú fehérjék szerkezetét nagy pontossággal képesek becsülni, ugyanakkor aktív transzporter fehérjék szerkezetét sokkal pontatlanabbul, más skálák pedig fordítva (Esposti és mtsi., 1990; Crimi és Esposti, 1991). Ez azt jelenti, hogy a transzmembrán fehérjéket nem lehet egységesen kezelni, egy adott hidrofóbicitási skálával vagy paraméter készlettel leírni, azokban különböző tulajdonságú«-hélixek találhatók. z egyes predikciós eljárások abban is különböznek, hogy a hidrofóbicitásokat hogyan (pl. súlyozott-súlyozatlan átlag) és mekkora szekvenciadarab alapján átlagolják, hol húzzák meg azt a határértéket, ami alapján különbséget tesznek a transzmembrán és a nem 11

13 Transzmembrán fehérjék transzmembrán szakaszok között. hidrofóbicitási görbék vizsgálatán nyugvó predikciók hátránya, hogy a globuláris fehérjék belső apoláris részeit nem tudják megkülönböztetni az apoláris transzmembrán szakaszoktól, és ezért túlbecsülik a transzmembrán szakaszok jelenlétét, valamint csak a membránt átszelő régiók aminosav összetételét vizsgálják, és így nem használják ki a szekvencia más részeiben rejlő információt. predikciók pontossága e két hiányosság figyelembevételével javítható volt. Egyrészt a hidrofóbicitási momentum bevezetésével különbséget lehet tenni a globuláris amfipatikus«-hélixek és a transzmembránhélixek között (Eisenberg és mtsi., 1984), másrészt felhasználták azt a megfigyelést, hogy az aszimmetrikus lipideloszlás eredményeképpen a transzmembrán hélixek közötti rövidebb citoszolikus hurkokban általában több pozitívan töltött aminosav található, mint az extra-citoszolikus hurkokban (belül-pozitív szabály, positive-inside rule ) (Sipos és von Heijne, 1993; van Klompenburg és mtsi., 1997). predikciók pontosságának további növelése az egyre több bizonyított topológiájú transzmembrán fehérje statisztikai vizsgálatával volt elérhető. Jones és mtsi. (1994b) mutatták meg először, hogy nemcsak a pozitívan töltött aminosavak gyakorisága tér el a membrán két oldalán levő hurkokban, hanem mind a 20 aminosav gyakoriságában látható különbség, Sipos és von Heijne (1993) pedig kimutatták, hogy a transzmembrán régión belüli szakaszokon is változik az egyes aminosavak gyakorisága, az apoláris aminosavak közül az apoláris aromás aminosavak gyakoribbak a lipidréteg széleinél, míg az alifás oldalláncú aminosavak a membrán közepe felé gyakoriabbak. transzmembrán fehérjék szekvenciáit ezeknek a térrészeknek megfelelően öt részre bontva, Jones és mtsi. (1994b) olyan predikciós eljárást dolgoztak ki (az eljárásuk neve MEMST), amelyben az egyes térrészeknek megfelelő aminosav gyakoriságokat maximalizálták egy dinamikus programozási eljárás segítségével. predikció pontossága felülmúlta a hidrofóbicitási profil analízisen alapuló predikciók pontosságát. predikció során felhasznált információ mennyiségének hatása a pontosságra jól látható Persson és rgos (1994) munkáján, akik csak két térszerkezeti részt különböztettek meg (transzmembránhélixek közepe és széle), viszont nem egy fehérje szekvenciája alapján végezték a becslést, hanem többszörösen illesztett rokon szekvenciák felhasználásával. z általuk készített predikció pontossága összemérhető volt a MEMST eljárás pontosságával. Szintén többszörösen illesztett szekvenciákat használ Rost és mtsi. (1996) által kidolgozott mesterséges idegháló ( artificial neural network ) szimuláción alapuló becslő eljárás, amelynek hatékonysága az irodalomban az addigi legjobb volt. Ezeken az eljárásokon kívül számos más transzmembrán szegmenseket és topológiát becslő eljárás látott napvilágot, melyek közül Cserző és mtsi. (1994,1997) által készített eljárást érdemes kiemelni. z általuk készített speciális pont-mátrixok segítségével ugyanis több olyan fehérje szerkezetét sikerült pontosan becsülni, amelyeket korábban nem tudtak helyesen predi- 12

14 Transzmembrán fehérjék kálni. Eljárásuk lényege, hogy az aminosavak párpreferenciái alapján képzett mutációs mátrixokat használva két szekvencia illesztésénél, az illesztéshez készült pont-mátrixok sűrűsége a transzmembránhélixek helyén sokkal nagyobb, mint a szekvencia többi részén, még akkor is, ha szekvenciálisan nem hasonló transzmembrán fehérjék szekvenciáit hasonlítják össze. Ezt az eredményt azzal magyarázhatjuk, hogy bár a transzmembránhélixek esetében a szekvencia konzervativitása általában nagyon alacsony, a hélixek aminosav összetétele azonban konzervatív. predikciós eljárásokkal kapcsolatban fontos megjegyezni két dolgot. z egyik, hogy nem áll rendelkezésünkre olyan adatbázis, amelyben a transzmembránhélixek pontos elhelyezkedése a szekvencián belül helyesen, megbízható kísérleti adatokra támaszkodva lenne megadva. Swiss-Prot szekvencia adatbázis ugyan tartalmazza a transzmembrán fehérjék topológiáját meghatározó adatokat, azonban nagyon sok esetben helytelenül. Ennek az az oka, hogy a fehérjék szekvenciájának meghatározásakor végzett első szekvencia vizsgálatok eredményeit sokszor kísérleti tényként fogadják el. Így például az emberi MRP1 fehérje (lásd következő fejezet) esetében a hidrofóbicitási görbe analízisén alapuló predikció eredménye került az adatbázisba, amelyet egyetlen kísérleti adattal sem támasztottak alá a szerzők. Sajnos, ezeket a hibákat később sem javítják ki, így az adatbázisban a hibák egyre halmozottabban vannak jelen. másik oka az adatok pontatlanságának, hogy a membránt átszelő szakaszok kísérletesen nehezen tanulmányozhatók. Ezeket röntgendiffrakció segítségével határozhatjuk meg pontosan, azonban a membránfehérjék kristályosítása szinte lehetetlen feladat, és emiatt nagyon kevés (kb. 10) membrán fehérje szerkezete ismert atomi felbontásban. Molekuláris biológiai eszközöket felhasználva (fúziós fehérjék készítése, epitóp inzerció, glikozilációs helyek beépítése...) a kapott eredmények sokszor ellentmondóak, nehezen értelmezhetők, és csak indirekt bizonyítékokat szolgáltatnak. Például egy vizsgált fehérje szekvenciájába beépített epitóp segítségével csak azt mondhatjuk meg, hogy a kérdéses szakasz a sejten kívül helyezkedik-e el vagy belül, s nem a membránt átszelő rész pontos határait z BC transzporter család és az MRP rokon fehérjék transzmembrán fehérjék csatorna típusú transzporterek csoportjába tartoznak az BC (TP Binding Casette) transzporter család fehérjéi, amelyek a prokarióta egysejtűektől az élesztőkön át az emberig szinte valamennyi fajban megtalálhatók (Higgins, 1992). Ebbe a családba számos, az orvostudomány számára fontos fehérje tartozik, mint például a cisztikus fibrózis transzmembrán regulátor (CFTR), amelynek mutációja okozza a cisztikus fibrózist (Riordan és mtsi., 1989), az antigének prezentációjában szerepet játszó peptid transzporterek, a TP-ok (Spies és mtsi., 1990), valamint a rákos betegek kemoterápiájának kudarcát okozó fehérjék, a multidrog rezisztencia fehérje (MDR1) és a multidrog rezisztenciához társuló fehérje (MRP1) 13

15 Transzmembrán fehérjék (Chen és mtsi., 1986; Cole és mtsi., 1992). Valamennyi, e családba tartozó fehérje az TP hidrolízisekor felszabaduló energiát használja a transzport energiaigényének fedezésére. z eukarióta BC transzporterek többsége két homológ molekulafélből áll, amelyek egy transzmembrándomént és egy nukleotid kötő domént tartalmaznak. két transzmembrándomén valószínűleg együtt alakítja ki a transzport funkció biztosításához szükséges csatornát, míg a két nukleotid domén az TP hidrolízisét végzi. z TP kötésében és hidrolízisében szerepet játszó Walker és B szekvencia motívumok (Walker és mtsi., 1982), valamint az TP hidrolízisét a transzporttal összekötő konformációs változásokban résztvevő, un. BC signature régió valamennyi BC transzporter fehérje nukleotid kötő doménjében megtalálható. z egyes fehérjéket ez utóbbi szekvencia motívum megléte alapján sorolják az BC családba (Shyamala és mtsi., 1991; Croop, 1993). kilencvenes évek közepéig számos BC transzporter topológiáját vizsgálták, és ezek legtöbbje azt mutatta, hogy a két transzmembrándoménban 6-6 transzmembránhélix található. Ezt a topológiát a maltóz és az oligopeptid bakteriális permeázok estében alkalikus foszfatázzal és -laktamázzal fuzionált fehérjék vizsgálatával támasztották alá (Pearce és mtsi., 1992; Dassa és Muir, 1993), az egér MDR3 esetében a beépített epitópok lokalizációját határozták meg (Kast és mtsi., 1995, 1996), a humán CFTR szekvenciájába glikolizációs helyek inszerciójával, és a képződött fehérje glikoziláltsága alapján határozták meg a topológiát (Chang és mtsi., 1994). humán MDR1 vizsgálatánál olyan funkcióját megőrzött fehérjét állítottak elő, amely nem tartalmazott ciszteint, majd ezen a cisztein nélküli fehérjén egyesével számos aminosavat ciszteinre cseréltek, és a ciszteinek lokalizációját membránpermeábilis és impermeábilis tiol reagensek segítségével határozták meg (Loo és Clarke, 1995). z MRP1 szekvenciájának meghatározását követően több olyan fehérjét találtak, amelyek szekvenciájuk alapján a MRP1-hez álltak legközelebb az BC családon belül. Ezek között található a májsejtek apikális membránjában elhelyezkedő kanalikuláris multispecifikus organikus anion transzporter (cmot, vagy MRP2), aminek hibás müködése okozza a Dubin-Johnson szindrómát, a krónikus konjugált hiperbilirubinémiát (Jansen és mtsi., 1995; Paulusma és mtsi., 1996), a szulfonilurea receptor (SUR1, SUR2), amely az TP függőã csatornák reguláló alegysége és defektusa a csatorna inaktiválódása folytán krónikus inzulin szekrécióhoz vezet (hiperinzulinémiás hipoglikémia) (guilar-bryan és mtsi., 1995; Inagaki és mtsi., 1996; Bryan és guilar-bryan, 1997). z emberen kívül számos más fajban is meghatároztak az MRP1-hez hasonló fehérjéket. Nyúlban és patkányban az MRP2-vel megegyező fehérjét írtak le (van Kuijck és mtsi., 1996), Caenorhabditis elegans-ban 4 MRP1 rokon szekvenciát találtak (Wilson és mtsi., 1994; Broeks és mtsi., 1996), az élesztő genom szekvenálásakor a már korábban megismert YCF1 (yeast cadmium resistance protein) (Szczypka és mtsi., 1994) mellett további 4 MRP1 rokon szekvenciát határoztak meg (Decottignies és Goffeau, 1996). MRP1-hez hasonló 14

16 Statisztikai eljárások a fehérje kutatásban szekvenciájú fehérjét találtak növényekben is (rabidobsis thaliana) (Lu és mtsi., 1997; Marin és mtsi., 1998), ami mutatja a fehérje igen széleskörű elterjedését az élővilágban. z eddig vizsgálatok alapján az MRP1 rokon fehérjék képesek organikus anionokat transzportálni, vagy valamilyen anionos vegyülettel kölcsönhatni. z MRP1 a hidrofób rákellenes gyógyszereket glutationnal kotranszportálva távolítja el a sejtekből (Leier és mtsi., 1994), az MRP2 a konjugált epesók transzportjában vesz részt (Jedlitschky és mtsi., 1997), az YCF1 fehérje a kadmiumot glutation konjugátum formában transzportálja (Li és mtsi., 1996). Ezek alapján várható, hogy valamennyi MRP1 rokon fehérje szerkezete hasonló Statisztikai eljárások a fehérje kutatásban Dinamikus programozási eljárások z aminosav szekvenciák vizsgálatánál legelterjedtebben használt eljárások alapja az un. dinamikus programozási eljárás. dinamikus programozás akkor használható, ha az adott probléma rekurzív módon felbontható kettő vagy több kisebb feladatra. Például, ha meg kell mondanunk, hogy városból B városba hogyan juthatunk el a legrövidebb úton, akkor a feladat dinamikus programozáson alapuló megoldása, hogy ha C és D városok és B között találhatók, hogy megkeressük a legrövidebb -ból C-be és C-ből B-be menő utat, valamint a legrövidebb -ból D-be és D-ből B-be vezető utat, és e kettő lehetséges út közül a kiválasztjuk a rövidebbet. szekvenciák globális illesztéséhez ( alignment ) Needleman és Wunch (1970) használt először dinamikus programozáson alapuló eljárást, amit Smith és Waterman (1981) módosított a lokális hasonlóságok kimutatására. z illesztés készítése során először az aminosavak közötti hasonlóságokat ( score ) kell megadni, amely lehet az egység mátrix, vagy a fejezetben leírt hasonlósági mátrixok valamelyike. z illesztés lényege, hogy a két szekvenciát úgy rendezzük egymáshoz, hogy az azonos pozícióban levő aminosavak hasonlóságainak összege maximális legyen. Mivel ez a feladat a lehetséges összerendezések csillagászati száma miatt nem oldható meg direkt kereséssel, ezért szükséges a dinamikus programozási eljárás alkalmazása. Mindkét algoritmus lényege, hogy a feladatot rekurzív módon visszavezeti egyre kisebb feladatokra, és azoknak megoldása után oldja meg a nagyobb feladatot. Tehát, ha azæéså hosszúságú szekvenciákban levő½ Ò-ig és½ Ñ-ig tartó részszekvenciák maximális pontszámot adó összerendezését ismerjük, akkor ennek alapján az½ Ò ½-ig és½ Ñ ½-ig tartó részszekvenciák összerendezéséhez az½ Ò,½ Ñ; az½ Ü,½ Ñ(½ Ü Ò) és az½ Ò,½ Ý(½ Ý Ñ) esetek közül kell kiválasztani a legnagyobb pontszámot adó összerendezést. gyakorlati kivitelezés során ezt úgy oldják meg, hogy egyæ Å-es mátrixot töltenek fel a maximálist pontszámot adó összerendezés értékeivel (tehát a mátrix eleme az 15

17 Statisztikai eljárások a fehérje kutatásban ½,½ részszekvenciák összerendezése során kapható maximális pontszámmal egyenlő), majd ezen a mátrixon visszafele lépegetve megadható a két szekvencia összerendezése. Több szekvencia esetében ezt a feladatot ilyen módon nem tudjuk megoldani, mert az illesztés során használt mátrix mérete meghaladja a mai számítógépek kapacitását (ha a szekvenciák számañés átlagos hosszukæ, akkor egyæñelemű mátrix szükséges). Emiatt a többszörös szekvenciaillesztésekre többféle heurisztikus módszert dolgoztak ki, melyek általában a szekvenciák párosával való összehasonlításán alapulnak (Feng és Doolittle, 1987; Barton, 1994; Higgins, 1994; Wishart és mtsi., 1994). dinamikus programozási eljárások másik nagy alkalmazási területe a szekvenciák vizsgálata során a rejtett Markov modell használata, amelyben a modellnek a megfigyelési sorozathoz való illesztésénél alkalmazott Baum-Welch algoritmus, illetve a legjobb állapot sorozat megkereséséhez használt eljárás, a Viterbi algoritmus alkalmazza ezt a programozási eljárást (Rabiner, 1989). rejtett Markov modell alkalmazásait a következő fejezetben írom le, az eljárás matematikai részleteit a Módszerek-ben ( fejezet), illetve a Függelékben ismertetem Rejtett Markov eljárások sztochasztikus modellek alkalmazása a bioinformatika területén az elmúlt néhány évben ugrásszerűen nőtt meg. z egyik első modellt Churchill (1989) írta le, amelyben a különböző mitokondriális és kromoszómális DNS szekvenciák és fragmentek nagy változásokat mutató nukleotid összetételét modellezte rejtett Markov modell segítségével. Rejtett Markov modellt szekvencia motívumok felismerésére először DNS-ben levő fehérjekötő régiók, promóter helyek felismerésére dolgoztak ki. Mivel ezekben a régiókban a nukleotidok alig néhány pozícióban konzerváltak, valamint a konzervált pozíciók egymástól és az RNS szintézis indító helyétől való távolsága variábilis, a feladat megoldására különösen alkalmas a rejtett Markov modell, amelyben az EM ( Expectation-Maximization, vagy Expectation-Modification ) algoritmus segítségével a nem ismert távolságok és nukleotid eloszlások ismert szekvenciák segítségével megtaníthatók (Lawrence és Reilly, 1990; Cardon és Stormo, 1992). szekvencia illesztésekre és motívumok felismerésére a modell egy speciálisan erre a célra kidolgozott architektúra révén vált alkalmassá (Baldi és mtsi., 1994; Krogh és mtsi., 1994a). z eljárás két nagy előnye a hagyományos szekvencia illesztésekkel szemben, hogy számítási igénye a szekvenciák számával nem exponenciálisan, hanem csak lineárisan nő, valamint, hogy az aminosavak közötti hasonlóságokat nem kell előre megadni, sőt az eljárás képes az adott fehérje családra jellemző kicserélődések között a szekvencia különböző pontjain különbséget tenni, és ezáltal a térszerkezet szempontjából fontos és nem fontos szekvenciadarabokat megkülönböztetni. tanítás során kapott modellt a szekvencia profil eljárásokkal hasonló módon felhasználhatjuk az 16

18 Statisztikai eljárások a fehérje kutatásban adatbázisokban levő homológ szekvenciák keresésére (Hughey és Krogh, 1996), amely eljárás pontosságát a nagyon alacsony szekvenciális hasonlóságot mutató, de rokon fehérjék felismerését a Dirichlet keverék alkalmazásával tovább lehetett fokozni (Sjölander és mtsi., 1996). rejtett Markov modell eljárások másik nagy alkalmazási területe a gének lokalizálása a genomokban. Ehhez olyan architektúrájú modellt készítettek, amely a kódoló régiók felismerése mellett figyelembe veszi az adott élőlény kodon használatát, egyes szekvenálási hibákat automatikusan ki tud javítani (pl. frameshift-et okozó nukleotid inzerciót vagy deléciót), valamint különbséget tud tenni a rövidebb és hosszabb intergenikus régiók között, és számos intergenikus repetitív szekvenciát képes felismerni (Krogh és mtsi., 1994b; Borodovsky és mtsi., 1995; Lukashin és Borodovsky, 1998). szekvencia illesztésekhez használt modell segítségével nemcsak az egyes szekvencia motívumokat ismerhetjük fel, hanem a fehérjék másodlagos szerkezeti osztályokba való besorolását is elvégezhetjük (Francesco és mtsi., 1997). Ezekben a modellekben a rejtett állapotokhoz nem rendeltek valamilyen konkrét megfigyelhető fizikai tulajdonságot, míg a génfelismeréshez használt modellben a rejtett állapotokhoz hozzárendelhetjük pl. a kódoló vagy nem kódoló régiókat. rejtett állapotokhoz az egyes másodlagos térszerkezeti elemeket rendelve és a megfelelő architektúrát kialakítva olyan eljárásokat is kidolgoztak, amelyek a fehérjék másodlagos szerkezetét becsülték (Stultz és mtsi., 1993; White és mtsi., 1993). becslés pontossága alacsonyabb volt a már ismert másodlagos szerkezet becslő eljárások pontosságánál, de megmutatták a rejtett Markov modellnek egy általánosabb használatát. rejtett Markov modell szerkezete, architektúrája (a rejtett állapotok száma és a közöttük levő lehetséges átmenetek) szinte tetszőleges lehet, és emiatt a legkülönbözöbb biológiai problémák leírására alkalmazható az architektúra megfelelő megválasztásával. 17

19 3. Célkitűzések Célkitűzések z aminosav szekvenciák vizsgálata, a rokon fehérjék családokba sorolása szekvencia illesztések segítségével történik. z illesztéshez definiálni kell az aminosavak közötti hasonlóságok mértékét, amelyet vagy a rokon szekvenciák statisztikai analízisével határoznak meg, vagy az aminosavak fizikai-kémiai tulajdonságai alapján, vagy az ismert térszerkezetű fehérjék vizsgálata alapján. z első esetben az illesztésnél használt hasonlósági mátrix determinálja a készítendő hasonlósági mátrixot. Ezt a hibát úgy próbálják kiküszöbölni, hogy csak nagy szekvenciális hasonlóságot mutató fehérjék szekvenciáit illesztik az identitás mátrixot felhasználva, ekkor azonban a kisebb hasonlóságokra való extrapoláció kérdőjelezhető meg. fizikai-kémiai paraméterek használata során nem tudjuk, hogy a fehérje térszerkezetének stabilitásához az egyes tulajdonságok milyen mértékben járulnak hozzá, míg a térszerkezeti adatok használatakor a vizsgálatok nagyon kis számú minta statisztikáján alapulnak, és ezért kevésbé megbízhatók. Ezen okok miatt célul tűztem ki az aminosavak közötti hasonlóságok meghatározására egy olyan eljárás kidolgozását, amely nagyszámú szekvencia adaton nyugszik, ugyanakkor mentes a szekvencia illesztésekből fakadó tautológiától, és képes meghatározni az aminosavaknak a fehérjeszerkezet építése és fenntartása szempontjából fontos tulajdonságait. Intézetünk ktív Transzporter Fehérje kutatócsoportja, illetve az Országos Haematológiai és Immunológiai Intézet Membrán kutatócsoportja két olyan fehérjének a kutatásában vesz részt, amelyek az esetek nagy többségében a daganatos megbetegedések kemoterápiás kezelésének kudarcát okozzák. E két fehérje a multidrog rezisztencia fehérje (MDR1) és a multidrog rezisztenciához társuló fehérje (MRP1), amelyek megnövekedett kifejeződése okozza a sejtek széleskörű drog rezisztenciáját. Mindkét fehérje az BC transzporterek családjába tartozik, amely család eukarióta tagjainak többsége két homológ egy transzmembrán és egy nukleotidkötő domént tartalmazó molekulafélből áll. családba tartozó fehérjék topológiai vizsgálata azt mutatta, hogy a a transzmembrándoménok 6-6 transzmembránhélixből állnak. z MRP1 szekvenciájának meghatározásakor azonban a szerzők azt javasolták, hogy az MRP1 fehérjét ettől eltérő membrántopológia jellemez, az N-terminális transzmembrándoménban szerintük 8 transzmembránhélix van, míg a C-terminális felé esőben 4. fenti két kutatócsoporttal együttműködve célul tűztük ki az MRP1 jól megalapozott membrántopológiai modelljének kidolgozását. Ezzel párhuzamosan arra is kíváncsiak voltunk, hogy az BC családon belül milyen más hasonló szerkezetű fehérjék találhatók, és azok milyen szekvenciális viszonyban állnak az MRP1-gyel. 18

20 Célkitűzések Általánosan elfogadott, hogy a membránt átszelő szekvenciadarabok felismerése a szekvencia alapján könnyebb feladat, mint a globuláris fehérjék másodlagos szerkezeti részeinek a becslése, és ezt az irodalomban található becslő eljárások a másodlagos szerkezet becsléséhez viszonyítva nagy pontossága is alátámasztja. Bár ezek a becslő eljárások egyes aminosavaknak a topológia kialakításában betöltött szerepét is megmutatták, a transzmembrán fehérjék topológiáját elsősorban meghatározó alapelvet nem ismerjük. z Irodalmi áttekintésben ismertetett munkák alapján egyértelművé vált, hogy a transzmembrán fehérjék egyes térszerkezeti részei különböző fizikai-kémiai környezetben találhatók. z aminosavak affinitása az egyes térrészekhez különböző, amit a transzmembrán fehérjéknek ezekben a régióiban levő szekvenciadarabjainak az aminosav összetételeiben megmutatkozó különbségeik jól mutatnak. különböző membránokban levő fehérjék összetétele, valamint az a tény, hogy egyes fehérjék topológiája egy adott paraméter sereget használva jól becsülhető, míg mások más paraméterekkel írhatók le, azt mutatják, hogy nem az egyes térrészekben levő szegmensek aminosav összetételeinek abszolut értéke határozza meg a fehérjék topológiáját, hanem feltételezésem szerint az, hogy az egyes térrészekben levő szegmensek aminosav összetételeinek különbsége maximális legyen, és így a maximális különbséget adó felbontást megkeresve a fehérje topológiája a szekvencia alapján megadható. Ezért célul tűztem ki egy olyan transzmembrán fehérjék topológiáját becslő eljárás kidolgozását, amellyel megkereshetjük ezt a maximális aminosav összetételbeli különbséget adó felbontást a fehérjékben és ezáltal igazolhatjuk az előbbi feltételezést. 19

TDK lehetőségek az MTA TTK Enzimológiai Intézetben

TDK lehetőségek az MTA TTK Enzimológiai Intézetben TDK lehetőségek az MTA TTK Enzimológiai Intézetben Vértessy G. Beáta egyetemi tanár TDK mind 1-3 helyezettek OTDK Pro Scientia különdíj 1 második díj Diákjaink Eredményei Zsűri különdíj 2 első díj OTDK

Részletesebben

A fehérjék szerkezeti hierarchiája. Fehérje-szerkezetek! Klasszikus szerkezet-funkció paradigma. szekvencia. funkció. szerkezet! Myoglobin.

A fehérjék szerkezeti hierarchiája. Fehérje-szerkezetek! Klasszikus szerkezet-funkció paradigma. szekvencia. funkció. szerkezet! Myoglobin. Myoglobin Fehérje-szerkezetek! MGLSDGEWQLVLNVWGKVEADIPGGQEVLIRLFK GPETLEKFDKFKLKSEDEMKASE DLKKGATVLTALGGILKKKGEAEIKPLAQSA TKKIPVKYLEFISECIIQVLQSK PGDFGADAQGAMNKALELFRKDMASNYKELGFQG Fuxreiter Mónika! Debreceni

Részletesebben

2. Ismert térszerkezetű transzmembrán fehérjék adatbázisa: a PDBTM adatbázis. 3. A transzmembrán fehérje topológiai adatbázis, a TOPDB szerver

2. Ismert térszerkezetű transzmembrán fehérjék adatbázisa: a PDBTM adatbázis. 3. A transzmembrán fehérje topológiai adatbázis, a TOPDB szerver A 2005 és 2007 között megvalósított project célja transzmembrán fehérjék vizsgálata és az ehhez szükséges eljárások kifejlesztése volt. Ez utóbbi magába foglalta új adatbázisok és szerkezet becslő módszerek

Részletesebben

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 10 X. SZIMULÁCIÓ 1. VÉLETLEN számok A véletlen számok fontos szerepet játszanak a véletlen helyzetek generálásában (pénzérme, dobókocka,

Részletesebben

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 4 IV. MINTA, ALAPsTATIsZTIKÁK 1. MATEMATIKAI statisztika A matematikai statisztika alapfeladatát nagy általánosságban a következőképpen

Részletesebben

A tárgy címe: Bioinformatika

A tárgy címe: Bioinformatika A tárgy címe: Bioinformatika Kötelezően választható tárgy IV. és V. évfolyamos biológus hallgatók számára; heti 2+3 óra Előkövetelmény: Biokémia főkollégium; genetika főkollégium; alapszintű számítógépes

Részletesebben

Matematikai alapok és valószínőségszámítás. Középértékek és szóródási mutatók

Matematikai alapok és valószínőségszámítás. Középértékek és szóródási mutatók Matematikai alapok és valószínőségszámítás Középértékek és szóródási mutatók Középértékek A leíró statisztikák talán leggyakrabban használt csoportját a középértékek jelentik. Legkönnyebben mint az adathalmaz

Részletesebben

NÖVÉNYGENETIKA. Az Agrármérnöki MSc szak tananyagfejlesztése TÁMOP /1/A

NÖVÉNYGENETIKA. Az Agrármérnöki MSc szak tananyagfejlesztése TÁMOP /1/A NÖVÉNYGENETIKA Az Agrármérnöki MSc szak tananyagfejlesztése TÁMOP-4.1.2-08/1/A-2009-0010 A NÖVÉNYI TÁPANYAG TRANSZPORTEREK az előadás áttekintése A tápionok útja a növényben Növényi tápionok passzív és

Részletesebben

Statisztikai következtetések Nemlineáris regresszió Feladatok Vége

Statisztikai következtetések Nemlineáris regresszió Feladatok Vége [GVMGS11MNC] Gazdaságstatisztika 10. előadás: 9. Regressziószámítás II. Kóczy Á. László koczy.laszlo@kgk.uni-obuda.hu Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet A standard lineáris modell

Részletesebben

FEHÉRJÉK A MÁGNESEKBEN. Bodor Andrea ELTE, Szerkezeti Kémiai és Biológiai Laboratórium. Alkímia Ma, Budapest,

FEHÉRJÉK A MÁGNESEKBEN. Bodor Andrea ELTE, Szerkezeti Kémiai és Biológiai Laboratórium. Alkímia Ma, Budapest, FEHÉRJÉK A MÁGNESEKBEN Bodor Andrea ELTE, Szerkezeti Kémiai és Biológiai Laboratórium Alkímia Ma, Budapest, 2013.02.28. I. FEHÉRJÉK: L-α aminosavakból felépülő lineáris polimerek α H 2 N CH COOH amino

Részletesebben

Regresszió. Csorba János. Nagyméretű adathalmazok kezelése március 31.

Regresszió. Csorba János. Nagyméretű adathalmazok kezelése március 31. Regresszió Csorba János Nagyméretű adathalmazok kezelése 2010. március 31. A feladat X magyarázó attribútumok halmaza Y magyarázandó attribútumok) Kérdés: f : X -> Y a kapcsolat pár tanítópontban ismert

Részletesebben

Adatszerkezetek. Nevezetes algoritmusok (Keresések, rendezések)

Adatszerkezetek. Nevezetes algoritmusok (Keresések, rendezések) Adatszerkezetek Nevezetes algoritmusok (Keresések, rendezések) Keresések A probléma általános megfogalmazása: Adott egy N elemű sorozat, keressük meg azt az elemet (határozzuk meg a helyét a sorozatban),

Részletesebben

Fehérjeszerkezet analízis. Fehérjeszerkezet analízis. Fehérjeszerkezet analízis. Fehérjeszerkezet analízis. Fehérjeszerkezet analízis

Fehérjeszerkezet analízis. Fehérjeszerkezet analízis. Fehérjeszerkezet analízis. Fehérjeszerkezet analízis. Fehérjeszerkezet analízis Szerkezet Protein Data Bank (PDB) http://www.rcsb.org/pdb ~ 35 701 szerkezet közepes felbontás 1552 szerkezet d 1.5 Å 160 szerkezet d 1.0 Å 10 szerkezet d 0.8 Å (atomi felbontás) E globális minimum? funkció

Részletesebben

[Biomatematika 2] Orvosi biometria

[Biomatematika 2] Orvosi biometria [Biomatematika 2] Orvosi biometria 2016.02.29. A statisztika típusai Leíró jellegű statisztika: összegzi egy adathalmaz jellemzőit. A középértéket jelemzi (medián, módus, átlag) Az adatok változékonyságát

Részletesebben

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 9 IX. ROBUsZTUs statisztika 1. ROBUsZTUssÁG Az eddig kidolgozott módszerek főleg olyanok voltak, amelyek valamilyen értelemben optimálisak,

Részletesebben

A regisztrált álláskeresők számára vonatkozó becslések előrejelző képességének vizsgálata

A regisztrált álláskeresők számára vonatkozó becslések előrejelző képességének vizsgálata A regisztrált álláskeresők számára vonatkozó becslések előrejelző képességének vizsgálata Az elemzésben a GoogleTrends (GT, korábban Google Insights for Search) modellek mintán kívüli illeszkedésének vizsgálatával

Részletesebben

Natív antigének felismerése. B sejt receptorok, immunglobulinok

Natív antigének felismerése. B sejt receptorok, immunglobulinok Natív antigének felismerése B sejt receptorok, immunglobulinok B és T sejt receptorok A B és T sejt receptorok is az immunglobulin fehérje család tagjai A TCR nem ismeri fel az antigéneket, kizárólag az

Részletesebben

A fehérjék térszerkezetének jóslása

A fehérjék térszerkezetének jóslása A fehérjék térszerkezetének jóslása 1. A probléma bonyolultsága 2. A predikció szintjei 3. 1D predikciók (másodlagos szerkezet, hozzáférhetõség, transzmembrán hélixek 4. 2D predikciók (oldallánc kontaktusok,

Részletesebben

MÉRÉSI EREDMÉNYEK PONTOSSÁGA, A HIBASZÁMÍTÁS ELEMEI

MÉRÉSI EREDMÉNYEK PONTOSSÁGA, A HIBASZÁMÍTÁS ELEMEI MÉRÉSI EREDMÉYEK POTOSSÁGA, A HIBASZÁMÍTÁS ELEMEI. A mérési eredmény megadása A mérés során kapott értékek eltérnek a mérendő fizikai mennyiség valódi értékétől. Alapvetően kétféle mérési hibát különböztetünk

Részletesebben

STATISZTIKA. A maradék független a kezelés és blokk hatástól. Maradékok leíró statisztikája. 4. A modell érvényességének ellenőrzése

STATISZTIKA. A maradék független a kezelés és blokk hatástól. Maradékok leíró statisztikája. 4. A modell érvényességének ellenőrzése 4. A modell érvényességének ellenőrzése STATISZTIKA 4. Előadás Variancia-analízis Lineáris modellek 1. Függetlenség 2. Normális eloszlás 3. Azonos varianciák A maradék független a kezelés és blokk hatástól

Részletesebben

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió SZDT-08 p. 1/31 Biometria az orvosi gyakorlatban Korrelációszámítás, regresszió Werner Ágnes Villamosmérnöki és Információs Rendszerek Tanszék e-mail: werner.agnes@virt.uni-pannon.hu Korrelációszámítás

Részletesebben

1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása

1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása HIPOTÉZIS VIZSGÁLAT A hipotézis feltételezés egy vagy több populációról. (pl. egy gyógyszer az esetek 90%-ában hatásos; egy kezelés jelentősen megnöveli a rákos betegek túlélését). A hipotézis vizsgálat

Részletesebben

I. BESZÁLLÍTÓI TELJESÍTMÉNYEK ÉRTÉKELÉSE

I. BESZÁLLÍTÓI TELJESÍTMÉNYEK ÉRTÉKELÉSE I. BESZÁLLÍTÓI TELJESÍTMÉNYEK ÉRTÉKELÉSE Komplex termékek gyártására jellemző, hogy egy-egy termékbe akár több ezer alkatrész is beépül. Ilyenkor az alkatrészek általában sok különböző beszállítótól érkeznek,

Részletesebben

7. Fehérjeszekvenciák és térszerkezetek analízise.

7. Fehérjeszekvenciák és térszerkezetek analízise. 7. Fehérjeszekvenciák és térszerkezetek analízise. 1. Egyszerû elemzések 2. Térszerkezet predikció 2.1. A probléma bonyolultsága 2.2. A predikció szintjei 2.3. 1D predikciók (másodlagos szerkezet, hozzáférhetõség,

Részletesebben

A mérési eredmény megadása

A mérési eredmény megadása A mérési eredmény megadása A mérés során kapott értékek eltérnek a mérendő fizikai mennyiség valódi értékétől. Alapvetően kétféle mérési hibát különböztetünk meg: a determinisztikus és a véletlenszerű

Részletesebben

Flagellin alapú filamentáris nanoszerkezetek létrehozása

Flagellin alapú filamentáris nanoszerkezetek létrehozása Flagellin alapú filamentáris nanoszerkezetek létrehozása Vonderviszt Ferenc PE MÜKKI Bio-Nanorendszerek Laboratórium MTA Enzimológiai Intézete MTA MFA Bakteriális flagellumok Flagelláris filamentum: ~10

Részletesebben

Al-Mg-Si háromalkotós egyensúlyi fázisdiagram közelítő számítása

Al-Mg-Si háromalkotós egyensúlyi fázisdiagram közelítő számítása l--si háromalkotós egyensúlyi fázisdiagram közelítő számítása evezetés Farkas János 1, Dr. Roósz ndrás 1 doktorandusz, tanszékvezető egyetemi tanár Miskolci Egyetem nyag- és Kohómérnöki Kar Fémtani Tanszék

Részletesebben

Balatoni albedó(?)mérések

Balatoni albedó(?)mérések Környezettudományi Doktori Iskolák Konferenciája Budapest, 2012. augusztus 30-31 PE Georgikon Kar menyhart-l@georgikon.hu Eredeti célkitűzés Balaton albedójának napi és éves menete Albedó paraméterezése

Részletesebben

A mérés. A mérés célja a mérendő mennyiség valódi értékének meghatározása. Ez a valóságban azt jelenti, hogy erre kell

A mérés. A mérés célja a mérendő mennyiség valódi értékének meghatározása. Ez a valóságban azt jelenti, hogy erre kell A mérés A mérés célja a mérendő mennyiség valódi értékének meghatározása. Ez a valóságban azt jelenti, hogy erre kell törekedni, minél közelebb kerülni a mérés során a valós mennyiség megismeréséhez. Mérési

Részletesebben

A matematikai feladatok és megoldások konvenciói

A matematikai feladatok és megoldások konvenciói A matematikai feladatok és megoldások konvenciói Kozárné Fazekas Anna Kántor Sándor Matematika és Informatika Didaktikai Konferencia - Szatmárnémeti 2011. január 28-30. Konvenciók Mindenki által elfogadott

Részletesebben

Statisztika I. 8. előadás. Előadó: Dr. Ertsey Imre

Statisztika I. 8. előadás. Előadó: Dr. Ertsey Imre Statisztika I. 8. előadás Előadó: Dr. Ertsey Imre Minták alapján történő értékelések A statisztika foglalkozik. a tömegjelenségek vizsgálatával Bizonyos esetekben lehetetlen illetve célszerűtlen a teljes

Részletesebben

Mérési hibák 2006.10.04. 1

Mérési hibák 2006.10.04. 1 Mérési hibák 2006.10.04. 1 Mérés jel- és rendszerelméleti modellje Mérési hibák_labor/2 Mérési hibák mérési hiba: a meghatározandó értékre a mérés során kapott eredmény és ideális értéke közötti különbség

Részletesebben

Méréselmélet MI BSc 1

Méréselmélet MI BSc 1 Mérés és s modellezés 2008.02.15. 1 Méréselmélet - bevezetés a mérnöki problémamegoldás menete 1. A probléma kitűzése 2. A hipotézis felállítása 3. Kísérlettervezés 4. Megfigyelések elvégzése 5. Adatok

Részletesebben

Matematikai alapok és valószínőségszámítás. Valószínőségi eloszlások Binomiális eloszlás

Matematikai alapok és valószínőségszámítás. Valószínőségi eloszlások Binomiális eloszlás Matematikai alapok és valószínőségszámítás Valószínőségi eloszlások Binomiális eloszlás Bevezetés A tudományos életben megfigyeléseket teszünk, kísérleteket végzünk. Ezek többféle különbözı eredményre

Részletesebben

Molekuláris biológiai eljárások alkalmazása a GMO analitikában és az élelmiszerbiztonság területén

Molekuláris biológiai eljárások alkalmazása a GMO analitikában és az élelmiszerbiztonság területén Molekuláris biológiai eljárások alkalmazása a GMO analitikában és az élelmiszerbiztonság területén Dr. Dallmann Klára A molekuláris biológia célja az élőlények és sejtek működésének molekuláris szintű

Részletesebben

8. A fehérjék térszerkezetének jóslása

8. A fehérjék térszerkezetének jóslása 8. A fehérjék térszerkezetének jóslása A probléma bonyolultsága Általánosságban: találjuk meg egy tetszõleges szekvencia azon konformációját, amely a szabadentalpia globális minimumát adja. Egyszerû modellekben

Részletesebben

Markov modellek 2015.03.19.

Markov modellek 2015.03.19. Markov modellek 2015.03.19. Markov-láncok Markov-tulajdonság: egy folyamat korábbi állapotai a későbbiekre csak a jelen állapoton keresztül gyakorolnak befolyást. Semmi, ami a múltban történt, nem ad előrejelzést

Részletesebben

OZMÓZIS. BIOFIZIKA I Október 25. Bugyi Beáta PTE ÁOK Biofizikai Intézet

OZMÓZIS. BIOFIZIKA I Október 25. Bugyi Beáta PTE ÁOK Biofizikai Intézet BIOFIZIKA I 2011. Október 25. Bugyi Beáta PTE ÁOK Biofizikai Intézet Áttekintés 1. Diffúzió rövid ismétlés 2. Az ozmózis jelensége és leírása 4. A diffúzió és ozmózis orvos biológiai jelentősége Diffúzió

Részletesebben

KUTATÁSI JELENTÉS. Multilaterációs radarrendszer kutatása. Szüllő Ádám

KUTATÁSI JELENTÉS. Multilaterációs radarrendszer kutatása. Szüllő Ádám KUTATÁSI JELENTÉS Multilaterációs radarrendszer kutatása Szüllő Ádám 212 Bevezetés A Mikrohullámú Távérzékelés Laboratórium jelenlegi K+F tevékenységei közül ezen jelentés a multilaterációs radarrendszerek

Részletesebben

Modern műszeres analitika szeminárium Néhány egyszerű statisztikai teszt

Modern műszeres analitika szeminárium Néhány egyszerű statisztikai teszt Modern műszeres analitika szeminárium Néhány egyszerű statisztikai teszt Galbács Gábor KIUGRÓ ADATOK KISZŰRÉSE STATISZTIKAI TESZTEKKEL Dixon Q-tesztje Gyakori feladat az analitikai kémiában, hogy kiugrónak

Részletesebben

Az idősorok összetevői Trendszámítás Szezonalitás Prognosztika ZH

Az idősorok összetevői Trendszámítás Szezonalitás Prognosztika ZH Idősorok Idősor Statisztikai szempontból: az egyes időpontokhoz rendelt valószínűségi változók összessége. Speciális sztochasztikus kapcsolat; a magyarázóváltozó az idő Determinisztikus idősorelemzés esetén

Részletesebben

[Biomatematika 2] Orvosi biometria

[Biomatematika 2] Orvosi biometria [Biomatematika 2] Orvosi biometria 2016.02.08. Orvosi biometria (orvosi biostatisztika) Statisztika: tömegjelenségeket számadatokkal leíró tudomány. A statisztika elkészítésének menete: tanulmányok (kísérletek)

Részletesebben

Thomson-modell (puding-modell)

Thomson-modell (puding-modell) Atommodellek Thomson-modell (puding-modell) A XX. század elejére világossá vált, hogy az atomban található elektronok ugyanazok, mint a katódsugárzás részecskéi. Magyarázatra várt azonban, hogy mi tartja

Részletesebben

Tatisztika? Ammegmi? (Békásmegyeri aluljáró átlagos lakója ) Biostatisztika és informatika alapjai. Változók, kimenetelek

Tatisztika? Ammegmi? (Békásmegyeri aluljáró átlagos lakója ) Biostatisztika és informatika alapjai. Változók, kimenetelek Tatisztika? Ammegmi? (Békásmegyeri aluljáró átlagos lakója ) A statisztika a véletlen tömegjelenségek leírója. Biostatisztika és informatika alapjai 2. előadás: Leíró statisztika 26. szeptember 5. Veres

Részletesebben

Azonos és egymással nem kölcsönható részecskékből álló kvantumos rendszer makrókanónikus sokaságban.

Azonos és egymással nem kölcsönható részecskékből álló kvantumos rendszer makrókanónikus sokaságban. Kvantum statisztika A kvantummechanika előadások során már megtanultuk, hogy az anyagot felépítő részecskék nemklasszikus, hullámtulajdonságokkal is rendelkeznek aminek következtében viselkedésük sok szempontból

Részletesebben

Andó Mátyás Felületi érdesség matyi.misi.eu. Felületi érdesség. 1. ábra. Felületi érdességi jelek

Andó Mátyás Felületi érdesség matyi.misi.eu. Felületi érdesség. 1. ábra. Felületi érdességi jelek 1. Felületi érdesség használata Felületi érdesség A műszaki rajzokon a geometria méretek tűrése mellett a felületeket is jellemzik. A felületek jellemzésére leginkább a felületi érdességet használják.

Részletesebben

Területi statisztikai elemzések

Területi statisztikai elemzések Területi statisztikai elemzések KOTOSZ Balázs, SZTE, kotosz@eco.u-szeged.hu Módszertani dilemmák a statisztikában 2016. november 18. Budapest Apropó Miért különleges a területi adatok elemzése? A számításokhoz

Részletesebben

Két kevéssé ismert humán ABCG fehérje expressziója és funkcionális vizsgálata: ABCG1 és ABCG4 jellemzése

Két kevéssé ismert humán ABCG fehérje expressziója és funkcionális vizsgálata: ABCG1 és ABCG4 jellemzése Két kevéssé ismert humán ABCG fehérje expressziója és funkcionális vizsgálata: ABCG1 és ABCG4 jellemzése Doktori tézisek Dr. Cserepes Judit Semmelweis Egyetem Molekuláris Orvostudományok Doktori Iskola

Részletesebben

Méréselmélet és mérőrendszerek

Méréselmélet és mérőrendszerek Méréselmélet és mérőrendszerek 6. ELŐADÁS KÉSZÍTETTE: DR. FÜVESI VIKTOR 2016. 10. Mai témáink o A hiba fogalma o Méréshatár és mérési tartomány M é r é s i h i b a o A hiba megadása o A hiba eredete o

Részletesebben

Tömbök kezelése. Példa: Vonalkód ellenőrzőjegyének kiszámítása

Tömbök kezelése. Példa: Vonalkód ellenőrzőjegyének kiszámítása Tömbök kezelése Példa: Vonalkód ellenőrzőjegyének kiszámítása A számokkal jellemzett adatok, pl. személyi szám, adószám, taj-szám, vonalkód, bankszámlaszám esetében az elírásból származó hibát ún. ellenőrző

Részletesebben

A tananyag felépítése: A BIOLÓGIA ALAPJAI. I. Prokarióták és eukarióták. Az eukarióta sejt. Pécs Miklós: A biológia alapjai

A tananyag felépítése: A BIOLÓGIA ALAPJAI. I. Prokarióták és eukarióták. Az eukarióta sejt. Pécs Miklós: A biológia alapjai A BIOLÓGIA ALAPJAI A tananyag felépítése: Környezetmérnök és műszaki menedzser hallgatók számára Előadó: 2 + 0 + 0 óra, félévközi számonkérés 3 ZH: október 3, november 5, december 5 dr. Pécs Miklós egyetemi

Részletesebben

Immunológia alapjai előadás. Az immunológiai felismerés molekuláris összetevői.

Immunológia alapjai előadás. Az immunológiai felismerés molekuláris összetevői. Immunológia alapjai 3 4. előadás Az immunológiai felismerés molekuláris összetevői. Az antigén fogalma. Antitestek, T- és B- sejt receptorok: molekuláris szerkezet, funkciók, alcsoportok Az antigén meghatározása

Részletesebben

egy szisztolikus példa

egy szisztolikus példa Automatikus párhuzamosítás egy szisztolikus példa Áttekintés Bevezetés Példa konkrét szisztolikus algoritmus Automatikus párhuzamosítási módszer ötlet Áttekintés Bevezetés Példa konkrét szisztolikus algoritmus

Részletesebben

Rendezések. Sergyán Szabolcs Óbudai Egyetem Neumann János Informatikai Kar október 24.

Rendezések. Sergyán Szabolcs Óbudai Egyetem Neumann János Informatikai Kar október 24. Rendezések 8. előadás Sergyán Szabolcs sergyan.szabolcs@nik.uni-obuda.hu Óbudai Egyetem Neumann János Informatikai Kar 2011. október 24. Sergyán (OE NIK) AAO 08 2011. október 24. 1 / 1 Felhasznált irodalom

Részletesebben

DETERMINATION OF SHEAR STRENGTH OF SOLID WASTES BASED ON CPT TEST RESULTS

DETERMINATION OF SHEAR STRENGTH OF SOLID WASTES BASED ON CPT TEST RESULTS Műszaki Földtudományi Közlemények, 83. kötet, 1. szám (2012), pp. 271 276. HULLADÉKOK TEHERBÍRÁSÁNAK MEGHATÁROZÁSA CPT-EREDMÉNYEK ALAPJÁN DETERMINATION OF SHEAR STRENGTH OF SOLID WASTES BASED ON CPT TEST

Részletesebben

Gyakorlati bioinformatika

Gyakorlati bioinformatika Gyakorlati bioinformatika Szekvenciaillesztés PhD kurzus 2. Szekvenciaillesztés Bagossi Péter Fajtái: - egyszer ill. többszörös illesztés - globális ill. lokális illesztés Alkalmazása: - adatbázisokban

Részletesebben

Az ABCG2 multidrog transzporter fehérje szerkezetének és működésének vizsgálata

Az ABCG2 multidrog transzporter fehérje szerkezetének és működésének vizsgálata Az ABCG2 multidrog transzporter fehérje szerkezetének és működésének Kutatási előzmények Az ABC transzporter membránfehérjék az ATP elhasítása (ATPáz aktivitás) révén nyerik az energiát az általuk végzett

Részletesebben

1. előadás. Lineáris algebra numerikus módszerei. Hibaszámítás Számábrázolás Kerekítés, levágás Klasszikus hibaanalízis Abszolút hiba Relatív hiba

1. előadás. Lineáris algebra numerikus módszerei. Hibaszámítás Számábrázolás Kerekítés, levágás Klasszikus hibaanalízis Abszolút hiba Relatív hiba Hibaforrások Hiba A feladatok megoldása során különféle hibaforrásokkal találkozunk: Modellhiba, amikor a valóságnak egy közelítését használjuk a feladat matematikai alakjának felírásához. (Pl. egy fizikai

Részletesebben

Mérés és modellezés Méréstechnika VM, GM, MM 1

Mérés és modellezés Méréstechnika VM, GM, MM 1 Mérés és modellezés 2008.02.04. 1 Mérés és modellezés A mérnöki tevékenység alapeleme a mérés. A mérés célja valamely jelenség megismerése, vizsgálata. A mérés tervszerűen végzett tevékenység: azaz rögzíteni

Részletesebben

Méréselmélet és mérőrendszerek 2. ELŐADÁS (1. RÉSZ)

Méréselmélet és mérőrendszerek 2. ELŐADÁS (1. RÉSZ) Méréselmélet és mérőrendszerek 2. ELŐADÁS (1. RÉSZ) KÉSZÍTETTE: DR. FÜVESI VIKTOR 2016. 10. Mai témáink o A hiba fogalma o Méréshatár és mérési tartomány M é r é s i h i b a o A hiba megadása o A hiba

Részletesebben

41. ábra A NaCl rács elemi cellája

41. ábra A NaCl rács elemi cellája 41. ábra A NaCl rács elemi cellája Mindkét rácsra jellemző, hogy egy tetszés szerint kiválasztott pozitív vagy negatív töltésű iont ellentétes töltésű ionok vesznek körül. Különbség a közvetlen szomszédok

Részletesebben

Mikroszkóp vizsgálata Folyadék törésmutatójának mérése

Mikroszkóp vizsgálata Folyadék törésmutatójának mérése KLASSZIKUS FIZIKA LABORATÓRIUM 8. MÉRÉS Mikroszkóp vizsgálata Folyadék törésmutatójának mérése Mérést végezte: Enyingi Vera Atala ENVSAAT.ELTE Mérés időpontja: 2011. október 12. Szerda délelőtti csoport

Részletesebben

Mérési adatok illesztése, korreláció, regresszió

Mérési adatok illesztése, korreláció, regresszió Mérési adatok illesztése, korreláció, regresszió Korreláció, regresszió Két változó mennyiség közötti kapcsolatot vizsgálunk. Kérdés: van-e kapcsolat két, ugyanabban az egyénben, állatban, kísérleti mintában,

Részletesebben

Adatok statisztikai értékelésének főbb lehetőségei

Adatok statisztikai értékelésének főbb lehetőségei Adatok statisztikai értékelésének főbb lehetőségei 1. a. Egy- vagy kétváltozós eset b. Többváltozós eset 2. a. Becslési problémák, hipotézis vizsgálat b. Mintázatelemzés 3. Szint: a. Egyedi b. Populáció

Részletesebben

12/4/2014. Genetika 7-8 ea. DNS szerkezete, replikáció és a rekombináció. 1952 Hershey & Chase 1953!!!

12/4/2014. Genetika 7-8 ea. DNS szerkezete, replikáció és a rekombináció. 1952 Hershey & Chase 1953!!! Genetika 7-8 ea. DNS szerkezete, replikáció és a rekombináció 1859 1865 1869 1952 Hershey & Chase 1953!!! 1879 1903 1951 1950 1944 1928 1911 1 1. DNS szerkezete Mi az örökítő anyag? Friedrich Miescher

Részletesebben

Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet

Miskolci Egyetem Gazdaságtudományi Kar Üzleti Információgazdálkodási és Módszertani Intézet Klaszteranalízis Hasonló dolgok csoportosítását jelenti, gyakorlatilag az osztályozás szinonimájaként értelmezhetjük. A klaszteranalízis célja A klaszteranalízis alapvető célja, hogy a megfigyelési egységeket

Részletesebben

A preventív vakcináció lényege :

A preventív vakcináció lényege : Vakcináció Célja: antigénspecifkus immunválasz kiváltása a szervezetben A vakcina egy olyan készítmény, amely fokozza az immunitást egy adott betegséggel szemben (aktiválja az immunrendszert). A preventív

Részletesebben

Modern Fizika Labor. Fizika BSc. Értékelés: A mérés dátuma: A mérés száma és címe: 13. mérés: Molekulamodellezés PC-n. 2008. április 29.

Modern Fizika Labor. Fizika BSc. Értékelés: A mérés dátuma: A mérés száma és címe: 13. mérés: Molekulamodellezés PC-n. 2008. április 29. Modern Fizika Labor Fizika BSc A mérés dátuma: A mérés száma és címe: 13. mérés: Molekulamodellezés PC-n Értékelés: A beadás dátuma: 2008. május 6. A mérést végezte: 1/5 A mérés célja A mérés célja az

Részletesebben

A mérés problémája a pedagógiában. Dr. Nyéki Lajos 2015

A mérés problémája a pedagógiában. Dr. Nyéki Lajos 2015 A mérés problémája a pedagógiában Dr. Nyéki Lajos 2015 A mérés fogalma Mérésen olyan tevékenységet értünk, amelynek eredményeként a vizsgált jelenség számszerűen jellemezhetővé, más hasonló jelenségekkel

Részletesebben

Statisztika 2. Dr Gősi Zsuzsanna Egyetemi adjunktus

Statisztika 2. Dr Gősi Zsuzsanna Egyetemi adjunktus Statisztika 2. Dr Gősi Zsuzsanna Egyetemi adjunktus Gyakorisági sorok Mennyiségi ismérv jellemző rangsor készítünk. (pl. napi jegyeladások száma) A gyakorisági sor képzése igazából tömörítést jelent Nagyszámú

Részletesebben

Az élő sejt fizikai Biológiája:

Az élő sejt fizikai Biológiája: Az élő sejt fizikai Biológiája: Modellépítés, biológiai rendszerek skálázódása Kellermayer Miklós Fizikai biológia Ma már nem csak kvalitatív megfigyeléseket, hanem kvantitatív méréseket végzünk (biológiai

Részletesebben

Bioinformatika 2 5.. előad

Bioinformatika 2 5.. előad 5.. előad adás Prof. Poppe László BME Szerves Kémia és Technológia Tsz. Bioinformatika proteomika Előadás és gyakorlat 2009. 03. 21. Fehérje térszerkezet t megjelenítése A fehérjék meglehetősen összetett

Részletesebben

Szenzorcsatolt robot: A szenzorcsatolás lépései:

Szenzorcsatolt robot: A szenzorcsatolás lépései: 1. Mi a szenzorcsatolt robot, hogyan épül fel? Ismertesse a szenzorcsatolás lépéseit röviden az Egységes szenzorplatform architektúra segítségével. Mikor beszélünk szenzorfúzióról? Milyen módszereket használhatunk?

Részletesebben

Populációbecslések és monitoring

Populációbecslések és monitoring Populációbecslések és monitoring A becslés szerepe az ökológiában és a vadgazdálkodásban. A becslési módszerek csoportosítása. Teljes számlálás. Statisztikai alapfogalmak. Fontos lehet tudnunk, hogy hány

Részletesebben

Programozási módszertan. Dinamikus programozás: A leghosszabb közös részsorozat

Programozási módszertan. Dinamikus programozás: A leghosszabb közös részsorozat PM-07 p. 1/13 Programozási módszertan Dinamikus programozás: A leghosszabb közös részsorozat Werner Ágnes Villamosmérnöki és Információs Rendszerek Tanszék e-mail: werner.agnes@virt.uni-pannon.hu PM-07

Részletesebben

avagy az ipari alkalmazhatóság kérdése biotechnológiai tárgyú szabadalmi bejelentéseknél Dr. Győrffy Béla, Egis Nyrt., Budapest

avagy az ipari alkalmazhatóság kérdése biotechnológiai tárgyú szabadalmi bejelentéseknél Dr. Győrffy Béla, Egis Nyrt., Budapest Iparilag alkalmazható szekvenciák, avagy az ipari alkalmazhatóság kérdése biotechnológiai tárgyú szabadalmi bejelentéseknél Dr. Győrffy Béla, Egis Nyrt., Budapest Neutrokin α - jelentős kereskedelmi érdekek

Részletesebben

y ij = µ + α i + e ij STATISZTIKA Sir Ronald Aylmer Fisher Példa Elmélet A variancia-analízis alkalmazásának feltételei Lineáris modell

y ij = µ + α i + e ij STATISZTIKA Sir Ronald Aylmer Fisher Példa Elmélet A variancia-analízis alkalmazásának feltételei Lineáris modell Példa STATISZTIKA Egy gazdálkodó k kukorica hibrid termesztése között választhat. Jelöljük a fajtákat A, B, C, D-vel. Döntsük el, hogy a hibridek termesztése esetén azonos terméseredményre számíthatunk-e.

Részletesebben

10. modul: FÜGGVÉNYEK, FÜGGVÉNYTULAJDONSÁGOK

10. modul: FÜGGVÉNYEK, FÜGGVÉNYTULAJDONSÁGOK MATEMATIK A 9. évfolyam 10. modul: FÜGGVÉNYEK, FÜGGVÉNYTULAJDONSÁGOK KÉSZÍTETTE: CSÁKVÁRI ÁGNES Matematika A 9. évfolyam. 10. modul: FÜGGVÉNYEK, FÜGGVÉNYTULAJDONSÁGOK Tanári útmutató 2 MODULLEÍRÁS A modul

Részletesebben

Gépi tanulás és Mintafelismerés

Gépi tanulás és Mintafelismerés Gépi tanulás és Mintafelismerés jegyzet Csató Lehel Matematika-Informatika Tanszék BabesBolyai Tudományegyetem, Kolozsvár 2007 Aug. 20 2 1. fejezet Bevezet A mesterséges intelligencia azon módszereit,

Részletesebben

13. Egy x és egy y hosszúságú sorozat konvolúciójának hossza a. x-y-1 b. x-y c. x+y d. x+y+1 e. egyik sem

13. Egy x és egy y hosszúságú sorozat konvolúciójának hossza a. x-y-1 b. x-y c. x+y d. x+y+1 e. egyik sem 1. A Huffman-kód prefix és forráskiterjesztéssel optimálissá tehető, ezért nem szükséges hozzá a forrás valószínűség-eloszlásának ismerete. 2. Lehet-e tökéletes kriptorendszert készíteni? Miért? a. Lehet,

Részletesebben

trns-ek identitásvizsgálata új, in silico módszerrel

trns-ek identitásvizsgálata új, in silico módszerrel trns-ek identitásvizsgálata új, in silico módszerrel Doktori (PhD) értekezés tézisei Szenes Áron Témavezetők: Dr. Pál Gábor docens és Dr. Jakó Éena tudományos főmunkatárs Eötvös Loránd Tudományegyetem

Részletesebben

Új típusú döntési fa építés és annak alkalmazása többtényezős döntés területén

Új típusú döntési fa építés és annak alkalmazása többtényezős döntés területén Új típusú döntési fa építés és annak alkalmazása többtényezős döntés területén Dombi József Szegedi Tudományegyetem Bevezetés - ID3 (Iterative Dichotomiser 3) Az ID algoritmusok egy elemhalmaz felhasználásával

Részletesebben

openbve járműkészítés Leírás az openbve-hez kapcsolódó extensions.cfg fájl elkészítéséhez

openbve járműkészítés Leírás az openbve-hez kapcsolódó extensions.cfg fájl elkészítéséhez Leírás az openbve-hez kapcsolódó extensions.cfg fájl elkészítéséhez 1. oldal openbve járműkészítés Leírás az openbve-hez kapcsolódó extensions.cfg fájl elkészítéséhez A leírás az openbve-hez készített

Részletesebben

TRANSZPORTEREK Szakács Gergely

TRANSZPORTEREK Szakács Gergely TRANSZPORTEREK Szakács Gergely Összefoglalás A biológiai membránokon keresztüli anyagáramlást számos membránfehérje szabályozza. E fehérjék változatos funkciója és megjelenésük mintázata biztosítja a sejtek

Részletesebben

Neurális hálózatok bemutató

Neurális hálózatok bemutató Neurális hálózatok bemutató Füvesi Viktor Miskolci Egyetem Alkalmazott Földtudományi Kutatóintézet Miért? Vannak feladatok amelyeket az agy gyorsabban hajt végre mint a konvencionális számítógépek. Pl.:

Részletesebben

Posztanalitikai folyamatok az orvosi laboratóriumban, az eredményközlés felelőssége

Posztanalitikai folyamatok az orvosi laboratóriumban, az eredményközlés felelőssége Posztanalitikai folyamatok az orvosi laboratóriumban, az eredményközlés felelőssége Autovalidálási folyamatok Lókiné Farkas Katalin Az autovalidálás elméleti alapjai Az előző eredménnyel való összehasonlítás

Részletesebben

VALÓSZÍNŰSÉG, STATISZTIKA TANÍTÁSA

VALÓSZÍNŰSÉG, STATISZTIKA TANÍTÁSA VALÓSZÍNŰSÉG, STATISZTIKA TANÍTÁSA A VALÓSZÍNŰSÉGI SZEMLÉLET ALAPOZÁSA 1-6. OSZTÁLY A biztos, a lehetetlen és a lehet, de nem biztos események megkülünböztetése Valószínűségi játékok, kísérletek események

Részletesebben

Gépi tanulás a gyakorlatban. Bevezetés

Gépi tanulás a gyakorlatban. Bevezetés Gépi tanulás a gyakorlatban Bevezetés Motiváció Nagyon gyakran találkozunk gépi tanuló alkalmazásokkal Spam detekció Karakter felismerés Fotó címkézés Szociális háló elemzés Piaci szegmentáció analízis

Részletesebben

6. Előadás. Vereb György, DE OEC BSI, október 12.

6. Előadás. Vereb György, DE OEC BSI, október 12. 6. Előadás Visszatekintés: a normális eloszlás Becslés, mintavételezés Reprezentatív minta A statisztika, mint változó Paraméter és Statisztika Torzítatlan becslés A mintaközép eloszlása - centrális határeloszlás

Részletesebben

Rendezetlen fehérjék kölcsönhatásainak vizsgálata: elmélet, predikciók és alkalmazások

Rendezetlen fehérjék kölcsönhatásainak vizsgálata: elmélet, predikciók és alkalmazások Rendezetlen fehérjék kölcsönhatásainak vizsgálata: elmélet, predikciók és alkalmazások Doktori (PhD) értekezés tézisei Mészáros Bálint Témavezetők: Dr. Dosztányi Zsuzsanna, PhD és Prof. Simon István, PhD,

Részletesebben

A Markovi forgalomanalízis legújabb eredményei és ezek alkalmazása a távközlő hálózatok teljesítményvizsgálatában

A Markovi forgalomanalízis legújabb eredményei és ezek alkalmazása a távközlő hálózatok teljesítményvizsgálatában A Markovi forgalomanalízis legújabb eredményei és ezek alkalmazása a távközlő hálózatok teljesítményvizsgálatában Horváth Gábor ghorvath@hit.bme.hu (Horváth András, Telek Miklós) - p. 1 Motiváció, problémafelvetés

Részletesebben

Matematikai geodéziai számítások 6.

Matematikai geodéziai számítások 6. Matematikai geodéziai számítások 6. Lineáris regresszió számítás elektronikus távmérőkre Dr. Bácsatyai, László Matematikai geodéziai számítások 6.: Lineáris regresszió számítás elektronikus távmérőkre

Részletesebben

biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás

biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás Kísérlettervezés - biometria II. foglalkozás előadó: Prof. Dr. Rajkó Róbert Matematikai-statisztikai adatfeldolgozás A matematikai-statisztika feladata tapasztalati adatok feldolgozásával segítséget nyújtani

Részletesebben

A BIZOTTSÁG JELENTÉSE AZ EURÓPAI PARLAMENTNEK ÉS A TANÁCSNAK. az EMGA kiadásairól. Korai előrejelző rendszer, 2014/5-6. szám

A BIZOTTSÁG JELENTÉSE AZ EURÓPAI PARLAMENTNEK ÉS A TANÁCSNAK. az EMGA kiadásairól. Korai előrejelző rendszer, 2014/5-6. szám EURÓPAI BIZOTTSÁG Brüsszel, 2014.6.25. COM(2014) 390 final A BIZOTTSÁG JELENTÉSE AZ EURÓPAI PARLAMENTNEK ÉS A TANÁCSNAK az EMGA kiadásairól Korai előrejelző rendszer, 2014/5-6. szám HU HU TARTALOMJEGYZÉK

Részletesebben

A replikáció mechanizmusa

A replikáció mechanizmusa Az öröklődés molekuláris alapjai A DNS megkettőződése, a replikáció Szerk.: Vizkievicz András A DNS-molekula az élőlények örökítő anyaga, kódolt formában tartalmazza mindazon információkat, amelyek a sejt,

Részletesebben

Nemzetközi számvitel. 12. Előadás. IAS 8 Számviteli politika, a számviteli becslések változásai és hibák. Dr. Pál Tibor

Nemzetközi számvitel. 12. Előadás. IAS 8 Számviteli politika, a számviteli becslések változásai és hibák. Dr. Pál Tibor Dr. Pál Tibor Nemzetközi számvitel 12. Előadás IAS 8 Számviteli politika, a számviteli becslések változásai és hibák 2014.05.13. IAS 8 Bevételek 2 Az IAS 8 célja A fejezet célja, hogy bemutassa Hogyan

Részletesebben

Bakteriális identifikáció 16S rrns gén szekvencia alapján

Bakteriális identifikáció 16S rrns gén szekvencia alapján Bakteriális identifikáció 16S rrns gén szekvencia alapján MOHR ANITA SIPOS RITA, SZÁNTÓ-EGÉSZ RÉKA, MICSINAI ADRIENN 2100 Gödöllő, Szent-Györgyi Albert út 4. info@biomi.hu, www.biomi.hu TÖRZS AZONOSÍTÁS

Részletesebben

STATISZTIKA I. Centrális mutatók. Helyzeti középértékek. Középértékek. Bimodális eloszlás, U. Módusz, Mo. 4. Előadás.

STATISZTIKA I. Centrális mutatók. Helyzeti középértékek. Középértékek. Bimodális eloszlás, U. Módusz, Mo. 4. Előadás. Centrális mutatók STATISZTIKA I. 4. Előadás Centrális mutatók 1/51 2/51 Középértékek Helyzeti középértékek A meghatározása gyakoriság vagy sorszám alapján Számítás nélkül Az elemek nagyság szerint rendezett

Részletesebben

Matematikai és matematikai statisztikai alapismeretek

Matematikai és matematikai statisztikai alapismeretek Kézirat a Matematikai és matematikai statisztikai alapismeretek című előadáshoz Dr. Győri István NEVELÉSTUDOMÁNYI PH.D. PROGRM 1999/2000 1 1. MTEMTIKI LPOGLMK 1.1. Halmazok Halmazon mindig bizonyos dolgok

Részletesebben

Szerkesztette: Vizkievicz András

Szerkesztette: Vizkievicz András Fehérjék A fehérjék - proteinek - az élő szervezetek számára a legfontosabb vegyületek. Az élet bármilyen megnyilvánulási formája fehérjékkel kapcsolatos. A sejtek szárazanyagának minimum 50 %-át adják.

Részletesebben