Tusnády E. Gábor. Sztochasztikus modellek a fehérjekutatásban. Doktori (Ph.D.) értekezés. ELTE TTK Szerkezeti Biokémia Program
|
|
- Kinga Tamás
- 10 évvel ezelőtt
- Látták:
Átírás
1 Tusnády E. Gábor Sztochasztikus modellek a fehérjekutatásban Doktori (Ph.D.) értekezés ELTE TTK Szerkezeti Biokémia Program Témavezető: Dr. Simon István Készült: a Magyar Tudományos kadémia Szegedi Biológiai Központjának Enzimológiai Intézetében Budapest 1999
2 Tartalomjegyzék TRTLOMJEGYZÉK 1. Bevezetés 4 2. Irodalmi áttekintés z aminosav szekvenciák jellemzése szekvenciák rendezettsége Hasonlósági mátrixok Transzmembrán fehérjék z integráns membránfehérjék általános felépítése Transzmembránhélix predikciók z BC transzporter család és az MRP rokon fehérjék Statisztikai eljárások a fehérje kutatásban Dinamikus programozási eljárások Rejtett Markov eljárások Célkitűzések Felhasznált módszerek és eszközök datbázisok, felhasznált adatok Szekvencia adatbázisok Transzmembrán fehérjék topológia adatai függetlenségi divergencia divergencia definíciója divergencia használata aminosav hasonlóságok becslésére Transzmembrán fehérjék topológiájának becslése becsléshez használt rejtett Markov modell becslés menete modell paraméterei becslés pontosságának mérése Programok, egyéb predikciós eljárások Eredmények z aminosavak kicserélhetősége a függetlenségi divergencia alapján z MRP rokon fehérjék és membrántopológiájuk Transzmembrán fehérjék topológiájának becslése rejtett Markov modell
3 TRTLOMJEGYZÉK predikció pontossága predikciós módszerek összehasonlítása hipotézis igazolása Összefoglalás Hivatkozások z értekezés alapjául szolgáló közlemények jegyzéke Egyéb közlemények jegyzéke Köszönetnyilvánítás Függelék Diszkrét Markov folyamatok diszkrét Markov folyamatok kiterjesztése rejtett Markov modell elemei rejtett Markov modell három alapfeladata z első feladat megoldása második feladat megoldása harmadik feladat megoldása
4 ÁBRÁK JEGYZÉKE Ábrák jegyzéke 1. Szekvencia és térszerkezeti adatbázisok mérete transzmembrán fehérjék három alaptípusa Bináris aminosav hasonlósági fák (I) Bináris aminosav hasonlósági fák (II) Bináris aminosav hasonlósági fák (III) z MRP1 és CFTR szekvenciaillesztett hidrofóbicitási görbéje z MRP alcsalád transzmembránhélixek közötti szekvenciadarabok hosszúságának eloszlása transzmembrán fehérjék tipikus szerkezeti elemei transzmembránhélix predikcióhoz használt rejtett Markov modell architektúrája Elsőrendű diszkrét Markov modell rejtett Markov modell forward-backward algoritmus rejtett Markov modell paramétereinek újrabecslése Táblázatok jegyzéke 1. PIR (34.0) adatbázis szűrése Transzmembránhélix topológia becslő programok URL címei z aminosavak távolság mátrixa z aminosav hasonlósági mátrixok korrelációja transzmembránhélix predikció pontossága Különböző topológia becslő eljárások pontossága
5 Bevezetés 1. Bevezetés z élő szervezetek legérdekesebb makromolekulái a fehérjék, amelyek néhány építőelemet felhasználva a legváltozatosabb szerkezeteket spontán módon képesek kialakítani. z építőkövek az aminosavak a fehérjékben láncszerűen kapcsolódnak össze, és az aminosavaknak a láncban való sorrendjének megadása elegendő a fehérje teljes szerkezetének és működésének megadásához. Ezt az információt az élőlények genomjában a DNS molekulák tárolják, amelyről bonyolult szabályozási rendszereken keresztül szintetizálódnak a fehérjék. hatvanas évek elején nfinsen most már klasszikusnak mondható kísérletével megmutatta, hogy a fehérjék polipeptidlánca spontán módon képes felcsavarodni, azaz a fehérjére jellemző háromdimenziós szerkezetet kialakítani. Kutatók ezreit foglalkoztatja azóta a kérdés, hogyan megy végbe ez a folyamat, valamint, hogy az aminosav sorrend mi módon határozza meg a térszerkezetet. fehérjék háromdimenziós szerkeze- tének kísérleti meghatározása lényegesen GENBNK (nukleotid) SWISS-PROT (fehérje) PDB (térszerkezet) nehezebb feladat, mint az aminosavak sorrendjének meghatározása. Ez utóbbi az automatizált DNS szekvenálás révén rutinfeladattá vált, és mostanra annyira felgyorsult, hogy ma már néhány alacsonyabb rendű élőlény teljes genomiális DNS-ének bázissorrendje ismertté vált. térszerkezet és az aminosav sorrend meghatározás ne- Darab Évek 1. ábra. szekvencia és térszerkezeti adatbázisokban levő fehérjék számának változása az évek függvényében hézsége közötti különbség eredményeképpen a szekvencia adatbankok mérete meszsze meghaladja a térszerkezeti adatokat tartalmazó adatbankok méretét, és a kettő különbsége évről évre exponenciálisan nő (1. ábra). szekvencia adatbázisok rohamos növekedésével lehetőség nyílt az aminosav szekvenciák statisztikai vizsgálatára. z első statisztikai eljárások a 70-es évek közepén jelentek meg, és már ezek a vizsgálatok is utaltak arra, hogy az aminosavak nem rendezetlen, véletlen módon következnek egymás után a szekvenciában. szekvencia és a térszerkezet közötti összefüggések feltárására több statisztikai eljárás látott napvilágot, ezek közül a legtöbb a szekvencia és a másodlagos szerkezet közötti kapcsolatot vizsgálta. Napjainkban egyre több olyan eljárást dolgoznak ki, amelyek önállóan tanulják meg a szekvenciákban rejlő szabályokat, és ezáltal a fehérjék egyes térszerkezeti tulajdonságait képesek predikálni 1. 1 z angol prediction szó az Országh szótár szerint jóslást, jövendölést jelent. Mivel el szeretném kerülni a magyar kifejezések okkult jelentését, ezért meghagyom predikció-nak, vagy a becslés szóval fordítom. 4
6 Bevezetés z aminosav szekvenciák vizsgálata két szintet érint. Egyrészt az eredményeket az ismert szekvenciájú, de ismeretlen tulajdonságú fehérjék szerkezet predikciójához használhatjuk fel, másrészt a statisztikai vizsgálatok célja a fehérjékre általánosan jellemző tulajdonságok feltárása, végső soron a háromdimenziós kód megfejtése. vizsgálatok során célszerű figyelembe venni a fehérje szerkezet kialakulásakor szerepet játszó, illetve a szerkezet fenntartásához szükséges kölcsönhatásokat, amelyeket alapvetően két osztályba sorolhatunk: az aminosavak közötti és az aminosavak és környezetük közötti kölcsönhatásokra. z egyes aminosavaknak a fehérjén belül valamely más aminosavval való kölcsönhatása létrejöhet a szekvenciában közeli aminosavak között (rövidtávú kölcsönhatás), vagy szekvenciálisan távoli, de térben közeli aminosavak között (hosszútávú kölcsönhatás). dolgozat első részében azt vizsgáltam, hogy a rövidtávú kölcsönhatások miatt kialakuló rendezettséget hogyan mérhetjük, illetve ennek alapján mely aminosavak cserélhetők ki a szekvenciában a szerkezet megváltozása nélkül. dolgozat következő részében egy konkrét fehérje esetében, az BC (TP Binding Casette) transzporterek családjába tartozó MRP1 (Multidrug Resistance-associated Protein) fehérjén mutatom meg a szekvencia vizsgálatok gyakorlati életben való felhasználását, és a kísérletek tervezéséhez való fontos hozzájárulását. Ezek a vizsgálatok irányították a figyelmemet az értekezés harmadik részében leírt transzmembrán fehérjék szerkezetének kialakításában fontos szerepet játszó tényezők kutatására, amely során a kölcsönhatások előbb említett második csoportja, a fehérje molekula és környezete között levő kölcsönhatások kerültek előtérbe. fehérje szekvenciák statisztikai vizsgálatai során ilyen kölcsönhatásokat eddig még nem vettek figyelembe. z aminosav szekvenciákat tekinthetjük időbeli folyamatoknak, ahol az idő az aminosavaknak a fehérje N-terminálisától számított sorszámának felel meg, ezért csak diszkrét, egységnyi értékeket vehet fel, az aminosavak pedig az adott időponthoz tartozó megfigyelést jelentik. Ebben az értelemben a szekvenciák sztochasztikusnak tekinthetők, ezért a statisztikusok által használt sztochasztikus modellek felhasználhatók a szekvencia vizsgálatoknál. Így bevezettem a vizsgálatok során a bioinformatika területén eddig még nem használt függetlenségi divergencia használatát, valamint megmutattam, hogyan alkalmazhatjuk a szekvenciák illesztésénél és a fehérjék térszerkezetének felismerésénél használt speciális eljárást a rejtett Markov modellt a transzmembrán fehérjék topológiájának becslésére. dolgozatban leírt eredmények egy része mivel az alkalmazott matematikai eljárásokat eddig még nem használták a szekvencia vizsgálatokban metodikai jellegű. Mivel el akartam kerülni a biokémikus szemszögéből száraz statisztikai módszerek leírását az eredmények ismertetése során, ezeket az általam kifejlesztett, tehát új eredménynek tekinthető eljárásokat a Módszerek című fejezetben írtam le (4.2.1., , és fejezet). rejtett Markov modell megértéséhez és használatához szükséges általános leírás a Függelékben található. 5
7 2. Irodalmi áttekintés Irodalmi áttekintés 2.1. z aminosav szekvenciák jellemzése szekvenciák rendezettsége természetes fehérjék aminosav szekvenciáit vizsgálva az egyik legfontosabb kérdés annak tisztázása, hogy az aminosavak a szekvenciákban véletlen sorrendben követik-e egymást, vagy valamilyen általánosan érvényes szabályok határozzák meg sorrendjüket. fehérjék a biológiai rendszerben és in vitro körülmények között is a másodpercek törtrésze alatt képesek kialakítani háromdimenziós szerkezetüket. feltekeredésnek ( folding ) még nem tisztázott minden részlete, annyit azonban már lehet tudni, hogy a két legfontosabb hajtóerő a hidrofób aminosav oldalláncok kizárása a víz számára hozzáférhető térrészből, illetve a szekvenciában közel levő aminosav oldalláncok közötti kölcsönhatások (Sali és mtsi., 1994; Dill és mtsi., 1995; Fersht, 1997; Baldwin és Rose, 1999a, 1999b). feltekeredés során kialakuló globuláris szerkezetben a fehérje belsejében többnyire apoláris, hidrofób aminosav oldalláncok találhatók, a fehérje felszínén pedig a poláris, hidrofil oldalláncok. zt is kimutatták, hogy a térszerkezetben az atomok pakoltsága, a fehérje sűrűsége majdnem olyan nagy, mint egyes molekulakristályok sűrűsége. Ezek alapján feltételezhető, hogy a biológiai fehérjék tulajdonságaival rendelkező polipeptidláncot tetszőleges aminosav szekvencia nem képes biztosítani. rendezettséget kétféleképpen jellemezhetjük. Egyrészt vizsgálhatjuk az aminosavak sorrendjét a szekvenciákban (rövidtávú kölcsönhatások), másrészt vizsgálhatjuk az aminosavak, illetve szekvenciadarabok térbeli egymás mellé kerülését a kialakult térszerkezetben (hosszútávú kölcsönhatások). Ez utóbbiban megmutatkozó rendezettséget felhasználták a cisztein aminosavak oxidációs állapotának a becsléséhez pusztán a szekvencia alapján (Fiser és mtsi., 1992), illetve a térben közel álló aminosavak egy speciális csoportját melyek valószínűleg fontos szerepet játszanak a fehérjék stabilitásában, a stabilitás centrumokat az aminosavak térbeli egymás mellé kerülésének nem véletlen jellege miatt fel lehet ismerni a szekvencia alapján (Gugolya és mtsi., 1997; Dosztányi és mtsi., 1997; Dosztányi és Simon, 1999). szekvencia mentén való rendezettséget először a szekvenciában közel levő aminosav párok vizsgálatával mutatták ki (Vonderviszt és mtsi., 1986). z aminosavak párpreferenciáinak távolság függésének vizsgálata alapján megállapították, hogy a rendezettség mértéke a szekvenciában egymástól tíz aminosavra álló aminosavak esetén már a véletlen esetben várt értékre esik (Cserző és Simon, 1989). z információs elméletben használt entrópia segítségével szintén igazolták az aminosav szekvenciák nem véletlen jellegét (Pincus és Singer, 1996), valamint az entrópia mérésével különbséget lehetett találni a genomokban levő ténylegesen fehérjét kódoló 6
8 z aminosav szekvenciák jellemzése és az olyan hosszabb, stop kodont nem tartalmazó nukleotid szekvencia darabok (ORF, Open Reading Frame) között, amelyekről fehérje nem íródik át (Rani és mtsi., 1995). z aminosavak valamilyen bináris fizikai-kémiai paramétereit felhasználva (pl. poláris-apoláris) a szekvenciában levő periodicitások jól kimutathatók, és azoknak a térszerkezet különböző elemeivel való korrelációját is megállapították (West és Hecht, 1995). szekvenciákban található periodicitások vizsgálatával Rackovsky (1998) a szekvenciák nem véletlen jellegén túlmenően kapcsolatot tudott kimutatni a periodicitás és a térszerkezet szimmetriája között Hasonlósági mátrixok z aminosav szekvenciák összehasonlítása a molekuláris biológia egyik alap-, és igen általánosan elterjedt feladata. Szükség van erre egy új fehérje szekvenciájának meghatározása után a szekvenciálisan rokon fehérjék adatbázisokban való keresésénél, és ezzel az új fehérje funkciójának és szerkezetének felderítésénél, továbbá a szekvenciák rendszerezésénél, a fehérjék családokba való sorolásánál, stb. szekvencia összehasonlítás alapfeladata a szekvenciák illesztése ( alignment ), amely eljárást a fejezetben részletesen ismertetek. z eljárás lényege az, hogy ha definiáljuk az aminosavak egymással való kicserélődésének mértékét, más szóval az aminosavak hasonlóságát vagy távolságát ( score matrix ), akkor a szekvenciákat úgy illesztjük össze, hogy az aminosav hasonlóságok összege az összerendezett szekvenciák mentén maximális legyen (Needleman és Wunsch, 1970). Nagy hasonlóságot mutató szekvenciák esetén (> ¼±) majdnem mindegy, hogy az aminosavak hasonlóságát hogyan definiáljuk. lacsonyabb szekvenciális hasonlóság esetében azonban az illesztés nagymértékben függ az alkalmazott hasonlósági mátrixtól (Risler és mtsi., 1988). z egyes illesztések pontosságát ismert térszerkezetű fehérjék esetében tudjuk ellenőrizni. fehérjék térszerkezetét egymásra illesztve úgy, hogy a megfelelő atomok térbeli koordinátái távolságának négyzetösszege ( rms value: root mean square ) minimális legyen (Greer, 1981), pontosan megmondható, hogy a szekvencia illesztésben melyik aminosavnak melyik felel meg. z elmúlt harminc év alatt több tucat aminosav hasonlósági mátrixot állítottak elő. Ezeket alapvetően három csoportba sorolhatjuk: (i) szekvenciális hasonlóságot mutató fehérjék illesztésén alapuló hasonlósági mátrixok, (ii) térszerkezeti hasonlóságot mutató fehérjék vizsgálatából adódó mátrixok, (iii) az aminosavak fizikai kémiai tulajdonságainak összevetésén alapuló hasonlósági mátrixok. z első aminosav hasonlósági mátrix az aminosavak genetikai kódjainak távolságán alapult (Fitch, 1966; Fitch és Margoliash, 1967), amelyben két aminosav hasonlóságát az egyik aminosav kodonjának a másik aminosav kodonjára való cseréhez szükséges minimális nukleotid mutációk számával mérték. Ez azonban helytelen következtetésekre vezethet, hiszen a konkrét fehérjékben bekövetkezett mutációk hatása a fehérje működésének megvál- 7
9 z aminosav szekvenciák jellemzése tozásában jelentkezik, és nem a DNS-ben. Éppen ezért ezt a fajta hasonlósági mátrixot csak közeli rokon szekvenciák esetében használhatjuk biztonsággal. Dayhoff és mtsi. (1968) alkalmazták először a szekvenciálisan hasonló aminosavak illesztésén alapuló eljárást az aminosav rokonságok megállapítására. z általuk javasolt PM mátrix(ok) ( PM: accepted point mutation ) (Dayhoff és mtsi., 1968, 1978) használata teljesen általánossá vált a szekvencia analízissel foglalkozók körében. Eljárásuk lényege az, hogy a nagy hasonlóságot mutató szekvenciák összerendezése után a szekvencia illesztés egy-egy pontjában levő aminosavak kicserélődését számolják, majd ezeket az értékeket egy elsőrendű Markov folyamatot feltételezve extrapolálják a kisebb hasonlóság esetén várt értékekre (nagyobb evolúciós távolságra). z extrapoláció jogosságát számosan megkérdőjelezték (Risler és mtsi., 1988; George és mtsi., 1990). Ennek az eljárásnak és általában a szekvencia illesztésen alapuló eljárásoknak a másik hibája, hogy a statisztikához használt szekvenciaillesztés önmaga determinálja, hogy melyik aminosav melyikkel lesz hasonló. További hátránya, hogy a térszerkezetileg nem releváns pozíciókban levő és a szerkezet konzervativitásában fontos szerepet játszó aminosavcseréket ugyanolyan súllyal veszi figyelembe (Risler és mtsi., 1988). PM mátrixokat ½fehérjecsaládban megfigyelt½ ¾aminosavcsere alapján számolták, amely számolást 1992-ben ismételtek meg a teljes (¾ Swiss-Prot adatbázist használva, több mint fehérje szekvenciáját figyelembe véve (Bairoch és Boeckmann, 1991; Jones és mtsi., 1992). z ismert térszerkezetű fehérjék vizsgálata alapján már a hatvanas évek közepén felvetették, hogy a térszerkezet konzervatívabb, mint az aminosav szekvencia, azaz egymással nagyon kis szekvenciális hasonlóságot mutató fehérjéknek ¼±) nagyon gyakran ugyanaz a térszerkezete (Perutz és mtsi., 1965). Ezt a feltevést a későbbi megfigyelések alátámasztották, és mára teljesen elfogadottá vált. térszerkezeti adatok birtokában tehát a kis szekvenciális hasonlóságot mutató rokon szekvenciákban vizsgálhatjuk az aminosavak kicserélődésének mértékét. McLachan (1971) készített először térszerkezeti adatokon nyugvó kicserélődési mátrixot, vizsgálata 16 fehérjecsalád elemzésén alapult. Risler és mtsi. (1988) 32 fehérje térszerkezetének illesztése után vizsgálta az aminosavak kicserélődését, de csak azokban a pozíciókban, amely aminosavak «atomjainak távolsága az illesztésben½ ¾Å-nál közelebb volt. Így a fehérjék felszíni hurkaiban levő a szerkezet stabilitásában és fenntartásában nem releváns aminosavcseréket nem vették figyelembe a hasonlóságok megállapításánál. z aminosavak fizikai-kémiai paramétereit felhasználva készített mutációs mátrixok nagyobb hasonlóságott mutattak a Dayhoff féle PM mátrixokkal, mint a genetikai pontmutációs mátrixok (Grantham, 1974). z immunoglobulinok hipervariábilis szakaszainak és az abnormális hemoglobinok vizsgálatával azt is sikerült kimutatni, hogy a fizikai-kémiai paraméterek konzervativitása csak azokban a pozíciókban várható, amelyek a szerkezet fenntartásáért felelő- 8
10 Transzmembrán fehérjék sek (Miyata és mtsi., 1979). z irodalomban számos hasonlósági mátrixot találunk, amelyek az alkalmazott fizikai-kémiai paraméterekben különböznek egymástól, illetve abban, hogy ezekből az adatokból hogyan származtatták a hasonlóságokat. leggyakrabban használt paraméterek a következők: az aminosavak polaritása, mérete, hidrofóbicitása, másodlagos szerkezet képző potenciálja (Grantham, 1974; Miyata és mtsi., 1979; Pongor, 1987; Rao, 1987). Ezeken a módszereken kívül számos egyedi eljárás is napvilágot látott. Levin és mtsi. (1986) a másodlagos szerkezeti elemek predikciójához fejlesztett ki egy mátrixot, amellyel a predikció hatékonyságát sikerült ¼±fölé vinni. z egymással nagy hasonlóságot mutató szekvencia blokkok felhasználásával (Henikoff és Henikoff, 1992), illetve szekvencia és térszerkezeti adatok vegyes alkalmazásával (Henikoff és Henikoff, 1993) is készítettek hasonlósági mátrixokat, amelyek közül az utóbbi szintén az egyik leggyakrabban alkalmazott hasonlósági mátrix. Tüdős és mtsi. (1990) először használtak teljes adatbázist felhasználó, nem szekvencia illesztésen alapuló eljárást a hasonlóságok megállapítására Transzmembrán fehérjék z integráns membránfehérjék általános felépítése z egyes sejtek és a sejteken belül az egyes térrészek féligáteresztő hártyával vannak körülvéve, amelyek biztosítják a környezettől való elválasztást. kettős lipidrétegen kisebb apoláris molekulák könnyen átjutnak diffúzióval, de a membrán az ionok és nagyobb molekulák számára átjárhatatlan. nagyobb molekulák transzportja, illetve diffúziója csak segítséggel mehet végbe, a kettős lipidrétegbe ágyazott fehérjemolekulák révén. z integráns membránfehérjék felelősek a legtöbb vegyület transzportjáért, a sejtek közötti komunikációért, az immunrendszer helyes működéséért, az ideg-ideg és ideg-izom kapcsolatok kialakításáért, a szervezet számára káros anyagok sejtekből való szelektív kipumpálásáért. membránfehérjék polipeptidlánca a membránon egyszer, vagy többször fűződik át. membránon áthaladó rész mindig rendezett, vagy«-hélix szerkezetű, vagy -szál. Ennek az a magyarázata, hogy az apoláris kettős lipidrétegben a szabad hidrogénhíd akceptor és donor atomok jelenléte kedvezőtlen, és a peptidgerinc amino- (donor) és karboxil- (akceptor) csoportja folytonosan csak akkor lekötött, ha szerkezete«-hélix, vagy ha több -szál alkot egy -hordót (2. ábra). z utóbbi esetben a membránba való beépülés előtt a teljes hordónak össze kell szerelődnie, míg az«-hélixek esetében az egyes hélixek egyesével is beépülhetnek a membránba (Booth és Curran, 1999). Ez lehet az oka annak, hogy az integráns memránfehérjék túlnyomó többségében a membránt átszelő szakasz«-hélix szerkezetű, míg a -hordó csak néhány bakteriális fehérjére, a baktériumok sejtfalában levő porinokra jellemző. 9
11 Transzmembrán fehérjék Külso oldal B C Belso oldal 2. ábra. transzmembrán fehérjék három alaptípusa., -hordó; B, rendezetlen«-csokor; C,«-hélixek gyűrű alakú elrendezésben membránok átlagos vastagsága ¼- ¼Å, amit½ -¾ aminosavból álló - menetű«-hélix ér át. Bár alig néhány transzmembrán fehérje szerkezete ismert atomi felbontásban, azokban a transzmembránhélixek többnyire a membrán síkjára merőlegesen helyezkednek el. receptor molekulákban a membránhélixek szorosan pakoltak, míg a csatorna és transzporter fehérjékben gyűrűt alkotnak (2. ábra). Érdemes megjegyezni, hogy amíg a prolin a globuláris fehérjékben levő«-hélixben szinte egyáltalán nem fordul elő, addig számos transzmembrán«-hélix közepén megtalálható és ezen a helyen konzervativitása is nagyobb, mint a globuláris fehérjékben (von Heijne, 1991; Woolfson és mtsi., 1991; Jones és mtsi., 1994a; Jacob és mtsi., 1999). z ionokat, poláris vegyületeket transzportáló és áteresztő fehérjék belső részének polárisnak kell lennie, ami a prolin beépítésével oldható meg úgy, hogy a csatorna belső átmérője a legkisebb mértékben csökkenjen, ugyanakkor poláris legyen. prolin aminocsoportja ugyanis nem képes hidrogénhíd kötésre, így a szekvenciában négy aminosavval előrébb levő aminosav gerinc karbonilcsoportja szabad marad, és ez biztosítja a csatorna polaritását. szerin és treonin szintén gyakrabban fordul elő a transzmembránhélixekben, mint a globuláris fehérjék«-hélixeiben, ami a kialakuló speciális hidrogénhíd szerkezettel magyarázható. Ezeknek az aminosavaknak az oldallánca«-hélix szerkezetben ugyanis visszahajlik a peptidgerincre, egy nem szabályos, három centrumú hidrogénhíd kötést alakítva ki (Gray és Matthews, 1984). 10
12 Transzmembrán fehérjék membránok minden tekintetben aszimmetrikusak. Különbözik az ionok, a kis molekulák, valamint a fehérjék koncentrációja a membrán két oldalán, aminek eredményeképpen potenciálkülönbség alakul ki az elválasztott térrészek között. Ugyancsak eltér a membránt alkotó kettős lipidréteg összetétele a membrán külső és belső rétege között (Bergelson és Barsukov, 1977; Rothman és Lenard, 1977). plazmamembránban levő fehérjék extracelluláris tér felé levő részeken glikozilálódhatnak megfelelő szekvenciális környezetben levő szerin és aszparagin oldalláncokon Transzmembránhélix predikciók z apoláris lipidréteggel kölcsönható aminosav oldalláncok nagy részének szintén apolárisnak kell lennie, és így a szekvencia alapján a membránt átszelő peptidszakaszok megkereshetők a szekvencia mentén az aminosavak valamilyen átlagos hidrofóbicitásának meghatározásával. Ezen az elven alapultak az első transzmembránhélix predikciók (Kyte és Doolittle, 1982; Eisenberg és mtsi., 1984; Engelman és mtsi., 1986; Cornette és mtsi., 1987; Esposti és mtsi., 1990; Ponnuswamy és Gromiha, 1993; Gromiha és Ponnuswamy, 1995), amelyek egymástól abban térnek el, hogyan határozták meg az aminosavak hidrofóbicitását és azt hogyan átlagolták a szekvencia mentén. z aminosavak hidrofóbicitása közvetlenül nem mérhető, és az a környezettől is függ (Ponnuswamy és Gromiha, 1993). z oldalláncok hidrofóbicitásának meghatározására a következő eljárásokat dolgozták ki: (i) az aminosavak oktanol és víz közötti egyensúlya alapján a Gibbs-féle szabadentalpia változás meghatározásával (Kyte és Doolittle, 1982; Eisenberg és mtsi., 1984), (ii) az egyes atomcsoportok számított hidrofób és hidrofil kölcsönhatásainak különbségéből, szintén az oktanolt és vizet tekintve oldószerként (Engelman és mtsi., 1986), (iii) a globuláris fehérjék belsejében található adott aminosav környezetében levő aminosavak átlagos hidrofóbicitása alapján (Ponnuswamy és Gromiha, 1993), illetve (iv) a bizonyított transzmembrán«-hélixek statisztikai vizsgálatával, az aminosavak gyakoriságának meghatározásával az«-hélixekben, illetve a teljes fehérjében (Esposti és mtsi., 1990). Egyes hidrofóbicitási skáláknak a predikciókban való pontossága azonban nemcsak a skálától függ, hanem a becsült fehérjétől is. Egyes skálák például a nem csatorna tipusú fehérjék szerkezetét nagy pontossággal képesek becsülni, ugyanakkor aktív transzporter fehérjék szerkezetét sokkal pontatlanabbul, más skálák pedig fordítva (Esposti és mtsi., 1990; Crimi és Esposti, 1991). Ez azt jelenti, hogy a transzmembrán fehérjéket nem lehet egységesen kezelni, egy adott hidrofóbicitási skálával vagy paraméter készlettel leírni, azokban különböző tulajdonságú«-hélixek találhatók. z egyes predikciós eljárások abban is különböznek, hogy a hidrofóbicitásokat hogyan (pl. súlyozott-súlyozatlan átlag) és mekkora szekvenciadarab alapján átlagolják, hol húzzák meg azt a határértéket, ami alapján különbséget tesznek a transzmembrán és a nem 11
13 Transzmembrán fehérjék transzmembrán szakaszok között. hidrofóbicitási görbék vizsgálatán nyugvó predikciók hátránya, hogy a globuláris fehérjék belső apoláris részeit nem tudják megkülönböztetni az apoláris transzmembrán szakaszoktól, és ezért túlbecsülik a transzmembrán szakaszok jelenlétét, valamint csak a membránt átszelő régiók aminosav összetételét vizsgálják, és így nem használják ki a szekvencia más részeiben rejlő információt. predikciók pontossága e két hiányosság figyelembevételével javítható volt. Egyrészt a hidrofóbicitási momentum bevezetésével különbséget lehet tenni a globuláris amfipatikus«-hélixek és a transzmembránhélixek között (Eisenberg és mtsi., 1984), másrészt felhasználták azt a megfigyelést, hogy az aszimmetrikus lipideloszlás eredményeképpen a transzmembrán hélixek közötti rövidebb citoszolikus hurkokban általában több pozitívan töltött aminosav található, mint az extra-citoszolikus hurkokban (belül-pozitív szabály, positive-inside rule ) (Sipos és von Heijne, 1993; van Klompenburg és mtsi., 1997). predikciók pontosságának további növelése az egyre több bizonyított topológiájú transzmembrán fehérje statisztikai vizsgálatával volt elérhető. Jones és mtsi. (1994b) mutatták meg először, hogy nemcsak a pozitívan töltött aminosavak gyakorisága tér el a membrán két oldalán levő hurkokban, hanem mind a 20 aminosav gyakoriságában látható különbség, Sipos és von Heijne (1993) pedig kimutatták, hogy a transzmembrán régión belüli szakaszokon is változik az egyes aminosavak gyakorisága, az apoláris aminosavak közül az apoláris aromás aminosavak gyakoribbak a lipidréteg széleinél, míg az alifás oldalláncú aminosavak a membrán közepe felé gyakoriabbak. transzmembrán fehérjék szekvenciáit ezeknek a térrészeknek megfelelően öt részre bontva, Jones és mtsi. (1994b) olyan predikciós eljárást dolgoztak ki (az eljárásuk neve MEMST), amelyben az egyes térrészeknek megfelelő aminosav gyakoriságokat maximalizálták egy dinamikus programozási eljárás segítségével. predikció pontossága felülmúlta a hidrofóbicitási profil analízisen alapuló predikciók pontosságát. predikció során felhasznált információ mennyiségének hatása a pontosságra jól látható Persson és rgos (1994) munkáján, akik csak két térszerkezeti részt különböztettek meg (transzmembránhélixek közepe és széle), viszont nem egy fehérje szekvenciája alapján végezték a becslést, hanem többszörösen illesztett rokon szekvenciák felhasználásával. z általuk készített predikció pontossága összemérhető volt a MEMST eljárás pontosságával. Szintén többszörösen illesztett szekvenciákat használ Rost és mtsi. (1996) által kidolgozott mesterséges idegháló ( artificial neural network ) szimuláción alapuló becslő eljárás, amelynek hatékonysága az irodalomban az addigi legjobb volt. Ezeken az eljárásokon kívül számos más transzmembrán szegmenseket és topológiát becslő eljárás látott napvilágot, melyek közül Cserző és mtsi. (1994,1997) által készített eljárást érdemes kiemelni. z általuk készített speciális pont-mátrixok segítségével ugyanis több olyan fehérje szerkezetét sikerült pontosan becsülni, amelyeket korábban nem tudtak helyesen predi- 12
14 Transzmembrán fehérjék kálni. Eljárásuk lényege, hogy az aminosavak párpreferenciái alapján képzett mutációs mátrixokat használva két szekvencia illesztésénél, az illesztéshez készült pont-mátrixok sűrűsége a transzmembránhélixek helyén sokkal nagyobb, mint a szekvencia többi részén, még akkor is, ha szekvenciálisan nem hasonló transzmembrán fehérjék szekvenciáit hasonlítják össze. Ezt az eredményt azzal magyarázhatjuk, hogy bár a transzmembránhélixek esetében a szekvencia konzervativitása általában nagyon alacsony, a hélixek aminosav összetétele azonban konzervatív. predikciós eljárásokkal kapcsolatban fontos megjegyezni két dolgot. z egyik, hogy nem áll rendelkezésünkre olyan adatbázis, amelyben a transzmembránhélixek pontos elhelyezkedése a szekvencián belül helyesen, megbízható kísérleti adatokra támaszkodva lenne megadva. Swiss-Prot szekvencia adatbázis ugyan tartalmazza a transzmembrán fehérjék topológiáját meghatározó adatokat, azonban nagyon sok esetben helytelenül. Ennek az az oka, hogy a fehérjék szekvenciájának meghatározásakor végzett első szekvencia vizsgálatok eredményeit sokszor kísérleti tényként fogadják el. Így például az emberi MRP1 fehérje (lásd következő fejezet) esetében a hidrofóbicitási görbe analízisén alapuló predikció eredménye került az adatbázisba, amelyet egyetlen kísérleti adattal sem támasztottak alá a szerzők. Sajnos, ezeket a hibákat később sem javítják ki, így az adatbázisban a hibák egyre halmozottabban vannak jelen. másik oka az adatok pontatlanságának, hogy a membránt átszelő szakaszok kísérletesen nehezen tanulmányozhatók. Ezeket röntgendiffrakció segítségével határozhatjuk meg pontosan, azonban a membránfehérjék kristályosítása szinte lehetetlen feladat, és emiatt nagyon kevés (kb. 10) membrán fehérje szerkezete ismert atomi felbontásban. Molekuláris biológiai eszközöket felhasználva (fúziós fehérjék készítése, epitóp inzerció, glikozilációs helyek beépítése...) a kapott eredmények sokszor ellentmondóak, nehezen értelmezhetők, és csak indirekt bizonyítékokat szolgáltatnak. Például egy vizsgált fehérje szekvenciájába beépített epitóp segítségével csak azt mondhatjuk meg, hogy a kérdéses szakasz a sejten kívül helyezkedik-e el vagy belül, s nem a membránt átszelő rész pontos határait z BC transzporter család és az MRP rokon fehérjék transzmembrán fehérjék csatorna típusú transzporterek csoportjába tartoznak az BC (TP Binding Casette) transzporter család fehérjéi, amelyek a prokarióta egysejtűektől az élesztőkön át az emberig szinte valamennyi fajban megtalálhatók (Higgins, 1992). Ebbe a családba számos, az orvostudomány számára fontos fehérje tartozik, mint például a cisztikus fibrózis transzmembrán regulátor (CFTR), amelynek mutációja okozza a cisztikus fibrózist (Riordan és mtsi., 1989), az antigének prezentációjában szerepet játszó peptid transzporterek, a TP-ok (Spies és mtsi., 1990), valamint a rákos betegek kemoterápiájának kudarcát okozó fehérjék, a multidrog rezisztencia fehérje (MDR1) és a multidrog rezisztenciához társuló fehérje (MRP1) 13
15 Transzmembrán fehérjék (Chen és mtsi., 1986; Cole és mtsi., 1992). Valamennyi, e családba tartozó fehérje az TP hidrolízisekor felszabaduló energiát használja a transzport energiaigényének fedezésére. z eukarióta BC transzporterek többsége két homológ molekulafélből áll, amelyek egy transzmembrándomént és egy nukleotid kötő domént tartalmaznak. két transzmembrándomén valószínűleg együtt alakítja ki a transzport funkció biztosításához szükséges csatornát, míg a két nukleotid domén az TP hidrolízisét végzi. z TP kötésében és hidrolízisében szerepet játszó Walker és B szekvencia motívumok (Walker és mtsi., 1982), valamint az TP hidrolízisét a transzporttal összekötő konformációs változásokban résztvevő, un. BC signature régió valamennyi BC transzporter fehérje nukleotid kötő doménjében megtalálható. z egyes fehérjéket ez utóbbi szekvencia motívum megléte alapján sorolják az BC családba (Shyamala és mtsi., 1991; Croop, 1993). kilencvenes évek közepéig számos BC transzporter topológiáját vizsgálták, és ezek legtöbbje azt mutatta, hogy a két transzmembrándoménban 6-6 transzmembránhélix található. Ezt a topológiát a maltóz és az oligopeptid bakteriális permeázok estében alkalikus foszfatázzal és -laktamázzal fuzionált fehérjék vizsgálatával támasztották alá (Pearce és mtsi., 1992; Dassa és Muir, 1993), az egér MDR3 esetében a beépített epitópok lokalizációját határozták meg (Kast és mtsi., 1995, 1996), a humán CFTR szekvenciájába glikolizációs helyek inszerciójával, és a képződött fehérje glikoziláltsága alapján határozták meg a topológiát (Chang és mtsi., 1994). humán MDR1 vizsgálatánál olyan funkcióját megőrzött fehérjét állítottak elő, amely nem tartalmazott ciszteint, majd ezen a cisztein nélküli fehérjén egyesével számos aminosavat ciszteinre cseréltek, és a ciszteinek lokalizációját membránpermeábilis és impermeábilis tiol reagensek segítségével határozták meg (Loo és Clarke, 1995). z MRP1 szekvenciájának meghatározását követően több olyan fehérjét találtak, amelyek szekvenciájuk alapján a MRP1-hez álltak legközelebb az BC családon belül. Ezek között található a májsejtek apikális membránjában elhelyezkedő kanalikuláris multispecifikus organikus anion transzporter (cmot, vagy MRP2), aminek hibás müködése okozza a Dubin-Johnson szindrómát, a krónikus konjugált hiperbilirubinémiát (Jansen és mtsi., 1995; Paulusma és mtsi., 1996), a szulfonilurea receptor (SUR1, SUR2), amely az TP függőã csatornák reguláló alegysége és defektusa a csatorna inaktiválódása folytán krónikus inzulin szekrécióhoz vezet (hiperinzulinémiás hipoglikémia) (guilar-bryan és mtsi., 1995; Inagaki és mtsi., 1996; Bryan és guilar-bryan, 1997). z emberen kívül számos más fajban is meghatároztak az MRP1-hez hasonló fehérjéket. Nyúlban és patkányban az MRP2-vel megegyező fehérjét írtak le (van Kuijck és mtsi., 1996), Caenorhabditis elegans-ban 4 MRP1 rokon szekvenciát találtak (Wilson és mtsi., 1994; Broeks és mtsi., 1996), az élesztő genom szekvenálásakor a már korábban megismert YCF1 (yeast cadmium resistance protein) (Szczypka és mtsi., 1994) mellett további 4 MRP1 rokon szekvenciát határoztak meg (Decottignies és Goffeau, 1996). MRP1-hez hasonló 14
16 Statisztikai eljárások a fehérje kutatásban szekvenciájú fehérjét találtak növényekben is (rabidobsis thaliana) (Lu és mtsi., 1997; Marin és mtsi., 1998), ami mutatja a fehérje igen széleskörű elterjedését az élővilágban. z eddig vizsgálatok alapján az MRP1 rokon fehérjék képesek organikus anionokat transzportálni, vagy valamilyen anionos vegyülettel kölcsönhatni. z MRP1 a hidrofób rákellenes gyógyszereket glutationnal kotranszportálva távolítja el a sejtekből (Leier és mtsi., 1994), az MRP2 a konjugált epesók transzportjában vesz részt (Jedlitschky és mtsi., 1997), az YCF1 fehérje a kadmiumot glutation konjugátum formában transzportálja (Li és mtsi., 1996). Ezek alapján várható, hogy valamennyi MRP1 rokon fehérje szerkezete hasonló Statisztikai eljárások a fehérje kutatásban Dinamikus programozási eljárások z aminosav szekvenciák vizsgálatánál legelterjedtebben használt eljárások alapja az un. dinamikus programozási eljárás. dinamikus programozás akkor használható, ha az adott probléma rekurzív módon felbontható kettő vagy több kisebb feladatra. Például, ha meg kell mondanunk, hogy városból B városba hogyan juthatunk el a legrövidebb úton, akkor a feladat dinamikus programozáson alapuló megoldása, hogy ha C és D városok és B között találhatók, hogy megkeressük a legrövidebb -ból C-be és C-ből B-be menő utat, valamint a legrövidebb -ból D-be és D-ből B-be vezető utat, és e kettő lehetséges út közül a kiválasztjuk a rövidebbet. szekvenciák globális illesztéséhez ( alignment ) Needleman és Wunch (1970) használt először dinamikus programozáson alapuló eljárást, amit Smith és Waterman (1981) módosított a lokális hasonlóságok kimutatására. z illesztés készítése során először az aminosavak közötti hasonlóságokat ( score ) kell megadni, amely lehet az egység mátrix, vagy a fejezetben leírt hasonlósági mátrixok valamelyike. z illesztés lényege, hogy a két szekvenciát úgy rendezzük egymáshoz, hogy az azonos pozícióban levő aminosavak hasonlóságainak összege maximális legyen. Mivel ez a feladat a lehetséges összerendezések csillagászati száma miatt nem oldható meg direkt kereséssel, ezért szükséges a dinamikus programozási eljárás alkalmazása. Mindkét algoritmus lényege, hogy a feladatot rekurzív módon visszavezeti egyre kisebb feladatokra, és azoknak megoldása után oldja meg a nagyobb feladatot. Tehát, ha azæéså hosszúságú szekvenciákban levő½ Ò-ig és½ Ñ-ig tartó részszekvenciák maximális pontszámot adó összerendezését ismerjük, akkor ennek alapján az½ Ò ½-ig és½ Ñ ½-ig tartó részszekvenciák összerendezéséhez az½ Ò,½ Ñ; az½ Ü,½ Ñ(½ Ü Ò) és az½ Ò,½ Ý(½ Ý Ñ) esetek közül kell kiválasztani a legnagyobb pontszámot adó összerendezést. gyakorlati kivitelezés során ezt úgy oldják meg, hogy egyæ Å-es mátrixot töltenek fel a maximálist pontszámot adó összerendezés értékeivel (tehát a mátrix eleme az 15
17 Statisztikai eljárások a fehérje kutatásban ½,½ részszekvenciák összerendezése során kapható maximális pontszámmal egyenlő), majd ezen a mátrixon visszafele lépegetve megadható a két szekvencia összerendezése. Több szekvencia esetében ezt a feladatot ilyen módon nem tudjuk megoldani, mert az illesztés során használt mátrix mérete meghaladja a mai számítógépek kapacitását (ha a szekvenciák számañés átlagos hosszukæ, akkor egyæñelemű mátrix szükséges). Emiatt a többszörös szekvenciaillesztésekre többféle heurisztikus módszert dolgoztak ki, melyek általában a szekvenciák párosával való összehasonlításán alapulnak (Feng és Doolittle, 1987; Barton, 1994; Higgins, 1994; Wishart és mtsi., 1994). dinamikus programozási eljárások másik nagy alkalmazási területe a szekvenciák vizsgálata során a rejtett Markov modell használata, amelyben a modellnek a megfigyelési sorozathoz való illesztésénél alkalmazott Baum-Welch algoritmus, illetve a legjobb állapot sorozat megkereséséhez használt eljárás, a Viterbi algoritmus alkalmazza ezt a programozási eljárást (Rabiner, 1989). rejtett Markov modell alkalmazásait a következő fejezetben írom le, az eljárás matematikai részleteit a Módszerek-ben ( fejezet), illetve a Függelékben ismertetem Rejtett Markov eljárások sztochasztikus modellek alkalmazása a bioinformatika területén az elmúlt néhány évben ugrásszerűen nőtt meg. z egyik első modellt Churchill (1989) írta le, amelyben a különböző mitokondriális és kromoszómális DNS szekvenciák és fragmentek nagy változásokat mutató nukleotid összetételét modellezte rejtett Markov modell segítségével. Rejtett Markov modellt szekvencia motívumok felismerésére először DNS-ben levő fehérjekötő régiók, promóter helyek felismerésére dolgoztak ki. Mivel ezekben a régiókban a nukleotidok alig néhány pozícióban konzerváltak, valamint a konzervált pozíciók egymástól és az RNS szintézis indító helyétől való távolsága variábilis, a feladat megoldására különösen alkalmas a rejtett Markov modell, amelyben az EM ( Expectation-Maximization, vagy Expectation-Modification ) algoritmus segítségével a nem ismert távolságok és nukleotid eloszlások ismert szekvenciák segítségével megtaníthatók (Lawrence és Reilly, 1990; Cardon és Stormo, 1992). szekvencia illesztésekre és motívumok felismerésére a modell egy speciálisan erre a célra kidolgozott architektúra révén vált alkalmassá (Baldi és mtsi., 1994; Krogh és mtsi., 1994a). z eljárás két nagy előnye a hagyományos szekvencia illesztésekkel szemben, hogy számítási igénye a szekvenciák számával nem exponenciálisan, hanem csak lineárisan nő, valamint, hogy az aminosavak közötti hasonlóságokat nem kell előre megadni, sőt az eljárás képes az adott fehérje családra jellemző kicserélődések között a szekvencia különböző pontjain különbséget tenni, és ezáltal a térszerkezet szempontjából fontos és nem fontos szekvenciadarabokat megkülönböztetni. tanítás során kapott modellt a szekvencia profil eljárásokkal hasonló módon felhasználhatjuk az 16
18 Statisztikai eljárások a fehérje kutatásban adatbázisokban levő homológ szekvenciák keresésére (Hughey és Krogh, 1996), amely eljárás pontosságát a nagyon alacsony szekvenciális hasonlóságot mutató, de rokon fehérjék felismerését a Dirichlet keverék alkalmazásával tovább lehetett fokozni (Sjölander és mtsi., 1996). rejtett Markov modell eljárások másik nagy alkalmazási területe a gének lokalizálása a genomokban. Ehhez olyan architektúrájú modellt készítettek, amely a kódoló régiók felismerése mellett figyelembe veszi az adott élőlény kodon használatát, egyes szekvenálási hibákat automatikusan ki tud javítani (pl. frameshift-et okozó nukleotid inzerciót vagy deléciót), valamint különbséget tud tenni a rövidebb és hosszabb intergenikus régiók között, és számos intergenikus repetitív szekvenciát képes felismerni (Krogh és mtsi., 1994b; Borodovsky és mtsi., 1995; Lukashin és Borodovsky, 1998). szekvencia illesztésekhez használt modell segítségével nemcsak az egyes szekvencia motívumokat ismerhetjük fel, hanem a fehérjék másodlagos szerkezeti osztályokba való besorolását is elvégezhetjük (Francesco és mtsi., 1997). Ezekben a modellekben a rejtett állapotokhoz nem rendeltek valamilyen konkrét megfigyelhető fizikai tulajdonságot, míg a génfelismeréshez használt modellben a rejtett állapotokhoz hozzárendelhetjük pl. a kódoló vagy nem kódoló régiókat. rejtett állapotokhoz az egyes másodlagos térszerkezeti elemeket rendelve és a megfelelő architektúrát kialakítva olyan eljárásokat is kidolgoztak, amelyek a fehérjék másodlagos szerkezetét becsülték (Stultz és mtsi., 1993; White és mtsi., 1993). becslés pontossága alacsonyabb volt a már ismert másodlagos szerkezet becslő eljárások pontosságánál, de megmutatták a rejtett Markov modellnek egy általánosabb használatát. rejtett Markov modell szerkezete, architektúrája (a rejtett állapotok száma és a közöttük levő lehetséges átmenetek) szinte tetszőleges lehet, és emiatt a legkülönbözöbb biológiai problémák leírására alkalmazható az architektúra megfelelő megválasztásával. 17
19 3. Célkitűzések Célkitűzések z aminosav szekvenciák vizsgálata, a rokon fehérjék családokba sorolása szekvencia illesztések segítségével történik. z illesztéshez definiálni kell az aminosavak közötti hasonlóságok mértékét, amelyet vagy a rokon szekvenciák statisztikai analízisével határoznak meg, vagy az aminosavak fizikai-kémiai tulajdonságai alapján, vagy az ismert térszerkezetű fehérjék vizsgálata alapján. z első esetben az illesztésnél használt hasonlósági mátrix determinálja a készítendő hasonlósági mátrixot. Ezt a hibát úgy próbálják kiküszöbölni, hogy csak nagy szekvenciális hasonlóságot mutató fehérjék szekvenciáit illesztik az identitás mátrixot felhasználva, ekkor azonban a kisebb hasonlóságokra való extrapoláció kérdőjelezhető meg. fizikai-kémiai paraméterek használata során nem tudjuk, hogy a fehérje térszerkezetének stabilitásához az egyes tulajdonságok milyen mértékben járulnak hozzá, míg a térszerkezeti adatok használatakor a vizsgálatok nagyon kis számú minta statisztikáján alapulnak, és ezért kevésbé megbízhatók. Ezen okok miatt célul tűztem ki az aminosavak közötti hasonlóságok meghatározására egy olyan eljárás kidolgozását, amely nagyszámú szekvencia adaton nyugszik, ugyanakkor mentes a szekvencia illesztésekből fakadó tautológiától, és képes meghatározni az aminosavaknak a fehérjeszerkezet építése és fenntartása szempontjából fontos tulajdonságait. Intézetünk ktív Transzporter Fehérje kutatócsoportja, illetve az Országos Haematológiai és Immunológiai Intézet Membrán kutatócsoportja két olyan fehérjének a kutatásában vesz részt, amelyek az esetek nagy többségében a daganatos megbetegedések kemoterápiás kezelésének kudarcát okozzák. E két fehérje a multidrog rezisztencia fehérje (MDR1) és a multidrog rezisztenciához társuló fehérje (MRP1), amelyek megnövekedett kifejeződése okozza a sejtek széleskörű drog rezisztenciáját. Mindkét fehérje az BC transzporterek családjába tartozik, amely család eukarióta tagjainak többsége két homológ egy transzmembrán és egy nukleotidkötő domént tartalmazó molekulafélből áll. családba tartozó fehérjék topológiai vizsgálata azt mutatta, hogy a a transzmembrándoménok 6-6 transzmembránhélixből állnak. z MRP1 szekvenciájának meghatározásakor azonban a szerzők azt javasolták, hogy az MRP1 fehérjét ettől eltérő membrántopológia jellemez, az N-terminális transzmembrándoménban szerintük 8 transzmembránhélix van, míg a C-terminális felé esőben 4. fenti két kutatócsoporttal együttműködve célul tűztük ki az MRP1 jól megalapozott membrántopológiai modelljének kidolgozását. Ezzel párhuzamosan arra is kíváncsiak voltunk, hogy az BC családon belül milyen más hasonló szerkezetű fehérjék találhatók, és azok milyen szekvenciális viszonyban állnak az MRP1-gyel. 18
20 Célkitűzések Általánosan elfogadott, hogy a membránt átszelő szekvenciadarabok felismerése a szekvencia alapján könnyebb feladat, mint a globuláris fehérjék másodlagos szerkezeti részeinek a becslése, és ezt az irodalomban található becslő eljárások a másodlagos szerkezet becsléséhez viszonyítva nagy pontossága is alátámasztja. Bár ezek a becslő eljárások egyes aminosavaknak a topológia kialakításában betöltött szerepét is megmutatták, a transzmembrán fehérjék topológiáját elsősorban meghatározó alapelvet nem ismerjük. z Irodalmi áttekintésben ismertetett munkák alapján egyértelművé vált, hogy a transzmembrán fehérjék egyes térszerkezeti részei különböző fizikai-kémiai környezetben találhatók. z aminosavak affinitása az egyes térrészekhez különböző, amit a transzmembrán fehérjéknek ezekben a régióiban levő szekvenciadarabjainak az aminosav összetételeiben megmutatkozó különbségeik jól mutatnak. különböző membránokban levő fehérjék összetétele, valamint az a tény, hogy egyes fehérjék topológiája egy adott paraméter sereget használva jól becsülhető, míg mások más paraméterekkel írhatók le, azt mutatják, hogy nem az egyes térrészekben levő szegmensek aminosav összetételeinek abszolut értéke határozza meg a fehérjék topológiáját, hanem feltételezésem szerint az, hogy az egyes térrészekben levő szegmensek aminosav összetételeinek különbsége maximális legyen, és így a maximális különbséget adó felbontást megkeresve a fehérje topológiája a szekvencia alapján megadható. Ezért célul tűztem ki egy olyan transzmembrán fehérjék topológiáját becslő eljárás kidolgozását, amellyel megkereshetjük ezt a maximális aminosav összetételbeli különbséget adó felbontást a fehérjékben és ezáltal igazolhatjuk az előbbi feltételezést. 19
A fehérjék szerkezeti hierarchiája. Fehérje-szerkezetek! Klasszikus szerkezet-funkció paradigma. szekvencia. funkció. szerkezet! Myoglobin.
Myoglobin Fehérje-szerkezetek! MGLSDGEWQLVLNVWGKVEADIPGGQEVLIRLFK GPETLEKFDKFKLKSEDEMKASE DLKKGATVLTALGGILKKKGEAEIKPLAQSA TKKIPVKYLEFISECIIQVLQSK PGDFGADAQGAMNKALELFRKDMASNYKELGFQG Fuxreiter Mónika! Debreceni
TDK lehetőségek az MTA TTK Enzimológiai Intézetben
TDK lehetőségek az MTA TTK Enzimológiai Intézetben Vértessy G. Beáta egyetemi tanár TDK mind 1-3 helyezettek OTDK Pro Scientia különdíj 1 második díj Diákjaink Eredményei Zsűri különdíj 2 első díj OTDK
2. Ismert térszerkezetű transzmembrán fehérjék adatbázisa: a PDBTM adatbázis. 3. A transzmembrán fehérje topológiai adatbázis, a TOPDB szerver
A 2005 és 2007 között megvalósított project célja transzmembrán fehérjék vizsgálata és az ehhez szükséges eljárások kifejlesztése volt. Ez utóbbi magába foglalta új adatbázisok és szerkezet becslő módszerek
FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI
FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 10 X. SZIMULÁCIÓ 1. VÉLETLEN számok A véletlen számok fontos szerepet játszanak a véletlen helyzetek generálásában (pénzérme, dobókocka,
Hipotézis STATISZTIKA. Kétmintás hipotézisek. Munkahipotézis (H a ) Tematika. Tudományos hipotézis. 1. Előadás. Hipotézisvizsgálatok
STATISZTIKA 1. Előadás Hipotézisvizsgálatok Tematika 1. Hipotézis vizsgálatok 2. t-próbák 3. Variancia-analízis 4. A variancia-analízis validálása, erőfüggvény 5. Korreláció számítás 6. Kétváltozós lineáris
Statisztika - bevezetés Méréselmélet PE MIK MI_BSc VI_BSc 1
Statisztika - bevezetés 00.04.05. Méréselmélet PE MIK MI_BSc VI_BSc Bevezetés Véletlen jelenség fogalma jelenséget okok bizonyos rendszere hozza létre ha mindegyik figyelembe vehető egyértelmű leírás általában
Transzporterek vizsgálata lipidmembránokban Sarkadi Balázs MTA-SE Molekuláris Biofizikai Kutatócsoport, MTA-TTK Budapest
Transzporterek vizsgálata lipidmembránokban 2016. Sarkadi Balázs MTA-SE Molekuláris Biofizikai Kutatócsoport, MTA-TTK Budapest Membrántranszport fehérjék típusok, lipid-kapcsolatok A membránok szerkezete
FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI
FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 4 IV. MINTA, ALAPsTATIsZTIKÁK 1. MATEMATIKAI statisztika A matematikai statisztika alapfeladatát nagy általánosságban a következőképpen
transzláció DNS RNS Fehérje A fehérjék jelenléte nélkülözhetetlen minden sejt számára: enzimek, szerkezeti fehérjék, transzportfehérjék
Transzláció A molekuláris biológia centrális dogmája transzkripció transzláció DNS RNS Fehérje replikáció Reverz transzkriptáz A fehérjék jelenléte nélkülözhetetlen minden sejt számára: enzimek, szerkezeti
Bioinformatika és genomanalízis az orvostudományban. Biológiai adatbázisok. Cserző Miklós 2018
Bioinformatika és genomanalízis az orvostudományban Biológiai adatbázisok Cserző Miklós 2018 A mai előadás Mi az adatbázis A biológia kapcsolata az adatbázisokkal Az adatbázisok típusai Adatbázis formátumok,
Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János
Szent István Egyetem Állatorvos-tudományi Kar Biomatematikai és Számítástechnikai Tanszék Biomatematika 12. Regresszió- és korrelációanaĺızis Fodor János Copyright c Fodor.Janos@aotk.szie.hu Last Revision
NÖVÉNYGENETIKA. Az Agrármérnöki MSc szak tananyagfejlesztése TÁMOP /1/A
NÖVÉNYGENETIKA Az Agrármérnöki MSc szak tananyagfejlesztése TÁMOP-4.1.2-08/1/A-2009-0010 A NÖVÉNYI TÁPANYAG TRANSZPORTEREK az előadás áttekintése A tápionok útja a növényben Növényi tápionok passzív és
MÉRÉSI EREDMÉNYEK PONTOSSÁGA, A HIBASZÁMÍTÁS ELEMEI
MÉRÉSI EREDMÉYEK POTOSSÁGA, A HIBASZÁMÍTÁS ELEMEI. A mérési eredmény megadása A mérés során kapott értékek eltérnek a mérendő fizikai mennyiség valódi értékétől. Alapvetően kétféle mérési hibát különböztetünk
Fehérjeszerkezet, és tekeredés
Fehérjeszerkezet, és tekeredés Futó Kinga 2013.10.08. Polimerek Polimer: hasonló alegységekből (monomer) felépülő makromolekulák Alegységek száma: tipikusan 10 2-10 4 Titin: 3,435*10 4 aminosav C 132983
Matematikai alapok és valószínőségszámítás. Középértékek és szóródási mutatók
Matematikai alapok és valószínőségszámítás Középértékek és szóródási mutatók Középértékek A leíró statisztikák talán leggyakrabban használt csoportját a középértékek jelentik. Legkönnyebben mint az adathalmaz
FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI
FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 8 VIII. REGREssZIÓ 1. A REGREssZIÓs EGYENEs Két valószínűségi változó kapcsolatának leírására az eddigiek alapján vagy egy numerikus
A tárgy címe: Bioinformatika
A tárgy címe: Bioinformatika Kötelezően választható tárgy IV. és V. évfolyamos biológus hallgatók számára; heti 2+3 óra Előkövetelmény: Biokémia főkollégium; genetika főkollégium; alapszintű számítógépes
FEHÉRJÉK A MÁGNESEKBEN. Bodor Andrea ELTE, Szerkezeti Kémiai és Biológiai Laboratórium. Alkímia Ma, Budapest,
FEHÉRJÉK A MÁGNESEKBEN Bodor Andrea ELTE, Szerkezeti Kémiai és Biológiai Laboratórium Alkímia Ma, Budapest, 2013.02.28. I. FEHÉRJÉK: L-α aminosavakból felépülő lineáris polimerek α H 2 N CH COOH amino
FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI
FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI statisztika 9 IX. ROBUsZTUs statisztika 1. ROBUsZTUssÁG Az eddig kidolgozott módszerek főleg olyanok voltak, amelyek valamilyen értelemben optimálisak,
Regresszió. Csorba János. Nagyméretű adathalmazok kezelése március 31.
Regresszió Csorba János Nagyméretű adathalmazok kezelése 2010. március 31. A feladat X magyarázó attribútumok halmaza Y magyarázandó attribútumok) Kérdés: f : X -> Y a kapcsolat pár tanítópontban ismert
BAGME11NNF Munkavédelmi mérnökasszisztens Galla Jánosné, 2011.
BAGME11NNF Munkavédelmi mérnökasszisztens Galla Jánosné, 2011. 1 Mérési hibák súlya és szerepe a mérési eredményben A mérési hibák csoportosítása A hiba rendűsége Mérési bizonytalanság Standard és kiterjesztett
Natív antigének felismerése. B sejt receptorok, immunglobulinok
Natív antigének felismerése B sejt receptorok, immunglobulinok B és T sejt receptorok A B és T sejt receptorok is az immunglobulin fehérje család tagjai A TCR nem ismeri fel az antigéneket, kizárólag az
y ij = µ + α i + e ij
Elmélet STATISZTIKA 3. Előadás Variancia-analízis Lineáris modellek A magyarázat a függő változó teljes heterogenitásának két részre bontását jelenti. A teljes heterogenitás egyik része az, amelynek okai
Hipotézis, sejtés STATISZTIKA. Kétmintás hipotézisek. Tudományos hipotézis. Munkahipotézis (H a ) Nullhipotézis (H 0 ) 11. Előadás
STATISZTIKA Hipotézis, sejtés 11. Előadás Hipotézisvizsgálatok, nem paraméteres próbák Tudományos hipotézis Nullhipotézis felállítása (H 0 ): Kétmintás hipotézisek Munkahipotézis (H a ) Nullhipotézis (H
A fehérjék térszerkezetének jóslása
A fehérjék térszerkezetének jóslása 1. A probléma bonyolultsága 2. A predikció szintjei 3. 1D predikciók (másodlagos szerkezet, hozzáférhetõség, transzmembrán hélixek 4. 2D predikciók (oldallánc kontaktusok,
Kettőnél több csoport vizsgálata. Makara B. Gábor
Kettőnél több csoport vizsgálata Makara B. Gábor Három gyógytápszer elemzéséből az alábbi energia tartalom adatok származtak (kilokalória/adag egységben) Három gyógytápszer elemzésébô A B C 30 5 00 10
Semmelweis Egyetem / Élettani Intézet / Budapest. Bioinformatika és genomanalízis az orvostudományban. Szekvenciaelemzés. Cserző Miklós 2017
Bioinformatika és genomanalízis az orvostudományban Szekvenciaelemzés Cserző Miklós 2017 A mai előadás Szekvencia analízis statisztikus szempontból Annotálás homológia alapján Az annotálás szempontjai
Fehérjeszerkezet analízis. Fehérjeszerkezet analízis. Fehérjeszerkezet analízis. Fehérjeszerkezet analízis. Fehérjeszerkezet analízis
Szerkezet Protein Data Bank (PDB) http://www.rcsb.org/pdb ~ 35 701 szerkezet közepes felbontás 1552 szerkezet d 1.5 Å 160 szerkezet d 1.0 Å 10 szerkezet d 0.8 Å (atomi felbontás) E globális minimum? funkció
A nukleinsavak polimer vegyületek. Mint polimerek, monomerekből épülnek fel, melyeket nukleotidoknak nevezünk.
Nukleinsavak Szerkesztette: Vizkievicz András A nukleinsavakat először a sejtek magjából sikerült tiszta állapotban kivonni. Innen a név: nucleus = mag (lat.), a sav a kémhatásukra utal. Azonban nukleinsavak
7. Fehérjeszekvenciák és térszerkezetek analízise.
7. Fehérjeszekvenciák és térszerkezetek analízise. 1. Egyszerû elemzések 2. Térszerkezet predikció 2.1. A probléma bonyolultsága 2.2. A predikció szintjei 2.3. 1D predikciók (másodlagos szerkezet, hozzáférhetõség,
Statisztikai következtetések Nemlineáris regresszió Feladatok Vége
[GVMGS11MNC] Gazdaságstatisztika 10. előadás: 9. Regressziószámítás II. Kóczy Á. László koczy.laszlo@kgk.uni-obuda.hu Keleti Károly Gazdasági Kar Vállalkozásmenedzsment Intézet A standard lineáris modell
Statisztika I. 11. előadás. Előadó: Dr. Ertsey Imre
Statisztika I. 11. előadás Előadó: Dr. Ertsey Imre Összefüggés vizsgálatok A társadalmi gazdasági élet jelenségei kölcsönhatásban állnak, összefüggnek egymással. Statisztika alapvető feladata: - tényszerűségek
Al-Mg-Si háromalkotós egyensúlyi fázisdiagram közelítő számítása
l--si háromalkotós egyensúlyi fázisdiagram közelítő számítása evezetés Farkas János 1, Dr. Roósz ndrás 1 doktorandusz, tanszékvezető egyetemi tanár Miskolci Egyetem nyag- és Kohómérnöki Kar Fémtani Tanszék
Membrántranszport. Gyógyszerész előadás Dr. Barkó Szilvia
Membrántranszport Gyógyszerész előadás 2017.04.10 Dr. Barkó Szilvia Sejt membránok A sejtmembrán funkciói Védelem Kommunikáció Molekulák importja és exportja Sejtmozgás Általános szerkezet Lipid kettősréteg
Statisztika I. 12. előadás. Előadó: Dr. Ertsey Imre
Statisztika I. 1. előadás Előadó: Dr. Ertsey Imre Regresszió analízis A korrelációs együttható megmutatja a kapcsolat irányát és szorosságát. A kapcsolat vizsgálata során a gyakorlatban ennél messzebb
A mérési eredmény megadása
A mérési eredmény megadása A mérés során kapott értékek eltérnek a mérendő fizikai mennyiség valódi értékétől. Alapvetően kétféle mérési hibát különböztetünk meg: a determinisztikus és a véletlenszerű
Cserző Miklós Bioinformatika és genomanalízis az orvostudományban. Integrált biológiai adatbázisok
Bioinformatika és genomanalízis az orvostudományban Integrált biológiai adatbázisok Cserző Miklós 2018 A mai előadás A genom annotálás jelentősége Genome Reference Consortium Gene Ontology Az ensembl pipeline
Bioinformatika 2 6. előadás
6. előadás Prof. Poppe László BME Szerves Kémia és Technológia Tsz. Bioinformatika proteomika Előadás és gyakorlat 2018.10.08. PDBj: http://www.pdbj.org/ Fehérjék 3D szerkezeti adatbázisai - PDBj 2 2018.10.08.
MedInProt Szinergia IV. program. Szerkezetvizsgáló módszer a rendezetlen fehérjék szerkezetének és kölcsönhatásainak jellemzésére
MedInProt Szinergia IV. program Szerkezetvizsgáló módszer a rendezetlen fehérjék szerkezetének és kölcsönhatásainak jellemzésére Tantos Ágnes MTA TTK Enzimológiai Intézet, Rendezetlen fehérje kutatócsoport
STATISZTIKA. A maradék független a kezelés és blokk hatástól. Maradékok leíró statisztikája. 4. A modell érvényességének ellenőrzése
4. A modell érvényességének ellenőrzése STATISZTIKA 4. Előadás Variancia-analízis Lineáris modellek 1. Függetlenség 2. Normális eloszlás 3. Azonos varianciák A maradék független a kezelés és blokk hatástól
Semmelweis Egyetem / Élettani Intézet / Budapest. Bioinformatika és genomanalízis az orvostudományban. Bioinformatikai modellek. Cserző Miklós 2017
Bioinformatika és genomanalízis az orvostudományban Bioinformatikai modellek Cserző Miklós 2017 A mai előadás A predikció jelentősége a biológiában Egyszerű statisztikai modellek Kyte-Doolittle hidrofóbicitás
[Biomatematika 2] Orvosi biometria
[Biomatematika 2] Orvosi biometria 2016.02.29. A statisztika típusai Leíró jellegű statisztika: összegzi egy adathalmaz jellemzőit. A középértéket jelemzi (medián, módus, átlag) Az adatok változékonyságát
Balatoni albedó(?)mérések
Környezettudományi Doktori Iskolák Konferenciája Budapest, 2012. augusztus 30-31 PE Georgikon Kar menyhart-l@georgikon.hu Eredeti célkitűzés Balaton albedójának napi és éves menete Albedó paraméterezése
Hemoglobin - myoglobin. Konzultációs e-tananyag Szikla Károly
Hemoglobin - myoglobin Konzultációs e-tananyag Szikla Károly Myoglobin A váz- és szívizom oxigén tároló fehérjéje Mt.: 17.800 153 aminosavból épül fel A lánc kb 75 % a hélix 8 db hélix, köztük nem helikális
1. Adatok kiértékelése. 2. A feltételek megvizsgálása. 3. A hipotézis megfogalmazása
HIPOTÉZIS VIZSGÁLAT A hipotézis feltételezés egy vagy több populációról. (pl. egy gyógyszer az esetek 90%-ában hatásos; egy kezelés jelentősen megnöveli a rákos betegek túlélését). A hipotézis vizsgálat
I. BESZÁLLÍTÓI TELJESÍTMÉNYEK ÉRTÉKELÉSE
I. BESZÁLLÍTÓI TELJESÍTMÉNYEK ÉRTÉKELÉSE Komplex termékek gyártására jellemző, hogy egy-egy termékbe akár több ezer alkatrész is beépül. Ilyenkor az alkatrészek általában sok különböző beszállítótól érkeznek,
Nagyságrendek. Kiegészítő anyag az Algoritmuselmélet tárgyhoz. Friedl Katalin BME SZIT február 1.
Nagyságrendek Kiegészítő anyag az Algoritmuselmélet tárgyhoz (a Rónyai Ivanyos Szabó: Algoritmusok könyv mellé) Friedl Katalin BME SZIT friedl@cs.bme.hu 018. február 1. Az O, Ω, Θ jelölések Az algoritmusok
Diszkréten mintavételezett függvények
Diszkréten mintavételezett függvények A függvény (jel) értéke csak rögzített pontokban ismert, de köztes pontokban is meg akarjuk becsülni időben mintavételezett jel pixelekből álló műholdkép rácson futtatott
A matematikai feladatok és megoldások konvenciói
A matematikai feladatok és megoldások konvenciói Kozárné Fazekas Anna Kántor Sándor Matematika és Informatika Didaktikai Konferencia - Szatmárnémeti 2011. január 28-30. Konvenciók Mindenki által elfogadott
Mintavétel fogalmai STATISZTIKA, BIOMETRIA. Mintavételi hiba. Statisztikai adatgyűjtés. Nem véletlenen alapuló kiválasztás
STATISZTIKA, BIOMETRIA. Előadás Mintavétel, mintavételi technikák, adatbázis Mintavétel fogalmai A mintavételt meg kell tervezni A sokaság elemei: X, X X N, lehet véges és végtelen Mintaelemek: x, x x
Flagellin alapú filamentáris nanoszerkezetek létrehozása
Flagellin alapú filamentáris nanoszerkezetek létrehozása Vonderviszt Ferenc PE MÜKKI Bio-Nanorendszerek Laboratórium MTA Enzimológiai Intézete MTA MFA Bakteriális flagellumok Flagelláris filamentum: ~10
A T sejt receptor (TCR) heterodimer
Immunbiológia - II A T sejt receptor (TCR) heterodimer 1 kötőhely lánc lánc 14. kromoszóma 7. kromoszóma V V C C EXTRACELLULÁRIS TÉR SEJTMEMBRÁN CITOSZÓL lánc: VJ régió lánc: VDJ régió Nincs szomatikus
Adatszerkezetek. Nevezetes algoritmusok (Keresések, rendezések)
Adatszerkezetek Nevezetes algoritmusok (Keresések, rendezések) Keresések A probléma általános megfogalmazása: Adott egy N elemű sorozat, keressük meg azt az elemet (határozzuk meg a helyét a sorozatban),
Mérési hibák 2006.10.04. 1
Mérési hibák 2006.10.04. 1 Mérés jel- és rendszerelméleti modellje Mérési hibák_labor/2 Mérési hibák mérési hiba: a meghatározandó értékre a mérés során kapott eredmény és ideális értéke közötti különbség
1b. Fehérje transzport
1b. Fehérje transzport Fehérje transzport CITOSZÓL Nem-szekretoros útvonal sejtmag mitokondrium plasztid peroxiszóma endoplazmás retikulum Szekretoros útvonal lizoszóma endoszóma Golgi sejtfelszín szekretoros
Matematikai alapok és valószínőségszámítás. Statisztikai becslés Statisztikák eloszlása
Matematikai alapok és valószínőségszámítás Statisztikai becslés Statisztikák eloszlása Mintavétel A statisztikában a cél, hogy az érdeklõdés tárgyát képezõ populáció bizonyos paramétereit a populációból
(1) A T sejtek aktiválása (2) Az ön reaktív T sejtek toleranciája. α lánc. β lánc. V α. V β. C β. C α.
Immunbiológia II A T sejt receptor () heterodimer α lánc kötőhely β lánc 14. kromoszóma 7. kromoszóma 1 V α V β C α C β EXTRACELLULÁRIS TÉR SEJTMEMBRÁN CITOSZÓL αlánc: VJ régió β lánc: VDJ régió Nincs
A regisztrált álláskeresők számára vonatkozó becslések előrejelző képességének vizsgálata
A regisztrált álláskeresők számára vonatkozó becslések előrejelző képességének vizsgálata Az elemzésben a GoogleTrends (GT, korábban Google Insights for Search) modellek mintán kívüli illeszkedésének vizsgálatával
Infobionika ROBOTIKA. X. Előadás. Robot manipulátorok II. Direkt és inverz kinematika. Készült a HEFOP P /1.0 projekt keretében
Infobionika ROBOTIKA X. Előadás Robot manipulátorok II. Direkt és inverz kinematika Készült a HEFOP-3.3.1-P.-2004-06-0018/1.0 projekt keretében Tartalom Direkt kinematikai probléma Denavit-Hartenberg konvenció
Markov modellek 2015.03.19.
Markov modellek 2015.03.19. Markov-láncok Markov-tulajdonság: egy folyamat korábbi állapotai a későbbiekre csak a jelen állapoton keresztül gyakorolnak befolyást. Semmi, ami a múltban történt, nem ad előrejelzést
Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió
SZDT-08 p. 1/31 Biometria az orvosi gyakorlatban Korrelációszámítás, regresszió Werner Ágnes Villamosmérnöki és Információs Rendszerek Tanszék e-mail: werner.agnes@virt.uni-pannon.hu Korrelációszámítás
4/24/12. Regresszióanalízis. Legkisebb négyzetek elve. Regresszióanalízis
1. feladat Regresszióanalízis. Legkisebb négyzetek elve 2. feladat Az iskola egy évfolyamába tartozó diákok átlagéletkora 15,8 év, standard deviációja 0,6 év. A 625 fős évfolyamból hány diák fiatalabb
Exponenciális kisimítás. Üzleti tervezés statisztikai alapjai
Exponenciális kisimítás Üzleti tervezés statisztikai alapjai Múlt-Jelen-Jövő kapcsolat Egyensúlyi helyzet Teljes konfliktus Részleges konfliktus: 0 < α < 1, folytatódik a múlt, de nem változatlanul módosítás:
Molekuláris biológiai eljárások alkalmazása a GMO analitikában és az élelmiszerbiztonság területén
Molekuláris biológiai eljárások alkalmazása a GMO analitikában és az élelmiszerbiztonság területén Dr. Dallmann Klára A molekuláris biológia célja az élőlények és sejtek működésének molekuláris szintű
8. A fehérjék térszerkezetének jóslása
8. A fehérjék térszerkezetének jóslása A probléma bonyolultsága Általánosságban: találjuk meg egy tetszõleges szekvencia azon konformációját, amely a szabadentalpia globális minimumát adja. Egyszerû modellekben
Matematikai alapok és valószínőségszámítás. Valószínőségi eloszlások Binomiális eloszlás
Matematikai alapok és valószínőségszámítás Valószínőségi eloszlások Binomiális eloszlás Bevezetés A tudományos életben megfigyeléseket teszünk, kísérleteket végzünk. Ezek többféle különbözı eredményre
A mérés. A mérés célja a mérendő mennyiség valódi értékének meghatározása. Ez a valóságban azt jelenti, hogy erre kell
A mérés A mérés célja a mérendő mennyiség valódi értékének meghatározása. Ez a valóságban azt jelenti, hogy erre kell törekedni, minél közelebb kerülni a mérés során a valós mennyiség megismeréséhez. Mérési
NUKLEINSAVAK. Nukleinsav: az élő szervezetek sejtmagvában és a citoplazmában található, az átöröklésben szerepet játszó, nagy molekulájú anyag
NUKLEINSAVAK Nukleinsav: az élő szervezetek sejtmagvában és a citoplazmában található, az átöröklésben szerepet játszó, nagy molekulájú anyag RNS = Ribonukleinsav DNS = Dezoxi-ribonukleinsav A nukleinsavak
BIOFIZIKA I OZMÓZIS Bugyi Beáta (PTE ÁOK Biofizikai Intézet) OZMÓZIS
BIOFIZIKA I OZMÓZIS - 2010. 10. 26. Bugyi Beáta (PTE ÁOK Biofizikai Intézet) OZMÓZIS BIOFIZIKA I - DIFFÚZIÓ DIFFÚZIÓ - ÁTTEKINTÉS TRANSZPORTFOLYAMATOK ÁLTALÁNOS LEÍRÁSA ONSAGER EGYENLET lineáris, irreverzibilis
Thomson-modell (puding-modell)
Atommodellek Thomson-modell (puding-modell) A XX. század elejére világossá vált, hogy az atomban található elektronok ugyanazok, mint a katódsugárzás részecskéi. Magyarázatra várt azonban, hogy mi tartja
A XXI. SZÁZADRA BECSÜLT KLIMATIKUS TENDENCIÁK VÁRHATÓ HATÁSA A LEFOLYÁS SZÉLSŐSÉGEIRE A FELSŐ-TISZA VÍZGYŰJTŐJÉN
44. Meteorológiai Tudományos Napok Budapest, 2018. november 22 23. A XXI. SZÁZADRA BECSÜLT KLIMATIKUS TENDENCIÁK VÁRHATÓ HATÁSA A LEFOLYÁS SZÉLSŐSÉGEIRE A FELSŐ-TISZA VÍZGYŰJTŐJÉN Kis Anna 1,2, Pongrácz
Statisztika I. 8. előadás. Előadó: Dr. Ertsey Imre
Statisztika I. 8. előadás Előadó: Dr. Ertsey Imre Minták alapján történő értékelések A statisztika foglalkozik. a tömegjelenségek vizsgálatával Bizonyos esetekben lehetetlen illetve célszerűtlen a teljes
Adaptív dinamikus szegmentálás idősorok indexeléséhez
Adaptív dinamikus szegmentálás idősorok indexeléséhez IPM-08irAREAE kurzus cikkfeldolgozás Balassi Márton 1 Englert Péter 1 Tömösy Péter 1 1 Eötvös Loránd Tudományegyetem Informatikai Kar 2013. november
Tömbök kezelése. Példa: Vonalkód ellenőrzőjegyének kiszámítása
Tömbök kezelése Példa: Vonalkód ellenőrzőjegyének kiszámítása A számokkal jellemzett adatok, pl. személyi szám, adószám, taj-szám, vonalkód, bankszámlaszám esetében az elírásból származó hibát ún. ellenőrző
Szimuláció RICHARD M. KARP és AVI WIGDERSON. (Készítette: Domoszlai László)
Szimuláció RICHARD M. KARP és AVI WIGDERSON A Fast Parallel Algorithm for the Maximal Independent Set Problem című cikke alapján (Készítette: Domoszlai László) 1. Bevezetés A következőkben megadott algoritmus
1. előadás. Lineáris algebra numerikus módszerei. Hibaszámítás Számábrázolás Kerekítés, levágás Klasszikus hibaanalízis Abszolút hiba Relatív hiba
Hibaforrások Hiba A feladatok megoldása során különféle hibaforrásokkal találkozunk: Modellhiba, amikor a valóságnak egy közelítését használjuk a feladat matematikai alakjának felírásához. (Pl. egy fizikai
Biofizika szeminárium. Diffúzió, ozmózis
Biofizika szeminárium Diffúzió, ozmózis I. DIFFÚZIÓ ORVOSI BIOFIZIKA tankönyv: III./2 fejezet Részecskék mozgása Brown-mozgás Robert Brown o kísérlet: pollenszuszpenzió mikroszkópos vizsgálata o megfigyelés:
sejt működés jovo.notebook March 13, 2018
1 A R É F Z S O I B T S Z E S R V E Z D É S I S E Z I N E T E K M O I B T O V N H C J W W R X S M R F Z Ö R E W T L D L K T E I A D Z W I O S W W E T H Á E J P S E I Z Z T L Y G O A R B Z M L A H E K J
Elektromiográfia (Dinamometria) A motoros egységek toborzása, az izomfáradás vizsgálata A mérési adatok elemzése és értékelése
Elektromiográfia (Dinamometria) A motoros egységek toborzása, az izomfáradás vizsgálata A mérési adatok elemzése és értékelése Biológia Bsc. B / Pszichológia gyakorlat A mérést és kiértékelést végezték:............
Modern műszeres analitika szeminárium Néhány egyszerű statisztikai teszt
Modern műszeres analitika szeminárium Néhány egyszerű statisztikai teszt Galbács Gábor KIUGRÓ ADATOK KISZŰRÉSE STATISZTIKAI TESZTEKKEL Dixon Q-tesztje Gyakori feladat az analitikai kémiában, hogy kiugrónak
Rendezések. Sergyán Szabolcs Óbudai Egyetem Neumann János Informatikai Kar október 24.
Rendezések 8. előadás Sergyán Szabolcs sergyan.szabolcs@nik.uni-obuda.hu Óbudai Egyetem Neumann János Informatikai Kar 2011. október 24. Sergyán (OE NIK) AAO 08 2011. október 24. 1 / 1 Felhasznált irodalom
Keresés képi jellemzők alapján. Dr. Balázs Péter SZTE, Képfeldolgozás és Számítógépes Grafika Tanszék
Keresés képi jellemzők alapján Dr. Balázs Péter SZTE, Képfeldolgozás és Számítógépes Grafika Tanszék Lusta gépi tanulási algoritmusok Osztályozás: k=1: piros k=5: kék k-legközelebbi szomszéd (k=1,3,5,7)
Két kevéssé ismert humán ABCG fehérje expressziója és funkcionális vizsgálata: ABCG1 és ABCG4 jellemzése
Két kevéssé ismert humán ABCG fehérje expressziója és funkcionális vizsgálata: ABCG1 és ABCG4 jellemzése Doktori tézisek Dr. Cserepes Judit Semmelweis Egyetem Molekuláris Orvostudományok Doktori Iskola
Bioinformatika 2 4. előadás
4. előadás Prof. Poppe László BME Szerves Kémia és Technológia Tsz. Bioinformatika proteomika Előadás és gyakorlat 2018.09.24. Biológiai adatbázisok Felhasználó Keresõprogram BLAST Biológiai adatbázisok
Biomatematika 2 Orvosi biometria
Biomatematika 2 Orvosi biometria 2017.02.05. Orvosi biometria (orvosi biostatisztika) Statisztika: tömegjelenségeket számadatokkal leíró tudomány. A statisztika elkészítésének menete: tanulmányok (kísérletek)
A tananyag felépítése: A BIOLÓGIA ALAPJAI. I. Prokarióták és eukarióták. Az eukarióta sejt. Pécs Miklós: A biológia alapjai
A BIOLÓGIA ALAPJAI A tananyag felépítése: Környezetmérnök és műszaki menedzser hallgatók számára Előadó: 2 + 0 + 0 óra, félévközi számonkérés 3 ZH: október 3, november 5, december 5 dr. Pécs Miklós egyetemi
I. VEKTOROK, MÁTRIXOK
217/18 1 félév I VEKTOROK, MÁTRIXOK I1 I2 Vektorok 1 A síkon derékszögű koordinátarendszerben minden v vektornak van vízszintes és van függőleges koordinátája, ezeket sorrendben v 1 és v 2 jelöli A v síkbeli
Problémás regressziók
Universitas Eotvos Nominata 74 203-4 - II Problémás regressziók A közönséges (OLS) és a súlyozott (WLS) legkisebb négyzetes lineáris regresszió egy p- változós lineáris egyenletrendszer megoldása. Az egyenletrendszer
6. AZ EREDMÉNYEK ÉRTELMEZÉSE
6. AZ EREDMÉNYEK ÉRTELMEZÉSE A kurzus anyagát felhasználva összeállíthatunk egy kitűnő feladatlapot, de még nem dőlhetünk nyugodtan hátra. Diákjaink teljesítményét még osztályzatokra kell átváltanunk,
Mikroszkóp vizsgálata Folyadék törésmutatójának mérése
KLASSZIKUS FIZIKA LABORATÓRIUM 8. MÉRÉS Mikroszkóp vizsgálata Folyadék törésmutatójának mérése Mérést végezte: Enyingi Vera Atala ENVSAAT.ELTE Mérés időpontja: 2011. október 12. Szerda délelőtti csoport
OZMÓZIS. BIOFIZIKA I Október 25. Bugyi Beáta PTE ÁOK Biofizikai Intézet
BIOFIZIKA I 2011. Október 25. Bugyi Beáta PTE ÁOK Biofizikai Intézet Áttekintés 1. Diffúzió rövid ismétlés 2. Az ozmózis jelensége és leírása 4. A diffúzió és ozmózis orvos biológiai jelentősége Diffúzió
A genetikai lelet értelmezése monogénes betegségekben
A genetikai lelet értelmezése monogénes betegségekben Tory Kálmán Semmelweis Egyetem, I. sz. Gyermekklinika A ~20 ezer fehérje-kódoló gén a 23 pár kromoszómán A kromoszómán található bázisok száma: 250M
Területi statisztikai elemzések
Területi statisztikai elemzések KOTOSZ Balázs, SZTE, kotosz@eco.u-szeged.hu Módszertani dilemmák a statisztikában 2016. november 18. Budapest Apropó Miért különleges a területi adatok elemzése? A számításokhoz
BÍRÁLAT. Kállay Mihály Automatizált módszerek a kvantumkémiában című MTA doktori értekezéséről.
BÍRÁLAT Kállay Mihály Automatizált módszerek a kvantumkémiában című MTA doktori értekezéséről. Kállay Mihály Automatizált módszerek a kvantumkémiában című az MTA doktora cím elnyerésére benyújtott 132
Mérési adatok illesztése, korreláció, regresszió
Mérési adatok illesztése, korreláció, regresszió Korreláció, regresszió Két változó mennyiség közötti kapcsolatot vizsgálunk. Kérdés: van-e kapcsolat két, ugyanabban az egyénben, állatban, kísérleti mintában,
Gyógyszerrezisztenciát okozó fehérjék vizsgálata
Gyógyszerrezisztenciát okozó fehérjék vizsgálata AKI kíváncsi kémikus kutatótábor 2017.06.25-07.01. Témavezetők : Telbisz Ágnes, Horváth Tamás Kutatók : Dobolyi Zsófia, Bereczki Kristóf, Horváth Ákos Gyógyszerrezisztencia
Méréselmélet MI BSc 1
Mérés és s modellezés 2008.02.15. 1 Méréselmélet - bevezetés a mérnöki problémamegoldás menete 1. A probléma kitűzése 2. A hipotézis felállítása 3. Kísérlettervezés 4. Megfigyelések elvégzése 5. Adatok
Mérési struktúrák
Mérési struktúrák 2007.02.19. 1 Mérési struktúrák A mérés művelete: a mérendő jellemző és a szimbólum halmaz közötti leképezés megvalósítása jel- és rendszerelméleti aspektus mérési folyamat: a leképezést
Víz. Az élő anyag szerkezeti egységei. A vízmolekula szerkezete. Olyan mindennapi, hogy fel sem tűnik, milyen különleges
Az élő anyag szerkezeti egységei víz nukleinsavak fehérjék membránok Olyan mindennapi, hogy fel sem tűnik, milyen különleges A Föld felszínének 2/3-át borítja Előfordulása az emberi szövetek felépítésében
STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Matematikai statisztika. Mi a modell? Binomiális eloszlás sűrűségfüggvény. Binomiális eloszlás
ELŐADÁS ÁTTEKINTÉSE STATISZTIKA 9. Előadás Binomiális eloszlás Egyenletes eloszlás Háromszög eloszlás Normális eloszlás Standard normális eloszlás Normális eloszlás mint modell 2/62 Matematikai statisztika