HIV proteáz inhibitor bioaktív konformációjának számítása

Hasonló dokumentumok
Konformációs flexibilitás és 3D QSAR

[S] v' [I] [1] Kompetitív gátlás

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Biometria az orvosi gyakorlatban. Korrelációszámítás, regresszió

Biomatematika 12. Szent István Egyetem Állatorvos-tudományi Kar. Fodor János

8. A fehérjék térszerkezetének jóslása

ELTE TáTK Közgazdaságtudományi Tanszék GAZDASÁGSTATISZTIKA. Készítette: Bíró Anikó. Szakmai felelős: Bíró Anikó június

Matematikai geodéziai számítások 6.

Mérési adatok illesztése, korreláció, regresszió

Fehérjeszerkezet analízis. Fehérjeszerkezet analízis. Fehérjeszerkezet analízis. Fehérjeszerkezet analízis. Fehérjeszerkezet analízis

A fehérjék térszerkezetének jóslása

Hogyan lesznek új gyógyszereink? Bevezetés a gyógyszerkutatásba

Matematikai geodéziai számítások 6.

Al-Mg-Si háromalkotós egyensúlyi fázisdiagram közelítő számítása

A PET szerepe a gyógyszerfejlesztésben. Berecz Roland DE KK Pszichiátriai Tanszék

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

ALKÍMIA MA Az anyagról mai szemmel, a régiek megszállottságával.

A fehérjék térszerkezetének jóslása (Szilágyi András, MTA Enzimológiai Intézete)

ALKÍMIA MA Az anyagról mai szemmel, a régiek megszállottságával.

A racionális gyógyszertervezés lehetőségei. A racionális gyógyszertervezés lehetőségei. A racionális gyógyszertervezés lehetőségei

Mérési hibák

Módszertani Intézeti Tanszéki Osztály. A megoldás részletes mellékszámítások hiányában nem értékelhető!

Elektrosztatikus számítások. Elektrosztatikus számítások. Elektrosztatikus számítások. Elektrosztatikus számítások Definíciók

Szimuláció RICHARD M. KARP és AVI WIGDERSON. (Készítette: Domoszlai László)

Regressziós vizsgálatok

Kémiai reakciók mechanizmusa számítógépes szimulációval

Dodé Réka (ELTE BTK Nyelvtudomány Doktori IskolaAlkalmazott Alknyelvdok 2017 nyelvészet program) február 3. 1 / 17

5. Az adszorpciós folyamat mennyiségi leírása a Langmuir-izoterma segítségével

4/24/12. Regresszióanalízis. Legkisebb négyzetek elve. Regresszióanalízis

Molekuláris dinamika I. 10. előadás

STATISZTIKA ELŐADÁS ÁTTEKINTÉSE. Matematikai statisztika. Mi a modell? Binomiális eloszlás sűrűségfüggvény. Binomiális eloszlás

Diverzifikáció Markowitz-modell MAD modell CAPM modell 2017/ Szegedi Tudományegyetem Informatikai Intézet

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

Az anyagi rendszer fogalma, csoportosítása

Matematikai geodéziai számítások 10.

HIDROFIL HÉJ KIALAKÍTÁSA

A regisztrált álláskeresők számára vonatkozó becslések előrejelző képességének vizsgálata

Khi-négyzet eloszlás. Statisztika II., 3. alkalom

Ütközések vizsgálatához alkalmazható számítási eljárások

Bevezetés a Korreláció &

Összefoglalók Kémia BSc 2012/2013 I. félév

STATISZTIKA. A maradék független a kezelés és blokk hatástól. Maradékok leíró statisztikája. 4. A modell érvényességének ellenőrzése

y ij = µ + α i + e ij

Biomatematika 2 Orvosi biometria

I. BESZÁLLÍTÓI TELJESÍTMÉNYEK ÉRTÉKELÉSE

Folyadékszcintillációs spektroszkópia jegyz könyv

Magspektroszkópiai gyakorlatok

TDK lehetőségek az MTA TTK Enzimológiai Intézetben

? ligandum kötés konformációs változás aktiválási energia számítás pka számítás kötési energiák

Lineáris regresszió vizsgálata resampling eljárással

Bioinformatika 2 6. előadás

Kutatási beszámoló február. Tangens delta mérésére alkalmas mérési összeállítás elkészítése

ALKÍMIA MA Az anyagról mai szemmel, a régiek megszállottságával.

Kémiai kötés. Általános Kémia, szerkezet Slide 1 /39

Kémiai kötés. Általános Kémia, szerkezet Slide 1 /39

Fázisátalakulások vizsgálata

A matematikai feladatok és megoldások konvenciói

Korreláció és lineáris regresszió

[Biomatematika 2] Orvosi biometria

Modern Fizika Labor Fizika BSC

[Biomatematika 2] Orvosi biometria

A mérések általános és alapvető metrológiai fogalmai és definíciói. Mérések, mérési eredmények, mérési bizonytalanság. mérés. mérési elv

Statisztikai következtetések Nemlineáris regresszió Feladatok Vége

Függvények Megoldások

A HŐMÉRSÉKLET ÉS A CSAPADÉK HATÁSA A BÜKK NÖVEKEDÉSÉRE

Compton-effektus. Zsigmond Anna. jegyzıkönyv. Fizika BSc III.

FEGYVERNEKI SÁNDOR, Valószínűség-sZÁMÍTÁs És MATEMATIKAI

A kovalens kötés elmélete. Kovalens kötésű molekulák geometriája. Molekula geometria. Vegyértékelektronpár taszítási elmélet (VSEPR)

Regresszió. Csorba János. Nagyméretű adathalmazok kezelése március 31.

TRIPSZIN TISZTÍTÁSA AFFINITÁS KROMATOGRÁFIA SEGÍTSÉGÉVEL

Biofizika szeminárium. Diffúzió, ozmózis

MATEMATIKA ÉRETTSÉGI május 8. EMELT SZINT

MATEMATIKA HETI 5 ÓRA. IDŐPONT: Június 4.

2. Hangfrekvenciás mechanikai rezgések vizsgálata jegyzőkönyv. Zsigmond Anna Fizika Bsc II. Mérés dátuma: Leadás dátuma:

A kovalens kötés polaritása

Modern Fizika Labor. 11. Spektroszkópia. Fizika BSc. A mérés dátuma: dec. 16. A mérés száma és címe: Értékelés: A beadás dátuma: dec. 21.

NULLADIK MATEMATIKA ZÁRTHELYI

Molekuláris dinamika. 10. előadás

Felhő használata mindennapi alkalmazások futtatására. Németh Zsolt MTA SZTAKI

Modern Fizika Labor. 2. Az elemi töltés meghatározása. Fizika BSc. A mérés dátuma: nov. 29. A mérés száma és címe: Értékelés:

Peltier-elemek vizsgálata

Statisztika I. 12. előadás. Előadó: Dr. Ertsey Imre

Cölöp függőleges teherbírásának és süllyedésének CPT alapú számítása

KÖSZÖNTJÜK HALLGATÓINKAT!

A leíró statisztikák

y ij = µ + α i + e ij STATISZTIKA Sir Ronald Aylmer Fisher Példa Elmélet A variancia-analízis alkalmazásának feltételei Lineáris modell

Kémiai reakciók sebessége

MATEMATIKA ÉRETTSÉGI május 10. KÖZÉP SZINT I.

Statisztika I. 11. előadás. Előadó: Dr. Ertsey Imre

A kísérlet, mérés megnevezése célkitűzései: Váltakozó áramú körök vizsgálata, induktív ellenállás mérése, induktivitás értelmezése.

Modern Fizika Labor. Fizika BSc. Értékelés: A mérés dátuma: A mérés száma és címe: 13. mérés: Molekulamodellezés PC-n április 29.

Kémiai kötés Lewis elmélet

Matematikai alapok és valószínőségszámítás. Középértékek és szóródási mutatók

Modern Fizika Labor. 2. Elemi töltés meghatározása

Kettőnél több csoport vizsgálata. Makara B. Gábor

Korreláció számítás az SPSSben

Sztöchiometriai egyenletrendszerek minimális számú aktív változót tartalmazó megoldásainak meghatározása a P-gráf módszertan alkalmazásával

Adatgyőjtés, mérési alapok, a környezetgazdálkodás fontosabb mőszerei

Matematikai alapok és valószínőségszámítás. Statisztikai becslés Statisztikák eloszlása

Gyalogos elütések szimulációs vizsgálata

Átírás:

Tudományos Diákköri Dolgozat ANTAL LÁSZLÓ HIV proteáz inhibitor bioaktív konformációjának számítása Témavezetők: Dr. Farkas Ödön, Dr. Kalászi Adrián Eötvös Loránd Tudományegyetem Természettudományi Kar Budapest, 2008 1

Köszönetnyilvánítás Köszönettel tartozom témavezetőimnek, Dr. Farkas Ödönnek és Dr. Kalászi Adriánnak munkám elvégzéséhez nyújtott támogatásukért. Köszönöm továbbá a kutatási lehetőséget az ELTE TTK Kémiai Intézet Szerves Kémia Tanszékének. 2

Tartalomjegyzék Köszönetnyilvánítás...2 Bevezetés...4 3D Farmakofor és bioaktív konformáció...4 Irodalmi áttekintés...6 QSAR (Quantitative/Qualitative Structure-Activity Relationship)...6 IQSAR (Inverz QSAR)...7 Modell validálás...8 HIV proteáz inhibitorok... 10 Célkitűzések... 12 Eredmények, értékelés... 13 Molekulatár keresése... 13 Konformerkeresés... 15 Konformációs eloszlás feltérképezése... 18 Befagyasztás... 18 Kis lépések... 18 Teljes trajektória... 18 Konformerkeresés értékelése... 19 Az elméleti összefüggés kísérleti vizsgálata... 20 Bioaktív konformációk keresése... 21 Összefoglalás... 23 Terveink... 23 Irodalomjegyzék... 24 3

Bevezetés A gyógyszerkutatás területén az utóbbi években egyre nagyobb jelentősége van a számítógépek által szolgáltatott eredményeknek. Ugyanis az új gyógyszerek kifejlesztésének teljes költsége meghaladja a 800 millió USD-t 1, amely tartalmazza a kutatási folyamat valamely szakaszában sikertelennek minősített gyógyszerjelölt molekulák kiadásait is. A költségek csökkentése érdekében a gyógyszergyárak a fejlesztés lehető legkorábbi szakaszában ki akarják szűrni a nem megfelelő vegyületeket. Jelentős idő- és költségcsökkentés érhető el, ha a kémiai szintézisek előtt virtuális szűrővizsgálatokkal (virtual screening, VS 2 ) kiválaszthatók a leghatékonyabb gyógyszermolekulák. A gyógyszerkutatás kezdeti lépésében vezérmolekulákat keresnek, amelyektől elvárják, hogy speciális tulajdonságokkal rendelkezzenek (szükséges biológiai aktivitás, nem lehet toxikus, nem lehet túl lipofil vagy poláros, ). A második lépés, a vezérmolekulák optimálása, új hatóanyag jelölt vegyülethez vezethet el. Ha a hatóanyag jelölt molekula minden támasztott követelménynek megfelel, akkor klinikai vizsgálatok során további ellenőrzéseket végeznek el. A virtuális szűrővizsgálatokat a már említett első két lépésben használják. A VS olyan számítási eljárások gyűjtőneve, amelyek egy nagy molekulakönyvtár méreteit csökkentik, és egy speciálisabb tulajdonságokkal rendelkező könyvtárat hoznak létre. Az egyik gyakran használt módszer a szerkezet-hatás összefüggésen alapuló QSAR (Quantitative/Qualitative Structure-Activity Relationship). 3D Farmakofor 3 és bioaktív konformáció A 3D molekuláris hasonlóság alapú módszerek és a 3D QSAR eljárások esetében kulcsfontosságú egy ún. 3D farmakofor ismerete. A farmakofor (pharmacophore) kifejezést Ehrlich vezette be az 1900-as évek elején 4. Napjainkban farmakofornak nevezik olyan sztérikus és elektronikus tulajdonságok összességét, amelyek szükségesek ahhoz, hogy teljesüljenek a biológiai célszerkezettel való optimális kölcsönhatás és a megfelelő válasz kiváltásának, ill. blokkolásának feltételei. A modell szerint szerkezetileg különböző molekulák közös farmakoforja azonos módon lép a kötőhellyel kölcsönhatásba. Az egyes molekulák bioaktív konformációja az a konformáció, amely a kötődés során megvalósul, és magában foglalja a farmakofort. A farmakoforokat használhatják VS-re úgy, hogy ujjlenyomatokat 4

készítenek belőlük, és ezt hasonlítják össze a könyvtár molekuláinak ujjlenyomataival, vagy az adatbázis szűrését közvetlen molekuláris összeforgatás alapján végzik. Munkám során egy új módszer (Inverz QSAR, IQSAR 5,6 ) tesztelését végeztem el, amely egy speciális tulajdonságokkal rendelkező molekulatár felhasználásával meghatározza a 3D farmakofort. A legtöbb 3D QSAR módszer megkívánja a bioaktív konformáció, vagy a 3D farmakofor előzetes ismeretét azért, hogy a molekulákat ezek alapján összeforgatva a szerkezet-hatás összefüggés számítása elvégezhető legyen. A tesztelt eljárásnál csak a 3D farmakofort alkotó atomokat kell előre definiálni. Eredményül pedig több 3D farmakofor hipotézist szolgáltat. 1. ábra A kísérletileg meghatározott bioaktív konformációból felépített farmakofor modell (LigandScout v2.02) sárga: polarizálható elektronok; piros, zöld nyilak: H-kötés donor, akceptor (HIV proteáz fehérjéhez kötött inhibitor molekula, PDB: 1B6M) 5

2. ábra 3D farmakofor Irodalmi áttekintés QSAR (Quantitative/Qualitative Structure-Activity Relationship) A módszer szerves vegyületek, gyógyszermolekulák kémiai szerkezete és biológiai, toxikológiai vagy farmakológiai hatásai közötti kvantitatív összefüggéseket vizsgál, és lehetővé teszi egy szerkezetileg rokon molekula hatékonyságának matematikai és statisztikai módszerekkel való előrejelzését. A QSAR módszerekkel kvalitatív összefüggéseket is fel lehet állítani a szerkezet és a hatás között. Hogyan működnek a QSAR módszerek? Adott egy molekulatár, amelyben minden molekulának ismerjük a kísérletileg meghatározott kötődési aktivitását. Kiválasztunk különböző tulajdonságokat, ún. deszkriptorokat, amelyekkel megpróbáljuk leírni a molekulát. Általában a deszkriptorok könnyen és gyorsan 6

számolhatóak a molekulák szerkezetéből. A QSAR eljárások összefüggést keresnek a deszkriptorok és az aktivitások között, vagyis a szerkezet és a molekula által kiváltott hatás között. 1988-ban Cramer és munkatársai közöltek egy 3D QSAR 7 módszert bemutató cikket, amelyben a deszkriptorok függnek a molekulák térszerkezetétől. A különböző molekulákra összeforgatás után egy illesztett rács pontjaiban kiszámolnak bizonyos tulajdonságokat (elektrosztatikus, hidrogénkötés donor/akceptor stb.). Majd az így kapott deszkriptorok és tulajdonságok között többdimenziós korrelációt végeznek (PLS, MLR). A gyógyszerkutatásban a költségek csökkentése érdekében használják a 3D QSAR módszereket, amennyiben ismert a 3D farmakofor, azaz a tulajdonságok összessége, amelyek szükségesek a megfelelő kölcsönhatás kiváltásához. IQSAR (Inverz QSAR) 5,6 Az IQSAR lényege, hogy a gyógyszerkutatás kezdeti szakaszába egy átmeneti lépést iktat. A módszer a kísérleti eredmények alapján előzetes térszerkezeti információ nélkül, számítási úton 3D farmakofor hipotéziseket szolgáltat. Tehát e módszer nem egy gyógyszerjelölt molekulát keres, azt a 3D farmakofor ismeretében a hagyományos QSAR módszerekkel határozhatjuk meg. Az IQSAR eljárás egy speciális, flexibilis molekulatárból dolgozik, amelytől nem várjuk el, hogy hatékony gyógyszermolekulákat tartalmazzon. Az eredményessége nagyban függ attól, hogy a kiválasztott molekulák megfelelő tulajdonságokkal bírjanak. A flexibilis molekulák elsősorban könnyen változtatható konformációjuk miatt fontosak, másodsorban elvárás a módszer során, hogy a kísérletileg meghatározott kötődési aktivitások különbségei lehetőleg a konformációs eloszlástól függjenek. Előny továbbá, hogy könnyebben mutathatnak mérhető aktivitást biológiai tesztekben. Tapasztalatok szerint a peptid alapú molekulák jól használhatók erre a célra. Az IQSAR eljárás két szakaszból áll. Az első szakaszban a bevitt molekulák konformációs terének bejárása a cél, tulajdonképpen a lehető legtöbb konformert találja meg, amelyeknek egymástól vett minimális távolságuk (tulajdonképpen rmsd számolás, rmsd: root mean square deviation, eltérés négyzetek átlagának gyöke) nagyobb egy előre beállított küszöbértéknél. A bevitt molekulákból egy nagy energiájú (600 K) molekuladinamikai (MD) szimuláció segítségével a módszer kiindulási konformereket generál (oldószermodell nélkül). 7

Az így kapott konformerek mindegyikéből egy újabb MD szimulációt indít, azonban most már oldószermodellel és alacsonyabb hőmérsékleten (300 K). A számolt trajektóriák modellezik a szabad - a fehérjéhez nem kötött - molekulák által felvett konformációkat az oldószerben, vagyis a konformációs teret, amit bejárnak. A második szakaszban a bioaktív-konformáció kereső eljárás az egyes molekulák konformációs terében keresi meg azt a térfogatot, amelyhez a rendelt konformációs sűrűségértékek a molekulák kötődési aktivitásával arányosak. Ugyanis levezethető 5,6 hogy a molekula bioaktív konformációjának felvételének valószínűsége és a kötődési aktivitás nagysága között egy lineáris összefüggés van. Modell validálás 8,9,10 A QSAR módszerek által felállított szerkezet-hatás összefüggés három tényezőn alapszik: az adatelőkészítésen, a modellépítésen és a modellvalidáláson. Az QSAR modellek ellenőrzését leggyakrabban a determinációs együtthatóval és a keresztellenőrzés (cross validation) segítségével végzik (r 2, q 2 ). Ha adott két n darab változóból álló mérési sorozat (x 1 x n, y 1 y n ), az (1)-es kifejezést nevezzük a Pearson-féle korrelációs együtthatónak. (a felülvonás a sorozat átlagát jelenti). r xi x yi y 2 x x y y i i 2 (1) A korrelációs együttható a változók lineáris összefüggésének a mértéke, illesszünk egyenest a pontokra a legkisebb négyzetek módszerével. Legyen ez az egyváltozós regressziós egyenes a modell. Jelölje x i a független, y i a függő változót és az y i az y i becslését. Ekkor a Pearsonféle korrelációs együttható négyzete (5) szerint felírható. r 1 y i y i y y 2 2 ˆ i 2 (2) 8

Ha a lineáristól eltérő más modellfüggvényt alkalmazunk az r 2 -et determinációs együtthatónak (coefficient of determination ) nevezzük. Az r 2 -et gyakran alkalmazzák a kísérletileg meghatározott és a QSAR modell által becsült aktivitások összehasonlítására, Érdemes megjegyezni, hogy ha az összes adatpontot felhasználjuk a modell építésekor, és a modellünk az y=a+bx egyenes, az r 2 0. Ha azonban bizonyos számú pontot kihagyunk, az r 2 negatív értéket is felvehet. QSAR modellek jóságának becslését gyakran végzik az r 2 segítségével és a keresztellenőrzéssel előállított r 2 (q 2 )-el. A keresztellenőrzést (cross validation) sok esetben használják a regressziós modell minőségének belső ellenőrzésére. Ez a technika általánosságban úgy működik, hogy a modell elkészítésekor bizonyos számú, ismert aktivitással rendelkező molekulát kihagynak a tanító halmazból, és az így kihagyott értékeket a modellből becsülik. Ezt az eljárást sokszor megismételve, statisztika készíthető a becsült és a mért értékek összehasonlításával. Ilyen módon, az ismételt felosztásokkal megbecsülhető a teljes tanító halmazra elkészített modell belső predikitvitása. A k-szoros keresztellenőrzés esetén a mintát k darab nagyjából egyenlő nagyságú alhalmazra osztják. Ezután k-szor felépítik a modellt, kihagyva mindig egy alhalmazt, majd a kihagyott elemekre kiszámítják a kívánt hibakritériumot. Így minta elemszáma. n n / k lehetőség állhat elő, ahol n a Ha k=n, akkor egy érték kihagyásával történő keresztellenőrzésről beszélünk (leave one out crossvalidation, LOO). Ebben az eljárásban tehát minden értéket egyszer hagynak ki, és a modellt a maradék alapján építik fel. A q 2 definiáló képlete (3) analóg az r 2 -re kapott kifejezéssel. A ˆ az i-edik molekulára, az y CV, i azt nem tartalmazó modellből becsült aktivitásérték. yi y 2 yˆ CV, i yi i 1 (3) 2 q 2 i 9

Míg az r 2 az illeszkedés jóságát, a q 2 éréke a belső predikció jóságát jellemzi. Mivel az IQSAR eljárás tesztelése volt a cél, olyan molekulatárakat kerestünk, amelyek teljesítik a módszer által támasztott elvárásokat: 1. Flexibilis molekulákat tartalmazzon, nagy legyen a konformációs szabadsága. 2. Az elmélet által megkívánt kötődési szabadentalpiaváltozás teljesítése. 3. A kötődési aktivitás (K i, vagy IC 50 ) ismert legyen. 4. A teszteléshez kell a kísérletileg ismert bioaktív konformáció. A 3. pontban szereplő kísérletileg meghatározott aktivitásértékeket a ligand molekulának a fehérjéhez való kötődésének leírására használják. Az IC 50, azt az inhibitor koncentrációt jelöli, amely a reakcióban levő ligand koncentrációját a felére csökkenti. Használják az aktivitás mérésére a K i értéket is, a receptor és az inhibitor közötti reakció egyensúlyi állandóját. (Ugyanakkor a ligand és a receptor között is reakció játszódik le, melynek egyensúlyi állandójának jelölése K d.) A fenti négy szempontnak több esetben is a HIV proteáz inhibitorok 11-15 feleltek meg, így a teszthalmaz kijelölésénél 13 őket választottuk. HIV proteáz inhibitorok 11-15 1996 óta használják a HIV elleni kezelésben a HIV proteáz inhibitorokat. Ez a vegyületcsoport jelentősen megváltoztatta a HIV fertőzöttek kezelési lehetőségeit. A HIV proteáz a keletkező HIV virion (teljes vírus részecske a sejten kívül, amely tartalmazza a DNSt vagy RNSt a protein burkon belül) gag-pol poliproteinjét hasítja, mely után a virion fertőzőképessé válik. A peptid, illetve a peptidekhez hasonló vegyületek a proteáz enzim működését gátolják, annak aktív helyéhez kötődve. Így a keletkezett HIV virionok nem tudnak újabb sejteket megfertőzni. A proteáz inhibitorok megjelenése az egyik legjobb példa a tudományos alapkutatás alkalmazására a racionális gyógyszertervezésben. A HIV felfedezése után a tudósok meghatároztak a vírusban levő genetikai információt. A virion genomjának pol régiójában 10

találhatóak a HIV proteáz, a reverz transzkriptáz és az integráz kodonjai, melyek lényeges információkat tartalmaznak a vírus kifejlődéséhez. Bár a genetikai kódja a HIV proteáz enzimnek viszonylag gyorsan ismertté vált, azonban a 3D szerkezetet a kristályosítás nehézsége miatt jóval később sikerült meghatározni. Elkezdődhetett olyan vegyületek tervezése, amely a HIV proteáz aktív helyére kötődve, megakadályozza annak működését. 3. ábra HIV ptoteáz inhibitor kötődési helye A felső képen a szabad állapotban levő fehérje látható, az alsón a sárgával színezett molekula a ligand 11

A proteázok a fehérjéket specifikus helyen hasító enzimek. A HIV proteáz csak a HIV fehérjéket hasítja és reakcióképességük teljesen más, mint a normál emberi proteázok reakcióképessége. Emiatt használhatóak biztonságosan a HIV proteáz inhibitorok a fertőzés kezelésére. A HIV proteáz a vírus egy fehérjeláncát (poliprotein) hasítja, alapvető fehérjéket létrehozva a virion kifejlődésének szakaszában. Ha a poliprotein nincs hasítva, a vírus nem lesz képes megfertőzni további egészséges sejteket. Ahogy a nevük is mutatja, a HIV proteáz inhibitorok megakadályozzák a HIV proteáz enzim működését. Ezt a hatást az enzim kikapcsolásával érik el, mielőtt még a gag/pol poliproteint hasítani tudná. Az inhibitor molekula pontosan az enzim aktív helyéhez köt, így egyszerűen zárolja azt. Így egy előre megtervezett molekula nagy hatásfokkal és rendkívül specifikusan akadályozhatja meg a HIV proteáz működését. Célkitűzések Hosszútávú célunk, hogy a kutatócsoportunkban kifejlesztett 3D farmakofor hipotézis építő eljárás (IQSAR) számítási úton kapott eredményeit ellenőrizzük a kísérletileg meghatározott értékekkel. Az eredmények alatt esetünkben a ligandnak a fehérje aktív helyén, a kötődéskor kialakuló konformációját értjük, amelyre a módszer több közelítő megoldást szolgáltathat. A számítás során a fehérje térszerkezetét és a valós, bioaktív konformációt ismeretlennek tételezzük fel, majd összehasonlítjuk a számítás során kapott konformációkkal. A dolgozatban összefoglalt munkám során a célom az volt, hogy a módszer alapjául szolgáló, a kutatócsoportunkban levezetett elméleti összefüggést a gyakorlatban is reprodukáljam. Az összefüggés lényege, hogy a lineáris összefüggés áll fenn a kötődési erősség (1/IC50, vagy 1/Ki) és a kötődő konformációnak megtalálási valószínűsége között. E megtalálási valószínűség szabad állapotban értendő. Az összefüggés csak bizonyos feltételek mellett teljesül. Ezért az alábbi célokat tűztük ki: Olyan molekulatár keresése a szakirodalomban, amelyre a kívánt feltételek várhatóan teljesülnek. 12

A választott tár molekuláinak jellemezni konformációs viselkedésük szempontjából, szabad (nem fehérjéhez kötött) állapotban (molekuladinamikai trajektóriákkal). Megvizsgálni, hogy az esetünkben ismert (természetesen a módszer szempontjából később majd ismeretlennek feltételezett) kötődő konformáció milyen valószínűséggel van jelen az egyes molekulák számított trajektóriáiban. Eredmények, értékelés Molekulatár keresése Első lépésben, a szakirodalomban olyan kísérleti eredményeket kerestem, amelyekben a molekulák teljesítik az IQSAR-hoz szükséges elengedhetetlen feltételeket, (pl. elegendően nagy konformációs flexibilitás, megfelelő kötődési aktivitások, a ligandumok ugyanazokkal az atomokkal kötődjenek a kötőhelyhez) és amely molekulákra a kötődő konformációt is meghatározták (ligand-fehérje komplex röntgenszerkezete). A legtöbb átolvasott cikk azonban nem felelt meg a fenti elvárásoknak. A legígéretesebb molekulatárak az integrinek 16,17 (RGD peptidek) és a HIV proteáz inhibitorok voltak. Választásunk a HIV proteáz inhibitorokra esett, mivel ezeket a molekulákat eléggé flexibilisnek találtuk és az aktivitásértékek is megfelelően különbözőek voltak. A kiválasztott cikk 21 molekulát tartalmaz NMR-adatokkal és K i, illetve IC 50 aktivitásértékekkel. Más publikációkból 11,12 ismerjük a HIV proteáz inhibitorok kötődéséhez szükséges térszerkezeti információkat is. 13

4. ábra A kiválasztott molekulák szerkezete és kötődési aktivitása (1) Az IQSAR eljáráshoz ideális esetben olyan molekulatárat kell használnunk, ahol a kötődési aktivitás értékek különbsége csak az egyes molekulák konformációs eloszlásának különbségével magyarázható. A módszert olyan molekulatáron szeretnénk tesztelni, amely ezt az ideális esetet minél inkább megközelíti. Ezért a molekulákat a védőcsoportok különbözősége alapján két csoportra osztottuk. A Z-Val (benziloxi-karbonil-val) csoporttal rendelkező molekuláknál az aktivitás értékek csak nagyon kis mértékben különböztek, ezért ezeket a molekulákat nem használtuk, így a Boc (t-butiloxi-karbonil) csoportot tartalmazó molekulákat vizsgáltuk. Ezzel jelentős mértékben csökkent a halmazunk, ami a statisztikai módszereket figyelembe véve rossz hatással lehet az eredményekre, viszont a későbbiekben a kihagyott molekulákat bevenni a rendszerbe és együtt futtatni az algoritmusokat már nem jelent sokkal nagyobb feladatot. 5. ábra A kiválasztott molekulák szerkezete és kötődési aktivitása (2) 14

Konformerkeresés Az IQSAR eljárás első lépése, hogy minden egyes molekulára egy adott küszöbértéknél nagyobb konformációs távolságra levő konformereket állít elő. A konformerkereső algoritmus nagy energiájú molekuladinamikai szimulációval kapott trajektóriákból gyűjt konformációkat, majd geometriai optimalizálás után, ha a kapott konformer megfelelő, elraktározza. Az algoritmust implementációja JAVA nyelven készült el, amelyben az MD szimulációkat a Gromacs nevű programcsomagban levő GROMOS (G43b1) erőtér végzi. Mivel ezt az erőteret fehérjékre és biomolekulákra optimalizálták, a molekulákat aminosavakból és más kisebb részekből (pl. acetát) építi fel. Ezen molekula egységek paramétereit (kötéstávolságok, kötésszögek, diéderes szögek) a topológiafájlokban tárolják. A Gromacs a molekula adatait tartalmazó PDB fájlból, felhasználva az általa ismert aminosavak tulajdonságait, elkészíti a teljes molekula paraméterezését. A fenti molekulákhoz azonban ez a módszer nem talál hozzárendelhető, felparaméterezett kisebb egységeket, mert nem tartalmaznak aminosavakat (kivéve a valint). A problémát a topológia megváltoztatásával lehet megoldani, azaz a hiányzó, általunk definiált egységeket és paramétereit hozzá kell adni a fájlhoz. (Megj.: A tervek között szerepel egy automatizálási lehetőség megvalósítása, amely bármely molekulára elkészíti a megfelelő topológiai fájlt. Így téve gyorsabbá az egész eljárást.) Ha egy meglévő csoporthoz nagyon hasonló egység van a molekulában, mint például a fenil-alanin a kiválasztott molekulákban, akkor a további paraméterek hozzáadása csak kisebb nehézséget jelent. A megfelelő paraméterek megtalálása viszont nem mindig triviális. Ugyanis a Boc csoportban található oxigénatomhoz (C-O*-C=O) hasonló nem található az eredeti fájlokban, így a parciális töltések megadásakor figyelembe vettünk olyan lehetőségeket, mint a tirozin és szerin OH-csoportja közötti különbség az erőtér paramétereiben vagy az éterkötést tartalmazó fragmentumok atomjainak töltése. A topológiafájlok átalakításával azonban nem lehetett megoldani, hogy az erőtér alkalmazható legyen a gyűrűs szerkezetek optimalizálására, mivel a Gromacs nem tudja megfelelően kezelni a gyűrűket, ugyanis, mint az előbbi bekezdésben említettük, fehérjékre optimalizálták az erőteret. A gyűrűzáró kötést és az azt körülvevő kötésszögeket, diéderes szögeket a Gromacs által elkészített teljesen felparaméterezett molekulákat tartalmazó fájlban kellett megváltoztatni. Ezzel az átalakítással az MD szimulációkat már el lehetett végezni a kiválasztott molekulákra is. A következő lépésben a szimuláció során 15

használt paraméterek változtatásával megnéztem, hogy a legkisebb gyűrűt tartalmazó molekulára (25) mennyi konformert talál az algoritmus. A különbözőnek talált konformerek távolságát a thr paraméter a kiválasztott atomok szerint összeforgatott molekulák megjelölt atomjai közötti rmsd érték változtatásával lehet szabályozni. thr (Å) T (K) kezd. lépésszám max lépésszám konformerek 1 1.0 800 10000 1000000 200+ 2 2.0 600 10000 1000000 200+ 3 3.0 600 100000 500000 51 4 2.0 400 10000 1000000 4 5 2.0 450 10000 1000000 160 6 2.5 600 100000 500000 33 1. táblázat A (25) molekulára talált konformerek száma A kapott adatokból a konformerkeresést a következő paraméterekkel végeztem: küszöbérték (thr): 2.5 kezdeti szimulációs idő: 100000 lépés maximális lépésszám: 500000 hőmérséklet: 600 K Molekula Konformerek száma 25 33 16 45 26 106 27 157 30 41 17 61 31 89 2. táblázat A végső paraméterekkel talált konformerek száma 16

6. ábra A 26. molekula talált konformereinek energiája 7. ábra A 26. molekula megtalált konformereinek száma az idő függvényében 17

Konformációs eloszlás feltérképezése Minden egyes megtalált konformerből indítottunk egy oldószeres MD szimulációt, a GROMOS (G53a6) erőtér segítségével. Majd a számított trajektóriákból a módszer meghatározza a kötődési konformációt. A molekulák felparaméterezése a topológia fájlok szerkesztésével valósult meg. Befagyasztás Az MD szimuláció első lépése előtt a molekula környezetét megtöltöttük vízmolekulákkal (SPC vízmodell), és rövid ideig nem engedélyeztük a molekulában levő atomok mozgását, így a molekula közvetlen környezetében is a vízmolekulák nagy része optimális elrendezést alakított ki. Amennyiben nem alkalmaztuk volna ezt a technikát, akkor nagy esély lett volna rá, hogy egyes atomokon akkora energia koncentrálódjon, amely elég ahhoz, hogy a rendszer instabillá váljon. A felhasznált paraméterek: lépésköz: 0.0002 fs; lépések száma: 2500 Kis lépések A szimuláció következő szakaszában ugyanazon paraméterek mellett a molekula atomjainak mozgását is engedélyeztük a vízmolekulákkal együtt. A kis lépésköznek köszönhetően a rendszer még jobban közeledett egy optimális szerkezethez. Teljes trajektória A fenti módszerekkel viszonylag jó szerkezeteket kaptunk, amelyekkel hosszabb szimulációt is végezhettünk. (Egy molekulánál sem fordult elő instabilitási probléma). A szimulációs idő hosszát leginkább a számítógép sebessége és a rendelkezésre álló idő határozta meg, egy nyolc processzorral rendelkező gépen megközelítőleg 10 nap alatt futott le a szimulációnak ez a része. A számolt trajektóriafájlokban csak a oldott molekula atomjainak koordinátáit mentettük el. (A keletkezett adatmennyiség így is 722 MB.) A számolt trajektóriákban található konformereket egy MySQL adatbázisban tároltuk el (kb. 1.300.000 db konformer). Paraméterek: lépésköz: 0.002 fs; lépések száma: 250000 18

8 ábra. Egy molekula a körülötte levő vízmolekulákkal Konformerkeresés értékelése A kiindulási konformereket kereső algoritmus jóságának ellenőrzésére több lehetőség is adott. Mivel bármelyik két konformer közötti rmsd érték nagyobb mint 2.5 Å, nyilvánvaló módon a merev molekuláknak kevesebb konformációs szabadságuk van, így kevesebb konformert is kell találnunk. A feltételezés helyességét mutatja 2. táblázat, ugyanis a legmerevebb molekuláknál (a makrociklus a legkisebb, 25. és 30. molekula) 33 illtetve 41 db. különböző konformer lett az eredménye a szimulációnak, míg a legnagyobb makrociklust tartalmazónak (27. molekula) 157 db. konformer. A 6. ábrán látható grafikon mutatja a konformerek energiáját, ami láthatóan több közel azonos csúcsot tartalmaz, ez bizonyíték arra, hogy a szimuláció során a molekula nem került egy mély potenciális energiaminimumba és nem emiatt állt le az algoritmus. A 7. ábrán levő grafikonon látható, hogy a szimulációs idő során egyre kevesebb konformert találunk, tehát jó eséllyel bejártuk a molekula konformációs terét. 19

Az elméleti összefüggés kísérleti vizsgálata Az elméleti úton már korábban levezetett lineáris összefüggést szerettem volna a gyakorlatban is reprodukálni. A számítási kísérlet eredményét a 9. ábra mutatja. Az x tengelyen az egyes ligand molekulákhoz tartozó kötődési aktivitást (1/Ki) ábrázoltam. Az y tengelyen pedig, hogy a molekulához tartozó, számítás során kapott MD trajektóriában mekkora valószínűséggel (P) találjuk a kísérletileg meghatározott kötődő konformációt. Ideális esetben, ha a kötődési aktivitás csak a ligand molekula konformációs viszonyaitól függne, és az alkalmazott számítási módszer tökéletesen feltérképezné a molekulák konformációs terét, lineáris, szigorúan monoton növő összefüggést kapnánk, (Pearson korreláció r=1, keresztvalidált q2=1) A számítás során mindig két különböző molekula konformációs térben vett távolságát vizsgáltam. Az egyik molekula mindig a kísérletileg meghatározott (PDB: 1B6M) röntgenszerkezetből kivágott ligand molekula volt, a megadott kötődő konformációban. A másik pedig a tár aktuális molekulájának trajektóriájából származó konformáció. A konformációs távolság számítása úgy történt, hogy a röntgen szerkezetből meghatározott 3D farmakofor alapján egymásnak ekvivalens atomokat definiáltam a két molekula között, majd a két szerkezetet egymásra forgattam (alignment). Ezután a két szerkezet távolságát az ekvivalens atomok közötti koordináta rmsd érték alapján határoztam meg. Ha ez az érték 2 Å-nél kisebbnek adódott, a két molekula adott konformációját azonosnak fogadtam el. Az összehasonlítás természetesen automatizálva történt. Az ábrázolt pontok q2 értéke negatív szám (-0.3), amely teljesen rossz eredményt jelent, viszont magyarázható a molekulák kis számával. A keresztellenőrzés során már csak 6 pontra illeszt egyenest az eljárás. A Pearson-féle korrelációs együttható értéke viszont r=0.4, ami elfogadhatónak mondható. Tulajdonképpen egy magasan kiugró érték van, amely a legmerevebb molekulához tartozik, ahol a legkevesebb kezdeti konformerből indultak a trajektóriák, így a legnagyobb valószínűséggel történhetett meg, hogy a konformerek kiugróan magas része került 2 Å-nél közelebb a kísérleti szerkezethez. Az ábra az egyes molekulák konformációs eloszlása és a biológiai aktivitás értékeik közötti összefüggést mutatja, amely az IQSAR módszer alapfeltevése. 20

9. ábra A kísérletileg meghatározott szerkezethez 2 Å Bioaktív konformációk keresése Az IQSAR eljárás végső lépésében a számolt trajektóriákból és a kísérletileg meghatározott komplex-ligand kötődési aktivitásokból meghatározza majd meg az elméletileg várható kötődési konformációt. A megírt programhoz tartozó grafikus környezet segítségével választhatók ki a statisztikailag jónak talált konformerek. A módszer futtatásához szükséges paraméterek beállítását jelenleg is végzem. Az IQSAR módszer próbafutásainak eredményéről tudok jelenleg, tájékoztató jelleggel beszámolni. Az algoritmus futása során több mint 50000 konformer korrelációját vizsgálta. De a statisztikailag is megfelelő, helyes korrelációt mutató bioaktív konformációk száma 100 alatt van. A legjobb r értékek 0.95 körül vannak, amely közelít a teljesen lineáris összefüggéshez. Viszont itt meg kell jegyezni, hogy a használt molekulatár mindössze hét elemű, így nem teljesen meglepő ez az eredmény. Mivel egy új eljárás tesztelése volt a cél, és a módszerhez 21

szükséges molekulákra nagyon speciális megkötések vannak, ezért a munka elején se vártuk, hogy sokkal nagyobb tárat találunk a tudományos cikkek között. Nyilvánvaló módon, ha nagyobb molekulatáron végezzük a tesztet a statisztikai mutatók is várhatóan rosszabbak lesznek. 22

Összefoglalás Az elmúlt évben végzett munkám során egy új QSAR eljárást teszteltem. Az IQSAR módszer egy köztes lépés lenne a gyógyszerkutatás folyamatában, amely segítené az új gyógyszerek fejlesztésének kezdeti lépéséhez szükséges 3D farmakofort. A teszt során kerestem a szakirodalomban az eljáráshoz megfelelő molekulakönyvtárat. (Flexibilis molekulák, kötődési aktivitásérték ismert, a kötödésben részt vevő atomok, minden molekulában megegyezőek). Mivel nagyon speciális tulajdonságokkal rendelkező molekulatárat igényel a rendszer, így csak kevés cikk felelt meg a követelményeknek és nagy részük 2-3 molekulát tartalmazott. Az IQSAR segítségével feltérképezte minden molekula konformációs terét, majd megvizsgáltam, hogy a kísérletileg meghatározott kötődő konformáció adhat-e jó korrelációt. A korrelációk jóságát statisztikai mutatókkal, a Pearson-féle korrelációs együtthatóval és a keresztellenőrzéssel ellenőriztem. A vizsgálatokból kiderült, hogy a keresztellenőrzés nem ad megbízható adatokat, a molekulák alacsony száma miatt. A Pearson-féle korrelációs együttható által szolgáltatott adatok alapján kiderült, hogy a módszer adhat jó eredményeket, viszont a merev szerkezetű molekuláknál, amelyek induló konformereinek száma alacsony, a várttól nagyon eltérő viselkedést mutathatnak. Terveink Távolabbi célok között szerepel egy hosszabb idejű MD szimulációval történő trajektória számolás, vagy akár egy teljesen más erőtérrel végzett számítás. Szeretnénk továbbá a kutatócsoportban elkészített 3D farmakofor-hipotézist előállító (IQSAR) programot tesztelni a HIV proteázokat tartalmazó molekulatáron és persze más molekulatárakon is. A tesztfutások eredményét minden esetben a számítás során kapott és a kísérletileg meghatározott kötődő konformációk összehasonlításával szeretnénk vizsgálni. Megoldásra vár még az egész folyamat automatizálása, amely azt jelentené, hogy a kezdeti molekulák és aktivitásértékek megadása után, az egész eljárás viszonylag kis beavatkozással adjon eredményt. 23

Irodalomjegyzék (1) Schachter, A. D.; Ramoni, M. F. From the analyst's couch - Clinical forecasting in drug development. Nature Reviews Drug Discovery 2007, 6, 107-108. (2) Mestres, J.; Knegtel, R. M. A. Similarity versus docking in 3D virtual screening. Perspectives in Drug Discovery and Design 2000, 20, 191-207. (3) Mason, J. S.; Good, A. C.; Martin, E. J. 3-D Pharmacophores in drug discovery. Current Pharmaceutical Design 2001, 7, 567-597. (4) Ehrlich, P. On the present state of chemotherapy. Berichte Der Deutschen Chemischen Gesellschaft 1909, 42, 17. (5) Kalászi A. Konformációs flexibiltás és 3D QSAR. ELTE Szerves Kémia Tanszék (doktori értekezés) 2007 (6) Manea, M.; Kalaszi, A.; Mezo, G.; Horvati, K.; Horvath, A.; Farkas, O.; Przybylski, M.; Hudecz, F. Antibody recognition and conformational flexibility of a plaque-specific - amyloid epitope modulated by non-native peptide flanking regions. Journal of Medical Chemistry 2007. (7) Cramer III, R.D., Patterson, D.E., Bunce, J.D.: Comparative molecular field analysis (CoMFA). 1. Effect of shape on binding of steroids to carrier proteins. Journal of the American Chemical Society 110 (18), pp. 5959-5967 (8) Wold, S.; Erikkson, L. Statistical validation of QSAR results. In Chemometrics Methods in Molecular Design; van de Waterbeemd, H. Ed.; VCH: Weinheim, 1995; pp 309-318. (9) Wold, S. Validation of Qsars. Quantitative Structure-Activity Relationships 1991, 10, 191-193. (10) Hulzebos, E.; Sijm, D.; Traas, T.; Posthumus, R.; Maslankiewicz, L. Validity and validation of expert (Q)SAR systems. Sar and Qsar in Environmental Research 2005, 16, 385-401. 24

(11) Lindberg, J., Pyring, D., Löwgren, S., Rosenquist, Å., Zuccarello, G., Kvarnström, I., Zhang, H., (...), Unge, T.: Symmetric fluoro-substituted diol-based HIV protease inhibitors: Ortho-fluorinated and meta-fluorinated P1/P1 -benzyloxy side groups significantly improve the antiviral activity and preserve binding efficacy. European Journal of Biochemistry 271 (22), pp. 4594-4602 (12) Andersson, H.O., Fridborg, K., Löwgren, S., Alterman, M., Mühlman, A., Björsne, M., Garg, N., (...), Unge, T.: Optimization of P1 P3 groups in symmetric and asymmetric HIV-1 protease inhibitors. European Journal of Biochemistry 270 (8), pp. 1746-1758 (13) Ettmayer, P., Billich, A., Hecht, P., Rosenwirth, B., Gstach, H.: Paracyclophanes: A Novel Class of Water-Soluble Inhibitors of HIV Proteinase. Journal of Medicinal Chemistry 39 (17), pp. 3291-3299 (14) Thaisrivongs, S., Skulnick, H.I., Turner, S.R., Strohbach, J.W., Tommasi, R.A., Johnson, P.D., Aristoff, P.A.: Structure-Based Design of HIV Protease Inhibitors: Sulfonamide- Containing 5,6-Dihydro-4-hydroxy-2-pyrones as Non-Peptidic Inhibitors. Journal of Medicinal Chemistry 39 (22), pp. 4349-4353 (15) Kumar, M., Hosur, M.V.: Adaptability and flexibility of HIV-1 protease. European Journal of Biochemistry 270 (6), pp. 1231-1239 (16) Xia, T., Takagi, J., Coller, B.S., Wang, J.-H., Springer, T.A.: Structural basis for allostery in integrins and binding to fibrinogen-mimetic therapeutics. Nature 432 (7013), pp. 59-67 (17) Marinelli, L., Lavecchia, A., Gottschalk, K.-E., Novellino, E., Kessler, H.: Docking studies on αvβ3 integrin ligands: Pharmacophore refinement and implications for drug design. Journal of Medicinal Chemistry 46 (21), pp. 4393-4404 25