Példák kémiai adat-típusokra

Hasonló dokumentumok
Fizikai és kémiai tulajdonságok számolása

Példák kémiai adat-típusokra

Példák kémiai adat-típusokra

s n s x A m és az átlag Standard hiba A m becslése Információ tartalom Átlag Konfidencia intervallum Pont becslés Intervallum becslés

Hipotézis vizsgálatok. Egy példa. Hipotézisek. A megfigyelt változó eloszlása Kérdés: Hatásos a lázcsillapító gyógyszer?

Regresszió. Fő cél: jóslás Történhet:

Lineáris regresszió. Statisztika I., 4. alkalom

ORVOSI STATISZTIKA. Az orvosi statisztika helye. Egyéb példák. Példa: test hőmérséklet. Lehet kérdés? Statisztika. Élettan Anatómia Kémia. Kérdések!

Statisztikai próbák. Ugyanazon problémára sokszor megvan mindkét eljárás.

Molekuláris dinamika: elméleti potenciálfelületek

A multikritériumos elemzés célja, alkalmazási területe, adat-transzformációs eljárások, az osztályozási eljárások lényege

Méréselmélet: 5. előadás,

A sokaság/minta eloszlásának jellemzése

10. Alakzatok és minták detektálása

Elektrokémia 03. Cellareakció potenciálja, elektródreakció potenciálja, Nernst-egyenlet. Láng Győző

20 PONT Aláírás:... A megoldások csak szöveges válaszokkal teljes értékőek!

Minősítéses mérőrendszerek képességvizsgálata

IDA ELŐADÁS I. Bolgár Bence október 17.

4 2 lapultsági együttható =

ELTE TáTK Közgazdaságtudományi Tanszék ÖKONOMETRIA. Készítette: Elek Péter, Bíró Anikó. Szakmai felelős: Elek Péter június

Indirekt térfogat-vizualizáció. Fourier térfogat-vizualizáció. Tomográfiás rekonstrukció. Radon-transzformáció. A Fourier vetítő sík tétel

Ötvözetek mágneses tulajdonságú fázisainak vizsgálata a hiperbolikus modell alkalmazásával

Szerven belül egyenetlen dóziseloszlások és az LNT-modell

Gazdaságtudományi Kar. Gazdaságelméleti és Módszertani Intézet. Korreláció-számítás. 1. előadás. Döntéselőkészítés módszertana. Dr.

Variancia-analízis (ANOVA) Mekkora a tévedés esélye? A tévedés esélye Miért nem csinálunk kétmintás t-próbákat?

Régió alapú szegmentálás. Digitális képelemzés alapvető algoritmusai. 2. példa: Elfogadható eredmények. 1. példa: Jó eredmények. Csetverikov Dmitrij

KOMBINATORIKA ELŐADÁS osztatlan matematika tanár hallgatók számára. Szita formula

METROLÓGIA ÉS HIBASZÁMíTÁS

Kvantum-tömörítés II.

Az entrópia statisztikus értelmezése

Dr. Ratkó István. Matematikai módszerek orvosi alkalmazásai Magyar Tudomány Napja. Gábor Dénes Főiskola

3D - geometriai modellezés, alakzatrekonstrukció, nyomtatás

Support Vector Machines

Algoritmusok és adatszerkezetek gyakorlat 09 Rendezések

VARIANCIAANALÍZIS (szóráselemzés, ANOVA)

ADATREDUKCIÓ I. Középértékek

Bevezetés a biometriába Dr. Dinya Elek egyetemi tanár. PhD kurzus. KOKI,

MOLEKULAMECHANIKA (MM)

Az elektromos kölcsönhatás

Adatelemzés és adatbányászat MSc

Intelligens elosztott rendszerek

Kísérlettervezési alapfogalmak:

Nemlineáris függvények illesztésének néhány kérdése

ADATREDUKCIÓ I. Középértékek

Alapvető elektrokémiai definíciók

8. Programozási tételek felsoroló típusokra

I. A közlekedési hálózatok jellemzői II. A közlekedési szükségletek jellemzői III. Analitikus forgalom-előrebecslési modell

SZÁMOLÁSI FELADATOK. 2. Mekkora egy klíma teljesítménytényező maximális értéke, ha a szobában 20 C-ot akarunk elérni és kint 35 C van?

Statisztika I. 3. előadás. Előadó: Dr. Ertsey Imre

4 Approximációs algoritmusok szorzatalakú hálózatok esetén

Statisztika feladatok

Tanult nem paraméteres próbák, és hogy milyen probléma megoldására szolgálnak.

ADATREDUKCIÓ I. Középértékek

Philosophiae Doctores. A sorozatban megjelent kötetek listája a kötet végén található

PhD értekezés. Gyarmati József

Műszaki folyamatok közgazdasági elemzése. Kevert stratégiák és evolúciós játékok

A kvantumkémia alkalmazása PES kémiai szempontból fontos jellemzői. A kvantumkémia alkalmazása Fogalmak

ORVOSI STATISZTIKA. Az orvosi statisztika helye. Egyéb példák. Példa: test hőmérséklet. Lehet kérdés? Statisztika. Élettan Anatómia Kémia. Kérdések!

A Ga-Bi OLVADÉK TERMODINAMIKAI OPTIMALIZÁLÁSA

d(f(x), f(y)) q d(x, y), ahol 0 q < 1.

Gazdaságtudományi Kar. Gazdaságelméleti és Módszertani Intézet. Regresszió-számítás. 2. előadás. Kvantitatív statisztikai módszerek. Dr.

7. Mágneses szuszceptibilitás mérése

MATEMATIKAI STATISZTIKA KISFELADAT. Feladatlap

Adatsorok jellegadó értékei

Mőanyagok felhasználása - szerkezeti. Mőanyagok felhasználása - technológiai. A faiparban felhasznált polimerek

Véletlenszám generátorok. 6. előadás

Példa: Egy üzletlánc boltjainak forgalmára vonatkozó adatok október hó: (adott a vastagon szedett!) S i g i z i g i z i

Gyakorló feladatok a Kísérletek tervezése és értékelése c. tárgyból Lineáris regresszió, ismétlés nélküli mérések

1.Tartalomjegyzék 1. 1.Tartalomjegyzék

Digitális Domborzat Modellek (DTM)

Egyenáramú szervomotor modellezése

(eseményalgebra) (halmazalgebra) (kijelentéskalkulus)

Reakciókinetika. Általános Kémia, kinetika Dia: 1 /53

OLS regresszió - ismétlés Mikroökonometria, 1. hét Bíró Anikó A tantárgy tartalma

Békefi Zoltán. Közlekedési létesítmények élettartamra vonatkozó hatékonyság vizsgálati módszereinek fejlesztése. PhD Disszertáció

FILMHANG RESTAURÁLÁS: A NEMLINEÁRIS KOMPENZÁLÁS

TÉRBELI STATISZTIKAI VIZSGÁLATOK, ÁTLAGOS JELLEMZŐK ÉS TENDENCIÁK MAGYARORSZÁGON. Bihari Zita, OMSZ Éghajlati Elemző Osztály OMSZ

Algoritmusok és adatszerkezetek I. 10. előadás

ELTE TáTK Közgazdaságtudományi Tanszék ÖKONOMETRIA. Készítette: Elek Péter, Bíró Anikó. Szakmai felelős: Elek Péter június

A m becslése. A s becslése. A (tapasztalati) szórás. n m. A minta és a populáció kapcsolata. x i átlag

Integrált rendszerek n é v; dátum

Fuzzy rendszerek. A fuzzy halmaz és a fuzzy logika

VÁROS- ÉS INGATLANGAZDASÁGTAN

3515, Miskolc-Egyetemváros

EM algoritmus. A feladat: egy valószínűség eloszlás valmilyen paraméterét(vektorát) akarjuk becsülni részlegesen megfigyelhető.

Biostatisztika e-book Dr. Dinya Elek

ELLÁTÁSI LÁNC VALÓS IDEJŰ OPTIMALIZÁLÁSA ABSZTRAKT

Extrém-érték elemzés. Extrém-érték eloszlások. A normálhatóság feltétele. Megjegyzések. Extrém-érték modellezés

3D-s számítógépes geometria

Elegyek. Fizikai kémia előadások 5. Turányi Tamás ELTE Kémiai Intézet. Elegyedés

BUDAPESTI MŐSZAKI ÉS GAZDASÁGTUDOMÁNYI EGYETEM VEGYÉSZMÉRNÖKI ÉS BIOMÉRNÖKI KAR OLÁH GYÖRGY DOKTORI ISKOLA. Tézisfüzet

A neurális hálózatok alapjai

Extrém-érték elemzés. Extrém-érték eloszlások. Megjegyzések. A normálhatóság feltétele. Extrém-érték modellezés

Elosztott rendszerek játékelméleti elemzése: tervezés és öszönzés. Toka László

BAGME11NNF Munkavédelmi mérnökasszisztens Galla Jánosné, 2011.

Kémiai kötés. Általános Kémia, szerkezet Slide 1 /39

Szerves Kémiai Problémamegoldó Verseny

Laboratóriumi kontrollkártya használata Tananyag. Készítette: Muránszky Géza vegyészmérnök Oktató: Lőrinc Anna minőségirányítási előadó

Extrém-érték elemzés. Extrém-érték eloszlások. A normálhatóság feltétele. Megjegyzések. Extrém-érték modellezés

Szárítás során kialakuló hővezetés számítása Excel VBA makróval

Átírás:

Példák kéma adat-típusokra Molekulárs topológa Markush szerkezetek Szmmetra elemek Anyag tulajdonságok Topológa ndexek Nómenklatúra Normál módok, vbrácók Bázs szetek kvantumkémához DNS és fehérjeszekvencák Kéma reakcók Reakcómechanzmusok Hgh throughput screenng adatok Skektrumok (MS, NMR, IR, ) Bblográfa adatok Gazdaság adatok (ár, költség, ) 0D/2D/3D molekulárs szerkezetek Atom koordnáta halmazok Fzka-kéma tulajdonságok Leírók (Descrptors) Molekulafelszínek Sztereokéma Erőtér paraméterek (molekulamechanka) Farmakofórok ADMETox adatok (toxctás) Reakcók knetka paramétere Reakcóutak Trajektórák MD szmulácókból Kromatogrammok Szabadalmak Szabványok Az adatátadás megfelelő specfkálása alapvető!!! Adatok, adatbázsok 2016. áprls 11. 1

Adatok A megfelelő nformácó knyeréséhez alapvető a felhasznált adatok mnőségének bztosítása kezdet adathalmaz jóslás, becslés (kísérlet és vagy elmélet) klógó és redundáns adatok kezelése adat-előkészítés, transzformácók legjobb leírók kválasztása Adatok, adatbázsok 2016. áprls 11. 2

Adat előkészítés Centrálás, skálázás Egy adat-vektorban használt adatok összeskálázása a hasonló numerkus súly, varanca eléréséhez. a j n x j x j a j 1 2 1 s j n n 1 Centrálás: Az átlag kvonása az adat-vektorokból. a n 1 j n x j x Automatkus skálázás (autoscalng): j n x j a j 2 x x j x j j x s a s j j j Adatok, adatbázsok 2016. áprls 11. 3

Adat előkészítés Centrálás, skálázás Eredet Skálázás Centrálás 0 Adatok, adatbázsok 2016. áprls 11. 4

Adat előkészítés Főkomponens-analízs (Prncpal Component Analyzs, PCA) Az X mátrx oszlopa tartalmazzák az x adatvektorokat, X a szngulárs érték felbontás (SVD) segítségével dagonalzálható: X UWV t, W A megfelelően nagy szngulárs értékek kválasztásával, j ha j, akkor 0 W, szngulárs érték W, ha ha hba-, ll. zajszűrés végezhető: W W, X, akkor akkor UWV t 0 W, Adatok, adatbázsok 2016. áprls 11. 5

Adat előkészítés Bázstranszformácó S = X t X átfedés, ll. kovaranca mátrx dagonáls felbontása: S UWU után, a megfelelően nagy W, sajátértékek meghagyásával (W') vetítéssel történhet a (SVD-nel egyenrangú) hbaszűrés: P UWW U ahol W' a W' dagonáls mátrx általánosított nverze: t t X XP W W, 0, 0 Az eredet adatvektorok bázstranszformácó segítségével ksebb dmenzójú vektorokkal (a C mátrx c oszlopvektoraval) reprezentálhatók: t t t 2 X X UW U C C C W 1 U t Adatok, adatbázsok 2016. áprls 11. 6

Adat előkészítés Fourer-transzformácó Egy f(x) függvény Fourer transzformácója (áttérés frekvenca-ampltudó térbe): F k x Inverz transzformácó: f e 2kx dx f x F k e 2kx dk Jelfeldogozás: NMR, FT-IR, stb. Adat előkészítés: Spektráls zajszűrés (Dszkrét) adatsor (pl. spektrum) esetén dszkrét FT, FFT Adatok, adatbázsok 2016. áprls 11. 7

Adat előkészítés Molekulárs szerkezetek előkészítése Ugyanazon szerkezet többféle formában leírható! Tautomerek Mezomerek (határszerkezet) Aromatzálás Hdrogének Ellenonok Oldószermolekulák Kraltás Csz-transz zoméra Megjelenítés standard formában Adatok, adatbázsok 2016. áprls 11. 8

Scentfc & techncal presentaton Standardzer October 2006 9

Why standardze structures? To recognze the same compound represented wth dfferent chemcal forms Adatok, adatbázsok 2016. Szerves 10

Custom transformatons Custom transformatons Bult-n functons Avalablty Adatok, adatbázsok 2016. Szerves 11

Mesomers Adatok, adatbázsok 2016. Szerves 12

Tautomers oxo-enol, enamne-mne Adatok, adatbázsok 2016. Szerves 13

Tautomers pyrdone-pyrdol Adatok, adatbázsok 2016. Szerves 14

Solvent removal Adatok, adatbázsok 2016. Szerves 15

Specfc counteron removal Adatok, adatbázsok 2016. Szerves 16

Bult-n functons Custom transformatons Bult-n functons Avalablty Adatok, adatbázsok 2016. Szerves 17

Fragment removal Adatok, adatbázsok 2016. Szerves 18

Aromatzaton Adatok, adatbázsok 2016. Szerves 19

Dearomatzaton Adatok, adatbázsok 2016. Szerves 20

Hydrogen conversons convertng mplct hydrogens to explct Adatok, adatbázsok 2016. Szerves 21

Hydrogen conversons convertng explct hydrogens to mplct Adatok, adatbázsok 2016. Szerves 22

2D Cleanng Adatok, adatbázsok 2016. Szerves 23

Template-based Cleanng 2D-coordnate calculaton of macrocycles or brdged systems Adatok, adatbázsok 2016. Szerves 24

Template-based Cleanng algnng search results to the query query Adatok, adatbázsok 2016. Szerves 25

Stereo manpulatons removng absolute R/S and E/Z stereo confguratons Adatok, adatbázsok 2016. Szerves 26

Stereo manpulatons settng the absolute stereo (chral) flag for stereo molecules Adatok, adatbázsok 2016. Szerves 27

Stochometry expanson expandng reacton stochometry Adatok, adatbázsok 2016. Szerves 28

Stochometry expanson expandng salt stochometry Adatok, adatbázsok 2016. Szerves 29

Group manpulaton Adatok, adatbázsok 2016. Szerves 30

Avalablty Custom transformatons Bult-n functons Avalablty Adatok, adatbázsok 2016. Szerves 31

API and command lne nterface Standardzer st = new Standardzer(new Fle("standardze.xml")); st.standardze(mol); standardze nput.sdf -c confg.xml -o output.smles Adatok, adatbázsok 2016. Szerves 32

Graphcal User Interface Adatok, adatbázsok 2016. Szerves 33

Features General aromatze/dearomatze add/remove explct hydrogens Conversons mesomers tautomers functonal groups Removals solvents counterons by lst remove smallest fragment keep largest fragment R-groups Stereo remove stereo features set the absolute stereo flag Sgroups expand/contract/ungroup clear/set the absolute stereo flag expand stochometry of attached data Cleanng partal full template based Compatble MOL, SDF, RXN, RDF (V2000/V3000) SMILES, SMARTS/SMIRKS (recursve too) MRV, CML, PDB Flexble customzable parameters customzable conversons Avalable full API command lne nterface ntegraton wth JChem Base and Cartrdge documentaton and examples free for the Academc communty Adatok, adatbázsok 2016. Szerves 34

Vst other techncal presentatons MarvnSketch/Vew MarvnSpace Calculator Plugns JChem Base JChem Cartrdge Standardzer Screen JKlustor Fragmenter Reactor http://www.chemaxon.com/marvnsketch_vew.ppt http://www.chemaxon.com/marvnspace.ppt http://www.chemaxon.com/calculator_plugns.ppt http://www.chemaxon.com/jchem_base.ppt http://www.chemaxon.com/jchem_cartrdge.ppt http://www.chemaxon.com/standardzer.ppt http://www.chemaxon.com/screen.ppt http://www.chemaxon.com/jklustor.ppt http://www.chemaxon.com/fragmenter.ppt http://www.chemaxon.com/reactor.ppt Adatok, adatbázsok 2016. Szerves 35

Tábla Egy adatbázs felépítése: Katalógus Adatbázsok Adattárolástól az adatbázsg Mező Címke Név Egyéb név Tsztaság (%) Forráspont Kulcs 43.919-3 Metanol Metl-alkohol 99.93 64.70 27.074-1 Etanol Etl-alkohol 90.00 78.00 Rekord 29.328-8 1-propanol Propl-alkohol 99.50 97.00 Címke Vásárló Dátum Fzetve 27.074-1 406 2007.03.08 IGAZ Vásárlók Vásárló Cég Cím Eladások 29.328-8 97 2007.03.07 HAMIS 406 Alb Kft. Vecsés 97 Vogon Bt. Bp. Adatok, adatbázsok 2016. áprls 11. 36

Adatbázsok Keresést elősegítő eljárások Rekordokhoz a rekordból számítható rendezhető kódok rendelése Bnárs keresés (szükséges lépések száma n elem esetén log 2 n-nel arányos): 1. >?,=?,<? 2. >?,=?,<? 3. >?,=?,<? Rendezhető kód pl. a hash kód, am egy beállított hosszúságú btsorozat, poztív egész szám: lehetőleg egyenletes elosztású legyen mnél nkább kerülje az ütközést lehetőleg közvetlenül adja meg a rekord ndexét a hash-kódból a rekord, objektum általában nem állítható vssza Adatok, adatbázsok 2016. áprls 11. 4. >?,=?,<? 37

Adatbázsok Bnárs fa alapú ndexelés Az adatbázs újrandexelése nélkül képes hatékonyan kereshető ndexelést bztosítan: mnden bejövő objektum ndexére a fa egy levele mutat mnden újabb objektum kód esetén újabb levéllel bővül a fa rendezetlenül jövő adatok esetén mélységében lassan nő a fa rendezetten bejövő objektumok esetén nem hatékony. Valójában lneárs tárolás: Adatok, adatbázsok 2016. áprls 11. 38

Keresés Teljes szerkezet keresés Feladat: az adott molekula gyors megtalálása az adatbázsban. Molekulárs szerkezetekből kszámított kódok, lneárs leírók használhatók gyors keresésre: hash kód gyors, de nem mndg egyértelmű egysoros leírók, pl. SMILES jól használhatók, de egyértelműséget bztosítan kell (pl. Morgan algortmus) kéma, pac elnevezések gyakran nem egyértelműek ráadásul a szerkezetet sem mndg adják vssza. a molekulárs szerkezetből származtatott egyszerű leírók, összegképlet, molekulatömeg, gráf alapú összegek csak első szűrésre használhatók Elő kell állítan a kérdéses molekulára s az adatbázsban használt kódo(ka)t Utána: bnárs keresés, bnárs fa alapú ndexelés, stb. Adatok, adatbázsok 2016. áprls 11. 39

Adatok, adatbázsok 2016. áprls 11. Keresés fragmens keresés (substructure search) Molekulárs szerkezetek felírhatók címkézett, színezett gráfok segítségével: G = (C,E), a G gráf C csúcsa és E éle segítségével adható meg. Ugyanez molekulárs szerkezetekre (S): S = (A,K), az S molekulagráf az A = {a 1, a 2, } atomok és K = {k 1, k 2, } kötések segítségével adható meg. Egy gráf másk gráfban való zomorf rész-gráfjának megtalálása NPteljes probléma, n atomos kereső (query) molekula és m atomos cél esetében az összes lehetőség száma: N llesztés m! ( m n)! 40

target 3H 3 C 5 5 5 5 4 4 4 4 3 3 3 3 2 2 2 2 1 1 1 1 map 0 0 0 0 query 1 2 3 4 1 OH 4 CH 3 2 Keresés Vsszalépéses (backtrack) algortmus Kereső (query) 1HO 5 CH 3 Összesen 5! = 120 lehetőség 2 3 Cél (target) map 1 0 0 0 2 0 0 0 2 1 0 0 2 3 0 0 2 3 1 0 2 3 2 0 2 3 4 0 2 3 5 0 2 3 5 1 2 3 5 4 2 4 0 0 2 5 0 0 2 5 1 0 2 5 3 0 2 5 3 1 2 5 3 4 2 5 4 0 CH 3 4 Adatok, adatbázsok 2016. áprls 11. 41

target 3H 3 C 5 5 5 5 4 4 4 4 3 3 3 3 2 2 2 2 1 1 1 1 map 0 0 0 0 query 1 2 3 4 1 OH 4 CH 3 2 Keresés Vsszalépéses (backtrack) algortmus Kereső (query) 1HO 5 CH 3 Összesen 5! = 120 lehetőség 2 3 Cél (target) CH 3 4 map 3 0 0 0 3 1 0 0 3 2 0 0 3 2 1 0 3 2 4 0 3 2 4 1 3 2 4 5 3 2 5 0 3 2 5 1 3 2 5 4 3 4 0 0 3 4 1 0 3 4 2 1 3 4 2 5 3 4 5 0 3 5 0 0 Adatok, adatbázsok 2016. áprls 11. 42

target 3H 3 C 5 5 5 5 4 4 4 4 3 3 3 3 2 2 2 2 1 1 1 1 map 0 0 0 0 query 1 2 3 4 1 OH 4 CH 3 2 Keresés Vsszalépéses (backtrack) algortmus Kereső (query) 1HO 5 CH 3 Összesen 5! = 120 lehetőség 2 3 Cél (target) Backtrack algortmussal 49 vzsgálat map 4 0 0 0 4 1 0 0 4 2 0 0 4 3 0 0 4 3 1 0 4 3 2 0 4 3 5 0 4 5 0 0 5 0 0 0 5 1 0 0 5 2 0 0 5 2 1 0 5 2 3 0 5 2 4 0 5 3 0 0 5 4 0 0 CH 3 4 Adatok, adatbázsok 2016. áprls 11. 43

Keresés Vsszalépéses (backtrack) algortmus optmálása 3H 3 C 1 CH 3 2 5 CH 3 target 1 Adatok, adatbázsok 2016. áprls 11. OH 4 Kereső (query) 5 5 5 4 4 4 3 3 3 2 2 2 map 0 0 0 0 query 4 1 2 3 1HO 2 3 Cél (target) Eredetleg 5! = 120 lehetőség Optmált backtrack algortmussal 12 vzsgálat CH 3 4 map 1 0 0 0 1 2 0 0 1 2 3 0 1 2 3 4 1 2 3 5 1 2 4 0 1 2 5 0 1 2 5 3 1 2 5 4 1 3 0 0 1 4 0 0 1 5 0 0 44

Keresés Vsszalépéses (backtrack) algortmus optmálása 3H 3 C 1 CH 3 2 5 CH 3 OH 4 1HO 2 3 CH 3 4 target 1 Adatok, adatbázsok 2016. áprls 11. Kereső (query) 5 5 4 4 3 3 2 2 2 map 0 0 0 0 query 4 1 2 3 Cél (target) Eredetleg 5! = 120 lehetőség Tovább optmált backtrack algortmussal 9 vzsgálat map 1 0 0 0 1 2 0 0 1 2 3 0 1 2 3 4 1 2 3 5 1 2 4 0 1 2 5 0 1 2 5 3 1 2 5 4 45

Keresés Szerkezet kulcs (structural key) A molekulában megtalálható, előre kválasztott szerkezet elemekhez (atom típusok, jellemző funkcós csoportok) egy btet rendelünk. Ha a szerkezet elem megtalálható, a btet beállítjuk Előnye Könnyen előállítható Fx hosszúságú Adatbázsra, tárolandó molekulák jellegére optmálható Hátránya Kevés bt (rövd kulcs) esetén sok ütközéssel járhat Sok bt esetén kcs a ktöltöttség, lassul a keresés Nehéz általánosan használható jól optmált kulcsot készíten Adatok, adatbázsok 2016. áprls 11. 46

Keresés Molekulárs ujjlenyomat (fngerprnt) Szntén adott n hosszúságú btsorozat, de: Az adott atomból l távolságon belül található összes lehetséges szerkezet motívumhoz rendelünk bteket Az adott motívumhoz pl. ezzel ncalzált véletlenszám-generátorral állítunk be k btet Előnye: Könnyű mplementáln Nem kíván előre kódolt szerkezet motívum-bt összerendelést Általános célokra paraméterezhető n, k és l megfelelő megválasztásával. A kívánt btsűrűség könnyen optmálható Hátránya: Nagy l esetén előállítása költséges lehet Nagy l esetén n és k növelése s szükséges, am a gyors keresés költséget növel Továbbfejlesztés lehetőség: Hajtogatással, változó hosszú kulcs használatával a btsűrűség széles tartományban állandó sznten tartható Adatok, adatbázsok 2016. áprls 11. 47

Precztás és szabatosság (precson and accuracy, TXSz) Precztás: a kísérlet adatok pontossága (mérés hba), számítások esetén azok reprodukálhatóságának hbája Szabatosság: a valóságtól (leírn kívánt állapottól) való eltérés mértéke precíz és szabatos Q.S.A.R 2010. áprls 22. szabatos, de nem precíz (átlag kb. jó) precíz, de nem szabatos (az eltérés smeretében javítható) 48

Fzka és kéma tulajdonságok számolása Objektum: molekula vagy molekulák rendszere Egy lehetséges csoportosítás: Addtvtáson alapuló becslések Molekulamechanka számolások Kvantumkéma számolások Q.S.A.R 2010. áprls 22. 49

Addtvtáson alapuló becslések Mlyen tulajdonságok becsülhetőek lyen módon? molekulatömeg (!) móltérfogat damágneses szuszceptbltás parachor molárs hőkapactás képződéshő / atomzácós hő... N Pm p 1 P m a molekulárs tulajdonság, N az atomok száma, p az -edk atom tulajdonsága Mnden atomtípushoz smernünk kell a megfelelő értéket! Q.S.A.R 2010. áprls 22. 50

Addtvtáson alapuló becslések példa: 3 séma szénhdrogének atomzácós hőjének számolására C Benson: csoportokon alapuló séma: C CH 3 C CH C C-(C)(H) 3, C-(C) 2 (H) 2, C-(C) 3 (H), C-(C) 4 C CH 2 C C Ladler: módosított kötésaddtvtás séma, a C-H kötéseket dfferencálja: C C C E(C-H) p, E(C-H) s, E(C-H) t (első-, másod-, és harmadrendű szenekhez kapcsolódó H) C Allen: a szénvázhoz tartozó kötésaddtvtás kegészítése két elemmel: G(CCC) és D(CCC): három C egymás után / ugyanazon szénatomhoz kapcsoltan A három séma egyformán szabatos (accurate)! C-(C)(H) 3 = 0,5E(C-C) + 3E(C-H) p = 0,5B(C-C) + 3B(C-H) C-(C) 2 (H) 2 = E(C-C) + 2E(C-H) s = B(C-C) + 2B(C-H) + G(CCC) C-(C) 3 (H) = 1,5E(C-C) + E(C-H) t = 1,5B(C-C) + B(C-H) + 3G(CCC) + D(CCC) C-(C) 4 = 2E(C-C) = 2B(C-C) + 6G(CCC) + 4D(CCC) Q.S.A.R 2010. áprls 22. 51

Addtvtáson alapuló becslések gyűrűk fgyelembevétele Ha a szerkezetben vannak gyűrűk, az nagymértékben befolyásolhatja a becsülendő értékeket A gyűrűk stablzálhatnak vagy destablzálhatnak Az addtvtás sémákban plusz tagokat kell használn a gyűrűk hatásának fgyelembevételéhez Példa: háromtagú gyűrűk feszülés energá O N H S 115.6 kj/mol 111.9 kj/mol 115.2 kj/mol 73.6 kj/mol Stablzácó: aromás rendszerekben jelentős Q.S.A.R 2010. áprls 22. 52

1975-ös fejlesztés (Johann Gasteger) Addtvtáson alapuló becslések töltéseloszlás számolása: a PEOE modell sokmllós adatbázsokon ma s használják gyorsasága matt PEOE: Partal Equalzaton of Orbtal Electronegatvtes A Mullken-féle elektronegatvtás: Fontos az adott vegyértékállapothoz tartozó értékek használata! A PEOE-ben használt képlet: Ahol Q az adott atom töltése, a koeffcenseket az adott elektronpálya semleges, anonos és katonos onzácós potencálja és elektronaffntása alapján lehet megkapn v v 2 1 a v I v E v b Q c Q v v I v : onzácós potencál E v : elektronaffntás (adott vegyértékállapotra) 2 Q.S.A.R 2010. áprls 22. 53

Addtvtáson alapuló becslések töltéseloszlás számolása: a PEOE modell Kötések kalakulásakor az elektronpályák elektronegatvtása elvleg kegyenlítődk A molekulában azonban az elektronegatvtások megváltoznak PEOE: teratív eljárás (lépés száma: n) mnden atomra (): mnden párra (j): q j : töltéskülönbség a kötés mentén d n : attenuácós faktor (d=1/2, az nduktív effektus mnden kötéssel felére-harmadára csökken) v+ : a poztív állapot elektronegatvtása 6 terácós lépés általában elegendő A maradék (rezduáls) elektronegatvtás jól írja le az nduktív effektust v a v b v Q c v Q 2 qj n 1 ( v) ( v jv) q j q j q n Q q Q Q j Q j j n n n d n Q.S.A.R 2010. áprls 22. 54

Addtvtáson alapuló becslések kéma eltolódások becslése Tpkus becslés: analóg a táblázatos számolásokkal, az alap eltolódáshoz hozzáadogatjuk a szomszédos csoportokból eredő korrekcós tagokat (pl. ChemOffce) Egy gazán nehéz probléma: fehérjék kéma eltolódásának becslése A térszerkezet befolyása döntő SHIFTX program: δ calc : számolt eltolódás δ col : alapérték ( random col δ RC : aromás köráramok hatása δ EF : elektrosztatkus hatások δ HB : hdrogénkötések hatása δ HS : lokáls konformácótól való függés calc col RC EF HB HS Q.S.A.R 2010. áprls 22. 55

QSAR Jelentés: Quanttatve/Qualtatve Structure-Actvty Relatonshp (mennység/mnőség szerkezet-hatás összefüggés) Név-változatok: QSPR: Quanttatve/Qualtatve Structure-Property Relatonshp SAR, SPR (Q) S A/P R Lényeg ugyanaz: modell építése analógák és nem elmélet alapján. Quanttatve: cél a predkcó Qualtatve: cél a megértés Felhasznált anyagok: Kalász Adrán PhD dolgozata Hugo Kubny előadása ChemAxon Screen (http://www.kubny.de/lectures.html) (http://www.chemaxon.com/conf/screen.ppt) Q.S.A.R 2010. áprls 22. 56

Q.S.A.R 2010. áprls 22. QSAR Történet - Hammet egyenletek (~1950), pl. reakcók egyensúly állandójára: log Kx K0 x Y Az Y referenca reakcó esetében meghatározhatók az x szubszttuensekre a konstansok, pl. aromás vegyületekre. 0 ndex a szubszttuálatlan vegyületet jelent, majd az egyenletek általánosíthatók egyéb (Z) reakcókra s: log Kx K0 Z x Z A Hammet egyenleteket reakcósebességre s alkalmazzák, a szubszttuens konstansok bzonyos mértékű addtvtása s megfgyelhető. Tanulság: Elmélet megalapozás nélkül s kalakítható jól működő mennység összefüggés valamely deszkrptor (szubszttuens állandó) és tulajdonság (reakcósebesség) között. 57

QSAR Történet A Hansch analízs (~1960) eredetleg lpoflctással fejez k kapcsolatot: log 1 C alog P b ahol C az adott választ teljesítő koncentrácó, P pedg az oktanol-víz megoszlás hányados. Bevezethető egy, logp alapú új szubszttuens állandó s: log Px P0 x melyet a Hammet -val kombnálva jobb korrelácót értek el: log Z 1 C k1 k2 k3 ahol a k értékek az adott vegyületcsoportra llesztett paraméterek. Ebben az esetben s a deszkrptorok (a szubszttuens állandók) önmagukban s származtatott mennységek. Q.S.A.R 2010. áprls 22. 58

QSAR Történet A Free-Wlson analízs (~1960) azt használja fel, hogy az adott molekulában () egy adott csoport (X) az adott pozícóban (j) megtalálható-e: log 1 C a X ahol C az adott választ teljesítő koncentrácó, X j pedg 1, ha X szubszttuens az molekulában megtalálható a j-k pozícóban, egyébként 0, m a szubszttuálatlan alapvegyület kísérlet aktvtása, a j -k llesztett paraméterek, az adott szubszttúcó hozzájárulását fejezk k. A Free-Wlson analízs teknthető a modern QSAR módszerek előfutárának. Az X j deszkrptorok előállításához nncs szükség egyébre, csak a molekulák képletére, az összefüggés kzárólag a kérdéses aktvtások (1/C ) megmérésével felállítható. j j m Q.S.A.R 2010. áprls 22. 59

QSAR A feladatok - A cél (összefüggés feltárása, predkcó) és preferencák (kívánt pontosság, vzsgálandó molekulák száma) meghatározása. - A vzsgált tulajdonság, aktvtás becsléséhez megfelelő deszkrptorok kválasztása. - Adatelőkészítés, adatok valdálása - Modellépítés, összefüggés felállítása - A modell valdálása - Alkalmazás, alkalmazhatóság vzsgálata Q.S.A.R 2010. áprls 22. 60

QSAR A cél - Összefüggés feltárásához a deszkrptorok (független változók) és a vzsgált tulajdonság (függő változó) között kapcsolatot egyenletek vagy vzuálsan értékelhető modell formájában kell megadn. - Ha csak predkcó a cél a modell szemléletessége nem szempont. - A modell előállításának, alkalmazásának költsége, pontossága megfelelőek-e. 3D QSAR HTS (Hgh Throughput Screenng) Q.S.A.R 2010. áprls 22. 61

QSAR A deszkrptorok - Lehetőleg a molekulák szerkezetének (topológájának) smeretében automatkusan és olcsón kszámíthatók legyenek. - Ne legyen túl sok deszkrptor (vagy ld. adatelőkészítés). - A deszkrptorok és függő változók nem megfelelő skálázása, származtatása furcsa eredményre, félrevezető modellre vezethet. - Ha a deszkrptorok kísérlet adatok, azok hbájának, megbízhatóságának ellenőrzése. Q.S.A.R 2010. áprls 22. 62

Q.S.A.R 2010. áprls 22. 63

Q.S.A.R 2010. áprls 22. QSAR Adatok előkészítése - Előkészítés: ld. Adatbázs1/6-11. - Fgyelembe kell venn az adatok előkészítésekor, hogy a leendő modell a lehető legegyszerűbb (pl. lneárs összefüggés) legyen (Occam borotvája). - Ha túl sok a felhasználható jellemző (feature), ll. leíró (pl. spektrumok, grd-ek) kevés látszólagos (latent) változó, pontszám (score, v ) bevezetése megfelelő súlyfaktorokkal (loadng, b j ): t v A x t deszkrptorok X soraban találhatók. j b kj x k ; Automatzálható főkomponens-analízs alapú bázs-transzformácóval. - Látszólagos vektorok bázs-transzformácóval való előállításához elég egy jól meghatározott metrka (távolság defnícó), az eredet deszkrptor nem s kell hogy vektor jellegű legyen! v B x; V XB 64

Q.S.A.R 2010. áprls 22. 65 2 2, 1 ), ( y x y x asymmetrc weghted Eucldean y x w y x w y x D asymmetrc scaled Tanmoto y x s y x s y y x s x y x s y x D ), mn( ), mn( 1 ), mn( ), mn( 1 ), (, 0,1 asymmetry factor N s scalng factor 0,1 asymmetry factor 0,1 w weghts Parametrzed metrcs

Q.S.A.R 2010. áprls 22. 66

Q.S.A.R 2010. áprls 22. QSAR Modellalkotó mnták vzsgálata Az n mnta k pontszám (score) vektora (X n sora) által kfeszített altér projektora (vetítő mátrx, PP = P) előállítható a következő módon: t 1 t X H X X X A H (angol Hat, azaz kalap) mátrx dagonáls eleme az adott mntának a modellre várható befolyását jelzk (leverage), 1/n és 1 között értékeket felvéve. Mnél nagyob a h dagonáls elem értéke, annál függetlenebb az adott mnta és érdemes felhasználn a modell építéséhez. Ennek megfelelően, ha csökkenten akarjuk a modell építéséhez felhasználandó tanító halmazt (tranng set) érdemes a ks befolyással bíró mntákat eltávolítan, ezekre várhatóan nterpolácóval tud majd a modell becslést végezn. Ha a modell tartalmaz kugróan nagy befolyással rendelkező mntákat akkor a modell valdálása során várhatóan rossz keresztvaldálás eredmények mellett jó predkcót mutathat. 67

QSAR Modellépítés, összefüggés felállítása - Ha lehetséges törekedjünk lneárs modell felépítésére: - Matematka, statsztka háttér jól megalapozott - Kevés paraméter - A buktatók elkerülésére nagy mennységű tapasztalat, tesztadat áll rendelkezésre (tanulj mások kárán) - Kész programcsomagok állnak rendelkezésre - A független változók (x) és a vzsgált tulajdonságok (y) közt lneárs kapcsolat, korrelácó megléte könnyen vzsgálható: r x x y y 2 x x y y 2 r a Pearson korrelácós koeffcens, az x és y változó vektorok var(x) és var(y) varancára, ll. szórására normált cov(x,y) covarancája. Q.S.A.R 2010. áprls 22. 68

Q.S.A.R 2010. áprls 22. QSAR Lneárs korrelácó Az r (Pearson) korrelácós koeffcens, az x és y változó vektorok var(x) és var(y) varancára, pontosabban szórására normált cov(x,y) covarancája: cov var r x x, y x s c x xy s y s 2 x c xy x x x y y n 1 A felső vonal (pl. ) a megfelelő változó átlaga, r pedg -1 és +1 között értéket vehet fel, ±1 tökéletes korrelácót jelent, a 0 közel érték csak a lneárs korrelácó hányát mutatja. Centrált adatok esetén az átlagok eltűnnek r a két vektor szögének kosznusza. x n 1 2 x x y y 2 x x y y 2 69

Q.S.A.R 2010. áprls 22. A Pearson-féle korrelácós koeffcens kapcsolata a lneárs regresszóval Lneárs regresszó (legksebb négyzetek módszere, method of least squares): c xy b 2 y a bx 2 mn mn y yˆ 2 sx a y bx ahol yˆ az y érték becslése lneárs regresszóval. Ez alapján a Pearson-féle korrelácós együttható négyzete a következő alakban s megadható: r y y y y 1 2 2 ˆ Ez az alak csak a függő változókat és becslésüket tartalmazza, ezért általánosan a becslés, a modell jóságának jelzésére használjuk és r 2 alatt nem(!) a Pearson-féle r négyzetét értjük. 2 70

QSAR Többváltozós lneárs regresszó (MLR) A centrálás(!) után kapott pontszámok (score, x) és a vzsgált, szntén centrált tulajdonság-, ll. aktvtás-értékek (y) között az a- ban szereplő súlyfaktorokkal (loadng) kfejezve a következő függvénykapcsolatot tételezzük fel: y a t x Ha n mntához tartozó k pontszám -hoz építjük a modellt, a n k méretű score-mátrx (X) defnálásával, a kísérletleg meghatározott n tulajdonság-értéket (y) a következő egyenlettel közelíthetjük: y Xa X y t XX y a Amennyben az adatok előkészítése főkomponens analízst és megfelelő bázstranszformácót s magában foglalt, X mátrx nvertálható, egyébként a jobb oldal formulát, általánosított nverzzel használhatjuk az a súlyfaktorok kszámítására. Ekkor megspórolhatunk egy bázstranszformácót (PCA regresson). a X 1 t 1 Q.S.A.R 2010. áprls 22. 71

súlyfaktorokat, mnden lépésben kválasztva a következő legjobban korreláló score vektort: l 0, ~ y y ha kválasztjuk azt az eddg nem szereplő t,ahol a ~ y QSAR Részleges legksebb négyzetek módszere (Partal Least Squares, PLS) A legtöbb leírás az adatelőkészítés (bázstranszformácó) beolvasztásával bonyolítja el a módszer smertetését, ezért egyszerűbb leírást adunk és feltételezzük a megfelelő adatelőkészítést, centrálást. A PLS eljárás nem adható meg zárt alakban, mert lépésenként számítja k a ~ t y ~ y l y t l t x ~ yl t xx ~ y a x l y ksebb a lmtnél l1 l, l l 1 vagy mnden score vektort felhasználtunk, vége t x ~ yl t x x ~ t y ~ y l y~l l maxmáls x ~ y l 1 Q.S.A.R 2010. áprls 22. 72

QSAR Részleges legksebb négyzetek módszere (Partal Least Squares, PLS) - A PLS manapság az egyk legelterjedtebben használt llesztés eljárás. - Sok pontszám (score) használatakor gyakorlatlag tökéletes lleszkedést produkálhat ezért érdemes megfelelő körültekntéssel használn. - A paraméterek száma a megállás krtérumként s megadható, de előnyösebb a ksszámú paramétert az adatok előkészítésekor dmenzószám csökkentő bázstranszformácóval (PCA) elérn. - A PLS regresszó eredménye: formában adható meg. yˆ Xa Q.S.A.R 2010. áprls 22. 73

Q.S.A.R 2010. áprls 22. QSAR A modell belső ellenőrzése - r 2 kszámítása a modellben felhasznált (tranng set) tulajdonság, aktvtás adatok becslésére. - Mnden egyes mntára kszámítjuk a predkcót úgy, hogy előtte kvesszük az llető molekulát (mntát) a modellből és így kapott predkcóra számítjuk k az r 2 értéket, amt általában q 2 tel jelölnek (Leave-One-Out q 2, LOO). - Több mntát s khagyunk csoportokban, véletlenszerűen vagy szsztematkusan és a predkcókra q 2 et számolunk (Leave- Many-Out q 2, LMO). - Bootstrap: Az n mntából smétlés megengedésével választunk k mnta-n-eseket melyekre pl. q 2 LOO átlagot számolunk. A bootstrap átlag és az eredet érték eltérése statsztka torzításról ad felvlágosítást és a regresszós együttható(k) konfdenca ntervallumának becslésére s használható. 74

QSAR A modell külső ellenőrzése - Teszt1 halmaz: Előfordulhat, hogy a modell építése során a tanító halmazból (tranng set) khagyunk mntákat, melyek a végső modellben nem vesznek részt. Az ezekre számított predktív r 2 lényegesen jobb becslését adja a modell predkcós erejének, mnt pl. q 2 LOO. - Teszt2 halmaz: A modell predkcós képességének gaz ellenőrzése olyan adatokkal vzsgálható legjobban, melyek egyáltalán nem vettek részt a modellépítés folyamatában. Érdemes azonban megjegyezn, hogy a QSAR modellektől nem várható el hatékony extrapolácó, ezért érdemes predkcó esetén az extrapolácó várható mértékét s megvzsgáln (pl. Hat-mátrx). - Kubny paradoxon: Jó statsztka adatok produkálására tanított modellek nagyon rossz predkcós tulajdonságokkal s bírhatnak. Q.S.A.R 2010. áprls 22. 75

Q.S.A.R 2010. áprls 22. 76

Q.S.A.R 2010. áprls 22. 77

Q.S.A.R 2010. áprls 22. 78

Q.S.A.R 2010. áprls 22. 79

Q.S.A.R 2010. áprls 22. 80

Q.S.A.R 2010. áprls 22. QSAR Problémák - Hbás bológa adatok - A bológa adatok rossz skálázása - Különböző laborokból származó adatok (eltérő szsztematkus hba) - Különböző módú kötődés - Különböző hatásmechanzmus (pl. toxctás!) - Túl kevés rendelkezésre álló adat - Túl sok egyedülálló pont - Ksmértékű kéma változatosság - Blokkosodott adatok - Tulajdonság/aktvtás ksmértékű varancája - Szsztematkus vagy túl nagy mérés hba - Kugró pontok (outlers) - Rossz modellválasztás (TXK) 81

Q.S.A.R 2010. áprls 22. QSAR Van még gond - Nem megfelelő deszkrptorok - Túl sok deszkrptor - a modellválasztáskor - a modellben - Deszkrptorok skálázása (pl. CoMFA) - Kezelés nélkül mátrx szngulartás - Változók khagyása, melyek csak a többvel együtt szgnfkánsak - Model nem szgnfkáns (F-teszt) - Deszkrptorok nem szgnfkánsak (t-teszt) - Nncs kvaltatív modell - Nncs ok-okozat összefüggés - Predkcó túl nagy extrapolácóval - Ellenőrzés hánya - Rossz eljárás használata ellenőrzésre (TXK) 82

QSAR 3D QSAR (CoMFA, 1988) - Összehasonlító molekula-mező elemzés (Comparatve Molecular Feld Analyss) - Hasonló dverztású trénng/teszt halmaz - 3D szerkezetek(ek) generálása az összes vzsgálandó molekulára (predkcónál s) - Molekulák megfelelő átfedés szabályanak kalakítása (közös aktív rész) - Molekulák összeforgatása a megfelelő közös orentácó eléréséhez. - Molekulák dobozba llesztése - Tulajdonságok kszámítása a grd pontokban (az összes molekulára tulajdonságonként) - Bázstranszformácó (latent varables) - PLS, tulajdonság-súlyok meghatározása - Predkcó - Thanks Kubny (TXK) Q.S.A.R 2010. áprls 22. 83

QSAR 3D QSAR (CoMFA, 1988) - Összehasonlító molekula-mező elemzés (Comparatve Molecular Feld Analyss) - Hasonló dverztású trénng/teszt halmaz - 3D szerkezetek(ek) generálása az összes vzsgálandó molekulára (predkcónál s) - Molekulák megfelelő átfedés szabályanak kalakítása (közös aktív rész) - Molekulák összeforgatás a megfelelő orentácó eléréséhez. - Molekulák dobozba llesztése - Tulajdonságok kszámítása a grd pontokban (az összes molekulára tulajdonságonként) - Bázstranszformácó (latent varables) - PLS, tulajdonság-súlyok meghatározása - Pedkcó - Thanks Kubny (TXK) Q.S.A.R 2010. áprls 22. 84

QSAR és 3D QSAR Free-Wlson analízs + Egyszerű módszer, legtöbbször egyetlen megoldás + A szubszttuens effektusok tsztán szétválnak + Segíthet Hansch-modell felállításában + Hansch-modellel kombnálható - Legalább két pozícóban szükséges kéma változatosság - Túl sok paraméter, kevés szabadság fok - Szűk modell, nncs extrapolácó Hansch analízs + Aktvtásokat fzka-kéma paraméterekkel korreláltatja + Lehetséges az extrapolácó - Származékokra használható csak - Aromás szuszttuensek változtatásával működk legnkább - Csak 2D (topológa) szerkezet nformácót használ - Több megoldás s lehetséges - Sok változó, véletlen korrelácó esélye nagy. - Nagymérvű extrapolácó esetén nagy lehet a hba Q.S.A.R 2010. áprls 22. 85

QSAR és 3D QSAR 3D QSAR + Lgandumok 3D szerkezetét vesz fgyelembe + Széleskörű mntahalmazra alkalmazható + Többféle tulajdonságot s fgyelembe vehet (elektrosztatkus, sztérkus, hdrogénkötés donor/akceptor, stb.) + Képes előnyös és hátrányos pozícók 3D feltérképezése - A boaktív konformácó megtalálása bzonytalan! - Különböző kötődés módokból adódhat bzonytalanság - Levágás problémák (CoMSIA részben megoldotta) - Változókválasztás töredezett kontúr felületeket eredményez - Nagy esélye van a véletlen korrelácónak - Kzárólag n vtro adatokra alkalmazható? Q.S.A.R 2010. áprls 22. PFLR-3D-QSAR: http://ptanc.chem.elte.hu/pflr, http://ptanc.chem.elte.hu/pflr/examples/ Farkas, O.; Jakl, I.; Kalasz, A.; Gabor, I. Parameter-free lnear relatonshp (PFLR) and ts applcaton to 3D QSAR. J. Math. Chem. 2008, n press (on-lne elérhető). (TXK) 86

QSAR? Mnden modell rossz, de néhány használható. All Models Are Wrong But Some Are Useful. George E. P. Box, 1979 (TXK) Q.S.A.R 2010. áprls 22. 87

Gyógyszerkutatás Defnícók - Lgandum: Fehérjéhez, esetleg nuklensavhoz jellegzetes módon kötődő molekula - Enzm: Kéma, bokéma reakcó(ka)t katalzáló fehérje. - Szubsztrát: Enzm által katalzált reakcó kndulás anyaga. - Inhbtor: Az enzm szubsztráttal való eredményes reakcóját megakadályozó molekula - Receptor: Lgandumot kötő, arra reagáló fehérjemolekula - Agonsta: Receptorhoz kötődő, azt aktváló molekula. - Antagonsta: Receptorhoz kötődő, de azt nem aktváló molekula. - Ioncsatorna: Nytott állapotban onokat enged átáramlan a sejtmembránon a koncentrácógradenssel szemben. - Transzporter: Ionokat, molekulák szállít át a sejtmembránon, akár koncentrácó gradensének rányában. - Metabolt: Egy molekula bológa lebomlásának közt- vagy végterméke. - Antmetabolt: Olyan molekula, mely egy fontos metabolt boszntézsét akadályozza, hams szubsztrát vagy nhbtor. - Vezérszerkezet (lead structure): Olyan vegyületcsaládot reprezentáló szerkezet, mely jó eséllyel lehet kndulópontja egy teljes gyógyszerfejlesztés programnak. - Blológa használhatóság (boavalblty): A gyógyszer élő szervezetben való felhasználhatóságának mértéke. Gyógyszerkutatás 2008. 88

Gyógyszerkutatás Defnícók Gyógyszerkutatás 2008. 89

Gyógyszerkutatás Defnícók Gyógyszerkutatás 2008. 90

Gyógyszerkutatás Defnícók Gyógyszerkutatás 2008. 91

Gyógyszerkutatás Defnícók Gyógyszerkutatás 2008. 92

Gyógyszerkutatás A gyógyszerkutatás története Idő Anyagok Teszt rendszerek Ősdők növények, mérgek, ásványok emberek 1806 morfum 1850 (zolált) molekulák 1890 szntetkumok, festékek állatok 1920 állatok, zolált szervek 1970 enzmek, membránok 1990 kombnatorkus könyvtárak ember fehérjék, HTS (Hgh Throughput Screenng 2000 célzott könyvtárak uhts, VS (Vrtual Screenng) Gyógyszerkutatás 2008. 93

Gyógyszerkutatás Gyógyszerkutatás 2008. 94

Gyógyszerkutatás Gyógyszerkutatás 2008. 95

Gyógyszerkutatás Gyógyszerkutatás 2008. 96

Gyógyszerkutatás A gyógyszerkutatás folyamata Vezérszerkezet keresés - Élet- és kórtanlag fontos molekulárs célpont (enzm, receptor, oncsatorna vagy transzporter) megtalálása - Az lletékes DNS vagy fehérje szekvenca meghatározása - A fehérje funkcójának és mechanzmusának feltárása - A terápa koncepcójának gazolása állatkísérletekkel - Nagy áteresztőképességű (hgh throughput) molekulárs tesztrendszer - Szntézsprogram vagy tömeges osztályozás (screenng) - Egy vagy néhány vezér szerkezet kválasztása Vezér (lead) optmálás és gyógyszerfejlesztés - A molekulárs célpont ks molekulatömegű lgandumokkal alkotott komplexe 3D szerkezetének meghatározása (Röntgen, NMR) - Molekulamodellezés és új lgandumok tervezése - Tovább szntézs és a kválasztott jelöltek bológa vzsgálata - Szelektvtás, gyógyszerknetka, bológa használhatóság optmálása - Gyógyszer véglegesítése - Pre-klnka, klnka fejlesztés - Gyógyszerbejelentés, törzskönyvezés, pac bevezetés, marketng Gyógyszerkutatás 2008. 97

Gyógyszerkutatás A gyógyszerkutatás folyamata Vezérszerkezet keresés - Élet- és kórtanlag fontos molekulárs célpont (enzm, receptor, oncsatorna vagy transzporter) megtalálása - Az lletékes DNS vagy fehérje szekvenca meghatározása - A fehérje funkcójának és mechanzmusának magyarázata - A terápa koncepcójának gazolása állatkísérletekkel - Nagy áteresztőképességű (hgh throuhput) molekulárs tesztrendszer - Szntézsprogram vagy tömeges osztályozás (screenng) - Egy vagy néhány vezér szerkezet kválasztása Vezér (lead) optmálás és gyógyszerfejlesztés - A molekulárs célpont ks molekulatömegű lgandumokkal alkotott komplexe 3D szerkezetének meghatározása (Röntgen, NMR) - Molekulamodellezés és új lgandumok tervezése - Tovább szntézs és a kválasztott jelöltek bológa vzsgálata - Szelektvtás, gyógyszerknetka optmálása - Gyógyszer véglegesítése - Pre-klnka, klnka fejlesztés - Gyógyszerbejelentés, törzskönyvezés, pac bevezetés, marketng Gyógyszerkutatás 2008. 98

Gyógyszerkutatás Tervezés: Vezérszerkezet keresés Gyógyszerkutatás 2008. 99

Gyógyszerkutatás Tervezés: Vezérszerkezet keresés Gyógyszerkutatás 2008. 100

Gyógyszerkutatás Gyógyszertervezés stratégák Gyógyszerkutatás 2008. 101

Gyógyszerkutatás Gyógyszertervezés A gyógyszertervezés hasonlóság alapelven nyugszk: a vezér (lead) optmálás evolúcós eljárás: Gyógyszerkémkusok mndg s vegyületek hasonlósága alapján fejlesztették k aktív molekulák új analógjat. Gyógyszerkutatás 2008. 102

Gyógyszerkutatás Hasonlóság és dverztás Gyógyszerkutatás 2008. 103

Gyógyszerkutatás Hasonlóság és dverztás Gyógyszerkutatás 2008. 104

Gyógyszerkutatás Hasonlóság és dverztás Gyógyszerkutatás 2008. 105

Gyógyszerkutatás Hasonlóság és dverztás Gyógyszerkutatás 2008. 106

Gyógyszerkutatás Hasonlóság és dverztás Gyógyszerkutatás 2008. 107

Gyógyszerkutatás Hasonlóság és dverztás Gyógyszerkutatás 2008. 108

Gyógyszerkutatás Hasonlóság és dverztás Gyógyszerkutatás 2008. 109

Gyógyszerkutatás Hasonlóság és dverztás Gyógyszerkutatás 2008. 110

Gyógyszerkutatás A farmakofór defnícója Egy farmakofór olyan sztérkus és elektronkus tulajdonságok összessége, amely szükséges ahhoz, hogy teljesüljenek a bológa célszerkezettel való optmáls kölcsönhatás és a megfelelő válasz kváltásának ll. blokkolásának feltétele. A farmakofór nem képvsel egy valód molekulát, vagy funkcós csoportok meghatározott összességét, hanem egy tsztán absztrakt fogalom, hogy kfejezze vegyületek egy csoportjának a célszerkezethez való közös molekulárs kölcsönhatás képességét. A gyógyszerészet szakrodalomban s gyakran előfordul hbás fogalomhasználat, amkor funkcós csoportot, szerkezet motívumot, vagy közös szerkezet részletet neveznek farmakofórnak. Egy farmakofórt atomok, gyűrű központok, és vrtuáls pontok pozícóban defnált farmakofór leírók (pharmacophore descrptors) mnt H-kötés, hdrofób, ll. elektrosztatkus kölcsönhatás helyek segítségével adunk meg. C. G. Wermuth et al., Pure Appl. Chem. 70, 1129-1143 (1998) Gyógyszerkutatás 2008. 111

Gyógyszerkutatás Farmakofórok defnálása Gyógyszerkutatás 2008. 112

Gyógyszerkutatás Vrtuáls osztályozás (vrtual screenng) R. Lahana, Drug Dscovery Today 4, 447-448 (1999) A szkeptkus vegyész: Hány vezérszerkezetet (lead) találtunk kombnatorkus kéma és vrtuáls osztályozás (vrtual screenng) segítségével? Egyet sem! Hbás Ha egy tűt keresünk a szénakazalban, nem bztos, hogy a szénakazal méretének növelése a legjobb stratéga. Igaz A kombnatorkus kéma egyértelműen nem teljesítette a kora elvárásokat. Ez azt jelent, hogy elhbázott technológa? Vagy a probléma abban rejlk, ahogy eddg a technológát alkalmaztuk? Gyógyszerkutatás 2008. 119

Gyógyszerkutatás Vrtuáls osztályozás (vrtual screenng) A vrtuáls osztályozás csökkent a szénakazal méretét, hszen kválogatja a vegyületeket vagy könyvtárakat, melyek - vezérszerkezet-szerűek - gyógyszer-szerűek vagy - jó eséllyel célbajuttathatók vagy - hasonlóak mnt a vezérszerkezet szabályok alkalmazásával, mnt - Lpnsk célbajuttathatóság szabálya - deghálózatok (neural network) a gyógyszer-szerűséghez - farmakofór analízs - hasonlóság analízs - dokkolás és pontozás Gyógyszerkutatás 2008. 120

Gyógyszerkutatás Aknek enny rossz kevés, azt érje gá-áncs é-és meg-ve-tés. (Vegyészopera) vagy olvassa el Kubny előadásanyagát: http://www.kubny.de/lectures.html Gyógyszerkutatás 2008. 121