Genomikai Nemzeti Technológiai Platform (GNTP) Adatfeldolgozás, bioinformatika Munkacsoport STRATÉGIAI KUTATÁSI TERV Összeállította Barta Endre Patthy László 1
Tartalomjegyzék 1. Helyzetelemzés... 3 1.1. A Bioinformatika és adatfeldolgozás munkacsoport célja és működési területének meghatározása... 3 1.2. A genomikához vezető út a bioinformatikában... 4 1.3. A bioinformatika magyarországi története... 4 1.4. A bioinformatika mai helyzete Magyarországon... 6 1.5. A bioinformatika nemzetközi helyzete... 7 2. Jövőképe... 9 2.1. Felzárkózás és kitörés :... 12 2.2. Lassú víz... 13 2.3. Megszegett ígéretek... 14 2.4. Sodródás... 15 3. Stratégiai Kutatási Terv... 16 3.1. K+F területek és célok... 16 3.1.1. Orvosi genomika... 17 3.1.2. Mezőgazdasági biotechnológia... 18 3.1.3. Ipari biotechnológia... 20 3.2. Együttműködések... 22 3.4. Oktatás, tudásmenedzsment... 23 3.4. Kutatási infrastruktúra fejlesztése... 25 3.4.2. Megvásárolni a bioinformatikai genomikai szolgáltatásokat magyar vagy külföldi cégektől... 27 3.4.2. Genomikai csoport illetve kutatóintézeti szintű bioinformatikai infrastruktúra kiépítése 27 3.4.5. Központi magyar genomikai bioinformatikai infrastruktúra kiépítése... 28 3.4.5. Javaslat a Magyar ELIXIR pont létrehozására... 29 3.4.5. Javaslat a magyar genomikai bioinformatikai infrastruktúra és kutatások támogatására... 30 2
1. Helyzetelemzés 1.1. A Bioinformatika és adatfeldolgozás munkacsoport célja és működési területének meghatározása A Genomikai Nemzeti Technológiai Platform Bioinformatika és adatfeldolgozás munkacsoportja a genomikához kapcsolódóan elsősorban három területet vizsgál: 1. Mivel a genomika legnagyobbrészt a megszekvenált genomok vizsgálatán alapul, a hozzá kapcsolódó bioinformatika fő területe az elsődleges és a származtatott szekvencia információk elemzése. Ez magába fogalja: a. Az elsődleges szekvenálási adatok feldolgozását, a genomszekvencia összerakását. b. A genom annotációt, amely alatt nem csak a gének (kódoló, pszeudo, riboszomális és transzfer RNS, kis RNS, mikro-rns, nem-kódoló RNS stb. gének), genomra térképezését, hanem más tulajdonságok, mint például a repetitív szekvenciák, a DNS összetétel (például CpG szigetek) vagy éppen a kromatin szerkezet annotációját is. c. Az összehasonlító genomvizsgálatot, amely során különböző egyedekből, fajtákból vagy fajokból származó teljes vagy részleges genomszekvenciákat hasonlítanak össze és elemeznek. 2. A második fontos kihívás, a genom szintű vizsgálatok adatainak a számítógépes feldolgozása és elemzése. Ez tulajdonképpen a funkcionális genomika bioinformatikai támogatása. Jellemző, hogy ezekben az esetekben legtöbbször a vizsgált élőlény teljes genomszekvenciája ismert, ez teszi lehetővé a genom szintű vizsgálatokat. A legismertebb példa erre a mikroarray technika, amikor például egyszerre több, akár az összes gén expresszióját lehet vizsgálni. 3. Különálló területként említhetjük az előző két ponthoz kapcsolható, de inkább informatikai jellegű fejlesztéseket. Ezeket sokszor nem is biológusok, hanem például matematikusok, informatikusok végzik, és jellemző rájuk, hogy termékeiket nem csak a biológiában, hanem akár más tudományágakban vagy éppen a mindennapi életben is fel lehet használni. Az is előfordul, hogy más tudományágakban bevált algoritmusokat implementálnak bioinformatikai programokhoz. Jó példa erre például a mikroarray 3
feldolgozásban használt különféle klaszterező algoritmus, a genomillesztéshez használt módszerek vagy éppen a Google kereső algoritmusai, amelyek előbb-utóbb fel fognak bukkanni a genomikában is. Ezt a területet is két részre lehet bontani: a. A bioinformatikában használt programok, alkalmazások és az azok alapjául szolgáló algoritmusok fejlesztése. b. A bioinformatikai adatok tárolásához, megtekintéséhez, böngészéséhez és irányított elemzéséhez szükséges adatbázisok fejlesztése és fenntartása. 1.2. A genomikához vezető út a bioinformatikában A bioinformatikáról tulajdonképpen onnantól lehet beszélni, hogy először álltak a kutatók rendelkezésére szekvencia információk. Bár már az 50-es években meg tudták határozni kis peptideknek az aminosav sorrendjét, a bioinformatika robbanásszerű fejlődése, párhuzamosan a szekvenálási technológiák javulásával, a 70-es évekre tehető. Ebben az időszakban kezdték el a bioinformatikusok kidolgozni a szekvencia analízis legfontosabb algoritmusait, mint például a globális illesztést, a fehérjék kétdimenziós struktúrájának a meghatározását vagy a filogenetika alapmódszereit. A 80-as években a DNS szekvenálás térnyerése megindított egy folyamatot, amikor már szükség volt az adatok adatbázisba rendezésére, így kifejlődtek a legfontosabb és a mai napig is használt adatbázisok, mint az EMBL/GENBANK/DDBJ elsődleges DNS adatbázisok, a SWISSPROT/PIR fehérje adatbázisok, a PROSITE fehérjékre jellemző motívumokat, módosulásokat tartalmazó adatbázis, az EPD az eukarióta promóter adatbázis vagy a TRANSFAC, a transzkripciós faktor kötőhely adatbázis. A 90-es évek közepén azonban egy kisebb törést lehetett megfigyelni a bioinformatika fejlődésében, ugyanis kiderült, hogy nagyon nehéz az egyes gének szekvenciájának elemzésével általános következtetéseket levonni. A fellendülést a genom szekvenálások elindulása indította meg ismét, amit az utóbbi években elterjedt új generációs szekvenálási technológiák (Next Generation Sequencing, NGS) csak tovább fokoztak. 1.3. A bioinformatika magyarországi története A nyolcvanas évek végén elsősorban a szekvenálási technikák elterjedésével Magyarországon is szükségessé vált a szekvenciák számítógépes kezelése. Erre az időszakra tevődött az első személyi számítógépek behozatala is az országba. Ez fontos volt, mivel az addig főleg az egyetemek informatikai karain használt (szó szerint) nagy számítógépekre 4
nyugaton nem fejlesztettek bioinformatikai programokat, a COCOM listás számítógépek pedig nem voltak elérhetőek a kutatók számára. Az első PC-ket nyugatról hazatérő kutatók hozták be az országba, és ezzel együtt már néhány bioinformatikai program is bekerült az országba, így például a Cornell Egyetem híres nucaln és protaln programjai. Megindult a programfejlesztés is, a szegedi József Attila Tudományegyetem Genetika Tanszékén és az SzBK-ban is térképező és egyszerű szekvencia analizáló programokat fejlesztettek. 1990-ben megnyitották a gödöllői Mezőgazdasági Biotechnológiai Kutatóközpontot, ahol már egy akkor még COCOM-listás MicroVAX számítógép és a hozzá kapcsolódó PC terminálok szolgálták a kutatást. A kilencvenes évek végéig a fő szekvencia analizáló programcsomag a GCG volt, amit először Gödöllőn telepítettek a MicroVax szerverre, majd az SzBK Enzimológián és később a Debreceni Egyetemen is egy-egy SUN UNIX alapú szerverre telepítettek adatbázisokkal együtt. 1993-ban a gödöllői MBK hivatalosan csatlakozott az Európai Molekuláris Biológiai Hálózathoz (European Molecular Biology Network, EMBnet) mint magyar központ ( node ). Ezzel azt vállalta, hogy a GCG programcsomag liszenszét minden évben megvásárolja, az adatbázisokat napi alapon frissíti, és mindezeket ingyen elérhetővé teszi a magyar kutatók számára. Sok kutatónak abban az időben a gödöllői szerver jelentette az egyedüli e-mail levelezési lehetőséget is a szekvenciaanalízis mellett. Teljesen bioinformatikai jellegű kutatások az országban először az SzBK Enzimológiai Intézetében folytak, ahol Patthy László végzett úttörő munkát az extracelluláris fehérjék doménszerkezetének a felfedésével. Az MBK-ban Pongor Sándor köré gyűlt egy kisebb bioinformatikai csoport, azonban később közülük mindenki külföldre távozott Barta Endre kivételével, aki a gödöllői EMBnet központ vezetőjeként 1993-tól csak bioinformatikai kutatásokkal foglalkozott. 2000 után aztán több fontosabb, a genomikához konkrétan köthető, bioinformatikával is foglalkozó kutatócsoport is kialakult. Az SzBK Enzimológiai Intézetében a Patthy László vezette Funkcionális genomika csoport, az SzBK-ban a Pongor Sándor vezette Bioinformatika, a Debreceni Egyetemen az OEC Biokémiai és Molekuláris Biológiai Intézetében a Fésüs László és Nagy László által vezetett Apoptózis és genomika csoport, a Semmelweis Egyetemen a Falus András vezette Genetikai-, Sejt- és Immunológiai Intézet Orvosi Genomika Csoportja, valamint a martonvásári Mezőgazdasági Kutatóintézetben a Balázs Ervin vezette Alkalmazott genomikai osztály. Az ELTE-n Tóth Gábor és Miklós István is elkezdett több bioinformatikai projektet, de később Tóth Gábor az MBK-ba, Miklós István pedig a Rényi Intézetbe távozott. A Szegedi Tudományegyetemen a Biotechnológia Tanszéken kezdődtek elsősorban a baktériumgenomikához köthető bioinformatikai projektek. Gödöllőn az MBK-ban 2001-ben Patthy László segédletével megalakult egy Bioinformatikai csoport, 5
amelyet 2005-től Barta Endre vezetett, az intézet vezetése azonban 2008-ra teljesen leépítette, és meg is szüntette a csoportot. Fontos megemlíteni, hogy az SzBK-ban, a Semmelweis Egyetemen és a Debreceni Egyetemen is, elsősorban az előbb említett csoportokoz köthetően, több mikroarray, SNP és genomikai core facilitás kezdte el a működését. 1.4. A bioinformatika mai helyzete Magyarországon Az előbbiekből következően a bioinformatika mai magyarországi helyzetét jelentősen befolyásolta, hogy nem alakultak ki erős bioinformatikai csoportok Magyarországon, amit meg legnagyobbrészt azzal lehet magyarázni, hogy magyarországi csoportok nem csatlakoztak egyetlen nemzetközi genomikai (genom szekvenálási) projekthez sem, és az első magyar genom projektre is 2009-ig kellett várni. Bár több jelentős magyar bioinformatikai témájú publikáció is megjelent, igazából egyetlenegy pusztán genomikai bioinformatikával foglalkozó csoport sem tudott megerősödni Magyarországon. Ehelyett sok bioinformatikával foglalkozó kutató külföldön talált munkát, és több olyan kutató is van, aki az IT iparba távozott felhasználva a bioinformatika művelése során megtanult programozási, rendszerszervezési ismereteit. Mindezek ellenére az utóbbi egy-két évben talán elindult valami kedvező folyamat, amit a következőkkel lehet bizonyítani: 1. Az OTKA keretén belül önálló zsűrit kapott a bioinformatika 2007-ben, ami először tette lehetővé, hogy a kutatók bioinformatikai témájú pályázatokat eséllyel adjanak be. Sajnos azonban kiderült, hogy a zsűrihez inkább a bioinformatika algoritmus-fejlesztési területéhez, a proteomikához, a rendszer-szemléletű biológiához és más egzotikus teljesen interdiszciplináris bioinformatikai-biofizikai területekhez tartozó pályázatokat adtak be, genomikai témájúakat alig, és forráshiány miatt azok se nyertek. 2. Megalakult a Magyar Bioinformatikai Társaság, ami sikeresen összegyűjtötte a bioinformatikával foglalkozó magyar kutatókat, és konferenciák szervezésével fórumot teremtett nekik. 3. 2000 után meghonosodott a mikroarray technológia Magyarországon. Előbb Szegeden az SzBK-ban, majd a Semmelweis és a Debreceni Egyetemen, majd Gödöllőn az MBK-ban és Martonvásáron is elkezdtek mikroarray kísérleteket végezni különböző platformokon. A mikroarray eredmények kiértékelése pedig bioinformatikai módszereket kíván, tehát ezeken a helyeken a bioinformatika is erősödött. 4. A bioinformatika, genomika egyik fontos ága az adatbázisok készítése. A 2005-ös Nucleic Acids Research (NAR) adatbázis számában publikálták az első két teljesen magyar 6
fejlesztésű adatbázist (az SzBK Enzimológiáról a PDB-TM és az MBK-ból a DoOP adatbázis), majd később újabb nemzetközi jelentőségű magyar adatbázisokat publikáltak, mint például ugyancsak az Enzimológiáról a MisPred adatbázist. Az adatbázisok fejlesztéséhez genomikai, bioinformatikai módszereket kell használni, így ezek is fontosak a genomika magyarországi fejlődése szempontjából. 5. 2000 után több magyar kutatóintézetben is üzembe helyeztek második generációs kapilláris technológiát használó automata szekvenátorokat, ám a genomika szempontjából az igazi áttörés, hogy 2009-ben két cég is (a KPS és a Baygen) beszerzett egy-egy új generációs szekvenátort, ami kétség kívül hatalmas lökést ad a genomikai bioinformatika hazai fejlődésének. 6. Egészen 2009-ig a magyar genomika fejlődésének egyik jelentős hátráltatója az volt, hogy nem indult magyar genom projekt, és a magyar kutatók egyetlen egy külföldi genom programhoz se csatlakoztak, miközben nyilvánvaló, hogy amelyik csoport csatlakozott egy ilyenhez, ott a bioinformatika is hatalmas fejlődésnek indult. Ennek az az oka, hogy egy genom program gyakorlatilag két részből áll, egyrészt a klónozásból, a térképezésből és a szekvencia meghatározásából, másrészt a kapott szekvencia bioinformatikai feldolgozásából, ami magába foglalja a szekvencia összerakását, annotációját és az elemzését is. 2009-ben végre elindult az első magyar genom projekt, amelynek során egy a BIOMI Biotechnológiai Szolgáltató Kft. által vezetett konzorcium a magyar mangalica sertésfajta genomszekvenciájának a meghatározását tűzte ki többek között célul. A szekvenálást a két magyar új generációs szekvenátorral rendelkező cég végzi, a bioinformatikai feldolgozást pedig az azóta megszűnt MBK Bioinformatikai csoport és a magyar EMBnet node volt infrastruktúráján végzik. 1.5. A bioinformatika nemzetközi helyzete A 80-as években elsősorban az elsődleges adatbázisok fejlesztésével párhuzamosan kialakultak a nagyobb bioinformatikai központok. Európában az EMBL adatbázis fejlesztése Heidelbergben kezdődött az EMBL laboratóriumban, majd létrejött Cambridge mellett a hinxtoni Genome Campus területén az Európai Bioinformatikai Intézet (European Bioinformatics Institute, EBI). A SWISSPROT, a PROSITE és az EPD adatbázisokat a svájci Lausanne-ban fejlesztették előbb csoport szinten, majd megalakult a Svájci Bioinformatikai Intézet (Swiss Institute of Bioinformatics). Amerikában az egyes, a bioinformatika 7
fejlődésében jelentős szerepet játszó egyetemek mellett (Wisconsin-i Egyetem, UCSC stb.) a Washington melletti Bethesdában működő, a GENBANK adatbázist fejlesztő NCBI a legjelentősebb bioinformatikai központ. Kevésbé jelentős szerepe van Japánban a DDBJ adatbázissal kapcsolatban 1995-ben alapított Center for Information Biology and DNA Data Bank of Japan bioinformatikai központnak. A 90-es években Európában jelentős szerepe volt a bioinformatika fejlődésében az EMBnetnek. Segítségével országonként kialakult egy-egy bioinformatikai központ, ezzel az adott ország kutatói használhatták a helyi napi frissítésű bioinformatikai adatbázisokat és szekvencia elemző programokat. Az EMBnet ezen kívül jelentős szerepet vállalt a bioinformatika oktatásában elsősorban a már végzett kutatók számára. A 90-es évek végétől az jellemző, hogy a bioinformatika terén azok az intézetek/kutatóhelyek illetve csoportok tudtak jelentősen fejlődni, amelyek csatlakoztak egy-egy genom projekthez. Jellemző az is, hogy mivel a szekvenálás költségei nagyon magasak voltak, azok a csoportok/intézetek tudtak csatlakozni ilyen projektekhez, amelyek erre célzott állami támogatást kaptak. Legjobb példa erre az angol Sanger Intézet, vagy az ugyancsak a humán genom programban (is) részvevő francia Genoscope. Nemzeti szintű és finanszírozású genom projektre jó példa a szőlő genomszekvenciájának a meghatározása, amelyet Olaszország és Franciaország állami szinten támogatott. Több esetben a szekvenálás szélesebb nemzetközi együttműködésben valósult meg, amire jó példa a burgonya és a paradicsom szekvenálása, ahol az egyes kromoszómákat osztották el különböző csoportok között. Fontos megjegyezni, hogy ezekben a genom projektekben nem, vagy csak nagyon elvétve találhatóak kelet-európai csoportok, amiből következően ezen országok a bioinformatika és a genomika területén is jelentős hátrányba kerültek. Ezt bizonyítja az oktatás helyzete is, hiszen míg például a nyugat-európai országokban mindenhol a jelentősebb egyetemek indítanak egyetemi és PhD bioinformatikai szakokat, kurzusokat, addig a kelet-európai országokban (és így Magyarországon is) egyszerűen nincs annyi bioinformatikával/genomikával foglalkozó kutató, akikre ilyeneket alapozni lehetne. 8
2. Jövőképe A következő jövőképek a magyar bioinformatika fejlődési lehetőségeit vázolják fel, a fejlődés legfontosabb elemeit, feltételeit szem előtt tartva. A jövőképeket az alábbi mátrix celláiként jeleníthetjük meg legtömörebben, ahol a mátrix sorai az ország által követett stratégiát vagy annak hiányát jelzik, az oszlopok pedig azt a kiemelt fontosságúnak értékelt dimenziót, hogy a felhasználók elutasítóan vagy támogatóan fogadják a bioinformatikai vívmányokat. Fontos hangsúlyoznunk, hogy a stratégia dimenzió nem önmagában a stratégia meglétére vonatkozik, hanem annak megvalósítására, megvalósulására. Egy érdemi változásokat megcélzó, megalapozott és hatásos stratégia kidolgozásának és megvalósításának jelentőségét számos külföldi példa mutatja. Gondolhatunk például az USA (NCBI), Európa (EMBL-EBI) stratégiáira, ahol világos célokat kitűzve dolgoztak ki központi programokat, fejlesztési terveket (pl. az európai ELIXIR program). Ezeknek a programoknak a hatása elsősorban hosszú távon érvényesül, tényleges gyakorlati hasznosításukra a biotechnológiai, gyógyszeripari, egészségügyi alkalmazásokban kerül sor. Nincs stratégia, vagy nem valósul meg Gyenge vagy átlagos társadalmi elfogadottság Sodródás A bioinformatika hazai fejlődése a jelenlegi szinthez képest is visszaesik. Külföldi innovatív termékek fogyasztása. Alul- és dezinformált társadalom negatív attitűddel. Romló kutatói, oktató kilátások, csökkenő Optimális társadalmi támogatottság Megszegett ígéretek Koordinálatlan fejlődés a K+F, innovációs törekvések, orvosi, üzleti alkalmazások területén. Csökkenő kihasználtságú bioinformatikai infrastrukturális kapacitások. Az ipar számára érdektelen akadémiai K+F tevékenység. 9
színvonalú élettudományos közép- és felsőfokú oktatás. Külföldi innovatív termékek fogyasztása. A kutatók és a társadalom közötti párbeszéd ad hoc jellegű, szervezetlen. Aktív, megvalósuló stratégia lassú víz Lassú fejlődés, azaz a nemzetközi lemaradás tartósul. A kutatási eredmények a nemzetközi trendeknél lassabban kerülnek át a gyakorlatba. A felhasználók elégtelen, nem meggyőző informálása. felzárkózás és kitörés Gyors felzárkózás a nemzetközi élvonalhoz; egyes területeken (pl. IT, gyógyszeripar) kitörési lehetőségeket nyújtó fejlesztések bevezetése. Aktív és szervezett párbeszéd folyik a kutatók és felhasználók között. A bioinformatika fejlődési lehetőségeinek tekintetében Magyarországon meghatározónak tekintjük a felhasználók (biotechnológia, gyógyszeripar és egészségipar) általi támogatottság mértékét. A támogatottság szintjének növeléséhez a bioinformatikusok és a felhasználók közötti intenzívebb párbeszéd szükséges. Ennek a törekvésnek a sikere nagymértékben függ attól, hogy sikerül-e átfogó, jól megalapozott, meggyőző fejlesztési stratégiát kidolgozni és végrehajtani. 10
A Bioinformatika hajtóerői fontossági sorrendben: 1. A genom megismerésének igénye: a. tudományos megismerés (különböző élőlények köztük kiemelt fontossággal az ember genomjának megismerése), b. a személyes emberi genom megismerésének igénye. 2. A felhasználók általi elfogadottság. 3. Társadalmi és gazdasági igények: magas hozzáadott értéket képviselő, bioinformatikai eszközök felhasználásával kifejleszthető termékek iránti kereslet: a. Orvosi alkalmazások (költséghatékony gyógyszerek és a személyre szabott orvoslás társadalmi szinten történő hasznosítása, a genomikán alapuló diagnosztika és terápia finanszírozása az egészségbiztosítási rendszerben); b. Gyógyszeripar, biotechnológia (bioinformatikai eszközök felhasználásával történő fejlesztés); c. Mezőgazdaság (növénynemesítés, állatnemesítés, élelmiszerek molekuláris ellenőrzése, diagnosztika, személyre szabott táplálkozás); d. Környezetvédelem; e. Kommersz genomika (ténylegesen nem használható eredményeket nyújtó, mégis eladható alkalmazások). 4. Tudományos és technológiai fejlődés, ezen belül is kiemelten az IT fejlődés (adatok értelmezése, illetve felhasználóbaráttá történő alakítása szoftverfejlesztés). 5. Igazodás a nemzetközi trendekhez (amerikai és EU trendek). 6. K+F irányváltás, nemzeti K+F stratégia részévé válik a genomika. 7. Fenntartható fejlődés (agrár-, élelmiszeripar és környezetvédelem). 11
2.1. Felzárkózás és kitörés : A jövőkép összefoglalása: A bioinformatika folyamatosan fejlődik, nemcsak követő, hanem úttörő kutatás-fejlesztés is folyik Magyarországon, a bioinformatika fontos társadalmi és gazdasági igények kielégítéséhez járul hozzá. A felhasználók igénylik a bioinformatikai K+F és innováció támogatását, és követelik az eredmények alkalmazását. A bioinformatika az élet- és orvostudományok integráns részévé válik, az oktatás gyorsan továbbadja a kutatási eredményeket. A jövőkép fő jellemzője, hogy a bioinformatikához pozitívan viszonyul a társadalom és a szakmai közvélemény is, a területet a progresszió letéteményesének tekintik. Ez megjelenik a bioinformatika KFI tevékenységek állami és vállalati finanszírozásában is. Így a legfontosabb hajtóerők a megismerési vágy mellett a magas szintű társadalmi elfogadottság és az anyagi támogatás. A legfontosabb keretfeltételek tehát mind optimálisak. Az alapkutatás magas színvonalú, nemzetközileg is versenyképes csoportok működnek a hazai egyetemeken és kutatóintézetekben, egymással hatékonyan együttműködve, sikeres hálózatokat képezve. Anyagilag jól ellátottak (pl. egy Nemzeti Bioinformatikai Program keretében célzott támogatásokban részesülnek). A munkát jól szervezett központ segíti, mely az ELIXIR program eredményeként létrejövő hálózat magyar nemzeti központjának szerepét tölti be. A nemzetközileg versenyképes alapkutatások jelentős külső kapcsolatokat, együttműködéseket eredményeznek, és jelentős külföldi, döntően EU-támogatásokat is hoznak. A bioinformatikai megközelítéseket használó és azon alapuló kutatások vonzóak a fiatal kutatók számára: ezért számos fiatal kutató kezd ilyen témájú kutatást, illetve jelentős a verseny a bioinformatikát művelő kutatócsoportokba való bejutásért. Az alapkutatást végző munkacsoportok eredményei spin-off és start-up cégek alapításához vezetnek. A bioinformatikai célú és alapú alkalmazott kutatás is fejlett. Ez egyrészt az alapkutatást is végző kutatócsoportok számára adott ipari megrendelésekből adódik, másrészt 12
az alkalmazott kutatást művelő kis- és közepes méretű cégek (pl. biotech vállalkozások) és a gyógyszergyárak együttműködésén alapul. Az alkalmazott kutatást végző cégek összehangolják, egyeztetik a nagy értékű infrastruktúrák felállítását és működtetését célzó erőfeszítéseiket. Jelentős, az európai rendszerekhez (vö. ELIXIR program) szorosan kapcsolódó bioinformatikai hálózat épül ki. A hazai gyógyszeripar, biotechnológia nagymértékben támaszkodik a hazai K+F infrastruktúrára, és sok szálon működik együtt a kutatóhelyekkel és KKV-kel. Hazai és külföldi cégek KKV-k által előállított szellemi termékeket, vagy sikeres, K+F-re szakosodott cégeket vásárolnak. Külföldi befektetőket is vonzanak a magyar bioinformatikai cégek. Különösen jelentős az információtechnológia beépülése a bioinformatikai alkalmazott kutatásokba. Az IT ipar önálló fejlesztései is segítik a bioinformatikai K+F-t. A bioinformatika mint módszer és szemlélet interdiszciplináris módon hatja át a magyar élet- és információs tudományt. Különösen jelentős az orvostudományt, gyógyszerfejlesztést érintő fejlődés. A fentiek alapja egy jól kimunkált nemzeti bioinformatikai fejlesztési stratégia megvalósítása, ami összehangolja az infrastruktúra-fejlesztést is, s ezzel megelőzi a szellemi és pénzügyi erőforrások szétforgácsolódását, a pazarlást. 2.2. Lassú víz A jövőkép összefoglalása: Bár a bioinformatika fejlődése elindul, hamar megtorpan, így annak ellenére, hogy nemcsak követő, hanem úttörő kutatások és fejlesztések is elindulnak, a bioinformatika nem tud jelentős mértékben hozzájárulni a társadalmi-gazdasági fejlődéshez. A felhasználók az egyes bioinformatikai alkalmazások alapos megismerése elől elzárkóznak, azokkal szemben elhamarkodottan, megalapozatlanul, negatív előítéletek által befolyásolva alakítanak ki véleményt. 13
A kidolgozott stratégia érvrendszerének felhasználásával sikerül meggyőzni a vállalati és tudománypolitikai döntéshozókat, hogy érdemes invesztálni bioinformatikai KFI-be, azonban ezeknek a ráfordításoknak az aránya csökkenő tendenciájúvá válik, mivel mind az ipari, mind az állami támogatások újraértékelése a kiadások más területekre történő átcsoportosításához vezet. Stagnál a bioinformatikai termékek, szolgáltatások felhasználása, nem hatja át a bioinformatikai szemlélet az egészségügy, az ipari ágazatok és a környezetvédelem fejlődési koncepcióit. Így a bioinformatika végső soron nem gyakorol semmilyen érzékelhető befolyást a társadalomra. Ezen a ponton a jövőkép kettéválik és valamelyik szomszédos jövőkép felé indul meg a további változás. A pesszimista változat szerint a negatív hatások tovább erősödnek, a stratégia fokozatosan elhalványodik, súlytalanná válik, ezért Magyarország a korábbi anyagi és szellemi befektetések ellenére a sodródás állapotába kerül. Az optimista változat szerint a bioinformatika meghatározó szereplői folyamatosan, szisztematikusan, közérthetően és meggyőzően tájékoztatják a társadalmat, hatékony párbeszédet alakítanak ki, és ennek eredményeként sikerül a társadalom negatív attitűdjét pozitívvá alakítani. Bár jelentős időveszteséggel, de végső soron Magyarország eléri az optimális jövőképben felvázolt állapotot. 2.3. Megszegett ígéretek A jövőkép összefoglalása: A társadalom igényli és követeli a bioinformatika elismerését és alkalmazását, megjelennek a bioinformatikához kapcsolódó állami és vállalati források. A bioinformatika ennek ellenére nem tud az élet- és orvostudományok integráns részévé válni, és az eredményeket sem terjeszti a szükséges széles körben az oktatási rendszer. Így a bioinformatika nem válhat a magyar KFI rendszer meghatározó elemévé: a Magyarországon folyó bioinformatikai KFI tevékenységek szétaprózódnak, az infrastrukturális beruházásokat nem hangolják össze, sok a párhuzamosan, alacsony kihasználtsággal működtetett K+F kapacitás, és nincs hatékony együttműködés az ipari és kutatói szféra között sem. Mivel a társadalom éhes a bioinformatika új eredményeire, de ezzel párhuzamosan nem nő a belső kínálat, Magyarország a bioinformatikai technológiák vásárlójává válik, alapvetően a 14
külföldi alkalmazások lesznek elérhetőek. Társadalmi nyomás hatására ugyan elindulnak államilag támogatott kutatási programok, de a hazai intézmények érdekellentétei lelassítják, vagy rosszabb esetben eleve kudarcra ítélik ezen programok megvalósulását. 2.4. Sodródás A jövőkép összefoglalása: Tartalmazza mind a megszegett ígéretek mind a lassú víz jövőképek negatívumait, azok negatív szinergiájában. Nagyon sötét jövőkép! A hazai sajátosságokat figyelmen kívül hagyó importált igények kielégítésére importált alkalmazások jelennek meg Magyarországon. Az alul- és dezinformált társadalom nem nyitott a bioinformatika eredményeire, célzott állami támogatás nem is jelenik meg sem az ipari ágazatok, sem az egészségügy területén. Nincs stratégia, azaz nincsenek elemzések, elképzelések, korszerűsítési törekvések. Gyógyszer- és biotech cégeknél illetve egyetemi, akadémiai bázisokon ugyan folynak kutatások, de ezek leginkább egymástól függetlenül történnek, egymás igényeit és lehetőségeit nem veszik figyelembe, leginkább külföldi megrendelők beszállítóiként dolgoznak a magyar kutatók. Vannak közös fejlesztések is, de azok finanszírozására nincs célzottan elérhető támogatás. A kedvezőtlen körülmények ellenére létrehozott piacképes termékek értékesítése sem itthon történik, a magyar piacra már csak elavulása után, külföldről jutnak vissza ezek a termékek. Végső soron a társadalom kutatásellenes attitűdje olyan szintre jut, hogy Magyarországon még az alapkutatás is szinte lehetetlenné válik. Ez az élettudományi oktatók és kutatók kivándorlásához vezet, ami viszont a természettudományos képzés további romlását eredményezi. 15
3. Stratégiai Kutatási Terv 3.1. K+F területek és célok Ha a genomika történetét nézzük, nyilvánvaló, hogy a szekvenálandó fajok kiválasztásánál két fő szempont volt. Az egyik a hasznosíthatóság, tehát olyan új tudományos ismeretek szerzése, amelyekkel vagy a gyógyításban vagy a mezőgazdaságban vagy a biotechnológiában olyan terméket lehet fejleszteni, amely hasznot hoz. A másik, ugyancsak nem elhanyagolható és az előzővel azért összefüggő szempont, a tudományos megismerés igénye, az, hogy például nyomon tudjuk követni az evolúciós folyamatokat a genom szintjén. Erre jó példa a gerinces fajok szekvenálása, hiszen miután a legfontosabb célt, a humán és a fontosabb genetikai modellállatok genomszekvenciáját meghatározták, elkezdték egyrészt a mezőgazdaságilag fontos fajok (szarvasmarha, csirke, sertés, juh, ló, kutya), másrészt az evolúciósan érdekes fajok (például a kacsacsőrű emlős, a Monodelphis domestica, a karmosbéka stb.) szekvenálását is. Jól nyomon követhető cél, hogy az evolúciós fa minden ágáról legyen olyan faj, amelynek meghatározzák a szekvenciáját. Ma már nincsenek nagyobb lyukak a fán, ezért a legjellemzőbb, hogy elkezdték több, már ismert genomszekvenciájú faj újraszekvenálását is. Emellett nekiláttak egyes nagyobb genomú, eddig megszekvenálhatatlannak tartott fajok szekvenálásának (például a búza), valamint elkezdték a kisebb gazdasági jelentőségű mezőgazdasági fajok valamint egyes fontos mezőgazdasági fajok változatainak a szekvenálását is. Az új generációs szekvenálási módszerekkel történő genom szekvenálás lehetővé teszi, hogy pontosabb legyen a szekvencia, hogy feltérképezzék a genom változatosságait (SNP-k CNV-k), valamint hogy nagyobb genomok szekvenciáját is meghatározzák. 16
3.1.1. Orvosi genomika A genomika egyik legfontosabb felhasználási területe a gyógyászati kutatás. Természetesen ebben nem csak a humán genom szekvenciáját használják, hanem más, rendszertanilag akár távol lévő fajok szekvenciáit is. A gyógyászat területén a következő területeken lenne szükséges bioinformatikával megerősített kutatás-fejlesztés: Egyes, különböző betegségekben szerepet játszó gének vizsgálata klasszikus genomikai módszerekkel. Ebbe elsősorban a transzkriptomikai módszerek tartoznak, így mikroarray vizsgálatok, valamint az egyes gének expressziója szabályozásának a kutatása a promóter régió bioinformatikai és kísérleti elemzésével. Fontos szerepe lehet ezekben a vizsgálatokban az összehasonlító genomikai módszerek széles körű felhasználásának is. Egyes betegségek genetikai okainak a felderítése SNP genotipizálással (teljes genom asszociációs vizsgálatok, GWA). Jelenleg ez a leggyorsabban fejlődő gyógyászati kutatási terület, eredményeit a legrangosabb újságokban publikálják, ugyanakkor sajnálatos módon Magyarországon csak egy-két példát látunk rá. A hagyományos magyar klinikai gyógyászat fejlettsége, a biobankok létrejötte lehetővé tenné, hogy több, a magyar lakosságot súlyosan érintő betegséget (például a szívinfarktus, a különböző rosszindulatú daganatok, cukorbetegség, elhízás stb.) is elkezdjünk vizsgálni ilyen módszerrel. Ehhez nagyon fontos lenne a megfelelő kutatási infrastruktúra megteremtése is (lásd később). Az ilyen típusú vizsgálatok eredményeképp pedig újabb célgének kerülhetnének a látókörünkbe, amelyeket aztán az első pontban részletezett módszerekkel lehetne vizsgálni. Daganatos betegségek okainak, következményeinek a kutatása a még egészséges és a beteg szövetek teljes genomszekvenciájának az összehasonlításával. Várhatóan egy-két éven belül ezer dollár alá süllyed egy teljes humán genom megszekvenálásának a költsége. Ez új távlatokat fog megnyitni a gyógyászati kutatásokban, amire fontos lenne időben felkészülni. Ma már nem tudományos fikció, hogy a korházba bekerült betegnek nem csak a vérképét, a cukor-, zsír-, hormon- vagy különböző enzimszintjeit mérik meg, hanem meghatározzák a genomszekvenciáját is, és ha szükséges, meghatározzák a rokonai vagy akár egy biobankból elővett mintából a már elhunyt felmenői genomszekvenciáját is. Ennek nemcsak diagnosztikai 17
jelentősége lehet, hanem nagyban segítheti az adott betegség gyógyítását célzó kutatást is azzal, hogy a betegség okairól, kialakulásának a mechanizmusáról pontosabb képet kaphatunk. Az orvosi diagnosztika területét is forradalmasíthatja a közeljövőben a genomika. Nemcsak a fent említett teljes genom szekvenálás révén, hanem annál jóval olcsóbb és egyszerűbb, szekvencián alapuló diagnosztikai kitek tömkelegét fogják a közeljövőben kidolgozni. A bioinformatika feladata ebben többek közt az lesz, hogy folyamatosan (az újabb és újabb szekvencia adatok figyelembe vételével) frissítse és ellenőrizze a használt módszereket, és újabb, jobb markereket javasoljon. A személyre szabott orvoslás területén is jelentős kutatás-fejlesztési erőfeszítések várhatóak a közeljövőben. Ismert, hogy az emberek genetikai hátterüktől függően másként reagálhatnak egyes gyógyszerekre. A jövő orvostudományának az egyik legjelentősebb kihívása, hogy mindenkinek a megfelelő gyógyszereket tudja ajánlani. Az orvosi metagenomika területén is jelentős fejlesztések várhatóak, ugyanis a közelmúlt genomikai kutatási eredményei szerint jelentős szerepe lehet például az elhízásban a bél baktériumflórájának, vagy a bőr, a nyálkahártyák egészségét is jelentősen befolyásolják a rajtuk élő baktériumok, és nem csak genetikai anyagunkban, de a bennünk illetve rajtunk élő mikroorganizmusok mennyiségében, összetételében is jelentősen különbözünk egymástól. 3.1.2. Mezőgazdasági biotechnológia Míg a 2000-es évek elején a genomika fő érdeklődési területe a humán genom, valamint a fontosabb modellszervezetek genom szekvenciájának a meghatározása volt, az utóbbi években egyre nagyobb hangsúlyt kapott a mezőgazdaságilag fontos állatok és növények szekvenálása. Ebben szerepet játszott az is, hogy mára világossá vált, hogy a 90-es évek nagy mezőgazdasági vívmánya, a génmódosított növények és állatok kifejlesztése nem tudja megváltani a világot. Egyrészt nem annyival jobb és olcsóbb, mint sokan gondolták, másrészt jelentős társadalmi ellenállás is kibontakozott a használatuk ellen. Ez az ellenérzés különösen erős Magyarországon is, ezért fontos, hogy alternatív, modern módszereket találjunk a növény- és állatnemesítésre. A genomika erre kiválóan alkalmas, ahogy azt már sok komolyabb mezőgazdasági kutatásokat folytató országban felismerték. Ez azt jelenti, hogy állami szinten elkezdték a mezőgazdaságilag fontos fajok (rizs, kukorica, búza, marha, sertés, juh stb.) 18
genomjainak a szekvenálását, valamint kiemelten támogatták, támogatják a genomikán alapuló növény- és állatnemesítést. A genom szekvenálás fő előnyei a nemesítésben: Átfogó ismeretet ad a géntartalomról és a genom felépítéséről, ezáltal segít megérteni például a nemesítés során bekövetkezett evolúciós folyamatokat, vagy például a heterózis hatást. A genetikai és a genom szekvencia adatok összevetésével meg lehet keresni azokat a kulcsgéneket, amelyek a nemesítés szempontjából fontosak. A Marker Asszisztált Szelekcióhoz (MAS) markereket lehet keresni. Olyan SNP-ket lehet keresni, amelyek fontosak lehetnek egyes jellegekben való eltérésben, így célzottan ezekre lehet szelektálni. Az egyes, a nemesítés szempontjából fontos jelleget (pl. rezisztencia vagy szárazságtűrés) hordozó fajták, fajok megszekvenálásával könnyen meg lehet találni az ezeket a jellegeket hordozó géneket. Ezek alapján a mezőgazdasági biotechnológia területén a következő területeken célszerű genomikai kutatás-fejlesztési projekteket indítani: Marker asszisztált szelekció (Marker Assisted Selection, MAS). Ez tulajdonképpen egy felgyorsított nemesítés, amelynek a hagyományos formája rendkívül időigényes, ugyanakkor ezt a genomikai módszerek alkalmazásával jelentősen fel lehet gyorsítani. A módszer nagy előnye, hogy GMO-mentes fajtákat lehet kinemesíteni, tehát a társadalmi elfogadottsága is sokkal pozitívabb lehet. A genomika két szinten segíthet, egyrészt a már megszekvenált fajoknál a kísérletek megtervezése, a markerek keresése és vizsgálata, valamint a célgének nyomon követése sokkal egyszerűbb, másrészt előbb-utóbb elérhetővé válik az a megoldás is, hogy a markereknek az utódnemzedékekben a fáradságos hagyományos (például PCR) úton történő tesztelése helyett egyszerűen megszekvenáljuk ezeket az egyedeket. Ugyancsak jelentős előny, hogy lehetővé válik az egyes jellegek már embriókorban történő vizsgálata, amivel például egy húsmarha esetén éveket lehet megspórolni. A magyar mezőgazdaságban használt fajok közül ismert a szekvenciája az állatok közül a marhának, a sertésnek, a juhnak, a csirkének, és rövidesen várható a pulyka genom szekvenciája is. A növények közül ismert a rizs, a kukorica, a dohány, a repce, a burgonya és a paradicsom szekvenciája, és rövidesen várható a búza és a lucerna teljes genom szekvenciája. Mezőgazdaságilag fontos fajok, fajták szekvenálása. Az új generációs szekvenálási technológia ma már lehetővé teszi, hogy egy-egy nagyobb (néhány százmillió) forintos 19
pályázat keretében, egy teljesen új faj vagy fajta teljes genom szekvenciáját is meghatározzuk (2009-es adat, ugyanakkor a szekvenálás költségei rohamosan csökkennek). Ennek nemcsak a mezőgazdaság, hanem a biodiverzitás megőrzése, megismerése tekintetében is fontos szerepe lehet. Természetesen magától értetődik, hogy Magyarországnak e tekintetben az egyik legfontosabb feladata, hogy az őshonos és jellemző magyar fajtákat sorolja előre. Nagyon jó példa erre a már említett MANGFOOD konzorcium, akik többek közt elhatározták, hogy megszekvenálják a mangalica sertés genomját. Az elsőként szóba jöhető fajok az állatoknál a már említett mangalica mellett a magyar szürkemarha, a rackajuh, a világbajnok trófeákat adó szarvas, egyes pontyfélék vagy a jellegzetes magyar kutyafajták. A növényeknél a legfontosabb célnövény valamelyik magyar fűszerpaprika fajta lehet, valamint a különböző kiváló magyar gyümölcsfajták. Eredetiségvédelem. A már említett MANGFOOD konzorcium fő célkitűzése, hogy egy egyszerű teszttel ellenőrizni lehessen a mangalica hústermékek eredetiségét. Ez nagyon fontos, és jövőben egyre jobban elterjedő módszer lesz az élelmiszer minőségellenőrzésben és az élelmiszerhamisítások elleni védelemben. Az eredetiségvizsgálat fontos lehet például a védett állatok (pl. a kerecsensólyom) vagy állatpopulációk (pl. a gemenci szarvas állomány) védelmében is. 3.1.3. Ipari biotechnológia A mikroorganizmusok használata az ipari biotechnológiában már régóta elfogadott és használt módszer. Ezen a területen az is teljesen elfogadott, hogy sokszor genetikailag módosított baktériumokat használnak különféle célokra. Természetesen a kilencvenes évek közepétől egymás után kezdték el megszekvenálni a különféle, az ipari biotechnológiában használt baktériumoknak a genomjait is. Ez természetesen ma is gőzerővel folyik, százával határozzák meg az iparilag fontos mikroorganizmusok (baktériumok, gombák, algák) genomszekvenciáját. Ez nagy lehetőséget ad a genomok elemzésére, az ipari biotechnológiai folyamatokban fontos kulcsgének megkeresésére, módosítására. Az utóbbi évek újdonsága a metagenomika, amikor is kevert tenyészeteknél, mintáknál határozzák meg a különböző hosszúságú DNS daraboknak a szekvenciáját, majd megpróbálják ezeket összerakni (ami természetesen nagy bioinformatikai kihívást jelent) és annotálni. A cél, amellett hogy a biodiverzitásról kapunk nagyon értékes információkat, az, hogy olyan új enzimeket, folyamatokat találjunk, amelyek aztán felhasználhatóak az ipar, a mezőgazdaság vagy éppen a 20