Van-e élet a genetikai sivatagokban - az emberi genom első analízisének vázlatos eredményei

Mint arról korábban beszámoltunk, az emberi genetikai állomány feltérképezését párhuzamosan végző két nemzetközi kutatócsoport, az állami forrásokból finanszírozott Humán Genom Projekt és a Celera Genomics nevű biotechnológiai óriás 2001 februárjának közepén nyilvánosságra hozta eddigi eredményeit a világ két legrangosabb tudományos fórumán, a Nature, illetve a Science folyóiratokban. A genetikai állomány bázissorrendjének (szekvenciájának) részleges közlése mellett - amelynek elkészültét egyébként már 2000 júniusában bejelentették - napvilágot láttak az eredmények első analízisei is: a két kutatócsoport megkezdte a feltérképezett mintegy 3 milliárd betűből (szerves bázisból) álló adattömeg "kiolvasását".

Meglepően kevés gén - a fehérjék szerepe felértékelődik

A korábbi becslésekkel szemben, amelyek 80-140 ezer emberi gént tételeztek fel, az első analízisek során kiderült, hogy ennél jóval kevesebb lehet a számuk: mindössze 26-40 ezer. Összehasonlításképpen: a genetikailag már feltérképezett ecetmuslicának (Drosophila melanogaster) 13 ezer, a Caenorhabditis elegans nevű fonálféregnek pedig 18 ezer génje van. Ám már ebből a két példából is sejthető, hogy a gének száma és a szervezet komplexitása között nincs közvetlen összefüggés (lévén egy rovar összetettebb szervezet egy féregnél).

Egy ilyen durva becslés - több mint tízezres hibahatárral - nem tűnik nagy teljesítménynek, de ne felejtsük el, hogy a gének keresése a mára feltérképezett teljes genetikai állományban (genomban) még csak most kezdődik igazán (ezért lehet félrevezető a számos forrásban olvasható, "elkészült az emberi géntérkép" kifejezés). A géneket egyébként is igen nehéz megtalálni: információt hordozó részeik a teljes genetikai állománynak mindössze 1-1,5%-át teszik ki. Az információt hordozó szakaszokat (az ún. exonokat) ráadásul nem kódoló szakaszok (ún. intronok) szakítják meg. Csak a gén RNS-molekulára történő átírása során kapcsolódik egységgé az exonokra tagolt információ.

A gének azonosítását tehát valahogy úgy kell elképzelnünk, mintha egy kb. 3 milliárd betűből álló tagolatlan szövegben keresnénk értelmes mondatokat (ez lenne a gén), az egyes mondatok szavai azonban nem közvetlenül egymás mellett állnak. Ráadásul a szöveg mindössze négyféle betűt (A, T, C, G - a DNS-ben szereplő szerves bázisok kezdőbetűje) tartalmaz, s ezek megfelelő kombinációja alapján kell egy mondatra (vagyis génre) következtetnünk.

A gének kis száma komoly problémát vet fel: hogyan határozhatja meg ilyen kevés gén tulajdonságainkat, a szervezetünket felépítő fehérjemolekulák összességét? Craig Venter, a Celera vezető tudósa szerint a gének kis száma azt jelenti, hogy nem minden tulajdonságért a gének felelősek, hanem ezek egy része már a fehérjemolekulák, illetve a sejtfolyamatok szintjén határozódik meg. Az emberi fehérjék szerkezete egyébként is sokkal bonyolultabb, mint például a fent említett két fajé, ami valóban lehetővé teheti egyes tulajdonságok ilyen szinten való kifejeződését.

Azt már korábban is tudtuk, hogy a gének egy része több különböző típusú fehérje (polipeptid) szerkezetét képes meghatározni. Egy adott génről ugyanis több különböző típusú fehérje felépítéséhez szükséges információ képes másolódni az úgynevezett transzkripció (átírás) során, amikor a DNS információtartalma a hírvivő RNS molekulára (mRNS) kerül át. Ez az "alternatív összekapcsolódás" (alternatív splicing) módszerével valósul meg, amelynek során egy ős-mRNS molekula darabjai több kombinációban is összeállhatnak. Példánknál maradva: a mondat (vagyis a gén) egyes szavait (exonok) több sorrendben is összerakhatjuk, s ez esetben az információtartalom is eltérő lesz. Becslések szerint - amennyiben csakugyan ilyen kevés gén van - legalább a gének egyharmada alkalmazza ezt a "trükköt".

Baktériuminvázió, "genetikai sivatagok" és "szemét-DNS"

Az első vizsgálatok további meglepő eredményeket hoztak. Kiderült, hogy több mint 200 gén baktériumokból kerülhetett át az emberi genetikai állományba, néhány millió évvel ezelőtt. Nem csupán stabilan beépültek a genomba, de közülük egyesek fontos funkciókat is magukra vállaltak, például a szervezet stresszhelyzetben történő szabályozásában. A felfedezés azért különösen meglepő, mert eddig nem feltételeztek ilyen irányú génáramlást gerincesek esetében.

Igen sajátosnak bizonyult a genom általános szerkezete is: a gének eloszlása a vártnál is kevésbé egyenletes. Génekben igen gazdag, és információt alig, vagy egyáltalán nem tartalmazó hatalmas szakaszok (több millió bázis hosszúságú "genetikai sivatagok") váltakoznak egymással. Az egyenlőtlen géneloszlása a kromoszómák között is feltűnő: a legnagyobb génsűrűség a 17, 19, 22-es kromoszómákon tapasztalható, míg a 4, 13, 18-as és az ivari kromoszómák (X és Y) génekben viszonylag szegények (a 19-es kromoszómán például négyszer annyi gén van, mint az ivari Y-kromoszómán).

Az emberi genetikai állomány mintegy harmada-fele úgynevezett ismétlődő szekvenciákból áll, amelyet "szemét-DNS"-nek is neveznek, mivel legnagyobb részének egyelőre nem ismerjük a funkcióját. Egyes elképzelések szerint szerepük lehet a rekombinációs gyakoriság meghatározásában, hiszen minél távolabb van két gén egymástól, annál gyakrabban lehet kitéve rekombinációnak (vagyis az apai és anyai kromoszómák közötti géncserének a sejtosztódás során). Igen valószínű - főleg ilyen kis génmennyiség mellett -, hogy a "szemét-DNS" szerepe a jövőben igen "felértékelődik", vagyis egyre több fontos funkciója válik világossá számunkra. Önmagában az a tény is jelezheti fontosságát, hogy a sejtek rengeteg anyagot és energiát fordítanak sok millió molekulájának másolására a sejtosztódás során.

Az ember esetében az ismétlődő szekvenciák zöme ún. transzpozonok működésének eredménye lehet: ezek olyan mozgó genetikai elemek, amelyek bárhová képesek magukat beszúrni és lemásolni. Az új eredmények egyébként arra utalnak, hogy a transzpozonok zömének "kalandozása" mára az emberben - legalábbis egyelőre - véget ért, s csak "kövületeik" maradtak fenn a genomban. Mivel mintegy 50 génünk transzpozonokból alakulhatott ki, lehetséges, hogy ezek az elemek korábban fontos szerepet töltöttek be a genom evolúciójában. Az is előfordulhat, hogy egyes változataik gyakori jelenléte - mint például az ún. Alu-elem a génekben gazdag régiókban - hasznos lehet a gének számára.

Az ismétlődő szekvenciák transzpozonok működése következtében történő kialakulása mellett úgy tűnik, hogy az idők során a genom egyes részei egyszerűen megduplázódtak. A kutatók szerint ez lehetőséget nyitott arra, hogy egyes gének más szerepkört vegyenek át anélkül, hogy az eredeti példány elvesztette volna funkcióját. Ilyen módon alakultak ki az emberben egyes hasonló gének családjai. A kutatások azt is feltárták, hogy léteznek ún. rekombinációs forró pontok, ahol az apai és anyai kromoszómák közötti géncsere sokkal intenzívebben zajlik a sejtosztódás során, mint más területeken.

Ilyen és más jelekből egyre inkább úgy tűnik, hogy genetikai állományunk egy igen komplex rendszer, amelyben minden alkotórésznek fontos szerepe lehet, s amely dinamikus egyensúlyban van. Nincsenek "jó" és "rossz" gének, csupán különböző szinteken működő kapcsolatrendszerek, amelyek különböző eséllyel tudnak jól működni, vagy éppen elromlani. Szintén az új kutatások tárták fel, hogy a genomban nagy számban találhatók korábban fehérjét kódoló, de ma már működésképtelen, ún. pszeudogének.

Minimális, de életbevágó egyedi különbségek

A kutatások során nagy számban fedeztek egyedi mutációkat, ún. SNP-ket (szimpla polinukleotid polimorfózis). Ez azt jelenti, hogy a mintát adó egyes személyek DNS-ében egyes bázisok helyzete eltérő. A HGP eddig 1,4 millió, míg a Celera 2,1 millió SNP-t azonosított. A kutatók részben ezektől az eltérésektől remélik annak megértését, hogy miért teszik a gének olyannyira különbözővé az egyes embereket, illetve egyes emberek miért sokkal fogékonyabbak bizonyos betegségekre. Az SNP-k egyébként jobbára ártalmatlanok, csak mintegy 1%-uk vezet rendellenesen működő gén kialakulásához. Az előzetes eredmények alapján viszont nem teljesen véletlenül alakulhattak ki, mivel eloszlásuk a genomban nem egyenletes. Az SNP-k vizsgálatával nem csak örökletes betegségeinket, hanem evolúciónk pontosabb történetét is felvázolhatják majd a kutatók.

Az emberi faj genetikai egyöntetűsége ezzel együtt is igen nagy: az új kutatások megerősítették a korábbi fehérjevizsgálatok eredményeit, miszerint genetikai anyagunk 99,9%-ban azonos bármely más emberével. Valójában egyes, különböző emberfajtákból származó emberek között nagyobb genetikai hasonlóság is lehet, mint ami a fajta ugyanazon tagjához képest jellemző. A kutatók szerint genetikai alapon nincs is értelme fajtákról beszélni.

Még messze a szép új világ

Jelenleg tehát itt tart az a dolog, amit sokan máris "szép új világként" harangoztak be, feleslegesen riogatva vagy túlzottan biztatva a közvéleményt. Egyelőre csak a genetikai állomány szekvenciája és annak első, nyers analízise készült el, ami persze önmagában is nagy eredmény. (A pontosság kedvéért meg kell jegyezni, hogy a szekvencia végső változata csak 2003 körül várható, mivel még mindkét tudóscsoportnak pontosítania kell eredményeit, illetve "be kell tömni" a még feltérképezetlen lyukakat.)

Az igazi munka, a genetikai állomány leolvasása, a gének pontos megkeresése és feladataik, kapcsolataik megállapítása (funkcionális genomika) csak most kezdődik el igazán, és még több évtizedig tarthat. Az eredmények persze folyamatosan születnek majd, s valóban remélhetjük, hogy lassan, fokozatosan új alapokra helyezik a gyógyászat tudományát anélkül, hogy komolyabb visszaélésre kerülne sor.

Amit viszont máris tudunk, hogy a dolog sokkal bonyolultabb lesz, mint azt eddig gondoltuk. A gének mellett egyre inkább felértékelődik a fehérjék, a sejtszintű folyamatok és a környezeti hatások szerepe az egyes tulajdonságok kialakításában. Az élet könyvének nyers adatai már a kezünkben vannak, de lehetséges, hogy ez önmagában soha nem lesz elegendő ahhoz, hogy megérthessük egy élő organizmus csodálatos összetettségét.

* * * * *


Génkeresés

A gének megtalálásához számítógépes algoritmusokat használnak, a jelenlegi legkomolyabb teljesítményű komputereket állítva munkába, amelyek bizonyos jellemző mintázatokat - pl. a mondat (gén) nagybetűs kezdőbetűjét vagy a mondat végi pontot (ún. start- és stopjeleket, vagyis az információ két végpontját) - keresik. Számos kutató azonban egyelőre nem tartja elég megbízhatónak ezt a módszert, mondván, hogy a számítógép ott is géneket lát, ahol semmi nincs, illetve ennek ellenkezője is igaz lehet.

Egy másik lehetőség, hogy a szöveghez olyan mondatokat (géneket) társítunk, amelyek szó- és betűrendjét (vagyis szekvenciáját) már ismerjük. Szerencsére egy ilyen szövegrész képes megtalálni a neki megfelelő helyet a könyvben, az ún. bázispárosodás elve alapján, amelyből következően a DNS két szála egymás kiegészítője (komplementer szálak). Ha a két szálat szétbontjuk, újból össze tudnak illeszkedni, illetve hozzájuk tud kapcsolódni egy-egy megfelelő kiegészítő szakasz. Ezek az ún. cDNS (komplementer-DNS) vizsgálatok. A cDNS-eknek kiterjedt adatbázisa van, amelyet mRNS molekulák bázissorendjéből kódoltak vissza.

Egy harmadik lehetőség, hogy más fajok genetikai információival vetjük össze az emberét. Számos gén ugyanis - például az egyedfejlődés alapjait meghatározó, roppant konzervatív szerkezetű gének - csak minimálisan különbözik egymástól két faj - például az ember és az egér - esetében, így a korábbról megismert állati gének jó támpontot nyújtanak sajátjaink azonosításához.

A Celera Genomics egyébként a napokban jelentette be, hogy a következő időszakban a patkány genetikai állományát fogják feltérképezni, ami - az emberhez hasonlóan - kb. 3 milliárd bázispár hosszúságú. A kutatásokat a Nemzeti Egészségügyi Intézet (USA) finanszírozza, amely 58 millió USD-t fizet a cégnek. Az eredmények - az emberi adatoktól eltérően - ezúttal mindenki számára elérhetők lesznek, s heti frissítéssel kerülnek be egy nyilvános adatbázisba.
A patkányok genetikai anyagának minél alaposabb ismerete igen fontos, mivel ezek az állatok fontos szerepet töltenek be az állatkísérletek során, részben egyes emberi betegségek modellszervezeteiként. Nagyobb méretük és az emberéhez közelebb álló betegségtüneteik miatt alkalmasabbak az ilyen vizsgálatokra az egereknél (az egér-genom feltérképezésével egyébként a közelmúltban készült el a Celera Genomics).

S. T.

A témához kapcsolódó oldalak