A kutatók által kifejlesztett mesterséges intelligencia megmondja, az emberi fehérjék egyes mutációi milyen valószínűséggel okoznak betegséget. A modell olyan mutációkkal is működik, amelyeket még senki eddig nem látott élő emberben.

Fotó: VICTOR DE SCHWANBERG/SCIENCE PHO / VSC
A mesterséges intelligencia csodája: mire képes a popEVE?
A popEVE-nek nevezett modell több százezer faj genetikai állományát és az emberi népesség genetikai változatosságát felölelő adatbázisokból táplálkozik. A hatalmas evolúciós adatbázis jóvoltából az algoritmusnak rálátása van arra, hogy a nagyjából 20 ezer emberi fehérje mely részei nélkülözhetetlenek az élethez, és melyek azok, amelyek jobban tolerálják a változást.
Ebből kiindulva a popEVE nemcsak megtalálja a betegségokozó mutációkat, de az általuk okozott defektus súlyossága szerint is rangsorolni tudja őket.
A Harvard Medical School és a barcelonai Genomszabályozási Központ (CRG) kutatói által jegyzett tanulmány, amely a Nature Genetics szakfolyóiratban látott napvilágot, jelentős hatással bírhat a genetikai betegségek diagnosztikai gyakorlatára.
Az ismeretlen mutációk okozta probléma
Jelenleg a ritka betegségekben szenvedő páciensek fele egész életében nem jut egyértelmű diagnózishoz. A popEVE javíthat ezen az arányon azzal, hogy segít az orvosoknak a legkártékonyabb génváltozatokra fókuszálni. A modell további előnye, hogy a beteg genetikai információján kívül semmilyen más referenciát nem igényel. Ez fontos következményekkel jár a ritka betegségek diagnosztikája terén, különösen a korlátozott forrásokkal bíró egészségügyi ellátórendszerekben, mivel a modell a korábbiaknál gyorsabb, egyszerűbb és olcsóbb diagnózist tesz lehetővé.
A szülők DNS-e nem mindig hozzáférhető az egészségügyi intézmények számára, és sok páciens egyedül érkezik. A popEVE az ilyen betegekkel foglalkozó orvosoknak is segít a betegségokozó mutáció azonosításában, és erre már tudunk is példát felhozni a genetikai szakrendelésekkel folytatott együttműködéseinkből”
– mondta el Mafalda Dias, a CRG kutatója és a tanulmány egyik levelező szerzője.
Minden ember genetikai állománya sok apróságban különbözik mindenki másétól; ez tesz bennünket egyedivé. A különbségek egy részét ún. missense mutációk alkotják, amelyek hatására egy fehérjében megváltozik egy aminosav. E mutációk zöme ártalmatlan, de akadnak súlyos betegséget okozók is. A kihívás éppen abban áll, hogy megkülönböztessük az ártalmatlanakat a kártékonyaktól.
Ráadásul a kártékony mutációk sem mind egyforma mértékben kártékonyak.
- Egyesek csak enyhe tüneteket okoznak,
- mások súlyos fogyatékosságokat,
- a legsúlyosabbak pedig már korai életkorban halálos kimenetelűek.
Sok MI-alapú eszközt fejlesztettek már annak eldöntésére, hogy egy eddig ismeretlen mutáció veszélyes lehet-e vagy sem, de ezek csak igen-nem választ adnak, és nem képesek a mutációkat egy súlyosság szerinti skálán osztályozni.
Az „egyemberes”, soha korábban nem látott mutációk esetében nincsenek esettanulmányok, amelyekhez fordulhatnánk. Ezek a mutációk akkor is újnak bizonyulnának, ha a világ teljes népességét le tudnánk szekvenálni. Azok a hagyományos módszerek, amelyek betegcsoportokban vagy nagy népességekben keresnek mintázatokat, nem működnek ezekben az elszigetelt esetekben.
Az első verzió: EVE
Debora Marks és csoportja a Harvard Medical Schoolon, valamint Jonathan Frazer és Mafalda Dias a Genomszabályozási Központtól ezért az evolúciót hívták segítségül. Az évmilliárdok során az evolúció már megszámlálhatatlanul sok kísérletet folytatott le arra nézve, hogy egy fehérjében mely változások tolerálhatók, és melyek azok, amelyek túlontúl kártékonyak a túléléshez.
A gépi algoritmusok sok különböző faj fehérjeszekvenciáinak összevetéséből meg tudják tanulni, melyik aminosavpozíciók kritikus fontosságúak a túlélés szempontjából.
Ebből az alapötletből táplálkozott a kutatók által 2021-ben kibocsátott EVE (Evolutionary model of Variant Effect, vagyis a Variánsok Hatásának Evolúciós Modellje) nevű program, amely evolúciós mintázatok segítségével osztályozta az emberi betegségokozó gének mutációit ártalmatlannak vagy károsnak. Az EVE legalább olyan jól, vagy talán még jobban is működött, mint a laborban végzett kísérleteken alapuló jósló módszerek, ezért a klinikai genetikusok azóta is előszeretettel használják bizonytalan hatású génváltozatok megítélésére.
Az EVE képes volt ugyan bármely gén különböző mutációit ártalmasság szerint rangsorolni, de az általa adott pontszámok nem voltak összevethetők az egyes gének között. Ha találtak egy súlyosnak tűnő variánst valamelyik génben, annak a súlyosságát nem lehetett összevetni egy másik gén variánsaival.
Márpedig ez egy komoly hiányosság, mivel az orvosoknak tudniuk kell, hogy egy páciens teljes genomjában melyik a leginkább ártalmas génváltozat.
Világelső AI-modell
Az EVE modellcsalád legújabb tagja, a popEVE úgy oldja meg ezt a problémát, hogy az evolúciós adatokat két hatalmas emberigenom-adatbázis, a UK Biobank és a gnomAD adataival kombinálja. Ezekből az adatbázisokból kideríthető, hogy melyik variánsok találhatók meg egészséges emberekben, ami segíti a modell emberi jóslatokra történő kalibrálását.
Az eredmény az első olyan modell, amely ártalmasság szerinti sorrendbe tudja állítani a talált mutációkat a teljes emberi proteomon, vagyis az emberi genom által kódolt mintegy 20 ezer fehérjén belül. Így az A génben talált mutációt most már közvetlenül, ugyanazon a súlyossági skálán összevethetjük a B génben talált mutációval.
Az orvosoknak most először nyílik lehetőségük arra, hogy egy új páciens felmérésekor rögtön a legártalmasabbnak vélt génváltozatokra összpontosítsák figyelmüket.
A popEVE validálása céljából a kutatók több mint 31 ezer olyan család adatait elemezték, amelyekben súlyos fejlődési rendellenességgel bíró gyermek született. Azoknak az eseteknek a 98%-ában, ahol a betegségokozó mutációt már korábban azonosították, a popEVE helyesen ismerte fel ezt a variánst a legsúlyosabbnak a gyermek genomjában. A modell teljesítménye felülmúlta a korszerű vetélytársakét, például a DeepMind által fejlesztett AlphaMissense-ét.
Amikor a kutatók elkezdtek a popEVE-vel új lehetséges betegségokozó génvariánsokat keresni, a modell 123 olyan változatot azonosított, amelyeket korábban nem hoztak még összefüggésbe fejlődési rendellenességekkel. Sokuk olyan fehérjét érint, amely a fejlődő agyban tevékeny, és ismert betegségokozó génekkel hat kölcsön.
A 123-ból 104 mutáció olyan, amit csak egy vagy két páciensben dokumentáltak.
A popEVE egyik nagy erőssége, hogy nem teljesít rosszabbul olyan emberek esetében sem, akiknek a vérvonala alulreprezentált a jobbára európai származásúakkal feltöltött genetikai adatbázisokban. Más modellek ugyanis hajlamosak betegségokozónak vélni egy-egy variánst pusztán azért, mert nem szerepel az általuk áttekintett humángenom-gyűjteményekben.

Fotó: JULIEN TROMEUR/SCIENCE PHOTO LIB / JTO
A popEVE ezzel szemben minden emberi génvariánst azonos módon kezel, így elkerüli ezt a csapdát. Mivel azt kérdezi, vajon egy mutációt láttak-e már egyáltalán emberben, mindegy, hogy csak egyetlenegyszer egy speciális népességben vagy ezerszer az európai népességben, kevesebb téves riasztást ad.
Senki se kapjon kézhez ijesztő genetikai szakvéleményt csak azért, mert olyan népesség tagja, akik nincsenek kellően képviselve a globális adatbázisokban. A popEVE segít megszüntetni ezt az egyenlőtlenséget, s ezzel a szakterületen régóta fennálló igényt elégít ki”
– hangsúlyozta Jonathan Frazer, a CRG kutatója és a tanulmány másik levelező szerzője.
A szerzők kiemelik: a popEVE csak olyan DNS-változatokat vesz figyelembe, amelyek változást idéznek elő egy fehérjében. Számos egyéb fajta mutáció létezik, így ez a modell nem fedi le a genetikai változatok valamennyi formáját. Szintén nem helyettesítheti a modell az orvos személyes megfontolását, aki a kórtörténet ismeretében és a tünetek elemzése nyomán állítja fel a végleges diagnózist.