A világon sok helyen tekintélyes erőforrásokat rendelnek a mesterséges intelligencia eszközeinek kutatására. A legnagyobb figyelem a mély neurális hálózatok felé fordul, mivel sok olyan problémát sikerült megoldani a segítségükkel, mint például az önvezető autók vezérlése, komplex képfelismerési feladatok megoldása vagy a legjobb humán gojátékos legyőzése.

A földi élet legfontosabb molekulái a fehérjék: az embernek mintegy 100 000 fehérjéje van, a bennünk élő baktériumoknak pedig összességében több millió. Különböző nagy adatbázisok tárolják az eddig ismert fehérjék összetételét, így az elsődleges szerkezetüket leíró aminosav-szekvenciákat is. A fehérjeszekvenciákat, azaz az őket alkotó aminosavak sorrendjét ma már nem nehéz meghatározni, azonban az ismert szekvenciájú fehérjék funkciójának kiderítése még ma sem könnyű feladat.

Egy fehérjekomplex szerkezeteForrás: Wikipedia

Ennek fontosságát azzal lehet érzékeltetni, hogy sok betegség vizsgálatánál kiderült, hogy bizonyos fehérjék szintje megnő, illetve lecsökken, tehát ezek a fehérjék szoros kapcsolatban lehetnek az adott betegség kialakulásával. Ezen fehérjék szekvenciájának meghatározása után a fehérjék funkciójának leírása nagyon fontos lépés lehet a betegség kialakulásának megértése, illetve gyógyítása felé. A kutatók sok éve próbálkoznak mély neurális hálókat alkalmazni a fehérjék funkciójának jóslására, több-kevesebb sikerrel. Az ELTE PIT Bioinformatikai Csoport kutatói, Szalkai Balázs doktorjelölt és Grolmusz Vince professzor most megjelent publikációjukban írták le a SECLAF webszervert, amely – mindenki számára elérhetően – határozza meg a fehérjék funkcióját aminosav-sorrendjükből.

Az eredmény azért jelentős, mert eddig még nem látott, igen nagy pontosságú eszközről van szó, mely több mint 99.99%-os találati aránnyal osztályozza a fehérjeszekvenciákat az UniProt adatbázis 698 fehérjecsaládjába.

A webszerver nyilvánosan elérhető a https://pitgroup.org/seclaf/ oldalon.
A közlemény a Bioinformatics című lapban jelent meg, 2018. február 27-én. Az ingyenes változat itt érhető el: https://arxiv.org/abs/1708.04103 .