Az utóbbi tíz év kutatásaiban két fontos trendet figyelhettünk meg: egyrészt rengeteg új adat vált elérhetővé, másrészt a kutatók ma már nem egyedül, hanem sokszor hálózatokba szerveződve dolgoznak. A hatalmas adattömegek hatékony elemzése talán a genomika számára jelentette a legnagyobb előrelépést. A DNS bázissorrend-meghatározó módszerek nagyot fejlődtek tíz év alatt, és ma már alig egy hét alatt, egyetlen eszközzel is három ember teljes genetikai állománya határozható meg. Az adatbányászat eddig kevésbé volt jellemző az ökológiára és a környezettudományokra, de rövidesen ezeknek a tudományágaknak is meg kell majd birkózniuk a hatalmas adatbázisokkal. A távérzékelő, valamint a földi és tengeri adatgyűjtő eszközök hamarosan lehetővé fogják tenni, hogy bolygónk aktuális állapota éjjel-nappal ellenőrizhető legyen.
A minden eddiginél nagyobb mennyiségű adat feldolgozásához olyan számítógépekre volt szükség, amelyek rendelkeznek a megfelelő számolókapacitással. Ezekre is igaz, hogy néha nem egy-egy szuperszámítógép, hanem a szuperszámítógépek hálózata végzi el az adatfeldolgozást, egymástól földrajzilag távol eső helyeken. A CERN laboratóriumának részecskegyorsítója, a Nagy Hadronütköztető például minden évben több petabájtnyi adatot fog előállítani. (A petabájt a terabájt ezerszerese, a gigabájtnak pedig milliószorosa). Ennek kezelésére - egy virtuális rendszerben - összekötötték a CERN társintézményeinek teljes számítógépes kapacitását. Ez a hálózat természetesen azt is lehetővé teszi, hogy az adatokhoz egyszerre több ezer kutató is hozzáférhessen, akik így nem külön-külön, hanem együtt képesek elemezni a mérési eredményeket.
Az adatbányászat legújabb, egészen különleges formája a kulturomika, amely az emberi kultúra fejlődésének új vizsgálati lehetőségét jelenti (erről itt olvashat bővebben). A bibliomika pedig már korábban is létezett: ez a szakirodalomban megjelent cikkek információiban történő adatbányászatot jelentette. |
A hálózatok tudománya (network science) nagyjából tíz éve jelent meg. A hálózatkutatás egyik legelső példája volt, amikor a fizikusok olyan jelenségekre kezdtek el matematikai modelleket alkalmazni, amelyeket korábban a szociológusok írtak le. A hálózatkutatásban jelentős magyar eredmények is születtek, amelyek közül talán Barabási Albert-László munkái a legismertebbek. (A kutatónak nemrég adták ki magyarul is a legújabb könyvét, Villanások címmel; a kutatóval készített interjúnk itt olvasható.) A hálózatkutatáshoz hasonló terület a rendszerbiológia, amely szintén csak az elmúlt öt-tíz évben jelent meg. Ezen a területen is találunk olyan magyar kutatókat, akik nemzetközi szintű eredményeket értek el a sejtek alrendszereinek megismerésében vagy a génkölcsönhatások vizsgálatában. A rendszerbiológiai kutatások alapvető célja, hogy a sejtek viselkedését számítógépes modellek segítségével vezesse vissza az alkatrészek kölcsönhatásaira.
Mára több ezer gén vagy fehérje működése mérhető párhuzamosan, a szuperszámítógépekkel (vagy ezek hálózatával) pedig ki is értékelhetőek az adatok. Ezek már a következő évek kutatási eredményei lesznek, most azonban tekintsük át, hogy mi történt az elmúlt tíz évben.