Hangyát tanít focizni a Google gépagya

hangya
Vágólapra másolva!
A Google DeepMind kutatói olyan újfajta algoritmuson dolgoznak, ami még profibban fog játékokat játszani, ráadásul már 3D-ben is boldogul. Ehhez a gépi mély tanulást, és a megerősítéses tanulást kombinálják.
Vágólapra másolva!

A Google által felvásárolt DeepMind cég mesterséges intelligenciája már több ízben bizonyított, eddig főként játékok terén. Nemrég az AlphaGo nevű szoftver verte meg a góbajnok Li Szedolt 4:1-re, korábban pedig számos 2D-s Atari játékot tanult meg játszani, többek közt a faltörő Breakoutot.

Most újabb kísérleti projektet jelentett be a Google, ezúttal focizni tanítják meg a szoftvert, hogy a 3D-s navigációt is fejlesszék. A tesztjáték valójában egy hangyafoci, játék közben azt fogja megtanulni a DQN nevű algoritmus, hogyan lőjön gólt, s miként taktikázzon, mindezt egy digitális hangya képében. Ez gyakorlatilag annak az algoritmusnak a továbbfejlesztett változata lesz, ami az Atari játékokat is játszotta.

Ennek megvalósításához a cég egyszerre használja fel a mély tanulást, a neurális hálózatokat, és a megerősítéses tanulást (reinforcement learning). Ez utóbbi módszer lényege, hogy

a program folyamatosan hibázik, és ezekből tanul.

Jutalmazással, illetve büntetéssel tanulja meg, mi volt a jó lépés.

A gépi mély tanulás alapja pedig, hogy a neurális hálózatokba táplált rengeteg adatot használja fel az algoritmus ahhoz, hogy következtetéseket és kapcsolatokat fedezzen fel, majd azokat alkalmazza az új információk esetében is.

A deep learning az utóbbi évek egyik legfontosabb technológiája,

ez teszi lehetővé, hogy a számítógépeket ne kelljen egyesével megtanítani minden különböző feladatra, hanem önmagától legyen képes elsajátítani dolgokat. Nem véletlen, hogy a Google mellett a Facebook és a Microsoft is erősítette csapatát ezzel foglalkozó szakemberekkel az utóbbi években.

Robotokhoz használnák

A fejlesztést minden bizonnyal beépítik Google szolgáltatásokba is, hogy melyikbe, azt nem részletezte a cég. Az algoritmust korábban nem csak játékokhoz használták, de a keresési ajánlatokhoz is.

A cég említette azt is, hogy hasznos lehet később a robotikus manipulációban, a robotok irányításában.