Tavaly óta kétszer jobban lát a számítógép

2014.08.20. 10:35

Egyetlen év alatt hatalmasat fejlődött a gépi látás, de az emberi képességeket még nem éri el.

Idén kiugróan sikeres volt a számítógépes látással foglalkozó nemzetközi verseny, a Large Scale Visualisation Challange. Igazi sláger a biológiai látás modellezése és a gépi tanulás továbbfejlesztése. A feladat az internetről származó képek felismerése, elhelyezése és rendezése volt.

Kétszer pontosabb lett a gépi szem

A gépi látás helyzete sokat javult a tavalyihoz képest: a versenyző technológiák esetében megduplázódott a pontosság és megfeleződött a hibák száma. A szervezők szerint a verseny történetében ez volt az egyik legjobb év.

A versenyzők nagy része egy Yann LeCun, egy deep learninggel, gépi tanulással foglalkozó kutató módszerét, az úgynevezett "konvolúciós neurális hálózatot" használta és fejlesztette tovább.

Emberként akarnak látni a gépek

Ezt a képfelismerési módszert a biológiai folyamatok inspirálták: a "digitális idegsejtek" egymást átfedve érzékelik a képeket, így képesek a hagyományos módszereknél hatékonyabban, kevesebb hibával feldolgozni azokat. A technológiát arcfelismerésre alkalmazva például rendkívül magas, 97,6%-os pontosság érhető el. LeCun Kunihiko Fukushima elméletei alapján 1998-ban fejlesztette ki társaival az algoritmust. A francia informatikus ma már a Facebook mesterséges intelligenciával foglalkozó részlegének igazgatója.

Ehhez hasonló dolgokat kellett felismerniük az algoritmusoknakForrás: image-net.org



Az idei versenyben a nyertesek eldönthették, hogy technológiájuk részleteit titokban tartják, vagy nyilvánossá teszik - mindenki az utóbbit választotta, amely Fei-Fei Li, a Stanford Mesterséges Intelligencia Laboratórium igazgatója szerint példaértékű, mert hozzásegíti a kísérleti technológiákat a megvalósuláshoz. Ezen a linken lehet megnézni az algoritmusok teszteléséhez használt digitális képeket.

Valóban elterjedhet a gépi látás

A nagy számítási igényű technológiák ára az utóbbi időben folyamatosan csökken, így a gépi látás egyre nagyobb teret nyerhet a gyakorlati élet számos területén. Az orvostudomány, a robotika, az autóipar és a videojátékok is egyre többet használják a vizuális felismerés új fejlesztéseit: számos autógyár kezdett gyalogosokat és kerékpárosokat felismerő rendszert építeni.

Az algoritmusok egyre összetettebbek, de még mindig képtelenek felvenni a versenyt az emberi látással. "Sokat fejlődött a gépi látás, de ha akarok, könnyen találok olyan képet, amivel összezavarom a számítógépes algoritmust, de egy embert nem tudnék vele átverni." - állítja Li. A számítógépek nem túl jók például az összetett jelenetek felismerésében, nem mindig tudják leírni, hogy mit is látnak, nem tudják összekapcsolni a kép részleteit. Li úgy gondolja, ha ez idővel mégis sikerül, az lesz az igazi Szent Grálja a gépi látásnak.