Mennyire készített felejthetetlen képeket az ünnepek alatt?

2016.01.05. 16:21

Átírhatja a reklámok és mozifilmek képi világát az az új algoritmus, amely képes megjósolni, mennyire lesz emlékezetes egy fotó - így abban is segít, hogyan lehet a gyengébb képeket valóban felejthetetlenné tenni. 

Az MIT számítástechnikai és mesterséges intelligencia laborjában (CSAIL) egy olyan algoritmust fejlesztettek ki, amely az emberhez hasonló pontossággal képes megjósolni, mennyire emlékezetes vagy felejthető egy kép. Készül már hozzá egy alkalmazás is, amellyel nemsokára apró módosításokat végezhetünk fotóinkon a maradandóbb hatás, több lájk érdekében. 

Az algoritmus minden fotót egy hőtérképhez hasonló képpé alakít

Forrás: Flickr / epSos

A MemNet nevű algoritmus minden fotót egy hőtérképhez hasonló képpé alakít: minél emlékezetesebb egy részlet, annál pirosabb, "forróbb" lesz. "Az emlékezetesség felderítése abban segít, hogy nyomatékosítsuk a legfontosabb tényeket, illetve kiderítsük, milyen információkat felejtenek el legkönnyebben az emberek", mondja a kapcsolódó tanulmány vezető szerzője, Aditya Khosla.

Tesztelje saját képeit a LaMem demóoldalán! Töltse fel fotóit, majd az algoritmus kiértékeli, mennyire emlékezetes a kép: a 0,5 körüli kép felejthető, a 0,9 fölötti érték már kimagasló. 

Mind a tetszés, mind a felejtés egyetemes

A projekt részeként a fejlesztők megalkották a világ legnagyobb képi segédanyag-adatbankját. A LaMem mind a hatvanezer fotóját részletes metaadatokkal egészítették ki, ezekkel az adott kép tetszési, érzelmi mutatója állapítható meg. Az adatbázis hozzájárulhat a képi tartalom értelmezését segítő számítógépes látás tudományterületének fejlesztéséhez is.

Igazán érdekes, hogy dacára az eltérő egyéni tapasztalatoknak és ízléseknek, mindannyian hasonló információkat nyerünk és tárolunk egy-egy kép megtekintése után. Például a különféle események vagy egy tevékenységekben részt vevő emberek, illetve a központi elrendezésű tárgyak megjegyezhetőbbek számunkra, mint mondjuk a tájképek - bár azok a leglátványosabbak.

Ugyanez az univerzalitás érvényes azon jellemzőkre, amelyek miatt kiesik emlékezetünkből egy-egy fotó. Vagyis, ha mind a pozitív, mind a negatív értékelés egységes szempontok mentén zajlik, akkor arra egy algoritmus is képes lehet.

Az algoritmus segítségével azt is megjósolhatjuk, melyik fotónk kapja majd a legtöbb lájkot

Forrás: Collection Christophel/© 2015 Paramount Pictures/2015 Paramount Pictures

Mesterséges intelligencia tanítja a számítógépet

A kutatócsoport korábban már létrehozott egy algoritmust, amellyel az emberi arc emlékezetes vonásai térképezhetők fel. Az új program nem csupán annyiban fejlettebb, hogy ítélőképessége megközelíti a miénket, hanem azért is, mert az úgynevezett mélytanulás eszközkészletét veti be a döntéshozatal során.

A mélytanulás a számítás- és idegtudományt egyesíti; a mesterséges intelligencia azon területe, amely különféle rendszereket, "ideghálózatokat" használ ahhoz, hogy megtanítsa a számítógépnek, miként találhat meg önállóan az adattengerben valamely értékelhető mintázatot.

Ilyen technológia van az Apple Siri asszisztense, a Google keresést segítő automata kiegészítő (autocomplete), illetve a Facebook fotómegjelölő (phototagging) rendszere mögött. Ezek a technológiai óriások már eddig is dollár százmilliókat költöttek a mélytanulással foglalkozó startupok felvásárlására.

Az új program nem csupán annyiben fejlettebb, hogy ítélőképessége megközelíti a miénket, hanem mert az úgynevezett mélytanulás eszközkészletét veti be a döntéshozatal során

Forrás: Riccardo Romano

Az algoritmus csak kevéssel marad el az embertől

"Jóllehet a mélytanulás nagy lökést adott a tárgyfelismerés és helyzetértékelés területének, az emberi emlékezet előrejelzéséről eddig az volt az általános meglátás, hogy az olyan magas fokú kognitív folyamat, amit a számítástechnika soha nem lesz érhet el" - mondta a kutatás társszerzője, Aude Oliva. - "Nekünk sikerült."

Működésük során az ideghálózatok emberi irányítás nélkül is képesek csoportosítani az adathalmazokat. A hálózatok rétegekbe szerveződnek, amelyek mindegyike véletlenszerű számításokat végez az adatokkal. Ahogy a hálózat egyre több adatot nyer, újraszervezi magát, hogy minél pontosabb előrejelzéseket készíthessen.

Hatvanezer fotónyi adatbázis kezdésnek

A MemNet algoritmus teszteléséhez a kutatók hatvanezer fotóból álló adatbázist állítottak össze. A képek mindegyikéhez kiszámoltatták az emlékezetességi mutatót, vagyis annak mértékét, hogy egy átlagember mennyire emlékezne az adott fotóra.

Most bárki lecsekkolhatja, hogy mennyire lesz megjegyezhető a fotója

Forrás: Thinkstock

Ezután mind az kísérletbe bevont alanyoknak, mind az algoritmusnak azt kellett megjósolnia, hogy az emberek mennyire fognak emlékezni egy sor olyan képre, amit még soha nem láttak korábban. Az alanyok 68 százalékos találati arányához képest a MemNet 64 százalékot ért el, ami csekély különbség. Ráadásul 30 százalékkal jobb eredmény, mint a korábbi algoritmusoké.

Az emlékezőképességünket lehet befolyásolni

A kutatás nem várt eredményt is hozott: Khosla kíváncsi volt, ha megmutatja az algoritmus által legemlékezetesebbnek ítélt fotókat a kísérleti alanyoknak, vajon mindegyiket képesek lesznek-e felidézni később?

"Azt feltételeztük, hogy az emberek kifáradnak, és épp annyi részletet fognak elfelejteni, mint a véletlenszerűen kiválasztott képek esetén. Ám másképp történt, ami azt jelenti, hogy ha a nézőknek valóban emlékezetes képeket mutatunk, akkor igenis emlékezni fognak rájuk- mondta Khosla.

Kutatótársaival most az algoritmus továbbfejlesztésén dolgozik, hogy a MemNet képes legyen akár egyetlen ember emlékezőképességét is előre jelezni.

Az algoritmus embereken is bizonyította hatékonyságát

Forrás: MTI/EPA/ANSA/Elisabetta Baracchi

Emlékezetesebb képek választásával hangsúlyosabbá tehetők a reklámok, a közösségi médiában elhelyezett posztok, vagy akár a napi teendőinkre emlékeztető bejegyzések. Sőt, olyan vizuális tananyag is készíthető vele, amelyet nem kell bebiflázniuk a diákoknak, mert valósággal beleég a memóriájukba.

KAPCSOLÓDÓ CIKKEK