Gépaggyal tömörítené kisebbre a fotókat a Google

2016.08.25. 11:51

A jelenlegi eljárásoknál hatékonyabb tömörítési módszert próbál kifejleszteni a Google, hogy a fotók még kevesebb helyet foglaljanak. Mint sok más közelmúltbeli fejlesztésükhöz, ehhez is a neurális hálózatokat vetik be.

A felsőkategóriás telefonok jellemzően legalább 32 gigabájtos adattárolóval vannak felszerelve, de az alsóbb szegmensekben már ritkábban vannak ennyire eleresztve a felhasználók.

Ezen próbál segíteni a Google: olyan megoldáson dolgoznak, ami sok milliárdnyi kép méretének csökkentését tenné lehetővé, mindezt mesterséges intelligenciával. Az algoritmus a tavaly nyílttá tett TensorFlow rendszeren alapul, a Google neurális hálózatok segítségével tanítja meg az újszerű tömörítési eljárást.

A tanuláshoz hatmillió, véletlenszerűen kiválasztott fotót használ fel. Az algoritmus mindegyik képet lebontja 32x32 pixeles részletekre, ezekből választja ki azt a száz darabot, ahol a legkevésbé volt hatékony a tömörítés. Így megtanulja, hogyan tudja a problémás, nagy helyet foglaló részeket jól tömöríteni, s válik összességében kisebbé méretűvé egy kép.

Egyre több mindenre lesz képes a mesterséges intelligenciaForrás: AFP/Patrik Stollarz

A tömörítés során az algoritmus bináris kódokra bontja a részleteket, majd újraépíti azokat. Az eljárás eddigi tesztek alapján jól működik, és hatékonyabb tömörítést tesz lehetővé, mint a JPEG-formátum, vagy bármelyik más eddig használt módszer. A képek pedig ennek köszönhetően kevesebb helyet igényelnek.

A fejlesztés nemcsak a végfelhasználóknak jelenthet megspórolt tárhelyet.Az olyan óriásvállalatoknak, mint a Google, rengeteg fotót kell tárolniuk szervereiken (ne feledkezzünk meg a Google Fotókról, ami korlátlan mennyiségű, 12 megapixeles fotó feltöltését engedélyezi a felhőbe), de említhetnénk a Facebookot is, ahova naponta kerül fel irdatlan mennyiségű képes tartalom.

Az algoritmus finomítása még javában zajlik, számos probléma vár megoldásra. Ezek egyike a túltömörítés: a gépagy ugyanis nem látja a végeredményt, így nem tudja megítélni, hogy egy kép mikor tűnik már túlságosan torznak az emberi szem számára.

Ha viszont elkészül a módszer, akkor rengeteg tárhelyet sikerülhet vele megspórolni, ami előnyös a cégek és a felhasználók számára is.

További cikkek