Hamarosan a videók hangjában is kereshetünk

2008.08.01. 12:25

Nemsokára nem csak weboldalak szövegében, de akár videókon elhangzó beszéd tartalmában is lehet majd keresni: a YouTube és más szájtok is tesztelik a hangot kereshető szöveges információvá alakító megoldást.

Azt, hogy egy weboldal milyen témákkal foglalkozik, a keresők a szöveg elemzésével elég jó hatásfokkal képesek megtalálni, ennek köszönhetően például a Google-lel nem nehéz akár egy olyan szájtot találni, amely mondjuk a lazactenyésztés rejtelmeibe nyújt betekintést. A netre feltöltött videók esetében már jóval bonyolultabb a helyzet: azt, hogy egy felvétel miről szól, leginkább a felhasználók által megadott címkék (tagek) alapján sorolják kategóriákba a videomegosztó oldalak. Ez azonban nem éppen tökéletes megoldás, hiszen sokan vagy egyáltalán nem rendelnek címkéket a videókhoz, vagy épp rutintalanok, így nem a megfelelő kulcsszavakat választják ki.

A videókban való keresés hatékonyságát javítaná jelentősen a Google: a társaság a YouTube politikai csatornáján nemrég kezdett tesztelni egy speciális megoldást, amely beszédfelismerés segítségével szöveges kivonatot készít a felvételeken elhangzó szövegekből. Ha például az egyik felvételen Barack Obama szót ejt például az egészségbiztosításról, akkor azt a videót az erre irányuló keresések eredményei között fel fogja tüntetni még akkor is, ha a címkék között nem szerepel ez a kulcsszó.

A USA Today beszámolója szerint hasonló megoldással próbálkozik a Blinkx nevű videokereső is: a szájt keresőmotorja ugyancsak a felvételek hangját elemzi, lebontva azt a legkisebb megkülönböztethető hangokra. A szájt ugyancsak szöveges kivonatot generál az elhangzott beszédből, emellett azonban a képi információkat - például a felvételen felbukkanó feliratokat - is vizsgálja.

Hasonló algoritmuson alapul az EveryZing is, a vállalatokat célzó szolgáltatás üzemeltetői szerint a tévéstúdiókban készült professzionális felvételek esetében keresőjük 90 százalék feletti hatékonyságot biztosít - a kézikamerával rögzített, sistergős hangú házivideók esetében ezt nem lehetséges elérni. A szociális hálózatok előnyeit használja a felvételek kategorizálásához a Meefeedia, ezen a szájton a felhasználók saját csatornákat, lejátszási listákat hozhatnak létre a felvételekből, melyet megoszthatnak a többiekkel. Az EveryZing egyik vezetője, Stephen Baker úgy véli, a videók tartalmának alapos elemzésén alapuló keresés akkor válhat széles körben elérhetővé, ha olcsóbban lehet majd számítási teljesítményt vásárolni. Ekkortól azonban már egy felvételen elhangzó összes szóra rá lehet majd keresni, ami jelentősen megkönnyíti majd az információk felkutatását a jelenlegi címkés megoldáshoz képest.