Bulikban tanult meg magyarul a Google

2012.08.22. 20:01

Pár hét alatt beprogramozták a magyar nyelvet az Android hangvezérléséhez, de kínaiul egy évig tanult a keresőóriás szoftvere. A nyelv elsajátításában több száz önkéntes segített, az alkalmazás a továbbiakban magától tanul tovább.

Egy új nyelv programozásánál általában összeül a Google stábja, és addig nem nagyon megy ki a szobából, amíg ki nem találják az új rendszer vázát, ez pedig akár napokat is jelenthet - mondta az [origo]-nak Pedro J. Moreno, a keresőóriás vezető számítógépes nyelvészettel foglalkozó kutatója. A spanyol kutató vezette azt a projektet, aminek során az androidos okostelefonokon megjelent a magyar nyelvű hangfelismerés funkció. Morenóval erről beszélgettünk a magyar Google-irodában, egy csoportos videokonferencián. 

Csak azért volt könnyű a magyar, mert nem megérteni kellett

A csapatnak nem volt nehéz dolga a magyar nyelvvel, de ez nem feltétlenül jelenti azt, hogy a magyar nem nehéz nyelv. "Hangvezérlés szempontjából a felismerő szoftvernek nem kell megérteni a szó jelentését, csak listáznia a találatokat. Ez így sokkal egyszerűbb" - mondta Moreno. A kutató szerint a jövőt a gépi megértés jelenti, az angol nyelvű Google már tud is ilyesmit: korrigálja a hibákat, tudja, hogy például az ebéd kifejezéshez csatoljon éttermeket. Moreno szerint ez még csak a kezdet, a jövőben akár a helytelenül diktált mondatokat is kijavíthatja a szoftver.

A magyar nyelvű hangfelismerés fejlesztése rendkívül nyitottan zajlott. A cég projekttel foglalkozó emberei Magyarországra jöttek, adatokat gyűjtöttek, valamint egyetemi találkozót is szerveztek. "Egy nyelv programozásánál három forrásból táplálkozunk: lingvisztikai, azaz nyelvtani, akusztikai, azaz hangtani és lexikai, tehát nyelvi jelentésbeli információkra van szükségünk. Ehhez egyrészt helyi nyomtatott szöveges termékekre van szükségünk: mozijegyek, újságok, könyvek és hasonlók" - mondta. Morena szerint azért nem volt elég a Google-ban listázott magyar nyelvű keresésekre támaszkodni, mert az emberek sokszor nem használnak ékezeteket. Éppen ezért a magyarnál az ékezetes betűkkel és az ilyeneket tartalmazó szavakkal volt a legtöbb problémájuk.

Fotó: Mudra László [origo]

Több találatot is kihoz a hangos keresésre

Egyetemistákkal találkoztak, könyveket olvastak

Egy nyelv akusztikai forrását csak személyes beszélgetések tudják jól reprodukálni, éppen ezért a Google Magyarországon is önkénteseket toborzott, egész pontosan egyetemi találkozókat szervezett, ahol rögzítették a hallgatók hangját. A kapott mintából megszületett egy átlagtartomány, hogy nagyjából milyen hangszín- és hanglejtéstartományokon belül mozog egy-egy szó kiejtése. Ez alapján be lehet táplálni a rendszerbe, hogy nagyjából mit fogadjon el a rendszer, amikor például kiejtjük Dádpuszta település nevét.

A magyar nyelv beprogramozása összesen három hétig tartott a Google-nak - mondta Moreno. Ebből a legtöbb időt és költséget a helyi adatgyűjtők kifizetése jelentette. A dolog informatikai része viszonylag elenyésző volt, és bár nem mondhatott konkrét összeget, szerinte az egész munka a Google büdzséjének elenyésző hányadát tette ki. Nem minden nyelvet tudnak olyan olcsón felismerhetővé tenni, mint a magyart. A mandarin hangfelismerő rendszerét például egy egész évig fejlesztették adatgyűjtéssel együtt. Utána jött a japán, ami már csak négy-öt hónap munkát igényelt, a francia, olasz, spanyol pedig már együtt meglett három hónap alatt - mondta Moreno.

A cseheknek már két éve van

Jelenleg negyvenöt nyelven működik a Google hangfelismerője, a magyar a legutolsó eddig, amit elkészítettek. A Google több tényező hatására dönt egy nyelv mellett, például hogy hányan élnek az adott országban, mekkora az okostelefonos penetráció, illetve milyen piaci helyzetben van a Google az adott területen - mondta Moreno. A kutató szerint a Magyarországhoz hasonlóan szintén tízmilliós Csehországban azért került két évvel ezelőtt bevezetésre a hangfelismerés, hogy a cég piaci helyzetén javítsanak. Csehország azoknak a ritka piacoknak az egyike, ahol a helyi kereső, a Seznam képes volt megszorongatni a Google-t.

A több száz, viszonylag sokak által beszélt nyelvvel is terveznek a keresőcégnél a jövőben. Moreno szerint jövőre fog megjelenni a szuahéli verzió, amit Kenyában, Tanzániában és Ugandában is beszélnek. Ez egy nagy piac, ahová a számítástechnika Moreno szerint nem a személyi számítógépekkel, hanem az okostelefonokkal fog hamarosan betörni. Fontos, hogy addigra a Google is készen álljon a megfelelő háttérrel, különösen azért, mert ezekben a térségekben még viszonylag alacsony az írástudók száma.

Sikertelen találatokból tanul tovább

Tesztünk a magyar hangvezérlésről

Moreno szerint a hangvezérlés nemcsak egy újabb érdekes, ám idővel kikopó funkció, hanem valóban hasznos kiegészítő. Az okostelefonokon körülményes gépelni, kicsi a hely az ujjak számára, sokszor mellényomnak az emberek. Ráadásul folyamatosan bámulni kell a képernyőt, míg a hagyományos gombos telefonok kezelése sokaknak csukott szemmel is ment. Erre nyújtana megoldást a hangvezérlés, ami viszont még korántsem tökéletes - és bár nincs arra garancia, hogy valaha is az lesz -, de öntanuló algoritmusának köszönhetően folyamatosan javul. Moreno szerint úgy kell elképzelnünk az öntanulást, hogy a rendszer automatikusan, három-négy havonta korrigálja magát: veszi a hangkereséseket, és összenézi őket a találatokkal, hogy melyek voltak sikeresek, és melyek nem. Valószínű, hogy a magyar rendszer is még az idén frissülni, fejlődni fog.