Mostantól megérti a magyar szót az iPhone

2011.11.16. 10:28

Próbáink során legalább nyolcvanszázalékos biztonsággal képes szöveggé alakítani az iPhone vagy iPad készüléknek feolvasott magyar nyelvű szöveget egy új alkalmazás. A Dragon Dictation teljesen ingyenes lesz, de használatához mobilinternetes kapcsolatra is szükség van.

Tesztünk során inkább a gépírásban jeleskedő, hadaró újságírókkal és rádiós múlttal rendelkező, profin hangsúlyozó, kellemes hangú kollégákkal egyaránt kipróbáltattuk a budapesti központtal is rendelkező Nuance cég ingyenes applikációit, melyek egyikének diktálni lehet, a másikkal pedig webes kereséseket lehet végrehajtani az iPhone vagy iPad-készülékhez beszélve. A megoldás nem csak a legújabb iPhone 4S-sel kompatibilis, hanem a korábbi, iOS 4-es rendszert használó régebbi iPhone, iPad és iPod Touch modellekkel is használható.

A készüléknek előbb Békés Pál A kétbalkezes varázsló című meseregényének egy bekezdését olvasták fel kollégáink, később áttértünk a Karinthy-fordította Micimackó egyik részletére.


Hangutánzó szavakkal és helynevekkel lehet megzavarni a diktálós programot

Háttérzajtól, hangtól és beszédsebességtől függetlenül remekül teljesített a Dragon Dictation. Ugyan egy olyan felvétel sem készült, amelyet azonnal el lehetett volna küldeni közlésre, de a legtöbb esetben a hangból szövegfájllá alakított szövegben csak néhány módosítást kellett eszközölni, ráadásul a programok képesek tanulni, így az első próbák után egyre kevesebb hibát ejtettek, a végeredmény pedig csaknem teljesen hibátlan szöveg lett.

Megfigyelésünk szerint a hangsúlyozás okozta a legnagyobb problémát a programnak, mondatrészek határán gyakran tévedett a Dragon Dictation. A tesztszövegnek használt Micimackó-bekezdés döngicsélés szavával sokadjára sem sikerült megbirkóznia a programnak, rendre gőgicsélésnek értette. A többi hangutánzó szóval is elbánt a program, aki loccsanásról, poccsanásról vagy zakkanásról akar smsezni, az jobban teszi, ha begépeli ezeket a szavakat. A nevekkel sincs kibékülve a program, teljesen esetleges, hogy a város- és személyneveket ki tudja-e találni a Dragon-program, vagy keres helyettük egy hasonló hangzású magyar szót. Minél mindennapibb a szöveg, annál jobb a hangfelismerő hatékonysága, egy kocsmázásra, koncertlátogatásra felszólító smst már első próbálkozásra is felismer, a szakkifejezéseket tartalmazó leveleket még célszerűbb kézzel írni.

Amerikába küldi a hangunkat

Az Apple legújabb iPhone-jába épített Siri-szolgáltatáshoz hasonló funkciókat biztosító program a számítási felhőn keresztül működik: az eszköz gyakorlatilag csupán felveszi a hangot és továbbítja egy amerikai szerverre, amely elvégzi annak elemzését.

A hangfelismerő programot kifejlesztő cég európai üzletágának vezetője, Reimund Schmald az [origo]-nak elmondta, hogy a Dragon Dictation önálló tanulásra is képes. Nem igényli, hogy használója manuálisan javítgassa át a hibás szavakat, a felhőben futó program maga is újraértékeli a korábban felismert hangsorokat, de manuálisan is meg lehet adni változtatásokat, ezeket a rendszer megjegyzi, és tanul belőlük.

Forrás: Nuance
A hangvezérelt Dragon Search segít a neten keresgélni és wikipédiázni

Schmaldtól megtudtuk, hogy a kipróbáláshoz még a hivatalos premier előtt rendelkezésünkre bocsátott applikáció annál kisebb hibaaránnyal dolgozik, minél többen használják. Mivel a Dragon Dictation és a Dragon Search csak néhány nap múlva kerül fel az Apple App Store-jába, néhány hét múlva várható, hogy elég sokan használni fogják, így érezhetően javulni fog hatékonysága.

Ehhez hasonló egyébként a Google Fordító szolgáltatásának a működési elve is, amelynek tudása a bevitt szöveg mennyiségének növekedésével, a felhasználók által javított hibás fordítások szaporodtával lett egyre okosabb.

Fotó: Tuba Zoltán [origo]
A felhőben tartják agyukat, ezért internetkapcsolat nélkül nem működnek a Dragon-szoftverek

A Nuance szolgáltatása nem csak a gépi intelligenciára támaszkodik, időnként nyelvtechnológusok is ellenőrzik adatbázisának minőségét. Így hiába próbálnák meg vicces kedvű hackerek például arra tanítani a hangfelismerőt, hogy a hétköznapi kifejezéseket például csúnya szavaknak ismerjék fel, az ellenőrzések során az ilyen próbálkozásokra fény derülne - tudtuk meg a cégtől.

Egyelőre csak iPhone-ra jelenik meg

A Dragon Dictation és a hangfelismerős keresésre képes Dragon Search november 17-én jelenik meg az Apple magyar App Store-jában. Mindkét program ingyenes lesz, az azonnali pénzszerzés helyett egyelőre a működő magyar hangfelismerés létét akarja demonstrálni a Nuance a szoftverekkel. A cég nem dolgozik a program androidos és Windows Phone 7-es verzióján - bár házon belül készítettek egy androidos tesztverziót - a Nuance által biztosított ingyenes programozói felületre azonban bárki építhet saját programot, így a titkárnő nélküli diktálás az Apple készülékein kívül eltérő eszközökön is elérhetővé válhat.

A Nuance képviselői ugyan nem közölték, hogy meddig lesz ingyenes a két Dragon-program, ám az iPhone és iPad felhasználóknak valószínűleg nincs félnivalójuk. A cég nem az appokból jut pénzhez, hanem az általa kidolgozott technológiákat licenceli orvosi felhasználásra, telefonos ügyfélszolgálati rendszerekhez, és egyéb, az állami szférában működő szövegértelmező rendszerekhez. A Nuance neve gyakran nem is szerepel a technológiát felhasználó terméken, ám lehet tudni, hogy a cég fejlesztéseinek köszönhetően tudja kimondani az előadó nevét az Apple iPod Nanója, olvassa fel a könyveket az Amazon Kindle, és tud új címet felvenni hangparancs alapján a TomTom navigációja.