Hiába lehet beszélni évek óta az Androidhoz, az iOS új diktálófunkciója teljes győzelmet aratott a Google megoldásával szemben. Egy Nexus 7-hez és egy iPad Minihez beszéltünk magyarul.

Az Apple eddig nem kényeztette el a magyar felhasználóit. Míg a Google Android szoftverének már két éve diktálhatunk anyanyelvünkön, az iOS-ből csak néhány napja megjelent 8-as kiadásba került bele ez a lehetőség. Arra voltunk kíváncsiak, hogy melyik rendszer érti meg jobban a beszédünket.

Angol szavak magyar mondatban

Tesztünkhöz ötféle szöveget olvastunk be. Az elsőben azt vizsgáltuk, hogyan boldogul a rendszer, ha a magyar mondatban angol szavak is vannak.

Az eredeti szöveg: "A Microsoft évek óta képtelen felzárkózni az Apple-höz és a Google-hoz az okostelefonok piacán."

  • A microsoft évek óta képtelen felzárkózni a repül és a google 6 az okostelefonok piacán (férfihang, Android)
  • A microsoft évek óta képtelen felzárkózni az apple és a google hoz az okostelefonok piacán (női hang, Android)
  • A microsoft évek óta képtelen felzárkózni a repül és a google 6 az okostelefonok piacán (férfihang, iOS)
  • A microsoft évek óta képtelen felzárkózni az apple és a google hoz az okostelefonok piacán (női hang, iOS)

A kifejezéseket szinte hibátlanul sikerült mindkét rendszernek felismernie, azonban nemcsak a nagy kezdőbetűket, de a kötőjeleket is lespórolták a mondatból. Míg egy tisztább női hang esetén, vagy ha jobban artikulál az ember, felismerték az "apple" szót a mondatban, egyéb esetekben a magyar épül, repül szavakra cserélték le a szoftverek. Ha a magyar mellett az angol nyelvet is megadjuk a hangalapú gépelés beállításainál, jobb eredményt kaphatunk.

Egyszerre olvastuk fel ugyanazt a mondatot az iPadnek és a Nexus 7 tabletnekFotó: Origo

Megért egy e-mail címet?

Második tesztünkben egy hivatalos üzenetet diktáltunk be, amelyben egy kérdést és egy e-mail címet helyeztünk el nehezítésként.

Az eredeti szöveg: "Kedves Ottó! Jól sikerült a rendezvény? Csatolt fájlban elküldtem a prezit, kérlek, okézd le holnap estig az info@origo.hu címre. Köszönöm!"

  • Kedves ottó jól sikerült a rendezvény csatolt fájlban elküldtem a brit kérlek oké holnap estig az info kukac origó.hu címre köszönöm (férfihang, Android)
  • Kedves ottó jól sikerült a rendezvény csatolt fájlban elküldtem a közép kelet oké holnap estig az info kukac origo.hu címre köszönöm (női hang, Android)
  • Kedves Ottó jólsikerült a rendezvény csatolt fájl van elküldtem a prezit kérlek okézd le holnap estig az info@origo.hu címre köszönöm (férfihang, iOS)
  • Kedves Ottó jól sikerült a rendezvény csatolt fájlban elküldtem a prezit kérek a keze holnap estig az info@origo.hu címre köszönöm (női hang, iOS)

Mindkét rendszernek sikerült megbirkóznia a névvel, de míg az Android kisbetűkkel írta mindkét próbánál, addig az iOS észlelte, hogy tulajdonnévről van szó, és rögtön átformázta a kezdőbetűt nagyra. A prezit rövidítés túl nagy kihívásnak bizonyult, az iOS is csak az artikulált női hangnál találta el helyesen a kifejezést, ahogy az "okézd le" is csak egyszer sikerült az iPadnek. Az e-mail címben lévő kukacot szintén csak az iOS ismerte fel, és írta ki helyesen. Már itt látszódott, hogy az Apple szoftvere több speciális karakter felismerésére képes.

Elboldogulnak a ...-tal?

A harmadik vizsgálat során az angolból hiányzó hangokat próbáltuk ki, mint például a gy, ty, zs. Emellett a speciális karakterek, mint egy felkiáltójel és egy "..." volt még a kihívás.

Az eredeti szöveg: "Szia Gyöngyi! Baleset történt Hegyeshalomnál, kések fél órát, a pátyi találkozót valószínűleg nem tudjuk időben megtartani... Köszi: Zsuzsa"

  • Szia gyöngyi baleset történt hegyeshalomnál kések fél órát apátitalálkozott valószínűleg nem tudjuk életben tartani pont pont pont köszi kettőspontzsuzsa (férfihang, Android)
  • Szia gyöngyi baleset történt hegyeshalomnál kések fél órát találkozott valószínűleg nem tudjuk időben megtartani pont pont pont köszi kettőspontzsuzsa (női hang, Android)
  • Szia Gyöngyi baleset történt Hegyeshalomnál kések fél órát a Pátyi találkozót valószínűleg nem tudjuk időben megtartani… Köszi: Zsuzsa (férfihang, iOS)
  • Szia Gyöngyi baleset történt Hegyeshalomnál kések fél órát akárki találkozott valószínűleg nem tudjuk időben megtartani… Köszi: Zsuzsa (női hang, iOS)

A Google szoftvere ez esetben sem birkózott meg a tulajdonnevekkel, ugyanakkor a magyar hangokat nagyjából felismerte. A Páty helységnév melléknevesült alakja már kifogott a diktálófunkción: hol teljesen elhagyták, hol értelmezni próbálták, és egy másik szóval helyettesítették, hol sikerült felismerni a tulajdonnevet, de az i-képző ellenére megmaradt a nagy kezdőbetű.

Az Apple szoftvere több mint ötven speciális karakter felismerésére és átkonvertálására képes, szemben a Google rendszerével, amelybe összesen öt alapkarakter – pont, vessző, felkiáltójel, kérdőjel és enter vagy új sor – beazonosítását programozták. Ennek tudatában nem volt meglepetés, hogy mind a "pont-pont-pont", mind a kettőspont betűkkel lett kiírva a szövegben. 

Az Android csalódást okozott: nem csak a magyar tulajdonneveket nem ismerte felForrás: Origo

Hogyan írjuk a Thököly utat?

Negyedik szövegünk egy intézmény, és annak hivatalos postacíme volt, szándékosan nehezebb tulajdonneveket kerestünk.

Az eredeti szöveg: "Ybl Miklós Építéstudományi Kar, Budapest, Thököly út 74."

  • Eagle miklósépítéstudományi kar budapest tököli út 74 (férfihang, Android)
  • Ibl miklósépítéstudományi kar budapest tököli út 74 (női hang, Android)
  • Ybl Miklós Építéstudományi kar Budapest Thököly út 74. (férfihang, iOS)
  • Ybl Miklós Építéstudományi kar Budapest Thököly út 74. (női hang, iOS)

Az Apple szoftvere jól vette az akadályt, és szinte hibátlanul teljesítette is a feladatot. A Google ezzel szemben sem Ybl Miklóst, sem a Thököly utat nem tudta beazonosítani, annak ellenére, hogy ezen tulajdonnevek több szolgáltatásában is elérhetők: ha a térképen kerestünk rá csak a címre, nem csak a helyszínt, magát a kar épületét is azonnal kidobta (helyesen írva) találatként. Megjegyzendő, hogy ha a Thököly út elé nem tettük oda, hogy Budapest, az Android a szigetszentmiklósi Tököli útként azonosította be a keresést, míg a Siri vélhetően a GPS-adatokat is figyelembe véve rögtön a budapesti Thökölyre irányított.

Amiket a leggyakrabban diktálunk

Az utolsó körben a magyarosított helységnevet, dátumot és telefonszámot kellett felismerniük a gépeknek.

Az eredeti szöveg: "Megvannak a március 18-ra szóló jegyek Egyiptomba. Hívj a +36 1 876 5432 számon!"

  • Megvannak a március 18 szóló jegyek egyiptomba hívj a plusz harminchat 1 8 76 54 harminckettőeszem a (férfihang, Android)
  • Megvannak a március 18 szóló jegyek egyiptomba hívta plusz harminchat 1 8 56 54 harminckettő számon (női hang, Android)
  • Megvannak a március 18-ra szóló jegyek Egyiptomba hívj a plusz 30 618 7654 32-es számon (férfihang, iOS)
  • Megvannak a március 18. ESZO jegyek Egyiptomba hívta+ 30 618 76 5432 számom (női hang, iOS)

A Google szoftverén ismét kifogott – már nem meglepő – módon a helységnév, azonban a ragozott dátumot sem tudta értelmezni, a ragot inkább gyorsan el is felejtette. A speciális karakterek felismerésének hiánya is újra megmutatkozott, a plusz szócskát kiírta betűkkel. A 36-ot viszont az Android azonosította, csak betűkkel írta ki, míg az iOS a hallottak alapján ("harminchat") két külön számnak értelmezte a magyarországi előhívószámot. A tagolt felsorolást viszont az iPad értelmezte jobban, a Nexus hol a számot "hallotta félre", hol úgy döntött, hogy inkább betűvel írja ki.

Kudarcot vallott a Google szoftvere

Meglepő jelenség volt, hogy a bonyolult magyar nyelvet több esetben is az iOS újdonsült diktálófunkciója értette jobban, értelmezte és formázta át helyesebben. Ahhoz képest, hogy a Google szoftvere már két éve is a piacon van, nagy fejlődést nem mutat a program, s mintha a többi, egyébként jól működő szolgáltatásaikkal (kereső, térkép) sem kötötték volna össze, pedig ez megkönnyíthetné például a tulajdonnevek azonosítását.

 

Tesztünket egy második generációs iPad mini készüléken, iOS 8 operációs rendszerrel, illetve egy második generációs Google Nexus 7 táblagépen, Android 4.4.4 (Kitkat) operációs rendszerrel hajtottuk végre.