Digitális kihalás fenyegeti a magyar nyelvet

Gondok a magyar nyelvvel a digitális jövőben, az Android hangfelismerő szoftvere
Vágólapra másolva!
Rosszul fest a magyar nyelv jövője a digitális korban. Attól ugyan a szakértők szerint sem kell félni, hogy nyelvünk eltűnik az internetről, és nem válik felismerhetetlenné sem a magyar az egyre több átvett angol szó miatt. Elképzelhető viszont, hogy nyelvtechnológiai fejlesztések hiánya miatt a jövő kütyüivel csak angolul beszélgethetünk majd.
Vágólapra másolva!

Sanyarú jövő vár a magyar nyelvre a digitális térben az európai nyelvek napja alkalmából kiadott jelentés szerint. A Magyar Tudományos Akadémia Nyelvtudományi Intézetének kutatói és a BME szakértői által jegyzett tanulmány szerint ha a jelenlegi trendek folytatódnak, a jövő iPhone-ja sem fog érteni a magyar beszédből.

Előre felvett szövegekből legózzák össze az útbaigazítást a jelenleg kapható okosmobilok navigációs szoftverei, ezért napjainkban a hangfelismerő rendszerek csak a kellően rövid közlésekre tudnak rákeresni, a magyar szövegek megértésére pedig még nem képesek. Az azonnali kihalás ugyan nem fenyegeti a 13 millió ember által beszélt magyar nyelvet, de a globalizált információs társadalomban jelentősége visszaszorulhat. Lehet, hogy az emberek évszázadok múlva is magyarul fognak egymás között beszélni, ha azonban a telefonjukkal, számítógépükkel, vagy a következő évszázadban elérhetővé váló intelligens háztartási robotokkal angolul kénytelenek beszélni, akkor annak a nyelv látja kárát.

Idegenek vagyunk

A nyelvünk digitális túlélésének esélyeit rontja, hogy míg az EU nyelvei túlnyomórészt az indo-európai nyelvcsalába tartoznak, addig a magyar finnugor eredetű. Ez eltérő nyelvtani megoldásokkal, felépítéssel jár, emiatt a franciára vagy olaszra kifejlesztett szoftverek csak módosítások után alkalmazhatók nyelvünkre.

Fotó: Mudra László [origo]
Egyszerű mondatokra már rá lehet keresni az androidos telefonokon

A rokonnyelvek jelentette előnyt látványosan megmutatta a gépi fordítóprogramokat tesztelő Euromatrix-vizsgálat. A legjobb eredményeket az egymáshoz közel álló (például olasz-francia) nyelvek között érték el. A magyar fordítóeszközök a teszt szerint angolra illetve angolról közepesen képesek fordítani, a többi európai nyelv irányába pedig még gyászosabb eredmények születtek. A jelenlegi gépi fordítások pedig csak a megértést szolgálják, a vizsgálatban született legjobb eredmény sem közelítette meg azt, amire az emberi fordítók képesek.

A magyarban komoly szerephez jutó toldalékok, ragok miatt a nyelvünkhöz készült szövegekben először például a szótőt kell megtalálni, utána kezdődhet meg a szöveg feldolgozása. Ahhoz pedig, hogy a szoftver ne csak a szavakat találja meg, hanem a szövegkörnyezetből jelentésre is következtessen, további, számítógépes nyelvészek által létrehozandó programokra van szükség.

Hátul vagyunk a tornasorban

A nemzetközi vizsgálatban résztvevő kutatók szerint Európában egyedül az angol nyelvre vannak megfelelő minőségű beszédtechnológiai, gépi fordítási, szövegelemző eszközök, valamint erőforrások. A nagy európai nyelvnek számító franciának, németnek, olasznak és a spanyolnak is csupán mérsékelt a támogatottsága. A magyar, a bolgár vagy a negyvenmillió anyanyelvi beszélő által használt lengyel nyelv pedig csak szórványos támogatottsággal rendelkezik, emiatt sorolták ezeket a nyelveket a komolyan veszélyeztetett kategóriába.

Fotó: Pályi Zsófia [origo]
Fejlett nyelvi szoltáltatásokat nem kínálnak a mobilok

A Meta-Net fehér könyv szerint a magyar nyelvtechnológusok elsősorban az erőforrások terén teljesítenek jól. Számos olyan magyar szövegtár, többnyelvű mondattár és egyéb korpusz van, amelyekre kutatásokat lehet alapozni. A magyar nyelv nehézsége, illetve a többi európai nyelvtől való eltérései miatt azonban bőven van munkájuk a magyar nyelvtechnológusoknak.

Az európai nyelvtechnológiai fejlesztések iránt érdeklődőknek a Magyar Tudományos Akadémia irányításával, nemzetközi összefogással készülő EU-s fordítógépet ajánljuk kipróbálásra. Az 2010 óta fejlesztett ITranslate4.eu már képes versenyre kelni a gigantikus adatbázisból dolgozó Google Translate fordítómotorjával. Az egy-egy mondatos feladatokra pedig a BME Média Oktató és Kutató Központ Hunglish nevű oldalát ajánljuk, amely angolul és magyarul is elérhető könyvekből, cikkekből és filmfeliratokból tanulta meg a nyelvet. Aki pedig mélyebben érdekel magyar nyelv jelentette kihívások és a jövő szöveget értő és válaszoló szoftverei, az a Kutatók Éjszakáján a MÁV-pénztáros robotról hallgathat előadást.


Pénz kell, hogy versenyre keljünk az angollal

Közvetlen veszély tehát nem fenyegeti a magyar nyelvet. A fehér könyv megállapításai szerint azonban sokat kell még arra várnunk, hogy a számítógépünk vagy az okostelefonunk megértse a mondatainkat, válaszolni tudjon a kérdéseinkre, és ha arra kérjük, pár mondatban össze tudjon foglalni egy hosszú cikket. Ezeken a fejlett területeken az angol nyelv áll a legjobban, mert nagy mennyiségű fejlesztést végeztek az amerikai védelmi minisztérium kutatási alapjából. Hasonló erőforrásokat kellene a kutatásra költeni ahhoz, hogy a magyar, a cseh vagy a lengyel is olyan eséllyel induljon, mint a kor közös nyelvének számító angol.