Képzeljük el, hogy mi angolul mondunk ki egy kifejezést, beszélgetőtársunk azonban spanyol nyelven hallja majd az általunk kiejtett szót. A Carnegie Mellon Egyetem kutatói által kifejlesztett készülék a tervek szerint nemsokára mindezt valóban lehetővé teheti, mivel képes rá, hogy a hangosan ki nem mondott szavakat egy másik nyelven megszólaló gépi beszéddé alakítsa.

A készülék az archoz és a nyakhoz erősített elektródák segítségével érzékeli a hangosan ki nem mondott szavak formálásakor az arcizmokhoz és a nyelvhez beérkező elektromos jelek mintázatait. Mindez arra hasonlít, amikor a televízióban az anyanyelvünktől különböző nyelven megszólaló, szinkronizált filmet látunk.

Az eddig kifejlesztett fordítógépek megegyeztek abban, hogy olyan szoftvert használtak, amely csak akkor ismeri fel a beszédet, ha hangosan is kimondjuk a szavakat. Ez azonban megnehezíti, hogy valódi párbeszédet folytassunk valakivel, mivel a beszélőnek szavai kiejtése után egy gomb megnyomásával kell lefordíttatni a szöveget az adott nyelvre. Az új eszköz azonban részben már képes rá, hogy kiküszöbölje ezt a problémát.

Az automatikus fordítógép első változatát 2005 októberében mutatták be: ez a készülék már felismerte az arc és a nyaki izmok által a beszéd közben továbbított elektromos jeleket, és ezeket olyan beszéddé alakította, amelyet egy gép olvasott fel. A laptopon futó program kínai nyelvről fordított angolra vagy spanyolra, de csak egy nagyjából száz szavas szókinccsel rendelkezett. Tanja Schultz és munkatársai most annyiban fejlesztették tovább ezt a rendszert, hogy a program elméletileg már korlátlan mennyiségű kifejezést is képes felismerni. A kutatóknak mindezt úgy sikerült elérniük, hogy a gép nemcsak a szavakat, hanem a szavakat felépítő beszédhangokat (fonémák) is azonosítja. Így például ahhoz, hogy a gép angolból egy másik nyelvre fordítson, a felhasználónak mindössze az angol nyelvben használatos negyvenöt beszédhangot kell betáplálnia a gép memóriájába - olvasható a New Scientist hírportálján.

A program az esetek egy részében a beszédhangok olyan sorozatát is sikerrel lefordítja, amelyeket csak részlegesen képes azonosítani: ezekben az esetekben olyan szót választ ki, amely a legnagyobb valószínűséggel egyezik meg a beszélő által kiejtett szóval.