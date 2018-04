A Microsoft kínai részlege érte el az áttörést, melynek köszönhetően szinte olyan természetességgel beszélhetünk egy mesteréges intelligencia által vezérelt chatbottal, mintha azt egy emberrel tennénk. Hamarosan a világ minden tájára megérkezhet az újdonság.

A chatbotok ugyebár azok a szoftverek, amikhez beszélhetünk akár szóban, akár írásban, és ők igyekeznek rájönni, hogy mit is akarunk megtudni tőlük, és arra megpróbálnak válaszolni. Eddig alapvetően az volt a lényeg és a fejlesztés fő csapásiránya, hogy ne konkrét parancsokat kelljen mondanunk vagy beütnünk a gépnek, hanem a hétköznapi nyelven írt szöveget is megértsék.

Ez már egy ideje viszonylag jól megy, és a chatbotok tényleg képesek nagyjából természetes módon megérteni, hogy mit akarunk tőlük, és arra válaszokat adni. Egy dolog azonban mostanáig nem valósult meg: a full-duplex kommunikáció. Itt nagyon egyszerűen arról van szó, hogy eddig egy chatbottal úgy történt a kommunikáció, mintha egy walkie-talkie segítségével beszélnénk valakivel: az egyik fél mond valamit, majd arra reagál a másik.

Nyilvánvaló, hogy a hétköznapi életben az emberek nem így kommunikálnak, hacsak nincsenek erre valamiért rákényszerítve. Jellemzően a beszélgetés inkább úgy működik, hogy az emberek egyszerre figyelnek és beszélnek, gyakran megtippelve, hogy a társunk hogyan fogja befejezni a mondatot, és ezáltal belevágva a szavába, amikor ezt érvényes módon meg lehet tenni.

De nem csak arról van szó, hogy az emberek sokszor már egy mondat közepén sejtik, hogy mire akar kilyukadni a másik, és erre előkészítik a válaszukat, azzal vagy belevágva, vagy nem a másik szavába. Arról is van szó, hogy az emberek az adott témában teljesen új gondolatokkal tudnak előjönni, hogy megtörtjenek egy kínosnak tűnő csendet, vagy amikor azt érzik, hogy a másik hallani akar valamit. Vagy akár hirtelen egy teljesen másik témába is bele tudunk kezdeni, hogy tovább vigyük a beszélgetés menetét.

A Microsoft pedig úgy gondolja, hogy ebben a kérdésben most végre sikerült áttörést elérnie. Erről a vezető mérnök Li Zhou számolt be, aki a Kínában rendkívül népszerű Xialoce nevű chatbot fejlesztését irányítja, de az itt kikutatott technológiát a világ többi táján használt chatbotokra is átültetik majd a közeli jövőben, így például az Egyesült Államokban használt Zo is megkapja az új képességeket.

Zhou szerint a legfontosabb, hogy a Xialoce most már menet közben tudja megtippelni, hogy mit akar mondani a másik, így fel tud készülni a válasszal. Ezzel kiiktatható a furcsa várakozási idő, amire a mesterséges intelligenciának korábban szüksége volt ahhoz, hogy reagálni tudjon. Ezen kívük egy másik problémára is megszületett a megoldás: míg korábban jellemzően minden válasz előtt meg kellett szólítanunk a gépet valamilyen kódszóval, hogy tudja, hozzá beszélünk (például ki kellett mondani a Xiaolace nevet), addig most már a beszélgetés természetes folyamatát értelmezve magától tudni fogja, hogy hozzá beszélünk.

De más módokon is fejlődött a rendszer. Most már például képes arra, hogy megszakítson valamit, egy kicsit mással foglalkozzon, majd visszatérjen. Például elkezd beszélni valamilyen témáról, mondjuk a második világháború egy eseményéről. Ha közben megkérjük, hogy egyébként kapcsolja már fel a villanyt a szobában, akkor ezt megteszi, majd visszatér a történethez, amiben előzőleg benne volt. Ez szintén természetesebbé teszi az egész interakciós folyamatot, hiszen emberek között is gyakori, hogy habár egy bizonyos témáról beszélünk, egy-egy pillanatra elkanyarodunk másfelé.

Érdemes megemlíteni, hogy ezek a chatbotok alapvetően más célt szolgálnak, mint például a Microsoft alap intelligens asszisztense, a Cortana. Utóbbi inkább a produktivitást, a gyors, hanggal történő vezérlést vagy információszerzést tartja szem előtt, míg a chatbotok alkalmasabbak hosszabb csevegésekre, jobb esetben humorérzékük is van, és akár játszani is tudnak velünk.

