Delfinnyelvre tanítja a Google a mesterséges intelligenciát

Vágólapra másolva!
A Google egy olyan nyelvi modellt fejleszt, amely segíthet kommunikálni a delfinekkel. A delfinekkel való beszélgetés régi álma az embereknek.
Vágólapra másolva!

A delfinek intelligenciájukról és szociális készségeikről híresek. Ezek a nagyméretű aggyal rendelkező tengeri emlősök egyedi kattintásokkal és füttyökkel kommunikálnak, és úgy tűnik, felismerik saját „nevüket” is. A mesterséges intelligencia terén elért nagy előrelépések felélesztették néhány tudós álmát, hogy végül megértsük, mit mondanak a delfinek. De mi lenne, ha mi, emberek válaszolni is tudnánk?

foltos delfin
Atlanti foltos delfin (Stenella frontalis)
Fotó: Connect Images

A cikkben írunk többek között arról, hogy

  • miként segít a mesterséges intelligencia megérteni a delfinek szavait,
  • mik az esélyei a delfinekkel való beszélgetésnek,
  • mennyire tekinthető nyelvnek a delfinek kommunikációja.

Kétirányú kommunikáció a delfinekkel 

Most néhány kutató úgy véli, hogy a delfinekkel való kétirányú kommunikáció egy formája a láthatáron lehet. A Georgia Institute of Technology és a Wild Dolphin Project (WDP) nonprofit szervezettel együttműködve a Google bejelentette, hogy előrelépést ért el abban, amit a csapat a delfin vokalizációk első nagy nyelvi modelljének (LLM) nevez, a DolphinGemmanak. 

A WDP, amelynek tudósai 40 éve tanulmányozzák az atlanti foltos delfineket (Stenella frontalis), akusztikus adatokat szolgáltatott a fajról az LLM betanításához. A Georgia Tech és a Google csapatai ezután arra kérték a modellt, hogy generáljon „delfinszerű” hangsorozatokat.

„A fele háttérzaj volt, amit az óceántól várunk” – mondja Thad Starner számítógépes tudós a Georgia Techtől és a Google DeepMindtól. De a többi hiteles hangzású kattintás, fütty és sorozatos kattogás volt – gyors kattintássorozatok, amelyeket a delfinek gyakran hallatnak harc és más közeli viselkedés során. 

Hagyományos számítógépes program nem képes ilyenre 

„Amikor először hallottam visszajátszva..., táncoltam a szobában” – mondja Starner. Még nem tudta reprodukálni a sorozatos kattogásokat a hagyományos számítógépes programjaival. A hang programozott előállításához egy embernek kell kódot írnia, de az LLM-ek függetlenül hoznak létre utasításokat új hangok készítéséhez, az adatokból tanultak alapján. 

A csapat most azt szeretné kideríteni, hogyan egészíti ki az MI a vokalizációs sorozatokat – „mint amikor a Google-ba gépelgetek, és az befejezi a mondatomat” - mondja Denise Herzing, a WDP alapítója. 

Manuálisan körülbelül 150 évbe telne, hogy végigmenjünk az összes adaton, és megpróbáljuk kivenni ezeket a mintázatokat. 

Az MI-elemzés használata nemcsak gyorsabb, de „lehetőséget adhat arra, hogy olyan mintázatokat lássunk, amelyeket emberi szempontból esetleg nem vennénk észre” – mondja Thea Taylor, a Sussex Dolphin Project ügyvezető igazgatója, aki nem vesz részt az új projektben. 

Hogy reagálnak a delfinek az MI által kitalált szavakra? 

Ha az LLM következetesen ugyanazokat a válaszokat adja vissza, az felfedhet egy mintázatot. A WDP videóadatainak áttekintése ezután megmutathatja a kutatóknak, hogy mit csinálnak a delfinek, amikor egy adott hangot adnak ki: Például a barátaikkal játszanak, vagy egy riválissal harcolnak? 

A csapat azt is szeretné felfedezni, hogyan reagálnak a delfinek, amikor a kutatók új vokalizációkat – az MI által kitalált „delfinszerű” szavakat – mutatnak be nekik olyan tárgyakra való utalásként, mint a tengeri fű vagy egy játék. 

Ehhez a csapat a CHAT (cetacean hearing augmented telemetry) nevű technológiát tervezi használni. A Starner csapata által a Georgia Techen kifejlesztett CHAT egy olyan eszközből áll, ami kicsit úgy néz ki, mint egy Szellemirtók jelmez: egy búvár mellkasára hámmal rögzített csomag felismeri a hangot, míg egy alkarhoz rögzített egység hangokat játszik le. 

A CHAT berendezés felszerelése Adam Pack kutatóra
Fotó: Matthias Hoffmann-Kuhnt / Wild Dolphin Project

Két kutató lejátssza az LLM által kitalált delfinszerű hangok egyikét, miközben egy tárgyat tart vagy ad át (lényegében elnevezve azt „delfinül”), majd megfigyelik, mit tesznek a delfinek látszólagos válaszként. Például utánoznák-e a hangot, hogy elkérjék a tárgyat? 

Ez egy érdekes megközelítés, de a kutatóknak vigyázniuk kell, hogy ne tanítsák akaratlanul a delfineket – mondja Taylor. Ha a delfinek megismétlik a hangot, „el kell gondolkodnunk azon, hogy ez valóban a nyelv megértése-e - vagy ugyanaz, mint amikor megtanítunk egy kutyát leülni, mert jutalmat kap.” 

Van-e valóban nyelvük a delfineknek? 

Ráadásul még mindig nem egyértelmű, hogy a delfineknek technikailag egyáltalán van-e nyelvük. Arik Kershenbaum, a Girton College-ban az állati kommunikációt tanulmányozó zoológus, aki nem vesz részt a projektben, úgy gondolja, hogy nincs. 

A nyelv végtelenül összetett” – mondja. „Ha minden tárgyra külön szavad van a környezetedben, az még nem nyelv.

 

Kershenbaum szerint korlátai vannak annak, amit a delfinek közvetíteni tudnak a vokalizációikon keresztül. 

A delfinfüttyökben vannak változatok, és nem tudjuk, hogy ezek különböző dolgokat jelentenek-e. „Nem egyértelmű, hogy a delfineknek vannak-e szavaik” – jegyzi meg. Ez potenciális probléma; az LLM-ek az elemzésük elvégzéséhez szószerű szimbólumsorozatra támaszkodnak. Az a kérdés, hogy két hasonló – de nem azonos – szimbólum (fütty) ugyanazt jelenti-e, megnehezítheti az AI számára a sorozat értelmezését. 

Különbségek lehetnek a populációk között 

Érdemes arra is emlékezni, hogy ez csak egy populáció egy fajon belül - mondja Taylor. „Az egyedi hálózatoknak lehetnek saját vokalizációs különbségeik” – teszi hozzá. 

Kershenbaum a projektet a Star Trek IV: A hazatérés című filmhez hasonlítja: amikor az Enterprise űrhajó legénysége megpróbál kommunikálni a hosszúszárnyú bálnákkal, tudják szimulálni a bálnaéneket, de annak jelentését nem. 

„Ez nem fordításról szól” – mondja. Tehát nem fogunk a közeljövőben úgy beszélgetni a delfinekkel, ahogy azt általában értjük. Ha azonban úgy tűnik, hogy az állatok felismerik a komplex MI által generált sorozatokat jelentéssel bíróként, „az betekintést nyújt a kognitív képességeikbe” - mondja Kershenbaum. 

 Forrás: Scientific American

 

Google News
A legfrissebb hírekért kövess minket az Origo Google News oldalán is!