A delfinek intelligenciájukról és szociális készségeikről híresek. Ezek a nagyméretű aggyal rendelkező tengeri emlősök egyedi kattintásokkal és füttyökkel kommunikálnak, és úgy tűnik, felismerik saját „nevüket” is. A mesterséges intelligencia terén elért nagy előrelépések felélesztették néhány tudós álmát, hogy végül megértsük, mit mondanak a delfinek. De mi lenne, ha mi, emberek válaszolni is tudnánk?
A cikkben írunk többek között arról, hogy
Most néhány kutató úgy véli, hogy a delfinekkel való kétirányú kommunikáció egy formája a láthatáron lehet. A Georgia Institute of Technology és a Wild Dolphin Project (WDP) nonprofit szervezettel együttműködve a Google bejelentette, hogy előrelépést ért el abban, amit a csapat a delfin vokalizációk első nagy nyelvi modelljének (LLM) nevez, a DolphinGemmanak.
A WDP, amelynek tudósai 40 éve tanulmányozzák az atlanti foltos delfineket (Stenella frontalis), akusztikus adatokat szolgáltatott a fajról az LLM betanításához. A Georgia Tech és a Google csapatai ezután arra kérték a modellt, hogy generáljon „delfinszerű” hangsorozatokat.
„A fele háttérzaj volt, amit az óceántól várunk” – mondja Thad Starner számítógépes tudós a Georgia Techtől és a Google DeepMindtól. De a többi hiteles hangzású kattintás, fütty és sorozatos kattogás volt – gyors kattintássorozatok, amelyeket a delfinek gyakran hallatnak harc és más közeli viselkedés során.
„Amikor először hallottam visszajátszva..., táncoltam a szobában” – mondja Starner. Még nem tudta reprodukálni a sorozatos kattogásokat a hagyományos számítógépes programjaival. A hang programozott előállításához egy embernek kell kódot írnia, de az LLM-ek függetlenül hoznak létre utasításokat új hangok készítéséhez, az adatokból tanultak alapján.
A csapat most azt szeretné kideríteni, hogyan egészíti ki az MI a vokalizációs sorozatokat – „mint amikor a Google-ba gépelgetek, és az befejezi a mondatomat” - mondja Denise Herzing, a WDP alapítója.
Manuálisan körülbelül 150 évbe telne, hogy végigmenjünk az összes adaton, és megpróbáljuk kivenni ezeket a mintázatokat.
Az MI-elemzés használata nemcsak gyorsabb, de „lehetőséget adhat arra, hogy olyan mintázatokat lássunk, amelyeket emberi szempontból esetleg nem vennénk észre” – mondja Thea Taylor, a Sussex Dolphin Project ügyvezető igazgatója, aki nem vesz részt az új projektben.
Ha az LLM következetesen ugyanazokat a válaszokat adja vissza, az felfedhet egy mintázatot. A WDP videóadatainak áttekintése ezután megmutathatja a kutatóknak, hogy mit csinálnak a delfinek, amikor egy adott hangot adnak ki: Például a barátaikkal játszanak, vagy egy riválissal harcolnak?
A csapat azt is szeretné felfedezni, hogyan reagálnak a delfinek, amikor a kutatók új vokalizációkat – az MI által kitalált „delfinszerű” szavakat – mutatnak be nekik olyan tárgyakra való utalásként, mint a tengeri fű vagy egy játék.
Ehhez a csapat a CHAT (cetacean hearing augmented telemetry) nevű technológiát tervezi használni. A Starner csapata által a Georgia Techen kifejlesztett CHAT egy olyan eszközből áll, ami kicsit úgy néz ki, mint egy Szellemirtók jelmez: egy búvár mellkasára hámmal rögzített csomag felismeri a hangot, míg egy alkarhoz rögzített egység hangokat játszik le.
Két kutató lejátssza az LLM által kitalált delfinszerű hangok egyikét, miközben egy tárgyat tart vagy ad át (lényegében elnevezve azt „delfinül”), majd megfigyelik, mit tesznek a delfinek látszólagos válaszként. Például utánoznák-e a hangot, hogy elkérjék a tárgyat?
Ez egy érdekes megközelítés, de a kutatóknak vigyázniuk kell, hogy ne tanítsák akaratlanul a delfineket – mondja Taylor. Ha a delfinek megismétlik a hangot, „el kell gondolkodnunk azon, hogy ez valóban a nyelv megértése-e - vagy ugyanaz, mint amikor megtanítunk egy kutyát leülni, mert jutalmat kap.”
Ráadásul még mindig nem egyértelmű, hogy a delfineknek technikailag egyáltalán van-e nyelvük. Arik Kershenbaum, a Girton College-ban az állati kommunikációt tanulmányozó zoológus, aki nem vesz részt a projektben, úgy gondolja, hogy nincs.
A nyelv végtelenül összetett” – mondja. „Ha minden tárgyra külön szavad van a környezetedben, az még nem nyelv.
Kershenbaum szerint korlátai vannak annak, amit a delfinek közvetíteni tudnak a vokalizációikon keresztül.
A delfinfüttyökben vannak változatok, és nem tudjuk, hogy ezek különböző dolgokat jelentenek-e. „Nem egyértelmű, hogy a delfineknek vannak-e szavaik” – jegyzi meg. Ez potenciális probléma; az LLM-ek az elemzésük elvégzéséhez szószerű szimbólumsorozatra támaszkodnak. Az a kérdés, hogy két hasonló – de nem azonos – szimbólum (fütty) ugyanazt jelenti-e, megnehezítheti az AI számára a sorozat értelmezését.
Érdemes arra is emlékezni, hogy ez csak egy populáció egy fajon belül - mondja Taylor. „Az egyedi hálózatoknak lehetnek saját vokalizációs különbségeik” – teszi hozzá.
Kershenbaum a projektet a Star Trek IV: A hazatérés című filmhez hasonlítja: amikor az Enterprise űrhajó legénysége megpróbál kommunikálni a hosszúszárnyú bálnákkal, tudják szimulálni a bálnaéneket, de annak jelentését nem.
„Ez nem fordításról szól” – mondja. Tehát nem fogunk a közeljövőben úgy beszélgetni a delfinekkel, ahogy azt általában értjük. Ha azonban úgy tűnik, hogy az állatok felismerik a komplex MI által generált sorozatokat jelentéssel bíróként, „az betekintést nyújt a kognitív képességeikbe” - mondja Kershenbaum.
Forrás: Scientific American