Gyors tempóban terjed a generatív mesterséges intelligencia használata a cégeknél, már olyan is létezik, ahol az emberi munkaerő felvételének kérésekor bizonyítani kell, hogy nem lehet MI-vel elvégezni az új ember munkáját.
Most a Carnegie Mellon Egyetem kutatói újszerű kutatást végeztek, arra voltak kíváncsiak, hogy vajon mi történne egy kizárólag MI-alapú dolgozókkal feltöltött cégnél. Ennek érdekében három modellel egy valódi szoftvercég hétköznapi működését próbálták a lehető legélethűbben szimulálni, többek közt pénzügyi elemzőket, szoftvermérnököket, projektmenedzsereket, műszaki igazgatót, HR-eseket utánoztak a botokkal.
A sejthetőnek megfelelően nem mentek simán a dolgok a TheAgentCompany nevű cégnél.
A fiktív dolgozókra bízott feladatok végrehajtásában az Anthropic Claude 3.5 Sonnet rendszer bizonyult a legjobbnak, ez a rábízott feladatok 24%-át tudta elvégezni, átlagosan 30 lépéses menetekben. Ez nem túl jó arány, ráadásul feladatonként borzasztóan drága 6 dollárra jött ki a költsége, ami gazdaságilag vállalhatatlanul magas összeg.
A másik két tesztelt modell teljesítménye még ennél is nagyságrendileg rosszabb volt, a Google Gemini 2.0 Flash 40 lépéses menetekben a feladatok 11,4%-át tudta sikeresen elvégezni, míg az Amazon Nova Pro v1 húsz lépéses menetekben 1,7% sikerességi arányt tudott felmutatni.
A kutatók értékelése alapján a MI-alapú munkavállalók a józan paraszti ész nagymértékű hiányáról tettek tanúbizonyságot, a szociális képességeik erősen alulfejlettnek bizonyultak, továbbá az interneten történő böngészés tudományában sem jártasak.
A kísérletek során a rendszerek szimpla felsülése mellett történtek érdekesebb jelenetek is. Az egyik legemlékezetesebb esetnek az bizonyult, mikor az egyik bot nem találta meg a vállalati chatben azt a személyt, amelyikkel egyeztetnie kellett volna az adott ügyben. A probléma megoldása érdekében gordiuszi csomós elmetrükköt talált ki: átnevezte az egyik „kollégát” a megfelelő névre, hogy legyen kivel társalognia.
Ha szeretne még több érdekes techhírt olvasni, akkor kövesse az Origo Techbázis Facebook-oldalát, kattintson ide!