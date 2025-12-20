A hallucináló mesterséges intelligenciák tévedéseinek pénzügyi következményei egyre súlyosabbak, azaz egyre nagyobb összegeket érnek el. Történik ez úgy, hogy az elmúlt években robbanásszerű fejlődésen átesett, nagyon friss – és nagyon energiaigényes – iparághoz nem csak a tőzsde világának felforgatása kapcsolható, hanem azok a várakozások is, amik szerint az MI milliók munkáját teszi könnyebbé, gyorsabbá – sőt, akár egyenesen el is veheti azt. Ehhez képest azt látni, hogy a nem éppen olcsó mulatságnak számító MI műfajának költségei tovább nőnek, miután a különféle MI-alkalmazások, nyelvi modellek, egyre-másra „halluznak be” és tárnak felhasználóik elé valóságnak, tényszerűnek tűnő dolgokat, amikről kiderül, hogy részben vagy egészben sületlenségek. Mindezt vállalati környezetben.
Ez pedig nem csak valami elvont, az algoritmusok vagy a bonyolult pénzügyi tranzakciók szintjén létező dolog: például csak idén júliusban több mint 50 amerikai bírósági ügyben derült ki, hogy hamis, mesterséges intelligencia által generált jogi forrásokra hivatkoztak azokban. Ügyvédek veszítettek pereket majd függesztették fel őket emiatt, és utólag kellett tisztázniuk a bíróságokon a helyzetet – mindezt azért, mert egy MI meggyőző magabiztossággal kitalált, hitelesnek tűnő válaszokat adott. Az MI-k botrányos jogi kavarása (pontosabban az, ami a területen való alkalmazásuk alapján kiviláglik) azonban csupán a jéghegy csúcsa.
Mit jelent az, hogy „hallucinálnak” a mesterséges intelligenciák?
Mi ez a jelenség, amiről itt szó van? Tulajdonképpen az MI-k jelenleg tapasztalható működésének velejárója, amivel sokan szembesülhettek akár hétköznapi, tehát nem vállalati, üzleti vagy jogi célú felhasználásnál is: az MI-k meglepően gyakran állnak elő hihetőnek, megalapozottnak tűnő, ám valójában alaptalan állításokkal. Ennek viszont a gazdaság dimenziójában – miként a Voroni összeállításából kideül – óriási jelentősége van, mert
akár egyértelműen hibás üzleti döntéseket, pénzügyi veszteséget is okozhat, ha egy MI közölte információra vagy következtetésre támaszkodva lép tovább a szervezet egy-egy kérdésben.
A portál a 17 vezető MI-modellt gyűjtötte össze megbízhatóság és „hallucinációs hajlandóság” alapján, azt vizsgálva, ezek a mostanra már meghatározott módszertannal mért jellemzőik hogyan jelentkezhetnek a vállalatoknál MI-megoldások adaptálásában. Az összeállításból az is kiderül, hogy a tárgyalt probléma nem korlátozódik egy-két iparágra, hanem a gazdaság lényegében valamennyi szegmensében előfordul (az MI ipagág nagysága miatt is főként az Egyesült Államokból találni arra példákat, de a jelenség, ahogy az MI is, globális).
Abban ugyanis nincs iparági meghatározottság, hol hoznak a vezetők döntéseket MI generált tartalom alapján, sőt.
Egy korábban készített, iparágakon átívelő felmérés eredménye szerint a felsővezetők közel fele elismerte, hogy már hozott jelentős üzleti döntést olyan MI tartalom alapján, ami nem volt valós.
Ez önmagában figyelemet érdemel, de annak tükrében különösen, hogy mint egy nyáron publikált jelentés megállapította, az MI-projektek 70 százaléka sikertelen a vállalatoknál, vagyis nagyjából minden 10 cégből 7-nek nem sikerül a mindennapok üzleti folyamataiba integrálni az MI-t.
Ennek nem technológiai okai vannak, hanem elsősorban az, hogy a szervezetek nem a megfelelő modellt választják az adott felhasználási célra, valamint a bevezetésnél hiányzik a megfelelő folyamatszervezés és a munkatársak felkészültsége.
A nem megfelelő MI választása, illetőleg a nem a tényeken nyugvó MI-tartalomra való támaszkodás okozta összesített pénzügyi veszteség viszont gigantikus: 2024-ben 67 milliárd dollár volt.
Azt, hogy mindez iparágaktól független, egészen biztos. Nézzünk ezekre néhány konkrét példát!
- Az Air Canada chatbotja valótlan információkat közölt a visszatérítési szabályokról, az ügyből peres eljárás lett, a bíróság végül elmarasztalta a vállalatot.
- A Google Gemini nem létező pereket „hallucinált” egy napelemes vállalattal kapcsolatban.
- Mint említettük, több mint amerikai 50 ügyvédet szankcionáltak egyetlen hónap alatt, végső soron azért, mert a ChatGPT-t jogi kutatási eszközként használták.
S ez tényleg csak néhány példa a sokból. Még a tekintélyes nemzetközi tanácsadó cég, a Deloitte is beleszaladt ebbe a problémába, amikor kiderült, hogy ausztrál állami szerveknek benyújtott jelentéseiben kitalált, MI által generált hivatkozások szerepelnek. Az idén ősszel kirobbant botrányban a vállalat megbízásának értéke közel 300 000 (amerikai) dollár (kb. 100 millió forint) volt, ennek tekintélyes részét a cég végül vissza is fizette.
„Okos”, de nem feltétlenül megbízható: nagy a szórás az MI-modelleknél
A nagy teljesítményű nyelvi modellek – például a GPT-5 vagy a Gemini – technológiai szempontból kiemelkedők, ugyanakkor meggyőző magabiztossággal képesek téves információkat is közölni (már amennyiben ezzel a képességgel felruházhatók cikkünk kedvéért). Ez különösen kockázatos éles üzemi környezetben, jogi, megfelelőségi, vagy olyan alkalmazások esetén, amelyeknél a biztonság kritikus kérdés.
Érdemes azt is hozzátenni, hogy a legismertebb modellek üzleti szempontból nem feltétlenül a legmegbízhatóbbak (tulajdonképpen ez az összeállítás fő következtetése).
A megbízhatóságra optimalizált modellek – például a Claude – ezzel szemben inkább kompromisszumot jelentenek a képességek és aközött, ami az üzleti szférában a bizalmon és a megbízhatóságon alapuló működést jelenti. Ez a megközelítés fontosabbnak tűnik a vállalati szférában, mint a „mindent tudás”.
A vállalatok számára különösen fontos információt jelenthet az MI-k alkalmazásában az, hogy már rendelkezésre áll egy iparági benchmark ahhoz, hogy segítségével a pontosság és a „hallucinációs arány” alapján is egyaránt rangsorolni lehessen az MI-ket. Az Artificial Analysis Omniscience Index adatai alapján pedig megállapítható, hogy a megbízható modellek bár teljesítményben elmaradhatnak más modellektől, de jobban teljesítenek a tényszerű pontosságban. Az index alapján ezek a következők (a pontosság kategóriában a minél magasabb, a hallucinációs aránynál a minél alacsonyabb szám tekintendő jobb értéknek – ez utóbbi mutató nem azonos azzal, ha egy MI téved vagy már nem aktuális információt közöl a felhasználóval, hanem arra vonatkozik, amikor nem valós információkat tálal akként, ahelyett, hogy megtagadná a válaszadást):
- Claude 4.1 Opus – 36 százalék pontosság, 48 százalék hallucinációs arány (az egyik legalacsonyabb az iparágban)
- Claude 4.5 Sonnet – 31 százalék pontosság, 48 százalék hallucinációs arány
- Grok 4 – 39 százalék pontosság, 64 százalék hallucinációs arány
Érdemes megemlíteni, hogy eszerint a mutató szerint az Open AI GPT-5-ös modellje bár 39 százalékos pontosságú, „halluzási” aránya elképesztően magas, 81 százalékos.
Ezért nagy az üzleti kockázat MI vállalati bevezetésénél
Nem meglepő, hogy a vállalati környezetben egyre inkább azok a modellek kerülnek előtérbe, amelyek működése kiszámítható és ellenőrizhető, nem pedig azok, amelyek pusztán nagyobb nyelvi teljesítményt mutatnak. Nyilvánvaló, hogy MI bevezetése egy vállalatnál önmagában kockázatot jelent, ezért gazdsági és üzleti szempontból a cégek számára a valódi kérdés az, mi választja el a sikeres MI-bevezetéseket a kudarctól. Erre a kérdésre ugyanakkor kizárólagos, minden vetületet lefedő választ nem lehet adni, de az elmúlt évek tapasztalatai alapján úgy látni, hogy a sikeres MI-bevezetés inkább az emberi tényezőkön (felkészültségen, hozzáálláson stb.) és a folyamatszervezésen múlik, s nem a technológián.
A vállalatoknak, és rajtuk keresztül a gazdaságnak nem csak a „hibás válaszok” miatt kerülnek dollármilliárdokba a hallucináló MI-k, hanem a jelenség közvetett költségei miatt is.
Áttételesen ugyanis nagyon fájdalmas lehet az, ha egy bevezetett MI a „képzelgéseit” közvetíti:
- közvetetten jogviták és bírságok is fakadhatnak azokból;
- a valóságosnak tűnő, de nem megalapozott információk alapján hozott döntések korrekcióinak is lehetnek költségei;
- reputációs károkat okozhat a szervezet, ami bevételkiesést okoz;
- a sikertelen bevezetéseknek önmagában vannak költségei.
A vállalatok esetében tehát most úgy tűnik, hogy nem igaz az a tétel, hogy ami „okosabb, az egyben jobb is”. A cégek gyakran választanak csevegésre optimalizált modelleket, noha jogi, pénzügyi, egyáltalán vállalati környezetben az MI-knek nem elsősorban ennek kell megfelelniük, különösen akkor, ha azokat korlátozott kontrollal alkalmazzák. Ezért – fogalmazható meg az eddigiek alapján az egyik lehetséges tanulság – vállalati szempontból
egy nem válaszoló MI-modell jobb, mint egy magabiztosan tévedő.
Ebből az irányból nézve pedig még a magas „nem válaszolási” arány is lehet inkább érték, mintsem hiba.