Az elmúlt évek AI-forradalma nemcsak a szoftverekben, hanem a hardverekben is alapvető változást indított el. A mesterséges intelligencia modelljei, különösen a generatív és nagynyelvi rendszerek, ma már milliárdos paramétermennyiségeket kezelnek. Ez a terhelés egyszerűen túl nagy a hagyományos processzorokra épülő adatközpontok számára.

A mesterséges intelligencia és mobiltechnológia egyre növeli a chipgyártás iránti keresletet.

A CPU-k világában megszoktuk, hogy a teljesítmény növelése egyenlő az órajel vagy a magszám emelésével. Az AI-korszakban azonban a feldolgozási igények párhuzamosítása vált kulcsfontosságúvá. Ezt hozta el a GPU-k – és most már a TPU-k, NPU-k és AI-chipek – térnyerése. A számítási teljesítmény ma már nem egyetlen magban, hanem milliónyi párhuzamos feldolgozóegységben rejlik.

A CPU-tól a GPU-ig: miért váltásra van szükség?

A mesterséges intelligencia algoritmusai, különösen a mélytanulási modellek, masszívan párhuzamos számításokat igényelnek. Egy CPU 8–16 magja helyett egy modern GPU több ezer feldolgozó egységet tartalmaz, amelyek egyidejűleg képesek végrehajtani a neurális hálók számításait.

A vállalati oldalon ez azt jelenti, hogy a hagyományos szerverparkok nem elegendőek: új, dedikált MI-klasztereket kell építeni, ahol az adatfeldolgozás, a modelltréning és a valós idejű következtetés elkülönül, de összehangoltan működik.

A nagyvállalatok – köztük a technológiai óriások és pénzügyi szektor szereplői – már az úgynevezett heterogén számítási architektúrák felé mozdultak el. Itt a CPU, GPU és az AI-gyorsítók közösen dolgoznak, az adatforgalmat pedig szoftveres rétegek optimalizálják.

Az energiahatékonyság új szerepe

Az MI-infrastruktúra-bővítés egyik legnagyobb kihívása az energiafogyasztás. Egyetlen nagyméretű nyelvi modell betanítása több száz megawattórát igényelhet. Ezért ma már nem elég erősebb chipeket építeni – az energiamenedzsment és a hűtés legalább akkora hangsúlyt kap, mint a nyers teljesítmény.

Az adatközpontokban a mesterséges intelligencia immár a saját erőforrásait is optimalizálja: prediktív algoritmusok figyelik a hőmérsékletet, a terhelést, és dinamikusan újraosztják a számítási kapacitást, hogy csökkentsék a fogyasztást és a CO₂-kibocsátást.