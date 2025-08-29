A kínai Alibaba bemutatta legújabb mesterséges intelligencián alapuló eszközét, amely képes tetszés szerint animálni a fotókon látható embereket. Olyan hamis videókat készít róluk a megadott fotó alapján, amelyeken mozognak, beszélnek, énekelnek.

Egyetlen fotóból éneklő, beszélő, mozgó embereket hoz létre az Alibaba MI-alapú videógenerátora

Fotó: Alibaba

A rendszer különlegessége, hogy nemcsak portékat, de félalakos és teljes alakos mozgásokat is képes élethűen animálni. A technológiáját a független alkotóktól a filmstúdiókig bárki használhatja videók létrehozására.

Egyetlen fotóból meggyőző videó készülhet

Az eszközzel akár többszereplős jelenetek is létrehozhatók, gesztusokkal, környezeti elemekkel kiegészítve. Kimenetként 480p és 720p felbontást kínál, így elsősorban közösségi médiás használatra lehetnek jók a rendszerrel készült videók.

A mesterséges intelligenciás modell betanításához különleges audiovizuális adatkészleteket használtak a fejlesztők, amelyek film- és tévés jelenetekre épülnek.

Az Alibaba szerint ez a fejlesztés hatalmas segítség lehet közösségi médiás tartalomgyártóknak, filmes projekteknek, de akár oktatási vagy marketingcélokra is. A Wan2.2-S2V (Speech-to-Video) névre keresztelt modell már elérhető a Hugging Face, a GitHub és az Alibaba ModelScope platformokon, azaz bárki számára szabadon elérhető.

