A kínai Alibaba bemutatta legújabb mesterséges intelligencián alapuló eszközét, amely képes tetszés szerint animálni a fotókon látható embereket. Olyan hamis videókat készít róluk a megadott fotó alapján, amelyeken mozognak, beszélnek, énekelnek.
A rendszer különlegessége, hogy nemcsak portékat, de félalakos és teljes alakos mozgásokat is képes élethűen animálni. A technológiáját a független alkotóktól a filmstúdiókig bárki használhatja videók létrehozására.
Az eszközzel akár többszereplős jelenetek is létrehozhatók, gesztusokkal, környezeti elemekkel kiegészítve. Kimenetként 480p és 720p felbontást kínál, így elsősorban közösségi médiás használatra lehetnek jók a rendszerrel készült videók.
A mesterséges intelligenciás modell betanításához különleges audiovizuális adatkészleteket használtak a fejlesztők, amelyek film- és tévés jelenetekre épülnek.
Az Alibaba szerint ez a fejlesztés hatalmas segítség lehet közösségi médiás tartalomgyártóknak, filmes projekteknek, de akár oktatási vagy marketingcélokra is. A Wan2.2-S2V (Speech-to-Video) névre keresztelt modell már elérhető a Hugging Face, a GitHub és az Alibaba ModelScope platformokon, azaz bárki számára szabadon elérhető.
Ha szeretne még több érdekes techhírt olvasni, akkor kövesse az Origo Techbázis Facebook-oldalát, kattintson ide!