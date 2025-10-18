A videókban hallható beszéd szöveges átiratának gépi elkészítésével és lefordításával a YouTube már tett egy óriási lépést afelé, hogy eltörölje a nézők és a tartalomkészítők közti nyelvi akadályokat. Nemrég a vállalat a szöveges átiratok gépi felolvasásával feljebb tette a lécet, most pedig bemutatta a végső megoldását: mesterséges intelligenciás rendszerrel nem csak hogy a videósok másolt hangján narrálná a gépileg fordított szöveget, de ajakmozgásos szinkront készítene a videókhoz.

A videón látható ajakmozgást is hamisítja a szinkron elkészítésekor a YouTube

Fotó: Anna Shvets/Pexels

A Digital Trends-nek adott interjúban Buddhika Kottahachchi, a YouTube projektért felelős vezetője elmondta, hogy a rendszer a kép pixeleit módosítja, hogy illeszkedjen a lefordított beszédhez. Ebben teljesen eltér a klasszikus szinkronizálástól, hiszen abban a fordítók és a szinkronszínészek a meglévő ajakmozgáshoz igazítják a szöveget, míg a YouTube rendszere gyakorlatilag meghamisítja a videót.

Ez bizarr lehet a videósok számára, de ha jó a fordítás és meggyőző a hamisítás, akkor a végeredmény tekintetében igazából lényegtelen.

Még korai fázisában jár YouTube ajakmozgásos gépi szinkronja

A rendszer jelenlegi verziója 1080p felbontásra optimalizált, de a nyilvános elérhetővé tételének idejére már támogatnák a 4K felbontást, a húsz nyelv közti oda-vissza fordítás a cél.

Kottahachchi szerint a technológia még korai fázisban van, egyelőre a nagybani működéséhez szükséges erőforrások mennyisége sem tisztázott. Ennek megfelelően nem zárható ki, hogy az ajakmozgásos szinkron végül fizetős extraként válhat majd elérhetővé a tartalomkészítők vagy a nézők számára.

Ha szeretne még több érdekes techhírt olvasni, akkor kövesse az Origo Techbázis Facebook-oldalát, kattintson ide!