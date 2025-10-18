A videókban hallható beszéd szöveges átiratának gépi elkészítésével és lefordításával a YouTube már tett egy óriási lépést afelé, hogy eltörölje a nézők és a tartalomkészítők közti nyelvi akadályokat. Nemrég a vállalat a szöveges átiratok gépi felolvasásával feljebb tette a lécet, most pedig bemutatta a végső megoldását: mesterséges intelligenciás rendszerrel nem csak hogy a videósok másolt hangján narrálná a gépileg fordított szöveget, de ajakmozgásos szinkront készítene a videókhoz.
A Digital Trends-nek adott interjúban Buddhika Kottahachchi, a YouTube projektért felelős vezetője elmondta, hogy a rendszer a kép pixeleit módosítja, hogy illeszkedjen a lefordított beszédhez. Ebben teljesen eltér a klasszikus szinkronizálástól, hiszen abban a fordítók és a szinkronszínészek a meglévő ajakmozgáshoz igazítják a szöveget, míg a YouTube rendszere gyakorlatilag meghamisítja a videót.
Ez bizarr lehet a videósok számára, de ha jó a fordítás és meggyőző a hamisítás, akkor a végeredmény tekintetében igazából lényegtelen.
Még korai fázisában jár YouTube ajakmozgásos gépi szinkronja
A rendszer jelenlegi verziója 1080p felbontásra optimalizált, de a nyilvános elérhetővé tételének idejére már támogatnák a 4K felbontást, a húsz nyelv közti oda-vissza fordítás a cél.
Kottahachchi szerint a technológia még korai fázisban van, egyelőre a nagybani működéséhez szükséges erőforrások mennyisége sem tisztázott. Ennek megfelelően nem zárható ki, hogy az ajakmozgásos szinkron végül fizetős extraként válhat majd elérhetővé a tartalomkészítők vagy a nézők számára.
Ha szeretne még több érdekes techhírt olvasni, akkor kövesse az Origo Techbázis Facebook-oldalát, kattintson ide!