Новий генератор дипфейків від ByteDance створює реалістичні відео по одному фото

Компанія ByteDance, що володіє TikTok, представила OmniHuman-1 – нову систему штучного інтелекту, здатну створювати гіперреалістичні діпфейки. За словами розробників, технологія дозволяє генерувати відео будь-якої довжини на основі одного зображення та аудіофайлу, чи то мова, чи пісня.

На відміну від більшості аналогів, OmniHuman-1 практично не видає себе. Система коректно синхронізує рухи губ, змінює пропорції тіла і навіть імітує взаємодію Космосу з предметами. Алгоритм навчений на 19 000 годин відеоконтенту з нерозкритих джерел, а в основі моделі лежить генератор SeaWeed, раніше розроблений ByteDance.

Попри дивовижні можливості, OmniHuman-1 має обмеження. Наприклад, технологія гірше працює з низькоякісними знімками та складними позами.

Експерти побоюються, що розвиток таких технологій посилить хвилю дезінформації та шахрайства. У 2023 році зловмисники використали діпфейки для крадіжки 12 мільярдів доларів, а до 2027 року збитки можуть досягти 40 мільярдів. У відповідь на загрозу низка країн уже почала розробляти законодавчі заходи щодо боротьби з підробленими відео.

Більше цікавого:

Джерело: ByteDance

Читайте также:

Groot N1 – модель штучного інтелекту для гуманоидної робототехніки від Nvidia

Безкоштовний курс AI Essentials від Google

Які нейромережі збирають найбільше даних про користувачів. Дослідження

Прихована функція ChatGPT, яка прискорить вашу роботу