Make-A-Video: система штучного інтелекту, яка створює відео з тексту

Цього тижня Meta, материнська компанія Facebook, представила інструмент Make-A-Video, що генерує короткі відео за текстовим описом. «За допомогою лише кількох слів або рядків тексту Make-A-Video може втілити фантазію в життя», повідомляє компанія у своєму пресрелізі. Система також може створювати відео зі статичних зображень та генерувати схожі ролики на основі наявних.

Make-A-Video доповнює генератор статичних зображень Make-A-Scene, представлений Meta у липні. Подібні інструменти, наприклад DALL-E та Midjourney, вже захопили інтернет. Однак Make-A-Video – це перший сервіс для створення відео за текстовим описом, який незабаром стане загальнодоступним.

«Створювати відео набагато складніше, ніж фото, оскільки система повинна не тільки правильно згенерувати кожен піксель, але і передбачити, як вони змінюватимуться з часом», – написав CEO Meta Марк Цукерберг у Facebook.

За заявою Цукерберга, щоб розв’язати цю проблему, до Make-A-Video додано шар неконтрольованого навчання. Завдяки йому система розуміє рух у фізичному світі та застосовує його до традиційного перетворення тексту на зображення.

Собака, що летить в небі в супергеройському костюмі з червоним плащем.

Плюшевий ведмедик малює портрет.

Ролики виконані у характерному для штучного інтелекту стилі: розмиті контури з елементами живопису. Проте вони демонструють стрімкий прогрес художніх систем зі штучним інтелектом, які лише кілька років тому зустрічалися лише у мемах та науковій фантастиці.

Проблеми з етикою штучного інтелекту

Meta, схоже, усвідомлює, які небезпеки стоять за системами зі штучним інтелектом, що генерують витвори мистецтва.

Компанія заявляє, що «відкрито ділиться дослідженнями цього генеративного штучного інтелекту та їх результатами зі спільнотою і продовжить використовувати систему відповідального штучного інтелекту, щоб удосконалювати підхід до цієї технології, що розвивається».

Однак, виходячи з дослідження Make-A-Video, моделі зображень були навчені на підмножині набору даних LAION. У ньому зібрані невідфільтровані вебдані, що видають упереджені результати.

Нещодавно видання Motherboard повідомило, що цей набір даних містив зображення страт ІДІЛ, оголені знімки знаменитостей, зроблені у Photoshop, та реальних людей, поширені без їхньої згоди. Щоб розв’язати цю проблему, Meta відфільтровує токсичні та NSFW-кадри, скорочуючи обсяг вихідного набору з 5,8 млрд зображень до 2,3 млрд.

У той самий час дослідники у сфері етики штучного інтелекту виступають проти великих мовних моделей. Вони попереджають, що через власний розмір вони вкрай упереджені, і цю проблему нелегко вирішити. Навіть дослідники з Facebook визнають, що їхні мовні системи «з високою ймовірністю» видають расистські та шкідливі результати.

Цей інструмент також ускладнює давнє питання про те, чи вважати правомірним використання творів мистецтва, згенерованих штучним інтелектом. Торішнього серпня у мистецькому конкурсі перемогло зображення, яке учасник Джейсон Аллен згенерував з допомогою штучного інтелекту. Це бурхливо обговорювалося в інтернеті, а митці звинуватили Аллена у тому, що він прискорює загибель творчих професій.

Shutterstock та Getty Images також видаляють створені за допомогою штучного інтелекту зображення. За словами CEO Getty Images Крейга Пітерса, це робиться через проблеми з авторськими правами.

Авторські права та політика конфіденційності поки не встигають за стрімким розвитком систем зі штучним інтелектом. Через це багато питань залишаються без відповіді. Наприклад, кому належать зображення, що використовуються в алгоритмах штучного інтелекту, а також чи порушує їхнє перетворення на нові кадри авторські права.

БІЛЬШЕ ЦІКАВОГО:

Джерело: Vice

Make-A-Video: система штучного інтелекту, яка створює відео з тексту

Проблеми з етикою штучного інтелекту

Читайте также: