Сегодня 16 мая 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Netflix научил собственную ИИ-модель без следов удалять объекты из видео и правдоподобно перестраивать сцену

Netflix открыл доступ к модели VOID для редактирования видео с помощью ИИ, которая удаляет из кадра объекты и следы их взаимодействия с окружающей средой, а затем достраивает сцену так, чтобы оставшиеся элементы вели себя правдоподобно без удалённого объекта. ИИ-модель уже доступна для установки на Hugging Face и, по данным разработчиков, в опросе 25 участников получила 64,8 % предпочтений против 18,4 % у её ближайшего конкурента Runway.

 Источник изображения: void-model.github.io

Источник изображения: void-model.github.io

VOID (Video Object and Interaction Deletion) рассчитана на сцены, где после удаления объекта нужно изменить поведение всего остального кадра. Вместо пересъёмки или полной переработки эпизода с помощью компьютерной графики ИИ-модель позволяет преобразовать уже снятый материал в новую версию сцены. В описании технологии этот подход сводится к простой задаче: убрать из видеозаписи причину события и одновременно пересчитать его последствия.

Netflix относит разработку к ИИ-моделям, работающим одновременно с изображением и текстом. Система не только стирает объект из сцены, но и восстанавливает недостающие части видеоряда так, чтобы оставшиеся элементы выглядели словно удалённого объекта не было. Один из примеров — лобовое столкновение двух машин, которое ИИ превращает в сцену с одной машиной на дороге, убирая второе транспортное средство и перестраивая траекторию первого. При наличии обломков, дыма и пламени они тоже удаляются.

Второй пример — человек прыгает в бассейн, а система после удаления фигуры перестраивает сцену так, что вода выглядит спокойной и ни в бассейне, ни рядом с ним не остаётся следов всплеска.

Авторы ИИ-модели в предварительной научной статье называют VOID системой удаления объектов из видео для физически правдоподобного восстановления изображения в сложных сценах. Netflix сравнила модель VOID с Runway, Generative Omnimatte, DiffuEraser, ROSE, MiniMax-Remover и ProPainter. В опросе 25 человек на нескольких сценах VOID выбрали в 64,8 % случаев, Runway — в 18,4 %. Разработчики также утверждают, что проверили ИИ-модель на искусственно созданных и реальных данных и показали её преимущество над базовыми системами восстановления видео и моделями, меняющими видеоряд по текстовому указанию.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Microsoft разрешит менять положение панели задач и размер меню «Пуск» в Windows 11 6 ч.
Бороться со своими дипфейками на YouTube теперь может любой желающий 7 ч.
ZA/UM показала 12 минут геймплея Zero Parades: For Dead Spies — психоделической шпионской RPG в духе Disco Elysium 10 ч.
Новая статья: Mixtape — воспоминания никто не отнимет. Рецензия 22 ч.
Google начнёт наказывать сайты за накрутку попаданий в ИИ-ответы 22 ч.
Спринт, торговля и продолжение сюжета: разработчики Subnautica 2 раскрыли план улучшения игры на ближайшие месяцы 15-05 19:59
ChatGPT получит прямой доступ к банковским счетам пользователей — для анализа расходов и финансовых советов 15-05 19:42
Трамп и Си Цзиньпин обсудили ограничения слишком умного ИИ и зависшие поставки Nvidia H200 15-05 19:18
Microsoft намерена избавить Windows 11 от главной причины «синих экранов» 15-05 19:05
Доминирование ChatGPT пошатнулось — Gemini и Perplexity быстро набирают обороты 15-05 18:38