Сегодня 24 апреля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → редактирование видео

Netflix научил собственную ИИ-модель без следов удалять объекты из видео и правдоподобно перестраивать сцену

Netflix открыл доступ к модели VOID для редактирования видео с помощью ИИ, которая удаляет из кадра объекты и следы их взаимодействия с окружающей средой, а затем достраивает сцену так, чтобы оставшиеся элементы вели себя правдоподобно без удалённого объекта. ИИ-модель уже доступна для установки на Hugging Face и, по данным разработчиков, в опросе 25 участников получила 64,8 % предпочтений против 18,4 % у её ближайшего конкурента Runway.

 Источник изображения: void-model.github.io

Источник изображения: void-model.github.io

VOID (Video Object and Interaction Deletion) рассчитана на сцены, где после удаления объекта нужно изменить поведение всего остального кадра. Вместо пересъёмки или полной переработки эпизода с помощью компьютерной графики ИИ-модель позволяет преобразовать уже снятый материал в новую версию сцены. В описании технологии этот подход сводится к простой задаче: убрать из видеозаписи причину события и одновременно пересчитать его последствия.

Netflix относит разработку к ИИ-моделям, работающим одновременно с изображением и текстом. Система не только стирает объект из сцены, но и восстанавливает недостающие части видеоряда так, чтобы оставшиеся элементы выглядели словно удалённого объекта не было. Один из примеров — лобовое столкновение двух машин, которое ИИ превращает в сцену с одной машиной на дороге, убирая второе транспортное средство и перестраивая траекторию первого. При наличии обломков, дыма и пламени они тоже удаляются.

Второй пример — человек прыгает в бассейн, а система после удаления фигуры перестраивает сцену так, что вода выглядит спокойной и ни в бассейне, ни рядом с ним не остаётся следов всплеска.

Авторы ИИ-модели в предварительной научной статье называют VOID системой удаления объектов из видео для физически правдоподобного восстановления изображения в сложных сценах. Netflix сравнила модель VOID с Runway, Generative Omnimatte, DiffuEraser, ROSE, MiniMax-Remover и ProPainter. В опросе 25 человек на нескольких сценах VOID выбрали в 64,8 % случаев, Runway — в 18,4 %. Разработчики также утверждают, что проверили ИИ-модель на искусственно созданных и реальных данных и показали её преимущество над базовыми системами восстановления видео и моделями, меняющими видеоряд по текстовому указанию.

Adobe представила ИИ-инструмент для редактирования видео по одному кадру

Компания Adobe показала публике несколько экспериментальных инструментов на базе искусственного интеллекта, работа над которыми ещё продолжается и которые предназначены для интуитивно понятного редактирования изображений, видео и аудио. Один из таких инструментов разрабатывается в рамках проекта Project Frame Forward и позволяет в процессе редактирования видео добавлять и удалять разные объекты без использования масок — трудоёмкого процесса выделения объектов или людей.

 Источник изображения: Adobe

Источник изображения: Adobe

В одном из демонстрационных видео Adobe показала, как с помощью Frame Forward можно легко удалить из видео какой-либо объект. Данный инструмент идентифицировал, выделил и удалил женщину в первом кадре видео, а затем заменил её естественно выглядящим фоном. После этого данные изменения применились ко всему видео буквально в несколько кликов.

Пользователи также могут добавлять объекты в кадр. Для этого нужно выделить область, в которую требуется добавить объект и с помощью текстовых описаний подсказать ИИ-алгоритму больше деталей. Эти изменения в первом кадре будут применены ко всему видео. Вставленные объекты могут хорошо вписываться в видео, как, например, вставленная в кадр лужа, в которой отражается кошка, которая была в видео изначально.

Ещё один ИИ-инструмент Project Light Touch позволяет изменить источник света на фотографиях. С его помощью можно менять направление освещения, создавать эффект освещения, будто комната освещается лампами, а также контролировать рассеивание света и тени. Этот инструмент можно задействовать для добавления динамического освещения, которое можно перемещать по рабочей области редактирования, изменяя то, как свет проходит вокруг и позади людей, а также других объектов. Цвет этих источников света можно изменять, позволяя корректировать теплоту освещения и создавать яркие RGB-эффекты.

Инструмент Project Clean Take позволяет менять манеру речи на основе текстовых подсказок, что позволит избежать необходимости перезаписывать видео или аудиоклип. Пользователь может изменить стиль подачи или эмоциональную окраску голоса, при необходимости можно полностью заменить проговариваемые слова, сохраняя идентификационные характеристики исходного голоса. Clean Take подходит для разделения исходных шумов на отдельные источники для последующей детальной настройки звука и повышения разборчивости речи.

Это лишь некоторые из разрабатываемых Adobe ИИ-инструментов, которые были показаны на конференции Max. Среди других выделим Project Surface Swap, с помощью которого можно мгновенно изменить материал или текстуру объектов и поверхностей. Ещё есть Project Turn Style для редактирования объектов на изображении за счёт их вращения, подобно 3D-моделям. Project New Depths позволяет редактировать фото как бы в 3D-пространстве, где система сама определяет, когда вставляемые объекты должны быть частично перекрыты окружающей средой.

Все эти ИИ-инструменты на данный момент недоступны для публичного использования. Когда они могут стать частью Adobe Creative Cloud или приложения Firefly, не уточняется.

Пользователи «Google Диска» теперь могут редактировать видео прямо в браузере, но есть нюанс

Google предложила возможность редактирования видео прямо на «Google Диске» в совместимом браузере. При предварительном просмотре видео в правом верхнем углу экрана может отображаться кнопка «Открыть». Нажатие на неё открывает клип в Google Vids, где можно обрезать видео, добавить текст и музыку, а также внести другие изменения. Нейросеть для генерации видео Google Veo также доступна прямо в приложении Google Vids.

 Источник изображения: Google

Источник изображения: Google

Функция Google Vids работает в последних версиях Chrome, Firefox и Microsoft Edge для Windows. Совместимость с другими браузерами не гарантируется. Поддерживаются видео в форматах MP4, Quicktime, OGG и WebM, при этом продолжительность отдельных клипов ограничена 35 минутами, а размер файла — 4 Гбайт. Для редактирования в Vids создаётся копия исходного файла, которую можно затем сохранить под другим именем или экспортировать.

В целом, это удобный способ быстрого редактирования видео, уже загруженного на «Google Диск», но есть важный нюанс — редактирование доступно только пользователям платных тарифных планов. Также воспользоваться этой функцией смогут некоммерческие организации и пользователи дополнений Gemini Education или Gemini Education Premium. Доступ получат пользователи Google AI Pro и Ultra, а также те, кто приобрёл дополнения Gemini Business и Enterprise до того, как Google прекратила их поддержку в начале этого года.

Возможность редактирования видео будет включена для поддерживаемых организаций по умолчанию, если, конечно, они не заблокировали доступ к «Документам Google». Google for Education предлагает бесплатный курс по использованию видеоредактора.


window-new
Soft
Hard
Тренды 🔥
Пламенный двухмерный боевик Nocturnal стал временно бесплатным в Steam — раздача доступна и в России 7 мин.
Microsoft добавила в Word, Excel и PowerPoint ИИ-агента Copilot и открыла его для всех подписчиков Microsoft 365 22 мин.
Ubisoft раскрыла системные требования Assassin’s Creed Black Flag Resynced для игры с апскейлерами и трассировкой лучей 2 ч.
Meta расширила родительский контроль на ИИ-чат-бот — родители увидят темы бесед подростков за неделю 6 ч.
Совсем без Call of Duty подписчиков Game Pass в 2026 году не оставят 12 ч.
Microsoft Gaming в прошлом — игровое подразделение вернуло имя Xbox 12 ч.
Funcom бесплатно прокачает Conan Exiles до версии на Unreal Engine 5 — трейлер и подробности Conan Exiles Enhanced 13 ч.
Tencent запустила тестирование ИИ-агента QClaw, но сильно ограничила к нему доступ 14 ч.
«Пришло время снова поднять чёрный флаг!»: Ubisoft наконец анонсировала Assassin’s Creed Black Flag Resynced 15 ч.
Релиз «Кибер Бэкап» 18.5: многопоточность, поддержка LDAPS, расширенная интеграция с Kubernetes и многое другое 15 ч.
Samsung создала переключаемый 2D/3D-дисплей — без очков и компромиссов 10 мин.
Смартфоны Huawei nova 15 и 15 Pro с усовершенствованными камерами поступили в продажу в России 13 мин.
В США начали строить первый ядерный реактор нового поколения — за этим стоит Билл Гейтс 40 мин.
Бум дата-центров помогает угольным электростанциям США дымить и дальше 2 ч.
Россияне стали чаще выбирать бюджетные наушники — рынок вырос в штуках, но не деньгах 2 ч.
MSI FORGE K200 Wireless Combo — комплект клавиатуры и мыши с высокой автономностью 2 ч.
В мае будет уволен каждый десятый сотрудник Meta 2 ч.
Intel призывает рассчитывать на снижение спроса на ПК во втором полугодии 2 ч.
Seagate представила три внешних накопителя ёмкостью от 24 до 256 Тбайт — старший получил восемь отсеков и Thunderbolt 5 3 ч.
Прогноз по выручке Intel превзошёл ожидания рынка, акции компании выросли в цене на 20 % 3 ч.