Сегодня 04 июня 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → редактирование видео

Netflix научил собственную ИИ-модель без следов удалять объекты из видео и правдоподобно перестраивать сцену

Netflix открыл доступ к модели VOID для редактирования видео с помощью ИИ, которая удаляет из кадра объекты и следы их взаимодействия с окружающей средой, а затем достраивает сцену так, чтобы оставшиеся элементы вели себя правдоподобно без удалённого объекта. ИИ-модель уже доступна для установки на Hugging Face и, по данным разработчиков, в опросе 25 участников получила 64,8 % предпочтений против 18,4 % у её ближайшего конкурента Runway.

 Источник изображения: void-model.github.io

Источник изображения: void-model.github.io

VOID (Video Object and Interaction Deletion) рассчитана на сцены, где после удаления объекта нужно изменить поведение всего остального кадра. Вместо пересъёмки или полной переработки эпизода с помощью компьютерной графики ИИ-модель позволяет преобразовать уже снятый материал в новую версию сцены. В описании технологии этот подход сводится к простой задаче: убрать из видеозаписи причину события и одновременно пересчитать его последствия.

Netflix относит разработку к ИИ-моделям, работающим одновременно с изображением и текстом. Система не только стирает объект из сцены, но и восстанавливает недостающие части видеоряда так, чтобы оставшиеся элементы выглядели словно удалённого объекта не было. Один из примеров — лобовое столкновение двух машин, которое ИИ превращает в сцену с одной машиной на дороге, убирая второе транспортное средство и перестраивая траекторию первого. При наличии обломков, дыма и пламени они тоже удаляются.

Второй пример — человек прыгает в бассейн, а система после удаления фигуры перестраивает сцену так, что вода выглядит спокойной и ни в бассейне, ни рядом с ним не остаётся следов всплеска.

Авторы ИИ-модели в предварительной научной статье называют VOID системой удаления объектов из видео для физически правдоподобного восстановления изображения в сложных сценах. Netflix сравнила модель VOID с Runway, Generative Omnimatte, DiffuEraser, ROSE, MiniMax-Remover и ProPainter. В опросе 25 человек на нескольких сценах VOID выбрали в 64,8 % случаев, Runway — в 18,4 %. Разработчики также утверждают, что проверили ИИ-модель на искусственно созданных и реальных данных и показали её преимущество над базовыми системами восстановления видео и моделями, меняющими видеоряд по текстовому указанию.

Adobe представила ИИ-инструмент для редактирования видео по одному кадру

Компания Adobe показала публике несколько экспериментальных инструментов на базе искусственного интеллекта, работа над которыми ещё продолжается и которые предназначены для интуитивно понятного редактирования изображений, видео и аудио. Один из таких инструментов разрабатывается в рамках проекта Project Frame Forward и позволяет в процессе редактирования видео добавлять и удалять разные объекты без использования масок — трудоёмкого процесса выделения объектов или людей.

 Источник изображения: Adobe

Источник изображения: Adobe

В одном из демонстрационных видео Adobe показала, как с помощью Frame Forward можно легко удалить из видео какой-либо объект. Данный инструмент идентифицировал, выделил и удалил женщину в первом кадре видео, а затем заменил её естественно выглядящим фоном. После этого данные изменения применились ко всему видео буквально в несколько кликов.

Пользователи также могут добавлять объекты в кадр. Для этого нужно выделить область, в которую требуется добавить объект и с помощью текстовых описаний подсказать ИИ-алгоритму больше деталей. Эти изменения в первом кадре будут применены ко всему видео. Вставленные объекты могут хорошо вписываться в видео, как, например, вставленная в кадр лужа, в которой отражается кошка, которая была в видео изначально.

Ещё один ИИ-инструмент Project Light Touch позволяет изменить источник света на фотографиях. С его помощью можно менять направление освещения, создавать эффект освещения, будто комната освещается лампами, а также контролировать рассеивание света и тени. Этот инструмент можно задействовать для добавления динамического освещения, которое можно перемещать по рабочей области редактирования, изменяя то, как свет проходит вокруг и позади людей, а также других объектов. Цвет этих источников света можно изменять, позволяя корректировать теплоту освещения и создавать яркие RGB-эффекты.

Инструмент Project Clean Take позволяет менять манеру речи на основе текстовых подсказок, что позволит избежать необходимости перезаписывать видео или аудиоклип. Пользователь может изменить стиль подачи или эмоциональную окраску голоса, при необходимости можно полностью заменить проговариваемые слова, сохраняя идентификационные характеристики исходного голоса. Clean Take подходит для разделения исходных шумов на отдельные источники для последующей детальной настройки звука и повышения разборчивости речи.

Это лишь некоторые из разрабатываемых Adobe ИИ-инструментов, которые были показаны на конференции Max. Среди других выделим Project Surface Swap, с помощью которого можно мгновенно изменить материал или текстуру объектов и поверхностей. Ещё есть Project Turn Style для редактирования объектов на изображении за счёт их вращения, подобно 3D-моделям. Project New Depths позволяет редактировать фото как бы в 3D-пространстве, где система сама определяет, когда вставляемые объекты должны быть частично перекрыты окружающей средой.

Все эти ИИ-инструменты на данный момент недоступны для публичного использования. Когда они могут стать частью Adobe Creative Cloud или приложения Firefly, не уточняется.

Пользователи «Google Диска» теперь могут редактировать видео прямо в браузере, но есть нюанс

Google предложила возможность редактирования видео прямо на «Google Диске» в совместимом браузере. При предварительном просмотре видео в правом верхнем углу экрана может отображаться кнопка «Открыть». Нажатие на неё открывает клип в Google Vids, где можно обрезать видео, добавить текст и музыку, а также внести другие изменения. Нейросеть для генерации видео Google Veo также доступна прямо в приложении Google Vids.

 Источник изображения: Google

Источник изображения: Google

Функция Google Vids работает в последних версиях Chrome, Firefox и Microsoft Edge для Windows. Совместимость с другими браузерами не гарантируется. Поддерживаются видео в форматах MP4, Quicktime, OGG и WebM, при этом продолжительность отдельных клипов ограничена 35 минутами, а размер файла — 4 Гбайт. Для редактирования в Vids создаётся копия исходного файла, которую можно затем сохранить под другим именем или экспортировать.

В целом, это удобный способ быстрого редактирования видео, уже загруженного на «Google Диск», но есть важный нюанс — редактирование доступно только пользователям платных тарифных планов. Также воспользоваться этой функцией смогут некоммерческие организации и пользователи дополнений Gemini Education или Gemini Education Premium. Доступ получат пользователи Google AI Pro и Ultra, а также те, кто приобрёл дополнения Gemini Business и Enterprise до того, как Google прекратила их поддержку в начале этого года.

Возможность редактирования видео будет включена для поддерживаемых организаций по умолчанию, если, конечно, они не заблокировали доступ к «Документам Google». Google for Education предлагает бесплатный курс по использованию видеоредактора.


window-new
Soft
Hard
Тренды 🔥
FromSoftware подтвердила дату выхода Elden Ring: Tarnished Edition для Nintendo Switch 2 и платное дополнение для других платформ 30 мин.
Apple App Store обеспечил разработчикам приложений $1,4 трлн продаж — втрое больше, чем в 2019 году 2 ч.
«Всё, о чём я мечтал, и даже больше»: 10 минут геймплея Ace Combat 8: Wings of Theve привели фанатов в восторг 2 ч.
God of War Laufey не придётся ждать годами 3 ч.
Instagram оповестил пользователей, которых взломали с помощью ИИ-бота Meta 4 ч.
Авторитетный инсайдер считает, что большая июньская презентация Nintendo Direct пройдёт на следующей неделе 5 ч.
Глава Take-Two Interactive Штраус Зельник стал рестлером — руководителя добавили в WWE 2K26 6 ч.
Meta вместо закрытия VR-приложения Supernatural выделит его разработку в самостоятельную компанию 7 ч.
Star Wars Zero Company скоро выйдет из тени — инсайдер рассекретил дату релиза суровой тактической стратегии от ветеранов XCOM 7 ч.
Google начала скупать исходный код приложений из «Play Маркета» для обучения ИИ 8 ч.
Cooler Master представила процессорный кулер V8 Ace 3DHP с «экстремальной» эффективностью теплоотвода 10 мин.
Представлен доступный смартфон Huawei nova Y74 — камера 50 Мп и батарея на 6620 мА·ч 13 мин.
AMD отобрала у Intel треть рынка x86-процессоров, пока рынок настольных CPU рухнул на 20 % 14 мин.
PowerColor показала видеокарты Radeon RX 9000, которые святятся под ультрафиолетом 2 ч.
3,84 Тбайт в формате M.2 — Swissbit представила SSD серии N7000 2 ч.
Silicon Motion нарастила продажи SSD-контроллеров на фоне дефицита NAND — нехватка памяти усугубится в 2027 году 2 ч.
7 из 10 американцев не хотят видеть дата-центры рядом с домом — ещё девять месяцев назад таких было лишь 42 % 2 ч.
Amazon представила полностью автономного складского робота Proteus с голосовым управлением 3 ч.
Microsoft: современный ИИ ЦОД потребляет воды не больше, чем ресторан 4 ч.
Репортаж со стенда Acer на Computex 2026: 50 лет инноваций, умные очки, игровые консоли и устройства нового поколения 4 ч.