Сегодня 27 июля 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Google представила нейросеть, которая генерирует HD-видео по текстовому описанию

Google рассказала о системе искусственного интеллекта Imagen Video, которая генерирует видео высокого разрешения (1280×768 пикселей, 24 кадра в секунду) по текстовому описанию. Однако из опасения, что модель будет генерировать неприемлемый контент, компания пока решила воздержаться от публикации исходных кодов проекта.

 Источник изображения: imagen.research.google

Источник изображения: imagen.research.google

В описании (PDF) решения Google отметила, что Imagen Video способна работать в заданной стилистике, имитируя, к примеру, манеры известных художников, создавать вращающиеся 3D-объекты с сохранением их формы или изображать текст в различных анимационных жанрах. Основу технологии составил «каскад» моделей, которые на основе текстового описания создают прототип ролика (16 кадров в разрешении 24×48 пикселей с частотой 3 кадра в секунду), который далее в несколько шагов преобразуется в видео высокого разрешения с более высокой частотой кадров. Конечное видео имеет длительность 5,3 секунды.

Представленные на сайте Imagen Video примеры включают и простые сцены вроде «Стекающего по стаканчику тающего фисташкового мороженого», и замысловатые сценарии, например, «Пролёт сквозь битву пиратских кораблей в бушующем океане». Изображения содержат очевидные артефакты, однако их детализация и плавность заметно выше, чем у существующих аналогов. Параллельно дебютировала ещё одна ИИ-модель от Google для генерации видео по текстовому описанию — Phenaki создаёт более длинные ролики.

В Google рассказали, что система Imagen Video была обучена на общедоступной базе LAION-400M, которая содержит «14 млн пар видео-текст и 60 млн пар картинка-текст». По версии компании, это «проблемные данные», и хотя специалисты попытались их отфильтровать, сохраняется вероятность, что модель будет генерировать неприемлемый контент, содержащий сцены деликатного характера, насилие, социальные стереотипы и культурные предубеждения. И «пока эти опасения не будут устранены», исходный код модели Imagen Video публиковать не станут.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме
Прежде чем оставить комментарий, пожалуйста, ознакомьтесь с правилами комментирования. Оставляя комментарий, вы подтверждаете ваше согласие с данными правилами и осознаете возможную ответственность за их нарушение.
Все комментарии премодерируются.
Комментарии загружаются...

window-new
Soft
Hard
Тренды 🔥
Дешёвые сканеры штрихкодов помогли в кратчайшие сроки восстановить пострадавшие от CrowdStrike компьютеры 4 ч.
Новая статья: Flintlock: The Siege of Dawn — хорошие идеи в неудачной обёртке. Рецензия 4 ч.
Анонсирован китайский ролевой детектив Kill the Shadow, напоминающий смесь Disco Elysium и The Last Night 5 ч.
Соцсеть X начала без уведомления использовать данные пользователей для обучения Grok 6 ч.
Mirthwood получила новый трейлер и дату выхода — это ролевой симулятор жизни в фэнтезийном мире, вдохновлённый Fable, Stardew Valley и The Sims 7 ч.
Журналисты выяснили, какие игры пострадают от забастовки актёров озвучки — GTA VI в безопасности 8 ч.
Разработчики Gran Turismo 7 извинились за баг, который запускает машины в космос 9 ч.
Хинштейн пояснил, почему в России замедлится YouTube 10 ч.
Windows 11 сможет добавлять синхронизированный с ПК Android-смартфон в «Проводник» 10 ч.
Заказы на ИИ и мейнфреймы z16 помогли IBM увеличить выручку и прибыль 11 ч.