Сегодня 04 мая 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Google представила нейросеть, которая генерирует HD-видео по текстовому описанию

Google рассказала о системе искусственного интеллекта Imagen Video, которая генерирует видео высокого разрешения (1280×768 пикселей, 24 кадра в секунду) по текстовому описанию. Однако из опасения, что модель будет генерировать неприемлемый контент, компания пока решила воздержаться от публикации исходных кодов проекта.

 Источник изображения: imagen.research.google

Источник изображения: imagen.research.google

В описании (PDF) решения Google отметила, что Imagen Video способна работать в заданной стилистике, имитируя, к примеру, манеры известных художников, создавать вращающиеся 3D-объекты с сохранением их формы или изображать текст в различных анимационных жанрах. Основу технологии составил «каскад» моделей, которые на основе текстового описания создают прототип ролика (16 кадров в разрешении 24×48 пикселей с частотой 3 кадра в секунду), который далее в несколько шагов преобразуется в видео высокого разрешения с более высокой частотой кадров. Конечное видео имеет длительность 5,3 секунды.

Представленные на сайте Imagen Video примеры включают и простые сцены вроде «Стекающего по стаканчику тающего фисташкового мороженого», и замысловатые сценарии, например, «Пролёт сквозь битву пиратских кораблей в бушующем океане». Изображения содержат очевидные артефакты, однако их детализация и плавность заметно выше, чем у существующих аналогов. Параллельно дебютировала ещё одна ИИ-модель от Google для генерации видео по текстовому описанию — Phenaki создаёт более длинные ролики.

В Google рассказали, что система Imagen Video была обучена на общедоступной базе LAION-400M, которая содержит «14 млн пар видео-текст и 60 млн пар картинка-текст». По версии компании, это «проблемные данные», и хотя специалисты попытались их отфильтровать, сохраняется вероятность, что модель будет генерировать неприемлемый контент, содержащий сцены деликатного характера, насилие, социальные стереотипы и культурные предубеждения. И «пока эти опасения не будут устранены», исходный код модели Imagen Video публиковать не станут.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
LinkedIn оказалась негласным конкурентом соцсети X 2 ч.
В Лос-Анджелесе прошёл фестиваль ИИ-кино — оно уже почти неотличимо от традиционного 3 ч.
Mediascope: среднемесячный охват Telegram вырос в России до 73 % 7 ч.
Чат-бот Grok будет резюмировать новостную информацию для подписчиков социальной сети X 8 ч.
Создатель расширения подал в суд на Meta, чтобы получить право отключить ленту новостей 14 ч.
Новая статья: Indika — во Царствии твоем меня помяни. Рецензия 15 ч.
Никакого PvP, офлайн-режим и неутомимый T-800: новые подробности Terminator: Survivors 17 ч.
Разработчики «Смуты» опубликовали план обновлений — улучшение основных механик и дополнение в жанре политического триллера 18 ч.
Microsoft объявила кибербезопасность абсолютным приоритетом — сработала серия хакерских атак 19 ч.
Новая платформа DevX Platform будет применяться при разработке всех ключевых продуктов МТС 19 ч.
Квартальные продажи HDD приблизились к 30 млн штук, а Western Digital вышла в лидеры 17 мин.
На ветрогенераторы в Германии начали ставить деревянные лопасти, но на мельницы они похожи не стали 21 мин.
Спрос на первый российский микроконтроллер на базе RISC-V оказался очень высоким 22 мин.
Разработано бактерицидное покрытие из меди для сенсорных экранов, и оно прозрачное 3 ч.
Virgin Galactic назначила новый суборбитальный полёт на 8 июня — несмотря на происшествие в прошлый раз 5 ч.
Первый пилотируемый полёт корабля Boeing Starliner состоится 6 мая, подтвердили в NASA 5 ч.
В первом квартале выручка от реализации смартфонов достигла сезонного максимума, объём поставок вырос на 6 % 9 ч.
В юбилейной публикации блога AMD слова «искусственный интеллект» упоминались 23 раза 10 ч.
Ученые создали светофильтр на 2D-полупроводнике, который прокачал недорогую камеру и открыл новый путь к оптическим компьютерам 16 ч.
Защищённые смартфоны «Ростеха» AYYA T1 начали собирать в России на предприятии «Ростелекома» 17 ч.