Сегодня 28 мая 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Google представила нейросеть, которая генерирует HD-видео по текстовому описанию

Google рассказала о системе искусственного интеллекта Imagen Video, которая генерирует видео высокого разрешения (1280×768 пикселей, 24 кадра в секунду) по текстовому описанию. Однако из опасения, что модель будет генерировать неприемлемый контент, компания пока решила воздержаться от публикации исходных кодов проекта.

 Источник изображения: imagen.research.google

Источник изображения: imagen.research.google

В описании (PDF) решения Google отметила, что Imagen Video способна работать в заданной стилистике, имитируя, к примеру, манеры известных художников, создавать вращающиеся 3D-объекты с сохранением их формы или изображать текст в различных анимационных жанрах. Основу технологии составил «каскад» моделей, которые на основе текстового описания создают прототип ролика (16 кадров в разрешении 24×48 пикселей с частотой 3 кадра в секунду), который далее в несколько шагов преобразуется в видео высокого разрешения с более высокой частотой кадров. Конечное видео имеет длительность 5,3 секунды.

Представленные на сайте Imagen Video примеры включают и простые сцены вроде «Стекающего по стаканчику тающего фисташкового мороженого», и замысловатые сценарии, например, «Пролёт сквозь битву пиратских кораблей в бушующем океане». Изображения содержат очевидные артефакты, однако их детализация и плавность заметно выше, чем у существующих аналогов. Параллельно дебютировала ещё одна ИИ-модель от Google для генерации видео по текстовому описанию — Phenaki создаёт более длинные ролики.

В Google рассказали, что система Imagen Video была обучена на общедоступной базе LAION-400M, которая содержит «14 млн пар видео-текст и 60 млн пар картинка-текст». По версии компании, это «проблемные данные», и хотя специалисты попытались их отфильтровать, сохраняется вероятность, что модель будет генерировать неприемлемый контент, содержащий сцены деликатного характера, насилие, социальные стереотипы и культурные предубеждения. И «пока эти опасения не будут устранены», исходный код модели Imagen Video публиковать не станут.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Konami со дня на день расскажет о новых играх Silent Hill и не только — анонсирована презентация Silent Hill Transmission 13 мин.
Windows сможет извлекать текст с фото на синхронизированном Android-смартфоне 24 мин.
ИИ потеснит бизнес-аналитиков: GPT-4 превзошёл человека в финансовом анализе 25 мин.
Telegram начнёт маркировать фейковые публикации 8 ч.
The Rogue Prince of Persia от соавторов Dead Cells вышла в раннем доступе Steam, причём без привязки к Ubisoft Connect 12 ч.
Календарь релизов 27 мая – 2 июня: Selaco, Nine Sols и обновленный MultiVersus 13 ч.
Моддер добавил «больше тонкостей и свободу действий» в один из лучших квестов The Elder Scrolls III: Morrowind 13 ч.
Издатель Syberia анонсировал первую игру про легендарного вора-джентльмена Арсена Люпена — трейлер и детали Arsene Lupin: Once a Thief 14 ч.
Инсайдер назвал слухи о ремейке первой Resident Evil «полной чушью» и прояснил, когда выйдет Resident Evil 9 15 ч.
Разработчики стратегии Songs of Conquest в духе «Героев Меча и Магии» анонсировали четыре сюжетных дополнения и первый аддон 16 ч.
Thermalright представила башенный кулер Burst Assassin 120 EVO DARK с парой вентиляторов 9 мин.
HP выпустила 37,5-дюймовый монитор Series 7 Pro с необычным соотношением сторон 24:10 и множеством портов 15 мин.
Realme представила смартфон Narzo N65 5G с Dimensity 6300, 50-Мп камерой и батарей на 5000 мА·ч 28 мин.
Чёрные дыры ведут себя как «Звёзды смерти» — их смертоносные джеты могут быстро менять направления 2 ч.
BOE построит в Чэнду крупнейший завод OLED-панелей, чтобы догнать Samsung и LG 3 ч.
Новая статья: Обзор ноутбука HUAWEI Matebook X Pro 2024: когда знаешь, что будет только лучше 11 ч.
Тридцать на одного: Liqid UltraStack 30 позволяет подключить десятки GPU к одному серверу 13 ч.
США выделили $75 млн на разработку инновационных стеклянных подложек для чипов 14 ч.
Представлены компактные SSD для ноутбуков и консолей IRDM M.2 2230 Pro Nano со скоростью до 7300 Мбайт/с 14 ч.
Amazon инвестирует €15,7 млрд в расширение облака AWS в Испании 14 ч.