Сегодня 19 ноября 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Runway AI создала ИИ для генерации видео по текстовому описанию, но у него «иногда машины могут улететь»

Разработчики генеративных нейросетей добились значительного успеха в создании статических изображений, подтверждением чему служат набравшие популярность модели, такие как Dall-E и Stable Diffusion. Теперь же стартап Runway AI представил нейросеть, способную генерировать по текстовому описанию короткие видеоролики.

 Источник изображения: Runway AI

Источник изображения: Runway AI

Генеративная нейросеть Gen 2 от Runway AI способна создавать короткие видео, опираясь на текстовое описание всего из нескольких слов. Достаточно написать, например, «кошка, идущая под дождём», после чего ИИ-алгоритм сгенерирует 3-секундное видео, демонстрирующее именно это или что-то очень похожее. В дополнение к этому пользователь может загрузить изображение, которое станет для алгоритма своеобразной подсказкой.

Сейчас нейросеть Runway AI доступна не всем. На данном этапе желающим испытать нейросеть в деле необходимо зарегистрироваться на сайте разработчиков и добавить себя в лист ожидания. Отметим, что Runway AI занимается разработкой инструментов на основе искусственного интеллекта с 2018 года и в прошлом году компания сумела привлечь $50 млн инвестиций. Стартап помогал в разработке оригинальной версии Stable Diffusion, которая способна генерировать изображения по текстовому описанию.

Во время демонстрации возможностей ИИ попросили создать видео «съёмки пустынного пейзажа с дрона». Несколько минут нейросеть обрабатывала запрос, но в конечном счёте ей удалось создать ролик, который соответствует предложенному описанию. Несколько других роликов раскрывают сильные и слабые стороны ИИ-алгоритма. Разработчики отмечают, что модель ещё не до конца «разобралась», как более точно изображать движущиеся объекты. «Вы можете сгенерировать автомобильную погоню, но иногда машины могут улететь», — отметили в Runway AI.

Также Gen 2 способна менять уже готовые видео, накладывая маски, добавлять стилизацию или даже полностью перестраивая картинку. Например, с помощью масок получились заменить на видео лабрадора на далматинца. Также ИИ смог превратить несколько поставленных на ребро блокнотов в ночной мегаполис. Либо из очень упрощенной 3D-модели сделать почти что кинематографическую картинку. Ещё ИИ способен анимировать фотографии.

Представленный алгоритм Gen 2 является логическим продолжением созданной ранее нейросети Gen 1. Тестирование алгоритма с привлечением небольшого числа пользователей началось в феврале. В настоящее время к этому процессу привлечены тысячи пользователей. Согласно имеющимся данным, в разработчики изучают возможность добавления к генерируемым видео звука, поскольку на данном этапе ИИ-алгоритм создаёт видео без звука.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
«Тарантиновские» диалоги и локации, от которых хочется кричать: новые детали «Русы против ящеров 2» 21 мин.
Духовный наследник Left 4 Dead получит сиквел — актёр «засветил» Back 4 Blood 2 53 мин.
Объявлены номинанты The Game Awards 2024 — Astro Bot и Final Fantasy VII Rebirth впереди, а дополнение к Elden Ring претендует на игру года 3 ч.
Ключевыми клиентами ИИ-сервиса Microsoft Azure OpenAI стали Adobe и Meta, но крупнейшим заказчиком всё ещё остаётся TikTok 4 ч.
Roblox введёт новые ограничения и расширит родительские возможности для защиты детей 5 ч.
Календарь релизов — 18–24 ноября: S.T.A.L.K.E.R. 2, Microsoft Flight Simulator 2024 и Loco Motive 5 ч.
«Время пришло»: следующий большой патч станет последним контентным обновлением для Pathfinder: Wrath of the Righteous 7 ч.
Google снова оштрафовали в России, но теперь всего на 3,8 млн рублей 7 ч.
Selectel объявил о доступности серверной операционной системы SelectOS 9 ч.
Снова не Bloodborne: инсайдер рассекретил ремастер Dark Souls 3 10 ч.
Новая статья: Практикум по ИИ-рисованию, часть одиннадцатая: быстрое прототипирование с FLUX.1 [schnell] 9 мин.
Samsung придумала, как сделать смартфоны тоньше — представлена перископическая камера ISOCELL ALoP 36 мин.
Nike выпустила кроссовки, почти полностью напечатанные на 3D-принтере 57 мин.
Карманный ноутбук GPD Pocket 4 с чипами AMD будет предлагаться по цене от $829 2 ч.
На дне Балтийского моря был разорван телекоммуникационный кабель 2 ч.
Sparkle представила видеокарту Arc A310 Omni View, которая медленнее эталонной Arc A310 2 ч.
Nubia Z70 Ultra показался во всей красе в чёрном, кремовом и звёздно-ночном обличиях 3 ч.
Счетверённые H200 NVL и 5,5-кВт GB200 NVL4: NVIDIA представила новые ИИ-ускорители 3 ч.
Российский бренд OSiO отпраздновал первый год на рынке и рассказал о новых компьютерах 5 ч.
CoreWeave добилась оценки в $23 млрд после вторичной продажи акций, среди инвесторов — Pure Storage 6 ч.