Сегодня 26 июня 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Runway AI создала ИИ для генерации видео по текстовому описанию, но у него «иногда машины могут улететь»

Разработчики генеративных нейросетей добились значительного успеха в создании статических изображений, подтверждением чему служат набравшие популярность модели, такие как Dall-E и Stable Diffusion. Теперь же стартап Runway AI представил нейросеть, способную генерировать по текстовому описанию короткие видеоролики.

 Источник изображения: Runway AI

Источник изображения: Runway AI

Генеративная нейросеть Gen 2 от Runway AI способна создавать короткие видео, опираясь на текстовое описание всего из нескольких слов. Достаточно написать, например, «кошка, идущая под дождём», после чего ИИ-алгоритм сгенерирует 3-секундное видео, демонстрирующее именно это или что-то очень похожее. В дополнение к этому пользователь может загрузить изображение, которое станет для алгоритма своеобразной подсказкой.

Сейчас нейросеть Runway AI доступна не всем. На данном этапе желающим испытать нейросеть в деле необходимо зарегистрироваться на сайте разработчиков и добавить себя в лист ожидания. Отметим, что Runway AI занимается разработкой инструментов на основе искусственного интеллекта с 2018 года и в прошлом году компания сумела привлечь $50 млн инвестиций. Стартап помогал в разработке оригинальной версии Stable Diffusion, которая способна генерировать изображения по текстовому описанию.

Во время демонстрации возможностей ИИ попросили создать видео «съёмки пустынного пейзажа с дрона». Несколько минут нейросеть обрабатывала запрос, но в конечном счёте ей удалось создать ролик, который соответствует предложенному описанию. Несколько других роликов раскрывают сильные и слабые стороны ИИ-алгоритма. Разработчики отмечают, что модель ещё не до конца «разобралась», как более точно изображать движущиеся объекты. «Вы можете сгенерировать автомобильную погоню, но иногда машины могут улететь», — отметили в Runway AI.

Также Gen 2 способна менять уже готовые видео, накладывая маски, добавлять стилизацию или даже полностью перестраивая картинку. Например, с помощью масок получились заменить на видео лабрадора на далматинца. Также ИИ смог превратить несколько поставленных на ребро блокнотов в ночной мегаполис. Либо из очень упрощенной 3D-модели сделать почти что кинематографическую картинку. Ещё ИИ способен анимировать фотографии.

Представленный алгоритм Gen 2 является логическим продолжением созданной ранее нейросети Gen 1. Тестирование алгоритма с привлечением небольшого числа пользователей началось в феврале. В настоящее время к этому процессу привлечены тысячи пользователей. Согласно имеющимся данным, в разработчики изучают возможность добавления к генерируемым видео звука, поскольку на данном этапе ИИ-алгоритм создаёт видео без звука.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Политические дипфейки оказались самой популярным направлением в злоупотреблениях ИИ 2 ч.
Forza Horizon 4 скоро снимут с продажи и удалят из Game Pass — подробности и причины 3 ч.
Игровая студия стримера Dr Disrespect разорвала с ним отношения — выяснилась причина его вечного бана на Twitch 4 ч.
Еженедельный чарт Steam: Elden Ring, новый кооперативный хит Chained Together и MMORPG от создателя EVE Online 5 ч.
Спустя три года фанаты дождались анонса Farming Simulator 25 — дата выхода, первый трейлер и предзаказ в российском Steam 6 ч.
Apple включила RCS на iPhone с выпуском второй беты iOS 18, но работает функция пока не у всех 7 ч.
Сборник S.T.A.L.K.E.R. Legends of the Zone Trilogy на PlayStation и Xbox получил официальную поддержку модов 8 ч.
ЕС предъявил Microsoft обвинения в незаконной привязке Teams к Office — компании грозит многомиллионный штраф 8 ч.
Анонсирована новая игра в легендарной серии «Ил-2» — первый тизер и скриншоты «Корея. Серия Ил-2» 8 ч.
OpenAI отключит API ChatGPT для китайских компаний — местные аналоги ждут наплыва пользователей 9 ч.
Новая статья: Обзор смартфона Infinix NOTE 40 Pro+ 5G: главарь банды 38 мин.
Etched Sohu — самый быстрый в мире ИИ-ускоритель, но только для трансформеров 2 ч.
Новая статья: Обзор ноутбука OSiO FocusLine F160a: уверенные первые шаги 3 ч.
Самолёты можно питать с помощью микроволнового излучения прямо в полёте, но сделать это крайне трудно 4 ч.
Huawei показала лучший рост продаж смартфонов во время недавних распродаж в Китае, несмотря на самые скромные скидки 5 ч.
Китайский стартап Yusur наладил массовое производство DPU третьего поколения K2-Pro 5 ч.
Представлена обновлённая портативная колонка Beats Pill с автономностью на 24 часа, защитой IP67 и портом USB-C 8 ч.
Tesla отозвала более 11 000 пикапов Cybertruck из-за проблем с обшивкой кузова и стеклоочистителем 8 ч.
В России запустили самый точный отечественный квантовый процессор 8 ч.
Etched представила ИИ-чип для нейросетей-трансформеров — он в разы быстрее и дешевле ускорителей Nvidia 8 ч.