Сегодня 03 сентября 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

OpenAI представила ИИ-генератор видео Sora, который выдаёт впечатляющие результаты

OpenAI представила новую нейросеть Sora для генерации видео. Компания утверждает, что Sora «может создавать реалистичные и фантазийные сцены по текстовым инструкциям». Модель преобразования текста в видео позволяет пользователям создавать на базе текстовых описаний фотореалистичные видео длиной до минуты с разрешением Full HD (1920 × 1080 точек).

 Источник изображения: OpenAI

Источник изображения: OpenAI

Sora способна создавать «сложные сцены с несколькими персонажами, определенными типами движения и точной детализацией объекта и фона», говорится в блоге OpenAI. Компания также отмечает, что нейросеть может понимать, как объекты «существуют в физическом мире», а также «точно интерпретировать реквизит и генерировать убедительных персонажей, выражающих яркие эмоции».

Модель может генерировать видео на основе неподвижного изображения, заполнять недостающие кадры в существующем видео или расширять его. Среди демонстрационных роликов, созданных с помощью Sora и показанных в блоге OpenAI, сцена Калифорнии времен золотой лихорадки, видео, снятое как будто изнутри токийского поезда, и другие. Многие из них имеют некоторые артефакты, указывающие на работу искусственного интеллекта. Например, подозрительно движущийся пол в видеоролике о музее. Сама OpenAI говорит, что модель «может испытывать трудности с точным моделированием физики сложной сцены», но в целом результаты довольно впечатляющие.

Пару лет назад именно генераторы текста в изображение, такие как Midjourney, лучше всего демонстрировали способности ИИ превращать слова в изображения. Но в последнее время генеративное видео стало улучшаться заметными темпами: такие компании, как Runway и Pika, продемонстрировали впечатляющие модели преобразования текста в видео, а Lumiere от Google, похоже, станет одним из главных конкурентов OpenAI в этой области. Как и Sora, Lumiere предоставляет пользователям инструменты для преобразования текста в видео, а также позволяет создавать видео из неподвижного изображения.

В настоящее время Sora доступна только отдельным тестировщикам, которые оценивают модель на предмет потенциального вреда и рисков. OpenAI также предлагает доступ по запросу отдельным художникам, дизайнерам и кинематографистам, чтобы получить обратную связь. Компания отмечает, что существующая модель может неточно имитировать физику сложной сцены и неправильно интерпретировать некоторые случаи причинно-следственных связей.

Ранее в этом месяце OpenAI объявила, что добавляет маркировку в свой инструмент преобразования текста в изображение DALL-E 3, но отмечает, что их можно легко удалить. Как и в случае с другими продуктами на базе ИИ, компании OpenAI придется бороться с последствиями того, что поддельные фотореалистичные видео, созданные ИИ, будут выдавать за настоящие.

Больше видео, сгенерированных Sora, можно найти здесь.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Инсайдер: амбициозная Resident Evil Requiem выйдет на Nintendo Switch 2 и даже PS4 9 мин.
ИИ-блокнот Google NotebookLM научился спорить сам с собой в формате аудиообзоров 51 мин.
Конкуренты Google негодуют из-за того, что суд разрешил ей сохранить Chrome 54 мин.
Количество зрителей на Twitch упало до самого низкого уровня за 5 лет из-за борьбы с ботами 2 ч.
«Вы объявили об этом только из-за “Таркова”»: анонс скорого релиза эвакуационного шутера Arena Breakout: Infinite в Steam удивил игроков 2 ч.
ChatGPT получит родительский контроль и научится выявлять психологические проблемы у пользователей 2 ч.
Суд разрешил Google дальше платить Apple миллиарды за установку её поиска в Safari по умолчанию 3 ч.
Новый геймплейный трейлер раскрыл дату выхода Steel Century Groove — ритмической RPG про танцевальные дуэли бывших военных роботов 3 ч.
Илон Маск нашёл новую причину затянуть с выплатой выходных пособий уволенным сотрудникам Twitter 4 ч.
Европа передумала штрафовать Google за монополизм, чтобы не вызвать гнев Трампа 4 ч.
Acer представила килограммовый 16-дюймовый ноутбук Swift Air 16 с функциями ИИ 36 мин.
Tesla рассказала, кто покупает её автопилот — наибольшей популярностью FSD пользуется у владельцев дорогих моделей 50 % 52 мин.
Tesla представила четвёртый «Генеральный план», но так и не разобралась с предыдущими 54 мин.
FS представила оптические коммутаторы DCS-W и 800G LPO-трансивер для задач ИИ и НРС 2 ч.
SpaceX выполнила редкий запуск Falcon 9 с новой первой ступенью — созвездие Starlink пополнили 24 спутника 2 ч.
Intel потратила больше других чипмейкеров на исследования, но ей это не особо помогло 3 ч.
Ядерные отходы станут источником дефицитного трития для термоядерных реакторов 3 ч.
В чем уникальность зум-камеры HUAWEI Pura 80 Ultra? 4 ч.
Гибридный суперчип NVIDIA GB10 оказался технически самым совершенным в семействе Blackwell 4 ч.
«Фантомные» ИИ ЦОД ещё не построены, но уже мешают энергокомпаниям США 5 ч.