Сегодня 09 мая 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

OpenAI представила ИИ-генератор видео Sora, который выдаёт впечатляющие результаты

OpenAI представила новую нейросеть Sora для генерации видео. Компания утверждает, что Sora «может создавать реалистичные и фантазийные сцены по текстовым инструкциям». Модель преобразования текста в видео позволяет пользователям создавать на базе текстовых описаний фотореалистичные видео длиной до минуты с разрешением Full HD (1920 × 1080 точек).

 Источник изображения: OpenAI

Источник изображения: OpenAI

Sora способна создавать «сложные сцены с несколькими персонажами, определенными типами движения и точной детализацией объекта и фона», говорится в блоге OpenAI. Компания также отмечает, что нейросеть может понимать, как объекты «существуют в физическом мире», а также «точно интерпретировать реквизит и генерировать убедительных персонажей, выражающих яркие эмоции».

Модель может генерировать видео на основе неподвижного изображения, заполнять недостающие кадры в существующем видео или расширять его. Среди демонстрационных роликов, созданных с помощью Sora и показанных в блоге OpenAI, сцена Калифорнии времен золотой лихорадки, видео, снятое как будто изнутри токийского поезда, и другие. Многие из них имеют некоторые артефакты, указывающие на работу искусственного интеллекта. Например, подозрительно движущийся пол в видеоролике о музее. Сама OpenAI говорит, что модель «может испытывать трудности с точным моделированием физики сложной сцены», но в целом результаты довольно впечатляющие.

Пару лет назад именно генераторы текста в изображение, такие как Midjourney, лучше всего демонстрировали способности ИИ превращать слова в изображения. Но в последнее время генеративное видео стало улучшаться заметными темпами: такие компании, как Runway и Pika, продемонстрировали впечатляющие модели преобразования текста в видео, а Lumiere от Google, похоже, станет одним из главных конкурентов OpenAI в этой области. Как и Sora, Lumiere предоставляет пользователям инструменты для преобразования текста в видео, а также позволяет создавать видео из неподвижного изображения.

В настоящее время Sora доступна только отдельным тестировщикам, которые оценивают модель на предмет потенциального вреда и рисков. OpenAI также предлагает доступ по запросу отдельным художникам, дизайнерам и кинематографистам, чтобы получить обратную связь. Компания отмечает, что существующая модель может неточно имитировать физику сложной сцены и неправильно интерпретировать некоторые случаи причинно-следственных связей.

Ранее в этом месяце OpenAI объявила, что добавляет маркировку в свой инструмент преобразования текста в изображение DALL-E 3, но отмечает, что их можно легко удалить. Как и в случае с другими продуктами на базе ИИ, компании OpenAI придется бороться с последствиями того, что поддельные фотореалистичные видео, созданные ИИ, будут выдавать за настоящие.

Больше видео, сгенерированных Sora, можно найти здесь.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Хоррор-шутер Alien: Rogue Incursion Evolved Edition отправит игроков выживать под натиском небывало хитрых ксеноморфов — трейлер и дата выхода 54 мин.
Сэм Альтман передал управление ChatGPT новому руководителю, а сам займётся исследованиями 3 ч.
Google защитит пользователей Chrome от фишинга с помощью локальной ИИ-модели Gemini Nano 3 ч.
Microsoft упростит установку приложений в Windows 11, но это может привести к засорению системы 12 ч.
Первое сюжетное дополнение к Kingdom Come: Deliverance 2 не заставит себя долго ждать — новый трейлер и дата выхода Brushes with Death 13 ч.
Meta наделит следующие умные очки Ray-Ban «супервосприятием» — функцией распознавания лиц окружающих 15 ч.
Первый геймплейный трейлер подтвердил дату выхода Mafia: The Old Country — игру будут продавать за $50 15 ч.
ИИ-боты начинают чаще привирать, когда их просят о лаконичных ответах — исследование 16 ч.
Перенос GTA VI прибавил Electronic Arts уверенности в успехе новой Battlefield 16 ч.
Apple начала принимать заявки на компенсации по иску о подслушивании Siri 17 ч.
OpenAI планирует развивать ИИ-инфраструктуру Stargate за пределами США 14 мин.
В завирусившемся видео человекоподобный робот Unitree H1 повёл себя неадекватно, неся угрозу окружающим 23 мин.
Apple продвинулась в разработке новых процессоров для умных очков и компьютеров 50 мин.
ASML ускорит строительство нового кампуса, где будет производиться оборудование для выпуска чипов 2 ч.
Продажи Tesla в апреле резко упали как в Китае, так и в Европе 3 ч.
Первая фаза ИИ-кластера xAI Colossus полностью обеспечена энергией 8 ч.
Новая статья: Двумерные полупроводники: ещё один подход к снаряду 10 ч.
Квартальная выручка Arm впервые превысила $1 млрд, но акции упали из-за слабого прогноза 10 ч.
Lenovo возродила 3D-гейминг — представлен ноутбук Legion 9i с RTX 5090, безочковым 3D-экраном и крышкой из кованного углеволокна 12 ч.
Razer выпустила компактные игровые мышь Basilisk Mobile и клавиатуру Joro для мобильного гейминга 12 ч.