Сегодня 18 мая 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → kandinsky video

«Сбер» представил собственный ИИ-генератор видео по текстовому описанию Kandinsky 4.0 Video

На проходящей на этой неделе конференции AI Journey «Сбер» представил бета-версию нейросети Kandinsky 4.0 Video, которая позволяет генерировать реалистичные видео на основе текстового описания или стартового кадра. Алгоритм может быть полезен не только обычным пользователям, но также дизайнерам, маркетологам и мультипликаторам, так как с его помощью можно создавать различные видео: от анимированных роликов с поздравлениями для близких до трейлеров и клипов.

 Источник изображения: fusionbrain.ai

Источник изображения: fusionbrain.ai

В компании отметили, что с момента релиза первой версии Kandinsky Video в прошлом году разработчики значительно улучшили многие характеристики алгоритма, включая качество создаваемых роликов и скорость генерации. Обновлённая нейросеть способна создавать ролики продолжительностью до 12 секунд с разрешением 1280 × 720 пикселей на основе текстового описания или изображения. Также поддерживается создание роликов с различным соотношением сторон. Улучшилось визуальное качество: повысились контрастность и чёткость кадров, композиция стала более выверенной, а движения объектов в кадре — реалистичными.

В дополнение к этому разработчики анонсировали ускоренную версию нейросети — Kandinsky 4.0 Video Flash, которая способна генерировать ролики продолжительностью до 12 секунд с разрешением 720 × 480 пикселей всего за 15 секунд. На начальном этапе доступ к новой версии Kandinsky Video получат представители креативных индустрий, включая художников, дизайнеров и кинематографистов через портал fusionbrain.ai. Для обычных пользователей алгоритм станет доступен в первом квартале следующего года.

«Сбер» открыла для всех ИИ-генератор 6-секундных видео Kandinsky Video 1.1

«Сбер» официально объявил о запуске бета-версии нейросети Kandinsky Video 1.1, которая способна создавать полноценные видео продолжительностью 6 секунд на основе текстового описания или статического изображения. Оценить возможности алгоритма можно на платформе fusionbrain.ai и в Telegram-боте Kandinsky.

 Источник изображения: fusionbrain.ai

Источник изображения: fusionbrain.ai

Нейросеть генерирует непрерывную сцену с движением объектов и фона продолжительностью до шести секунд на скорости 8 кадров в секунду или 32 кадра в секунду. Поддерживается генерация роликов в форматах 16:9, 9:16 и 1:1. Обновлённый алгоритм способен создавать ролики не только по текстовому описанию, но и на основе статического изображения. За счёт этого пользователи имеют больше возможностей для реализации своих творческих задумок. В дополнение к этому пользователь может контролировать динамику генерируемого видео путём изменения параметра «motion score».

«Сегодня мы сделали ещё один шаг в будущее видеотворчества. Теперь каждый пользователь Kandinsky Video может воплотить свои идеи и выразить их в видеоформате. С момента запуска первой версии нейросети прошло менее года, и за это время наша команда значительно улучшила такие показатели, как качество и скорость генерации полноценных видеороликов, открывая тем самым безграничные горизонты для креатива», — прокомментировал запуск нового алгоритма Андрей Белевцев, старший вице-президент, руководитель блока «Техническое развитие» Сбербанка.

«Сбер» представил нейросеть Kandinsky Video — она генерирует 8-секундные видео по текстовому описанию

«Сбер» представил нейросеть Kandinsky Video, способную создавать небольшие ролики по текстовому описанию. Алгоритм генерирует видеоряд продолжительностью до 8 секунд с частотой 30 кадров в секунду. Новинка была презентована в рамках конференции AI Journey первым заместителем председателя правления «Сбербанка» Александром Ведяхиным.

 Источник изображения: sberbank.com

Источник изображения: sberbank.com

Архитектура Kandinsky Video включает в себя два основных блока. Первый блок отвечает за генерацию ключевых кадров, используемых для создания структуры сюжета видео, а второй — генерирует интерполяционные кадры, за счёт чего достигается плавность движения в финальном ролике. Оба блока построены на базе модели синтеза изображений по текстовым описаниям Kandinsky 3.0.

В конечном счёте алгоритм создаёт видео с движением как объекта, так и фона. Это отличает сгенерированные нейросетью видео от анимационных роликов, в которых динамика достигается за счёт моделирования полёта камеры относительно статичной сцены. В настоящее время Kandinsky Video может создавать видео с разрешением 512 × 512 пикселей и разным соотношением сторон. Для обучения алгоритма использовался датасет из более чем 300 тыс. пар «текст-видео». Сам же процесс генерации ролика занимает до 3 минут.

Отмечается, что ранее некоторые пользователи нейросети Kandinsky 2.2 в тестовом режиме получили доступ к функции создания анимационных роликов. Всего одного запроса достаточно для генерации видео продолжительностью до 4 секунд с выбранными эффектами анимации, частотой 24 кадра в секунду и разрешением 640 × 640 пикселей. Пользователи новой версии Kandinsky 3.0 также могут генерировать ролики по текстовому описанию в режиме анимации.


window-new
Soft
Hard
Тренды 🔥
Новая статья: The Precinct: вы имеете право хранить молчание. Рецензия 16 ч.
Android-приложения получат доступ к ИИ-модели Gemini Nano, которая работает прямо на смартфоне 17-05 13:19
Microsoft показала возможности кастомизации нового меню «Пуск» для Windows 11 17-05 13:15
Epic Games снова обратилась в суд, чтобы принудить Apple вернуть Fortnite на iPhone 17-05 12:37
Intel выпустила важные исправления безопасности для устранения уязвимостей в Core Ultra, Arc и серверных GPU 17-05 07:32
OpenAI станет одним из основных пользователей крупного ЦОД в ОАЭ 17-05 06:34
Microsoft отделила Teams от Office в попытке увернуться от штрафа в ЕС 17-05 00:41
Новая статья: «Приключения Капитана Блада» — ахой из прошлого. Рецензия 17-05 00:00
Не будут брать подписку — отключим апдейт: Broadcom нарушила обещание поддерживать VMware с «вечными» лицензиями 16-05 23:14
«Мы делаем всё возможное»: создатели Stellar Blade отреагировали на недоступность игры в 130 странах и развеяли опасения фанатов насчёт Denuvo 16-05 23:11
Квартальные поставки Nearline-накопителей сократились на 12 % 2 ч.
Квартальная выручка CoreWeave взлетела в пять раз, но компания продолжает нести убытки 2 ч.
Индия потеряла новый спутник по пути на орбите — у ракеты-носителя PSLV-XL отказал двигатель 3 ч.
Xiaomi намеревается сделать свои электромобили самыми безопасными в отрасли 8 ч.
Первые немногочисленные роботакси Tesla будут контролироваться дистанционно 9 ч.
Глава Nvidia утверждает, что свидетельств контрабанды ускорителей этой марки в Китай нет 9 ч.
TSMC запустит девять новых фабрик вместо пяти в этом году из-за невероятного спроса на ИИ-чипы 15 ч.
Apple может полностью потерять китайский рынок смартфонов — Вашингтон против работы в сфере ИИ с Alibaba 18 ч.
Европа перейдёт на торий и выработанный уран — помимо энергии это сэкономит на захоронении отходов АЭС 18 ч.
Nvidia выпустит новый ИИ-ускоритель для Китая, но это будет уже не Hopper 22 ч.