Инженеры «Сбера» представили обновлённое семейство моделей искусственного интеллекта Kandinsky 5.0. Оно представлено четырьмя моделями: одна предназначена для генерации, а вторая — для редактирования статических изображений; ещё две генерируют видео. Компания открыла веса всех четырёх нейросетей.
Источник изображений: «Сбер»
Модель Kandinsky 5.0 Image Lite генерирует изображения высокого разрешения, в том числе 1280 × 768 и 1024 × 1024 пикселей. Image Editing предназначается для редактирования картинок высокого разрешения. Video Pro создаёт ролики длиной до 10 секунд в разрешении 1280 × 768 пикселей с частотой 24 кадра в секунду. Video Lite генерирует видео стандартного разрешения (768 × 512 пикселей) с той же частотой и может запускаться на бытовых видеокартах с 12 Гбайт памяти. В качестве запросов все модели принимают как изображения, так и текстовые описания.

Важнейшее преимущество моделей «Сбера» в семействе Kandinsky 5.0 — их способность свободно ориентироваться в российском культурном контексте; они могут создавать надписи на кириллице и латинице. Нейросети нового поколения понимают физические процессы и кинематографические приёмы — они поддерживают повороты и вращения камеры, а также умеют «оживлять» статические фотографии. Высокого качества изображений и видео у моделей Kandinsky 5.0 разработчики «Сбера» добились, обучая их на тщательно подобранных материалах с выверенной композицией.
Опробовать нейросети «Сбера» Kandinsky 5.0 Image Lite, Video Lite и Video Pro можно в приложении GigaChat для Android-устройств, на сайте giga.chat, а также в мессенджерах Telegram и Max. Все они доступны бесплатно.