Сегодня 18 сентября 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

«Сбер» представил ИИ-художника Kandinsky 3.0 — он стал точнее и изучил отечественный культурный код

«Сбер» представил на конференции AI Journey обновлённую генеративную модель искусственного интеллекта Kandinsky 3.0, предназначенную для создания изображений. Она научилась лучше понимать текстовые запросы пользователей, стала генерировать более фотореалистичные изображения, художественные картины и наброски.

 Источник изображений: sberbank.com

Источник изображений: sberbank.com

Одним из важнейших нововведений Kandinsky 3.0 стало обучение нейросети элементам отечественного культурного кода — это коснулось советских и российских знаменитостей и персонажей, архитектурных достопримечательностей, культурных объектов и объектов народного творчества: в частности, нейросеть знакома с гжелью. Разработчик усовершенствовал функцию редактирования изображения и возможность дорисовки картины в режиме бесконечного полотна.

По умолчанию Kandinsky 3.0 генерирует картинки c разрешением 1024 × 1024 пикселей, но есть возможность выбрать другое соотношение сторон. При обучении разработчик использовал массив из 1,5 млрд пар изображений с текстовыми описаниями. Нейросеть также получила поддержку генерации 4-секундных видеороликов по текстовому описанию — они имеют разрешение 640 × 640 пикселей с частотой 24 кадра в секунду. Генерация одной секунды видео занимает примерно 20 секунд. Модели анимации включают перемещения объектов, их приближение, удаление и другие приёмы. Основу алгоритма составляет перерисовка изображения по текстовому описанию.

Поработать с моделью Kandinsky 3.0 можно на платформе fusionbrain.ai, на сайте rudalle.ru, при помощи ботов в Telegram и «ВКонтакте», в переписке с чат-ботом GigaChat, в приложениях «СберБанк Онлайн» и «Салют», а также в умных устройствах от «Сбера» по команде «запусти художника». Доступ к созданию анимации в Telegram производится по предварительной заявке.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
В сервисе чтения новостей Google Discover появилась возможность подписки и больше социального контента 16 мин.
Reddit готовит новый контракт с Google по интеграции с ИИ-сервисами 2 ч.
Студия ветерана Blizzard анонсировала динамичный изометрический боевик Arkheron — смесь Diablo и королевской битвы 10 ч.
Даже авторы сценария The Wolf Among Us 2 не знают, что происходит с игрой 11 ч.
Nothing анонсировала OS 4.0 — интерфейс стал проще, а камера умнее 13 ч.
Paradox добавила возмутившие фанатов платные кланы в стандартное издание Vampire: The Masquerade — Bloodlines 2 и анонсировала два сюжетных DLC 13 ч.
Жертвы утечки данных Facebook через Cambridge Analytica начали получать выплаты от Цукерберга 14 ч.
В мессенджере Max начинаются «открытые» тесты каналов — создавать их разрешат блогерам из реестра РКН 14 ч.
В России выплатили первую зарплату в цифровых рублях 15 ч.
На официальном сайте Like a Dragon засветилась Yakuza Kiwami 3 — Ryu Ga Gotoku Studio готовит анонс ремейка Yakuza 3 16 ч.
Apple рассматривает возможность организации сборки складного iPhone на Тайване и в Индии 19 мин.
За пять лет количество расследований в сфере промышленного шпионажа на Тайване выросло на 31 % 51 мин.
Alibaba удалось разработать ИИ-чип T-Head PPU, сопоставимый по характеристикам с Nvidia H20 5 ч.
Новая статья: Обзор «золотого» блока питания GamerStorm PQ1000G (PQA00G-FD) с разъемом 12V-2x6 9 ч.
Глава NVIDIA разочарован запретом Китая на покупку RTX Pro 6000D, но все вопросы будут решаться на высшем уровне 10 ч.
Журналисты протестировали Apple Watch Series 11, Ultra 3 и SE 3 — всем нравится младшая модель 10 ч.
CoreWeave инвестирует ещё £1,5 млрд в британские ИИ ЦОД 10 ч.
Garmin выпустила смарт-часы Venu 4 — улучшенные функции, светодиодный фонарик и цена от $550 11 ч.
iPhone 17 Pro обласкали в первых обзорах: «значительное обновление, вызывающее восторг» 11 ч.
СМИ и блогеры протестировали iPhone Air: «ультратонкий смартфон не без компромиссов» 11 ч.