Сегодня 06 мая 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

«Сбер» представил Kandinsky — ИИ-модель для генерации изображений по текстовому описанию на русском языке

«Cбер» анонсировал Kandinsky — самую мощную на данный момент модель генерации изображений по текстовому описанию на русском языке, основанную на мультимодальной нейросети ruDALL-E, с помощью которой можно создавать различные виды изображений, включая иллюстрации, материалы для рекламных кампаний, архитектурного и промышленного дизайна, а также дизайна в области цифрового искусства.

 Источник изображения: Сбер

Источник изображения: Сбер

В ноябре прошлого года были выложены в открытый доступ код и параметры модели ruDALL-E XL, содержащей 1,3 млрд параметров, а также был разработан сервис генерации изображений. В этом же месяце была представлена эксклюзивная модель ruDALL-E XXL c 12 млрд параметров, которую специалисты Sber AI и SberDevices существенно улучшили, дообучив её на 179 млн изображений, снабжённых текстовыми описаниями, с помощью платформы SberCloud ML Space и суперкомпьютера Christofari Neo.

Созданная в результате дообучения модель Kandinsky умеет генерировать изображения с произвольным соотношением сторон, а также поддерживает в дополнение к стандартному подходу с использованием Real-ESRGAN способ повышения разрешения картинок на основе диффузионного процесса для изображений с соотношением сторон 1:1. Благодаря этому модель может создавать более реалистичные изображения, отображая различные текстуры, тени и отражения.

Процесс создания изображений с помощью модели Kandinsky проходит в три этапа. Сначала одна нейросеть (непосредственно Kandinsky) на основе текстового описания генерирует заданное число изображений. Затем вторая нейросеть (ruCLIP Large) выбирает из них наиболее соответствующие заданному текстовому описанию картинки, после чего третья увеличивает их в размере, используя или диффузионный способ, или Real-ESRGAN. В итоге получается набор сгенерированных изображений высокого качества. По сравнению с предыдущими версиями модель Kandinsky обеспечивает более высокую степень детализации изображений.

Модель Kandinsky доступна в мобильном приложении «Салют», на умных устройствах Sber по запросу «Включи художника».

По словам Александра Ведяхина, первого заместителя председателя правления «Сбера», модель Kandinsky способна более точно сравнивать и анализировать различные изображения, чтобы создавать настоящие живописные картины. Предполагается, что одним из одним из главных бенефициаров новой технологии станет бизнес.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Обзорный трейлер пошаговой ролевой игры SteamWorld Heist II: бои, прокачка, мультиклассы и кое-что ещё 9 ч.
Не бывать дешёвым мейнфреймам: IBM подала второй иск к LzLabs, предлагающей доступную облачную альтернативу её «железу» 9 ч.
Симулятор выживания Serum про сыворотку, гонку со временем и отравленный лес выйдет в раннем доступе 23 мая 17 ч.
В Instagram появились «секретные» Stories — для их просмотра нужно написать автору 18 ч.
IBM избежала выплаты $1,6 мрд в пользу BMC 19 ч.
Пользователи Threads смогут ограничить цитирование своих публикаций 20 ч.
Новая статья: Stellar Blade: внешность — не главное. Рецензия 05-05 00:05
Новая статья: Gamesblender № 672: слухи о презентации Xbox, триумф Manor Lords и «истинная» российская ААА-игра 04-05 23:32
iOS 18 получит функцию сокращения текстов и веб-страниц на основе ИИ 04-05 23:06
Рынок российских музыкальных сервисов вырос на 40 % в 2023 году 04-05 18:13
CATL разрабатывает натрий-ионные аккумуляторы второго поколения, но их практическое применение видит только в сочетании с литиевыми 2 мин.
Tesla готовит почву для легализации FSD в Европе и Великобритании 56 мин.
Апрельская выручка Foxconn выросла на 19 % до рекордных $15,8 млрд 3 ч.
Новая статья: Он вам не силикон! Часть третья: через нанотрубки к волшебным пузырькам 8 ч.
Nintendo 3DS на максималках: портативной консоли Asus ROG Ally добавили второй экран 12 ч.
HPE представила СХД среднего уровня Cray Storage Systems C500 для задач НРС и ИИ 18 ч.
SK hynix продала всю память HBM, запланированную к выпуску в 2024–2025 гг. 18 ч.
Власти США продали на аукционе 5,34-ПФлопс суперкомпьютер Cheyenne из-за растущего числа сбоев и протечек СЖО 18 ч.
В этом квартале цены на память DRAM вырастут более чем на 20 % 23 ч.
Презентация новых Apple iPad пройдёт в удобное для европейцев и китайцев время 05-05 06:53