Сегодня 20 мая 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

«Сбер» представил Kandinsky — ИИ-модель для генерации изображений по текстовому описанию на русском языке

«Cбер» анонсировал Kandinsky — самую мощную на данный момент модель генерации изображений по текстовому описанию на русском языке, основанную на мультимодальной нейросети ruDALL-E, с помощью которой можно создавать различные виды изображений, включая иллюстрации, материалы для рекламных кампаний, архитектурного и промышленного дизайна, а также дизайна в области цифрового искусства.

 Источник изображения: Сбер

Источник изображения: Сбер

В ноябре прошлого года были выложены в открытый доступ код и параметры модели ruDALL-E XL, содержащей 1,3 млрд параметров, а также был разработан сервис генерации изображений. В этом же месяце была представлена эксклюзивная модель ruDALL-E XXL c 12 млрд параметров, которую специалисты Sber AI и SberDevices существенно улучшили, дообучив её на 179 млн изображений, снабжённых текстовыми описаниями, с помощью платформы SberCloud ML Space и суперкомпьютера Christofari Neo.

Созданная в результате дообучения модель Kandinsky умеет генерировать изображения с произвольным соотношением сторон, а также поддерживает в дополнение к стандартному подходу с использованием Real-ESRGAN способ повышения разрешения картинок на основе диффузионного процесса для изображений с соотношением сторон 1:1. Благодаря этому модель может создавать более реалистичные изображения, отображая различные текстуры, тени и отражения.

Процесс создания изображений с помощью модели Kandinsky проходит в три этапа. Сначала одна нейросеть (непосредственно Kandinsky) на основе текстового описания генерирует заданное число изображений. Затем вторая нейросеть (ruCLIP Large) выбирает из них наиболее соответствующие заданному текстовому описанию картинки, после чего третья увеличивает их в размере, используя или диффузионный способ, или Real-ESRGAN. В итоге получается набор сгенерированных изображений высокого качества. По сравнению с предыдущими версиями модель Kandinsky обеспечивает более высокую степень детализации изображений.

Модель Kandinsky доступна в мобильном приложении «Салют», на умных устройствах Sber по запросу «Включи художника».

По словам Александра Ведяхина, первого заместителя председателя правления «Сбера», модель Kandinsky способна более точно сравнивать и анализировать различные изображения, чтобы создавать настоящие живописные картины. Предполагается, что одним из одним из главных бенефициаров новой технологии станет бизнес.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
ChatGPT показал сильнейший в истории скачок выручки у мобильного приложения после запуска GPT-4o 29 мин.
Подписка требует жертв: инсайдеры предупредили о подорожании Game Pass из-за Call of Duty 2 ч.
OpenAI отключила в ChatGPT голос Sky в из-за удивительного сходства с голосом Скарлетт Йоханссон 2 ч.
Google обвинила Microsoft в неспособности защитить клиентов от кибератак 2 ч.
Опубликованы первые тесты видеокарт в бенчмарке 3DMark Steel Nomad, который выйдет завтра 3 ч.
Гендиректор Take-Two: Rockstar постарается выпустить GTA VI без багов, но это не главное 5 ч.
«Обязателен для всех фанатов»: для ремастера культового квеста Grim Fandango вышел мод с улучшениями графики 6 ч.
С конца мая ЦБ начнет проверять, как в банках идёт импортозамещение ПО 7 ч.
«Встряхнёт игровую индустрию»: новый геймплейный трейлер Black Myth: Wukong привёл геймеров в восторг 8 ч.
Apple и OpenAI объявят о сотрудничестве на конференции WWDC в июне 9 ч.
Asus выпустила первый в мире WOLED-монитор с глянцевым экраном без бликов — 26,5-дюймовый ROG Strix OLED XG27AQDMG 25 мин.
HMD Global готовит смартфон с дизайном легендарного Nokia Lumia 920 32 мин.
В погоне за ИИ: большинство строящихся в Северной Америке ЦОД арендуют ещё до того, как они готовы, несмотря на рост цен 2 ч.
Глава Asus: эволюция ИИ ПК пойдёт сложным путём 3 ч.
На память HBM к концу года придётся 35 % производства DRAM по передовым техпроцессам 3 ч.
Vivo выпустила смартфон iQoo Neo9S Pro на чипе Dimensity 9300+ по цене прошлогоднего Neo9 Pro с Dimensity 9300 5 ч.
Аналитики ожидают от Nvidia рекордный квартальный отчёт 5 ч.
«Яндекс» намерен запустить серийное производство роботов-курьеров до конца 2024 года 5 ч.
Google Cloud умудрилась поломать собственную сетевую инфраструктуру, но быстро исправилась 6 ч.
Apple повысила скидки на iPhone в Китае, а в США стала дороже выкупать б/у смартфоны 6 ч.