Сегодня 14 июня 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Представлена ИИ-модель YandexART 2.0 с поддержкой генерации текста на изображениях

«Яндекс» выпустил YandexART 2.0 — генератор картинок нового поколения. Нейросеть научилась создавать надписи на изображении и выдерживать на одной картинке сразу несколько стилей; объекты в пространстве и относительно друг друга теперь располагаются более естественно; а при создании изображений учитывается большее число деталей запроса.

 Источник изображений: «Яндекс»

Источник изображений: «Яндекс»

Отличительной особенностью YandexART 2.0 является гибридная архитектура нейросети, сочетающая черты свёрточной и трансформерной моделей. Свёрточная модель работает по принципу человеческого глаза, определяя ключевые признаки объекта, например, его форму, текстуру и края, но она ограничена в длине контекста, поэтому в длинных запросах ей помогает трансформер. Эта архитектура помогает YandexART 2.0 выдерживать несколько жанров в одном изображении — к примеру, она может изобразить анимешную этикетку на фотореалистичной бутылке лимонада.

Для обучения нейросети YandexART 2.0 использовались несколько сотен миллионов пар изображений и текстовых описаний к ним; более точное их соотношение обеспечила дополнительная VLM-модель, при помощи которой картинки анализировались и сопровождались подробными текстовыми описаниями. Массив обучающих данных был расширен за счёт нескольких сотен тысяч изображений с текстом — это помогло YandexART 2.0 дополнять картинки надписями латинскими буквами.

«Яндекс» также разработал собственную систему оценки качества работы для генератора изображений: новая модель выиграла у Midjourney v6.1 по критериям комплексности и эстетичности в 66 % и 58 % случаев соответственно, а также приблизилась к нему в аспекте релевантности запросам.

Бизнес-пользователи могут поработать с YandexART 2.0 на платформе Yandex Cloud — при помощи API можно интегрировать генератор изображений в любые приложения; есть возможность протестировать её работу в демонстрационном режиме для подбора оптимальных запросов. Корпоративные клиенты могут генерировать логотипы, иллюстрации для статей, презентаций или социальных сетей.

Визуальная нейросеть доступна также частным пользователям в веб-версии «Алисы» и собственном приложении виртуального помощника; владельцы бесплатных учётных записей могут запросить до пяти изображений в сутки, а у подписчиков опции «Алиса Про» такое ограничение отсутствует. С YandexART 2.0 можно создать аватарку для соцсетей, значок приложения, принт для футболки, открытку для друга или иллюстрацию для публикации.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Новая статья: Fatekeeper — наконец-то Dark Messiah 2? Предварительный обзор 10 ч.
Новая статья: Gamesblender № 780: RE Veronica, Stellar Blade 2, Gears of War: E-Day, Senua — главные анонсы июня 11 ч.
Вышло приложение ASCILINE Engine для трансляции «неблокируемого» ASCII-видео 18 ч.
ИИ-стартап Mistral AI ведёт переговоры о привлечении €3 млрд при оценке в €20 млрд 18 ч.
Google начала развёртывать поисковых ИИ-агентов — но пока лишь для платных пользователей 21 ч.
Водители Tesla научились обманывать автопилот игрушечной головой — чтобы листать соцсети за рулём 23 ч.
Генпрокуроры нескольких штатов США запустили проверку в отношении OpenAI 23 ч.
Anthropic отключила передовые ИИ-модели Mythos 5 и Fable 5 для всех пользователей по требованию США 13-06 08:19
Новая статья: Gothic Remake — в новом теле старый дух. Рецензия 13-06 00:03
Нереалистичные сроки, неумелое руководство и страх отмены: журналисты рассказали о проблемах разработки новой Ghost Recon 12-06 19:51
Богатеющие сотрудники Samsung и SK hynix разгоняют цены на недвижимость в соседних с фабриками городах 2 ч.
Нераспакованный картридж Super Mario Bros. продали на аукционе за рекордные $3 млн 3 ч.
AMD утверждает, что ноутбук на базе Ryzen 5 220 лучше подходит для игр, чем Apple MacBook Neo 4 ч.
Удостоверяющий центр GlobalSign начал отзыв EV-сертификатов у российских компаний, находящихся под санкциями 9 ч.
Nvidia подняла рекомендованную цену RTX Pro 6000 Blackwell до $13 250 — рост на 55 % за год 16 ч.
We will VROC you: Graid Technology продолжит активное развитие купленной у Intel технологии RAID 16 ч.
Компактный ИИ-компьютер AMD Ryzen AI Halo на Windows 11 поступил в продажу за $4000 18 ч.
Учёные создали беспроводной нейростимулятор размером с рисовое зёрнышко — он легко вводится и подавляет боль 21 ч.
Netgear обвинила американскую часть TP-Link в сохранении тесных связей с Пекином 21 ч.
SpaceX построит завод Gigasat для массового выпуска космических ИИ ЦОД 23 ч.