Сегодня 23 марта 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Представлена ИИ-модель YandexART 2.0 с поддержкой генерации текста на изображениях

«Яндекс» выпустил YandexART 2.0 — генератор картинок нового поколения. Нейросеть научилась создавать надписи на изображении и выдерживать на одной картинке сразу несколько стилей; объекты в пространстве и относительно друг друга теперь располагаются более естественно; а при создании изображений учитывается большее число деталей запроса.

 Источник изображений: «Яндекс»

Источник изображений: «Яндекс»

Отличительной особенностью YandexART 2.0 является гибридная архитектура нейросети, сочетающая черты свёрточной и трансформерной моделей. Свёрточная модель работает по принципу человеческого глаза, определяя ключевые признаки объекта, например, его форму, текстуру и края, но она ограничена в длине контекста, поэтому в длинных запросах ей помогает трансформер. Эта архитектура помогает YandexART 2.0 выдерживать несколько жанров в одном изображении — к примеру, она может изобразить анимешную этикетку на фотореалистичной бутылке лимонада.

Для обучения нейросети YandexART 2.0 использовались несколько сотен миллионов пар изображений и текстовых описаний к ним; более точное их соотношение обеспечила дополнительная VLM-модель, при помощи которой картинки анализировались и сопровождались подробными текстовыми описаниями. Массив обучающих данных был расширен за счёт нескольких сотен тысяч изображений с текстом — это помогло YandexART 2.0 дополнять картинки надписями латинскими буквами.

«Яндекс» также разработал собственную систему оценки качества работы для генератора изображений: новая модель выиграла у Midjourney v6.1 по критериям комплексности и эстетичности в 66 % и 58 % случаев соответственно, а также приблизилась к нему в аспекте релевантности запросам.

Бизнес-пользователи могут поработать с YandexART 2.0 на платформе Yandex Cloud — при помощи API можно интегрировать генератор изображений в любые приложения; есть возможность протестировать её работу в демонстрационном режиме для подбора оптимальных запросов. Корпоративные клиенты могут генерировать логотипы, иллюстрации для статей, презентаций или социальных сетей.

Визуальная нейросеть доступна также частным пользователям в веб-версии «Алисы» и собственном приложении виртуального помощника; владельцы бесплатных учётных записей могут запросить до пяти изображений в сутки, а у подписчиков опции «Алиса Про» такое ограничение отсутствует. С YandexART 2.0 можно создать аватарку для соцсетей, значок приложения, принт для футболки, открытку для друга или иллюстрацию для публикации.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Издатель Resident Evil Requiem и Pragmata не станет внедрять генеративный ИИ в новые игры, но совсем от технологии не откажется 41 мин.
OpenAI поставила на рекламу: направлением займётся бывший топ-менеджер Meta 59 мин.
Plesk и cPanel уходят из России: «Рег.ру» перенесёт сайты пользователей на отечественный ispmanager 3 ч.
Ролевой боевик The Expanse: Osiris Reborn в духе Mass Effect скоро выйдет из тени — анонсирована новая презентация Xbox Partner Preview 3 ч.
В России разрешат искать экстремистские материалы в интернете, но только учёным и правоохранителям 7 ч.
«Не все изменения окончательны»: разработчики Slay the Spire 2 отреагировали на панику фанатов из-за первого обновления баланса игры 7 ч.
Capcom заинтриговала фанатов Dragon’s Dogma 2 — на иллюстрации ко второй годовщине игры углядели тизер крупного DLC 8 ч.
Марк Цукерберг создаёт ИИ-гендира: агента, который поможет ему руководить Meta 8 ч.
Ошибочка вышла: разработчики Crimson Desert попались на использовании генеративного ИИ, но пообещали всё исправить 10 ч.
Тодд Говард объяснил, почему Bethesda не спешит выпускать The Elder Scrolls VI 10 ч.
Производственные мощности даже ещё не построенных фабрик TSMC в США уже целиком забронированы 3 ч.
Представлены смартфоны Huawei Enjoy 90 Plus и 90 Pro Max с чипами Kirin 8000 и ёмкими кремний-углеродными батареями 3 ч.
NASA пытается «поймать» падающую обсерваторию Swift — до конца года она может сойти с орбиты 3 ч.
В Bloomberg назвали главного кандидата на замену Тиму Куку на посту главы Apple 3 ч.
iPhone Air оказался намного популярнее iPhone 16 Plus, а модем Apple C1X почти догнал аналоги Qualcomm 4 ч.
После волны критики разработчик Crimson Desert пообещал добавить поддержку видеокарт Intel Arc 5 ч.
Intel признала, что её новые настольные Core Ultra Plus почти не быстрее Ryzen в играх 6 ч.
Москвичи вынужденно пересели на Wi-Fi: трафик публичных точек доступа вырос в разы из-за отключений мобильного интернета 6 ч.
Мировой рынок чипов разросся до $831 млрд в прошлом году — сильнее всех выросла не Nvidia 6 ч.
DDoS нового уровня: Curator нейтрализовала длительную атаку в 2 Тбит/с на платформу онлайн-ставок 6 ч.