Сегодня 31 июля 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Представлена ИИ-модель YandexART 2.0 с поддержкой генерации текста на изображениях

«Яндекс» выпустил YandexART 2.0 — генератор картинок нового поколения. Нейросеть научилась создавать надписи на изображении и выдерживать на одной картинке сразу несколько стилей; объекты в пространстве и относительно друг друга теперь располагаются более естественно; а при создании изображений учитывается большее число деталей запроса.

 Источник изображений: «Яндекс»

Источник изображений: «Яндекс»

Отличительной особенностью YandexART 2.0 является гибридная архитектура нейросети, сочетающая черты свёрточной и трансформерной моделей. Свёрточная модель работает по принципу человеческого глаза, определяя ключевые признаки объекта, например, его форму, текстуру и края, но она ограничена в длине контекста, поэтому в длинных запросах ей помогает трансформер. Эта архитектура помогает YandexART 2.0 выдерживать несколько жанров в одном изображении — к примеру, она может изобразить анимешную этикетку на фотореалистичной бутылке лимонада.

Для обучения нейросети YandexART 2.0 использовались несколько сотен миллионов пар изображений и текстовых описаний к ним; более точное их соотношение обеспечила дополнительная VLM-модель, при помощи которой картинки анализировались и сопровождались подробными текстовыми описаниями. Массив обучающих данных был расширен за счёт нескольких сотен тысяч изображений с текстом — это помогло YandexART 2.0 дополнять картинки надписями латинскими буквами.

«Яндекс» также разработал собственную систему оценки качества работы для генератора изображений: новая модель выиграла у Midjourney v6.1 по критериям комплексности и эстетичности в 66 % и 58 % случаев соответственно, а также приблизилась к нему в аспекте релевантности запросам.

Бизнес-пользователи могут поработать с YandexART 2.0 на платформе Yandex Cloud — при помощи API можно интегрировать генератор изображений в любые приложения; есть возможность протестировать её работу в демонстрационном режиме для подбора оптимальных запросов. Корпоративные клиенты могут генерировать логотипы, иллюстрации для статей, презентаций или социальных сетей.

Визуальная нейросеть доступна также частным пользователям в веб-версии «Алисы» и собственном приложении виртуального помощника; владельцы бесплатных учётных записей могут запросить до пяти изображений в сутки, а у подписчиков опции «Алиса Про» такое ограничение отсутствует. С YandexART 2.0 можно создать аватарку для соцсетей, значок приложения, принт для футболки, открытку для друга или иллюстрацию для публикации.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Инсайдер раскрыл планы Electronic Arts на открытую «бету» Battlefield 6 — когда тестирование и как получить ранний доступ 3 ч.
«Абсолютно нормальное» обновление на радость фанатам добавило в инди-хит Peak каннибализм 5 ч.
Google выпустила экстренное обновление для Chrome, закрывшее опасную уязвимость 6 ч.
Devil May Cry 5 стала самой продаваемой игрой квартала для Capcom, а Monster Hunter Wilds весь запал растеряла 7 ч.
ИИ-приложения захватили смартфоны и удвоили выручку — ChatGPT уже дышит в затылок Google 7 ч.
Google заявила, что Великобритания не требовала от неё создать бэкдор в облаке — в отличие от Apple 8 ч.
Тысячи камер Hikvision остаются уязвимы ко взлому почти год — доступ к ним активно продают в даркнете 8 ч.
TikTok запустил систему проверки фактов и новые инструменты родительского контроля 8 ч.
Генерация кадров и востребованные функции: для Clair Obscur: Expedition 33 вышло крупное обновление 8 ч.
Завтра пройдёт презентация Nintendo Direct: Partner Showcase — фанаты ждут Hollow Knight: Silksong и Red Dead Redemption 2 9 ч.
Макеты всех версий iPhone 17 показались на фото в новых цветах — оранжевый Pro стал сюрпризом 2 ч.
Новая статья: Система жидкостного охлаждения Arctic Liquid Freezer III Pro 360 A-RGB: новые вентиляторы — и точка 2 ч.
Видео: австрийский одноместный электровертолёт eCopter впервые полетал без привязи 4 ч.
AOC представила 610-Гц киберспортивные мониторы Agon Pro CS24A и Agon Pro AG246FK6 5 ч.
Apple случайно прорекламировала Samsung Galaxy Z Flip7 6 ч.
Минюст США посягнул на качества, которые делают iPhone уникальным — Apple ответила на громкий иск 7 ч.
Житель Аризоны украл оборудования с вышек сотовой связи на полмиллиона долларов 8 ч.
В Москве протестировали 5G-антенну российского производства — она обеспечила 1 Гбит/с 9 ч.
Pixel 10 станет первым флагманом Google с магнитной зарядкой Qi2, если слухи и утечки не врут 9 ч.
Microsoft выпустила Smurface Laptop — спецверсию Surface Laptop с синим лого и изображениями смурфов 9 ч.