Сегодня 03 марта 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Представлена ИИ-модель YandexART 2.0 с поддержкой генерации текста на изображениях

«Яндекс» выпустил YandexART 2.0 — генератор картинок нового поколения. Нейросеть научилась создавать надписи на изображении и выдерживать на одной картинке сразу несколько стилей; объекты в пространстве и относительно друг друга теперь располагаются более естественно; а при создании изображений учитывается большее число деталей запроса.

 Источник изображений: «Яндекс»

Источник изображений: «Яндекс»

Отличительной особенностью YandexART 2.0 является гибридная архитектура нейросети, сочетающая черты свёрточной и трансформерной моделей. Свёрточная модель работает по принципу человеческого глаза, определяя ключевые признаки объекта, например, его форму, текстуру и края, но она ограничена в длине контекста, поэтому в длинных запросах ей помогает трансформер. Эта архитектура помогает YandexART 2.0 выдерживать несколько жанров в одном изображении — к примеру, она может изобразить анимешную этикетку на фотореалистичной бутылке лимонада.

Для обучения нейросети YandexART 2.0 использовались несколько сотен миллионов пар изображений и текстовых описаний к ним; более точное их соотношение обеспечила дополнительная VLM-модель, при помощи которой картинки анализировались и сопровождались подробными текстовыми описаниями. Массив обучающих данных был расширен за счёт нескольких сотен тысяч изображений с текстом — это помогло YandexART 2.0 дополнять картинки надписями латинскими буквами.

«Яндекс» также разработал собственную систему оценки качества работы для генератора изображений: новая модель выиграла у Midjourney v6.1 по критериям комплексности и эстетичности в 66 % и 58 % случаев соответственно, а также приблизилась к нему в аспекте релевантности запросам.

Бизнес-пользователи могут поработать с YandexART 2.0 на платформе Yandex Cloud — при помощи API можно интегрировать генератор изображений в любые приложения; есть возможность протестировать её работу в демонстрационном режиме для подбора оптимальных запросов. Корпоративные клиенты могут генерировать логотипы, иллюстрации для статей, презентаций или социальных сетей.

Визуальная нейросеть доступна также частным пользователям в веб-версии «Алисы» и собственном приложении виртуального помощника; владельцы бесплатных учётных записей могут запросить до пяти изображений в сутки, а у подписчиков опции «Алиса Про» такое ограничение отсутствует. С YandexART 2.0 можно создать аватарку для соцсетей, значок приложения, принт для футболки, открытку для друга или иллюстрацию для публикации.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Apple обратилась к Google с просьбой о размещении Siri на её серверах из-за неподготовленности собственной инфраструктуры 3 ч.
Издатель Terminator: Survivors и Styx: Blades of Greed под угрозой банкротства отложил шоу Nacon Connect 2026, чтобы показать игры «в наилучшем виде» 11 ч.
Nvidia выпустила драйвер 595.71 WHQL на замену неудачному 595.59 WHQL 13 ч.
Nintendo анонсировала презентацию инди-игр Indie World Showcase — фанаты ждут Hollow Knight: Silksong 14 ч.
В Великобритании Sony обвинили в завышении цен для пользователей PlayStation — сумма иска составила $2,7 млрд 15 ч.
В России снизился уровень цифровой грамотности — люди не успевают адаптироваться к новым технологиям 15 ч.
Дату выхода и цену Starfield на PS5 подтвердил надёжный инсайдер 15 ч.
Бесплатные выходные, новые дополнения и обновления: Paradox с размахом отметит 11-летие Cities: Skylines 15 ч.
Marathon / Slay the Spire 2 / Planet of Lana 2 / Esoteric Ebb / Календарь релизов 2 – 8 марта 16 ч.
Российский рынок видеопиратства сократился на 5,5 % по итогам 2025 года 18 ч.
SpaceX начнёт регулярно использовать ракету-носитель Starship с середины следующего года 40 мин.
Власти США хотят продавать китайским компаниям не более 75 000 ускорителей Nvidia H200 на клиента 4 ч.
Vivo показала камерофон X300 Ultra и пообещала сделать его доступным за пределами Китая 8 ч.
Новая статья: Обзор Samsung Galaxy Z TriFold: тройной складной смартфон по цене квартиры в Воркуте 9 ч.
288-ядерные Xeon Clearwater Forest хороши для телекома, говорят Intel и Ericsson 10 ч.
ASML расширит ассортимент продукции: к литографам добавится оборудование для передовой упаковки чипов 13 ч.
Apple представила новый iPad Air с чипом M4, 12 Гбайт ОЗУ и ценой от $599 14 ч.
Apple представила iPhone 17e на чипе A19, с поддержкой MagSafe, розовым цветом и ценой от $599 15 ч.
Qualcomm представила свой первый чип с поддержкой Wi-Fi 8 и пообещала запустить сети 6G к 2029 году 15 ч.
Intel показала 18-ангстремные Xeon 6+ с 288 ядрами и пообещала их выпустить до июля 16 ч.