Сегодня 24 апреля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Представлена ИИ-модель YandexART 2.0 с поддержкой генерации текста на изображениях

«Яндекс» выпустил YandexART 2.0 — генератор картинок нового поколения. Нейросеть научилась создавать надписи на изображении и выдерживать на одной картинке сразу несколько стилей; объекты в пространстве и относительно друг друга теперь располагаются более естественно; а при создании изображений учитывается большее число деталей запроса.

 Источник изображений: «Яндекс»

Источник изображений: «Яндекс»

Отличительной особенностью YandexART 2.0 является гибридная архитектура нейросети, сочетающая черты свёрточной и трансформерной моделей. Свёрточная модель работает по принципу человеческого глаза, определяя ключевые признаки объекта, например, его форму, текстуру и края, но она ограничена в длине контекста, поэтому в длинных запросах ей помогает трансформер. Эта архитектура помогает YandexART 2.0 выдерживать несколько жанров в одном изображении — к примеру, она может изобразить анимешную этикетку на фотореалистичной бутылке лимонада.

Для обучения нейросети YandexART 2.0 использовались несколько сотен миллионов пар изображений и текстовых описаний к ним; более точное их соотношение обеспечила дополнительная VLM-модель, при помощи которой картинки анализировались и сопровождались подробными текстовыми описаниями. Массив обучающих данных был расширен за счёт нескольких сотен тысяч изображений с текстом — это помогло YandexART 2.0 дополнять картинки надписями латинскими буквами.

«Яндекс» также разработал собственную систему оценки качества работы для генератора изображений: новая модель выиграла у Midjourney v6.1 по критериям комплексности и эстетичности в 66 % и 58 % случаев соответственно, а также приблизилась к нему в аспекте релевантности запросам.

Бизнес-пользователи могут поработать с YandexART 2.0 на платформе Yandex Cloud — при помощи API можно интегрировать генератор изображений в любые приложения; есть возможность протестировать её работу в демонстрационном режиме для подбора оптимальных запросов. Корпоративные клиенты могут генерировать логотипы, иллюстрации для статей, презентаций или социальных сетей.

Визуальная нейросеть доступна также частным пользователям в веб-версии «Алисы» и собственном приложении виртуального помощника; владельцы бесплатных учётных записей могут запросить до пяти изображений в сутки, а у подписчиков опции «Алиса Про» такое ограничение отсутствует. С YandexART 2.0 можно создать аватарку для соцсетей, значок приложения, принт для футболки, открытку для друга или иллюстрацию для публикации.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Meta расширила родительский контроль на ИИ-чат-бот — родители увидят темы бесед подростков за неделю 3 ч.
Совсем без Call of Duty подписчиков Game Pass в 2026 году не оставят 9 ч.
Microsoft Gaming в прошлом — игровое подразделение вернуло имя Xbox 10 ч.
Funcom бесплатно прокачает Conan Exiles до версии на Unreal Engine 5 — трейлер и подробности Conan Exiles Enhanced 10 ч.
Tencent запустила тестирование ИИ-агента QClaw, но сильно ограничила к нему доступ 11 ч.
«Пришло время снова поднять чёрный флаг!»: Ubisoft наконец анонсировала Assassin’s Creed Black Flag Resynced 12 ч.
Релиз «Кибер Бэкап» 18.5: многопоточность, поддержка LDAPS, расширенная интеграция с Kubernetes и многое другое 12 ч.
Евросоюз принуждает Google открыть Android для конкурентов Gemini 12 ч.
Первое сюжетное дополнение к Vampire: The Masquerade — Bloodlines 2 даст почувствовать себя шерифом вампиров — трейлер и дата выхода Loose Cannon 13 ч.
«Белый список» пополнили сайты и приложения банков, доставки, магазинов и волонтёрских организаций 14 ч.
Rivian запустила производство электрического внедорожника R2 — первый экземпляр уже сошёл с конвейера 3 ч.
Новая статья: Экспресс-тест внешнего SSD-накопителя MSI Datamag 40Gbps 8 ч.
Cisco представила прототип универсального квантового коммутатора 9 ч.
3D X-DRAM впервые воплотили в кремнии — оперативная память будущего стала ближе 10 ч.
Intel показала эталонный ноутбук на Wildcat Lake — он похож на MacBook Neo 10 ч.
Honor представила конкурентов MacBook Air — MagicBook X14 Plus и X16 Plus с Intel Panther Lake и дисплеями 120 Гц 13 ч.
Honor представила мощный игровой ноутбук Win H9 с шестёркой вентиляторов для тихой работы 13 ч.
Китай оценил мощность своей ИИ-инфраструктуры — оценки США были ниже в 6000 раз 13 ч.
Marvell приобрела Polariton, разработчика решений в области плазмоники 14 ч.
Эпоха возрождения компьютерных клубов в России: обороты выросли почти в 40 раз за пять лет и продолжают расти 14 ч.