Сегодня 30 мая 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Представлена ИИ-модель YandexART 2.0 с поддержкой генерации текста на изображениях

«Яндекс» выпустил YandexART 2.0 — генератор картинок нового поколения. Нейросеть научилась создавать надписи на изображении и выдерживать на одной картинке сразу несколько стилей; объекты в пространстве и относительно друг друга теперь располагаются более естественно; а при создании изображений учитывается большее число деталей запроса.

 Источник изображений: «Яндекс»

Источник изображений: «Яндекс»

Отличительной особенностью YandexART 2.0 является гибридная архитектура нейросети, сочетающая черты свёрточной и трансформерной моделей. Свёрточная модель работает по принципу человеческого глаза, определяя ключевые признаки объекта, например, его форму, текстуру и края, но она ограничена в длине контекста, поэтому в длинных запросах ей помогает трансформер. Эта архитектура помогает YandexART 2.0 выдерживать несколько жанров в одном изображении — к примеру, она может изобразить анимешную этикетку на фотореалистичной бутылке лимонада.

Для обучения нейросети YandexART 2.0 использовались несколько сотен миллионов пар изображений и текстовых описаний к ним; более точное их соотношение обеспечила дополнительная VLM-модель, при помощи которой картинки анализировались и сопровождались подробными текстовыми описаниями. Массив обучающих данных был расширен за счёт нескольких сотен тысяч изображений с текстом — это помогло YandexART 2.0 дополнять картинки надписями латинскими буквами.

«Яндекс» также разработал собственную систему оценки качества работы для генератора изображений: новая модель выиграла у Midjourney v6.1 по критериям комплексности и эстетичности в 66 % и 58 % случаев соответственно, а также приблизилась к нему в аспекте релевантности запросам.

Бизнес-пользователи могут поработать с YandexART 2.0 на платформе Yandex Cloud — при помощи API можно интегрировать генератор изображений в любые приложения; есть возможность протестировать её работу в демонстрационном режиме для подбора оптимальных запросов. Корпоративные клиенты могут генерировать логотипы, иллюстрации для статей, презентаций или социальных сетей.

Визуальная нейросеть доступна также частным пользователям в веб-версии «Алисы» и собственном приложении виртуального помощника; владельцы бесплатных учётных записей могут запросить до пяти изображений в сутки, а у подписчиков опции «Алиса Про» такое ограничение отсутствует. С YandexART 2.0 можно создать аватарку для соцсетей, значок приложения, принт для футболки, открытку для друга или иллюстрацию для публикации.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Apple: разработчики приложений заработали $406 млрд через App Store в 2024 году 6 ч.
В Steam вышло демо Dispatch — комедийной игры про агентство супергероев от бывших разработчиков Tales from the Borderlands и The Wolf Among Us 8 ч.
Bandai Namco предупредила владельцев «новейших видеокарт» о проблемах Elden Ring Nightreign на ПК — игра уже получила первый патч 8 ч.
Yandex B2B Tech запустила YTsaurus — платформу обработки данных любого объёма для бизнеса 10 ч.
CD Projekt подтвердила разработку двух секретных игр, о которых никто ничего не знает 10 ч.
Полный запрет майнинга скоро будет введён в Бурятии и Забайкалье 12 ч.
Миллионы людей открыли сотням веб-приложений полный доступ к своим файлам в Microsoft OneDrive 12 ч.
В Atomic Heart сыграло 10 миллионов человек, а Mundfish начнёт помогать амбициозным разработчикам 12 ч.
«Ростелеком» усилил требования по информационной безопасности к дочерним организациям и подрядчикам 12 ч.
Минцифры пообещало принять единую политику использования VPN в России 13 ч.
Учёные создали наклейку на лицо за $20, которая предупредит о «выгорании» 57 мин.
Dell удалось воодушевить инвесторов прогнозом увеличения выручки от ИИ-серверов в полтора раза 2 ч.
ASRock признала, что её материнские платы ломают процессоры Ryzen 9000 6 ч.
Lian Li представила СЖО HydroShift II LCD-C с радиатором 360 мм и тремя конфигурациями 6 ч.
Новая статья: Обзор LCD Full HD-проектора Digma DP-FHD800A: современный подход 7 ч.
NVIDIA значительно увеличила выручку и прибыль, несмотря на потери из-за санкций США 8 ч.
В Китае испытали многоразовую ракету для мгновенной доставки товаров с Aliexpress по всему миру 9 ч.
Гендир Intel Лип-Бу Тан начал борьбу с бюрократией и теперь нуждается в большом клиенте 11 ч.
Vivo представила смартфоны S30 и S30 Pro Mini с 50-Мп перископическими камерами и мощными чипами 11 ч.
Frore представила твердотельный кулер AirJet Mini G2 — производительность выросла на 42 % 11 ч.