Сегодня 18 января 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Представлена ИИ-модель YandexART 2.0 с поддержкой генерации текста на изображениях

«Яндекс» выпустил YandexART 2.0 — генератор картинок нового поколения. Нейросеть научилась создавать надписи на изображении и выдерживать на одной картинке сразу несколько стилей; объекты в пространстве и относительно друг друга теперь располагаются более естественно; а при создании изображений учитывается большее число деталей запроса.

 Источник изображений: «Яндекс»

Источник изображений: «Яндекс»

Отличительной особенностью YandexART 2.0 является гибридная архитектура нейросети, сочетающая черты свёрточной и трансформерной моделей. Свёрточная модель работает по принципу человеческого глаза, определяя ключевые признаки объекта, например, его форму, текстуру и края, но она ограничена в длине контекста, поэтому в длинных запросах ей помогает трансформер. Эта архитектура помогает YandexART 2.0 выдерживать несколько жанров в одном изображении — к примеру, она может изобразить анимешную этикетку на фотореалистичной бутылке лимонада.

Для обучения нейросети YandexART 2.0 использовались несколько сотен миллионов пар изображений и текстовых описаний к ним; более точное их соотношение обеспечила дополнительная VLM-модель, при помощи которой картинки анализировались и сопровождались подробными текстовыми описаниями. Массив обучающих данных был расширен за счёт нескольких сотен тысяч изображений с текстом — это помогло YandexART 2.0 дополнять картинки надписями латинскими буквами.

«Яндекс» также разработал собственную систему оценки качества работы для генератора изображений: новая модель выиграла у Midjourney v6.1 по критериям комплексности и эстетичности в 66 % и 58 % случаев соответственно, а также приблизилась к нему в аспекте релевантности запросам.

Бизнес-пользователи могут поработать с YandexART 2.0 на платформе Yandex Cloud — при помощи API можно интегрировать генератор изображений в любые приложения; есть возможность протестировать её работу в демонстрационном режиме для подбора оптимальных запросов. Корпоративные клиенты могут генерировать логотипы, иллюстрации для статей, презентаций или социальных сетей.

Визуальная нейросеть доступна также частным пользователям в веб-версии «Алисы» и собственном приложении виртуального помощника; владельцы бесплатных учётных записей могут запросить до пяти изображений в сутки, а у подписчиков опции «Алиса Про» такое ограничение отсутствует. С YandexART 2.0 можно создать аватарку для соцсетей, значок приложения, принт для футболки, открытку для друга или иллюстрацию для публикации.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Стало известно, о чём Дуров говорил и что обещал на допросе во французском суде 16 мин.
Дональд Трамп опубликовал «официальный мем» — некоторые заработали на нём миллионы долларов за минуты 19 мин.
TikTok предупредил, что завтра прекратит работу в США, если Байден не вмешается 43 мин.
Instagram добавил новые функции в Reels в преддверии блокировки TikTok в США 3 ч.
Новая статья: Marvel Rivals — нужна ли теперь Overwatch? Рецензия 14 ч.
Ремастер Tomb Raider: The Angel of Darkness для сборника Tomb Raider IV-VI Remastered раскроет потенциал худшей игры серии — подробности улучшений 16 ч.
Первый «геймплей» Virtua Fighter 6 оказался точной копией боевой сцены из фильма «Драконы навсегда» с Джеки Чаном 17 ч.
Руководитель разработки Dragon Age: The Veilguard покинет BioWare после 18 лет в Electronic Arts 18 ч.
Верховный суд США поддержал закон о блокировке TikTok — соцсети осталось два дня 19 ч.
ЕС потребовал от соцсети X раскрыть алгоритм рекомендаций и политику модерирования 19 ч.
Новую тяжёлую европейскую ракету Ariane 6 улучшили — следующий пуск состоится в феврале 27 мин.
Российский аналог Starlink решено строить на отечественной электронике — проект «Бюро 1440» может затянуться 33 мин.
Amazon прекратила доставлять товары дронами после инцидента на испытательном полигоне 2 ч.
Во Франции создали крошечного робота-хирурга, который очень аккуратно покопается в мозгах 2 ч.
SpaceX запретили запускать Starship на время расследования взрыва при последнем полёте 3 ч.
Стартап по выпуску электромобилей Canoo объявил о своём банкротстве и прекращении деятельности 5 ч.
GlobalFoundries построить в США исследовательский центр и новую фабрику на субсидии по «Закону о чипах» 7 ч.
Трамп планирует объявить криптовалюту национальным приоритетом и создать консультативный совет по криптовалютам 13 ч.
Sparkle и OEC переработают 22 тыс. км подводных кабелей 14 ч.
Lenovo купила поставщика СХД Infinidat 15 ч.