Сегодня 18 декабря 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Представлена ИИ-модель YandexART 2.0 с поддержкой генерации текста на изображениях

«Яндекс» выпустил YandexART 2.0 — генератор картинок нового поколения. Нейросеть научилась создавать надписи на изображении и выдерживать на одной картинке сразу несколько стилей; объекты в пространстве и относительно друг друга теперь располагаются более естественно; а при создании изображений учитывается большее число деталей запроса.

 Источник изображений: «Яндекс»

Источник изображений: «Яндекс»

Отличительной особенностью YandexART 2.0 является гибридная архитектура нейросети, сочетающая черты свёрточной и трансформерной моделей. Свёрточная модель работает по принципу человеческого глаза, определяя ключевые признаки объекта, например, его форму, текстуру и края, но она ограничена в длине контекста, поэтому в длинных запросах ей помогает трансформер. Эта архитектура помогает YandexART 2.0 выдерживать несколько жанров в одном изображении — к примеру, она может изобразить анимешную этикетку на фотореалистичной бутылке лимонада.

Для обучения нейросети YandexART 2.0 использовались несколько сотен миллионов пар изображений и текстовых описаний к ним; более точное их соотношение обеспечила дополнительная VLM-модель, при помощи которой картинки анализировались и сопровождались подробными текстовыми описаниями. Массив обучающих данных был расширен за счёт нескольких сотен тысяч изображений с текстом — это помогло YandexART 2.0 дополнять картинки надписями латинскими буквами.

«Яндекс» также разработал собственную систему оценки качества работы для генератора изображений: новая модель выиграла у Midjourney v6.1 по критериям комплексности и эстетичности в 66 % и 58 % случаев соответственно, а также приблизилась к нему в аспекте релевантности запросам.

Бизнес-пользователи могут поработать с YandexART 2.0 на платформе Yandex Cloud — при помощи API можно интегрировать генератор изображений в любые приложения; есть возможность протестировать её работу в демонстрационном режиме для подбора оптимальных запросов. Корпоративные клиенты могут генерировать логотипы, иллюстрации для статей, презентаций или социальных сетей.

Визуальная нейросеть доступна также частным пользователям в веб-версии «Алисы» и собственном приложении виртуального помощника; владельцы бесплатных учётных записей могут запросить до пяти изображений в сутки, а у подписчиков опции «Алиса Про» такое ограничение отсутствует. С YandexART 2.0 можно создать аватарку для соцсетей, значок приложения, принт для футболки, открытку для друга или иллюстрацию для публикации.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Новый геймплейный трейлер Lost Soul Aside подтвердил перенос релиза на 2025 год — в Steam игра потребует привязку аккаунта PSN 47 мин.
Комиссия по азартным играм Великобритании выявила нелегальные казино в Roblox 2 ч.
Люксовые бренды начали принимать оплату криптовалютой после взлёта биткоина 3 ч.
МТС выделит облачные сервисы, ИИ-технологии и большие данные в самостоятельную компанию 4 ч.
Вместе с Apple Intelligence на старые iPhone пришёл перегрев 4 ч.
Участники рынка выступили за доработку законопроекта по регулированию индустрии игр в России, а в Минцифры подготовили альтернативный акт 6 ч.
Американские военные проверят Маска на предмет угроз нацбезопасности 7 ч.
45 тонн пауков из WoW, более 1,7 триллиона демонов в Diablo IV и другие итоги 2024 года для Blizzard 7 ч.
Анимационный сериал Secret Level от авторов «Любовь, смерть и роботы» установил рекорд для Prime Video и уже заслужил продолжение 9 ч.
«Почти как RDR 2»: случайный баг показал, как Indiana Jones and the Great Circle выглядела бы с видом от третьего лица 10 ч.
Intel раскрыла характеристики мобильных процессоров Core 200H — это не новые чипы 25 мин.
Наш мозг работает медленнее 50-летнего процессора — учёные из Калтеха измерили скорость человеческой мысли 41 мин.
Первая частная японская ракета Kairos впервые достигла космоса и почти сразу самоуничтожилась 2 ч.
США столкнутся с дефицитом электроэнергии из-за ИИ уже в 2025 году, предупредил отраслевой регулятор 3 ч.
США нащупали угрозу нацбезопасности в роутерах TP-Link и собираются их запретить 3 ч.
Слитый постер раскрыл дату презентации Samsung Galaxy S25 3 ч.
МТС соберёт все свои IT-подразделения в самостоятельную компанию 4 ч.
Чёрные дыры оказались безопаснее, чем считали учёные — рядом с ними могут стабильно «жить» звёзды и планеты 4 ч.
Microsoft купила как минимум вдвое больше ускорителей NVIDIA, чем любой из конкурентов 5 ч.
Huawei обогнала Apple и стала крупнейшим в мире поставщиком носимой на запястье электроники 5 ч.