Сегодня 29 марта 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Представлена ИИ-модель YandexART 2.0 с поддержкой генерации текста на изображениях

«Яндекс» выпустил YandexART 2.0 — генератор картинок нового поколения. Нейросеть научилась создавать надписи на изображении и выдерживать на одной картинке сразу несколько стилей; объекты в пространстве и относительно друг друга теперь располагаются более естественно; а при создании изображений учитывается большее число деталей запроса.

 Источник изображений: «Яндекс»

Источник изображений: «Яндекс»

Отличительной особенностью YandexART 2.0 является гибридная архитектура нейросети, сочетающая черты свёрточной и трансформерной моделей. Свёрточная модель работает по принципу человеческого глаза, определяя ключевые признаки объекта, например, его форму, текстуру и края, но она ограничена в длине контекста, поэтому в длинных запросах ей помогает трансформер. Эта архитектура помогает YandexART 2.0 выдерживать несколько жанров в одном изображении — к примеру, она может изобразить анимешную этикетку на фотореалистичной бутылке лимонада.

Для обучения нейросети YandexART 2.0 использовались несколько сотен миллионов пар изображений и текстовых описаний к ним; более точное их соотношение обеспечила дополнительная VLM-модель, при помощи которой картинки анализировались и сопровождались подробными текстовыми описаниями. Массив обучающих данных был расширен за счёт нескольких сотен тысяч изображений с текстом — это помогло YandexART 2.0 дополнять картинки надписями латинскими буквами.

«Яндекс» также разработал собственную систему оценки качества работы для генератора изображений: новая модель выиграла у Midjourney v6.1 по критериям комплексности и эстетичности в 66 % и 58 % случаев соответственно, а также приблизилась к нему в аспекте релевантности запросам.

Бизнес-пользователи могут поработать с YandexART 2.0 на платформе Yandex Cloud — при помощи API можно интегрировать генератор изображений в любые приложения; есть возможность протестировать её работу в демонстрационном режиме для подбора оптимальных запросов. Корпоративные клиенты могут генерировать логотипы, иллюстрации для статей, презентаций или социальных сетей.

Визуальная нейросеть доступна также частным пользователям в веб-версии «Алисы» и собственном приложении виртуального помощника; владельцы бесплатных учётных записей могут запросить до пяти изображений в сутки, а у подписчиков опции «Алиса Про» такое ограничение отсутствует. С YandexART 2.0 можно создать аватарку для соцсетей, значок приложения, принт для футболки, открытку для друга или иллюстрацию для публикации.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Новая статья: Selaco — неоновый кураж. Предварительный обзор 7 мин.
«Яндекс» впервые отчиталась о результатах работы Yandex B2B Tech 47 мин.
Prince of Persia: The Lost Crown выйдет на новых платформах, причём совсем скоро 2 ч.
Сюжетный боевик MindsEye от студии экс-продюсера GTA получил дату выхода и взрывной трейлер — в российском Steam доступен предзаказ 4 ч.
38 миллиардов потерянных рун и 58 тысяч побед над финальным боссом: опубликована статистика игроков с тестирования Elden Ring Nightreign 6 ч.
Обнаружен вредоносный загрузчик CoffeeLoader — он прячется от антивирусов на видеокарте и прибегает к другим уловкам 7 ч.
Nintendo раскрыла дату выхода экранизации The Legend of Zelda, но подробности фильма держит в секрете 7 ч.
Россия заняла третье место в мире по объёму вредоносного бот-трафика 8 ч.
Учёные наконец выяснили, как работает ИИ — оказалось, что он может вынашивать планы и сознательно врать 8 ч.
Android Auto получила полную поддержку игр для Android, но на ходу они запускаться не будут 8 ч.
Arctic представила СЖО Liquid Freezer III Pro с улучшенными вентиляторами 16 мин.
Трамп помиловал бывшего главу Nikola Motor, осуждённого за обман с электрическими грузовиками 40 мин.
Intel окончательно избавилась от бизнеса по выпуску флеш-памяти NAND 44 мин.
Запущено производство летающих электрических мотоциклов Jetson One стоимостью $128 000 4 ч.
Aston Martin представила роскошный домашний симулятор гоночного авто с RTX 5090 стоимостью от $75 000 5 ч.
Google наконец определилась, когда начнёт продажи Pixel 9a 6 ч.
Мобильная GeForce RTX 5090 разочаровала обозревателей слабым ростом производительности относительно RTX 4090 6 ч.
Crusoe привлекла $225 млн на закупку чипов NVIDIA для развития облачной ИИ-инфраструктуры 7 ч.
Разработчик легендарных смарт-часов Pebble раскрыл подробности о новых часах Core 2 Duo и Core Time 2 7 ч.
Разработана перчатка для передачи разных ощущений в виртуальной реальности 7 ч.