Сегодня 03 апреля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Представлена ИИ-модель YandexART 2.0 с поддержкой генерации текста на изображениях

«Яндекс» выпустил YandexART 2.0 — генератор картинок нового поколения. Нейросеть научилась создавать надписи на изображении и выдерживать на одной картинке сразу несколько стилей; объекты в пространстве и относительно друг друга теперь располагаются более естественно; а при создании изображений учитывается большее число деталей запроса.

 Источник изображений: «Яндекс»

Источник изображений: «Яндекс»

Отличительной особенностью YandexART 2.0 является гибридная архитектура нейросети, сочетающая черты свёрточной и трансформерной моделей. Свёрточная модель работает по принципу человеческого глаза, определяя ключевые признаки объекта, например, его форму, текстуру и края, но она ограничена в длине контекста, поэтому в длинных запросах ей помогает трансформер. Эта архитектура помогает YandexART 2.0 выдерживать несколько жанров в одном изображении — к примеру, она может изобразить анимешную этикетку на фотореалистичной бутылке лимонада.

Для обучения нейросети YandexART 2.0 использовались несколько сотен миллионов пар изображений и текстовых описаний к ним; более точное их соотношение обеспечила дополнительная VLM-модель, при помощи которой картинки анализировались и сопровождались подробными текстовыми описаниями. Массив обучающих данных был расширен за счёт нескольких сотен тысяч изображений с текстом — это помогло YandexART 2.0 дополнять картинки надписями латинскими буквами.

«Яндекс» также разработал собственную систему оценки качества работы для генератора изображений: новая модель выиграла у Midjourney v6.1 по критериям комплексности и эстетичности в 66 % и 58 % случаев соответственно, а также приблизилась к нему в аспекте релевантности запросам.

Бизнес-пользователи могут поработать с YandexART 2.0 на платформе Yandex Cloud — при помощи API можно интегрировать генератор изображений в любые приложения; есть возможность протестировать её работу в демонстрационном режиме для подбора оптимальных запросов. Корпоративные клиенты могут генерировать логотипы, иллюстрации для статей, презентаций или социальных сетей.

Визуальная нейросеть доступна также частным пользователям в веб-версии «Алисы» и собственном приложении виртуального помощника; владельцы бесплатных учётных записей могут запросить до пяти изображений в сутки, а у подписчиков опции «Алиса Про» такое ограничение отсутствует. С YandexART 2.0 можно создать аватарку для соцсетей, значок приложения, принт для футболки, открытку для друга или иллюстрацию для публикации.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Пираты победили Denuvo: игры теперь взламывают в день релиза, но разработчик обещает новые меры 45 мин.
Microsoft AI представила три собственные ИИ-модели для генерации текста, голоса и изображений 51 мин.
Google прокачала ИИ-ассистента для умного дома: Gemini в Home стал лучше понимать сложные команды 2 ч.
Всему хорошему приходит конец: Microsoft подтвердила, когда GTA V покинет Game Pass 3 ч.
Мультиплеерный стелс-экшен Thick as Thieves от создателя Deus Ex и System Shock стал одиночной игрой с кооперативом на двоих 4 ч.
Отменённая The Last of Us Online была почти готова — ведущего разработчика «убивает, что люди не смогут поиграть в неё» 5 ч.
Ветеран Microsoft: обновления Windows не всегда ломают ПК — иногда они просто вскрывают проблемы 6 ч.
На следующей неделе «Яндекс» проведёт конференцию «День поиска» 6 ч.
Blizzard заинтриговала фанатов StarCraft новой вакансией — шутер с открытым миром на Unreal Engine 6 ч.
Игроки профинансировали русскую озвучку South Park: The Stick of Truth от GamesVoice — она выйдет «до того, как у вас закончатся запасы терпения» 7 ч.
SpaceX пожаловалась, что запуски спутников-конкурентов Amazon Leo создали риск столкновения 2 ч.
8BitDo выпустила механическую клавиатуру Retro 68 AP50 за $500 в стиле компьютера Apple II 2 ч.
К созданию спонсируемого Биллом Гейтсом нетипичного ядерного реактора подключили ИИ — процесс пойдёт живее 2 ч.
Космический сбой Microsoft: в летящем к Луне корабле «Орион» оказалось два Outlook и ни один из них не работает 2 ч.
Piter-IX поднял цены на свои услуги 5 ч.
Поставки электромобилей Tesla рухнули на 14 % за первый квартал — продано всего 358 000 штук 5 ч.
Тепло от дата-центров для ИИ начало сказываться на климате — пока лишь локально, но чувствительно для соседей 6 ч.
Представлен смартфон среднего уровня Honor X80i с чипом Dimensity 6500 Elite, 50-Мп камерой и батареей на 7000 мА·ч 6 ч.
Британские учёные выяснили, что дата-центры подогревают окрестности на километры вокруг 7 ч.
В России хотят «зачистить» рынок связи от небольших операторов — это может спровоцировать рост цен 8 ч.