Сегодня 12 июня 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Представлена ИИ-модель YandexART 2.0 с поддержкой генерации текста на изображениях

«Яндекс» выпустил YandexART 2.0 — генератор картинок нового поколения. Нейросеть научилась создавать надписи на изображении и выдерживать на одной картинке сразу несколько стилей; объекты в пространстве и относительно друг друга теперь располагаются более естественно; а при создании изображений учитывается большее число деталей запроса.

 Источник изображений: «Яндекс»

Источник изображений: «Яндекс»

Отличительной особенностью YandexART 2.0 является гибридная архитектура нейросети, сочетающая черты свёрточной и трансформерной моделей. Свёрточная модель работает по принципу человеческого глаза, определяя ключевые признаки объекта, например, его форму, текстуру и края, но она ограничена в длине контекста, поэтому в длинных запросах ей помогает трансформер. Эта архитектура помогает YandexART 2.0 выдерживать несколько жанров в одном изображении — к примеру, она может изобразить анимешную этикетку на фотореалистичной бутылке лимонада.

Для обучения нейросети YandexART 2.0 использовались несколько сотен миллионов пар изображений и текстовых описаний к ним; более точное их соотношение обеспечила дополнительная VLM-модель, при помощи которой картинки анализировались и сопровождались подробными текстовыми описаниями. Массив обучающих данных был расширен за счёт нескольких сотен тысяч изображений с текстом — это помогло YandexART 2.0 дополнять картинки надписями латинскими буквами.

«Яндекс» также разработал собственную систему оценки качества работы для генератора изображений: новая модель выиграла у Midjourney v6.1 по критериям комплексности и эстетичности в 66 % и 58 % случаев соответственно, а также приблизилась к нему в аспекте релевантности запросам.

Бизнес-пользователи могут поработать с YandexART 2.0 на платформе Yandex Cloud — при помощи API можно интегрировать генератор изображений в любые приложения; есть возможность протестировать её работу в демонстрационном режиме для подбора оптимальных запросов. Корпоративные клиенты могут генерировать логотипы, иллюстрации для статей, презентаций или социальных сетей.

Визуальная нейросеть доступна также частным пользователям в веб-версии «Алисы» и собственном приложении виртуального помощника; владельцы бесплатных учётных записей могут запросить до пяти изображений в сутки, а у подписчиков опции «Алиса Про» такое ограничение отсутствует. С YandexART 2.0 можно создать аватарку для соцсетей, значок приложения, принт для футболки, открытку для друга или иллюстрацию для публикации.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Слухи: разработчики ремейка «Ведьмака» сделают для The Witcher 3: Wild Hunt ещё одно сюжетное дополнение 23 мин.
Meta запустила редактор видео на базе ИИ — пока он работает только по шаблонам 2 ч.
The Outer Worlds 2 всё-таки получит официальный перевод на русский язык 3 ч.
Безопасность операционных систем в контексте искусственного интеллекта обсудят на конференции OS DAY 2025 4 ч.
После 10 месяцев протестов гильдия актёров США прекратила забастовку против крупных игровых компаний, но это ещё не конец 4 ч.
Ошибка в прошивке UEFI ставит под угрозу безопасную загрузку Windows, но уже вышло обновление 7 ч.
«Бездонная яма плагиата»: Disney и Universal подали в суд на Midjourney из-за ИИ 8 ч.
В WhatsApp появятся ИИ-сводки, которые помогут «разгрести» море непрочитанных чатов 8 ч.
Meta разработала «мировую ИИ-модель» V-JEPA 2: она понимает законы физики, а не только слова 12 ч.
«Выглядит как игра моей мечты»: фанаты остались в восторге от 15 минут геймплея Super Meat Boy 3D 15 ч.
Память HBM будущего потребует сквозного охлаждения и других прорывных технологий 12 мин.
Kospet представила для глобального рынка сверхпрочные смарт-часы Tank T3 Ultra 2 2 ч.
Мини-синхротрон ускорит производство передовых чипов в 15 раз, но сначала придётся решить ряд проблем 2 ч.
Использование китайских ускорителей увеличивает разработку ИИ-моделей на три месяца 7 ч.
Google урежет ёмкость батареи Pixel 6a из-за сообщений о перегреве и возгораниях 8 ч.
Китайская YMTC подала в суд на американскую Micron за клевету и очернение в прессе 12 ч.
Опубликованы финальные спецификации PCIe 7.0 — в четыре раза быстрее PCIe 5.0, но не скоро 14 ч.
Новая статья: Обзор корпуса DeepCool CH270 Digital WH: почти компактный и почти вместительный 14 ч.
Представлена финальная спецификация PCI Express 7.0 14 ч.
Жизнь после «Яндекса» есть: Nebius Group Аркадия Воложа создала второй суперкомпьютер, и он попал в топ-15 мира 17 ч.