Сегодня 10 июля 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Представлена ИИ-модель YandexART 2.0 с поддержкой генерации текста на изображениях

«Яндекс» выпустил YandexART 2.0 — генератор картинок нового поколения. Нейросеть научилась создавать надписи на изображении и выдерживать на одной картинке сразу несколько стилей; объекты в пространстве и относительно друг друга теперь располагаются более естественно; а при создании изображений учитывается большее число деталей запроса.

 Источник изображений: «Яндекс»

Источник изображений: «Яндекс»

Отличительной особенностью YandexART 2.0 является гибридная архитектура нейросети, сочетающая черты свёрточной и трансформерной моделей. Свёрточная модель работает по принципу человеческого глаза, определяя ключевые признаки объекта, например, его форму, текстуру и края, но она ограничена в длине контекста, поэтому в длинных запросах ей помогает трансформер. Эта архитектура помогает YandexART 2.0 выдерживать несколько жанров в одном изображении — к примеру, она может изобразить анимешную этикетку на фотореалистичной бутылке лимонада.

Для обучения нейросети YandexART 2.0 использовались несколько сотен миллионов пар изображений и текстовых описаний к ним; более точное их соотношение обеспечила дополнительная VLM-модель, при помощи которой картинки анализировались и сопровождались подробными текстовыми описаниями. Массив обучающих данных был расширен за счёт нескольких сотен тысяч изображений с текстом — это помогло YandexART 2.0 дополнять картинки надписями латинскими буквами.

«Яндекс» также разработал собственную систему оценки качества работы для генератора изображений: новая модель выиграла у Midjourney v6.1 по критериям комплексности и эстетичности в 66 % и 58 % случаев соответственно, а также приблизилась к нему в аспекте релевантности запросам.

Бизнес-пользователи могут поработать с YandexART 2.0 на платформе Yandex Cloud — при помощи API можно интегрировать генератор изображений в любые приложения; есть возможность протестировать её работу в демонстрационном режиме для подбора оптимальных запросов. Корпоративные клиенты могут генерировать логотипы, иллюстрации для статей, презентаций или социальных сетей.

Визуальная нейросеть доступна также частным пользователям в веб-версии «Алисы» и собственном приложении виртуального помощника; владельцы бесплатных учётных записей могут запросить до пяти изображений в сутки, а у подписчиков опции «Алиса Про» такое ограничение отсутствует. С YandexART 2.0 можно создать аватарку для соцсетей, значок приложения, принт для футболки, открытку для друга или иллюстрацию для публикации.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Electronic Arts скоро оставит Need for Speed Rivals без мультиплеера, но есть и хорошая новость 9 мин.
В Дубае откроется ресторан Woohoo с меню и концепцией от ИИ-шеф-повара 10 мин.
Своевольный ИИ-бот Grok появится в электромобилях Tesla «не позднее следующей недели» 14 мин.
Создатель USDT припас 80 тонн золота в собственном швейцарском хранилище 2 ч.
Еврокомиссия представила инструкцию по соблюдению «Закона об ИИ» 3 ч.
«Перестроили многое с нуля»: новые подробности ролевой игры Warhammer 40,000: Dark Heresy от авторов Rogue Trader 4 ч.
Amazon планирует инвестировать миллиарды долларов в ИИ-стартап Anthropic 5 ч.
Финансовый отчёт Arkane Studios раскрыл, когда выйдет боевик Marvel’s Blade от создателей Deathloop и Dishonored 6 ч.
Snoop Dogg выпустил трек про Telegram — миллион его NFT-подарков разлетелся за считанные минуты 6 ч.
Microsoft похвасталась, что сэкономила $500 млн с помощью ИИ в прошлом году, — а в этом уволила 15 000 сотрудников 7 ч.
Bloomberg: Китай строит в пустыне гигантский комплекс ИИ ЦОД для 115 тыс. ускорителей NVIDIA, поставки которых запрещены США 19 мин.
Отмену мобильного роуминга в ЕАЭС отложили до 2028 год, чтобы не навредить операторам 20 мин.
Intel вылетела из десятки крупнейших производителей чипов и проиграла гонку ИИ, признал гендир Тан 2 ч.
В процессорах AMD найдены уязвимости TSA, похожие на Meltdown и Spectre 2 ч.
Новые квантовые материалы обещают в 1000 раз ускорить работу электроники 3 ч.
Google проложит свой второй трансатлантический интернет-кабель — Sol 3 ч.
Hugging Face выпустила домашнего ИИ-робота Reachy Mini с открытым кодом за $449 4 ч.
OpenAI завершила поглощение стартапа io Джони Айва 4 ч.
Китайцы превратили пчелу в киборга и заставили её летать по командам с пульта от телевизора 4 ч.
Nvidia показала уникальную GeForce RTX 5090 с Суперменом и Крипто, которых нарисовал глава DC Comics 5 ч.