Сегодня 18 августа 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Представлена ИИ-модель YandexART 2.0 с поддержкой генерации текста на изображениях

«Яндекс» выпустил YandexART 2.0 — генератор картинок нового поколения. Нейросеть научилась создавать надписи на изображении и выдерживать на одной картинке сразу несколько стилей; объекты в пространстве и относительно друг друга теперь располагаются более естественно; а при создании изображений учитывается большее число деталей запроса.

 Источник изображений: «Яндекс»

Источник изображений: «Яндекс»

Отличительной особенностью YandexART 2.0 является гибридная архитектура нейросети, сочетающая черты свёрточной и трансформерной моделей. Свёрточная модель работает по принципу человеческого глаза, определяя ключевые признаки объекта, например, его форму, текстуру и края, но она ограничена в длине контекста, поэтому в длинных запросах ей помогает трансформер. Эта архитектура помогает YandexART 2.0 выдерживать несколько жанров в одном изображении — к примеру, она может изобразить анимешную этикетку на фотореалистичной бутылке лимонада.

Для обучения нейросети YandexART 2.0 использовались несколько сотен миллионов пар изображений и текстовых описаний к ним; более точное их соотношение обеспечила дополнительная VLM-модель, при помощи которой картинки анализировались и сопровождались подробными текстовыми описаниями. Массив обучающих данных был расширен за счёт нескольких сотен тысяч изображений с текстом — это помогло YandexART 2.0 дополнять картинки надписями латинскими буквами.

«Яндекс» также разработал собственную систему оценки качества работы для генератора изображений: новая модель выиграла у Midjourney v6.1 по критериям комплексности и эстетичности в 66 % и 58 % случаев соответственно, а также приблизилась к нему в аспекте релевантности запросам.

Бизнес-пользователи могут поработать с YandexART 2.0 на платформе Yandex Cloud — при помощи API можно интегрировать генератор изображений в любые приложения; есть возможность протестировать её работу в демонстрационном режиме для подбора оптимальных запросов. Корпоративные клиенты могут генерировать логотипы, иллюстрации для статей, презентаций или социальных сетей.

Визуальная нейросеть доступна также частным пользователям в веб-версии «Алисы» и собственном приложении виртуального помощника; владельцы бесплатных учётных записей могут запросить до пяти изображений в сутки, а у подписчиков опции «Алиса Про» такое ограничение отсутствует. С YandexART 2.0 можно создать аватарку для соцсетей, значок приложения, принт для футболки, открытку для друга или иллюстрацию для публикации.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Assassin’s Creed Shadows стала самой продаваемой новой игрой 2025 года в Европе, опередив Monster Hunter Wilds и Kingdom Come: Deliverance 2 22 мин.
Курс биткоина упал до $115 000 после нового рекорда на прошлой неделе 27 мин.
Чат-бот Claude AI станет прекращать «вредоносные или оскорбительные диалоги с пользователями» 3 ч.
Таиланд разрешит иностранным туристам обменивать криптовалюту на баты уже к концу года 3 ч.
Полностью отключить обновление приложений в Microsoft Store больше не получится 3 ч.
«Более яркая, отзывчивая и доступная, чем когда-либо»: культовое приключение Shenmue 3 выйдет на новых платформах в улучшенном виде 3 ч.
Microsoft наконец улучшила тёмный режим в Windows 11, но до идеала ещё далеко 3 ч.
Научно-фантастическое выживание StarRupture от создателей Green Hell отправит игроков на планету кошмарных катастроф — ранний доступ откладывается 4 ч.
Олдскульный хоррор Caput Mortum покажет, каково 30 лет назад было играть в King's Field — геймплейный трейлер раскрыл дату выхода 9 ч.
Rutube — главный бенефициар замедления YouTube: аудитория российского сервиса выросла более чем вдвое в этом году 11 ч.
Представлен смартфон Honor X7c 5G с чипом Snapdragon 4 Gen 2 и 50-Мп камерой за $170 4 мин.
Steam Deck и подобные портативные ПК набирают популярность — продажи вырастут на 32 % в этом году 7 мин.
Apple теряет американский рынок смартфонов два квартала подряд — её долю захватывает Samsung 16 мин.
Умные очки Meta Hypernova с экраном будут стоить гораздо дешевле, чем предполагалось 3 ч.
Samsung представила беспроводные наушники Galaxy Buds3 FE с активным шумоподавлением, классическим дизайном и Galaxy AI за $149 6 ч.
Китайская HKC выпустила первый в мире игровой монитор с частотой обновления 750 Гц 6 ч.
В Apple готовятся к волне увольнений топ-менеджеров, но Тим Кук останется гендиром 7 ч.
OpenAI намерена потратить триллионы долларов на ИИ-инфраструктуру, но для начала их надо где-то найти 8 ч.
BYD построила «Автомобильный Диснейленд» — за $280 можно поплавать на внедорожнике и погонять на гиперкаре 8 ч.
AAEON представила вычислительные модули на IoT-платформе MediaTek Genio 9 ч.