Сегодня 31 мая 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Alibaba представила ИИ-генератор изображений Qwen-Image с высокой степенью грамотности

Alibaba представила модель искусственного интеллекта Qwen-Image 20B MMDiT, предназначенную для работы с изображениями — в ней разработчик значительно улучшил механизмы прорисовки сложных текстов и реализовал возможности точного редактирования изображений.

 Источник изображения: huggingface.co/Qwen

Источник изображения: huggingface.co/Qwen

Модель, доступ к которой откроется на платформе Qwen Chat в разделе «Генерация изображений», обладает расширенными возможностями рендеринга текста, в том числе многострочных макетов с семантикой на уровне абзацев и детализированными элементами. Поддерживаются языки на основе букв и иероглифов. Усовершенствованные механизмы многозадачного обучения помогли расширить возможности редактирования изображений с сохранением смыслового наполнения и визуального реализма.

Новая Qwen-Image, уверяет Alibaba, обошла существующие решения в нескольких тестах по задачам на генерацию и редактирование изображений, включая GenEval, DPG, OneIG-Bench, GEdit, ImgEdit и GSO. Особых успехов удалось добиться в тестах на качество прорисовки текста, таких как LongText-Bench, ChineseWord и TextCraft — новая модель превзошла современные аналоги. Qwen-Image, в частности, справляется с точным отображением китайских иероглифов на вывесках магазинов с правильной глубиной резкости, с созданием детализированного английского текста на обложках книг и информационных слайдах, поддерживается работа с двуязычным контентом.

Помимо обработки текста, модель свободно ориентируется в художественных жанрах от фотореализма до импрессионизма; поддерживаются различные операции при редактировании изображений, в том числе изменение стиля, добавление, удаление и улучшение деталей, а также редактирование текста и изменение поз у персонажей. В проекте Qwen-Image разработчики Alibaba, по их словам стремились способствовать развитию генерации изображений, снизить технические барьеры для создания визуальных материалов и вдохновить коллег на инновационные приложения.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Новая статья: Lego Batman: Legacy of the Dark Knight — это что, новая Batman: Arkham? Рецензия 8 мин.
Тактическая ролевая игра RuneSmith позволит возглавить отряд дворфов, чтобы выбить из главного злодея денежный долг 4 ч.
ООН объяснила: запрещать соцсети для детей контрпродуктивно, нужно менять сами платформы 7 ч.
AOMedia выпустила первый вариант кодека AV2 8 ч.
Деамериканизированный офисный пакет Euro-Office для европейских пользователей выйдет 9 июня 10 ч.
Microsoft выпустит суперприложение со всеми ИИ-сервисами Copilot сразу 13 ч.
YouTube представил ИИ-регулировку скорости воспроизведения для нудных подкастов и другие функции 13 ч.
Новая статья: Forza Horizon 6 — в Японию с ветерком. Рецензия 30-05 00:03
Microsoft проигнорировала баги Windows, а потом пригрозила уголовным делом исследователю за их публикацию 29-05 23:56
Открытое тестирование мрачного экшена Mistfall Hunter с нестандартной механикой эвакуации стартует 15 июня 29-05 23:16