Сегодня 29 января 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Alibaba представила ИИ-генератор изображений Qwen-Image с высокой степенью грамотности

Alibaba представила модель искусственного интеллекта Qwen-Image 20B MMDiT, предназначенную для работы с изображениями — в ней разработчик значительно улучшил механизмы прорисовки сложных текстов и реализовал возможности точного редактирования изображений.

 Источник изображения: huggingface.co/Qwen

Источник изображения: huggingface.co/Qwen

Модель, доступ к которой откроется на платформе Qwen Chat в разделе «Генерация изображений», обладает расширенными возможностями рендеринга текста, в том числе многострочных макетов с семантикой на уровне абзацев и детализированными элементами. Поддерживаются языки на основе букв и иероглифов. Усовершенствованные механизмы многозадачного обучения помогли расширить возможности редактирования изображений с сохранением смыслового наполнения и визуального реализма.

Новая Qwen-Image, уверяет Alibaba, обошла существующие решения в нескольких тестах по задачам на генерацию и редактирование изображений, включая GenEval, DPG, OneIG-Bench, GEdit, ImgEdit и GSO. Особых успехов удалось добиться в тестах на качество прорисовки текста, таких как LongText-Bench, ChineseWord и TextCraft — новая модель превзошла современные аналоги. Qwen-Image, в частности, справляется с точным отображением китайских иероглифов на вывесках магазинов с правильной глубиной резкости, с созданием детализированного английского текста на обложках книг и информационных слайдах, поддерживается работа с двуязычным контентом.

Помимо обработки текста, модель свободно ориентируется в художественных жанрах от фотореализма до импрессионизма; поддерживаются различные операции при редактировании изображений, в том числе изменение стиля, добавление, удаление и улучшение деталей, а также редактирование текста и изменение поз у персонажей. В проекте Qwen-Image разработчики Alibaba, по их словам стремились способствовать развитию генерации изображений, снизить технические барьеры для создания визуальных материалов и вдохновить коллег на инновационные приложения.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Google превратила Chrome в ИИ-браузер — с автопилотом для веб-сёрфинга, Gemini в боковой панели и не только 3 ч.
«Средневековая Богемия ещё никогда не была такой красивой»: PS Store «засветил» подробности ремастера Kingdom Come: Deliverance для PS5 5 ч.
Google заплатит $135 млн за тайный сбор данных пользователей Android и больше не будет «шпионить» без спроса 7 ч.
Литовский маркетплейс рассекретил статуэтку по ремейку Assassin’s Creed IV: Black Flag — Ubisoft отреагировала мемом из GTA: San Andreas 7 ч.
Открытая игра без открытого мира: новые подробности амбициозного ролевого боевика Control Resonant от создателей Alan Wake 2 8 ч.
Microsoft улучшила бесшовный перенос приложений между Android и Windows 11 9 ч.
План «Б» для стареющего Linux: у сообщества появился план на случай ухода Линуса Торвальдса 9 ч.
Google: хакеры до сих пор активно используют уже закрытую уязвимость WinRAR для взлома Windows 9 ч.
Настольный Microsoft Excel получил режим ИИ-агента — он сам заполняет таблицы, исправляет формулы и не только 9 ч.
Психологический триллер The Alighieri Circle: Dante’s Bloodline превратит «Божественную комедию» в симулятор ходьбы 10 ч.