Сегодня 10 марта 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Alibaba представила ИИ-генератор изображений Qwen-Image с высокой степенью грамотности

Alibaba представила модель искусственного интеллекта Qwen-Image 20B MMDiT, предназначенную для работы с изображениями — в ней разработчик значительно улучшил механизмы прорисовки сложных текстов и реализовал возможности точного редактирования изображений.

 Источник изображения: huggingface.co/Qwen

Источник изображения: huggingface.co/Qwen

Модель, доступ к которой откроется на платформе Qwen Chat в разделе «Генерация изображений», обладает расширенными возможностями рендеринга текста, в том числе многострочных макетов с семантикой на уровне абзацев и детализированными элементами. Поддерживаются языки на основе букв и иероглифов. Усовершенствованные механизмы многозадачного обучения помогли расширить возможности редактирования изображений с сохранением смыслового наполнения и визуального реализма.

Новая Qwen-Image, уверяет Alibaba, обошла существующие решения в нескольких тестах по задачам на генерацию и редактирование изображений, включая GenEval, DPG, OneIG-Bench, GEdit, ImgEdit и GSO. Особых успехов удалось добиться в тестах на качество прорисовки текста, таких как LongText-Bench, ChineseWord и TextCraft — новая модель превзошла современные аналоги. Qwen-Image, в частности, справляется с точным отображением китайских иероглифов на вывесках магазинов с правильной глубиной резкости, с созданием детализированного английского текста на обложках книг и информационных слайдах, поддерживается работа с двуязычным контентом.

Помимо обработки текста, модель свободно ориентируется в художественных жанрах от фотореализма до импрессионизма; поддерживаются различные операции при редактировании изображений, в том числе изменение стиля, добавление, удаление и улучшение деталей, а также редактирование текста и изменение поз у персонажей. В проекте Qwen-Image разработчики Alibaba, по их словам стремились способствовать развитию генерации изображений, снизить технические барьеры для создания визуальных материалов и вдохновить коллег на инновационные приложения.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Фантастическая комедия Deponia от Daedalic стала временно бесплатной в Steam — раздача доступна и в России 12 мин.
«МТС VoiceTech» обеспечит голосовой связью абонентов с нарушениями слуха 41 мин.
Anthropic запустила ИИ для поиска багов в программном коде, написанном ИИ 2 ч.
iOS 26.4 добавит йети и ещё восемь новых эмодзи на iPhone 2 ч.
Konami похвасталась успехами Metal Gear Solid Delta: Snake Eater — ремейку MGS 3 покорилась новая вершина продаж 3 ч.
Представители Google и OpenAI готовы выступить в суде в поддержку Anthropic в деле о конфликте с Пентагоном 5 ч.
Пользователи X теперь могут запретить чат-боту Grok менять свои фотографии 6 ч.
Календарь релизов 9–15 марта: Solasta 2, John Carpenter’s Toxic Commando и 1348 Ex Voto 12 ч.
Microsoft представила Copilot Cowork — автономного ИИ-агента для сложных задач на базе моделей Anthropic 14 ч.
Anthropic подала в суд на власти США из-за включения её в «чёрный список» Пентагона 14 ч.