Сегодня 22 апреля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

OpenAI выпустила ИИ-модель ChatGPT Images 2.0, которая отлично генерирует текст на картинках

OpenAI представила модель генерации изображений ChatGPT Images 2.0, которая впервые среди массовых ИИ корректно отрисовывает текст на картинках. Если два года назад диффузионные ИИ-модели не могли составить меню мексиканского ресторана без выдуманных слов вроде «enchuita» и «burrto», то новая модель создаёт изображения с надписями, пригодными к использованию без правок.

Ещё в 2024 году диффузионные ИИ-модели систематически искажали надписи. По словам Асмелаша Тека Хадгу (Asmelash Teka Hadgu), основателя и гендиректора Lesan AI, модели восстанавливают изображение из шума и усваивают паттерны, покрывающие основную массу пикселей, а текст занимает ничтожную долю площади.

 Слева — меню, сгенерированное ChatGPT Images 2.0: все надписи читаемы, ни одного выдуманного слова. Справа — три варианта от Microsoft Designer на основе DALL-E 3: «Enchidas», «Tamrielo», «Churiros», «Margartas» и десятки других искажений. Источник изображений: ChatGPT Images 2.0, Microsoft Designer (DALL-E 3) / techcrunch.com

Слева — меню, сгенерированное ChatGPT Images 2.0: все надписи читаемы, ни одного выдуманного слова. Справа — три варианта от Microsoft Designer на основе DALL-E 3: «Enchidas», «Tamrielo», «Churiros», «Margartas» и десятки других искажений. Источник изображений: ChatGPT Images 2.0, Microsoft Designer (DALL-E 3) / techcrunch.com

С тех пор исследователи опробовали альтернативные подходы — в частности, авторегрессионные модели, которые предсказывают содержание изображения и работают по принципу, близкому к большим языковым моделям (LLM).

OpenAI не раскрыла, какая архитектура лежит в основе Images 2.0. Компания пояснила лишь, что новинка умеет «рассуждать» — искать информацию в интернете, генерировать несколько изображений по одному запросу и перепроверять результаты. Благодаря этому Images 2.0 создаёт маркетинговые материалы в разных размерах и даже комиксы. У ИИ-модели также улучшена работа с нелатинскими шрифтами — японским, корейским, хинди и бенгальским. Однако знания Images 2.0 ограничены декабрём 2025 года, что может сказаться на точности генерации по запросам о недавних событиях.

 Источник изображения: ChatGPT Images 2.0 / openai.com

Источник изображения: ChatGPT Images 2.0 / openai.com

«Images 2.0 выводит детализацию и точность генерации на беспрецедентный уровень. Модель способна продумать сложную композицию и воплотить её на практике: следовать инструкциям, сохранять заданные детали и отрисовывать элементы, на которых обычно спотыкаются генераторы, — мелкий текст, пиктограммы, элементы интерфейса, насыщенные композиции и тонкие стилистические ограничения, — и всё это в разрешении до 2K», — говорится в пресс-релизе компании. Генерация при этом занимает больше времени, чем обычный текстовый запрос к ChatGPT, но даже многопанельный комикс укладывается в несколько минут.

 Источник изображения: ChatGPT Images 2.0 / openai.com

Источник изображения: ChatGPT Images 2.0 / openai.com

Доступ к Images 2.0 получат все пользователи ChatGPT и Codex. Платные подписчики смогут генерировать более сложные изображения. OpenAI также откроет программный интерфейс (API) gpt-image-2 — стоимость будет зависеть от качества и разрешения выходных изображений.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Google Chrome начнёт показывать созданные ИИ картинки на разных сайтах, но непонятно зачем 2 ч.
Дизельпанковый эвакуационный шутер Marauders готовится к перерождению после двух лет простоя в раннем доступе Steam 2 ч.
xAI готова купить ИИ-стартап Cursor за $60 млрд или заплатить $10 млрд в рамках партнёрства 2 ч.
«Вызывает привыкание. Ни в коем случае не покупайте»: безумный карточный роглайк Vampire Crawlers ворвался в Steam с 98 % положительных отзывов 2 ч.
Потенциально опасная ИИ-модель Anthropic Mythos нашла 271 уязвимость в Firefox 150 3 ч.
Плату за VPN-трафик для россиян хотят отложить: операторы не готовы к нововведению 3 ч.
Новая Divinity удивит размерами — Larian избавила игру от одного из главных ограничений Baldur’s Gate 3 4 ч.
WhatsApp предложит ИИ-сводки по всем непрочитанным сообщениям 4 ч.
YouTube начнёт удалять дипфейки по запросам знаменитостей, но не все 4 ч.
SpaceX может купить ИИ-стартап Cursor за $60 млрд — или ограничится партнёрством 4 ч.
«Джеймс Уэбб» построил первый полный спектр колец Урана и указал на неизвестные луны 8 мин.
Meta зарезервировала 100 ГВт·ч ёмкости для хранения энергии на базе инновационных накопителей Noon Energy 10 мин.
MediaTek неожиданно отменила доклад гендира Цая на Computex 2026 — в этом усмотрели намёк на совместный анонс с Nvidia 32 мин.
Анонсирован смартфон Motorola Edge 70 Pro с чипом Dimensity 8500 Extreme по цене от $415 41 мин.
Anker представила ИИ-аудиочип Thus — он дебютирует во флагманских наушниках Soundcore 43 мин.
Экс-сотрудника Samsung приговорили к семи годам тюрьмы за передачу секретов выпуска чипов в Китай 50 мин.
Хакеры легко извлекли из электромобиля BYD Seal полную историю поездок — от китайского завода до авторазборки в Польше 59 мин.
2025-й стал годом исторического роста мировой солнечной энергетики, но с одной оговоркой 2 ч.
MSI IPC выпустила индустриальный компьютер MS-C936 на базе Intel Raptor Lake-P Refresh для AIoT-приложений 2 ч.
CATL представила батареи Freevoy 2 — они дадут гибридам до 600 км пробега на одном лишь электричестве 2 ч.