Сегодня 23 июля 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → dall-e

Представлен ИИ-генератор изображений DALL-E 3 — он лучше понимает людей и скоро будет встроен в ChatGPT

Компания OpenAI представила новую версию генератора изображений DALL-E и заявила о планах интегрировать его в ChatGPT. Разработчики сообщают, что DALL-E 3 может «значительно лучше понимать запросы», анализировать сложные инструкции и генерировать «чрезвычайно детальные и точные изображения» по сравнению с DALL-E 2.

 Источник изображений: OpenAI / DALL-E 3

Источник изображений: OpenAI / DALL-E 3

«Современные генераторы изображений имеют тенденцию игнорировать слова или описания, вынуждая пользователей изучать промпт-инженерию. DALL-E 3 представляет собой шаг вперёд в нашей способности создавать изображения, которые точно соответствуют предоставленному вами запросу», — сообщает OpenAI в описании нового генератора изображений.

Модель лучше справляется и с такими сложными для искусственного интеллекта мелкими деталями, как человеческие руки. Даже при одинаковых запросах результаты DALL-E 3 намного лучше, чем у DALL-E 2, отмечают разработчики. DALL-E 3 сможет точно отобразить сцену с конкретными объектами и учесть, как они друг с другом связаны, как показано на изображении ниже.

OpenAI планирует в ближайшем будущем встроить DALL-E 3 в чат-бот ChatGPT Plus и Enterprise. Комбинация языковых навыков чат-бота с генератором изображений позволит создавать ещё более точные изображения и предоставит ещё больше возможностей в тонкой настройке запроса, если первый полученный результат окажется не тем, чего ожидал пользователь.

«При запросе ChatGPT автоматически сгенерирует индивидуальные подробные подсказки для DALL-E 3, на основе которых тот создаст изображение. Если полученное изображение понравится пользователю, но оно не совсем точно будет отображать запрос, то в него можно будет внести изменения, добавив всего несколько дополнительных уточняющих слов», — говорят в OpenAI

Сейчас DALL-E 3 находится на стадии исследовательской предварительной версии и станет доступен подписчикам ChatGPT Plus и Enterprise в октябре через API. Следует напомнить, что использование DALL-E 2 платное, а месячная подписка на тот же ChatGPT Plus стоит $20. В настоящий момент единственным крупным ИИ-чат-ботом, предлагающим бесплатный встроенный генератор изображений, является Bing Chat AI от Microsoft. Он, к слову, работает на базе мощной языковой модели GPT-4 от OpenAI.

«Как и в случае с DALL-E 2, сгенерированные с помощью DALL-E 3 изображения будут принадлежать пользователю, и ему не потребуется разрешение на их перепечатку, продажу или распространение», — уточняют в OpenAI.

В компании также отметили, что в DALL-E 3 предусмотрены инструменты, ограничивающие создание определённых изображений. Например, генератор изображений будет отклонять запросы с именами общественных деятелей или «вредными предубеждениями», чтобы снизить риск распространения пропаганды и дезинформации. Разработчики также тестируют классификатор происхождения — инструмент, который позволит определить, было ли изображение сгенерировано нейросетью. Наконец, DALL-E не будет генерировать картинки в стиле ныне живущих и творящих художников.


window-new
Soft
Hard
Тренды 🔥
«Sea of Thieves в космосе»: игроки встретили мультиплеерный шутер Wildgate от компании сооснователя Blizzard «очень положительными» отзывами в Steam 7 ч.
Создатели Until Dawn устроили новую волну сокращений и отложили релиз нелинейного хоррора Directive 8020 7 ч.
Более пяти миллионов ассасинов: Ubisoft похвасталась достижениями игроков Assassin's Creed Shadows 9 ч.
Запутавшие разработчиков изменения Apple в комиссиях App Store скорее всего будут приняты Еврокомиссией 9 ч.
Electronic Arts анонсирует Battlefield 6 уже на этой неделе — запущен обратный отсчёт до выхода первого трейлера 10 ч.
Microsoft узнала о критической уязвимости SharePoint ещё два месяца назад, но не смогла её исправить 11 ч.
Apple почти открыла исходный код своих ИИ-моделей, но что-то пошло не так 11 ч.
Встроенный в Telegram криптокошелёк Wallet стал доступен 87 млн пользователей в США 11 ч.
Nvidia выпустила драйвер GeForce Game Ready 577.00 WHQL с поддержкой DLSS 4 для Wuchang: Fallen Feathers 12 ч.
«Яндекс» выпустит «Нейроаналитика» — ИИ-агента для визуализации данных 13 ч.
Илон Маск намерен привлечь ещё $12 млрд кредитов на закупку ускорителей Nvidia для Grok 2 ч.
Новая статья: Обзор смартфона Samsung Galaxy S25 Edge: игра на опережение 5 ч.
Oracle поставит OpenAI два миллиона ИИ-чипов для ЦОД 5 ч.
Новая статья: Обзор Full HD IPS-монитора Digma Progress 27P504F: больше, чем можно представить 6 ч.
Microsoft представила ноутбук Surface Laptop 5G со слотом для SIM и чипами Core Ultra 200 по цене от $1800 8 ч.
Razer представила беспроводную версию геймерской мыши Cobra 10 ч.
Компактно, но дорого и медленно: ДНК-накопителям до коммерциализации пока ещё далеко 11 ч.
Китайские учёные впервые осуществили квантовую телепортацию с записью состояний в твердотельную память 12 ч.
Всё своё, от «железа» до ПО: «Группа Астра» и YADRO строят полностью российское облако 13 ч.
Sharp представили VR-перчатки, которые передают тактильные ощущения от прикосновений к виртуальным объектам 13 ч.