Сегодня 12 июля 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Представлен ИИ-генератор изображений DALL-E 3 — он лучше понимает людей и скоро будет встроен в ChatGPT

Компания OpenAI представила новую версию генератора изображений DALL-E и заявила о планах интегрировать его в ChatGPT. Разработчики сообщают, что DALL-E 3 может «значительно лучше понимать запросы», анализировать сложные инструкции и генерировать «чрезвычайно детальные и точные изображения» по сравнению с DALL-E 2.

 Источник изображений: OpenAI / DALL-E 3

Источник изображений: OpenAI / DALL-E 3

«Современные генераторы изображений имеют тенденцию игнорировать слова или описания, вынуждая пользователей изучать промпт-инженерию. DALL-E 3 представляет собой шаг вперёд в нашей способности создавать изображения, которые точно соответствуют предоставленному вами запросу», — сообщает OpenAI в описании нового генератора изображений.

Модель лучше справляется и с такими сложными для искусственного интеллекта мелкими деталями, как человеческие руки. Даже при одинаковых запросах результаты DALL-E 3 намного лучше, чем у DALL-E 2, отмечают разработчики. DALL-E 3 сможет точно отобразить сцену с конкретными объектами и учесть, как они друг с другом связаны, как показано на изображении ниже.

OpenAI планирует в ближайшем будущем встроить DALL-E 3 в чат-бот ChatGPT Plus и Enterprise. Комбинация языковых навыков чат-бота с генератором изображений позволит создавать ещё более точные изображения и предоставит ещё больше возможностей в тонкой настройке запроса, если первый полученный результат окажется не тем, чего ожидал пользователь.

«При запросе ChatGPT автоматически сгенерирует индивидуальные подробные подсказки для DALL-E 3, на основе которых тот создаст изображение. Если полученное изображение понравится пользователю, но оно не совсем точно будет отображать запрос, то в него можно будет внести изменения, добавив всего несколько дополнительных уточняющих слов», — говорят в OpenAI

Сейчас DALL-E 3 находится на стадии исследовательской предварительной версии и станет доступен подписчикам ChatGPT Plus и Enterprise в октябре через API. Следует напомнить, что использование DALL-E 2 платное, а месячная подписка на тот же ChatGPT Plus стоит $20. В настоящий момент единственным крупным ИИ-чат-ботом, предлагающим бесплатный встроенный генератор изображений, является Bing Chat AI от Microsoft. Он, к слову, работает на базе мощной языковой модели GPT-4 от OpenAI.

«Как и в случае с DALL-E 2, сгенерированные с помощью DALL-E 3 изображения будут принадлежать пользователю, и ему не потребуется разрешение на их перепечатку, продажу или распространение», — уточняют в OpenAI.

В компании также отметили, что в DALL-E 3 предусмотрены инструменты, ограничивающие создание определённых изображений. Например, генератор изображений будет отклонять запросы с именами общественных деятелей или «вредными предубеждениями», чтобы снизить риск распространения пропаганды и дезинформации. Разработчики также тестируют классификатор происхождения — инструмент, который позволит определить, было ли изображение сгенерировано нейросетью. Наконец, DALL-E не будет генерировать картинки в стиле ныне живущих и творящих художников.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Новый раунд финансирования может оценить капитализацию xAI в $200 млрд 20 мин.
ИИ для написания кода не ускоряет работу программистов, а замедляет, показало исследование 4 ч.
NVIDIA, Cisco и Indosat помогут Индонезии встать на ИИ-рельсы 5 ч.
Oracle под давлением Трампа предоставила правительству США 75-% скидку на облако, на очереди — Google Cloud, Azure и AWS 6 ч.
«Бесплатный YouTube Premium» оказался фикцией — рекламу российским блогерам никто не отключал 7 ч.
Новый трейлер раскрыл дату выхода и цену ремастера Warhammer 40,000: Dawn of War — владельцы классической версии получат скидку 8 ч.
Genshin Impact и Honkai: Star Rail станут первыми играми, которые Роскачество проверит на «способы вытягивания денег» у пользователей 9 ч.
Миллионы Mercedes-Benz, Volkswagen и Škoda оказалось можно взломать по Bluetooth 9 ч.
Олдскульный хоррор Heartworm в духе Resident Evil и Silent Hill не заставит себя долго ждать — дата выхода и новый трейлер 10 ч.
В Windows 11 появился ИИ-агент, помогающий с настройками ОС 11 ч.
AST SpaceMobile всё же запустит гигантский спутник связи, несмотря на препоны SpaceX 4 ч.
Суд обязал МТС выплатить штраф в 3 млрд рублей за необоснованное повышение тарифов 10 ч.
Разработчик зрения для роботов RealSense отделился от Intel и привлёк $50 млн инвестиций 10 ч.
Смарт-часы станут производительнее и эффективнее — Qualcomm, наконец, разработает для них новый процессор 11 ч.
«Самая старая комета, которую мы когда-либо видели» — учёные оценили возраст третьего межзвёздного объекта в 7 млрд лет 11 ч.
Бюрократы да экологи: Microsoft посетовала на трудность развития ЦОД в Европе 11 ч.
Умные серьги и ожерелья не за горами — Samsung задумалась о новых формфакторах носимых устройств 13 ч.
Colorful показала видеокарту GeForce RTX 5000 iGame Ultra с двумя слотами M.2 для SSD 13 ч.
Sony показала спецверсии PlayStation 5 Ghost of Yotei Limited Edition 13 ч.
Silicon Motion представила SSD-контроллер с PCIe 6.0 и скоростью до 28 Гбайт/с 13 ч.