Сегодня 21 апреля 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Представлен ИИ-генератор изображений DALL-E 3 — он лучше понимает людей и скоро будет встроен в ChatGPT

Компания OpenAI представила новую версию генератора изображений DALL-E и заявила о планах интегрировать его в ChatGPT. Разработчики сообщают, что DALL-E 3 может «значительно лучше понимать запросы», анализировать сложные инструкции и генерировать «чрезвычайно детальные и точные изображения» по сравнению с DALL-E 2.

 Источник изображений: OpenAI / DALL-E 3

Источник изображений: OpenAI / DALL-E 3

«Современные генераторы изображений имеют тенденцию игнорировать слова или описания, вынуждая пользователей изучать промпт-инженерию. DALL-E 3 представляет собой шаг вперёд в нашей способности создавать изображения, которые точно соответствуют предоставленному вами запросу», — сообщает OpenAI в описании нового генератора изображений.

Модель лучше справляется и с такими сложными для искусственного интеллекта мелкими деталями, как человеческие руки. Даже при одинаковых запросах результаты DALL-E 3 намного лучше, чем у DALL-E 2, отмечают разработчики. DALL-E 3 сможет точно отобразить сцену с конкретными объектами и учесть, как они друг с другом связаны, как показано на изображении ниже.

OpenAI планирует в ближайшем будущем встроить DALL-E 3 в чат-бот ChatGPT Plus и Enterprise. Комбинация языковых навыков чат-бота с генератором изображений позволит создавать ещё более точные изображения и предоставит ещё больше возможностей в тонкой настройке запроса, если первый полученный результат окажется не тем, чего ожидал пользователь.

«При запросе ChatGPT автоматически сгенерирует индивидуальные подробные подсказки для DALL-E 3, на основе которых тот создаст изображение. Если полученное изображение понравится пользователю, но оно не совсем точно будет отображать запрос, то в него можно будет внести изменения, добавив всего несколько дополнительных уточняющих слов», — говорят в OpenAI

Сейчас DALL-E 3 находится на стадии исследовательской предварительной версии и станет доступен подписчикам ChatGPT Plus и Enterprise в октябре через API. Следует напомнить, что использование DALL-E 2 платное, а месячная подписка на тот же ChatGPT Plus стоит $20. В настоящий момент единственным крупным ИИ-чат-ботом, предлагающим бесплатный встроенный генератор изображений, является Bing Chat AI от Microsoft. Он, к слову, работает на базе мощной языковой модели GPT-4 от OpenAI.

«Как и в случае с DALL-E 2, сгенерированные с помощью DALL-E 3 изображения будут принадлежать пользователю, и ему не потребуется разрешение на их перепечатку, продажу или распространение», — уточняют в OpenAI.

В компании также отметили, что в DALL-E 3 предусмотрены инструменты, ограничивающие создание определённых изображений. Например, генератор изображений будет отклонять запросы с именами общественных деятелей или «вредными предубеждениями», чтобы снизить риск распространения пропаганды и дезинформации. Разработчики также тестируют классификатор происхождения — инструмент, который позволит определить, было ли изображение сгенерировано нейросетью. Наконец, DALL-E не будет генерировать картинки в стиле ныне живущих и творящих художников.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
В Екатеринбурге прошло PG BootCamp Russia — четвёртое официальное мероприятие российского сообщества PostgreSQL 56 мин.
Бета-версия футбольного экшена Rematch от создателей Sifu стала хитом — тестирование привлекло более миллиона игроков 3 ч.
Дуров раскрыл, что может его заставить закрыть Telegram 3 ч.
ОАЭ первой в мире привлечёт ИИ к написанию законов 3 ч.
Instagram начнёт выявлять аккаунты подростков с помощью ИИ — обмануть систему не получится 4 ч.
Valorant выйдет на мобильных устройствах, но пока только в Китае 5 ч.
OpenAI заподозрили в манипуляциях с тестами мощной ИИ-модели o3 7 ч.
Cyberpunk 2077 стала первой подтверждённой игрой для Switch 2 с поддержкой DLSS, но есть нюанс 7 ч.
Олдскульная стратегия Tempest Rising в духе Command & Conquer из-за ошибки вышла на неделю раньше запланированного — издатель смирился с этим 8 ч.
Европейский регулятор случайно раскрыл планы Ubisoft на Assassin’s Creed Shadows для Nintendo Switch 2 9 ч.
В 2024 году дата-центры Apple потребили 2,5 ТВт∙ч «зелёного» электричества, но есть нюанс 26 мин.
Nothing рассекретила дизайн смартфона CMF Phone 2 Pro в преддверии анонса 32 мин.
«Голосовое протезирование с ИИ» превратит мозговые волны немых людей в беглую речь 34 мин.
Смартфоны получат этикетки с данными об автономности и не только — ЕС вводит экомаркировку 2 ч.
Для российских исследователей будут созданы суперкомпьютерный центр и роботизированные лаборатории 2 ч.
«АвтоВАЗ» взял на работу поющего робота-тележку «Антонину» 3 ч.
Deloitte: АЭС смогут обеспечить 10 % будущего спроса ЦОД США на электроэнергию, но строить их придётся быстрее 3 ч.
Oppo представила недорогой смартфон Oppo K13 со Snapdragon 6 Gen 4, 50-Мп камерой и батарей на 7000 мА·ч 3 ч.
«Чудо-долина» для ИИ — в Канаде построят крупнейший в мире 7,5-ГВт ЦОД с питанием от природного газа 3 ч.
G.Skill представила 256-Гбайт комплект памяти DDR5-6000 CL32 из четырёх модулей 4 ч.