Сегодня 07 февраля 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Представлен ИИ-генератор изображений DALL-E 3 — он лучше понимает людей и скоро будет встроен в ChatGPT

Компания OpenAI представила новую версию генератора изображений DALL-E и заявила о планах интегрировать его в ChatGPT. Разработчики сообщают, что DALL-E 3 может «значительно лучше понимать запросы», анализировать сложные инструкции и генерировать «чрезвычайно детальные и точные изображения» по сравнению с DALL-E 2.

 Источник изображений: OpenAI / DALL-E 3

Источник изображений: OpenAI / DALL-E 3

«Современные генераторы изображений имеют тенденцию игнорировать слова или описания, вынуждая пользователей изучать промпт-инженерию. DALL-E 3 представляет собой шаг вперёд в нашей способности создавать изображения, которые точно соответствуют предоставленному вами запросу», — сообщает OpenAI в описании нового генератора изображений.

Модель лучше справляется и с такими сложными для искусственного интеллекта мелкими деталями, как человеческие руки. Даже при одинаковых запросах результаты DALL-E 3 намного лучше, чем у DALL-E 2, отмечают разработчики. DALL-E 3 сможет точно отобразить сцену с конкретными объектами и учесть, как они друг с другом связаны, как показано на изображении ниже.

OpenAI планирует в ближайшем будущем встроить DALL-E 3 в чат-бот ChatGPT Plus и Enterprise. Комбинация языковых навыков чат-бота с генератором изображений позволит создавать ещё более точные изображения и предоставит ещё больше возможностей в тонкой настройке запроса, если первый полученный результат окажется не тем, чего ожидал пользователь.

«При запросе ChatGPT автоматически сгенерирует индивидуальные подробные подсказки для DALL-E 3, на основе которых тот создаст изображение. Если полученное изображение понравится пользователю, но оно не совсем точно будет отображать запрос, то в него можно будет внести изменения, добавив всего несколько дополнительных уточняющих слов», — говорят в OpenAI

Сейчас DALL-E 3 находится на стадии исследовательской предварительной версии и станет доступен подписчикам ChatGPT Plus и Enterprise в октябре через API. Следует напомнить, что использование DALL-E 2 платное, а месячная подписка на тот же ChatGPT Plus стоит $20. В настоящий момент единственным крупным ИИ-чат-ботом, предлагающим бесплатный встроенный генератор изображений, является Bing Chat AI от Microsoft. Он, к слову, работает на базе мощной языковой модели GPT-4 от OpenAI.

«Как и в случае с DALL-E 2, сгенерированные с помощью DALL-E 3 изображения будут принадлежать пользователю, и ему не потребуется разрешение на их перепечатку, продажу или распространение», — уточняют в OpenAI.

В компании также отметили, что в DALL-E 3 предусмотрены инструменты, ограничивающие создание определённых изображений. Например, генератор изображений будет отклонять запросы с именами общественных деятелей или «вредными предубеждениями», чтобы снизить риск распространения пропаганды и дезинформации. Разработчики также тестируют классификатор происхождения — инструмент, который позволит определить, было ли изображение сгенерировано нейросетью. Наконец, DALL-E не будет генерировать картинки в стиле ныне живущих и творящих художников.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
В «Google Фото» появятся водяные знаки SynthID для изображений, в которые «вмешался» ИИ 2 мин.
Первая игра создателя Syberia спустя 26 лет снова отправит в затерянную страну — дата выхода и демоверсия ремейка Amerzone: The Explorer’s Legacy 6 ч.
Windows 11 теперь обеспечит «наилучший опыт для музыкантов» — ОС получила полную поддержку MIDI 2.0 6 ч.
Организаторы E3 устроят в Лас-Вегасе закрытую игровую конференцию iicon для раскрытия «безграничного потенциала интерактивных развлечений» 8 ч.
Создатели Jagged Alliance 3 и Surviving Mars лишатся независимости — Paradox Interactive покупает студию Haemimont Games 9 ч.
Доходы хакеров от программ-вымогателей упали на треть в прошлом году, хотя атак стало больше 10 ч.
Death Stranding 2: On The Beach получила новый возрастной рейтинг, а Кодзима намекает на следующий трейлер 11 ч.
Российские специалисты из Smart Engines расшифровали рукописи Пушкина при помощи ИИ 12 ч.
«Яндекс» добавил генератор картинок DeepSeek в «Шедеврум» 12 ч.
Утечка: в PS Store засветилась дата выхода и новый трейлер Metal Gear Solid Delta: Snake Eater 12 ч.
ASRock перенесёт часть своего производства из Китая из-за новых импортных тарифов, введённых Трампом 4 мин.
Исследователи создали аналог ИИ-модели OpenAI за 26 минут, используя метод дистилляции 7 мин.
Процессоры Qualcomm заняли 10 % рынка в США в сегменте ПК с Windows дороже $800 26 мин.
В Asus пообещали исправить механизм,  который зажевывал видеокарты в слотах PCIe, и выплатить компенсации 5 ч.
Thermal Grizzly представила термопрокладки Minus Pad Basic, Pad Advance и Pad Pro 5 ч.
Intel нашла куда пристроить свои квантовые процессоры — они появятся в компьютерах «Made in Japan» 5 ч.
Новая статья: Обзор ASUS ROG Phone 9 Pro: главный смартфон для игр 6 ч.
Немецкие учёные создали лучшие в мире солнечные ячейки из перовскита и плёнок CIGS 7 ч.
Квантовую телепортацию впервые применили для распределённых квантовых вычислений 10 ч.
Xiaomi и Huawei сильнее всех нарастили продажи планшетов в 2024 году, но до Apple им ещё далеко 10 ч.