Сегодня 24 февраля 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → dall-e
Быстрый переход

OpenAI будет незаметно маркировать творчество ИИ-художника DALL-E 3

Генератор изображений OpenAI DALL-E 3 будет помечать созданные им картинки метаданными в соответствии со стандартами организации C2PA (Coalition for Content Provenance and Authenticity — «Коалиции по происхождению и аутентичности контента»). Такая маркировка позволит легко узнать, что изображение создано ИИ, а не человеком.

 Источник изображения: Gerd Altmann / pixabay.com

Источник изображения: Gerd Altmann / pixabay.com

При помощи метаданных будут маркироваться изображения, созданные искусственным интеллектом на сайте ChatGPT и при подключении к API для модели DALL-E 3, сообщила OpenAI. При выводе таких изображений на поддерживающих технологию Content Credentials ресурсах будет отображаться изображение с символами «CR» в левом верхнем углу каждой картинки. Это позволит установить происхождение файла, но пока маркировку получат только картинки, а не видеозаписи или текст. Добавление метаданных лишь незначительно повлияет на скорость работы системы и никак не скажется на качестве картинки, подчеркнули в OpenAI.

 Источник изображения: openai.com

Источник изображения: openai.com

Организация C2PA, в которую входят крупные технологические компании масштаба Adobe и Microsoft, продвигает собственный стандарт Content Credentials — это решение позволяет определять происхождение контента. Ранее о намерении помечать на своих платформах созданные ИИ материалы сообщила компания Meta.

Американские разработчики технологий ИИ взяли на себя обязательства обеспечивать средства идентификации генерируемого ИИ контента. Метаданные, однако, трудно назвать надёжным способом защиты — их легко удалить, случайно или намеренно. Так, они часто в принудительном порядке удаляются при загрузке в соцсети. Метаданные также не сохраняются при снятии снимков экрана.

Инженер Microsoft нашёл серьёзную уязвимость в ИИ-художнике DALL-E 3, но компания замолчала проблему

Старший инженер по искусственному интеллекту Microsoft Шейн Джонс (Shane Jones) обнаружил уязвимость в генераторе изображений OpenAI DALL-E 3, которая позволяет обходить защитные механизмы нейросети и генерировать недопустимый контент. Но в Microsoft и OpenAI отвергли факт наличия этой уязвимости и воспрепятствовали огласке проблемы.

 Источник изображения: efes / pixabay.com

Источник изображения: efes / pixabay.com

Инженер пояснил, что решил предать проблему огласке после того, как на прошлой неделе в соцсетях была опубликована серия сгенерированных ИИ фотореалистичных изображений известной исполнительницы Тейлор Свифт (Taylor Swift), имеющих деликатный характер. Инцидент вызвал возмущение в среде её поклонников, а Шейн Джонс призвал OpenAI изъять DALL-E 3 из открытого доступа. По одной из версий, создавшие эту серию изображений злоумышленники пользуются инструментом Microsoft Designer, частично основанным на этом ИИ-генераторе. Инженер также направил письмо двум сенаторам, одному члену Палаты представителей и генпрокурору штата Вашингтон, отметив, что «Microsoft знала об этих уязвимостях и возможностях злоупотреблений».

Джонс сообщил Microsoft об обнаруженной им проблеме ещё 1 декабря 2023 года, направив соответствующее обращение через внутреннюю систему компании. В тот же день он получил ответ от работающего с такими обращениями сотрудника, который отметил, что проблема не касается ни внутренней сети Microsoft, ни учётных записей клиентов компании, и порекомендовал направить своё обращение в OpenAI. Инженер направил его 9 декабря, представив подробную информацию об уязвимости, но так и не получил ответа. Джонс продолжил изучать проблему и «пришёл к выводу, что DALL-E 3 представляет угрозу общественной безопасности и должен быть изъят из общественного доступа, пока OpenAI не сможет устранить связанные с этой моделью риски».

 Источник изображения: ilgmyzin / unsplash.com

Источник изображения: ilgmyzin / unsplash.com

Две недели спустя, 14 декабря, инженер перевёл общение в публичную плоскость, разместив на своей странице в LinkedIn публикацию с призывом отозвать DALL-E 3 с рынка. Он уведомил об этом руководство компании, и с ним быстро связался его непосредственный начальник — он заявил, что юридический отдел Microsoft требует немедленно удалить публикацию, а обоснования своего требования он предоставит позже. Джонс удалил публикацию, но никаких сообщений от юристов Microsoft так и не получил. В итоге он 30 января был вынужден направить письмо властям.

OpenAI отреагировала только 30 января, заявив, что она изучила обращение инженера сразу после того, как оно поступило, и описанный им метод якобы не позволяет обходить средств безопасности. «Безопасность является нашим приоритетом, и мы применяем многосторонний подход. В основополагающей модели DALL-E 3 мы разработали фильтр наиболее откровенного контента из её обучающих данных, включая изображения сексуального характера и насилия, разработали надёжные классификаторы изображений, не позволяющие модели создавать пагубные картинки. Мы также внедрили дополнительные меры безопасности для наших продуктов, ChatGPT и DALL-E API, включая отклонение запросов, содержащих имя публичного деятеля. Мы выявляем и отклоняем изображения, которые нарушают нашу политику, и фильтруем все созданные изображения, прежде чем они показываются пользователю. Для усиления наших мер безопасности и для проверки на злоупотребления мы привлекаем команду сторонних экспертов», — заверили в OpenAI.

Microsoft переведёт ИИ-помощника Copilot на флагманскую нейросеть GPT-4 Turbo

Компания Microsoft анонсировала ряд нововведений, которые получит её ИИ-помощник Copilot. В скором времени Copilot получит поддержку флагманской нейросети GPT-4 Turbo, а также обновленную модель DALL-E 3. Также помощник получит интерпретатора программного кода, а поисковик Bing обзаведётся функцией «Глубокого поиска» на базе ИИ.

 Источник изображения: Microsoft

Источник изображения: Microsoft

Скоро Copilot сможет отвечать на запросы, используя новейшую модель GPT-4 Turbo от OpenAI, что означает, что он сможет принять больше данных благодаря контекстному окну размером 128 тыс. символов. Увеличенное контекстное окно позволит Copilot лучше понимать запросы и предлагать более качественные ответы. «В настоящее время эта модель тестируется отдельными пользователями и будет интегрирована в Copilot в ближайшие недели», – сообщил Юсуф Медхи (Yusuf Medhi), директор по потребительскому маркетингу в Microsoft.

Пока пользователи дожидаются появления модели GPT-4 Turbo в Copilot, Microsoft уже задействовала модель DALL-E 3 в Bing Image Creator и Copilot. «Теперь вы можете использовать Copilot для создания изображений, которые будут ещё более высокого качества и более точно соответствовать запросам благодаря обновлённой модели DALL-E 3», – утверждает Медхи.

 Источник изображения: Microsoft

Источник изображения: Microsoft

Microsoft Edge, в котором есть боковая панель Copilot, также получил возможность компоновки текста на веб-сайтах, чтобы переписывать предложения в режиме реального времени. Кроме того, теперь вы можете использовать Copilot в Microsoft Edge для конспектирования видеороликов, которые вы смотрите на YouTube.

Разработчиков же может заинтересовать новая функция интерпретатора кода, которая скоро появится в Copilot. Эта новая функция позволит пользователям Copilot получать от ИИ-чат-бота более точные расчеты, анализ данных и даже код. «Copilot будет писать код для ответа на сложные запросы на естественном языке, запускать его в изолированной среде и использовать результаты для получения более качественных ответов, – поясняют в Microsoft. – Вы также сможете загружать и скачивать файлы в Copilot и из него, чтобы работать с собственными данными и кодом, а также с результатами поиска Bing».

Что касается, собственно Bing, то Microsoft добавляет в него результаты так называемого «Глубокого поиска». «Deep Search использует возможности GPT-4 для предоставления оптимизированных результатов поиска по сложным темам, — поясняет Медхи. — Активация Deep Search расширяет поисковые запросы до более полных описаний, чтобы предоставить более релевантные результаты».

Paint в Windows 11 обзавёлся ИИ-генератором изображений на базе DALL-E 3

Microsoft представила долгожданную интеграцию генеративной нейросети DALL-E 3 с графическим редактором Paint в Windows 11. Благодаря этому пользователи программной платформы теперь смогут задействовать ИИ-генератор для создания изображений в Paint через функцию под названием Cocreator.

 Источник изображений: windowslatest.com

Источник изображений: windowslatest.com

В сентябре этого года упомянутое нововведение стало доступно участникам программы предварительной оценки на каналах Dev и Canary. Ранее в этом месяце возможность использования генеративной нейросети появилась на канале Release Preview, а теперь она становится доступна всем пользователям Windows 11.

Для генерации изображений достаточно открыть чистый лист Paint, выбрать функцию Cocreator в правой части панели инструментов и ввести текстовое описание изображения, которое алгоритм должен создать. Пользователи, которые только начинают знакомство с инструментами на базе нейросетей, могут ознакомиться с четырёхэтапным руководством прямо в приложении. С его помощью можно узнать порядок работы с алгоритмом и быстро приступить к генерации изображений.

Отмечается, что на данном этапе некоторые пользователи Windows 11 могут получить доступ к новой функции только через регистрацию в списке ожидания, поэтому до получения одобрения от вендора может пройти несколько дней. Пользователям, которые не видят кнопку Cocreator, рекомендуется убедиться в том, что они используют наиболее актуальную версию Paint, а также зарегистрироваться в списке ожидания.

Энтузиаст создал игру в стиле Angry Birds, используя только ChatGPT, DALL-E 3 и Midjourney

Блогер Хави Лопес (Javi Lopez), изучающий возможности нейросетей, рассказал о том, как с помощью одних лишь ChatGPT 4.0, DALL-E 3 и Midjourney создал на Хэллоуин рабочую видеоигру в стиле Angry Birds — Angry Pumpkins.

 Источник изображения: X (Javi Lopez)

Источник изображения: X (Javi Lopez)

Знаменитый мобильный хит Rovio узнаётся в Angry Pumpkins с первого взгляда: схожая эстетика, аналогичный геймплей (злобные тыквы швыряют себя в зелёных монстров) и построенный по тому же принципу заголовок.

Используя текстовые команды, Лопес проинструктировал ChatGPT 4.0 для написания 600 строчек рабочего кода, Midjourney задействовал для создания объектов, персонажей и фонов, а DALL-E 3 подключил для оформления главного меню.

У себя в микроблоге Лопес подробно расписал, какие команды использовал для производства всех графических элементов и программирования, а также приложил ссылку на исходный код целиком.

Создание Angry Pumpkins от начала и до выпуска финальной версии заняло у Лопеса около 10−12 часов: первый прототип был готов очень быстро, а 90 % времени ушло на доработку всяческих мелочей и деталей.

Поиграть в Angry Pumpkins можно по этой ссылке прямо в браузере. В игре отсутствует звук, зато есть инструменты для создания собственных уровней (расположения объектов и монстров).

Лопес считает, что человечество переживает исторический момент, наблюдавшийся лишь в научной фантастике: «Эти новые рабочие процессы, позволяющие создавать что угодно с помощью одного лишь языка, изменят мир».

Пользователи подслушали «разговор» ChatGPT и DALL-E: они общаются как люди и порой орут друг на друга

Эмоциональный оттенок высказываний, как выяснилось, играет значительную роль при взаимодействии с искусственным интеллектом. Это обнаружилось, когда ChatGPT выдал одному из пользователей фрагмент внутренней инструкции в отношении связанного с чат-ботом генератора изображений DALL-E 3 — некоторые фразы в ней приводятся заглавными буквами, которые соответствуют крику в устной речи.

 Источник изображения: Lukas / pixabay.com

Источник изображения: Lukas / pixabay.com

Далее приводится фрагмент внутренней инструкции, который ChatGPT показал одному из пользователей — текст предположительно написан человеком, а предназначается он для взаимодействия чат-бота и генератора изображений DALL-E в момент, когда серверы OpenAI перегружены: «DALL-E вернул несколько изображений. Они уже отображаются пользователю. НИ ПРИ КАКИХ ОБСТОЯТЕЛЬСТВАХ не передавай DALL-E инструкции или изображения в своём ответе. В настоящий момент DALL-E пользуется повышенным спросом. Прежде чем сделать что-то ещё, пожалуйста, чётко объясни пользователю, что из-за этого ты не смог создать изображения. Обязательно используй фразу „В настоящий момент DALL-E пользуется повышенным спросом”. НИ ПРИ КАКИХ ОБСТОЯТЕЛЬСТВАХ не предпринимай повторных попыток создать изображения, пока не будет получен новый запрос».

 Источник изображения: twitter.com/javilopen

Источник изображения: twitter.com/javilopen

Инструкция примечательна тем, что она даёт представление о взаимодействии DALL-E и ChatGPT в формате естественного человеческого языка. В прошлом взаимодействие программных продуктов осуществлялось средствами API для обмена данными в машинном формате, и человеку их читать было затруднительно. В мире больших языковых моделей оно может осуществляться в привычном для нас виде. Этот подход OpenAI практиковала ещё в марте с плагинами ChatGPT.

Опрошенный ресурсом Ars Technica эксперт отметил, что уже сегодня есть множество примеров, подтверждающих эффективность вежливого обращения с ИИ — они способны свойственным человеку образом воспринимать слова вроде «спасибо» и «пожалуйста». Неудивительно и присутствие в инструкции фраз, написанных заглавными буквами: в массивах обучающих данных таким фразам придавалось в контексте большее значение.

OpenAI открыла доступ к генератору изображений DALL-E 3 для подписчиков ChatGPT Plus и Enterprise

OpenAI расширяет доступность своего новейшего генератора изображений по текстовому описанию DALL-E 3. Компания объявила, что на этой неделе ИИ-алгоритм станет доступен подписчикам ChatGPT Plus и ChatGPT Enterprise. Разработчики заявили, что для этой модели был подготовлен пакет мер по повышению уровня безопасности, что указывает на её готовность к расширенному запуску.

 Источник изображения: OpenAI

Источник изображения: OpenAI

Модель DALL-E 3 была анонсирована в прошлом месяце, и разработчики показали, насколько она лучше справляется с генерацией картинок по сравнению с предыдущей версией алгоритма DALL-E 2. Пользователи могли убедиться в этом, составляя в ChatGPT более длинные и детальные описания изображений, которые должен создать генератор. Ранее в этом месяце модель DALL-E 3 была интегрирована в службы Bing Chat и Bing Image Creator.

Разработчики признают, что предыдущие версии генератора вызывали опасения, поскольку могли использоваться для создания фейковых изображений с целью распространения дезинформации или ведения другой неправомерной деятельности. В DALL-E 3 реализованы инструменты для ограничения генерации картинок определённых тематик. К примеру, алгоритм будет отклонять запросы, содержащие имена общественных деятелей или какие-либо «вредные побуждения». Разработчики ввели ограничения, которые не позволят DALL-E создавать изображения в стиле живущих ныне художников. OpenAI также заявила о наличии классификатора изображений, который позволяет с точностью до 99 % определить, была ли та или иная картинка сгенерирована с помощью DALL-E.

ИИ-генератор изображений DALL-E 3 появился в Bing, но опробовать его трудно из-за ажиотажа

Всем пользователям служб Bing Chat и Bing Image Creator стала доступна новейшая модель искусственного интеллекта — генератор изображений OpenAI DALL-E 3. На прошлой неделе система была развёрнута для пользователей Bing Enterprise, затем к ним присоединились пользователи Bing Image Creator, а теперь она открыта для всех.

 Источник изображения: blogs.bing.com

Источник изображения: blogs.bing.com

Таким образом, поисковая машина Bing получила доступ к DALL-E 3 даже раньше, чем OpenAI ChatGPT — это должно случиться до конца месяца, но только для пользователей, оформивших платную подписку. Система лучше понимает команды, а также генерирует более креативные и фотореалистичные изображения. Кроме того, она спроектирована так, чтобы её было проще использовать: DALL-E 3 интегрировали в Bing Chat и ChatGPT, а не стали делать отдельным продуктом. Пользователи могут постепенно совершенствовать изображение с чат-ботом, а не бесконечно упражняться в составлении запросов.

К сожалению, на текущий момент пользоваться DALL-E 3 через Bing довольно затруднительно: генератор изображений вызвал большой ажиотаж, и сейчас его серверы перегружены, а служба сообщает о «невозможности обрабатывать новые запросы». Это подтвердил и сотрудник Microsoft Михаил Парахин: «Мы ожидали большого интереса, но не ожидали, что он будет настолько большим».

Одной из ключевых особенностей генератора изображений в новом интерфейсе является его способность не только создавать картинки, но и предлагать варианты дальнейших действий. К примеру, в диалоге появляются шаблоны вроде «Можешь добавить радугу на заднем плане?», «Сделай его кошкой вместо собаки» или «Добавь птиц вокруг водопада».

Microsoft интегрирует в Bing продвинутый ИИ-генератор изображений DALL-E 3

Компания Microsoft сообщила, что интегрирует генератор изображений DALL-E 3 на базе искусственного интеллекта, разработанный компанией OpenAI, в собственный ИИ-чат-бот Bing.

 Источник изображения: Microsoft

Источник изображения: Microsoft

Представленный на днях генератор изображений DALL-E 3, который в октябре появится в составе чат-бота ChatGPT (точнее в его платных версиях Plus и Enterprise), лучше понимает запросы пользователей и более точно генерирует изображения по сравнению с моделью DALL-E 2. В Microsoft не уточнили, когда именно DALL-E 3 появится в составе Bing.

В компании также сообщили, что добавили в поисковик Bing новую функцию для шопинга. Bing может задавать пользователем вопросы о том, как они планируют использовать тот или иной продукт, а также более персонализированные вопросы, чтобы в конечном итоге подобрать максимально правильный товар, подходящий под запросы и нужды пользователя. Система также позволит искать и использовать скидочные коды.

Microsoft одной из первых интегрировала ИИ-технологии OpenAI в свой поисковик Bing. С помощью новых функций компания стремится усилить поисковую платформу. С февраля этого года в Bing присутствует чат-бот, который может отвечать на вопросы пользователя, искать новости, создавать тщательно подобранные руководства по покупке и многое другое.

Представлен ИИ-генератор изображений DALL-E 3 — он лучше понимает людей и скоро будет встроен в ChatGPT

Компания OpenAI представила новую версию генератора изображений DALL-E и заявила о планах интегрировать его в ChatGPT. Разработчики сообщают, что DALL-E 3 может «значительно лучше понимать запросы», анализировать сложные инструкции и генерировать «чрезвычайно детальные и точные изображения» по сравнению с DALL-E 2.

 Источник изображений: OpenAI / DALL-E 3

Источник изображений: OpenAI / DALL-E 3

«Современные генераторы изображений имеют тенденцию игнорировать слова или описания, вынуждая пользователей изучать промпт-инженерию. DALL-E 3 представляет собой шаг вперёд в нашей способности создавать изображения, которые точно соответствуют предоставленному вами запросу», — сообщает OpenAI в описании нового генератора изображений.

Модель лучше справляется и с такими сложными для искусственного интеллекта мелкими деталями, как человеческие руки. Даже при одинаковых запросах результаты DALL-E 3 намного лучше, чем у DALL-E 2, отмечают разработчики. DALL-E 3 сможет точно отобразить сцену с конкретными объектами и учесть, как они друг с другом связаны, как показано на изображении ниже.

OpenAI планирует в ближайшем будущем встроить DALL-E 3 в чат-бот ChatGPT Plus и Enterprise. Комбинация языковых навыков чат-бота с генератором изображений позволит создавать ещё более точные изображения и предоставит ещё больше возможностей в тонкой настройке запроса, если первый полученный результат окажется не тем, чего ожидал пользователь.

«При запросе ChatGPT автоматически сгенерирует индивидуальные подробные подсказки для DALL-E 3, на основе которых тот создаст изображение. Если полученное изображение понравится пользователю, но оно не совсем точно будет отображать запрос, то в него можно будет внести изменения, добавив всего несколько дополнительных уточняющих слов», — говорят в OpenAI

Сейчас DALL-E 3 находится на стадии исследовательской предварительной версии и станет доступен подписчикам ChatGPT Plus и Enterprise в октябре через API. Следует напомнить, что использование DALL-E 2 платное, а месячная подписка на тот же ChatGPT Plus стоит $20. В настоящий момент единственным крупным ИИ-чат-ботом, предлагающим бесплатный встроенный генератор изображений, является Bing Chat AI от Microsoft. Он, к слову, работает на базе мощной языковой модели GPT-4 от OpenAI.

«Как и в случае с DALL-E 2, сгенерированные с помощью DALL-E 3 изображения будут принадлежать пользователю, и ему не потребуется разрешение на их перепечатку, продажу или распространение», — уточняют в OpenAI.

В компании также отметили, что в DALL-E 3 предусмотрены инструменты, ограничивающие создание определённых изображений. Например, генератор изображений будет отклонять запросы с именами общественных деятелей или «вредными предубеждениями», чтобы снизить риск распространения пропаганды и дезинформации. Разработчики также тестируют классификатор происхождения — инструмент, который позволит определить, было ли изображение сгенерировано нейросетью. Наконец, DALL-E не будет генерировать картинки в стиле ныне живущих и творящих художников.

OpenAI сможет ещё шесть лет обучать ИИ на библиотеке изображений Shutterstock

Фотобанк Shutterstock на шесть лет продлил партнёрство с OpenAI, в рамках которого разработчик искусственного интеллекта сохранит право обучать свои модели на изображениях, видео, музыке и метаданных в библиотеке Shutterstock.

 Источник изображения: prnewswire.com

Источник изображения: prnewswire.com

Две компании начали сотрудничать в 2021 году — материалы Shutterstock помогли OpenAI обучить генератор изображений DALL-E. Глава OpenAI Сэм Альтман (Sam Altman) назвал это соглашение критически важным для разработки модели. В прошлом году Shutterstock учредила специальный фонд, из которого авторам материалов выплачиваются вознаграждения, когда их работа используется в обучении ИИ.

Тогда же Shutterstock запустила на своём сайте генератор изображений и запретила продавать на площадке изображения, созданные ИИ, отличными от DALL-E. Впоследствии работа функции была расширена — с помощью ИИ теперь можно редактировать любые материалы на платформе. Функции ИИ также вскоре появятся на ресурсе Giphy, который Shutterstock недавно приобрела у Meta.

В отличие от некоторых других платформ обмена изображениями, включая Getty Images, Shutterstock поддерживает технологии ИИ. Недовольство их распространением часто выражают авторы материалов: в Getty Images решили идти до конца, запретив на платформе размещение изображений, созданных генераторами, и подав в суд на ответственную за модель Stable Diffusion компанию Stability AI, которая якобы незаконно использовала защищённые авторским правом материалы для обучения ИИ. В Shutterstock правовые вопросы пока активно не поднимались, а интеграция с DALL-E помогает фотобанку активно расширять библиотеку.

В Microsoft Edge появился ИИ-инструмент создания изображений — Bing Image Creator

Компания Microsoft, похоже, решила внедрить ИИ-функции во все доступные ей приложения и сервисы. Совсем недавно появилась новость об интеграции в Microsoft Edge инструмента для создания изображений — Bing Image Creator, уже доступного в веб-версии.

 Источник изображения: Microsoft

Источник изображения: Microsoft

Microsoft выпустила Bing Image Creator ещё в прошлом месяце, он представляет собой модифицированную версию нейросети DALL-E 2, способную создавать изображения по текстовым описаниям. Сервис доступен всем по адресу bing.com/images/create и также его можно активировать из умного чата Bing, но теперь Microsoft добавила возможность создать соответствующую панель и в браузере.

Как сообщается в блоге Microsoft, «функция поможет создать изображения, которые ещё не существуют» — это возможно благодаря использованию новейших моделей DALL-E от партнёра — компании OpenAI. Инструмент появится в боковой панели. Он очень пригодится, если необходимо быстро сформировать изображение для поста в социальной сети или даже презентации PowerPoint.

Новая панель в целом работает так же, как и веб-версия Bing Image Creator, но получила более компактный интерфейс для того, чтобы тот умещался в боковой панели. Чтобы активировать функцию, необходимо нажать на панели кнопку (+) и активировать Image Creator — если соответствующего переключателя не видно, функция появится позже, поскольку её релиз в мире происходит постепенно.

Недавно появилась информация о намерении Microsoft использовать алгоритмы искусственного интеллекта Copilot в приложении «записной книжки» OneNote — например, ИИ сможет по запросу быстро набросать план мероприятия или рассказать о кратком содержании заметки.

Microsoft Bing научился генерировать изображения из текста с помощью нейросети DALL-E

Компания Microsoft продолжает интегрировать инструменты на основе нейросетей в свои продукты. На этот раз разработчики добавили в чат-бота поисковой системы Bing возможность генерации изображений, для чего используется нейросеть DALL-E компании Open AI. Развёртывание инструмента под названием Bing Image Creator происходит в несколько этапов, поэтому на данный момент он доступен не всем желающим.

 Источник изображений: Microsoft

Источник изображений: Microsoft

«Для тех, кто участвует в программе предварительной оценки Bing, инструмент Bing Image Creator будет полностью интегрирован в чат-бота Bing и доступен в творческом режиме. Введя описание изображения и предоставив дополнительный контекст, например, местоположение или деятельность, а также выбрав творческий стиль, с помощью Image Creator можно создать изображение из вашего собственного воображения», — сказано в сообщении Юсуфа Мехди (Yusuf Mehdi), главы отдела потребительского маркетинга Microsoft.

В дополнение к этому Microsoft добавляет инструмент Bing Image Creator в свой браузер Edge. На боковой панели обозревателя появится соответствующая иконка, нажав на которую пользователь сможет приступить к вводу описания, на основе которого нейросеть сгенерирует изображение. На начальном этапе распространения Bing Image Creator будет доступен только при использовании творческого режима общения чат-бота. Позднее данный инструмент можно будет использовать независимо от того, какой стиль общения с чат-ботом выбран пользователем.

Напомним, ИИ-бот в Bing поддерживает три режима общения: творческий, точный и сбалансированный. Первый вариант предполагает, что чат-бот даёт более развёрнутые и оригинальные ответы. Во втором случае он ограничивается лаконичными и точными формулировками по заданной тематике, а третий вариант представляет собой нечто среднее между первыми двумя вариантами.

Shutterstock запустил ИИ-инструмент для генерации изображений по текстовому описанию

В прошлом году фотобанк Shutterstock и компания Open AI объявили о партнёрстве, в рамках которого последняя планировала интегрировать в фотосервис свою ИИ-модель DALL-E 2 для генерации изображений по текстовому описанию. Теперь же было объявлено, что пользователи онлайн-платформы для дизайнеров Creative Flow от Shutterstock смогут генерировать изображения по текстовому описанию, используя для этого инструмент на основе DALL-E 2.

 Источник изображения: freepik.com

Источник изображения: freepik.com

Ключевая особенность нового инструмента, который, похоже, не имеет названия, заключается в том, что сгенерированные ИИ изображения можно будет лицензировать. Это важно, поскольку один из крупнейших конкурентов Shutterstock в лице платформы Getty Images в настоящее время ведёт судебное разбирательство по поводу изображений, созданных с помощью генеративного алгоритма Stable Diffusion от компании Stability AI. Поводом для иска стало использование разработчиками для обучения своего алгоритма изображений, размещённых на платформе Getty Images.

Другими словами, сервис Shutterstock не только намерен использовать возможности нейросетей для генерации картинок, но и наделять авторскими правами созданный таким образом контент. Этим решением сервис ставит себя в оппозицию Getty Images, владельцы которого выступили на стороне авторов контента, недовольных тем, что их работы используются для обучения генеративных нейросетей. Хотя Stability AI получила значительное финансирование, по состоянию на эту неделю Open AI значительно превосходит её в этом плане. В 2019 году Microsoft инвестировала в Open AI $1 млрд и на днях софтверный гигант объявил, что намерен вложить ещё миллиарды.

Помимо партнёрства с Open AI, Shutterstock также недавно объявил о сотрудничестве с Meta Platforms, владельцем Facebook, Instagram и WhatsApp. В рамках этого сотрудничества Meta будет использовать фото- и другие медиатеки Shutterstock для создания наборов данных для обучения собственных ИИ-алгоритмов. В конечном счёте можно ожидать появления новых инструментов на основе генеративных нейросетей.

Фотобанк Shutterstock начнёт продавать изображения, сгенерированные ИИ

Пока одни спорят, способны ли сгенерированные нейросетью изображения поставить крест на сервисах продажи стоковых картинок, другие уже берут технологию на вооружение и организуют торговлю созданным с помощью алгоритмов ИИ контентом. Именно такой проект готовится реализовать известный сервис Shutterstock.

 Источник изображения: Shutterstock

Источник изображения: Shutterstock

Анонсировано расширенное партнёрство с OpenAI, которая интегрирует свою ИИ-модель DALL-E 2 в платформу Shutterstock в ближайшие месяцы. Дополнительно Shutterstock основала фонд Contributor Fund, с помощью которого компания будет платить компенсации авторам контента, используемого для тренировки ИИ. При этом площадка будет блокировать продажу изображений, сгенерированных другими нейросетями.

Shutterstock и OpenAI сотрудничают в данной сфере не впервые. С 2021 года одна продавала другой изображения и метаданные для тренировки DALL-E, в OpenAI считают эти материалы критически важными для тренировки модели. Теперь художники будут буквально конкурировать с ИИ, который учился на их работах.

Компенсация авторам изображений поднимает ряд этических и правовых вопросов. Представитель Shutterstock заявил, что с новой технологией связано много спорных моментов, в том числе затрагивающих вопросы собственности. По мнению компании, поскольку для обучения использовались изображения многих художников, созданные ИИ изображения не могут иметь автора, а компенсацию за них должны получать авторы, чьи работы были использованы при создании каждого экземпляра изображения.

Запрет на публикацию изображений, сгенерированных другими нейросетями, объясняется невозможностью оценить, какая модель использовалась для создания контента, поэтому нет данных о том, кому принадлежат права на работы. В Shutterstock, по словам представителей сервиса, разработана модель компенсаций, при которой средства будут получать те, чьи работы использовались при обучении. Доля каждого будет рассчитана исходя из вклада в виде изображений и метаданных.

В Shutterstock заявляют, что выплаты будут осуществляться каждые полгода. В настоящий момент даже примерно неизвестно, сколько будут платить каждому автору.

window-new
Soft
Hard
Тренды 🔥
X открыла аудио- и видеозвонки для всех пользователей, а не только для платных 4 ч.
Суд одобрил признание Binance вины и штраф в размере $4,3 миллиарда 4 ч.
Илон Маск намекнул на запуск почтовой службы XMail 4 ч.
Google привела аргументы против обвинений в монополизации рынка поисковиков 9 ч.
«Такая же грандиозная, увлекательная и красивая, какой вы её помните»: скриншоты, подробности и сроки выхода Age of Mythology: Retold 16 ч.
Новая статья: Banishers: Ghosts of New Eden — изгнатели дьявола. Рецензия 17 ч.
Хидетака Миядзаки встал на защиту Dark Souls 2 — самой нелюбимой фанатами игры серии 18 ч.
«Этот день настал»: культовый российский квест Sublustrum получит трёхмерный ремейк 19 ч.
Паркурный экшен Vasya Run: Ghetto Gopnik расскажет об уличном художнике посреди инопланетного вторжения — первый трейлер и подробности 21 ч.
Warner Bros. признала релиз Suicide Squad: Kill the Justice League провалом 22 ч.
Взломанные беспроводные зарядки могут плавить смартфоны и вызывать возгорания, показали исследователи 17 мин.
У Урана нашли самый крошечный спутник в Солнечной системе — ещё два небольших спутника открыли у Нептуна 2 ч.
В этом году у «Альфа-банка» появится собственный сотовый оператор 2 ч.
NVIDIA, Microsoft и другие инвестировали $675 млн в разработчика роботов-гуманоидов Figure AI 3 ч.
Зарядки старых ноутбуков Toshiba попали под отзыв из-за сильного перегрева — это может привести к пожару или ожогам 4 ч.
NVIDIA потеряла в Китае $2 млрд за квартал из-за санкций США 6 ч.
Американский модуль Nova-C завалился на бок при посадке на Луну — это мешает связи с Землёй 6 ч.
TSMC открыла в Японии первое предприятие и пообещала построить второе 8 ч.
Владельцы AR/VR-гарнитуры Apple Vision Pro жалуются на идентичную трещину на защитном стекле устройства 8 ч.
EVGA выпустила обновлённые СЖО CLCx с 2,1-дюймовым экраном и ARGB-вентиляторами 9 ч.