Сегодня 28 апреля 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → midjourney
Быстрый переход

Midjourney теперь можно показать персонажа, чтобы он повторял его на генерируемых изображениях

Основанный на искусственном интеллекте генератор изображений Midjourney 6, доступный сейчас только в рамках альфа-тестирования на платформе Discord, предложил новую функцию «образец персонажа» (Character Reference), позволяющую зафиксировать один образ на разных созданных платформой изображениях.

 Источник изображения: youtube.com/@curtispyketech

Источник изображения: youtube.com/@curtispyketech

Чтобы задать образец, пользователь Midjourney может указать одну или несколько ссылок на картинку с интересующим его персонажем или загрузить его на платформу, и генератор будет учитывать эти данные при получении команды. Администрация сервиса отметила, что новая функция предназначается в первую очередь для персонажей, созданных ИИ. «Для реальных людей/фотографий она не предназначена», — заявил администратор Midjourney Discord и добавил, что это, «скорее всего, исказит их, как это делают обычные запросы на изображения».

Но пользователи платформы, конечно, не смогли не попробовать. Один из них загрузил в качестве образца фотографию футбольной звезды Криштиану Роналду (Cristiano Ronaldo), и результаты действительно сильно напоминали известного спортсмена. Функция пока тестируется, но уже демонстрирует убедительные результаты: доступен также параметр «силы» (strength), то есть степени соответствия образца и результата генерации.

Новая функция вызывает два противоположных этических вопроса. С одной стороны, возможность задать образец персонажа облегчит недобросовестным пользователям создание убедительных дипфейков. С другой, исключение отсылок на работы художников может вызвать проблемы с авторскими правами, если пользователи захотят коммерциализировать или опубликовать творения Midjourney.

Midjourney заблокировала доступ всем сотрудникам конкурирующей Stability AI за агрессивный сбор данных

В минувшую субботу ИИ-генератор изображений Midjourney подвергся массированной атаке, которая привела к отключению на 24 часа серверов сервиса. Атака проводилась со стороны учётной записи, которую связали с инженерами по сбору данных из конкурирующей компании Stability AI. В итоге всем сотрудникам Stability AI закрыли доступ к платформе Midjourney.

 Источник изображения: stability.ai

Источник изображения: stability.ai

Инженеры Midjourney обнаружили, что одна из учётных записей «пытается получить запросы и изображения каждого пользователя на сайте». Проще говоря, из Midjourney очень активно скачивались пары «запрос + картинка». Эти запросы спровоцировали перегрузку серверов компании и привели к частичному отключению её базы данных на 24 часа. После блокировки недобросовестного пользователя сотрудники Midjourney провели расследование и обнаружили, что учётная запись «была связана через две кредитные карты с одним из ведущих инженеров по сбору данных в команде Stable Diffusion [компании Stability AI]». В ответ Midjourney решила запретить всем сотрудникам Stability AI пользоваться её платформой.

Midjourney и Stability AI — прямые конкуренты в области генеративного ИИ. Работающая в Сан-Франциско компания Midjourney была основана Дэвидом Хольцем (David Holz). Её доход, по некоторым оценкам составляет $200 млн, а штат — менее 100 сотрудников; внешний капитал для работы компании не привлекался. Базирующаяся в Лондоне Stability AI привлекла $197 млн от Lightspeed, Coatue и Intel при оценке в $1 млрд. В 2023 году выручка компании, по данным AIM Research, составила $44,2 млн.

Глава Stability AI Эмад Мостак (Emad Mostaque) заявил, что инцидент не может расцениваться как DDoS-атака, и если сотрудники компании и были к нему причастны, то их действия не являлись преднамеренными; он также пообещал провести внутреннее расследование. В ответ на это Хольц сообщил, что отправил Мостаку дополнительную информацию в помощь внутреннему расследованию.

Сбор данных (data scraping) — извлечение информации из ответов другой программы, обычно производимое для обучения собственной модели. Сегодня этот метод является стандартной практикой в гонке за разработку инструментов ИИ, хотя иногда вызывает претензии — эта практика перегружает серверы платформ, с которых производится сбор данных и ухудшает качество обслуживания пользователей. Но крупные инциденты с отключением серверов до настоящего момента не отмечались.

Запущен обновлённый ИИ-художник Midjourney V6 — он научился писать

Состоялся выход альфа-версии Midjourney V6 — ИИ-генератора изображений. Среди наиболее примечательных нововведений разработчики отмечают более реалистичные и детализированные картинки, а также способность модели генерировать разборчивый текст внутри изображений.

 Источник изображения: twitter.com/OrctonAI

Источник изображения: twitter.com/OrctonAI

Midjourney V6 на самом деле является «третьей моделью, обученной с нуля на наших суперкластерах ИИ», и на её разработку ушли девять месяцев, пояснил глава компании Дэвид Хольц (David Holz). Подключение к обновлённой нейросети не происходит для всех пользователей по умолчанию — в чате Discord с ботом Midjourney необходимо перейти в режим настроек командой «/settings», после чего в раскрывающемся меню сверху выбрать «V6». В качестве альтернативы можно после каждого описания изображения добавлять параметр «-v 6».

 Источник изображения: twitter.com/Boris_Jov

Источник изображения: twitter.com/Boris_Jov

Господин Хольц обратил внимание на следующие нововведения: «гораздо более точное следование описаниям и более длинные описания; улучшенная согласованность и знания модели; улучшены механизмы подсказок и правок; некоторые возможности рисования текста — он указывается в кавычках, помочь могут параметры „--style raw” и низкие значения „--stylize”; улучшены средства масштабирования с „точным” и „творческим” режимами».

 Источник изображения: twitter.com/giffboake

Источник изображения: twitter.com/giffboake

Механизм создания описаний изображений в Midjourney полностью переработан: параметры вроде «фотореализм» или «4K» больше не работают, и пользователям придётся переучиваться. Разработчики советуют быть более откровенными в том, чего хотят пользователи. Так, если требуется фотореалистичное изображение, рекомендуется использовать параметр «--style raw». Следует также выбрать нужный баланс параметра «--stylize», значение которого по умолчанию равно «100». Чем меньше значение, тем буквальнее модель воспринимает команду, а с его увеличением растёт эстетический аспект изображения.

 Источник изображения: chrisperna / ***

Источник изображения: chrisperna / Instagram

Глава Midjourney подчеркнул, что V6 выпущена в рамках альфа-тестирования — её работа может со временем кардинально меняться, и зачастую без предварительного уведомления аудитории. С полноценным выходом модели, выразили надежду разработчики, «вы все почувствуете развитие чего-то более значительного, что глубоко переплетается с силой нашего коллективного воображения». Но пока в Midjourney V6 отсутствуют некоторые функции, которые есть в V5.2, в том числе панорамирование влево и вправо, а также уменьшение масштаба, но в последующих обновлениях они добавятся.

Энтузиаст создал игру в стиле Angry Birds, используя только ChatGPT, DALL-E 3 и Midjourney

Блогер Хави Лопес (Javi Lopez), изучающий возможности нейросетей, рассказал о том, как с помощью одних лишь ChatGPT 4.0, DALL-E 3 и Midjourney создал на Хэллоуин рабочую видеоигру в стиле Angry Birds — Angry Pumpkins.

 Источник изображения: X (Javi Lopez)

Источник изображения: X (Javi Lopez)

Знаменитый мобильный хит Rovio узнаётся в Angry Pumpkins с первого взгляда: схожая эстетика, аналогичный геймплей (злобные тыквы швыряют себя в зелёных монстров) и построенный по тому же принципу заголовок.

Используя текстовые команды, Лопес проинструктировал ChatGPT 4.0 для написания 600 строчек рабочего кода, Midjourney задействовал для создания объектов, персонажей и фонов, а DALL-E 3 подключил для оформления главного меню.

У себя в микроблоге Лопес подробно расписал, какие команды использовал для производства всех графических элементов и программирования, а также приложил ссылку на исходный код целиком.

Создание Angry Pumpkins от начала и до выпуска финальной версии заняло у Лопеса около 10−12 часов: первый прототип был готов очень быстро, а 90 % времени ушло на доработку всяческих мелочей и деталей.

Поиграть в Angry Pumpkins можно по этой ссылке прямо в браузере. В игре отсутствует звук, зато есть инструменты для создания собственных уровней (расположения объектов и монстров).

Лопес считает, что человечество переживает исторический момент, наблюдавшийся лишь в научной фантастике: «Эти новые рабочие процессы, позволяющие создавать что угодно с помощью одного лишь языка, изменят мир».

Представлена приключенческая игра, полностью созданная искусственным интеллектом

Разработчик образовательных и игровых программ, компания Luden.io, у истоков которой стоят выходцы из Nival (Heroes of Might & Magic V), представил новую игру — Generated Adventure. В ней каждый аспект, от художественного оформления и сюжета до диалогов, персонажей, локаций и музыки, был создан с использованием таких инструментов искусственного интеллекта, как Stable Diffusion, Midjourney и ChatGPT.

 Источник изображений: Luden.io

Источник изображений: Luden.io

Generated Adventure представляет собой приключенческую онлайн-игру, созданную, по словам разработчиков, с применением «всех генеративных систем, которые мы смогли найти». Олег Чумаков из Luden.io говорит, что команда задействовала Stable Diffusion и Midjourney при поиске вдохновения и разработке различных игровых объектов, локаций и персонажей.

Поскольку игра была разработана для гейм-джема, посвящённого теме доставки, ChatGPT был использован для создания истории (включая диалоги), вращающейся вокруг возвращения объектов их законным владельцам в созданных разработчиками компактных локациях.

Идея состояла в том, чтобы попытаться создать всю игру, используя системы на основе ИИ, кроме непосредственно движка — им стал Defold, который не требует много ресурсов и полностью готов для работы в интернете. Анимация персонажей была выполнена при помощи Photoshop, так как создать анимационные спрайты с помощью Midjourney у разработчиков не получилось.

«Мы думали, что сможем легко создавать анимационные спрайты с помощью Midjourney. Чтобы избежать проблем с сохранением согласованности художественного стиля, мы попытались сгенерировать один атлас для всех анимаций вроде ходьбы (взгляд спереди и сзади), а также стояния без движения. Не знаю, почему мы предположили, что Midjourney может это сделать», — пояснил Чумаков.

Команда также использовала AIVA, инструмент для написания музыки на основе ИИ. В качестве референса использовался саундтрек Pillars of Eternity II: Deadfire. Чумаков сообщил, что разработка Generated Adventure была завершена всего за 72 часа, и подробно описал весь процесс создания игры в блоге, предоставив информацию о каждом этапе.

По словам Чумакова, самый трудоёмкий аспект работы с Midjourney и Stable Diffusion — поддержание согласованного визуального стиля. Особенно, когда необходимо добавить несколько деталей в общую картину или изменить всего несколько вещей, оставив всё остальное как есть.

В качестве проверки новых инструментов студия давала ИИ задачу сгенерировать такое изображение: «Картина в стиле Dungeons & Dragons с изображением капитана пиратов, который является минотавром с деревянной ногой, вырезанной в виде человека, и держит что-то действительно тяжёлое, как Атлас в архитектуре».

К счастью, недавно команда разработчиков Midjourney представила функцию, извлекающую визуальный стиль из изображения, предоставленного по ссылке. Это значительно облегчило задачу поддержания единого дизайна игровых локаций и персонажей.

Разработчики уверяют, что им было очень весело, и они получили огромное удовольствие во время производства Generated Adventure. Больше всего команду поразило огромное количество вопросов от других разработчиков. Похоже, тема генерации ассетов с помощью ИИ предельно интересна создателям видеоигр.

Нейросеть для создания картинок Midjourney перестала быть бесплатной — из-за злоупотреблений с дипфейками

Компания Midjourney закрыла бесплатный доступ к своей одноимённой нейросети, которая позволяет генерировать изображения по текстовому описанию. Произошло это после того, как пользователи стали активно использовать нейросеть для создания дипфейков с участием знаменитых личностей.

 Источник изображения: Midjourney

Источник изображения: Midjourney

Основатель и исполнительный директор Midjourney Дэвид Хольц (David Holz) в официальном канале Discord сообщил, что компания закрывает программу бесплатного пробного периода «из-за чрезвычайного спроса, а также из-за злоупотреблений в его использовании со стороны пользователей». По словам Хольца, новые правила безопасности использования нейросети Midjourney оказались «недостаточными» для предотвращения случаев неправильного использования ИИ-генератора изображений во время пробного периода. Отныне пользователи Midjourney должны будут платить по $10 в месяц за возможность пользоваться технологией.

Как пишет издание The Washington Post, Midjourney в последнее время оказалась в центре нежелательного внимания. Пользователи, используя указанную нейросеть, начали создавать фейковые изображения с арестом бывшего президента США Дональда Трампа, а также изображения Папы римского Франциска, разгуливающего в модном пуховике. Хотя указанные изображения быстро разоблачили как фейки, злоумышленники могут использовать генеративные нейросети вроде Midjourney, DALL-E от OpenAI и аналогичные для распространения дезинформации в Сети.

Midjourney признала, что правила использования ИИ-алгоритмов для создания изображений требуют доработок. В 2022 году Хольц запретил использовать Midjourney для создания дипфейков с китайским лидером Си Цзиньпинем. Он объяснил это тем, что доступ на китайский рынок для компании важнее возможности для пользователей создавать сатирический контент. В этот четверг Хольц в разговоре с пользователями в Discord посетовал, что формирование политики в отношении создания ИИ-контента с помощью Midjourney ещё сильнее усложнилось тем фактом, что ИИ теперь способен создавать ещё более реалистичные изображения. Несмотря на это, компания продолжит совершенствовать модерацию ИИ-контента и выявлять случаи злоупотребления в его создании, добавил он.

Некоторые разработчики нейросетей для генерации изображений уже ввели более строгие правила, связанные с их использованием. Например, OpenAI запретила создавать любые изображения, которые каким-либо образом были бы связаны с текущими политическими событиями, политиками и теориями заговоров. Она также запретила контент, связанный с ненавистью, насилием и сексом. Впрочем, другие пока придерживаются более свободных правил. Stability AI не позволяет нейросети Stable Diffusion копировать стили или создавать так называемые «не безопасные для работы» изображения. Однако в целом компания не диктует пользователям, какие изображения можно или нельзя создавать.

Российская Caviar привлекла нейросети ChatGPT и Midjourney к созданию iPhone 14 Pro AI Design

Российский бренд Caviar, занимающийся люксовой кастомизацией смартфонов и умных аксессуаров, создал серию гаджетов AI Design, поставив творческую задачу передовым нейросетям: за формирование текстовых описаний дизайна отвечала ChatGPT, а за создание качественных цифровых изображений — Midjourney.

 Источник изображения: Caviar

Источник изображения: Caviar

Компания Caviar, использующая для своих продуктов дорогие матераилы, драгоценные металлы и камни, заложила основу стиля neuroluxe, став пионером в применении оформительских решений ИИ при создании облика смартфонов. В компании сообщают, что речь идёт о первой в мире luxury-коллекции, создание продуктов которой выполнялось нейросетями. Caviar заявляет, что стала первой компанией, запустившей в производство модели, дизайн которых разработан нейросетями — ранее это не удавалось из-за технических сложностей, обусловленных проблемами воплощения генеративного дизайна в жизнь.

По данным Caviar, чат-бот ChatGPT использовали для формирования технического задания для Midjourney, а последняя уже оформила их в визуальные образы. «Как приглашённый арт-директор Caviar, я горжусь нашей совместной работой над коллекцией AI Design, в рамках которой Caviar впервые включила искусственный интеллект в творческий процесс компании. Вместе мы смогли раздвинуть границы дизайна и создать по-настоящему новаторский проект», — цитирует компания слова, сгенерированные ChatGPT.

 Источник изображения: Caviar

Источник изображения: Caviar

Коллекция AI Design состоит из трёх кастомных iPhone 14 Pro, ставших «зеркалом мира роскоши». Модель Magnum является образом Rolls-Royce, воплощённом в iPhone, вариант Skyline «отдаёт дань архитектурным изысканиям Захи Хадид», известной благодаря параметрическому дизайну зданий и знаменитой по всему миру.

 Источник изображения: Caviar

Источник изображения: Caviar

Наконец, главным сокровищем коллекции стала модель Emir, по данным Caviar, названная в честь владельца самой большой яхты в мире — Халифа ибн Заид ибн Султан Аль Нахайян, эмира Абу-Даби и второго президента ОАЭ. Как и у остальных моделей серии, корпус смартфона выполнен из авиационного титана, фигурные вырезы покрывает 24-каратное золото.

 Источник изображения: Caviar

Источник изображения: Caviar

iPhone 14 Pro Magnum со 128 Гбайт постоянной памяти стоит 409 тыс. рублей, самая дорогая версия — Emir обойдётся в 429 тыс. рублей. Более того, клиентам уже предложили заказывать нейродизайн в соответствии с их предпочтениями — Caviar берётся воплотить творения в стиле neuroluxe в жизнь.

Генеративная нейросеть MidJourney для создания изображений по текстовому описанию обновилась до пятой версии

Разработчики представили пятую версию системы генеративного искусственного интеллекта MidJourney, способную создавать изображения по текстовым описаниям. В настоящий момент новая версия генеративной ИИ-сети доступна в рамках программы альфа-тестирования для тех, кто подписан на сервис MidJourney. Подписку можно оформить в официальном канале разработчиков в Discord.

 Источник изображений: MidJourney

Источник изображений: MidJourney

По словам графического дизайнера Джули Виланд (Julie Wieland), часто публикующей в Twitter изображения, созданные с помощью MidJourney, генеративная сеть MidJourney v5 научилась создавать практически фотореалистичные изображения.

«MJ v5 ощущается так, как будто вы наконец-то надели очки после того, как долго страдали от недостатка зрения. Неожиданно всё вокруг вы видите, как в 4K. Это одновременно ошеломляет и удивляет», — прокомментировала Виланд.

Виланд, давно наблюдающая за развитием генеративной сети MidJourney, поделилась изображениями, демонстрирующими прогресс в её эволюции. Её первая версия была представлена в марте 2022 года. До третьей версии генеративная сеть добралась в августе, а четвёртая версия была представлена в ноябре. Ниже представлены примеры, демонстрирующие прогресс в развитии этой технологии. С каждым новым поколением нейросеть училась создавать более сложные и детализованные изображения.

 MidJourney v3 (слева), MidJourney v4 (в центре) и MidJourney v5 (справа)

MidJourney v3 (слева), MidJourney v4 (в центре) и MidJourney v5 (справа)

MidJourney работает по тому же принципу, согласно которому работают другие генеративные системы искусственного интеллекта, вроде Stable Diffusion и DALL-E. Они создают изображения на основе заданного текстового описания (промта), используя ИИ-модель, обученную на основе миллионов изображений, созданных людьми.

За день экспериментов MidJourney v5 Виланд пришла к выводу, что нейросеть значительно продвинулась вперёд. Она научилась «невероятно реалистично» передавать текстуру кожи и черты лица, создаёт более реалистичное и кинематографическое освещение, лучше передаёт отражения, блики и тени, выбирает более выразительные ракурсы и общий план, «а глаза научилась создавать практически идеально».

Также MidJourney v5 научилась лучше рисовать руки и зубы. В описании к MidJourney v5 указывается, что генеративная система искусственного интеллекта получила расширенный стилистический диапазон, у неё повышена отзывчивость на запросы, разрешение сгенерированных изображений увеличено в два раза. Кроме того, улучшены динамический диапазон и детализация.

Картинкам, сгенерированным ИИ, отказали в защите авторских прав

Бюро авторского права США пересмотрело решение о защите авторских прав на комикс «Рассветная заря» (Zarya of the Dawn) художницы Кристины Каштановой (Kristina Kashtanova). Изображения в этом произведении были созданы системой генеративного искусственного интеллекта Midjourney по текстовому описанию.

 Источник изображения: Kris Kashtanova

Источник изображения: Kris Kashtanova

Ведомство постановило, что госпожа Каштанова «является автором текста произведения, а также отбора, согласования и организации текстовых и визуальных элементов произведения». Однако представленные в комиксе изображения «не являются продуктом за авторством человека», и первоначально выданная регистрация авторских прав была отозвана. Бюро сослалось на прецеденты, когда люди не смогли оформить защиту на тексты и песни, авторами которых указывались «не являющиеся людьми духовные существа» — аналогичное решение было вынесено по селфи, которое сделала обезьяна.

Чиновники пояснили, что об авторстве Midjourney стало известно только после регистрации произведения — сведения об этом Каштанова сама опубликовала в социальных сетях, а название ИИ-системы фигурировало только на обложке комикса. Таким образом, свидетельство было выдано на основании «неточной и неполной информации», поэтому его пришлось аннулировать. Госпожа Каштанова выразила разочарование решением ведомства — по её мнению, произведение должно быть защищено авторским правом, если только оно не создано ИИ в полной мере. В бюро с её выводами не согласились и также отвергли утверждение, что авторское право может быть зарегистрировано на основании того, что созданные ИИ изображения подвергались последующей корректировке человеком: эти правки либо были незначительными, либо их объём вообще нельзя было установить на основе предоставленной информации.

«Мои адвокаты изучают наши варианты, чтобы разъяснить Бюро авторского права, как отдельные изображения, созданные Midjourney, являются прямым выражением моего творчества и тем самым подлежат защите авторским правом», — заключила Кристина Каштанова.


window-new
Soft
Hard
Тренды 🔥
ИИ убьёт классические колл-центры в течение года, считают в их руководстве 4 мин.
Продажи средневековой градостроительной стратегии Manor Lords превысили миллион копий спустя сутки после релиза 47 мин.
Thoma Bravo купит за $5,3 млрд британского разработчика ИИ-решений для ИБ Darktrace 3 ч.
Positive Technologies увеличила в I квартале 2024 года объём отгрузок в 1,5 раза 4 ч.
Новая статья: XDefiant — любопытный конкурент Call of Duty. Превью по техническому тестированию 15 ч.
Новая статья: Gamesblender № 671: подробности Kingdom Come: Deliverance 2, Stellar Blade без цензуры и релиз Unreal Engine 5.4 15 ч.
Росту выручки Microsoft в III финансовом квартале способствовало облако и ИИ 17 ч.
Microsoft исправила поиск в Windows 10 — наконец-то он будет искать то, что надо 23 ч.
Программный комплекс Tarantool получил сертификат ФСТЭК России по 4-му уровню доверия 23 ч.
Госдума рассмотрит запрет на «организацию обращения криптовалют» с 1 сентября 2024 года 24 ч.