Сегодня 25 июля 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → редактирование изображений

Google научила ИИ-бота Gemini редактировать любые изображения

Google Gemini научился редактировать как сгенерированные ИИ изображения, так и загруженные со смартфона или компьютера. В ближайшие недели новая функциональность станет доступна пользователям в большинстве стран мира, где доступен Gemini, и получит поддержку более чем 45 языков. Россия, напомним, в этот список не входит, однако русский язык Gemini понимает и «говорит» на нём.

 Источник изображений: Google

Источник изображений: Google

Нативное редактирование изображений в ИИ-чат-боте Gemini представляет собой эволюционный шаг в развитии возможностей взаимодействия пользователя с ИИ. Запуск последовал за моделью редактирования изображений с помощью ИИ, которую Google опробовала в марте в своей платформе AI Studio и которая получила широкую огласку благодаря своей спорной способности удалять водяные знаки с любого изображения. Подобно недавно обновлённому инструменту редактирования изображений в ChatGPT, встроенный редактор Gemini теоретически способен достигать более высоких результатов по сравнению с автономными ИИ-генераторами изображений.

Теперь Gemini предлагает инновационный «многоэтапный» процесс редактирования, обеспечивающий, по описанию компании, «более богатые и контекстуальные» отклики на каждый запрос — с интеграцией текста и изображений. Функциональность нового редактора позволяет пользователям изменять фон на изображениях, заменять объекты, добавлять элементы и выполнять множество других операций — и всё это непосредственно в интерфейсе Gemini. Подобное решение существенно упрощает процесс создания и редактирования визуального контента, устраняя необходимость переключаться между несколькими специализированными приложениями.

 Источник изображений: Google

«Например, вы можете загрузить личную фотографию и попросить Gemini сгенерировать изображение того, как вы будете выглядеть с разными цветами волос. Также можно попросить Gemini создать первый черновик сказки на ночь о драконах и сгенерировать иллюстрации к истории», — поясняет Google в своём блоге. Эти примеры наглядно демонстрируют многофункциональность системы, пригодной как для утилитарных, так и для креативных задач.

Потенциальные риски технологии в контексте создания дипфейков обоснованно вызывают опасения у специалистов по информационной безопасности. Чтобы нивелировать возможные злоупотребления, Google внедряет технологию невидимых водяных знаков во все изображения, созданные или отредактированные с помощью нативного генератора изображений Gemini. Параллельно компания проводит экспериментальные исследования по внедрению видимых водяных знаков на всех изображениях, сгенерированных с помощью Gemini.

ИИ-модель Google Gemini 2.0 Flash оказалась на удивление хороша в удалении водяных знаков с изображений

Некоторые новейшие «экспериментальные» функции модели Gemini 2.0 Flash от Google вызывают нешуточные опасения у многих пользователей. В частности, модель показала «очень качественные» результаты при удалении водяных знаков с изображений.

 Источник изображений: Google

Источник изображений: Google

Gemini 2.0 Flash умеет не только генерировать изображения по текстовому запросу, но и редактировать их в соответствии с указаниями пользователя — примеры опубликованы на Reddit. На днях обнаружилось, что модель с высокой точностью может удалять водяные знаки. Это поведение радикально отличается от модели GPT-4o от OpenAI, которая запросы на удаление водяных знаков отклоняет.

Ранее уже существовали такие инструменты, как Watermark Remover.io, который умеет удалять водяные знаки со стоковых фотографий, а исследовательская группа Google создала в 2017 году подобный алгоритм, чтобы подчеркнуть необходимость более надёжной защиты авторских прав на изображения.

Gemini 2.0 Flash, похоже, лучше всех проявила себя при удалении сложных водяных знаков, такие как штампы Getty Images, и смогла качественно восстановить изображение. Конечно, после удаления водяного знака модель добавляет метку SynthID, фактически заменяя знак авторского права на «отредактировано с помощью ИИ». Но метки ИИ довольно легко удаляются при помощи другого ИИ, что ранее было продемонстрировано инструментом стирания объектов от Samsung.

По сообщениям пользователей, облегчённая Gemini 2.0 Flash также умеет добавлять узнаваемые изображения реальных людей на фотографии, чего не позволяет полная модель Gemini.

На данный момент описанные возможности доступны только разработчикам через AI Studio — общедоступный бот Gemini отказывается убирать защитные знаки, как показано на скриншоте выше. Google не ответила на запросы о наличии защиты от возможных злоупотреблений после выхода модели в открытый доступ.

Новая статья: Photoshop не нужен: быстрое редактирование изображений в режиме онлайн

Данные берутся из публикации Photoshop не нужен: быстрое редактирование изображений в режиме онлайн


window-new
Soft
Hard
Тренды 🔥
«История про убийство нацистов всегда в моде»: Amazon запустила в производство сериал по Wolfenstein 3 мин.
Как много чемпионов: Bethesda похвасталась новыми успехами The Elder Scrolls IV: Oblivion Remastered 2 ч.
Google представила экспериментальный ИИ-генератор веб-приложений Opal 2 ч.
Google DeepMind назвал переманивание Meta талантов из других компаний вполне оправданным 3 ч.
Издатель PUBG купил студию разработчиков Last Epoch, чтобы поднять игру «до новых высот» 3 ч.
Режим для двух игроков появится в Elden Ring Nightreign уже на следующей неделе — трейлер и дата выхода горячо ожидаемого обновления 4 ч.
Аудитория ИИ-поиска в Google выросла до 100 миллионов человек в месяц 4 ч.
AdGuard и браузер Brave стали блокировать функцию Microsoft Recall 4 ч.
Правозащитники массово жалуются в Еврокомиссию на Alphabet: Android не даёт удалять приложения Google 5 ч.
ФАС: блогерам не придётся удалять всю старую рекламу в запрещённых соцсетях 5 ч.
«Народные» Ryzen Threadripper 9000 с четырёхканальной памятью и числом ядер до 64 поступят в продажу 31 июля 16 мин.
Китайская Unitree выпустила человекоподобного робота дешевле $6000 2 ч.
Масштабные сокращения в Intel не скажутся на графике выхода процессоров Panther Lake и Nova Lake 2 ч.
Kioxia начала поставки образцов более быстрых 218-слойных чипов TLC-флеш-памяти BiCS 9 3 ч.
Раджа Кодури присоединился к Sandisk, чтобы увеличить память в ИИ-ускорителях до 4 Тбайт 3 ч.
TeamGroup представила предназначенные для Ryzen комплекты DDR5 объёмом 256 Гбайт 3 ч.
SoftBank развернула крупнейшую в мире ИИ-платформу на базе NVIDIA DGX B200 4 ч.
По пути Маска: Crusoe заказала 29 газовых турбин для ИИ ЦОД, часть которых достанется OpenAI 4 ч.
Anthropic: к 2028 году для ИИ в США потребуется 50 ГВт электроэнергии, а для передовых ИИ-моделей — 5-ГВт ЦОД 5 ч.
ASRock представила материнскую плату B850 Challenger для недорогих игровых сборок на Ryzen 5 ч.