Сегодня 13 июня 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → водяной знак

ИИ-модель Google Gemini 2.0 Flash оказалась на удивление хороша в удалении водяных знаков с изображений

Некоторые новейшие «экспериментальные» функции модели Gemini 2.0 Flash от Google вызывают нешуточные опасения у многих пользователей. В частности, модель показала «очень качественные» результаты при удалении водяных знаков с изображений.

 Источник изображений: Google

Источник изображений: Google

Gemini 2.0 Flash умеет не только генерировать изображения по текстовому запросу, но и редактировать их в соответствии с указаниями пользователя — примеры опубликованы на Reddit. На днях обнаружилось, что модель с высокой точностью может удалять водяные знаки. Это поведение радикально отличается от модели GPT-4o от OpenAI, которая запросы на удаление водяных знаков отклоняет.

Ранее уже существовали такие инструменты, как Watermark Remover.io, который умеет удалять водяные знаки со стоковых фотографий, а исследовательская группа Google создала в 2017 году подобный алгоритм, чтобы подчеркнуть необходимость более надёжной защиты авторских прав на изображения.

Gemini 2.0 Flash, похоже, лучше всех проявила себя при удалении сложных водяных знаков, такие как штампы Getty Images, и смогла качественно восстановить изображение. Конечно, после удаления водяного знака модель добавляет метку SynthID, фактически заменяя знак авторского права на «отредактировано с помощью ИИ». Но метки ИИ довольно легко удаляются при помощи другого ИИ, что ранее было продемонстрировано инструментом стирания объектов от Samsung.

По сообщениям пользователей, облегчённая Gemini 2.0 Flash также умеет добавлять узнаваемые изображения реальных людей на фотографии, чего не позволяет полная модель Gemini.

На данный момент описанные возможности доступны только разработчикам через AI Studio — общедоступный бот Gemini отказывается убирать защитные знаки, как показано на скриншоте выше. Google не ответила на запросы о наличии защиты от возможных злоупотреблений после выхода модели в открытый доступ.

Google начнёт помечать фотографии пользователей, в которые «вмешался» ИИ

Приложение «Google Фото» начнёт использовать цифровые водяные знаки SynthID для фотографий, отредактированных с помощью генеративного искусственного интеллекта (ИИ). По заявлению Google, новая функция предназначена для облегчения идентификации изображений, которые были изменены с помощью инструмента Reimagine в Magic Editor.

 Источник изображений: Google

Источник изображений: Google

Magic Editor позволяет легко редактировать фотографии через текстовые запросы, добавляя или удаляя различные детали. Хотя сами по себе ИИ-инструменты не представляют угрозы, Magic Editor может создавать неправомерные компиляции, например разбившиеся вертолёты, сцены аварий, причём без явных меток, указывающих на то, что изображение было изменено.

Водяные знаки призваны решить эту проблему. Однако SynthID визуально не изменяет изображение и чтобы понять, что оно было отредактировано ИИ, придётся дополнительно использовать функцию проверки «Об изображении». Более того, Google признаёт, что некоторые небольшие изменения, выполненные через Magic Editor, могут быть настолько незначительными, что SynthID не сможет идентифицировать эти изменения и применить маркировку.

Эксперты отмечают, что хотя водяные знаки могут помочь в идентификации компиляций, этой технологии недостаточно для масштабной проверки контента, созданного нейросетями. Для надёжности потребуется использовать целый комплекс подходов и программных средств.

Отметим, что система водяных знаков используется в нейросети Google Imagen AI, которая генерирует изображения на основе текста. Аналогичные инструменты были разработаны и другими компаниями, например, функция Content Credentials компании Adobe защищает от несанкционированного доступа к метаданным и позволяет авторам добавлять информацию о себе.

Технология SynthID была разработана командой DeepMind и представляет собой цифровой метатег, встроенный в изображения, видео, аудио или текст. Этот тег позволяет идентифицировать, были ли файлы созданы или изменены с помощью ИИ.

OpenAI научилась распознавать сгенерированные своим ИИ изображения, но не без ошибок

OpenAI объявила о начале разработки новых методов определения контента, созданного искусственным интеллектом (ИИ). Среди них — новый классификатор изображений, который определяет, было ли изображение сгенерировано ИИ, а также устойчивый к взлому водяной знак, способный маркировать аудиоконтент незаметными сигналами.

 Источник изображения: Placidplace / Pixabay

Источник изображения: Placidplace / Pixabay

Новый классификатор изображений способен с точностью до 98 % определять, было ли изображение создано ИИ-генератором изображений DALL-E 3. Компания утверждает, что их классификатор работает, даже если изображение было обрезано, сжато или была изменена его насыщенность. В то же время эффективность этой разработки OpenAI в распознавании контента, созданного другими ИИ-моделями, такими как Midjourney, значительно ниже — от 5 до 10 %.

Также OpenAI ввела водяные знаки для аудиоконтента, созданного с помощью своей платформы преобразования текста в речь Voice Engine, находящейся на стадии предварительного тестирования. Эти водяные знаки содержат информацию о создателе и методах создания контента, что значительно упрощает процесс проверки их подлинности.

OpenAI активно участвует в работе Коалиции по происхождению и аутентичности контента (C2PA), в состав которой также входят такие компании, как Microsoft и Adobe. В этом месяце компания присоединилась к руководящему комитету C2PA, подчеркивая свою роль в разработке стандартов прозрачности и подлинности цифрового контента.

Для этих целей OpenAI интегрировала в метаданные изображений так называемые учётные данные контента от C2PA. Эти учётные данные, фактически являясь водяными знаками, включают информацию о владельце изображения и способах его создания. OpenAI уже много лет работает над обнаружением ИИ-контента, однако в 2023 году компании пришлось прекратить работу программы, определяющей текст, сгенерированный ИИ, из-за её низкой точности.

Разработка классификатора изображений и водяного знака для аудиоконтента продолжается. В OpenAI подчёркивают, что для оценки эффективности этих инструментов крайне важно получить отзывы пользователей. Исследователи и представители некоммерческих журналистских организаций имеют возможность протестировать классификатор изображений на платформе доступа к исследованиям OpenAI.


window-new
Soft
Hard
Тренды 🔥
Epic Games продолжает борьбу против читеров в Fortnite — студия подала в суд на разработчика и продавцов программ Sincey Cheats и Vanta Cheats 34 мин.
Чемоданный ИИ: в Китае придумали, как обучать модели на чипах Nvidia, которые нельзя ввезти в страну 51 мин.
«Хотим создать нечто действительно особенное»: Heroes of Might & Magic: Olden Era не выйдет в раннем доступе летом 2 ч.
Techland пообещала не бросать Dying Light 2 Stay Human из-за Dying Light: The Beast — у студии ещё «много очень и очень крутых идей» для игры 3 ч.
Несмотря на громкие провалы, Sony всё ещё нацелена на создание «разнообразных и устойчивых» игр-сервисов 5 ч.
Гейминг на Mac вышел на новый уровень: Steam наконец получил нативную поддержку процессоров Apple 5 ч.
Агрессивный план отменяется: Sony продолжит «очень вдумчиво» переносить эксклюзивы PlayStation на ПК 6 ч.
Google откажется от «мгновенных приложений» для Android, потому что ими почти никто не пользуется 7 ч.
Meta AI показывает всем чужие переписки с интимными подробностями — формально с согласия самих пользователей 10 ч.
Симулятор RoadCraft от авторов MudRunner и SnowRunner показал один из лучших запусков в истории Focus Entertainment 11 ч.
Закат эпохи DDR4: Micron объявила о прекращении выпуска устаревшей памяти 30 мин.
Новозеландцы продали США первый космоплан для суборбитальных полётов 2 ч.
Раскол Intel — вопрос времени: аналитики не верят, что компания справится с кризисом без разделения 3 ч.
Intel отправила на пенсию свои первые настольные и мобильные видеокарты Arc 4 ч.
Сделка Synopsys и Ansys на $35 млрд под угрозой — Китай отложил её одобрение 5 ч.
Intel анонсировала новую волну увольнений — в июне работы лишатся сотрудники Intel Foundry 5 ч.
Скидки сработали: iPhone стал самым продаваемым смартфоном в Китае 7 ч.
Sony призналась, что уже разрабатывает PlayStation 6, — а также новые способы взаимодействия с играми 7 ч.
Garmin выпустила квадратные смарт-часы Venu X1 с большим дисплеем, титановым корпусом и сапфировым стеклом за $799 7 ч.
Microsoft приоткрыла завесу над консолью Xbox следующего поколения, но этого никто не заметил 8 ч.