Сегодня 08 июля 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Разработана система обучения ИИ на повреждённых данных — это защитит от претензий правообладателей

Модели искусственного интеллекта, которые генерируют картинки по текстовому описанию, при обучении на оригинальных изображениях могут их «запоминать», поднимая таким образом вопрос о нарушении авторских прав. Для защиты от претензий со стороны правообладателей была разработана система Ambient Diffusion для обучения моделей ИИ только на повреждённых данных.

 Источник изображения: github.com/giannisdaras

Источник изображения: github.com/giannisdaras

Диффузионные модели — передовые алгоритмы машинного обучения, которые генерируют высококачественные объекты, постепенно добавляя шум в набор данных, а затем обращая этот процесс вспять. Как показали исследования, такие модели способны запоминать образцы из обучающего массива. Эта особенность может иметь неприятные последствия в аспектах конфиденциальности, безопасности и авторских прав. К примеру, если ИИ обучается работе с рентгеновскими снимками, он не должен запоминать изображения конкретных пациентов.

Чтобы избежать этих проблем, исследователи из Техасского университета в Остине и Калифорнийского университета в Беркли разработали фреймворк Ambient Diffusion для обучения диффузионных моделей ИИ только на изображениях, которые были повреждены до неузнаваемости — так практически обнуляется вероятность, что ИИ «запомнит» и воспроизведёт оригинальную работу.

Чтобы подтвердить свою гипотезу, учёные обучили модель ИИ на 3000 изображений знаменитостей из базы CelebA-HQ. При получении запроса эта модель начинала генерировать изображения, почти идентичные оригинальным. После этого исследователи переобучили модель, использовав 3000 изображений с сильными повреждениями — маскировке подверглись до 90 % пикселей. Тогда она начала генерировать реалистичные человеческие лица, которые сильно отличались от оригинальных. Исходные коды проекта его авторы опубликовали на GitHub.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
МТС взялась за разработку собственных видеоигр 8 мин.
Huawei обвинили в копировании ИИ конкурентов — компания всё отрицает 10 мин.
Google открыла Gemini доступ ко всем приложениям на Android и толком не объяснила, как от этого отказаться 12 мин.
«Яндекс» наконец перешёл в прямое управление к участникам «Консорциум.Первый» 17 мин.
«ЗН Цифра» внедрила решения импортонезависимой экосистемы «Базиса» 24 мин.
OpenAI усилила режим секретности, опасаясь утечки передовых ИИ-разработок 30 мин.
Упор на сюжет, жуткие анимации и физическое ощущение ужаса: новые подробности гротескного хоррора Ill 2 ч.
«Romero Games не закрылась»: студия соавтора Doom Джона Ромеро жива, несмотря на отмену нового шутера 3 ч.
Британские СМИ восстали против ИИ-сводок в поиске Google и требуют отключить опцию 4 ч.
Чат-бот Илона Маска Grok стал ещё более «политически некорректным» после обновления 4 ч.
Изменения климата грозят дефицитом чипов — через 10 лет мир столкнётся с нехваткой меди для полупроводников 18 мин.
Intel запустила новую волну сокращений — работы лишатся тысячи специалистов 43 мин.
Gateway расправила плечи — гигантскую солнечную батарею для лунной станции впервые развернули во всю длину 48 мин.
Администрация Трампа опять надавила на Apple за промедление в переносе производства электроники в США 2 ч.
В гонке за лидерство в сфере ИИ поможет инфраструктура, а не хайп 3 ч.
Прибыль Samsung должна упасть впервые с 2023 года, причём сразу на 56 % 3 ч.
Jsaux представила кулер с клипсой для Nintendo Switch 2 4 ч.
Meta заполучила ещё одного крупного специалиста по ИИ — теперь из Apple 7 ч.
Суд не удовлетворил очередную жалобу Apple на запрет продажи в США часов Watch с датчиком содержания кислорода в крови 8 ч.
CoreWeave всё-таки купила оператора ЦОД Core Scientific, но в девять раз дороже, чем когда-то планировала 12 ч.