Сегодня 22 ноября 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Разработана система обучения ИИ на повреждённых данных — это защитит от претензий правообладателей

Модели искусственного интеллекта, которые генерируют картинки по текстовому описанию, при обучении на оригинальных изображениях могут их «запоминать», поднимая таким образом вопрос о нарушении авторских прав. Для защиты от претензий со стороны правообладателей была разработана система Ambient Diffusion для обучения моделей ИИ только на повреждённых данных.

 Источник изображения: github.com/giannisdaras

Источник изображения: github.com/giannisdaras

Диффузионные модели — передовые алгоритмы машинного обучения, которые генерируют высококачественные объекты, постепенно добавляя шум в набор данных, а затем обращая этот процесс вспять. Как показали исследования, такие модели способны запоминать образцы из обучающего массива. Эта особенность может иметь неприятные последствия в аспектах конфиденциальности, безопасности и авторских прав. К примеру, если ИИ обучается работе с рентгеновскими снимками, он не должен запоминать изображения конкретных пациентов.

Чтобы избежать этих проблем, исследователи из Техасского университета в Остине и Калифорнийского университета в Беркли разработали фреймворк Ambient Diffusion для обучения диффузионных моделей ИИ только на изображениях, которые были повреждены до неузнаваемости — так практически обнуляется вероятность, что ИИ «запомнит» и воспроизведёт оригинальную работу.

Чтобы подтвердить свою гипотезу, учёные обучили модель ИИ на 3000 изображений знаменитостей из базы CelebA-HQ. При получении запроса эта модель начинала генерировать изображения, почти идентичные оригинальным. После этого исследователи переобучили модель, использовав 3000 изображений с сильными повреждениями — маскировке подверглись до 90 % пикселей. Тогда она начала генерировать реалистичные человеческие лица, которые сильно отличались от оригинальных. Исходные коды проекта его авторы опубликовали на GitHub.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
«Проводник» в Windows 11 будет автоматически загружаться в фоновом режиме, чтобы стать быстрее 2 ч.
Биткоин рухнул вслед за акциями технокомпаний — уже на 40 тыс. меньше исторического максимума 2 ч.
Соцсеть X запустила маркетплейс редких и «спящих» никнеймов 2 ч.
Google опровергла «вводящие в заблуждение» сообщения об обучении ИИ на письмах из Gmail 3 ч.
Хакеры взломали приложение Gainsight и могли похитить данные более двухсот компаний 3 ч.
Россияне стали больше слушать радио после замедления YouTube 3 ч.
Новая статья: Call of Duty: Black Ops 7 — такой «колды» ещё не было. Рецензия 15 ч.
Google теперь использует письма пользователей Gmail для обучения ИИ, но это можно отключить 18 ч.
У Grok сломался регулятор подхалимства к Илону Маску — бот решил, что он совершенен во всём и даже может воскрешать людей 18 ч.
Разработчики Nioh 3 раскрыли системные требования для игры в 1080p с апскейлерами 19 ч.
Китайцы создали EUV-сканер на гармониках — в тысячи раз компактнее «шкафов» ASML 2 ч.
ASUS представила модульную ИИ-систему PE3000N на платформе NVIDIA Jetson Thor T5000 3 ч.
В Microsoft Azure появились инстансы с Intel Xeon 6 и CXL-памятью 3 ч.
Суд намерен устранить монополию Google в онлайн-рекламе пока ен поздно, но скорого успеха не ожидает 3 ч.
В США испытали беспроводное питание для спутников 4 ч.
Японский «заменитель TSMC» получит от местных властей $6,38 млрд на производство 2-нм чипов 6 ч.
Рынок не поверил Хуангу: акции бигтехов обвалились после квартального отчёта Nvidia 8 ч.
Власти США задумались о снятии запрета на поставки ускорителей Nvidia H200 в Китай 9 ч.
По-настоящему космический микроконтроллер STMicroelectronics STM32V8 пропишется в спутниках Starlink: 800 Мгц, защита от радиации и работа при +140 °C 15 ч.
Huawei пообещала флагманам Mate 80 автономность до 14 дней, но чем-то придётся жертвовать 18 ч.