Сегодня 08 мая 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

В популярных материалах для обучения нейросетей нашли изображения сексуального насилия над детьми

Исследователи из Стэнфорда обнаружили, что популярный набор данных LAION-5B, используемый для обучения моделей генеративного искусственного интеллекта, и применявшийся для Stable Diffusion и Google Imagen, включает в себя сотни ссылок на материалы сексуального насилия над детьми (Child Sexual Abuse Material — CSAM). Установлено, что LAION-5B включал по меньшей мере 1679 нелегальных изображений, взятых из постов в социальных сетях и популярных сайтов для взрослых.

 Источник изображения: LAION

Источник изображения: LAION

Исследователи начали изучение набора данных LAION в сентябре 2023 года, стремясь выяснить, используются ли там материалы с сексуальным насилием над детьми. С этой целью хеши или идентификаторы изображений отправлялись на платформы обнаружения CSAM, такие как PhotoDNA, и в Канадский центр защиты детей.

Исследователи из Стэнфорда отметили, что наличие CSAM в наборе данных для обучения ИИ не обязательно негативно повлияет на результаты обученных моделей. Тем не менее, всегда есть вероятность, что модель использует что-то из незаконных материалов при генерации изображений. «Наличие повторяющихся идентичных случаев CSAM также является проблематичным, особенно из-за увеличения вероятности получения изображений конкретных жертв», — говорится в отчёте.

LAION, некоммерческая организация, которая управляет набором данных, сообщила, что придерживается политики «нулевой терпимости» к вредоносному контенту и временно удалит наборы данных из Сети. Согласно сайту LAION, набор данных не является непосредственно репозиторием изображений. Он представляет собой результат индексирования ресурсов интернета и содержит ссылки на изображения и замещающий текст.

Stability AI сообщила, что внутренние правила компании запрещают неправомерное использование её платформ. Компания утверждает, что при обучении своих моделей на наборе данных LAION-5B, она использовала лишь часть материалов, которые отбирались в том числе и с учётом безопасности.

Эксперты полагают, что будет сложно полностью удалить проблемный контент из моделей ИИ, обученных на нём. Они рекомендуют подождать, чтобы модели, обученные на LAION-5B, такие как Stable Diffusion 1.5, «устарели, а распространение прекратилось там, где это возможно». Google выпустила новую версию Imagen, но не раскрыла, на каком наборе данных она обучалась.

Генеральные прокуроры США призвали Конгресс создать комитет для расследования влияния ИИ на эксплуатацию детей и запретить создание CSAM, генерируемого ИИ.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Electronic Arts косвенно подтвердила, когда выйдет Dragon Age: Dreadwolf 51 мин.
Arkane Austin до последнего работала над обновлениями для Redfall — закрытие студии застало сотрудников врасплох 2 ч.
OpenAI превратит ChatGPT в ИИ-поисковик и будет конкурировать с Google 3 ч.
США пообещали $10 млн за сведения о россиянине, который создал вирус-вымогатель LockBit 3 ч.
OpenAI научилась распознавать сгенерированные своим ИИ изображения, но не без ошибок 4 ч.
Инсайдер раскрыл планы Ubisoft на показ геймплея Assassin’s Creed Codename: Red 4 ч.
Еженедельный чарт Steam: Gray Zone Warfare обошла Counter-Strike 2, а Total War: Warhammer III заняла четыре строчки в топ-10 14 ч.
Смерть ей к лицу: критики вынесли вердикт релизной версии вампирского MMO-экшена V Rising 15 ч.
Owlcat раскрыла, когда выйдет «Танец Масок» — последнее дополнение к Pathfinder: Wrath of the Righteous 16 ч.
Симулятор космической больницы Galacticare отправит спасать галактику по одному пациенту за приём — новый трейлер и дата выхода 17 ч.
IBM представила небольшой сервер POWER S1012 для ИИ-вычислений на периферии 35 мин.
Asus представила 15,6" сенсорный монитор ProArt Display PA169CDV за $1300 и изогнутый 34" дисплей ProArt Display PA34VCNV за $730 41 мин.
«Роскосмос» запустил разработку ядерной энергоустановки для российско-китайской станции на Луне 46 мин.
Первый запуск Boeing Starliner с людьми отложили до 17 мая — ракету увезут в цех для замены кислородного клапана 2 ч.
Apple будет продавать iPad Pro и iPad Air без зарядки в некоторых странах, а ещё без наклеек в виде яблока 2 ч.
Компании Dell исполнилось 40 лет — она начала работу с инвестиций на $1000 3 ч.
Tesla оказалась крупнейшим покупателем лидаров Luminar, хотя Илон Маск вовсю критиковал эту технологию 4 ч.
Новая статья: Обзор TWS-наушников Baseus Eli Sport 1: интересный подход к решению знакомых задач 4 ч.
Дроны Amazon не станут доставлять заказы в жару — это будет время курьеров-людей 4 ч.
EHang продемонстрировала в Абу-Даби беспилотные дроны трёх модификаций: пассажирский, грузовой и пожарный 5 ч.