Сегодня 06 июля 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Поискового робота OpenAI теперь можно не пускать к себе на сайт

OpenAI сообщила, что администраторы веб-сайтов теперь могут целенаправленно частично или полностью запретить её поисковому роботу GPTBot посещать их ресурсы, указав в служебном файле robots.txt соответствующие директивы.

 Источник изображения: Mariia Shalabaieva / unsplash.com

Источник изображения: Mariia Shalabaieva / unsplash.com

«Веб-страницы, проиндексированные при помощи [робота со значением строки] user-agent GPTBot, потенциально могут использоваться для улучшения будущих моделей и фильтруются с целью удаления источников, требующих платного доступа, известных сбором информации для идентификации личности или содержащих текст, нарушающий наши политики», — говорится в справочном разделе на сайте OpenAI. Для источников, не соответствующих исключающим критериям, «открытие доступа GPTBot к вашему сайту может помочь моделям стать более точными и улучшить их общие возможности и безопасность».

На практике блокировка GPTBot доступа к сайтам — важный шаг, который поможет пользователям интернета отказаться от включения своих персональных данных в массивы информации для обучения больших языковых моделей. В прошлом году платформа DeviantArt внедрила тег NoAI — работы с этой пометкой исключаются из массива обучающих данных ChatGPT.

Обучение ИИ зачастую производится с использованием больших массивов данных, которые собираются в интернете, и разработчики нейросетей пока не раскрывают, какая именно информация для этого используется — непонятно даже, присутствуют ли в списке ресурсов соцсети. Тем временем администрации Reddit и Twitter напрямую выступили против включения их данных в массивы для обучения ИИ — пришлось сделать доступ к API платным.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме
Прежде чем оставить комментарий, пожалуйста, ознакомьтесь с правилами комментирования. Оставляя комментарий, вы подтверждаете ваше согласие с данными правилами и осознаете возможную ответственность за их нарушение.
Все комментарии премодерируются.
Комментарии загружаются...

window-new
Soft
Hard
Тренды 🔥
Присутствие индийских смартфонов в России выросло за год в 14 раз 2 мин.
ИИ — это пузырь: чтобы окупить вложения, ИИ-индустрии нужно научиться зарабатывать на порядки больше 2 ч.
LG и Samsung сокращают инвестиции в micro-LED — внедрение технологии забуксовало 5 ч.
Учёные сделали литийметаллические аккумуляторы дружелюбнее к окружающей среде без ухудшения характеристик 8 ч.
Еврокомиссия начала изучать возможные последствия китайской экспансии производства зрелых чипов 11 ч.
Samsung выпустила SSD-накопитель на 61,44 Тбайт и анонсировала модель на 122,88 Тбайт 12 ч.
Atos подпишет окончательное соглашение о реструктуризации на следующей неделе 18 ч.
ChinData заняла $490 млн для рефинансирования малайзийского подразделения 18 ч.
Lian Li выпустила L-образные блоки питания EDGE мощностью до 1300 Вт 21 ч.
Asus выпустила в продажу мини-ПК ROG NUC с процессорами Intel Core Ultra и графикой Nvidia 23 ч.