Сегодня 01 апреля 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Поискового робота OpenAI теперь можно не пускать к себе на сайт

OpenAI сообщила, что администраторы веб-сайтов теперь могут целенаправленно частично или полностью запретить её поисковому роботу GPTBot посещать их ресурсы, указав в служебном файле robots.txt соответствующие директивы.

 Источник изображения: Mariia Shalabaieva / unsplash.com

Источник изображения: Mariia Shalabaieva / unsplash.com

«Веб-страницы, проиндексированные при помощи [робота со значением строки] user-agent GPTBot, потенциально могут использоваться для улучшения будущих моделей и фильтруются с целью удаления источников, требующих платного доступа, известных сбором информации для идентификации личности или содержащих текст, нарушающий наши политики», — говорится в справочном разделе на сайте OpenAI. Для источников, не соответствующих исключающим критериям, «открытие доступа GPTBot к вашему сайту может помочь моделям стать более точными и улучшить их общие возможности и безопасность».

На практике блокировка GPTBot доступа к сайтам — важный шаг, который поможет пользователям интернета отказаться от включения своих персональных данных в массивы информации для обучения больших языковых моделей. В прошлом году платформа DeviantArt внедрила тег NoAI — работы с этой пометкой исключаются из массива обучающих данных ChatGPT.

Обучение ИИ зачастую производится с использованием больших массивов данных, которые собираются в интернете, и разработчики нейросетей пока не раскрывают, какая именно информация для этого используется — непонятно даже, присутствуют ли в списке ресурсов соцсети. Тем временем администрации Reddit и Twitter напрямую выступили против включения их данных в массивы для обучения ИИ — пришлось сделать доступ к API платным.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Разработчики Palworld анонсировали симулятор свиданий по мотивам игры, и это не шутка — трейлер Palworld! More Than Just Pals 41 мин.
В новых Android-смартфонах нашли вирус, который угоняет аккаунты Telegram и ворует криптовалюту 2 ч.
Wizards of the Coast заблокировала мод по Baldur’s Gate 3 для Stardew Valley, но у истории «хорошая концовка» 2 ч.
Стало известно, какие iPhone не смогут обновиться до iOS 19 3 ч.
Copilot+PC на чипах Intel и AMD наконец получили новые ИИ-функции для Paint, «Фото» и не только 3 ч.
Настольная карточная игра Riftbound по League of Legends вышла из тени — подробности международного запуска 3 ч.
Завирусившийся новый генератор изображений в ChatGPT стал доступен всем пользователям 3 ч.
OpenAI привлекла $40 млрд инвестиций от «синдиката инвесторов» — деньги пойдут на создание AGI 4 ч.
OpenAI привлекла рекордные $40 млрд — капитализация достигла $300 млрд 4 ч.
«Он смотрит в прошлое»: глава Take-Two объяснил, почему ИИ никогда не создаст собственную GTA VI 4 ч.
Microsoft вновь заявила о намерении сотрудничать с OpenAI несмотря на план по замедлению экспансии ЦОД 6 мин.
XenData представила 1U-устройство Z20 на базе Windows 11 Pro для доступа к облачным хранилищам 10 мин.
Asus и Xbox намекнули на совместный выпуск портативной приставки с «новым уровнем гейминга» 11 мин.
Флагманский смартфон Honor Magic 7 стал доступен для предзаказа в России за 109 990 рублей 15 мин.
Минпромторг готовит обязательную маркировку импортной электроники — это может лишить россияне дешёвых гаджетов из-за границы 25 мин.
Первый пациент с Neuralink провёл год с имплантом в голове — побочных эффектов нет 2 ч.
Samsung назначила нового второго гендиректора — прежде он возглавлял мобильное подразделение 3 ч.
Новый глава Intel пообещал «исправить ошибки прошлого» и «добиться совершенства» 3 ч.
Космический корабль SpaceX Crew Dragon с экипажем отправился в первый полёт над полюсами Земли 4 ч.
Одноплатный компьютер Orange Pi RV получил процессор RISC-V и 8 Гбайт оперативной памяти 4 ч.
Включить темный режим