Сегодня 09 мая 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Поискового робота OpenAI теперь можно не пускать к себе на сайт

OpenAI сообщила, что администраторы веб-сайтов теперь могут целенаправленно частично или полностью запретить её поисковому роботу GPTBot посещать их ресурсы, указав в служебном файле robots.txt соответствующие директивы.

 Источник изображения: Mariia Shalabaieva / unsplash.com

Источник изображения: Mariia Shalabaieva / unsplash.com

«Веб-страницы, проиндексированные при помощи [робота со значением строки] user-agent GPTBot, потенциально могут использоваться для улучшения будущих моделей и фильтруются с целью удаления источников, требующих платного доступа, известных сбором информации для идентификации личности или содержащих текст, нарушающий наши политики», — говорится в справочном разделе на сайте OpenAI. Для источников, не соответствующих исключающим критериям, «открытие доступа GPTBot к вашему сайту может помочь моделям стать более точными и улучшить их общие возможности и безопасность».

На практике блокировка GPTBot доступа к сайтам — важный шаг, который поможет пользователям интернета отказаться от включения своих персональных данных в массивы информации для обучения больших языковых моделей. В прошлом году платформа DeviantArt внедрила тег NoAI — работы с этой пометкой исключаются из массива обучающих данных ChatGPT.

Обучение ИИ зачастую производится с использованием больших массивов данных, которые собираются в интернете, и разработчики нейросетей пока не раскрывают, какая именно информация для этого используется — непонятно даже, присутствуют ли в списке ресурсов соцсети. Тем временем администрации Reddit и Twitter напрямую выступили против включения их данных в массивы для обучения ИИ — пришлось сделать доступ к API платным.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Сэм Альтман передал управление ChatGPT новому руководителю, а сам займётся исследованиями 2 ч.
Google защитит пользователей Chrome от фишинга с помощью локальной ИИ-модели Gemini Nano 2 ч.
Microsoft упростит установку приложений в Windows 11, но это может привести к засорению системы 10 ч.
Первое сюжетное дополнение к Kingdom Come: Deliverance 2 не заставит себя долго ждать — новый трейлер и дата выхода Brushes with Death 11 ч.
Meta наделит следующие умные очки Ray-Ban «супервосприятием» — функцией распознавания лиц окружающих 13 ч.
Первый геймплейный трейлер подтвердил дату выхода Mafia: The Old Country — игру будут продавать за $50 13 ч.
ИИ-боты начинают чаще привирать, когда их просят о лаконичных ответах — исследование 14 ч.
Перенос GTA VI прибавил Electronic Arts уверенности в успехе новой Battlefield 14 ч.
Apple начала принимать заявки на компенсации по иску о подслушивании Siri 15 ч.
Saber Interactive «выкатила» системные требования амбициозного симулятора RoadCraft 17 ч.
ASML ускорит строительство нового кампуса, где будет производиться оборудование для выпуска чипов 6 мин.
Продажи Tesla в апреле резко упали как в Китае, так и в Европе 32 мин.
Первая фаза ИИ-кластера xAI Colossus полностью обеспечена энергией 7 ч.
Новая статья: Двумерные полупроводники: ещё один подход к снаряду 8 ч.
Квартальная выручка Arm впервые превысила $1 млрд, но акции упали из-за слабого прогноза 9 ч.
Lenovo возродила 3D-гейминг — представлен ноутбук Legion 9i с RTX 5090, безочковым 3D-экраном и крышкой из кованного углеволокна 10 ч.
Razer выпустила компактные игровые мышь Basilisk Mobile и клавиатуру Joro для мобильного гейминга 10 ч.
Alienware представила тонкие и доступные геймерские ноутбуки Aurora 16 и 16X в сдержанном дизайне 13 ч.
Cadence представила суперкомпьютер Millennium M2000 на базе NVIDIA Blackwell 13 ч.
IBM представила сервер LinuxONE Emperor 5 на платформе Telum II для ИИ-задач 13 ч.