Сегодня 03 октября 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

OpenAI запустит партнёрскую программу, призванную собирать уникальные данные от сторонних организаций для обучения ИИ

Компания OpenAI объявила о запуске новой партнёрской программы OpenAI Data Partnerships, целью которой является получение уникальных наборов данных от сторонних организаций для обучения своих ИИ-моделей. Эта инициатива направлена на привлечение обширных баз данных, в том числе тех, которых нет в свободном доступе. Отличительной чертой программы является её всеобъемлющий характер: данные не обязательно должны быть количественными или в текстовом формате — программа также открыта для изображений, аудио и видео.

 Источник изображения: Franz26 / Pixabay

Источник изображения: Franz26 / Pixabay

Собираемые данные могут охватывать любую тематику и быть представлены на любом языке, главное требование — они должны отражать человеческое намерение, быть похожими на длинные сочинения или тщательно расшифрованные диалоги. Это позволит OpenAI существенно улучшить такие инструменты, как технологии автоматического распознавания речи, и расширить функциональность ChatGPT, в том числе поддержку голосовых запросов, что сделает взаимодействие с пользователем более естественным.

Проведение тестирования модели в рамках OpenAI Data Partnerships в будущем расширит возможности флагманской нейросети GPT-4 Turbo, которая недавно была обновлена для более содержательных ответов пользователям. Компания сообщает, что уже начала работать с заинтересованными организациями, в том числе с правительством Исландии. С помощью специально подобранных наборов данных OpenAI стремится улучшить способность GPT-4 понимать запросы пользователей на исландском языке.

Частные или государственные организации, желающие участвовать в партнёрской программе OpenAI, могут подать заявку на сайте компании, указав тип и объём предоставляемых данных. Предлагаются два пути передачи данных: первый — это архив Open-Source, который идеально подходит для наборов данных, имеющих отношение к обучению языковых моделей. Однако данные, представленные таким образом, будут доступны всем желающим.

В качестве альтернативы OpenAI предлагает организациям предоставить информацию в виде частных данных, которые будут использованы в обучении собственных ИИ-моделей, включая базовые, точные и пользовательские модели. Этот вариант рекомендуется для компаний и учреждений, которые хотят сохранить конфиденциальность своих данных. OpenAI подчёркивает, что не заинтересована в данных, содержащих персональную или чувствительную информацию.

При реализации этой программы внимание общественности будет приковано к вопросам конфиденциальности, учитывая растущую аудиторию ChatGPT, которая насчитывает около 100 млн активных пользователей еженедельно. Прецеденты, такие как утечка данных, допущенная сотрудниками Samsung, показывают важность обеспечения безопасности информации.

OpenAI заверяет, что не использует генерируемые через свой API данные для обучения собственных ИИ-моделей без явного согласия пользователей. Однако методы обработки и защиты конфиденциальных данных, собранных в рамках партнёрской программы OpenAI Data Partnerships, будут тщательно анализироваться как специалистами, так и широкой общественностью.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
«Делаем всё, чтобы каждый покупатель игры был в восторге»: амбициозная песочница с тотальными разрушениями Kingmakers не выйдет 8 октября 36 мин.
ИИ-браузер Comet заставили воровать письма из Gmail и другие данные — в Perplexity только отмахнулась 3 ч.
Геймерскую мышь превратили в шпионский микрофон для прослушки пользователей 3 ч.
Облачный игровой сервис Xbox Cloud Gaming скоро станет бесплатным, но есть нюанс 4 ч.
Слухи: ремейк культовой Halo: Combat Evolved создаётся на гибридном движке при участии студии в ответе за The Elder Scrolls IV: Oblivion Remastered 5 ч.
Microsoft предсказала биологические угрозы «нулевого дня» из-за ИИ 6 ч.
Обнаружена уязвимость, которая ставит под угрозу пользователей всех игр на Unity с 2017 года 7 ч.
Cloudflare обновила robots.txt: теперь сайты могут запретить ИИ-чат-ботам воровать контент 7 ч.
Джефф Безос: ИИ — это «промышленный пузырь», но он поможет человечеству 8 ч.
Боссы в Resident Evil Requiem проверят не навыки стрельбы, а смекалку игроков 10 ч.
В Китае собрали крупнейший в мире плавучий ветрогенератор — его ротор охватывает площадь семи футбольных полей 3 ч.
Samsung представит гарнитуру смешанной реальности на Android XR уже в этом месяце 4 ч.
Thermal Grizzly представила эффективные термопрокладки Minus Pad extreme 2 и очень пластичные Minus Pad High Compression 4 ч.
Kodak впервые за годы выпустила новые плёнки Kodacolor — и сама займётся их продажей 5 ч.
До 2,8 МВт за 45 с: Rolls-Royce представила газовый генератор mtu 20V4000 L64 для дата-центров 6 ч.
UKPN начнёт отапливать дома британских малоимущих кластерами из сотен Raspberry Pi 7 ч.
В лучших ИИ-ускорителях Huawei нашли чипы TSMC, Samsung и SK hynix, которых в Китае быть не должно 8 ч.
Задержки поставок ИИ-чипов в ОАЭ на десятки миллиардов долларов расстраивают NVIDIA 8 ч.
Видео: электромобиль Xiaomi SU7 сам включился и попытался сбежать от хозяев 9 ч.
В MIT на порядок улучшили батарею из бетона — фундамент сможет питать дом в течение суток и дольше 9 ч.