Сегодня 01 июля 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

OpenAI запустит партнёрскую программу, призванную собирать уникальные данные от сторонних организаций для обучения ИИ

Компания OpenAI объявила о запуске новой партнёрской программы OpenAI Data Partnerships, целью которой является получение уникальных наборов данных от сторонних организаций для обучения своих ИИ-моделей. Эта инициатива направлена на привлечение обширных баз данных, в том числе тех, которых нет в свободном доступе. Отличительной чертой программы является её всеобъемлющий характер: данные не обязательно должны быть количественными или в текстовом формате — программа также открыта для изображений, аудио и видео.

 Источник изображения: Franz26 / Pixabay

Источник изображения: Franz26 / Pixabay

Собираемые данные могут охватывать любую тематику и быть представлены на любом языке, главное требование — они должны отражать человеческое намерение, быть похожими на длинные сочинения или тщательно расшифрованные диалоги. Это позволит OpenAI существенно улучшить такие инструменты, как технологии автоматического распознавания речи, и расширить функциональность ChatGPT, в том числе поддержку голосовых запросов, что сделает взаимодействие с пользователем более естественным.

Проведение тестирования модели в рамках OpenAI Data Partnerships в будущем расширит возможности флагманской нейросети GPT-4 Turbo, которая недавно была обновлена для более содержательных ответов пользователям. Компания сообщает, что уже начала работать с заинтересованными организациями, в том числе с правительством Исландии. С помощью специально подобранных наборов данных OpenAI стремится улучшить способность GPT-4 понимать запросы пользователей на исландском языке.

Частные или государственные организации, желающие участвовать в партнёрской программе OpenAI, могут подать заявку на сайте компании, указав тип и объём предоставляемых данных. Предлагаются два пути передачи данных: первый — это архив Open-Source, который идеально подходит для наборов данных, имеющих отношение к обучению языковых моделей. Однако данные, представленные таким образом, будут доступны всем желающим.

В качестве альтернативы OpenAI предлагает организациям предоставить информацию в виде частных данных, которые будут использованы в обучении собственных ИИ-моделей, включая базовые, точные и пользовательские модели. Этот вариант рекомендуется для компаний и учреждений, которые хотят сохранить конфиденциальность своих данных. OpenAI подчёркивает, что не заинтересована в данных, содержащих персональную или чувствительную информацию.

При реализации этой программы внимание общественности будет приковано к вопросам конфиденциальности, учитывая растущую аудиторию ChatGPT, которая насчитывает около 100 млн активных пользователей еженедельно. Прецеденты, такие как утечка данных, допущенная сотрудниками Samsung, показывают важность обеспечения безопасности информации.

OpenAI заверяет, что не использует генерируемые через свой API данные для обучения собственных ИИ-моделей без явного согласия пользователей. Однако методы обработки и защиты конфиденциальных данных, собранных в рамках партнёрской программы OpenAI Data Partnerships, будут тщательно анализироваться как специалистами, так и широкой общественностью.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Руководство OpenAI признало, что конкуренция за ценные кадры вынуждает его шевелиться 3 ч.
Марк Цукерберг собрал звёздную команду для разработки суперинтеллекта 4 ч.
Microsoft испытала ИИ-доктора MAI-DxO, который ставит диагнозы в 4 раза точнее врачей 8 ч.
The Blood of Dawnwalker, Code Vein 2 и многие другие: анонсирована игровая презентация Bandai Namco Summer Showcase 2025 10 ч.
Комиссионный хаос: Apple изменила правила App Store для ЕС так, что теперь их никто не понимает 10 ч.
«Это был ошибочный выбор»: авторы The Alters подтвердили, что в игру попал ИИ-контент, и объяснили, как так получилось 10 ч.
AMD выпустила драйвер с поддержкой FSR 4 для Monster Hunter Wilds и GTA V Enhanced 11 ч.
Календарь релизов — 1–6 июля: Mecha Break, Dying Light Retouched и девятый сезон Diablo IV 11 ч.
Avanpost: в корпоративном сегменте по-прежнему большей частью полагаются на обычные пароли и LDAP 11 ч.
Надёжный инсайдер раскрыл, когда ждать анонс и релиз следующей Ghost Recon 12 ч.
OpenAI пока не готова активно использовать ускорители Google в своей инфраструктуре 2 ч.
Пять причин полюбить HONOR 400 Pro 3 ч.
Apple не смогла отклонить иск Министерства юстиции США о монополии на рынке смартфонов 4 ч.
Новая статья: Обзор Core Ultra 7 265K: гадкий утёнок 9 ч.
В России вышло игровое кресло Filum FL-CH-G-070 с надёжной конструкцией и эргономичной посадкой 9 ч.
ИИ создаст спрос на передовые чипы: выпуск 7-нм и более тонких полупроводников вырастет на 69 % к 2028 году 9 ч.
Google подключит серверы к термоядерному реактору Commonwealth Fusion Systems 10 ч.
В деревню, в глушь, на север: московский регион страдает от дефицита мощностей ЦОД, но скоро операторы могут уйти в провинцию 10 ч.
Дубай стал на шаг ближе к запуску аэротакси — Joby Aviation доставила первый серийный электролёт в ОАЭ 14 ч.
Китай через пять лет станет крупнейшим поставщиком чипов в мире с долей рынка в 30 %, несмотря на санкции 15 ч.