Сегодня 01 октября 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Новая модель OpenAI CriticGPT обучена «критиковать» результаты GPT-4

Компания OpenAI представила CriticGPT — новую модель искусственного интеллекта, предназначенную для выявления ошибок в коде, сгенерированном непосредственно ChatGPT. CriticGPT будет использоваться в качестве алгоритмического помощника для тестировщиков, которые проверяют программный код, выданный ChatGPT.

 Источник изображения: Copilot

Источник изображения: Copilot

Согласно новому исследованию «LLM Critics Help Catch LLM Bugs», опубликованному OpenAI, новая модель CriticGPT создана как ИИ-ассистент для экспертов-тестировщиков, проверяющих программный код, сгенерированный ChatGPT. CriticGPT, основанный на семействе большой языковой модели (LLM) GPT-4, анализирует код и указывает на потенциальные ошибки, облегчая специалистам обнаружение недочётов, которые в противном случае могли бы остаться незамеченными из-за человеческого фактора. Исследователи обучили CriticGPT на наборе данных с образцами кода, содержащими намеренно внесённые ошибки, научив его распознавать и отмечать различные погрешности.

Учёные обнаружили, что в 63-% случаев, связанных с естественно возникающими ошибками LLM, аннотаторы предпочитали критику CriticGPT человеческой. Кроме того, команды, использующие CriticGPT, писали более полные отзывы, чем люди, не использующие этого ИИ-помощника, при этом снижался уровень конфабуляций (ложных фактов и галлюцинаций).

Разработка автоматизированного «критика» включала обучение модели на большом количестве входных данных с намеренно внесёнными ошибками. Экспертов просили модифицировать код, написанный ChatGPT, внося ошибки, а затем предоставлять результат с якобы обнаруженными багами. Этот процесс позволил модели научиться выявлять и критиковать различные типы ошибок в коде.

В экспериментах CriticGPT продемонстрировал способность улавливать как внесённые баги, так и естественно возникающие ошибки в результатах ответов ChatGPT. Исследователи также создали новый метод «Force Sampling Beam Search» (FSBS), который помогает CriticGPT писать более детальные обзоры кода, позволяя регулировать тщательность поиска проблем и одновременно контролируя частоту ложных срабатываний.

Интересно, что возможности CriticGPT выходят за рамки простой проверки кода. В экспериментах модель применили к множеству тренировочных данных ChatGPT, ранее оцененных людьми как безупречные. Удивительно, но CriticGPT выявил ошибки в 24-% случаев, которые впоследствии были подтверждены экспертами. OpenAI считает, что это демонстрирует потенциал модели не только для работы с техническими задачами, но и подчёркивает её способность улавливать тонкие ошибки, которые могут ускользнуть даже от тщательной проверки человеком.

Несмотря на многообещающие результаты, CriticGPT, как и все ИИ-модели, имеет ограничения. Модель обучалась на относительно коротких ответах ChatGPT, что может не полностью подготовить её к оценке более длинных и сложных задач, с которыми могут столкнуться будущие ИИ-системы. Команда исследователей признаёт, что модель наиболее эффективна в обнаружении ошибок, которые могут быть определены в одном конкретном, узком месте кода. Однако реальные ошибки в выводе AI могут часто быть разбросаны по нескольким частям ответа, что представляет собой вызов для будущих итераций модели.

Кроме того, хотя CriticGPT снижает уровень конфабуляций, он не устраняет их полностью, и люди-эксперты по-прежнему могут совершать ошибки на основе этих ложных данных.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
ФИФА анонсировала первую FIFA после ухода Electronic Arts — это футбольная аркада FIFA Heroes для консолей и мобильных телефонов 3 мин.
Microsoft обновила иконки Office — они стали объёмнее и красочнее 16 мин.
Подписка Microsoft 365 Premium теперь доступна всем — Office, GPT-5 и другие ИИ-функции за $20 в месяц 25 мин.
«Тектонический сдвиг»: у Microsoft появится второй гендир — текущий сосредоточится на технических вопросах 38 мин.
«Любим вас больше, чем банкомат — деньги»: хоррор об ужасах долговой ямы CloverPit достиг новой вершины продаж 48 мин.
«Окей, Google, давай пообщаемся»: представлен ИИ-помощник Gemini for Home для умного дома 2 ч.
У Assassin's Creed, Far Cry и Rainbow Six теперь новый дом, которым частично владеет Tencent — Ubisoft представила Vantage Studios 2 ч.
Microsoft вывела Xbox Cloud Gaming из беты, подтянула графику до 1440p и повысила битрейт 3 ч.
Meta начнёт использовать чаты пользователей с ИИ, чтобы продавать ещё более персонализированную рекламу 3 ч.
Ultimate за $30, ПК-игры и Xbox Cloud Gaming для всех: Microsoft анонсировала масштабные изменения в Game Pass 3 ч.
Китай запустил самую мощную в мире центрифугу для экспериментов над пространством и временем 20 мин.
Apple приступила к разработке гарнитуры Vision Pro 2, подтвердила свежая утечка 2 ч.
Asus оценила GeForce RTX 5080 Hatsune Miku Edition в $1900 — на 90 % дороже рекомендованной цены 2 ч.
OpenAI построит ИИ ЦОД Stargate в Южной Корее, а Samsung поможет ей создать плавучие дата-центры 3 ч.
OpenAI объединится с Samsung и SK hynix, чтобы удовлетворить потребность в памяти для ИИ-мегапроекта Stargate 3 ч.
Oura представила керамические умные кольца Ring 4 за $499, зарядный футляр за $99 и медицинский сервис за $99 3 ч.
Сегодня в России отмечается День работников отрасли ЦОД 4 ч.
Selectel проведёт ежегодную флагманскую конференцию Selectel Tech Day 2025 в Москве 4 ч.
Паукообразный робот Charlotte будет возводить по дому в день — и на Луне тоже 4 ч.
Crucial выпустила самую быструю память LPCAMM2 LPDDR5X для ноутбуков — 8533 МТ/с 4 ч.