Сегодня 29 января 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → criticgpt

Новая модель OpenAI CriticGPT обучена «критиковать» результаты GPT-4

Компания OpenAI представила CriticGPT — новую модель искусственного интеллекта, предназначенную для выявления ошибок в коде, сгенерированном непосредственно ChatGPT. CriticGPT будет использоваться в качестве алгоритмического помощника для тестировщиков, которые проверяют программный код, выданный ChatGPT.

 Источник изображения: Copilot

Источник изображения: Copilot

Согласно новому исследованию «LLM Critics Help Catch LLM Bugs», опубликованному OpenAI, новая модель CriticGPT создана как ИИ-ассистент для экспертов-тестировщиков, проверяющих программный код, сгенерированный ChatGPT. CriticGPT, основанный на семействе большой языковой модели (LLM) GPT-4, анализирует код и указывает на потенциальные ошибки, облегчая специалистам обнаружение недочётов, которые в противном случае могли бы остаться незамеченными из-за человеческого фактора. Исследователи обучили CriticGPT на наборе данных с образцами кода, содержащими намеренно внесённые ошибки, научив его распознавать и отмечать различные погрешности.

Учёные обнаружили, что в 63-% случаев, связанных с естественно возникающими ошибками LLM, аннотаторы предпочитали критику CriticGPT человеческой. Кроме того, команды, использующие CriticGPT, писали более полные отзывы, чем люди, не использующие этого ИИ-помощника, при этом снижался уровень конфабуляций (ложных фактов и галлюцинаций).

Разработка автоматизированного «критика» включала обучение модели на большом количестве входных данных с намеренно внесёнными ошибками. Экспертов просили модифицировать код, написанный ChatGPT, внося ошибки, а затем предоставлять результат с якобы обнаруженными багами. Этот процесс позволил модели научиться выявлять и критиковать различные типы ошибок в коде.

В экспериментах CriticGPT продемонстрировал способность улавливать как внесённые баги, так и естественно возникающие ошибки в результатах ответов ChatGPT. Исследователи также создали новый метод «Force Sampling Beam Search» (FSBS), который помогает CriticGPT писать более детальные обзоры кода, позволяя регулировать тщательность поиска проблем и одновременно контролируя частоту ложных срабатываний.

Интересно, что возможности CriticGPT выходят за рамки простой проверки кода. В экспериментах модель применили к множеству тренировочных данных ChatGPT, ранее оцененных людьми как безупречные. Удивительно, но CriticGPT выявил ошибки в 24-% случаев, которые впоследствии были подтверждены экспертами. OpenAI считает, что это демонстрирует потенциал модели не только для работы с техническими задачами, но и подчёркивает её способность улавливать тонкие ошибки, которые могут ускользнуть даже от тщательной проверки человеком.

Несмотря на многообещающие результаты, CriticGPT, как и все ИИ-модели, имеет ограничения. Модель обучалась на относительно коротких ответах ChatGPT, что может не полностью подготовить её к оценке более длинных и сложных задач, с которыми могут столкнуться будущие ИИ-системы. Команда исследователей признаёт, что модель наиболее эффективна в обнаружении ошибок, которые могут быть определены в одном конкретном, узком месте кода. Однако реальные ошибки в выводе AI могут часто быть разбросаны по нескольким частям ответа, что представляет собой вызов для будущих итераций модели.

Кроме того, хотя CriticGPT снижает уровень конфабуляций, он не устраняет их полностью, и люди-эксперты по-прежнему могут совершать ошибки на основе этих ложных данных.


window-new
Soft
Hard
Тренды 🔥
YouTube переложил ответственность за трёхчасовую рекламу, которую нельзя пропустить, на блокировщики рекламы 5 ч.
Новый трейлер Kingdom Come: Deliverance 2 показал трудности и радости жизни в средневековой Богемии 5 ч.
«Выглядит лучше двух прошлых DLC вместе взятых»: для Atomic Heart вышло сюжетное дополнение «Чары морских глубин» 7 ч.
Стартовало тестирование восьмого патча для Baldur’s Gate 3 — с кроссплеем, фоторежимом и не для всех 8 ч.
Браузер Microsoft Edge будет подглядывать за пользователем в интернете — исключительно для защиты от мошенников 8 ч.
Ну его, Мексику: масштабный мод Fallout: Nuevo Mexico для Fallout: New Vegas отменён, потому что цена разработки «слишком высока» 9 ч.
Microsoft закроет сайт с обоями и темами для Windows — искать их придётся в Microsoft Store 9 ч.
«Т-банк» импортозаместил сертификаты безопасности Microsoft 10 ч.
Слухи: первые в истории Олимпийские киберспортивные игры отложат вплоть до 2027 года 11 ч.
Игроки в CS:GO и Counter-Strike 2 за всё время открыли свыше 2 млрд кейсов, Valve заработала на этом почти $5 млрд 11 ч.
AMD опровергла слухи, что видеокарта Radeon RX 9070 XT будет стоить $899 3 ч.
Новая статья: Обзор и тестирование 120- и 140-мм вентиляторов DeepCool FT12 и FT14 4 ч.
Прототип сверхзвукового авиалайнера Boom Supersonic XB-1 впервые преодолел скорость звука 4 ч.
ФСБ сертифицировала оборудование для квантовых коммуникаций «ИнфоТеКС» и «СМАРТС-Кванттелеком» — теперь его можно использовать на спецобъектах 4 ч.
Российский электромобиль «Атом» воплотили в предсерийных прототипах и уже тестируют на дорогах 5 ч.
Российское телеком-оборудование подорожало из-за роста цен на компоненты, инфляции и проблем с логистикой 5 ч.
Первый ЦОД Stargate получит собственные газовые турбины, солнечную электростанцию и энергохранилище 5 ч.
В ОАЭ начали тестировать вызов дождя с помощью искусственных молний или нанотехнологий 7 ч.
Nvidia подтвердила вероятность дефицита GeForce RTX 5090 и RTX 5080 на старте продаж 8 ч.
«Рынки ошибаются»: DeepSeek не угрожает NVIDIA и другим американским IT-гигантам 9 ч.