Сегодня 26 февраля 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Новая модель OpenAI CriticGPT обучена «критиковать» результаты GPT-4

Компания OpenAI представила CriticGPT — новую модель искусственного интеллекта, предназначенную для выявления ошибок в коде, сгенерированном непосредственно ChatGPT. CriticGPT будет использоваться в качестве алгоритмического помощника для тестировщиков, которые проверяют программный код, выданный ChatGPT.

 Источник изображения: Copilot

Источник изображения: Copilot

Согласно новому исследованию «LLM Critics Help Catch LLM Bugs», опубликованному OpenAI, новая модель CriticGPT создана как ИИ-ассистент для экспертов-тестировщиков, проверяющих программный код, сгенерированный ChatGPT. CriticGPT, основанный на семействе большой языковой модели (LLM) GPT-4, анализирует код и указывает на потенциальные ошибки, облегчая специалистам обнаружение недочётов, которые в противном случае могли бы остаться незамеченными из-за человеческого фактора. Исследователи обучили CriticGPT на наборе данных с образцами кода, содержащими намеренно внесённые ошибки, научив его распознавать и отмечать различные погрешности.

Учёные обнаружили, что в 63-% случаев, связанных с естественно возникающими ошибками LLM, аннотаторы предпочитали критику CriticGPT человеческой. Кроме того, команды, использующие CriticGPT, писали более полные отзывы, чем люди, не использующие этого ИИ-помощника, при этом снижался уровень конфабуляций (ложных фактов и галлюцинаций).

Разработка автоматизированного «критика» включала обучение модели на большом количестве входных данных с намеренно внесёнными ошибками. Экспертов просили модифицировать код, написанный ChatGPT, внося ошибки, а затем предоставлять результат с якобы обнаруженными багами. Этот процесс позволил модели научиться выявлять и критиковать различные типы ошибок в коде.

В экспериментах CriticGPT продемонстрировал способность улавливать как внесённые баги, так и естественно возникающие ошибки в результатах ответов ChatGPT. Исследователи также создали новый метод «Force Sampling Beam Search» (FSBS), который помогает CriticGPT писать более детальные обзоры кода, позволяя регулировать тщательность поиска проблем и одновременно контролируя частоту ложных срабатываний.

Интересно, что возможности CriticGPT выходят за рамки простой проверки кода. В экспериментах модель применили к множеству тренировочных данных ChatGPT, ранее оцененных людьми как безупречные. Удивительно, но CriticGPT выявил ошибки в 24-% случаев, которые впоследствии были подтверждены экспертами. OpenAI считает, что это демонстрирует потенциал модели не только для работы с техническими задачами, но и подчёркивает её способность улавливать тонкие ошибки, которые могут ускользнуть даже от тщательной проверки человеком.

Несмотря на многообещающие результаты, CriticGPT, как и все ИИ-модели, имеет ограничения. Модель обучалась на относительно коротких ответах ChatGPT, что может не полностью подготовить её к оценке более длинных и сложных задач, с которыми могут столкнуться будущие ИИ-системы. Команда исследователей признаёт, что модель наиболее эффективна в обнаружении ошибок, которые могут быть определены в одном конкретном, узком месте кода. Однако реальные ошибки в выводе AI могут часто быть разбросаны по нескольким частям ответа, что представляет собой вызов для будущих итераций модели.

Кроме того, хотя CriticGPT снижает уровень конфабуляций, он не устраняет их полностью, и люди-эксперты по-прежнему могут совершать ошибки на основе этих ложных данных.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
ИИ-агент OpenAI для написания рефератов стал доступен всем платным пользователям ChatGPT 5 мин.
Первый шаг к победе над смертью: бесплатный пролог «Карантин» к Pathologic 3 получил дату выхода и новый трейлер 54 мин.
Резервное копирование с ИИ: Microsoft инвестировала в Veeam 3 ч.
YouTube перестанет показывать рекламу в неподходящие моменты, но меньше её не станет 6 ч.
Yandex B2B Tech запустил платформу для разработчиков SourceCraft, которая должна стать аналогом американской GitLab 10 ч.
Warner Bros. Games отменила боевик Wonder Woman и закрыла три студии, включая Monolith Productions — создателей F.E.A.R. и Middle-earth: Shadow of Mordor 12 ч.
Успех ремейка Silent Hill 2 открыл «польским мастерам хоррора» из Bloober Team дорогу к новой совместной игре с Konami 13 ч.
«Ожидание точно будет того стоить»: Microsoft перенесла Fable на 2026 год и показала геймплей с пинком курицы 15 ч.
Google откажется от SMS-кодов при авторизации в Gmail — их заменят QR-коды 15 ч.
Adobe выпустила полнофункциональный Photoshop для iPhone с платной «Волшебной палочкой» 16 ч.
Продажи электромобилей Tesla в Европе рухнули почти вдвое в январе, хотя рынок вырос на 37 % — в этом замешаны политические амбиции Маска 14 мин.
Космический грузовик «Прогресс МС-28» затопили в Тихом океане после полугода на МКС 23 мин.
Micron первой начала поставлять чипы DDR5, выпущенные по техпроцессу 1γ с EUV-литографией — быстрые, холодные и плотные 43 мин.
Vodafone испытала дроны с лазерными терминалами Google X Taara для организации экстренной связи 2 ч.
Intel представила 200GbE-адаптеры E830 и 10GbE-адаптеры E610 3 ч.
Чехлы Clicks с qwerty-клавиатурой отныне предлагаются для смартфонов Google, Motorola и Samsung 4 ч.
Новая статья: Обзор маршрутизатора Keenetic Giga KN-1012: временный флагман 9 ч.
Новая статья: Жидкостное охлаждение PCCooler DC360 Pro ARGB Display: обои на помпу заказывали? 11 ч.
Framework представила «самый простой в ремонте» ноутбук — модульный, бюджетный и компактный Laptop 12 12 ч.
Intel: 288-ядерные процессоры Xeon 6900E — нишевый продукт 12 ч.