Сегодня 12 марта 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Больше половины ответов ChatGPT на вопросы по программированию неверны — исследование

В последнее время на фоне ажиотажа вокруг технологий ИИ программисты стали всё чаще обращаться за помощью в написании кода программ к чат-ботам на базе ИИ, таким как ChatGPT от OpenAI, что повлекло за собой снижение посещаемости ресурса Stack Overflow, вынужденного уволить в прошлом году почти 30 % персонала.

 Источник изображения: geralt/Pixabay

Источник изображения: geralt/Pixabay

Как оказалось, полагаться на ИИ в написании программ пока рано. Согласно исследованию команды специалистов Университета Пердью, представленному в этом месяце на конференции Computer-Human Interaction («Взаимодействие компьютера и человека»), 52 % ответов по программированию, сгенерированных ChatGPT, оказались неверны.

В ходе исследования программисты Университета Пердью просмотрели более 517 вопросов в сервисе Stack Overflow и проанализировали ответы на них чат-бота ChatGPT. «Мы обнаружили, что 52 % ответов ChatGPT содержат дезинформацию, 77 % ответов более многословны, чем человеческие ответы, а 78 % ответов характеризуются различной степенью несоответствия ответам людей», — отметили исследователи.

Команда исследователей также провела лингвистический анализ 2000 случайно выбранных ответов ChatGPT и обнаружила, что они «более формальные и аналитические», но при этом отражают «менее негативные настроения» — чем обычно отличается ИИ.

Комментируя результаты исследования, сайт Futurism выразил обеспокоенность тем, что многие программисты предпочитают обращаться за помощью к ChatGPT. Исследователи Университета Пердью опросили 12 программистов и обнаружили, что 35 % респондентов предпочитают полагаться на ответы ChatGPT и не замечают ошибок в ответах, сгенерированных ИИ, в 39 % случаев.

Исследователи допускают, что пользователей подкупает вежливость, проявляемая ИИ. «Последующие полуструктурированные интервью показали, что вежливый язык, чётко сформулированные ответы в стиле учебника, а также полнота являются одними из основных причин, по которым ответы ChatGPT выглядели более убедительными, поэтому участники ослабили бдительность и упустили из виду некоторую дезинформацию в ответах ChatGPT», — сообщили они.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Бывшие разработчики Gothic и Elex анонсировали Rootbound — завязанный на физике экшен с разумным рюкзаком 5 ч.
OpenAI позволит всем желающим создавать ИИ-агентов, которые будут управлять ПК и гулять по интернету 5 ч.
Захватывающая дух метроидвания Forgotlings с графикой ручной работы отправит игроков в мир оживших потерянных вещей — новый трейлер и дата выхода 7 ч.
Бывшая сотрудница Facebook раскрыла тайную систему цензуры, созданную для работы в Китае 7 ч.
BlizzCon возвращается, но не в 2025 году: Blizzard анонсировала BlizzCon 2026 9 ч.
Более $12,5 млрд мошенники похитили у жителей США за 2024 год 9 ч.
Спустя пять лет разработчики Control неожиданно раздали всем владельцам Ultimate Edition костюмы за предзаказ и миссию с Кодзимой 9 ч.
Selectel запустил в облаке сетевой SSD с настраиваемым уровнем производительности 10 ч.
Студия-разработчик Disco Elysium анонсировала новый проект, и это не Disco Elysium 2 — тизер и первые детали шпионской ролевой игры Project [C4] 11 ч.
IBM засудила разработчика эмулятора мейнфреймов LzLabs 13 ч.
Новая статья: Выбираем игровой ноутбук: лучшее, что можно купить в российской рознице в первой половине 2025 года 3 ч.
Meta начала тестирование собственного ускорителя для обучения ИИ-моделей 5 ч.
Новая статья: Целеустремлённый ИИ: видит и цель, и препятствия 5 ч.
В Красном море повреждён очередной интернет-кабель — на ремонт пострадавшей системы Peace уйдут месяцы 6 ч.
Завалившийся на бок аппарат «Афина» заточил в себе маленький луноход и сорвал первый 4G-звонок с Луны 9 ч.
RuVDS развернул вычислительные мощности в Краснодаре 9 ч.
25 марта в России начнутся продажи смартфонов Realme 14 Pro, меняющих цвет на холоде 9 ч.
AMD представила EPYC Embedded 9005: до 192 ядер Zen 5(c), расширенная поддержка и высокая надёжность 9 ч.
«Излишне мощный Mac»: опубликованы обзоры Mac Studio на чипах M4 Max и M3 Ultra 9 ч.
Oppo показала, как четыре самых тонких складных смартфона в мире выдержали вес человека 10 ч.