Сегодня 30 мая 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Больше половины ответов ChatGPT на вопросы по программированию неверны — исследование

В последнее время на фоне ажиотажа вокруг технологий ИИ программисты стали всё чаще обращаться за помощью в написании кода программ к чат-ботам на базе ИИ, таким как ChatGPT от OpenAI, что повлекло за собой снижение посещаемости ресурса Stack Overflow, вынужденного уволить в прошлом году почти 30 % персонала.

 Источник изображения: geralt/Pixabay

Источник изображения: geralt/Pixabay

Как оказалось, полагаться на ИИ в написании программ пока рано. Согласно исследованию команды специалистов Университета Пердью, представленному в этом месяце на конференции Computer-Human Interaction («Взаимодействие компьютера и человека»), 52 % ответов по программированию, сгенерированных ChatGPT, оказались неверны.

В ходе исследования программисты Университета Пердью просмотрели более 517 вопросов в сервисе Stack Overflow и проанализировали ответы на них чат-бота ChatGPT. «Мы обнаружили, что 52 % ответов ChatGPT содержат дезинформацию, 77 % ответов более многословны, чем человеческие ответы, а 78 % ответов характеризуются различной степенью несоответствия ответам людей», — отметили исследователи.

Команда исследователей также провела лингвистический анализ 2000 случайно выбранных ответов ChatGPT и обнаружила, что они «более формальные и аналитические», но при этом отражают «менее негативные настроения» — чем обычно отличается ИИ.

Комментируя результаты исследования, сайт Futurism выразил обеспокоенность тем, что многие программисты предпочитают обращаться за помощью к ChatGPT. Исследователи Университета Пердью опросили 12 программистов и обнаружили, что 35 % респондентов предпочитают полагаться на ответы ChatGPT и не замечают ошибок в ответах, сгенерированных ИИ, в 39 % случаев.

Исследователи допускают, что пользователей подкупает вежливость, проявляемая ИИ. «Последующие полуструктурированные интервью показали, что вежливый язык, чётко сформулированные ответы в стиле учебника, а также полнота являются одними из основных причин, по которым ответы ChatGPT выглядели более убедительными, поэтому участники ослабили бдительность и упустили из виду некоторую дезинформацию в ответах ChatGPT», — сообщили они.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Apple грозит штраф не менее 500 млн евро за нарушение законов ЕС 2 ч.
DeepSeek ужесточила цензуру в обновлённой ИИ-модели R1 2 ч.
Apple: разработчики приложений заработали $406 млрд через App Store в 2024 году 8 ч.
В Steam вышло демо Dispatch — комедийной игры про агентство супергероев от бывших разработчиков Tales from the Borderlands и The Wolf Among Us 9 ч.
Yandex B2B Tech запустила YTsaurus — платформу обработки данных любого объёма для бизнеса 11 ч.
CD Projekt подтвердила разработку двух секретных игр, о которых никто ничего не знает 12 ч.
Полный запрет майнинга скоро будет введён в Бурятии и Забайкалье 13 ч.
Миллионы людей открыли сотням веб-приложений полный доступ к своим файлам в Microsoft OneDrive 14 ч.
В Atomic Heart сыграло 10 миллионов человек, а Mundfish начнёт помогать амбициозным разработчикам 14 ч.
«Ростелеком» усилил требования по информационной безопасности к дочерним организациям и подрядчикам 14 ч.
Китайские техногиганты начали готовиться к жизни без ускорителей Nvidia 19 мин.
Учёные создали наклейку на лицо за $20, которая предупредит о «выгорании» 3 ч.
Dell удалось воодушевить инвесторов прогнозом увеличения выручки от ИИ-серверов в полтора раза 3 ч.
ASRock признала, что её материнские платы ломают процессоры Ryzen 9000 8 ч.
Lian Li представила СЖО HydroShift II LCD-C с радиатором 360 мм и тремя конфигурациями 8 ч.
Новая статья: Обзор LCD Full HD-проектора Digma DP-FHD800A: современный подход 8 ч.
NVIDIA значительно увеличила выручку и прибыль, несмотря на потери из-за санкций США 9 ч.
В Китае испытали многоразовую ракету для мгновенной доставки товаров с Aliexpress по всему миру 10 ч.
Гендир Intel Лип-Бу Тан начал борьбу с бюрократией и теперь нуждается в большом клиенте 13 ч.
Vivo представила смартфоны S30 и S30 Pro Mini с 50-Мп перископическими камерами и мощными чипами 13 ч.