Сегодня 18 сентября 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Больше половины ответов ChatGPT на вопросы по программированию неверны — исследование

В последнее время на фоне ажиотажа вокруг технологий ИИ программисты стали всё чаще обращаться за помощью в написании кода программ к чат-ботам на базе ИИ, таким как ChatGPT от OpenAI, что повлекло за собой снижение посещаемости ресурса Stack Overflow, вынужденного уволить в прошлом году почти 30 % персонала.

 Источник изображения: geralt/Pixabay

Источник изображения: geralt/Pixabay

Как оказалось, полагаться на ИИ в написании программ пока рано. Согласно исследованию команды специалистов Университета Пердью, представленному в этом месяце на конференции Computer-Human Interaction («Взаимодействие компьютера и человека»), 52 % ответов по программированию, сгенерированных ChatGPT, оказались неверны.

В ходе исследования программисты Университета Пердью просмотрели более 517 вопросов в сервисе Stack Overflow и проанализировали ответы на них чат-бота ChatGPT. «Мы обнаружили, что 52 % ответов ChatGPT содержат дезинформацию, 77 % ответов более многословны, чем человеческие ответы, а 78 % ответов характеризуются различной степенью несоответствия ответам людей», — отметили исследователи.

Команда исследователей также провела лингвистический анализ 2000 случайно выбранных ответов ChatGPT и обнаружила, что они «более формальные и аналитические», но при этом отражают «менее негативные настроения» — чем обычно отличается ИИ.

Комментируя результаты исследования, сайт Futurism выразил обеспокоенность тем, что многие программисты предпочитают обращаться за помощью к ChatGPT. Исследователи Университета Пердью опросили 12 программистов и обнаружили, что 35 % респондентов предпочитают полагаться на ответы ChatGPT и не замечают ошибок в ответах, сгенерированных ИИ, в 39 % случаев.

Исследователи допускают, что пользователей подкупает вежливость, проявляемая ИИ. «Последующие полуструктурированные интервью показали, что вежливый язык, чётко сформулированные ответы в стиле учебника, а также полнота являются одними из основных причин, по которым ответы ChatGPT выглядели более убедительными, поэтому участники ослабили бдительность и упустили из виду некоторую дезинформацию в ответах ChatGPT», — сообщили они.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
ИИ от OpenAI обошёл все команды из людей, а заодно и Google Deepmind, на чемпионате по программированию 22 мин.
Похоже, в Cyberpunk 2 всё-таки появится мультиплеер — вакансия выдала планы CD Projekt Red 2 ч.
Google превращает Discover в «новостную соцсеть» с подписками и постами из X и Instagram 2 ч.
Reddit готовит новый контракт с Google по интеграции с ИИ-сервисами 4 ч.
Даже авторы сценария The Wolf Among Us 2 не знают, что происходит с игрой 13 ч.
Nothing анонсировала OS 4.0 — интерфейс стал проще, а камера умнее 14 ч.
Paradox добавила возмутившие фанатов платные кланы в стандартное издание Vampire: The Masquerade — Bloodlines 2 и анонсировала два сюжетных DLC 15 ч.
Жертвы утечки данных Facebook через Cambridge Analytica начали получать выплаты от Цукерберга 15 ч.
В мессенджере Max начинаются «открытые» тесты каналов — создавать их разрешат блогерам из реестра РКН 16 ч.
В России выплатили первую зарплату в цифровых рублях 17 ч.
За июль роботакси Tesla попали в три ДТП, но компания постаралась замести следы 17 мин.
Huawei представит четыре новых ИИ-ускорителя Ascend за три года, чтобы догнать и перегнать Nvidia 29 мин.
Вы нам — SMR, мы вам — ядерное топливо: американские и британские компании подписали целый ряд соглашению по развитию АЭС для питания ЦОД 2 ч.
Apple рассматривает возможность организации сборки складного iPhone на Тайване и в Индии 2 ч.
За пять лет количество расследований в сфере промышленного шпионажа на Тайване выросло на 31 % 3 ч.
Alibaba удалось разработать ИИ-чип T-Head PPU, сопоставимый по характеристикам с Nvidia H20 6 ч.
Новая статья: Обзор «золотого» блока питания GamerStorm PQ1000G (PQA00G-FD) с разъемом 12V-2x6 11 ч.
Глава NVIDIA разочарован запретом Китая на покупку RTX Pro 6000D, но все вопросы будут решаться на высшем уровне 11 ч.
Журналисты протестировали Apple Watch Series 11, Ultra 3 и SE 3 — всем нравится младшая модель 12 ч.
CoreWeave инвестирует ещё £1,5 млрд в британские ИИ ЦОД 12 ч.