Сегодня 14 мая 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Больше половины ответов ChatGPT на вопросы по программированию неверны — исследование

В последнее время на фоне ажиотажа вокруг технологий ИИ программисты стали всё чаще обращаться за помощью в написании кода программ к чат-ботам на базе ИИ, таким как ChatGPT от OpenAI, что повлекло за собой снижение посещаемости ресурса Stack Overflow, вынужденного уволить в прошлом году почти 30 % персонала.

 Источник изображения: geralt/Pixabay

Источник изображения: geralt/Pixabay

Как оказалось, полагаться на ИИ в написании программ пока рано. Согласно исследованию команды специалистов Университета Пердью, представленному в этом месяце на конференции Computer-Human Interaction («Взаимодействие компьютера и человека»), 52 % ответов по программированию, сгенерированных ChatGPT, оказались неверны.

В ходе исследования программисты Университета Пердью просмотрели более 517 вопросов в сервисе Stack Overflow и проанализировали ответы на них чат-бота ChatGPT. «Мы обнаружили, что 52 % ответов ChatGPT содержат дезинформацию, 77 % ответов более многословны, чем человеческие ответы, а 78 % ответов характеризуются различной степенью несоответствия ответам людей», — отметили исследователи.

Команда исследователей также провела лингвистический анализ 2000 случайно выбранных ответов ChatGPT и обнаружила, что они «более формальные и аналитические», но при этом отражают «менее негативные настроения» — чем обычно отличается ИИ.

Комментируя результаты исследования, сайт Futurism выразил обеспокоенность тем, что многие программисты предпочитают обращаться за помощью к ChatGPT. Исследователи Университета Пердью опросили 12 программистов и обнаружили, что 35 % респондентов предпочитают полагаться на ответы ChatGPT и не замечают ошибок в ответах, сгенерированных ИИ, в 39 % случаев.

Исследователи допускают, что пользователей подкупает вежливость, проявляемая ИИ. «Последующие полуструктурированные интервью показали, что вежливый язык, чётко сформулированные ответы в стиле учебника, а также полнота являются одними из основных причин, по которым ответы ChatGPT выглядели более убедительными, поэтому участники ослабили бдительность и упустили из виду некоторую дезинформацию в ответах ChatGPT», — сообщили они.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Google готовит функцию синхронного перевода речи без подключения к интернету 2 ч.
ИИ сможет предугадывать потребности пользователей в ближайшем будущем, считают в Anthropic 2 ч.
Apple всё же допустит автономных ИИ-агентов в App Store, но с ограничениями 2 ч.
К заданию готов: шпионский боевик 007 First Light от создателей Hitman отправился на золото за две недели до релиза 9 ч.
Microsoft исправила ошибку в Windows Autopatch, из-за которой драйверы обновлялись без разрешения 11 ч.
Meta запустила сервис Instants для обмена спонтанными фото без ретуши 12 ч.
Anthropic научила Claude вести бухгалтерию, продажи и маркетинг для малого бизнеса 12 ч.
Devolver Digital анонсировала The Talos Principle 3 — грандиозный финал трилогии философских головоломок от создателей Serious Sam 12 ч.
«Ваши разговоры не сохраняются»: в WhatsApp появились «Инкогнито-чаты» для приватных бесед с ИИ 13 ч.
Уход Sora открыл дорогу конкурентам: ИИ-генераторы видео Kling AI и AI Video ворвались в топы Apple App Store 13 ч.
В следующем месяце объём инвестиций Microsoft в OpenAI превысит $100 млрд 18 мин.
Китай запустил на орбитальной станции эксперимент с искусственными эмбрионами человека 2 ч.
Технологическую отрасль накрыло цунами увольнений — более 100 тысяч сотрудников потеряли работу с начала года 10 ч.
Apple нарастила продажи в США, тогда как Android-смартфоны потеряли более 14 % 12 ч.
Canon представила полнокадровую беззеркалку EOS R6 V с вентилятором, но без видоискателя 12 ч.
Представлена полнокадровая беззеркалка Sony A7R VI с многослойным 66,8-Мп сенсором — серийную съёмку разогнали до 30 кадров/с 12 ч.
Curator вошла в число крупнейших ИБ-компаний России 13 ч.
Выручка Tencent не оправдала прогнозов, несмотря на успехи игрового бизнеса и ИИ 13 ч.
Прибыль Alibaba рухнула на 84 %, но гендир назвал отдачу от ИИ «абсолютно очевидной» 14 ч.
Xiaomi скоро представит флагман Xiaomi 17 Max, фитнес-браслет Smart Band 10 Pro и первые спортивные наушники 14 ч.