Сегодня 01 мая 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Больше половины ответов ChatGPT на вопросы по программированию неверны — исследование

В последнее время на фоне ажиотажа вокруг технологий ИИ программисты стали всё чаще обращаться за помощью в написании кода программ к чат-ботам на базе ИИ, таким как ChatGPT от OpenAI, что повлекло за собой снижение посещаемости ресурса Stack Overflow, вынужденного уволить в прошлом году почти 30 % персонала.

 Источник изображения: geralt/Pixabay

Источник изображения: geralt/Pixabay

Как оказалось, полагаться на ИИ в написании программ пока рано. Согласно исследованию команды специалистов Университета Пердью, представленному в этом месяце на конференции Computer-Human Interaction («Взаимодействие компьютера и человека»), 52 % ответов по программированию, сгенерированных ChatGPT, оказались неверны.

В ходе исследования программисты Университета Пердью просмотрели более 517 вопросов в сервисе Stack Overflow и проанализировали ответы на них чат-бота ChatGPT. «Мы обнаружили, что 52 % ответов ChatGPT содержат дезинформацию, 77 % ответов более многословны, чем человеческие ответы, а 78 % ответов характеризуются различной степенью несоответствия ответам людей», — отметили исследователи.

Команда исследователей также провела лингвистический анализ 2000 случайно выбранных ответов ChatGPT и обнаружила, что они «более формальные и аналитические», но при этом отражают «менее негативные настроения» — чем обычно отличается ИИ.

Комментируя результаты исследования, сайт Futurism выразил обеспокоенность тем, что многие программисты предпочитают обращаться за помощью к ChatGPT. Исследователи Университета Пердью опросили 12 программистов и обнаружили, что 35 % респондентов предпочитают полагаться на ответы ChatGPT и не замечают ошибок в ответах, сгенерированных ИИ, в 39 % случаев.

Исследователи допускают, что пользователей подкупает вежливость, проявляемая ИИ. «Последующие полуструктурированные интервью показали, что вежливый язык, чётко сформулированные ответы в стиле учебника, а также полнота являются одними из основных причин, по которым ответы ChatGPT выглядели более убедительными, поэтому участники ослабили бдительность и упустили из виду некоторую дезинформацию в ответах ChatGPT», — сообщили они.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Анонсирован симулятор железнодорожного магната Steam to Electric с безумными, но исторически достоверными поездами — первый трейлер и подробности 53 мин.
Разработчики Subnautica 2 раскрыли системные требования перед погружением в ранний доступ и пообещали оптимизировать игру 3 ч.
Это другое: Пентагон не перестал считать Anthropic неблагонадёжной — но не отказался от передовой ИИ-модели Mythos 4 ч.
Epic Games вернула Fortnite на iPhone ещё в одной стране — Mac остались в стороне 5 ч.
Cloudflare перестала маркировать мессенджер Max как шпионское ПО 5 ч.
Windows 11 получила крупное обновление для повышения стабильности — первый шаг к возвращению «доверия пользователей» 5 ч.
Олдскульный шутер Gravelord в духе Duke Nukem вырвется с кладбища раннего доступа Steam совсем скоро — новый трейлер и дата выхода 6 ч.
Microsoft показала ИИ-агента для работы с юридическими документами в Word 8 ч.
Microsoft разрешила удалять любые предустановленные приложения в Windows 11 8 ч.
Инструмент анализа данных на Python на полдня стал вредоносным — он крал ключи и токены 8 ч.
Китайские учёные создали воздушно-железный проточный аккумулятор, который проработает 16 лет без деградации 2 ч.
Virgin Galactic показала строящийся космический корабль для туристов — запуск планируют на конец 2026 года 2 ч.
Xiaomi готовит Smart Band 10 Pro с крупным дисплеем и керамическим корпусом 5 ч.
Полный потенциал DualSense на ПК раскрылся с помощью кустарного адаптера из Raspberry Pi Pico 6 ч.
Пентагон выбрал семёрку поставщиков ИИ-технологий для своих секретных сетей 6 ч.
Траты SpaceX на разработку Starship перевалили за $15 млрд 6 ч.
Intel раскрыла техпроцесс 18A-P: быстрее, экономичнее и с улучшенным теплоотводом 7 ч.
Blue Origin намерена потеснить SpaceX — в планах запускать по 100 тяжёлых ракет New Glenn в год 8 ч.
Процессоры Hygon C86-4G, китайские наследники AMD Zen1, получили поддержку AVX-512, DDR5 и PCIe 5.0 8 ч.
HPE представила серверы ProLiant Compute EL220/EL240 Gen12 для ИИ-задач на периферии 9 ч.