Сегодня 16 мая 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

ИИ становится умнее — чат-бот на базе GPT-4 прошёл тест Тьюринга

В современном мире люди взаимодействуют с искусственным интеллектом в интернете не только чаще, чем когда-либо, но и чаще, чем им кажется. Нейросети становятся всё более продвинутыми, зачастую отличить их от человека не так просто. В подтверждение этого учёные из Института инженеров электротехники и электроники (IEEE) провели исследование, в рамках которого респондентам предлагалось пообщаться с четырьмя агентами, среди которых был только один человек.

 Источник изображения: Copilot

Источник изображения: Copilot

Цель исследования была в том, чтобы определить, смогут ли участники отличить синтетического собеседника от живого человека. Исследование учёных представляет собой современную интерпретацию теста, который был предложен знаменитым математиком Аланом Тьюрингов ещё в 1950 году. Тест считается пройденным, если ИИ-алгоритм в процессе общения с человеком может заставить его думать, что беседу с ним ведёт другой человек.

В тестировании приняли участие 500 человек, которые некоторое время поочерёдно беседовали с четырьмя агентами, одним из которых был человек, а ещё три — программные продукты, такие как написанный в 60-е годы прошлого века виртуальный собеседник ELIZA и современные чат-боты, построенные на базе больших языковых моделей GPT-3.5 и GPT-4 (последняя также является основой популярного ИИ-бота ChatGPT).

Респонденты по пять минут беседовали с каждым из агентов, после чего они должны были сказать, с кем, по их мнению, они разговаривали — с человеком или чат-ботом. В итоге было установлено, что 54 % участников тестирования приняли GPT-4 за человека. ELIZA, не имеющая в арсенале большой языковой модели и архитектуры нейросети, была признана человеком лишь в 22 % случаев. Алгоритм на базе GPT-3.5 признали человеком в 50 % случаев, а человека опознали в 67 % случаев.

«Машины могут рассуждать, смешивая воедино правдоподобные обоснования вещей постфактум, как это делают люди. Они могут быть подвержены когнитивным предубеждениям, ими можно манипулировать, и они становятся всё более обманчивыми. Всё это означает, что в ИИ-системах выражаются человеческие недостатки и причуды, что делает их более похожими на человека, чем предыдущие подобные решения, которые имели в арсенале лишь список готовых заранее ответов», — прокомментировал результаты работы один из исследователей.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Новая статья: Mixtape — воспоминания никто не отнимет. Рецензия 12 ч.
Google начнёт наказывать сайты за накрутку попаданий в ИИ-ответы 12 ч.
Московский суд оштрафовал владельца Deus Ex, Metro и Kingdom Come: Deliverance за отказ локализовать данные россиян 13 ч.
Спринт, торговля и продолжение сюжета: разработчики Subnautica 2 раскрыли план улучшения игры на ближайшие месяцы 16 ч.
ChatGPT получит прямой доступ к банковским счетам пользователей — для анализа расходов и финансовых советов 16 ч.
Трамп и Си Цзиньпин обсудили ограничения слишком умного ИИ и зависшие поставки Nvidia H200 16 ч.
Microsoft намерена избавить Windows 11 от главной причины «синих экранов» 17 ч.
Доминирование ChatGPT пошатнулось — Gemini и Perplexity быстро набирают обороты 17 ч.
Pragmata стала новой жертвой пиратов — игру взломали без гипервизора 17 ч.
YouTube Shorts набрали популярность на смарт-телевизорах — 2 млрд часов просмотра за месяц 18 ч.
Китай и США не заключили крупных сделок в технологическом секторе — это запустило распродажу акций производителей чипов 8 мин.
Apple тестирует производство чипов для iPhone на мощностях Intel 8 мин.
Китайские ИТ-гиганты ускорили переход на отечественные ИИ-ускорители, несмотря на возможное возвращение Nvidia 11 мин.
Дженсен Хуанг стал героем китайских соцсетей, перекусив лапшой и мороженым прямо на пекинской улице 2 ч.
Tesla сняла гриф секретности с отчётов о ДТП с участием своих роботакси 3 ч.
ArXiv запретила учёным загружать статьи, сгенерированные нейросетями — за это предусмотрен бан на один год 3 ч.
DJI анонсировала в Каннах карманную кинокамеру Osmo Pocket 4P 11 ч.
OpenAI перестраивается вокруг ИИ-агентов в рамках подготовки к IPO — ChatGPT и Codex объединят в единую платформу 11 ч.
Зонд Mars Express показал «хаос и кратеры», образовавшиеся в результате древних наводнений на Марсе 11 ч.
Asus и T1 выпустили лимитированные GeForce RTX для фанатов League of Legends 13 ч.