Сегодня 03 апреля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

ИИ становится умнее — чат-бот на базе GPT-4 прошёл тест Тьюринга

В современном мире люди взаимодействуют с искусственным интеллектом в интернете не только чаще, чем когда-либо, но и чаще, чем им кажется. Нейросети становятся всё более продвинутыми, зачастую отличить их от человека не так просто. В подтверждение этого учёные из Института инженеров электротехники и электроники (IEEE) провели исследование, в рамках которого респондентам предлагалось пообщаться с четырьмя агентами, среди которых был только один человек.

 Источник изображения: Copilot

Источник изображения: Copilot

Цель исследования была в том, чтобы определить, смогут ли участники отличить синтетического собеседника от живого человека. Исследование учёных представляет собой современную интерпретацию теста, который был предложен знаменитым математиком Аланом Тьюрингов ещё в 1950 году. Тест считается пройденным, если ИИ-алгоритм в процессе общения с человеком может заставить его думать, что беседу с ним ведёт другой человек.

В тестировании приняли участие 500 человек, которые некоторое время поочерёдно беседовали с четырьмя агентами, одним из которых был человек, а ещё три — программные продукты, такие как написанный в 60-е годы прошлого века виртуальный собеседник ELIZA и современные чат-боты, построенные на базе больших языковых моделей GPT-3.5 и GPT-4 (последняя также является основой популярного ИИ-бота ChatGPT).

Респонденты по пять минут беседовали с каждым из агентов, после чего они должны были сказать, с кем, по их мнению, они разговаривали — с человеком или чат-ботом. В итоге было установлено, что 54 % участников тестирования приняли GPT-4 за человека. ELIZA, не имеющая в арсенале большой языковой модели и архитектуры нейросети, была признана человеком лишь в 22 % случаев. Алгоритм на базе GPT-3.5 признали человеком в 50 % случаев, а человека опознали в 67 % случаев.

«Машины могут рассуждать, смешивая воедино правдоподобные обоснования вещей постфактум, как это делают люди. Они могут быть подвержены когнитивным предубеждениям, ими можно манипулировать, и они становятся всё более обманчивыми. Всё это означает, что в ИИ-системах выражаются человеческие недостатки и причуды, что делает их более похожими на человека, чем предыдущие подобные решения, которые имели в арсенале лишь список готовых заранее ответов», — прокомментировал результаты работы один из исследователей.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Пираты победили Denuvo: игры теперь взламывают в день релиза, но разработчик обещает новые меры 2 ч.
Microsoft AI представила три собственные ИИ-модели для генерации текста, голоса и изображений 2 ч.
Google прокачала ИИ-ассистента для умного дома: Gemini в Home стал лучше понимать сложные команды 2 ч.
Всему хорошему приходит конец: Microsoft подтвердила, когда GTA V покинет Game Pass 3 ч.
Мультиплеерный стелс-экшен Thick as Thieves от создателя Deus Ex и System Shock стал одиночной игрой с кооперативом на двоих 5 ч.
Отменённая The Last of Us Online была почти готова — ведущего разработчика «убивает, что люди не смогут поиграть в неё» 5 ч.
Ветеран Microsoft: обновления Windows не всегда ломают ПК — иногда они просто вскрывают проблемы 6 ч.
На следующей неделе «Яндекс» проведёт конференцию «День поиска» 7 ч.
Blizzard заинтриговала фанатов StarCraft новой вакансией — шутер с открытым миром на Unreal Engine 7 ч.
Игроки профинансировали русскую озвучку South Park: The Stick of Truth от GamesVoice — она выйдет «до того, как у вас закончатся запасы терпения» 8 ч.
Новая статья: Восьмеричный путь к AGI: от ложной нирваны к истинной 33 мин.
SpaceX пожаловалась, что запуски спутников-конкурентов Amazon Leo создали риск столкновения 2 ч.
8BitDo выпустила механическую клавиатуру Retro 68 AP50 за $500 в стиле компьютера Apple II 2 ч.
К созданию спонсируемого Биллом Гейтсом нетипичного ядерного реактора подключили ИИ — процесс пойдёт живее 3 ч.
Космический сбой Microsoft: в летящем к Луне корабле «Орион» оказалось два Outlook и ни один из них не работает 3 ч.
Piter-IX поднял цены на свои услуги 5 ч.
Поставки электромобилей Tesla рухнули на 14 % за первый квартал — продано всего 358 000 штук 6 ч.
Тепло от дата-центров для ИИ начало сказываться на климате — пока лишь локально, но чувствительно для соседей 7 ч.
Представлен смартфон среднего уровня Honor X80i с чипом Dimensity 6500 Elite, 50-Мп камерой и батареей на 7000 мА·ч 7 ч.
Британские учёные выяснили, что дата-центры подогревают окрестности на километры вокруг 7 ч.