Сегодня 01 мая 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

ИИ становится умнее — чат-бот на базе GPT-4 прошёл тест Тьюринга

В современном мире люди взаимодействуют с искусственным интеллектом в интернете не только чаще, чем когда-либо, но и чаще, чем им кажется. Нейросети становятся всё более продвинутыми, зачастую отличить их от человека не так просто. В подтверждение этого учёные из Института инженеров электротехники и электроники (IEEE) провели исследование, в рамках которого респондентам предлагалось пообщаться с четырьмя агентами, среди которых был только один человек.

 Источник изображения: Copilot

Источник изображения: Copilot

Цель исследования была в том, чтобы определить, смогут ли участники отличить синтетического собеседника от живого человека. Исследование учёных представляет собой современную интерпретацию теста, который был предложен знаменитым математиком Аланом Тьюрингов ещё в 1950 году. Тест считается пройденным, если ИИ-алгоритм в процессе общения с человеком может заставить его думать, что беседу с ним ведёт другой человек.

В тестировании приняли участие 500 человек, которые некоторое время поочерёдно беседовали с четырьмя агентами, одним из которых был человек, а ещё три — программные продукты, такие как написанный в 60-е годы прошлого века виртуальный собеседник ELIZA и современные чат-боты, построенные на базе больших языковых моделей GPT-3.5 и GPT-4 (последняя также является основой популярного ИИ-бота ChatGPT).

Респонденты по пять минут беседовали с каждым из агентов, после чего они должны были сказать, с кем, по их мнению, они разговаривали — с человеком или чат-ботом. В итоге было установлено, что 54 % участников тестирования приняли GPT-4 за человека. ELIZA, не имеющая в арсенале большой языковой модели и архитектуры нейросети, была признана человеком лишь в 22 % случаев. Алгоритм на базе GPT-3.5 признали человеком в 50 % случаев, а человека опознали в 67 % случаев.

«Машины могут рассуждать, смешивая воедино правдоподобные обоснования вещей постфактум, как это делают люди. Они могут быть подвержены когнитивным предубеждениям, ими можно манипулировать, и они становятся всё более обманчивыми. Всё это означает, что в ИИ-системах выражаются человеческие недостатки и причуды, что делает их более похожими на человека, чем предыдущие подобные решения, которые имели в арсенале лишь список готовых заранее ответов», — прокомментировал результаты работы один из исследователей.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Microsoft сообщила о росте капзатрат до $190 млрд и портфеле заказов на $627 млрд 3 мин.
Анонсирован симулятор железнодорожного магната Steam to Electric с безумными, но исторически достоверными поездами — первый трейлер и подробности 2 ч.
Разработчики Subnautica 2 раскрыли системные требования перед погружением в ранний доступ и пообещали оптимизировать игру 4 ч.
Это другое: Пентагон не перестал считать Anthropic неблагонадёжной — но не отказался от передовой ИИ-модели Mythos 5 ч.
Epic Games вернула Fortnite на iPhone ещё в одной стране — Mac остались в стороне 5 ч.
Cloudflare перестала маркировать мессенджер Max как шпионское ПО 6 ч.
Windows 11 получила крупное обновление для повышения стабильности — первый шаг к возвращению «доверия пользователей» 6 ч.
Олдскульный шутер Gravelord в духе Duke Nukem вырвется с кладбища раннего доступа Steam совсем скоро — новый трейлер и дата выхода 6 ч.
Microsoft показала ИИ-агента для работы с юридическими документами в Word 8 ч.
Microsoft разрешила удалять любые предустановленные приложения в Windows 11 8 ч.
Google планирует начать продажу собственных ИИ-ускорителей TPU 16 мин.
Китайские учёные создали воздушно-железный проточный аккумулятор, который проработает 16 лет без деградации 2 ч.
Virgin Galactic показала строящийся космический корабль для туристов — запуск планируют на конец 2026 года 3 ч.
Xiaomi готовит Smart Band 10 Pro с крупным дисплеем и керамическим корпусом 5 ч.
Полный потенциал DualSense на ПК раскрылся с помощью кустарного адаптера из Raspberry Pi Pico 6 ч.
Пентагон выбрал семёрку поставщиков ИИ-технологий для своих секретных сетей 6 ч.
Траты SpaceX на разработку Starship перевалили за $15 млрд 6 ч.
Intel раскрыла техпроцесс 18A-P: быстрее, экономичнее и с улучшенным теплоотводом 7 ч.
Blue Origin намерена потеснить SpaceX — в планах запускать по 100 тяжёлых ракет New Glenn в год 8 ч.
Процессоры Hygon C86-4G, китайские наследники AMD Zen1, получили поддержку AVX-512, DDR5 и PCIe 5.0 9 ч.