Сегодня 06 мая 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

ИИ становится умнее — чат-бот на базе GPT-4 прошёл тест Тьюринга

В современном мире люди взаимодействуют с искусственным интеллектом в интернете не только чаще, чем когда-либо, но и чаще, чем им кажется. Нейросети становятся всё более продвинутыми, зачастую отличить их от человека не так просто. В подтверждение этого учёные из Института инженеров электротехники и электроники (IEEE) провели исследование, в рамках которого респондентам предлагалось пообщаться с четырьмя агентами, среди которых был только один человек.

 Источник изображения: Copilot

Источник изображения: Copilot

Цель исследования была в том, чтобы определить, смогут ли участники отличить синтетического собеседника от живого человека. Исследование учёных представляет собой современную интерпретацию теста, который был предложен знаменитым математиком Аланом Тьюрингов ещё в 1950 году. Тест считается пройденным, если ИИ-алгоритм в процессе общения с человеком может заставить его думать, что беседу с ним ведёт другой человек.

В тестировании приняли участие 500 человек, которые некоторое время поочерёдно беседовали с четырьмя агентами, одним из которых был человек, а ещё три — программные продукты, такие как написанный в 60-е годы прошлого века виртуальный собеседник ELIZA и современные чат-боты, построенные на базе больших языковых моделей GPT-3.5 и GPT-4 (последняя также является основой популярного ИИ-бота ChatGPT).

Респонденты по пять минут беседовали с каждым из агентов, после чего они должны были сказать, с кем, по их мнению, они разговаривали — с человеком или чат-ботом. В итоге было установлено, что 54 % участников тестирования приняли GPT-4 за человека. ELIZA, не имеющая в арсенале большой языковой модели и архитектуры нейросети, была признана человеком лишь в 22 % случаев. Алгоритм на базе GPT-3.5 признали человеком в 50 % случаев, а человека опознали в 67 % случаев.

«Машины могут рассуждать, смешивая воедино правдоподобные обоснования вещей постфактум, как это делают люди. Они могут быть подвержены когнитивным предубеждениям, ими можно манипулировать, и они становятся всё более обманчивыми. Всё это означает, что в ИИ-системах выражаются человеческие недостатки и причуды, что делает их более похожими на человека, чем предыдущие подобные решения, которые имели в арсенале лишь список готовых заранее ответов», — прокомментировал результаты работы один из исследователей.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Невероятный мод Zagreus’ Journey для Hades 2 вышел из «беты» и поразил даже разработчиков Hades 5 мин.
Издатели: Цукерберг лично одобрил массовое пиратство книг для обучения ИИ 38 мин.
Студия разработчиков MindsEye уволила 90 % сотрудников, а план спасения игры под угрозой 60 мин.
Китайский «Большой фонд» может возглавить финансирование DeepSeek при оценке $45 млрд 2 ч.
Galaxy S26 получит бету One UI 9 раньше, чем владельцы старых моделей увидят стабильную One UI 8.5 2 ч.
«Выглядит круто и ужасно одновременно»: авторы ремастеров GTA анонсировали онлайн-боевик о сражениях огромных монстров BeastLink 2 ч.
Спустя 10 лет в Steam вернулась амбициозная военная стратегия R.U.S.E. — с поддержкой Steam Deck и всеми DLC в комплекте 4 ч.
4 или 32 Гбайт: Microsoft запуталась в собственных рекомендациях по оперативной памяти для Windows 11 4 ч.
Gartner: пользователям VMware дешевле перейти на мейнфреймы IBM, чем приобрести новые лицензии у Broadcom 4 ч.
Официальный сайт Daemon Tools уже месяц распространяет заражённый установщик с трояном 8 ч.
Видео: серийная версия робота Atlas от Boston Dynamics выполнила «уголок в упоре» 12 мин.
Власти США намерены вмешаться в цепочки поставок, чтобы смягчить дефицит памяти 14 мин.
LG Display показала Tandem OLED с удвоенным сроком службы и сниженным потреблением, а также геймерский 720-Гц OLED-дисплей 16 мин.
Частные инвесторы нашли способ вложиться в OpenAI и другие «закрытые» ИИ-компании — через криптоплатформы 45 мин.
Акции Intel достигли исторического максимума — вложения властей США с августа упятерились 2 ч.
Учёные предсказали скорое появление практичных квантовых компьютеров — но не знают, зачем они нужны 2 ч.
Xiaomi представила беспроводную игровую мышь Gaming Mouse 2 с флагманским сенсором PixArt 2 ч.
На смартфонах Google Pixel без видимой причины перестали работать eSIM 2 ч.
Китайские конкуренты Nvidia тратят на разработки больше, чем зарабатывают 2 ч.
Исключённые из параллельного импорта ноутбуки и накопители не исчезнут из продажи, но подорожают 2 ч.