Сегодня 17 августа 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Галлюцинации у моделей ИИ случаются реже, чем у людей, заявил глава Anthropic

Современные модели искусственного интеллекта демонстрируют галлюцинации, то есть дают заведомо не соответствующие действительности ответы на вопросы, реже, чем люди. Такое заявление сделал гендиректор Anthropic Дарио Амодеи (Dario Amodei) на проводимой компанией конференции Code with Claude.

 Источник изображения: anthropic.com

Источник изображения: anthropic.com

Галлюцинации, по мнению господина Амодеи, не являются препятствием к разработке сильного ИИ (Artificial General Intelligence — AGI), то есть системы, сравнимой по уровню развития с человеком. «На самом деле всё зависит от подхода, но у меня есть подозрения, что модели ИИ, вероятно, галлюцинируют реже, чем люди, но галлюцинируют они более удивительным образом», — заявил глава Anthropic ресурсу TechCrunch. Дарио Амодеи относится к числу оптимистов в отрасли ИИ. В его прошлогодней статье говорится, что AGI может появиться уже в 2026 году. Поводов отказаться от этой позиции он не нашёл и накануне — по его мнению, в этом направлении наблюдается устойчивый прогресс, и «вода поднимается повсюду». «Все и всегда ищут эти жёсткие ограничения на то, что может делать [ИИ]. Их не видно нигде. Нет такого», — уверен гендиректор Anthropic.

С ним согласны не все. Глава подразделения Google DeepMind Демис Хассабис (Demis Hassabis) на этой неделе заявил, что у сегодняшних моделей ИИ слишком много «дыр», и эти модели дают неправильные ответы на слишком большое число очевидных вопросов. А адвокат самой Anthropic в этом месяце был вынужден извиняться за то, что использованный компанией для составления иска чат-бот Claude указал в цитатах неверные имена и должности. Проверить утверждение господина Амодеи непросто: в большинстве тестов на галлюцинации модели сравниваются друг с другом, а не с человеком. В отдельных случаях число таких проявлений удаётся снизить, открывая чат-ботам доступ к веб-поиску; а OpenAI GPT-4.5 значительно снизила процент галлюцинаций по сравнению с моделями предыдущих поколений. С другой стороны, рассуждающие модели OpenAI o3 и o4-mini, как стало известно ранее, дают не соответствующие действительности ответы чаще, чем предшественники, и пока не удалось установить, почему.

Телеведущие, политики и вообще люди всех профессий совершают ошибки постоянно, указал Дарио Амодеи, и тот факт, что их совершает также ИИ, не может выступать аргументом для критики его способностей. Но, признал он, уверенность, с которой ИИ выдаёт вымысел за факты, может обернуться проблемой. Anthropic уже неоднократно изучала склонность моделей ИИ обманывать людей. Исследовательский институт Apollo Research, которому предоставили ранний доступ к Claude Opus 4, установил, что модель имеет значительные склонности к интригам и обману, и порекомендовала Anthropic отозвать её — разработчик заявил, что принял некоторые меры, которые смягчили выявленные проблемы.

Заявление главы Anthropic свидетельствует, что компания может признать за достаточно развитой моделью ИИ уровень AGI, даже если она не избавилась от галлюцинаций, но некоторые эксперты такую позицию отвергают.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Новая статья: Mafia: The Old Country — возвращение привычной «Мафии». Рецензия 7 ч.
Мошенники начали заменять контакты на смартфонах жертв при помощи файлов VCF 12 ч.
Сэм Альтман рассказал о перспективах OpenAI, ИИ и других технологий 14 ч.
Meta проведёт масштабные изменения в структуре ИИ-подразделений — в четвёртый раз за полгода 16 ч.
GPT-5 пока не смогла порадовать потребителей, зато корпоративные клиенты пришли в восторг 18 ч.
В рамках вторичного размещения персонал OpenAI продаст акций на сумму $6 млрд 24 ч.
Волна интереса к ИИ порождает новых миллиардеров с рекордной скоростью 16-08 04:34
Почти 30 тыс. серверов Microsoft Exchange Server оказались уязвимыми из-за нерасторопности администраторов 16-08 01:23
OpenAI заработала $2 млрд на мобильном приложении ChatGPT — в 30 раз больше всех конкурентом вместе 16-08 01:05
Google Gemini внезапно заработал в России без ограничений и ухищрений 16-08 01:03
В Пекине стартовали первые в мире Всемирные игры человекоподобных роботов 14 ч.
Автономность планшетов Surface Pro 11 снизилась вдвое — Microsoft изучает проблему 15 ч.
Asus выпустила белые версии GeForce RTX 5060 и Radeon RX 9060 XT в исполнении Dual 15 ч.
Inspur представила суперускоритель Metabrain SD200 для ИИ-моделей с триллионами параметров 16 ч.
Представлена первая в мире контактная OLED-линза для самостоятельной диагностики сетчатки глаза 16 ч.
Dell представила ИИ-серверы PowerEdge R7725 и R770 на базе NVIDIA RTX Pro 6000 Blackwell Server Edition 16 ч.
Lamborghini выпустит самый быстрый в истории подключаемый гиперкар Fenomeno по цене $3,5 млн 19 ч.
Samsung «обманула физику», разработав сверхтонкие линзы для камер смартфонов 19 ч.
Стартап Lucid Motors представил электрический внедорожник, чтобы оправдать провальные продажи 23 ч.
Американское правительство может использовать для покупки пакета акций Intel средства, выделенные по «Закону о чипах» 24 ч.