Сегодня 13 октября 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Исследование Apple показало, что ИИ-модели не думают, а лишь имитируют мышление

Исследователи Apple обнаружили, что большие языковые модели, такие как ChatGPT, не способны к логическому мышлению и их легко сбить с толку, если добавить несущественные детали к поставленной задаче, сообщает издание TechCrunch.

 Источник изображения: D koi/Unsplash

Источник изображения: D koi/Unsplash

Опубликованная статья «Понимание ограничений математического мышления в больших языковых моделях» поднимает вопрос о способности искусственного интеллекта к логическому мышлению. Исследование показало, что большие языковые модели (LLM) могут решать простые математические задачи, но добавление малозначимой информации приводит к ошибкам.

Например, модель вполне может решить такую задачу: «Оливер собрал 44 киви в пятницу. Затем он собрал 58 киви в субботу. В воскресенье он собрал вдвое больше киви, чем в пятницу. Сколько киви у Оливера?». Однако, если при этом в условие задачи добавить фразу «в воскресенье 5 из этих киви были немного меньше среднего размера», модель скорее всего вычтет эти 5 киви из общего числа, несмотря на то, что размер киви не влияет на их количество.

 Источник изображения: Copilot

Источник изображения: Copilot

Мехрдад Фараджтабар (Mehrdad Farajtabar), один из соавторов исследования, объясняет, что такие ошибки указывают на то, что LLM не понимают сути задачи, а просто воспроизводят шаблоны из обучающих данных. «Мы предполагаем, что это снижение [эффективности] связано с тем фактом, что современные LLM не способны к подлинному логическому рассуждению; вместо этого они пытаются воспроизвести шаги рассуждения, наблюдаемые в их обучающих данных», — говорится в статье.

Другой специалист из OpenAI возразил, что правильные результаты можно получить с помощью техники формулировки запросов (prompt engineering). Однако Фараджтабар отметил, что для сложных задач может потребоваться экспоненциально больше контекстных данных, чтобы нейтрализовать отвлекающие факторы, которые, например, ребёнок легко бы проигнорировал.

Означает ли это, что LLM не могут рассуждать? Возможно. Никто пока не даёт точного ответа, так как нет чёткого понимания происходящего. Возможно, LLM «рассуждают», но способом, который мы пока не распознаём или не можем контролировать. В любом случае эта тема открывает захватывающие перспективы для дальнейших исследований.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
В Microsoft Defender нашли давние уязвимости, позволяющие обойти аутентификацию и загружать вредоносные файлы 22 мин.
AMD FSR 4, улучшения графики и оптимизации: для Black Myth: Wukong вышел первый за полгода новый патч 2 ч.
Журналисты показали, как волшебное приключение Everwild от авторов Sea of Thieves выглядело незадолго до отмены 2 ч.
OpenAI определила эпоху ИИ и стала уникальной компанией в истории Кремниевой долины 3 ч.
xAI будет создавать виртуальные миры для игр и обучения роботов 9 ч.
Пользователи ChatGPT снова могут удалять свои чаты безвозвратно 12-10 12:08
Арт-директор Halo покинул студию после 17 лет работы и намекнул на проблемы в команде разработчиков 12-10 10:33
Один из основателей ИИ-стартапа Thinking Machines переметнулся к Марку Цукербергу 12-10 08:17
Apple завершила поддержку своего бесплатного видеоредактора Clips 12-10 06:28
Новая статья: CloverPit — добро пожаловать в яму. Рецензия 12-10 00:07
Vivo X300 и X300 Pro представлены официально с 200-Мп камерами Zeiss и чипами MediaTek Dimensity 9500 25 мин.
Microsoft запустила новые облачные регионы в Малайзии и Индонезии и откроет дополнительные в Индии и на Тайване 2 ч.
«Инферит» представил российские 2U-серверы для ИИ на базе Intel Xeon Emerald Rapids 3 ч.
OpenAI растёт быстрее всех — но теперь никто не понимает, кому она принадлежит 3 ч.
Apple уже работает над новыми AirPods Pro и AirPods 5 — они получат чип H3 3 ч.
IBM представила ускоритель Spyre Accelerator для ИИ-инференса 4 ч.
Intel начала сворачивать поддержку ускорителей Ponte Vecchio и Arctic Sound — они вышли всего два года назад 4 ч.
Умные очки Apple будут работать в разных режимах при подключении к Mac и iPhone 5 ч.
Анонсирован защищённый смартфон Oukitel WP58 Pro с батареей на 10 000 мА·ч и двумя кемпинговыми фонариками 6 ч.
«Зелёные» надежды стали пеплом: американские ЦОД активно переходят на питание от угольных электростанций из-за спроса на ИИ 7 ч.