Сегодня 26 мая 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Рассуждающий ИИ показывает лишь «иллюзию мышления», решили исследователи Apple

Apple представила результаты исследования новейших больших рассуждающих моделей ИИ (LRM). Из отчёта следует, что, хотя LRM превосходят стандартные LLM (большие языковые модели) при выполнении запросов средней сложности, они не дают желаемых результатов при усложнении заданий. Исследователи считают, что нынешняя популярность LRM — это просто мода, а результаты их работы — лишь «иллюзия мышления», несовместимая с мыслительным процессом человека.

 Источник изображения: unsplash.com

Источник изображения: unsplash.com

Исследователи уделили особое внимание моделям Claude 3.7 Sonnet Thinking от Anthropic, o3 от OpenAI, Gemini от Google и R1 LRM от DeepSeek, оценивая их возможности рассуждений в широком диапазоне тестов, выходящих за рамки стандартных задач по математике и написанию кода. Моделям также пришлось проектировать контролируемые среды головоломок, включая «Ханойскую башню».

Главной целью исследования было желание установить и оценить возможности рассуждений моделей, а не их способность достигать желаемого результата или ответа. Согласно выводам учёных, «хотя эти модели демонстрируют улучшенную производительность в тестах рассуждений, их фундаментальные возможности, свойства масштабирования и ограничения остаются недостаточно изученными».

Стандартные LLM и LRM показали схожие результаты при выполнении простых запросов. LRM демонстрировали некоторое преимущество при более сложных задачах благодаря их структурированным механизмам рассуждений («цепочкам мыслей»). Но ни LRM, ни LLM не справились с запросами максимальной сложности.

Несмотря на демонстрацию правильных алгоритмов, LRM испытывали трудности с обработкой сложных задач в традиционном пошаговом процессе рассуждений, демонстрируя недостатки и непоследовательность в логических вычислениях. Модели рассуждений требовали больше времени для обработки сложных запросов, однако неожиданно сокращали процесс рассуждений, что заканчивалось сбоем, несмотря на «наличие адекватного бюджета токенов».

Стоит отметить, что исследование Apple опубликовано на фоне катастрофического отставания компании от лидеров перегретого рынка искусственного интеллекта. По мнению аналитиков, это отставание составляет до двух лет. Если же пузырь искусственного интеллекта в ближайшее время всё же лопнет, Apple даже может оказаться в выигрыше.

Ещё в прошлом году многие эксперты высказывали опасения, что разработка продвинутых моделей ИИ застопорится из-за отсутствия высококачественного контента для дальнейшего обучения нейросетей. Однако генеральный директор OpenAI Сэм Альтман (Sam Altman) не увидел «никаких преград», а бывший генеральный директор Google Эрик Шмидт (Eric Schmidt) посчитал эти опасения беспочвенными.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Президент Ирана подписал указ о восстановлении подключения страны к интернету — после почти трёх месяцев блокировки 7 мин.
Попытка не пытка: после отмены Contraband разработчики Just Cause взялись за ещё одну игру-сервис 24 мин.
Гибкие настройки безопасности и новые инструменты для работы с шаблонами — «Базис» обновил конструктор Basis Automation Studio до версии 2.4 60 мин.
Гибкие настройки безопасности и новые инструменты для работы с шаблонами — «Базис» обновил конструктор Basis Automation Studio до версии 2.4 2 ч.
Симулятор жизни Paralives порадовал разработчиков продажами на старте раннего доступа Steam 2 ч.
ЕС готовится оштрафовать Google на рекордную сумму по итогам антимонопольного расследования 6 ч.
Accenture и OneView Commerce получили контракт на замену скандально известного ПО Fujitsu Horizon для Почты Великобритании 13 ч.
Tether выпустит цифровой грузинский лари совместно с правительством Грузии 14 ч.
Konami показала 50 минут геймплея Metal Gear Solid 4: Guns of the Patriots на PS5 — фанаты в восторге 16 ч.
Календарь релизов 25–31 мая: 007 First Light, Paralives, Mina the Hollower и WoT: Heat 17 ч.
Samsung разработала первый в мире прототип флеш-чипа 3D NAND с 900 слоями 9 мин.
Но есть и плюсы: OCP напомнила местным властям о возможности использования избыточнго тепла ЦОД 20 мин.
Новая статья: Своевременная доставка до последнего байта: как российская сеть Curator CDN совмещает скорость, безопасность и гибкость управления 58 мин.
Учёные впервые поймали гамма-лучи сверхъяркой сверхновой — их связали с рождением магнитара 59 мин.
MediaTek намекнула на выпуск первого чипа для Windows-ноутбуков в преддверии Computex 2026 6 ч.
Масштабный разворот внешнего ядра Земли, начавшийся в 2010 году, может оказаться временным явлением 6 ч.
Новая статья: Обзор и тест процессорного кулера PCCooler RZ700D: битва башен 10 ч.
Tryx представила жидкостный кулер Holo с голографическим дисплеем 11 ч.
Со своим можно: в РФ готовы разрешить строить ЦОД, если они самообеспечатся энергией 11 ч.
Совокупная мощность строящихся ЦОД в мире удвоилась всего за год и достигла 31,7 ГВт 12 ч.