Сегодня 15 февраля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Рассуждающий ИИ показывает лишь «иллюзию мышления», решили исследователи Apple

Apple представила результаты исследования новейших больших рассуждающих моделей ИИ (LRM). Из отчёта следует, что, хотя LRM превосходят стандартные LLM (большие языковые модели) при выполнении запросов средней сложности, они не дают желаемых результатов при усложнении заданий. Исследователи считают, что нынешняя популярность LRM — это просто мода, а результаты их работы — лишь «иллюзия мышления», несовместимая с мыслительным процессом человека.

 Источник изображения: unsplash.com

Источник изображения: unsplash.com

Исследователи уделили особое внимание моделям Claude 3.7 Sonnet Thinking от Anthropic, o3 от OpenAI, Gemini от Google и R1 LRM от DeepSeek, оценивая их возможности рассуждений в широком диапазоне тестов, выходящих за рамки стандартных задач по математике и написанию кода. Моделям также пришлось проектировать контролируемые среды головоломок, включая «Ханойскую башню».

Главной целью исследования было желание установить и оценить возможности рассуждений моделей, а не их способность достигать желаемого результата или ответа. Согласно выводам учёных, «хотя эти модели демонстрируют улучшенную производительность в тестах рассуждений, их фундаментальные возможности, свойства масштабирования и ограничения остаются недостаточно изученными».

Стандартные LLM и LRM показали схожие результаты при выполнении простых запросов. LRM демонстрировали некоторое преимущество при более сложных задачах благодаря их структурированным механизмам рассуждений («цепочкам мыслей»). Но ни LRM, ни LLM не справились с запросами максимальной сложности.

Несмотря на демонстрацию правильных алгоритмов, LRM испытывали трудности с обработкой сложных задач в традиционном пошаговом процессе рассуждений, демонстрируя недостатки и непоследовательность в логических вычислениях. Модели рассуждений требовали больше времени для обработки сложных запросов, однако неожиданно сокращали процесс рассуждений, что заканчивалось сбоем, несмотря на «наличие адекватного бюджета токенов».

Стоит отметить, что исследование Apple опубликовано на фоне катастрофического отставания компании от лидеров перегретого рынка искусственного интеллекта. По мнению аналитиков, это отставание составляет до двух лет. Если же пузырь искусственного интеллекта в ближайшее время всё же лопнет, Apple даже может оказаться в выигрыше.

Ещё в прошлом году многие эксперты высказывали опасения, что разработка продвинутых моделей ИИ застопорится из-за отсутствия высококачественного контента для дальнейшего обучения нейросетей. Однако генеральный директор OpenAI Сэм Альтман (Sam Altman) не увидел «никаких преград», а бывший генеральный директор Google Эрик Шмидт (Eric Schmidt) посчитал эти опасения беспочвенными.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
OpenAI Codex и Anthropic Claude заставляют разработчиков отказываться от традиционного кодинга 3 ч.
Новая статья: Code Vein 2 — от отличного к странному. Рецензия 16 ч.
Новая статья: Gamesblender № 763: ремейк God of War, «Джон Уик», новая Silent Hill — анонсы State of Play 17 ч.
Хоррор Cronos: The New Dawn от авторов ремейка Silent Hill 2 получил лёгкий режим — для любителей сюжета 18 ч.
Голливуд вовсю осваивает ИИ: растёт число школ по кинопроизводству с нейросетями 20 ч.
ByteDance представила Doubao 2.0 — самый популярный ИИ-бот Китая стал мощнее и подготовился к «эре агентов» 14-02 15:22
Реклама Anthropic с подтруниванием над OpenAI сработала — аудитория Claude выросла на 11 % 14-02 12:39
Apple рассказала, насколько сильно iOS 26 проникла на iPhone по всему миру 14-02 12:15
Google с задержкой в пару дней выпустила первую бету Android 17 14-02 06:14
OpenAI убила самую эмоциональную ИИ-модель, несмотря на протесты пользователей 14-02 06:08
Siemens наращивает выручку и объём заказов на фоне бума ИИ 27 мин.
Характеристики и цена смартфона Google Pixel 10a стали известны до анонса 4 ч.
Январская статистика Amazon показывает, что рынок центральных процессоров просел, но выросла популярность старых моделей 8 ч.
Наличие у Lenovo запасов памяти на весь год не помешало компании поднять цены на компьютеры 10 ч.
Власти США признали парниковые газы безопасными для людей — ДВС, уголь и нефть снова в игре 20 ч.
У NASA снова испортилась лунная ракета SLS — при попытке её заправить, топливо перестало поступать в баки 20 ч.
Робопсы будут патрулировать мексиканский стадион на Чемпионате мира по футболу 14-02 15:24
Китай запретит нетрадиционные рули в автомобилях — под ударом штурвалы Tesla 14-02 14:39
TSMC придётся вложить ещё $100 млрд в американское производство чипов ради сделки США и Тайваня 14-02 14:36
Disney потребовала от ByteDance отключить новейший ИИ-генератор видео Seedance 2.0 — он копирует персонажей Star Wars и Marvel 14-02 14:29