Сегодня 02 июля 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Рассуждающий ИИ показывает лишь «иллюзию мышления», решили исследователи Apple

Apple представила результаты исследования новейших больших рассуждающих моделей ИИ (LRM). Из отчёта следует, что, хотя LRM превосходят стандартные LLM (большие языковые модели) при выполнении запросов средней сложности, они не дают желаемых результатов при усложнении заданий. Исследователи считают, что нынешняя популярность LRM — это просто мода, а результаты их работы — лишь «иллюзия мышления», несовместимая с мыслительным процессом человека.

 Источник изображения: unsplash.com

Источник изображения: unsplash.com

Исследователи уделили особое внимание моделям Claude 3.7 Sonnet Thinking от Anthropic, o3 от OpenAI, Gemini от Google и R1 LRM от DeepSeek, оценивая их возможности рассуждений в широком диапазоне тестов, выходящих за рамки стандартных задач по математике и написанию кода. Моделям также пришлось проектировать контролируемые среды головоломок, включая «Ханойскую башню».

Главной целью исследования было желание установить и оценить возможности рассуждений моделей, а не их способность достигать желаемого результата или ответа. Согласно выводам учёных, «хотя эти модели демонстрируют улучшенную производительность в тестах рассуждений, их фундаментальные возможности, свойства масштабирования и ограничения остаются недостаточно изученными».

Стандартные LLM и LRM показали схожие результаты при выполнении простых запросов. LRM демонстрировали некоторое преимущество при более сложных задачах благодаря их структурированным механизмам рассуждений («цепочкам мыслей»). Но ни LRM, ни LLM не справились с запросами максимальной сложности.

Несмотря на демонстрацию правильных алгоритмов, LRM испытывали трудности с обработкой сложных задач в традиционном пошаговом процессе рассуждений, демонстрируя недостатки и непоследовательность в логических вычислениях. Модели рассуждений требовали больше времени для обработки сложных запросов, однако неожиданно сокращали процесс рассуждений, что заканчивалось сбоем, несмотря на «наличие адекватного бюджета токенов».

Стоит отметить, что исследование Apple опубликовано на фоне катастрофического отставания компании от лидеров перегретого рынка искусственного интеллекта. По мнению аналитиков, это отставание составляет до двух лет. Если же пузырь искусственного интеллекта в ближайшее время всё же лопнет, Apple даже может оказаться в выигрыше.

Ещё в прошлом году многие эксперты высказывали опасения, что разработка продвинутых моделей ИИ застопорится из-за отсутствия высококачественного контента для дальнейшего обучения нейросетей. Однако генеральный директор OpenAI Сэм Альтман (Sam Altman) не увидел «никаких преград», а бывший генеральный директор Google Эрик Шмидт (Eric Schmidt) посчитал эти опасения беспочвенными.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
В следующем году PlayStation 5 Pro получит большое обновление с улучшенным алгоритмом масштабирования 2 ч.
Доисторическая метроидвания Primal Planet о выживании в мире динозавров и инопланетян получила дату выхода и новый трейлер 3 ч.
Huawei откроет исходный код языка программирования Cangjie для конкуренции с Java и Swift по всему миру 3 ч.
Baidu встроила генеративный ИИ в поиск, научила его лучше понимать китайский и запустила генератор видео по изображениям 3 ч.
Проверкой фактов в соцсети X займётся ИИ 3 ч.
Соавторы Subnautica и основатели Unknown Worlds покинули студию — их заменит бывший продюсер Dead Space 4 ч.
Figma собирается выйти на биржу и привлечь $1,5 млрд для конкуренции с Adobe, Canva и другими 5 ч.
Google оштрафовали на $314 млн за тайный сбор данных с неиспользуемых Android-смартфонов 5 ч.
«Хочу быть первым»: Кодзима нацелился разрабатывать игры в космосе и мечтает рискнуть жизнью как Том Круз 5 ч.
Windows 11 почти догнала Windows 10 по популярности — за несколько месяцев до окончания поддержки последней 5 ч.
Телескоп «Джеймс Уэбб» ударился в археологию и разглядел прошлое Млечного Пути в сотне древних галактик 25 мин.
G.Skill продемонстрировала в деле модуль памяти CAMM2 DDR5-10000 45 мин.
Acer выпустила внешний SSD Predator GP30 — до 8 Тбайт и 2000 Мбайт/с 2 ч.
Пользователи пожаловались на перегрев и аварийные отключения консоли Nintendo Switch 2 2 ч.
Попугай оправдан в деле о срыве пуска первой австралийской ракеты, но попытка старта снова отложена 3 ч.
«Большой красивый закон» Трампа предлагает повышение налоговых льгот на производство полупроводников в США 3 ч.
SK hynix поможет Intel интегрировать передовую память HBM4 в ускорители Jaguar Shores 3 ч.
Сеть, которая думает сама за себя: HPE добавила ИИ-агентов в Aruba Central, но клиенты не спешат передавать им полный контроль 3 ч.
Ажиотажный спрос на Xiaomi YU7 обеспечит TSMC рост выручки и заказов на передовые чипы для электромобилей 4 ч.
Samsung стала на шаг ближе к HBM4 — компания готова к выпуску DRAM шестого поколения 4 ч.