Anthropic представила флагманскую ИИ-модель Opus 4.7 — она стала «самостоятельнее» и лучше в сложных задачах
Читать в полной версииКомпания Anthropic анонсировала новую общедоступную ИИ-модель Claude Opus 4.7. Эта версия вышла через два месяца после предыдущего обновления, что соответствует заявленному графику обновлений Anthropic. По данным компании, Opus 4.7 требует меньше контроля в сложных задачах программирования и способна распознавать изображения с более высоким разрешением. Она обладает повышенной креативностью и способна создавать качественные интерфейсы, слайды и документы.
Источник изображений: Anthopic
По словам Anthropic, Opus 4.7 представляет собой заметное улучшение по сравнению с Opus 4.6 в области разработки передового программного обеспечения, особенно в отношении самых сложных задач. Компания особо подчеркнула улучшения в отслеживании инструкций, многомодальной поддержке, работе в реальных условиях и использовании памяти.
«Пользователи сообщают, что могут с уверенностью передавать свою самую сложную работу по программированию — ту, которая ранее требовала тщательного контроля — Opus 4.7. Opus 4.7 обрабатывает сложные, длительные задачи с тщательностью и последовательностью, уделяет точное внимание инструкциям и разрабатывает способы проверки собственных результатов перед отправкой отчёта», — сообщила Anthropic.
Работа со знаниями в офисных задачах
Компания заявила о «благоприятных результатах» в различных областях применения, включая агентное программирование и работу за компьютером, которые ставят Opus 4.7 выше 4.6, GPT-5.4 и Gemini 3.1 Pro, но ниже более универсальной Claude Mythos Preview. Однако Mythos не является общедоступной версией, как Opus 4.7, поскольку Anthropic делится ею только с ключевыми поставщиками программных платформ, такими как Apple.
Общий показатель несоответствия поведения модели Opus 4.7 по результатам автоматизированного аудита
«Opus 4.7 лучше использует память на основе файловой системы, — отметила компания. — Модель запоминает важные заметки в ходе длительной работы в несколько сессий и использует их для перехода к новым задачам, которые, как следствие, требуют меньше предварительного контекста».
Anthropic уделила особое внимание изменениям в обработке токенов в Opus 4.7: «Opus 4.7 — это прямое обновление Opus 4.6, но два изменения заслуживают внимания, поскольку они влияют на использование токенов. Во-первых, в Opus 4.7 используется обновлённый токенизатор, улучшающий обработку текста моделью. Компромисс заключается в том, что одни и те же входные данные могут соответствовать большему количеству токенов — примерно в 1,0–1,35 раза больше в зависимости от типа контента. Во-вторых, Opus 4.7 работает эффективнее на более высоких уровнях сложности, особенно на поздних этапах в агентных сценариях. Это повышает надёжность при решении сложных задач, но при этом означает, что генерируется больше выходных токенов».
Оценка агентного кодирования в зависимости от использования токенов
В Claude Code также появилась новая команда ultrareview, которая, по словам Anthropic, «запускает специальную сессию проверки, которая читает ваши изменения и отмечает то, что заметил бы внимательный рецензент».