Сегодня 21 мая 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Anthropic представила флагманскую ИИ-модель Opus 4.7 — она стала «самостоятельнее» и лучше в сложных задачах

Компания Anthropic анонсировала новую общедоступную ИИ-модель Claude Opus 4.7. Эта версия вышла через два месяца после предыдущего обновления, что соответствует заявленному графику обновлений Anthropic. По данным компании, Opus 4.7 требует меньше контроля в сложных задачах программирования и способна распознавать изображения с более высоким разрешением. Она обладает повышенной креативностью и способна создавать качественные интерфейсы, слайды и документы.

 Источник изображений: Anthopic

Источник изображений: Anthopic

По словам Anthropic, Opus 4.7 представляет собой заметное улучшение по сравнению с Opus 4.6 в области разработки передового программного обеспечения, особенно в отношении самых сложных задач. Компания особо подчеркнула улучшения в отслеживании инструкций, многомодальной поддержке, работе в реальных условиях и использовании памяти.

 Сравнительные результаты модели Opus 4.7 в ряде бенчмарков

Сравнительные результаты модели Opus 4.7 в ряде бенчмарков

«Пользователи сообщают, что могут с уверенностью передавать свою самую сложную работу по программированию — ту, которая ранее требовала тщательного контроля — Opus 4.7. Opus 4.7 обрабатывает сложные, длительные задачи с тщательностью и последовательностью, уделяет точное внимание инструкциям и разрабатывает способы проверки собственных результатов перед отправкой отчёта», — сообщила Anthropic.

 Работа со знаниями в офисных задачах

Работа со знаниями в офисных задачах

Компания заявила о «благоприятных результатах» в различных областях применения, включая агентное программирование и работу за компьютером, которые ставят Opus 4.7 выше 4.6, GPT-5.4 и Gemini 3.1 Pro, но ниже более универсальной Claude Mythos Preview. Однако Mythos не является общедоступной версией, как Opus 4.7, поскольку Anthropic делится ею только с ключевыми поставщиками программных платформ, такими как Apple.

 Общий показатель несоответствия поведения модели по результатам автоматизированного аудита

Общий показатель несоответствия поведения модели Opus 4.7 по результатам автоматизированного аудита

«Opus 4.7 лучше использует память на основе файловой системы, — отметила компания. — Модель запоминает важные заметки в ходе длительной работы в несколько сессий и использует их для перехода к новым задачам, которые, как следствие, требуют меньше предварительного контекста».

Anthropic уделила особое внимание изменениям в обработке токенов в Opus 4.7: «Opus 4.7 — это прямое обновление Opus 4.6, но два изменения заслуживают внимания, поскольку они влияют на использование токенов. Во-первых, в Opus 4.7 используется обновлённый токенизатор, улучшающий обработку текста моделью. Компромисс заключается в том, что одни и те же входные данные могут соответствовать большему количеству токенов — примерно в 1,0–1,35 раза больше в зависимости от типа контента. Во-вторых, Opus 4.7 работает эффективнее на более высоких уровнях сложности, особенно на поздних этапах в агентных сценариях. Это повышает надёжность при решении сложных задач, но при этом означает, что генерируется больше выходных токенов».

 Оценка агентного кодирования в зависимости от использования токенов

Оценка агентного кодирования в зависимости от использования токенов

В Claude Code также появилась новая команда ultrareview, которая, по словам Anthropic, «запускает специальную сессию проверки, которая читает ваши изменения и отмечает то, что заметил бы внимательный рецензент».

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Cloudflare сравнила Anthropic Mythos с опытным исследователем 15 мин.
Valve назвала абсурдом приравнивание лутбоксов в Counter-Strike к азартным играм 3 ч.
Google выложила в открытый доступ код эксплойта для уязвимости в Chromium, которую не исправляла 29 месяцев 3 ч.
Модель OpenAI решила задачу Эрдёша — и на этот раз с подтверждением математиков 3 ч.
Нейросеть Gemini начнёт объяснять пользователям, почему им стоит купить тот или иной товар 3 ч.
Postgres Professional представила СУБД Postgres Pro AXE для гибридных нагрузок 8 ч.
Цукерберг успокоил сотрудников Meta: новых массовых увольнений в этом году не ожидается 9 ч.
Microsoft позвала звёздного аналитика Мэттью Болла спасать стратегию Xbox 9 ч.
«Очередной шедевр Amanita»: авангардная головоломка Phonopolis от авторов Machinarium и Samorost стартовала в Steam с рейтингом 96 % 11 ч.
Embracer подтвердила сроки релиза следующей игры Warhorse Studios — новая Kingdom Come может выйти уже в 2027 году 12 ч.
Нереида оказалась единственным исконным спутником Нептуна — её состав не похож на состав объектов пояса Койпера 12 мин.
OpenAI торопится подать заявку на IPO до конца текущей недели 18 мин.
Глава Nvidia признал, что компания сдала китайский рынок конкурирующей Huawei 39 мин.
Microsoft продолжила закупать кредиты на удаление углерода: BioCirc получила контракт на 650 000 тонн CO2 2 ч.
SpaceX остаётся убыточной компанией и больше всего сейчас тратит на ИИ, а не на космос 2 ч.
Ридеры Boox серии Poke 7 получили рифлёный дизайн и поддержку Google Play 3 ч.
Выручка Nvidia в прошлом квартале взлетела на 85 % до рекордных $81,6 млрд 3 ч.
Samsung увернулась от забастовки, способной взвинтить цены на память — рабочие добились повышения премий 10 ч.
Китайские учёные впервые в истории запитали несколько движущихся по воздуху целей микроволновым лучом 11 ч.
Founders Edition, но не от Nvidia: китайская Lisuan Tech показала игровую видеокарту LX 7G100 в эталонном исполнении 11 ч.