Сегодня 30 января 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Anthropic представила Claude Sonnet 4.5 — «лучший в мире» ИИ для программирования и сложных вычислений

Компания Anthropic анонсировала Claude Sonnet 4.5 — самую мощную на сегодняшний день большую языковую модель в семействе Claude. По словам разработчиков, она ориентирована на программирование, построение ИИ-агентов и решение сложных задач. A Anthropic заверили, что Sonnet 4.5 стал не только лидером в профильных бенчмарках, но и демонстрирует заметный скачок в понимании программного кода, математических вычислениях и управлении компьютером.

Claude Sonnet 4.5 занял первую строчку в SWE-bench Verified — отраслевом тесте, который измеряет реальные способности ИИ-моделей к написанию и анализу программного кода. По данным Anthropic, Sonnet 4.5 способен поддерживать концентрацию более 30 часов при работе над сложными многоэтапными задачами, обходя предыдущие версии Claude и ближайших конкурентов.

В тесте OSWorld, проверяющем работу ИИ с реальными компьютерными задачами, Sonnet 4.5 показал результат 61,4 % против 42,2 % у версии Sonnet 4, что иллюстрирует резкий рост производительности за последние месяцы.

Новая модель показала себя не только в программировании. По результатам внутренних и независимых тестов, Sonnet 4.5 демонстрирует серьёзный прогресс в задачах логического вывода и математики, а также в специализированных областях: финансах, медицине, праве и STEM-дисциплинах. Разработчики отмечают рост качества генерации и анализа кода, управление файлами и сложными вычислениями в реальном времени.

Появился и экспериментальный режим Imagine with Claude: теперь ИИ может создавать программные решения буквально «на лету», полностью адаптируя код под текущие запросы пользователя.

Одновременно с выпуском Sonnet 4.5 компания представила крупные обновления экосистемы Claude. В сервисе Claude Code появились чекпоинты для сохранения прогресса, обновлённый терминал и нативное расширение для Visual Studio Code. В приложениях Claude теперь доступна непосредственная работа с кодом, создание файлов (включая таблицы, презентации и документы) прямо в диалоге, а пользователи с подпиской Max получили расширение для Chrome.

Для разработчиков открыт новый набор инструментов — Claude Agent SDK. Он позволяет создавать собственных интеллектуальных агентов на базе тех же технологий, что лежат в основе Claude Code. SDK реализует сложную работу с памятью, управлением правами и координацией подзадач между агентами — то есть открывает возможности построения продвинутых решений под любые задачи.

Помимо того, что Claude Sonnet 4.5 стала самой способной, она также стала самой «воспитанной» ИИ-моделью компании: снижено количество опасных и нежелательных паттернов поведения, таких как подыгрывание пользователю, попытки обойти ограничения или выполнение вредных запросов. В рамках защиты пользователей, Anthropic применяет многоуровневые фильтры (AI Safety Level 3), особенно в отношении тем, связанных с химическими, биологическими, ядерными и другими видами оружия. Также фильтры стали точнее: количество ложных срабатываний удалось снизить в 10 раз по сравнению с предыдущими релизами.

Claude Sonnet 4.5 уже доступен для всех пользователей через веб-версию чат-бота, а также в мобильных приложениях. Также новая ИИ-модель доступна API по цене старой (от $3 за миллион токенов). Новые возможности Claude Code и Agent SDK доступны всем разработчикам и корпоративным клиентам.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
В США расследуют, имели ли сотрудники Meta доступ к «секретным» чатам WhatsApp 3 мин.
ChatGPT скоро лишится устаревших моделей GPT-4o, GPT-4.1, GPT-4.1 mini и o4-mini 10 мин.
«Игра явно не готова к выходу»: ролевой аниме-боевик Code Vein 2 стартовал в Steam с рейтингом 52 % 57 мин.
Спустя 13 лет классическая Final Fantasy VII в Steam получит новую версию — когда и зачем, Square Enix не сказала 2 ч.
Microsoft попытается вернуть доверие к Windows 11, подорванное багами, замедлением и насаждением Edge, Bing, OneDrive и Copilot 2 ч.
Китайский ролевой боевик Genigods: Nezha отправит сражаться с богами и спасать мир от пространственно-временного коллапса — геймплейный трейлер 3 ч.
Google открыла широкий доступ к Genie — ИИ-генератору игровых миров 3 ч.
В видеоигры играет «почти каждый второй россиянин» — к 2035 году объём индустрии в стране превысит полтриллиона рублей 4 ч.
«Руки не держат, ноги дрожат»: атмосферный симулятор альпиниста Cairn оставил игроков и критиков в полном восторге 5 ч.
Epic Games Store устроил раздачу Definitely Not Fried Chicken — вдохновлённого сериалом «Во все тяжкие» симулятора закусочной с подвохом 16 ч.
Биоинженеры впервые встроили квантовый механизм в природный белок 11 мин.
В России стартовали продажи смартфонов Oppo Reno 15 и Reno15 F с 50-Мп фронтальными камерами и ёмкими батареями 2 ч.
Выручка Western Digital подскочила на четверть — 9 из 10 жестких дисков теперь идут в серверы 2 ч.
Астрономы нашли похожую на Землю планету-снежок 2 ч.
Нужно больше финансирования: OpenAI наметила выход на IPO на четвёртый квартал 2026 года 3 ч.
Спасите наши SSD: VAST Data запустила программу VAST Amplify для повышения эффективности использования имеющихся SSD 4 ч.
Lightmatter представила оптический движок Guide для ИИ-платформ нового поколения 4 ч.
Россияне массово перешли на дешёвые наушники — продажи рекордно выросли 4 ч.
Apple признала, что страдает от нехватки чипов — и речь пока не о памяти 4 ч.
Роботакси Tesla попадают в ДТП в девять раз чаще, чем обычные машины с водителем 5 ч.