Сегодня 14 ноября 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Anthropic выпустила умнейшую нейросеть Claude 3.7 Sonnet — она бесплатна и превосходит DeepSeek R1 и OpenAI o3

Компания Anthropic, один из главных конкурентов OpenAI, выпустила Claude 3.7 Sonnet — свою первую «гибридную рассуждающую модель». По словам компании, она способна решать более сложные задачи, чем предшественницы, и превосходит их в таких областях, как математика и написание программного кода.

 Источник изображений: Anthropic

Источник изображений: Anthropic

Claude 3.7 Sonnet стала доступна в приложениях Claude и веб-версии чат-бота, в том числе и для бесплатных пользователей. Также взаимодействовать с новой нейросетью можно через API Anthropic, Amazon Bedrock и Google Cloud's Vertix AI — стоит новинка столько же, сколько и её предшественница, 3.5 Sonnet, то есть $3 за миллион входных токенов и $15 за миллион выходных токенов.

OpenAI и другие компании предлагают модели со способностью к рассуждениям отдельно от обычных генеративных ИИ-моделей. Anthropic решила совместить их в одной системе, чтобы получить универсальное решение. В результате пользователь может выбрать, когда модели Claude 3.7 Sonnet стоит отвечать нормально, а когда — подольше подумать над ответом. В стандартном режиме Claude 3.7 Sonnet представляет собой просто улучшенную версию прежней Claude 3.5 Sonnet с более свежими данными (её база включает информацию до ноября 2024 года). В режиме расширенного мышления ИИ самостоятельно размышляет перед ответом, что повышает производительность при решении задач по математике, физике, выполнению сложных инструкций, кодингу и многих других.

Руководитель отдела исследований продуктов Anthropic Дайанн Пенн (Dianne Penn) рассказала The Verge, что компания хотела упростить процесс использования модели. «Мы принципиально считаем, что рассуждения — это скорее особенность ИИ, чем совершенно отдельная вещь», — говорит она, отмечая, что Claude не нужно много времени, чтобы ответить на вопрос «который час?», в отличие от ответа на более сложный запрос, например «спланируй двухнедельную поездку в Италию, учитывая погоду в конце марта».

Помимо новой модели, Anthropic также выпускала «ограниченную исследовательскую предварительную версию» своего ИИ-агента для программирования под названием Claude Code. Хотя Anthropic уже предлагает такие ИИ-инструменты для кодинга, как Cursor, новый Claude Code компания позиционирует как «активного сотрудника, который может искать и читать код, редактировать файлы, писать и выполнять тесты, фиксировать и отправлять код на GitHub, а также использовать инструменты командной строки».

Anthropic также позволяет разработчикам управлять тем, как модель «думает», и даже устанавливать время на раздумья. «Иногда разработчику нужно просто сказать, что ответ на этот вопрос не должен занимать более 200 миллисекунд», — подмечает вице-президент Anthropic по продуктам Майкл Герстенхабер (Michael Gerstenhaber).

Пенн утверждает, что Claude 3.7 Sonnet заметно лучше конкурентов справляется с «агентским кодированием», финансовыми и юридическими задачами. По словам представительницы Anthropic, сотрудники компании активно используют новую модель для создания дизайна веб-сайтов, интерактивных игр и даже тратят до 45 минут на кодирование, «создавая тестовые наборы и итеративно редактируя тестовые примеры».

Пенн также рассказала, что компания тестирует свои модели на способность проходить олдскульную видеоигру Pokémon, имитируя нажатие кнопок контроллера через API. Claude 3.5 Sonnet не смог выбраться из Pallet Town в начале игры, в то время как версия 3.7 смогла победить нескольких боссов.

Выход Claude 3.7 Sonnet показывает, что индустрия ИИ движется к тому, чтобы вместо нескольких отдельных моделей предлагать одну модель, которая способна и быстро отвечать, и думать над сложными задачами. О чём-то подобном недавно говорил глава OpenAI Сэм Альтман (Sam Altman).

Источники:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Почитать и покататься: Минцифры расширило список веб-ресурсов, доступных при отключении мобильного интернета 17 мин.
Google обязали заплатить €572 млн немецким сайтам сравнения цен Idealo и Producto за то, что поисковик мешал их работе 22 мин.
Microsoft прикрыла лазейку для бесплатной активации Windows посредством KMS38 29 мин.
Вдохновлённый S.T.A.L.K.E.R. кооперативный шутер Misery вернулся в Steam — разработчики уладили конфликт с GSC Game World 54 мин.
Амбициозный симулятор жизни Paralives не выйдет 8 декабря в раннем доступе Steam — объявлена новая дата релиза 3 ч.
Сюжет со смыслом, опыт Call of Duty и апгрейд торговцев: глава Battlestate Games рассказал, чего ждать от Escape from Tarkov в версии 1.0 4 ч.
Биткоин упал ниже $95 000 на фоне снижения акций криптобирж и технологических компаний 4 ч.
Google предложила Еврокомиссии поменять подход к рекламе вместо продажи активов 5 ч.
Глава Microsoft раскритиковал идею единой доминирующей ИИ-модели на замену человека 5 ч.
Россияне продолжают смотреть замедленный YouTube — он остался в пятёрке самых популярных соцсетей в России 5 ч.
Европейский Очень большой телескоп в Чили увеличил чувствительность в десять раз — удивительные находки не заставят себя ждать 13 мин.
Распахните небо! У вас накурено: выбросы CO₂ от сжигания ископаемого топилва установили новый рекорд 34 мин.
Asus представила GeForce RTX 5060 и RTX 5060 Ti Dual Evo с короткими печатными платами и сдвинутым разъёмом питания 2 ч.
MSI представила плату PRO B840M-P EVO WIFI6E PZ начального уровня с разъёмами питания на обратной стороне 3 ч.
Adata и MSI рассказали о первой потребительской четырёхранговой памяти — 128 Гбайт в одной планке CUDIMM DDR5-5600 4 ч.
Samsung повысила цены на память на 60 % с сентября — строительство ЦОД для ИИ душит поставки для обычных потребителей 5 ч.
Пузырь не страшен: JPMorgan прогнозирует, что затраты на ЦОД и ИИ-инфраструктуру составят $5 трлн, а спрос будет «астрономический» 7 ч.
Рынок отреагировал на Asus Xbox Ally X «крайне положительно» — дошло до дефицита консолей 7 ч.
Астрономы впервые подловили звезду в момент обращения в сверхновую — в этот миг она «родила оливку» 7 ч.
Китайская SMIC отчиталась о росте прибыли на 29 % по итогам третьего квартала 8 ч.