Сегодня 09 мая 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Инженеры проиграли ИИ: модель Claude Opus 4.5 справилась с заданием Anthropic лучше любого из людей

Anthropic вчера объявила о выпуске новой флагманской модели искусственного интеллекта Claude Opus 4.5. Позже компания рассказала, что в двухчасовом задании, предлагаемом самой Anthropic при найме сотрудников на инженерные позиции, Opus 4.5 показала лучший результат по сравнению с живыми участниками теста.

 Источник изображения: AI

Источник изображения: AI

По утверждению Anthropic, результат ИИ достигнут за счёт многократного решения каждой задачи и выбора лучшего из полученных ответов. Хотя тест не охватывает все компетенции, необходимые инженеру, сам факт превосходства модели над сильными кандидатами в ключевых технических аспектах заставляет предположить, что ИИ в будущем может изменить инженерию как профессию, пишет Business Insider.

Подробности содержания теста не раскрываются, но из отзывов на платформе Glassdoor известно лишь, что в 2024 году он включал четыре уровня и требовал реализации определённой системы с последующим добавлением функциональности. Неизвестно, был ли использован аналогичный формат задания при оценке новой версии Claude Opus 4.5, которая вышла спустя всего три месяца после предыдущей модели, получив улучшения не только в генерации кода, но и в создании профессиональных документов, включая таблицы Excel и презентации PowerPoint.

Данный релиз, по мнению специалистов, продолжает укреплять лидирующие позиции Anthropic в сфере ИИ для программирования. Даже компания Meta Марка Цукерберга (Mark Zuckerberg), являющаяся конкурентом в гонке ИИ, использует Claude для поддержки своего внутреннего помощника по кодированию под названием Devmate.

Методы обучения своих моделей компания держит в секрете. Однако ранее Эрик Саймонс (Eric Simons), генеральный директор стартапа Stackblitz, разработавшего сервис Bolt.new, предположил, что Anthropic, возможно, использует ИИ для написания и запуска кода, а затем анализирует результаты как с помощью людей, так и с применением ИИ-инструментов. Это описание подтвердила Дианна Пенн (Dianne Penn), руководитель направления управления продуктами, исследований и передовых технологий в Anthropic, назвав его «в целом верным».

Ещё в октябре глава Anthropic Дарио Амодеи (Dario Amodei) сообщил, что ИИ Claude уже пишет 90 % кода для большинства команд внутри компании. При этом он отметил, что это не приведёт к сокращению инженеров, а скорее наоборот, увеличит в них потребность, так как люди смогут сосредоточиться на самой сложной 10-процентной части работы или на контроле группы ИИ-моделей.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Новая статья: Saros — исправление ошибок, которых не было. Рецензия 8 ч.
«Мощный инструмент, но не замена художников и творцов»: руководство Sony прояснило использование генеративного ИИ в играх PlayStation 10 ч.
Роскомнадзор заявил, что не ограничивал доступ к GitHub 13 ч.
Шпионский боевик 007 First Light от создателей Hitman получил системные требования для игры в 4K, а трассировку пути придётся подождать 13 ч.
ИИ теперь пишет 60 % нового кода Airbnb — и сам решает 40 % запросов в техподдержку 15 ч.
Google начала тестировать ИИ-агента Remy — конкурента OpenClaw 15 ч.
Россияне массово жалуются на блокировки аккаунтов в Anthropic Claude — потеряны проекты и переписки с ИИ 15 ч.
Амбициозный хоррор Paranormal Activity: Threshold от создателя The Mortuary Assistant отменён из-за конфликта с Paramount Pictures 15 ч.
Архивировать интернет становится всё сложнее: Wayback Machine и Wikimedia страдают от дефицита HDD 15 ч.
«Золотой глобус» не будет дисквалифицировать номинантов из-за ИИ, но излишеств не допустит 17 ч.
TSMC отправит устаревшее оборудование для выпуска 28-нм чипов с Тайваня в Германию 4 мин.
В прошлом квартале AMD впервые выручила в сегменте ЦОД больше Intel 54 мин.
Грузовики Tesla Semi получили батареи меньшей ёмкости, чем планировалось, но на запасе хода это не сказалось 2 ч.
Акции Intel подскочили в цене на 14 % после появления информации о сделке с Apple 3 ч.
Intel снова будет производить чипы для Apple, но не как раньше — WSJ узнала о предварительном соглашении 9 ч.
Logitech нарастит инвестиции в игровые продукты, ИИ и корпоративный сегмент 11 ч.
Пентагон рассекретил первую партию файлов об НЛО — впечатлить скептиков не удалось 13 ч.
Gigabyte запустила продажи Aorus GeForce RTX 5090 Infinity с необычным дизайном и скрытым вентилятором 14 ч.
У заднеприводных Cybertruck могут отвалиться колёса — Tesla отзывает все 173 проданных электромобиля 14 ч.
iFixit объявила «короля ремонтопригодности» среди наушников — у AirPods Max 2 всего 4 балла из 10 14 ч.