Сегодня 09 апреля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Команда из 16 ИИ-агентов Anthropic Claude смогла самостоятельно написать компилятор языка Си

Компания Anthropic провела эксперимент, сформировав группу из агентов искусственного интеллекта, которые совместными усилиями с нуля написали компилятор языка Си. Программа работает далеко от идеала, уступая существующим аналогам, но демонстрирует возможности современных систем ИИ.

 Источник изображения:  Luca Bravo / unsplash.com

Источник изображения: Luca Bravo / unsplash.com

Отчёт о проделанной работе представил исследователь Anthropic Николас Карлини (Nicholas Carlini). Он запустил в облачном окружении 16 экземпляров новейшей модели Claude Opus 4.6, подключил их к общей кодовой базе с минимальным контролем и поручил им с нуля разработать полноценный Си-компилятор. Работа заняла две недели, потребовала почти 2000 сессий работы сервиса Claude Code и обошлась примерно в $20 000 за доступ к ИИ по API. На выходе ИИ-агенты написали на языке Rust компилятор объёмом 100 000 строк кода, способный самостоятельно собрать загружаемое ядро Linux 6.19 на машинах с архитектурами x86, Arm и RISC-V.

В рамках эксперимента исследователь задействовал новую функцию Claude Opus 4.6 — «команду агентов». На практике каждый экземпляр Claude был запущен внутри собственного контейнера Docker — он клонировал общий репозиторий Git, принимал задачи посредством lock-файлов, после чего отправлял готовый код обратно в репозиторий. Центральный агент, который координировал бы работу прочих, отсутствовал. Каждый экземпляр определял наиболее очевидную задачу для дальнейшей работы и начинал её решать. Когда возникали конфликты слияния, ИИ-агенты разрешали их самостоятельно.

Получившийся таким образом компилятор Anthropic опубликовала на GitHub. Он действительно может компилировать код таких открытых проектов как PostgreSQL, SQLite, Redis, FFmpeg и QEMU, а также проходит 99 % тестов GCC. Но есть и серьёзные ограничения: он не компилирует 16-битный машинный код для запуска Linux, поэтому на этом этапе подключается GCC; ассемблер и линкер работают со сбоями; даже при наличии всех оптимизаций он производит менее эффективный код, чем GCC. Наконец, исходный код компилятора на Rust хотя и функционален, но по качеству он даже не близок к тому, что мог бы создать опытный программист.

 Источник изображения: Mohammad Rahmani / unsplash.com

Источник изображения: Mohammad Rahmani / unsplash.com

Автор проекта очень старался преодолеть некоторые из ограничений, но успеха так и не добился — при попытках добавить новые возможности или исправить ошибки существующие функции часто переставали работать. Сработала закономерность, при которой кодовая база разрастается до такой степени, что ни один участник проекта не может в полной мере её понять. Предел наступил на отметке около 100 000 строк кода — видимо, это максимум возможностей для автономных ИИ-агентов.

Компилятор характеризуется как «реализация в чистой комнате» — во время разработки у ИИ-агентов не было доступа в интернет. Следует также отметить, что указанные затраты в $20 000 — это только стоимость токенов при доступе к ИИ через API. Сумма не включает в себя расходы на обучение ИИ-модели, труд организовавшего проект исследователя, а также труд программистов, которые создали наборы тестов и эталонные реализации. Подготовительная работа действительно оказалась непростой — проектирование среды для ИИ-агентов потребовало больше усилий, чем непосредственное написание кода компилятора.

Обнаружилось, что многословные запросы тестов засоряют контекстное окно модели, и она теряет из виду то, чем занималась. Чтобы решить эту проблему, исследователь разработал средства запуска тестов, при которых выводятся только несколько строк сводки, а запись производится в отдельные файлы. Кроме того, у Claude отсутствует чувство времени — ИИ может часами запускать тесты, не продвигаясь вперёд; поэтому пришлось создать быстрый режим с обработкой от 1 % до 10 % тестовых случаев. Когда все 16 ИИ-агентов застряли в попытке обработать одну ошибку ядра Linux, пришлось в качестве эталона запустить GCC — он компилировал большинство кода самостоятельно, а ИИ-агентам доставались случайные фрагменты. Когда в этих фрагментах возникали ошибки, ИИ-агенты их исправляли.

Все эти недочёты отступают перед основным выводом — ещё год назад ни одна большая языковая модель не смогла бы проделать такую работу, даже при надлежащем контроле и неограниченном бюджете. Механизм параллельного запуска нескольких агентов с координацией действий через Git — новаторское решение, а разработанные автором исследования инженерные приёмы по повышению производительности ИИ-агентов способны оказать влияние на дальнейшее развитие сегмента ИИ-программирования.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
«Положит конец Cities: Skylines»: игроков впечатлил первый геймплей реалистичной градостроительной стратегии City Masterplan 4 мин.
Злоумышленники спрятали вирус для кражи данных кредиток в SVG-изображении размером 1 пиксель 19 мин.
Фишинг нового уровня: Microsoft предупредила об атаках с обходом 2FA 21 мин.
В Госдуме объяснили, почему Steam не грозит блокировка в России 59 мин.
Excel ошибочно считает 1900 год високосным — и этот баг останется навсегда 2 ч.
Gemini стал умнее: Google добавила «Блокноты» для сбора и хранения информации по темам 2 ч.
Microsoft раскрыла кампанию по взлому десятков тысяч домашних роутеров MikroTik и TP-Link 2 ч.
Хакеры взломали китайский суперкомпьютер и украли 10 Пбайт секретных данных, включая схемы ракет и военные исследования 2 ч.
«Союзмультфильм» начнёт применять ИИ при производстве мультфильмов 2 ч.
Надёжный инсайдер раскрыл, когда пройдёт следующий выпуск State of Play — ждать осталось недолго 2 ч.
Президент Microsoft намекнул на создание защищённых ЦОД в свете войны на Ближнем Востоке 5 мин.
Человекоподобные роботы Boston Dynamics Atlas начнут собирать автомобили Kia на американских заводах 13 мин.
Intel научилась изготавливать самые тонкие в мире чиплеты на базе нитрида галлия 18 мин.
«Роскосмос» впервые одобрил проект частной космической ракеты — её назвали «Воронеж» 37 мин.
TrendForce: начало поставок NVIDIA Rubin задержится, а Hopper для Китая выпустят меньше, чем ожидалось 51 мин.
Российская электроника может подорожать на 15–30 %: производители назвали невыполнимыми новые требования к локализации печатных плат 2 ч.
Apple начала продавать запчасти для MacBook Neo, iPhone 17e и ещё пяти устройств, представленных в марте 2 ч.
NASA и «Роскосмос» продлят работу старейшего модуля МКС до 2032 года 2 ч.
Цены на 30-Тбайт SSD для ЦОД за год взлетели в шесть раз — теперь они в 22,6 раз дороже HDD 2 ч.
Uber перенесёт рабочие нагрузки на чипы AWS Graviton и Trainium нового поколения 2 ч.