Сегодня 17 августа 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

ИИ-помощники программистов начали перемещаться в интерфейс командной строки

Существующие уже не первый год инструменты для написания кода, основанные на искусственном интеллекте, такие как Cursor, Windsurf и GitHub Copilot, выступают в качестве законодателей моды в своём сегменте. И по мере развития ИИ-агентов эти инструменты меняют механизмы работы, перемещаясь в терминал — интерфейс командной строки, обращает внимание TechCrunch.

 Источник изображения: Mohammad Rahmani / unsplash.com

Источник изображения: Mohammad Rahmani / unsplash.com

Вместо работы только с кодом эти сервисы всё чаще взаимодействуют напрямую с оболочкой операционной системы, в которой работают, — это существенное изменение в процессе разработки ПО с использованием ИИ, и оно может повлиять на всю отрасль. Переход уже начали все крупные разработчики: в феврале Anthropic, Google DeepMind и OpenAI выпустили инструменты для программирования, ориентированные на работу с командной строкой — Claude Code, Gemini CLI и CLI Codex соответственно. Эти продукты уже завоевали популярность у своей аудитории.

Эту перемену легко не заметить, поскольку новые средства выпускаются преимущественно под теми же брендами, что и предыдущие, но на самом деле изменения носят глубокий характер. В будущем, считают создатели профильного бенчмарка Terminal-Bench, 95 % взаимодействия больших языковых моделей с компьютерами будут осуществляться через терминал или аналогичный интерфейс. Первое место в рейтинге теста занимает компания Warp, предложившая «агентную среду разработки» — нечто среднее между традиционной IDE и набором инструментов командной строки, таких как Claude Code.

 Источник изображения: Fotis Fotopoulos / unsplash.com

Источник изображения: Fotis Fotopoulos / unsplash.com

Чтобы оценить отличия нового подхода, полезно взглянуть на применяемые для его анализа бенчмарки. Так, задачи SWE-Bench составляются на основе открытых сообщений о проблемах на GitHub — это реальные фрагменты кода, которые не работают. Для поиска решения ИИ-модели предлагают собственные варианты, пока код не начнёт функционировать. Инструменты с поддержкой терминала позволяют взглянуть ещё шире, поскольку охватывают не только сам код, но и всю среду, в которой запускается приложение: помимо написания кода, решаются задачи по настройке Git-сервера и отладке.

В одной из задач, предлагаемых в Terminal-Bench, указывается программа для распаковки и приводится целевой текстовый файл — ИИ-агенту требуется произвести обратную разработку и определить подходящий алгоритм сжатия. В другой задаче — агенту предлагается собрать ядро Linux из исходного кода, но не упоминается, что этот исходный код необходимо предварительно скачать. Важно, что новый подход предполагает поэтапное решение задач — именно на основе этой способности оценивается ценность ИИ-агентов. Однако даже в этом случае они пока не решают все задачи — так, Warp вышел в лидеры, справившись лишь с чуть более чем половиной из них.

Тем не менее уже сейчас, подчёркивают эксперты, ИИ-агенты способны взять на себя значительную часть задач, которые обычно выполняет разработчик, и игнорировать это нерационально. Тот же Warp успешно справляется с повседневной работой по подготовке нового проекта, выявлению зависимостей и запуску — а в случаях, когда ИИ не справляется, он поясняет, почему.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Новая статья: Mafia: The Old Country — возвращение привычной «Мафии». Рецензия 21 ч.
Мошенники начали заменять контакты на смартфонах жертв при помощи файлов VCF 16-08 18:59
Сэм Альтман рассказал о перспективах OpenAI, ИИ и других технологий 16-08 17:14
Meta проведёт масштабные изменения в структуре ИИ-подразделений — в четвёртый раз за полгода 16-08 15:23
Google Gemini был доступен для россиян всего несколько часов 16-08 15:03
В рамках вторичного размещения персонал OpenAI продаст акций на сумму $6 млрд 16-08 07:17
Волна интереса к ИИ порождает новых миллиардеров с рекордной скоростью 16-08 04:34
Почти 30 тыс. серверов Microsoft Exchange Server оказались уязвимыми из-за нерасторопности администраторов 16-08 01:23
OpenAI заработала $2 млрд на мобильном приложении ChatGPT — в 30 раз больше всех конкурентом вместе 16-08 01:05
Google Gemini внезапно заработал в России без ограничений и ухищрений 16-08 01:03
США и Китай поменялись ролями: выбросы CO₂ в Поднебесной снизились, а в Америке выросли 2 ч.
Google потратит $9 млрд на развитие облачной и ИИ-инфраструктуры в Оклахоме — часть пойдёт на обучение электриков 3 ч.
AOC представила геймерский монитор с частотой обновления 420 Гц и ценой менее $225 6 ч.
В России наметили запуск межпланетной станции к Венере 6 ч.
Inspur разработала СЖО для мегаваттных стоек с 3-кВт ИИ-ускорителями 7 ч.
На пути к $10 млрд/год: Arista наращивает выручку и чистую прибыль на фоне бума ИИ 7 ч.
В Китае создали робота-рыбу с мягким телом, который сможет погрузиться на самое глубокое дно 9 ч.
В Пекине стартовали первые в мире Всемирные игры человекоподобных роботов 16-08 17:00
Автономность планшетов Surface Pro 11 снизилась вдвое — Microsoft изучает проблему 16-08 16:27
Asus выпустила белые версии GeForce RTX 5060 и Radeon RX 9060 XT в исполнении Dual 16-08 16:23