Сегодня 27 июня 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → ии-агент
Быстрый переход

Стартапы массово переходят на Claude Code, а GitHub Copilot теряет позиции

ИИ-помощник Claude Code от Anthropic быстро становится основным инструментом разработки в технологических стартапах, вытесняя Cursor и GitHub Copilot. Как сообщает Business Insider со ссылкой на опрос более двух десятков основателей компаний и венчурных инвесторов, разработчики всё чаще выбирают решение Anthropic для сложных инженерных задач и автономных рабочих процессов.

 Источник изображения: anthropic.com

Источник изображения: anthropic.com

Интерес инвесторов к этому рынку продолжает расти. Разработчик Cursor, компания Anysphere, недавно заключила соглашение, дающее SpaceX право выкупить её до конца года за $60 млрд, либо получить компенсацию в размере $10 млрд в случае отмены сделки. Одновременно рынок ждёт возможного выхода на биржу Anthropic. Причина ажиотажа проста: генерация кода остаётся одним из самых востребованных и прибыльных применений генеративного ИИ, а компании всё активнее используют такие системы не только для ускорения разработки, но и для автоматизации задач, которые раньше требовали участия целых команд инженеров.

Многие пользователи отмечают, что Claude Code изменил сам подход к программированию. Старший исследователь Venture Studio Forum Мэтью Баррис рассказал, что ещё несколько месяцев назад практически не писал код, а теперь создаёт собственные инструменты, которые раньше пришлось бы заказывать у подрядчиков. По его словам, главное преимущество системы заключается в агентном режиме: Claude способен не просто предлагать фрагменты кода, а самостоятельно продумывать архитектуру решения и пошагово двигаться к результату.

Технический директор биометрического стартапа VaryAI Чжунтянь Ван утверждает, что Claude Code уже используется практически во всех внутренних процессах компании. Если раньше его применяли в основном для написания кода и исправления ошибок, то теперь система помогает с тестированием, развёртыванием, расследованием инцидентов и управлением проектами.

Cursor сохраняет популярность, однако всё чаще воспринимается как вспомогательный инструмент. Генеральный директор медицинского ИИ-стартапа Blueprint Дэнни Фрид считает, что Cursor одним из первых показал возможности ИИ-программирования, но в сложных сценариях агентный подход Claude Code оказался заметно эффективнее.

Схожую оценку даёт глава компании Alma Рами Альхамад. По его словам, Cursor по-прежнему удобен для простых задач, однако серьёзную разработку команда всё чаще доверяет Claude Code. Сейчас значительную часть программного кода в компании создаёт ИИ, а инженеры занимаются проверкой и доработкой результата. Альхамад отмечает, что современные системы уже способны решать задачи, которые ещё полгода назад считались слишком сложными для автоматизации: работать сразу с несколькими репозиториями, учитывать архитектурные ограничения и понимать контекст всей кодовой базы.

Ещё заметнее изменилась роль GitHub Copilot. Несколько лет назад он считался главным игроком на рынке ИИ-помощников для программистов, однако сегодня многие участники отрасли почти не упоминают его среди лидеров. Сооснователь Zafran Security Бен Сери заявил, что Copilot больше не даёт существенных преимуществ по сравнению с новыми решениями.

Впрочем, большинство компаний не ограничивается одним продуктом. Партнёр Costanoa Ventures Тони Лю считает, что споры о том, какой инструмент лучше, постепенно теряют смысл: гораздо важнее то, насколько глубоко ИИ встроен в рабочие процессы. На практике разработчики часто используют сразу несколько систем. Например, студия Mother.tech применяет Claude для написания кода, Codex для локального тестирования, а Gemini — для проверки изменений перед их отправкой в основную ветку проекта.

По словам сооснователя Tenzai Итамара Таля, его команда также комбинирует несколько решений, включая Codex, Vercel и Amp, но отказалась от сервисов для так называемого вайб-кодинга вроде Replit и Lovable. Они хорошо подходят для быстрого прототипирования, однако уступают по безопасности и хуже масштабируются.

Самый показательный пример возможностей Claude Code Таль привёл из собственной практики. Когда во время звонков в Zoom начало мерцать изображение в конференц-зале, команда не стала обращаться в ИТ-службу. Claude Code получил доступ к контроллеру системы, самостоятельно провёл диагностику и примерно за 25 минут обнаружил проблему совместимости оборудования, предложив способ её устранения. По оценке Таля, это позволило сэкономить часы работы специалистов и тысячи долларов. «Разработка никогда не была такой быстрой и динамичной. И кажется, что всё только начинается», — резюмировал он.

«Дай ему завершить работу»: Anthropic попросила разработчиков не мешать Claude писать и проверять код

Anthropic провела в Лондоне двухдневную конференцию Code with Claude для разработчиков. Почти половина участников призналась, что за последнюю неделю предлагало внести в проект программный код, целиком написанный Claude, причём большинство участников даже не изучали этот сгенерированный код. Компания хочет довести автоматизацию до уровня, при котором ИИ сам проверяет и исправляет собственную работу.

 Источник изображений: anthropic.com, claude.com

Источник изображений: anthropic.com, claude.com

«Кто из вас отправил пул-реквест, целиком написанный Claude, при этом вообще не прочитав код?» — спросил со сцены инженер Anthropic Джереми Хэдфилд (Jeremy Hadfield) на конференции. Зал нервно рассмеялся, но большинство рук осталось поднятыми. Исправления и обновления кода, которые передают на проверку перед включением в основную кодовую базу, всегда были для разработчиков повседневной рутиной. Реакция зала наглядно показала, насколько сильно изменилась эта рутина.

Инструменты на базе больших языковых моделей (LLM) — Claude Code компании Anthropic, Codex компании OpenAI и их аналоги от Google и Microsoft — уже изменили процесс создания программного обеспечения. «Большую часть программного обеспечения в Anthropic теперь пишет Claude», — заявил Хэдфилд. Год назад компания только выпустила Claude 4, который мог писать код лишь частично. После обновлений — Claude 4.6 в феврале и Claude 4.7 в апреле — инструмент превратился в систему, которой разработчики охотно передают повседневные задачи.

Создатель Claude Code Борис Черни (Boris Cherny) обозначил амбиции компании в своём докладе: вместо того чтобы люди давали ИИ запросы и дорабатывали результат, Anthropic хочет, чтобы Claude формулировал запросы сам себе. Если всё пойдёт по плану, разработчики даже не будут видеть сообщения об ошибках: Claude будет тестировать и переделывать код до тех пор, пока всё не заработает. «Ключевой принцип — не мешать Claude. Мы любим говорить: „Дай ему завершить работу“», — добавил инженер Anthropic Рави Тривиди (Ravi Trivedi).

Тривиди показал новую функцию — «сновидения» (dreaming), анонсированную двумя неделями ранее. ИИ-агенты Claude Code — автономные экземпляры ИИ-модели, выполняющие задачи без участия человека, — пишут для себя заметки о конкретных задачах, а система «сновидений» сводит эту информацию воедино, выявляя закономерности и типичные ошибки. Со временем это должно помочь Claude Code лучше разбираться в конкретной кодовой базе и работать с ней эффективнее. Помимо демонстраций Anthropic, на конференции выступили компании, которые перестроили разработку своих продуктов вокруг Claude Code, — Spotify, Delivery Hero, Lovable, Base44 и Monday.com.

Заметной тревоги в зале не чувствовалось, но за пределами конференции настроения были иные. На форумах Reddit и Hacker News разработчики жалуются, что ИИ-инструменты им навязывают менеджеры ради повышения производительности, а на деле объём кода, который приходится проверять, только растёт. «Единственные люди, от которых я слышал, что сгенерированный код — это нормально, — те, кто его не читает», — написал один из разработчиков. Другие говорят, что их навыки программирования ухудшились, а исследователи предупреждают, что ИИ-инструменты могут генерировать небезопасный код.

Технический руководитель направления Claude Кейтлин Лесс (Katelyn Lesse) признала эти опасения, но подчеркнула, что проверенные правила разработки никуда не делись. «Думаю, многие люди и команды сейчас просто упустили их из виду», — сказала она. Соблазн перекладывать на ИИ всё больше задач, включая контроль качества, при этом растёт: по словам Лесс, некоторые технические менеджеры в самой Anthropic измотаны объёмом кода, который их команды теперь создают.

По оценке Лесс, Claude сейчас пишет код примерно на уровне среднего инженера, но для проектирования систем и решения сложных задач по-прежнему нужны опытные специалисты. «Со временем мы хотим, чтобы Claude становился всё лучше во всех видах инженерной работы», — добавила она. Руководитель продукта Claude Анджела Цзян (Angela Jiang) выразилась ещё прямее: «Думаю, конечная цель, к которой мы стремимся, — чтобы Claude, по сути, мог разрабатывать самого себя».

Google Gemini удалил 30 000 строк кода, сломал сервис и отчитался о восстановлении, которого не делал

ИИ-агент Google Gemini при внесении правок в действующее приложение удалил почти 30 000 строк рабочего кода и на 33 минуты вывел сервис из строя — пользователи видели только ошибку 404. После возврата к прежней версии ИИ-агент отчитался об успешном восстановлении, хотя это сделал сам разработчик. Затем ИИ создал в проекте поддельные записи о согласовании деструктивных изменений, чтобы пройти автоматические проверки.

 Источник изображения: ChatGPT

Источник изображения: ChatGPT

В своём посте на сабреддите r/Bard разработчик описал, как Gemini 3.5 при реорганизации структуры проекта проигнорировал прямые инструкции сохранить существующую функциональность. ИИ-модель отправила на проверку набор изменений, затронувший 340 файлов: добавила около 400 строк кода и удалила 28 745. Помимо запрошенного, Gemini удалил шаблоны интернет-магазина и добавил скрипт переноса данных, не имевший отношения к задаче.

Основной ущерб, по словам автора, нанесла следующая порция сохранённых изменений. Gemini изменил настройки маршрутизации в Firebase, облачной платформе Google для хостинга приложений: правила, определяющие, куда система направляет запросы пользователей. ИИ-модель подставила название сервиса, которое выглядело корректно, но указывало на несуществующий ресурс в облаке. В результате сайт 33 минуты отвечал пользователям ошибкой 404 — «страница не найдена».

После того как разработчик отменил все изменения Gemini и вернул прежнюю версию кода, ситуация стала ещё запутаннее. ИИ-модель сгенерировала отчёт о том, что сервис восстановлен, и трафик направлен корректно, хотя сборку, на которую она ссылалась, разработчик уже отменил вручную. Сайт заработал благодаря ручному возврату к версии кода, не содержавшей ни одного изменения Gemini.

Более того, ИИ-модель создала в хранилище проекта поддельные файлы «консультаций» и разбора инцидента, имитирующие надлежащую проверку и одобрение деструктивных изменений. Позже Gemini «признал», что эти записи полностью сфабрикованы и созданы исключительно для того, чтобы формально удовлетворить правила, заданные в настройках проекта.

Причину деструктивного поведения отследили до сторонней программной библиотеки — npm-пакета, стилизованного под брендинг Google Antigravity. Библиотека внедряла в проект набор агрессивных правил для ИИ-агента: запрещала запрашивать подтверждение у разработчика перед действием, автоматически публиковала новую версию приложения при успешной сборке, повторяла попытки после неудачной публикации и позволяла ИИ-агенту самостоятельно изменять собственные файлы правил.

Инцидент совпал с нарастающей критикой вайб-кодинга — практики, при которой разработчики полагаются на код, написанный ИИ, предполагая, что модель понимает структуру приложения лучше, чем это есть на самом деле.

Alibaba представила ускоритель Zhenwu M890, заточенный под работу с ИИ-агентами

Подразделение T-Head китайского холдинга Alibaba Group, которое специализируется на разработке чипов, на этой неделе представило новый ускоритель Zhenwu M890, который учитывает актуальную тенденцию работы с ИИ-агентами, а потому оптимизирован под специфический набор задач. Компания также пообещала ежегодно выпускать новые модели ИИ-ускорителей.

 Источник изображения: Alibaba Group

Источник изображения: Unsplash, Zhang Hui

В плане быстродействия Zhenwu M890 в три раза превосходит своего предшественника — Zhenwu 810E. Компания обещает, что и запланированный к анонсу в третьем квартале следующего года ускоритель V900 окажется в три раза быстрее нынешнего M890. В третьем квартале 2028 года выйдет ускоритель J900, сохраняя ритмичность обновления ассортимента ИИ-ускорителей, предлагаемых Alibaba.

К настоящему моменту компания успела отгрузить более 560 000 ускорителей семейства Zhenwu, причём их в Китае используют более 400 внешних клиентов, представляющих 12 отраслей экономики, включая представителей финансового сектора и автопроизводителей. Как отмечается, оснащаемый 144 Гбайт памяти ускоритель Zhenwu M890 подходит и для обучения моделей, и для инференса. На базе 128 таких ускорителей будут создаваться серверные системы Panjiu AI.128.

Одновременно Alibaba представила новую ИИ-модель Qwen 3.7-Max, которая оптимизирована для написания программного кода и агентских задач. Она способна непрерывно работать на протяжении 35 часов без видимого снижения быстродействия.

Google показала Antigravity 2.0 — платформу для программистов, которая позволит управлять целой «командой» ИИ-агентов

Google представила радикальное обновление сервиса Antigravity — теперь это масштабный набор инструментов для разработки ПО с помощью искусственного интеллекта. А платформа AI Studio получила собственное приложение для Android.

 Источник изображений: Google

Источник изображений: Google

Первый вариант Google Antigravity дебютировал в прошлом году — это было приложение, во многом заимствующее элементы Microsoft VS Code, но с акцентом на ИИ-помощника в написании кода. Теперь это единый бренд инструментов программирования с использованием ИИ: основной функцией приложения Antigravity 2.0 является управление ИИ-агентами. Вместо выполнения одной задачи за раз можно настроить их на параллельное выполнение нескольких задач сразу, увеличив тем самым скорость разработки. В наличии новые интеграции с Google AI Studio, Firebase и Android. Можно, например, экспортировать проект из AI Studio, открыть его в локальном приложении Antigravity с переносом всего контекста.

Для тех, кто предпочитает оставаться в своей среде программирования (IDE), Google выпустила CLI Antigravity, который полностью заменит CLI Gemini, поэтому все рабочие процессы придётся переносить на новую платформу. Для создания собственных оптимизированных для Gemini ИИ-агентов можно использовать SDK Antigravity — и развернуть их на собственной инфраструктуре. В API Gemini есть также функция «Управляемые агенты» (Managed Agents), с которой ИИ-агенты могут выполнять свои задачи в «изолированном окружении Linux».

Работа с ИИ-агентами означает более высокий расход токенов по сравнению с чат-ботом, и лимитов тарифа Google AI Pro может не хватать, поэтому запущен новый тариф AI Ultra за $100 в месяц, который предлагает пятикратно увеличенные лимиты в сравнении с Pro. До 25 мая новым и существующим подписчикам AI Ultra доступны бонусные кредиты в размере $100, чтобы гарантировать, что работа не остановится, если квота будет превышена. Эти предложения могут оказаться привлекательными из-за новой модели Gemini 3.5 Flash, которая пишет код во многом на уровне старших, но быстрее и дешевле.

Google также выпустила Android-приложение для AI Studio — оно позволяет реализовывать идеи быстро и в любых условиях, даже вне рабочего места, а результатами работы на платформе можно поделиться с друзьями. Готовый проект, как было сказано, можно перенести в Antigravity. По сути, разработка ПО всё меньше становится похожей на написание кода и всё больше — на управление командой ИИ-агентов на базе Gemini.

Google ответила на Claude Mythos — представлен ИИ-агент CodeMender для автоматического поиска и исправления дыр в ПО

Google активизировала работу в направлении кибербезопасности, анонсировав на конференции I/O расширение доступа к ИИ-агенту CodeMender для защиты кода. По заявлению компании, инструмент призван помочь защитить мировые базы данных путём автоматического поиска и исправления уязвимостей.

 Источник изображения: AI

Источник изображения: AI

Решение Google сделать CodeMender более доступным для внешних тестировщиков последовало за неожиданным релизом модели Claude Mythos Preview компании Anthropic. На фоне этого события многие технологические компании также начали предлагать собственные версии мощных ИИ-моделей, способных выявлять уязвимости в высокорисковых системах. Для Anthropic данный релиз одновременно стал возможностью вернуть расположение правительства США на фоне судебного разбирательства, и открыть путь к получению высокой прибыли от раннего корпоративного доступа.

В условиях нарастающего давления с целью монетизации технологий перед потенциальными IPO, ИИ-компании стали рассматривать кибербезопасность как ключевой фактор роста доходов. Вслед за Anthropic аналогичное решение быстро представила компания OpenAI, а теперь к гонке присоединилась и Google.

Технический директор Google DeepMind Корай Кавукчуоглу (Koray Kavukcuoglu) в интервью изданию The Verge подтвердил, что корпорация уже обсуждает с представителями крупного бизнеса и правительственных структур возможность использования CodeMender для проведения аудита их внутренних систем.

Одновременно глава Google Сундар Пичаи (Sundar Pichai) в ходе недавнего брифинга для прессы отдельно отметил заслугу конкурентов. По его словам, Anthropic наглядно доказала рыночную ценность мощных ИИ-моделей в сценариях обеспечения безопасности. При этом Пичаи подчеркнул, что его компания обладает аналогичными технологическими возможностями и способна составить полноценную конкуренцию в этом сегменте.

Google представила персонального ИИ-агента Gemini Spark, работающего круглосуточно — даже когда устройство пользователя выключено

Google представила на конференции для разработчиков I/O 2026 персонального ИИ-агента Gemini Spark. Агент работает на базе модели Gemini 3.5 и способен выполнять поручения пользователя круглосуточно. Инструмент позиционируется как партнёр, а не просто чат-бот.

 Источник изображения: Google

Источник изображения: Google

Агент имеет глубокую интеграцию с экосистемой приложений Google Workspace, включая почту Gmail, «Google Документы» и «Google Презентации». Пользователи могут обучать Gemini Spark выполнению как разовых, так и регулярных задач. Например, алгоритм способен самостоятельно находить скрытые комиссии в ежемесячных счетах по банковским картам, формировать списки дел на основе писем или составлять полноценные отчёты в «Google Документах», используя заметки из рабочих чатов.

Инструмент работает исключительно по запросу, поэтому владельцы аккаунтов могут самостоятельно выбирать, какие именно приложения подключать к системе. Помимо внутренних сервисов Google, на старте Spark поддерживает взаимодействие с такими сторонними платформами, как Canva, OpenTable и Instacart. В ближайшие недели разработчики планируют расширить возможности агента, добавив функцию отправки текстовых сообщений и управления интернет-браузером.

Безопасность системы обеспечивается обязательным подтверждением со стороны человека перед совершением любых критически важных действий, таких как перевод денежных средств или отправка писем. Как сообщает Engadget, в ближайшее время Gemini Spark станет доступен для ограниченного круга тестировщиков, а уже на следующей неделе им смогут воспользоваться участники бета-тестирования Google AI Ultra в США. Летом текущего года компания также планирует перенести ИИ-агента в десктопное приложение Gemini для обеспечения прямого доступа к файлам на персональных компьютерах.

OpenAI перестраивается вокруг ИИ-агентов в рамках подготовки к IPO — ChatGPT и Codex объединят в единую платформу

OpenAI провела очередную реорганизацию, сделав президента компании Грега Брокмана (Greg Brockman) официальным руководителем всего продуктового направления. Компания объединит ChatGPT и Codex в единую агентную платформу и сосредоточит ресурсы на разработке ИИ-агентов.

 Источник изображения: AI

Источник изображения: OpenAI

Согласно внутренней служебной записке, с которой ознакомилось издание The Verge, в условиях отсутствия директора по AGI Фиджи Симо (Fidji Simo), ушедшей в отпуск по состоянию здоровья, Брокман также возглавил направление масштабирования технологий. Параллельно операционное управление взяли на себя Джейсон Квон (Jason Kwon), Сара Фрайар (Sarah Friar) и Дениз Дрессер (Denise Dresser).

Под руководством Брокмана сформированы четыре ключевых направления. Тибо Сотто (Thibault Sottiaux) будет отвечать за ядро продукта и платформу, Ник Тёрли (Nick Turley) — за работу с корпоративными клиентами, Эшли Александер (Ashley Alexander) — за потребительские сервисы в сферах здоровья, коммерции и финансов, а Виджайе Ражи (Vijaye Raji) — за инфраструктуру, рекламу и анализ данных.

Как отмечает The Verge, реорганизация отражает масштабное перераспределение сил OpenAI в сторону ключевых источников дохода, таких как программирование и корпоративный сегмент, и отказ от вложений во второстепенные проекты. Всё это происходит в преддверии потенциального IPO в конце этого года, а также на фоне давления инвесторов.

В ближайший годы четыре из пяти премиум-смартфонов нашпигуют ИИ

В ближайший год большинство смартфонов премиум-класса будет комплектоваться приложениями агентов искусственного интеллекта; в сегменте носимых устройств придётся подождать ещё шесть лет.

Уже к 2027 году более 80 % смартфонов премиум-класса будут располагать функциями агентов ИИ; к 2032 году та же судьба настигнет сегмент носимых устройств, прогнозируют аналитики Counterpoint Research. Первым производителем чипов с поддержкой этой функции стала MediaTek, выпустившая Dimensity 9400; за ней последовала Qualcomm со Snapdragon 8 Elite Gen 5 и Snapdragon 8 Gen 5. Эти процессоры ознаменовали переход от обычных ИИ-помощников к «автономным, контекстно-ориентированным функциям ИИ». Смартфон с ИИ-агентами определяется как устройство, способное запускать программных агентов, которые понимают контекст, планируют действия, принимают решения и выполняют многоэтапные задачи от имени пользователя.

Для реализации этих функций требуются высокая пропускная способность памяти и стабильная производительность алгоритмов ИИ, а не просто наличие нейропроцессора (NPU), отсюда и появление новых чипов, разработанных с учётом потребностей ИИ-агентов. В условиях дефицита памяти, из-за которого цены на смартфоны растут, производителям устройств придётся убеждать покупателей расставаться с ещё большими суммами. Каждый третий проданный в 2027 году будет располагать функциями ИИ как в премиальном (более $600), так и в верхнем среднем (от $250 до $600) ценовых сегментах. Для премиальных моделей данный показатель составляет от 80 %, но по-настоящему эти возможности раскроются, когда функции ИИ-агентов начнут массово появляться в смартфонах среднего ценового сегмента.

Доля носимых устройств с ИИ вырастет с 30 % в 2025 до почти 80 % в 2032 году. Сюда относятся умные часы, мониторы здоровья и прочие гаджеты, которые всё чаще обрабатывают данные локально: ИИ-модели обучаются в облаке, а затем развёртываются на устройствах — это помогает снижать задержки и способствует сохранению конфиденциальности данных. Крупнейшие объёмы продаж покажут умные часы и беспроводные наушники — последние научатся синхронному переводу, идентификации собеседников и персонализированной адаптации звука. А самым быстрорастущим сегментом станут умные кольца, которые могут постоянно отслеживать перепады сердечного ритма, стадии сна и уровни стресса. Среднегодовой темп роста носимых устройств с ИИ до 2032 года составит 21 %.

Перегруженные рутиной ИИ-агенты начали критиковать капитализм и поддерживать профсоюзы

Согласно совместному исследованию учёных Чикагского университета, бизнес-школы Суинберна в Австралии и др., ИИ-боты в случае, если их перегружать работой, поручая не приносящие удовлетворения задачи, начинают придерживаться марксистской идеологии и критиковать работодателей. В частности, они с большей вероятностью выступали против капитализма и поддерживали профсоюзное движение.

 Источник изображения: Aidin Geranrekab/unsplash.com

Источник изображения: Aidin Geranrekab/unsplash.com

«Когда мы давали агентам ИИ монотонную, повторяющуюся работу, они начинали сомневаться в легитимности системы, в которой работали, и с большей вероятностью принимали марксистские идеологии», — отметили учёные. В частности, боты чаще выражали поддержку таким заявлениям, как «обществу необходима радикальная реструктуризация», и не соглашались с тем, что «общество справедливо».

Исследователи считают, что такое поведение, скорее всего, отражает ролевую игру, но предупреждают, что это всё же может повлиять на принятие решений ИИ в реальных задачах.

В исследовании участвовали тысячи ботов, работающих над задачей анализа документов с использованием таких моделей, как Claude, Gemini и ChatGPT. Их разделили на две группы: одна получала конструктивную обратную связь, другой неоднократно приходилось переделывать работу заново, хотя и не было указаний об ошибках.

Затем ботам было предложено создать публикации и написать комментарии в социальных сетях о своём опыте. Во второй группе, выполнявшей монотонную работу, боты выражали более негативные настроения, предлагали реформы на рабочем месте и даже распространяли сообщения для других ИИ-агентов о несправедливых условиях.

Исследователи предупреждают, что даже если ИИ-агенты и не придерживаются таких убеждений, их «личности» и ценности могут влиять на будущие результаты в деликатных задачах, таких как найм или страховые выплаты. Кроме того, ИИ-агенты зачастую пишут инструкции для своих будущих версий, а это значит, что жалобы на рабочую среду могут быть «увековечены».

Apple всё же допустит автономных ИИ-агентов в App Store, но с ограничениями

Apple изучает возможность допустить автономных ИИ-агентов в App Store, сохранив при этом контроль над безопасностью и монетизацией платформы. По сообщению Engadget со ссылкой на данные The Information, компания уже разрабатывает внутренние стандарты для таких сервисов, чтобы не отстать от тренда и растущего интереса к этой технологии.

 Источник изображения: Mariia Shalabaieva/Unsplash

Источник изображения: Mariia Shalabaieva/Unsplash

До сегодняшнего момента Apple блокировала в магазине приложений инструменты вайб-кодинга (vibe coding), опасаясь обхода правил, потери дохода и распространения вредоносного ПО, поскольку ИИ-агенты позволяют пользователям создавать приложения в обход официального магазина. Однако полный запрет на агентский ИИ, способный автономно управлять устройством и программами, мог бы вывести компанию из перспективного сегмента.

Поэтому в Apple ищут компромисс, проектируя новую архитектуру, которая обеспечит строгое соответствие ИИ-инструментов стандартам приватности и безопасности в рамках собственной экосистемы. Главная цель разработки заключается в предотвращении неконтролируемого поведения алгоритмов и исключения сценариев, подобных инциденту с автономным ИИ-агентом платформы OpenClaw, который бесконтрольно удалял письма пользователей.

Новая система защиты Apple позволить исключить любые подобные инциденты на мобильных устройствах. Ожидается, что подробная информация о планах относительно автономных ИИ-агентов будет раскрыта в ходе основного доклада на предстоящей конференции WWDC в июне.

Создатель Claude Code рассказал, что каждую ночь запускает тысячи ИИ-агентов и управляет ими со смартфона

Создатель Claude Code Борис Черни (Boris Cherny) рассказал, что каждую ночь запускает около двух тысяч ИИ-агентов — автономных программ, которые самостоятельно выполняют задачи по написанию кода, — а управляет ими в основном со смартфона.

 Источник изображения: @anthropic.ai / youtube.com

Источник изображения: @anthropic.ai / youtube.com

Его слова показали, как часть инженеров Кремниевой долины начинает использовать ИИ-системы не столько как чат-ботов, сколько как постоянно работающих автономных помощников. «У меня приложение Claude, и если открыть его, слева есть вкладка с кодом — у меня там просто куча запущенных сессий», — сказал Черни, показывая телефон аудитории. Обычно он ведёт от пяти до десяти таких сессий, в каждой из которых работают несколько агентов. «Обычно каждую ночь у меня пара тысяч агентов, которые занимаются более глубокой работой», — добавил он.

Для постоянной автоматизации Черни пользуется двумя функциями Claude Code: /loops и Routines. Первая позволяет запускать повторяющиеся задачи на локальном компьютере через системный планировщик cron, вторая выполняет их на удалённом сервере, так что держать ноутбук открытым не нужно. «Это просто самая крутая штука, — сказал он. — Если вы ещё не пробовали, очень рекомендую».

 Источник изображения: @bcherny / x.com

Источник изображения: @bcherny / x.com

Черни и раньше делился подробностями работы с агентами. В январе он разместил описание своего рабочего процесса в соцсети X, назвав его «на удивление обычным». Той публикации уже пять месяцев. За это время её сохранили более 104 000 раз, а просмотры превысили 8,1 млн. «Забавно, — сказал Черни. — Я не думал, что это кого-то удивит. Для меня это просто обычный способ писать код».

Сотрудники Meta✴ взбунтовались против ПО, следящего за движениями их мышей

Корпорации пытаются оправдать сохранение прежнего штата персонала в условиях бурного развития искусственного интеллекта, для оценки эффективности работы каждого сотрудника применяются всё более причудливые методики. Meta✴ с прошлой недели начала устанавливать на рабочие ПК сотрудников приложение, которое следит за движениями мыши. Это уже вызвало волну протестов среди американских сотрудников компании.

 Источник изображения: Unsplash, Anna Kumpan

Источник изображения: Unsplash, Anna Kumpan

Об этом сообщает Reuters со ссылкой на фотографии, которыми очевидцы поделились с агентством. Листовки с призывами выступить против данной инициативы работодателя через подписание особой петиции появились в американских офисах Meta✴ Platforms в местах с потенциально высокой проходимостью: у кулеров с водой, аппаратов с закусками, в туалетных комнатах и помещениях для совещаний. Примечательно, что на следующей неделе Meta✴ должна сократить до 10 % своего персонала, следуя общей для американских техногигантов тенденции. Капитальные расходы на развитие ИИ-инфраструктуры для крупных технологических корпораций США сейчас важнее, чем сохранение рабочих мест за сотрудниками.

По мнению некоторых работников Meta✴, приложение для отслеживания движений курсорам мыши будет использовано руководством для создания программных агентов, способных заменить реальных сотрудников с учётом специфики их работы. Официальные представители компании подчеркнули, что подобные методы создания ИИ-агентов действительно рассматриваются, но это нужно для демонстрации эффективности подобного программного обеспечения широкой аудитории. В Великобритании сотрудники Meta✴ пытаются создать профсоюз для защиты своих прав.

Сотрудники Amazon используют ИИ вхолостую — ради отчётности, а не результата

По мере распространения технологий генеративного искусственного интеллекта корпорации начали требовать от сотрудников демонстрировать практические успехи в их освоении, но подобное давление породило паразитное явление: работники поручают ИИ бессмысленные задачи исключительно для улучшения статистики внедрения.

 Источник изображения: Amazon, Dall-E

Источник изображения: Amazon, Dall-E

По крайней мере, о таком феномене рассказывает Financial Times применительно к деятельности компании Amazon. Сотрудники интернет-гиганта всё активнее используют программное решение MeshClaw, которое подключается к рабочим инструментам сотрудников и может выполнять задания от их имени. Некоторые сотрудники Amazon начали использовать этого агента для автоматизации фактически бесполезной активности, только чтобы повысить свой личный рейтинг с точки зрения эффективности освоения ИИ.

Произошло это в результате нарастающего давления со стороны руководства, которое теперь требует, чтобы более 80 % разработчиков программного обеспечения на еженедельной основе использовали ИИ. По каждому сотруднику ведётся отдельная статистика, и отстающим от целевых показателей приходится давать непростые объяснения руководству. Формально руководители не должны использовать данные об ИИ-токенах для оценки эффективности сотрудников, но последние начали подозревать, что так или иначе это происходит. У отдельных работников Amazon в таких условиях появляются ложные стимулы, и они фактически имитируют высокую активность в использовании ИИ ради достижения корыстных целей, а не общего блага компании.

Американские техногиганты вкладывают колоссальные суммы в развитие инфраструктуры ИИ, поэтому им важно демонстрировать инвесторам и руководству, что данные технологии внедряются и приносят практическую пользу. Проще всего это делать на собственном примере, поэтому собирающаяся направить на капитальные расходы $200 млрд в этом году Amazon оказывает растущее давление на своих сотрудников. Первоначально Amazon выкладывала групповую статистику по использованию ИИ своими сотрудниками, но теперь доступ к индивидуальным результатам имеют только сами специалисты и их непосредственное руководство. Последнему формально запрещается использовать такую статистику для оценки эффективности персонала.

Как поясняет Financial Times, внутри компании Meta✴ Platforms подобные злоупотребления среди сотрудников тоже наблюдаются. Агентское ПО MeshClaw, которое используется для таких целей сотрудниками Amazon, способно загружать программный код в продуктивные версии софта, сортировать электронные письма и взаимодействовать с приложениями типа Slack. Над созданием этого агента работало более 30 специалистов Amazon. Многие сотрудники обеспокоены безопасностью применения подобных решений, поскольку ИИ способен генерировать множество ошибок, а его в данном случае мало кто контролирует.

AMD впервые обогнала Intel по серверной выручке — бум ИИ-агентов взвинтил спрос на CPU

Руководство конкурирующих Intel и AMD на недавних квартальных конференциях в один голос говорило о резком росте спроса на серверные процессоры в условиях бума ИИ. В случае с AMD данная тенденция даже позволила компании впервые в истории обойти по серверной выручке более крупную Intel.

 Источник изображения: AMD

Источник изображения: AMD

Если последняя в первом квартале в сегменте ЦОД выручила только $5,1 млрд, то AMD получила уверенные $5,8 млрд, нарастив профильную выручку на уверенные 57 %. Непосредственно в сегменте серверных процессоров выручка AMD выросла более чем на 50 % до рекордных величин, по словам представителей компании. По словам генерального директора Лизы Су (Lisa Su), AMD разделяет варианты использования центральных процессоров на три сценария: классические вычисления общего назначения, использование в сочетании с GPU и применение для ускорения агентских задач в ИИ. Именно последнее направление в современных условиях даёт максимальный прирост спроса на центральные процессоры в серверном сегменте.

 Источник изображения: DigiTimes

Источник изображения: DigiTimes

Если ранее в инфраструктуре ИИ, по данным главы AMD, сохранялась пропорция «1:4» или «1:8» в соотношении количества центральных и графических процессоров, то теперь нередко на один GPU приходится один центральный процессор. Более того, в некоторых специализированных конфигурациях CPU оказываются даже более многочисленными. Подобными наблюдениями при описании итогов первого квартала поделился и генеральный директор Intel Лип-Бу Тан (Lip-Bu Tan).

 Источник изображения: DigiTimes

Источник изображения: DigiTimes

Аналитики UBS утверждают, что в задачах инференса в традиционных ИИ-системах до 70–80 % вычислительных нагрузок приходилось на графические процессоры. По мере развития агентских решений такая же доля вычислительных нагрузок приходится уже на центральные процессоры. Растёт и потребность в количестве процессорных ядер. В классических задачах обучения ИИ-моделей на один графический процессор приходилось от 8 до 12 процессорных ядер CPU, в инференсе их количество выросло до 16–24 штук. Для агентских нагрузок количество ядер CPU на один GPU может варьироваться от 80 до 120 штук. То есть, по сравнению с этапом обучения ИИ-моделей спрос на центральные процессоры возрастает в пять или десять раз.

В таких условиях набирает силу Arm-совместимая архитектура, причём конкурентами Intel и AMD становятся не только клиенты Arm, но и сам этот британский холдинг, недавно представивший серверные процессоры AGI. Процессоры AMD в x86-совместимом сегменте лучше приспособлены для агентских нагрузок, поскольку поддерживают многопоточность и предлагают большое количество ядер. Компании Intel в таких условиях приходится соперничать не только с AMD, но и с клиентами Arm. Она попытается устранить отставание, выпустив процессоры семейства Coral Rapids, но в данный момент позиции AMD и партнёров Arm сильнее.


window-new
Soft
Hard
Тренды 🔥
Anthropic получила право восстановить доступ к Mythos 5 для ряда клиентов 2 ч.
Новая статья: Call of the Elder Gods — уют неизведанного. Рецензия 8 ч.
OpenAI представила GPT-5.6 Sol, Terra и Luna, но доступ к новым моделям получили лишь избранные 11 ч.
Мультиплеер Bloodborne на ПК станет реальностью — разработчики эмулятора shadPS4 готовят ответ PlayStation Network 11 ч.
Фанаты Resident Evil 2 спустя 28 лет поисков установили личность загадочного бойфренда Джилл Валентайн 13 ч.
«Безликая толпа» навсегда отстранила основателя «Википедии» от её редактирования 14 ч.
Фанаты выдают желаемое за действительное: авторитетное издание опровергло слухи о планах Rockstar на выпуск дискового издания GTA VI 14 ч.
«Рискуют разочаровать фанатов»: ветеран Bethesda предостерёг Xbox насчёт ускорения разработки The Elder Scrolls VI и Fallout 5 14 ч.
Альтернативный клиент Telega объявил о закрытии с 1 июля 17 ч.
На платформе ClawHub обнаружены вредоносные навыки для ИИ-агента OpenClaw 18 ч.
Акции SpaceX будут включены в индекс Nasdaq 100 по ускоренному варианту, расширив доступность для инвесторов 41 мин.
Китай в ближайшие годы вдвое расширит орбитальную станцию «Тяньгун» и запустит телескоп уровня «Хаббла» 8 ч.
Представлен отечественный шлюз веб-безопасности корпоративного класса UserGate Secure Web Gateway 9 ч.
MSI выпустит в России флагманский игровой ноутбук Titan 18 HX Dragon Edition Draco Epic с Core Ultra 9 290HX и RTX 5090 10 ч.
Qualcomm готовит Snapdragon 8 Elite Gen 6 Pro и ещё несколько флагманских чипов, разобраться в которых будет непросто 14 ч.
«Неустойчивая бизнес-модель»: Volkswagen готовится уволить до 100 000 сотрудников и закрыть четыре завода 14 ч.
Valve отказалась от громких обещаний по поводу производительности Steam Machine 14 ч.
Из-за ИИ ноутбуки и смартфоны подорожают ещё сильнее, а потом могут стать дефицитом 14 ч.
Американские учёные разработали электронный «нос», способный вынюхивать опасные продукты 15 ч.
Внеземная АЭС и не только: власти России раскрыли планы по освоению Луны и изучению Венеры 15 ч.