Сегодня 09 марта 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → агент
Быстрый переход

ИИ должен был заменить консультантов, но спрос на них только растёт — из-за массового внедрения ИИ

Консалтинговые услуги, как было принято считать до сих пор, станут той сферой деятельности, в которой искусственный интеллект достаточно быстро заменит собой человека. В действительности же, как отмечают эксперты, на первых порах спрос на услуги консультантов по внедрению ИИ в корпоративной сфере даже вырастет.

 Источник изображения: Unsplash, Scott Graham

Источник изображения: Unsplash, Scott Graham

Как поясняет The Wall Street Journal, представители бизнеса пока с опаской присматриваются к генеративному ИИ. Его масштабное внедрение может потребовать помощи профильных специалистов, услуги которых в ближайшее время будут весьма востребованы. Из 2000 компаний, опрошенных McKinsey в прошлом году, примерно две трети заявили об отсутствии активности по масштабному внедрению ИИ. В конце прошлого года более половины опрошенных PwC руководителей 4500 компаний признались, что не видят существенной выгоды от внедрения ИИ на данном этапе.

OpenAI и Anthropic привлекают к продвижению своих ИИ-инструментов в корпоративной среде профессиональные консалтинговые компании типа McKinsey, Boston Consulting Group, Accenture и Capgemini. Их представители, например, будут работать над внедрением ИИ-инструментов в корпорациях вместе с сотрудниками OpenAI. Конкурирующая Anthropic заключила соглашение в этой сфере с Deloitte ещё в прошлом году, а также сотрудничает с другими консалтинговыми компаниями.

Платформа OpenAI Frontier как раз призвана помочь компаниям в создании ИИ-агентов, ускоряющих работу сотрудников. Профильная команда инженеров стартапа состоит из примерно 70 специалистов. Представители консалтинговых компаний будут работать с ними рука об руку. Один из крупных европейских банков, например, использует Frontier для создания восьми сфер применения ИИ, включая функции распознавания голоса и оценку кредитных рисков. Консалтинговые компании могут ускорить внедрение ИИ в корпоративной среде и позволить клиентам быстрее получать желаемые результаты.

Внедрение ИИ уже демонстрирует рост спроса на услуги консультантов. В случае с компанией Accenture, например, сумма контрактов в данной сфере выросла в прошлом квартале с $1,8 до $2,2 млрд. Заказчики стремятся платить консультантам в этой сфере за получаемый от внедрения ИИ эффект, а не просто за количество нанятых при реализации проекта специалистов консалтинговой компании. Структура корпоративного управления во многом консервативна, как отмечают участники рынка. Многие владельцы бизнеса и руководители просто желают понимать, что в случае провала какой-то связанной с ИИ инициативы найдётся ответственный человек, которого можно назначить виновным за неудачу. Перевод консалтинговых функций исключительно на ИИ лишает руководство такой возможности. Тем не менее, в какой-то перспективе рынок консалтинговых услуг в его прежнем виде должен сжаться, признают его участники.

OpenAI представила ИИ-агента Codex Security, который сам находит и закрывает «дыры» в ПО

OpenAI объявила о запуске специализированного ИИ-агента Codex Security, функциональность которого сосредоточена на выявлении и исправлении угроз кибербезопасности. В компании подчёркивают, что инструмент способен работать с большими объёмами данных и генерировать корректные патчи, освобождая разработчиков от рутины.

 Источник изображения: AI

Источник изображения: AI

Технической основой для Codex Security, как стало известно Bloomberg, послужил проект Aardvark, использовавший мощности модели GPT-5, который OpenAI тестировала в закрытом режиме в прошлом году. Теперь эта технология для поиска и устранения уязвимостей трансформировалась в коммерческий продукт, который способен сканировать репозитории и обучаться на отзывах пользователей для совершенствования своих алгоритмов.

Анонс нового продукта усиливает давление на традиционные компании в сфере информационной безопасности и продолжает тренд на автоматизацию защиты, заданный компанией Anthropic. Выпуск инструмента Claude Code Security месяцем ранее уже продемонстрировал чувствительность рынка к таким инновациям, спровоцировав падение стоимости акций Crowdstrike и Cloudflare на 8 %.

Доступ к Codex Security откроется в ближайшие дни в формате исследовательского превью для корпоративных клиентов, использующих ChatGPT Enterprise и Business, а также для образовательных учреждений. Компания предусмотрела бесплатный пробный период продолжительностью в 1 месяц, чтобы организации могли оценить эффективность системы без первоначальных затрат.

«Яндекс» научил «Алису» управлять смартфоном по командам пользователя — ИИ-агент уже тестируется

В предварительной версии мобильного приложения «Яндекс — с Алисой AI» для Google Android появилась информация о запуске тестирования функции агента с искусственным интеллектом, передаёт «Коммерсантъ». В «Яндексе» информацию подтвердили.

 Источник изображения: play.google.com

Источник изображения: play.google.com

Голосовой ассистент получит глубокую интеграцию в интерфейс смартфонов под Android. С возможностями ИИ-агента «Алиса» позволит пользователям отправлять сообщения в мессенджерах, не вводя текст вручную, находить информацию на устройстве и устанавливать приложения по голосовым командам. В настоящее время воспользоваться функцией могут только добровольцы, которые ранее подали заявку на участие в программе тестирования, но в перспективе возможности ИИ-агента будут интегрированы в сервис «Алиса AI», сообщил источник издания.

Ранее функцию управления смартфонами запустила Google — ИИ-агентом выступает ассистент Gemini, который научился управлять приложениями. На первом этапе функция доступна только на смартфонах серий Samsung Galaxy S26 и Google Pixel 10, и работает она только с приложениями для заказа еды и вызова такси.

Вышел Perplexity Computer — сервис для управления 19 ИИ-агентами, сообща работающими над большими проектами от начала и до конца

Perplexity представила новый сервис Computer, призванный объединить все доступные приложения искусственного интеллекта в цельную систему. Комплексный сервис включает интерфейсы чат-ботов и ИИ-агентов, которые теперь могут совместными усилиями работать над поставленными пользователями задачами.

 Источник изображения: perplexity.ai

Источник изображения: perplexity.ai

Perplexity Computer выполняет стандартные для сервисов ИИ задачи: рассуждает, делегирует, производит поиск, запоминает информацию, пишет программный код и даёт ответы на вопросы. Чтобы начать работу, пользователь формулирует результат, который хочет получить. Сервис разбивает поставленную задачу на подзадачи и создаёт субагентов ИИ для их выполнения. Эти субагенты могут производить веб-поиск и изучать вопросы, генерировать документы, обрабатывать данные или производить вызовы API к подключённым сервисам.

Координация работы субагентов производится в автоматическом режиме, а функционируют они асинхронно. Пользователь может создавать другие задачи или запускать десятки единиц Perplexity Computer параллельно. Столкнувшись с проблемой в процессе решения основной задачи, сервис создаёт дополнительных субагентов для её решения. При необходимости он сам находит ключи API, исследует дополнительную информацию, пишет код приложений и обращается к пользователю, если в этом возникает потребность. Каждая задача выполняется в изолированной вычислительной среде с доступом к реальной файловой системе, браузеру и с возможностью интегрировать инструменты. На выходе, уверяет Perplexity, получается безопасная платформа с мощным ИИ, доступная без необходимости производить локальную настройку.

Считается, что модели ИИ превращаются в товар массового потребления, но в действительности, отмечают в компании, у наиболее популярных моделей формируется специализация. Так, рассуждения и управление субагентами Perplexity Computer сейчас поручено модели Anthropic Opus 4.6; созданием субагентов и решением задач в области глубокого исследования занимается Google Gemini; Google Nano Banana генерирует изображения, Veo 3.1 — видео; xAI Grok быстрее всех решает легковесные задачи, а поиск информации и данных в контексте осуществляет OpenAI ChatGPT 5.2. Основная платформа Perplexity не зависит от моделей — по мере развития они могут меняться; доступен выбор конкретных моделей для конкретных подзадач.

Google доверила агенту Gemini управлять приложениями и делать покупки в Android — старт с Pixel 10 и Galaxy S26

Компания Google представила агентскую функцию автоматизации для Gemini на смартфонах Pixel 10 и Samsung Galaxy S26. ИИ-агент сможет самостоятельно открывать приложения, делать заказы в магазинах и многое другое, заменяя действия пользователя.

 Источник изображения: Google

Источник изображения: Google

Нейросеть сможет не просто искать информацию, а выполнять конкретные действия в сторонних приложениях. Если попросить систему вызвать такси, Gemini самостоятельно откроет Uber или DoorDash в виртуальном окне и начнёт оформлять заказ. При этом, как пишет The Verge, пользователь может наблюдать, как ИИ переключает пункты меню, и может в любой момент остановить процесс или просто свернуть окно для продолжения задачи в фоновом режиме.

Система спроектирована так, что окончательное решение о заказе и его оплате должен принять сам пользователь: Gemini пришлёт уведомление с просьбой проверить заказ и подтвердить оплату. Если в процессе возникнет заминка, например, нужный товар закончился или нужно выбрать комплектацию, ИИ также об этом сообщит.

Технически реализация основана на «рассуждающей» модели Gemini 3, которая умеет визуально считывать интерфейс. Для разработчиков приложений Google предлагает на выбор специальные протоколы, например, MCP или Android App Functions, однако система способна функционировать и без них, просто анализируя изображение на экране и осуществляя клики по кнопкам, как это сделал бы живой человек.

По словам президента экосистемы Android Самира Самата (Sameer Samat), для пользователя неважно, с помощью каких технологических решений достигается подобная автоматизация, главное — чтобы задача была выполнена. В связи с этим, отмечает The Verge, возникает вопрос, не вызовет ли у разработчиков приложений недовольство тот факт, что они могут лишиться возможности показывать пользователям рекламные материалы своих сервисов. Комментируя эту ситуацию, представитель Google отметил, что развитие технологии неизбежно, и теперь перед сообществом разработчиков встанет задача по поиску правильных способов взаимодействия с ней. Сообщается, что агентские возможности будут глубоко интегрированы в будущие версии платформы, в частности в Android 17.

Не умеешь — научим, не хочешь — заставим: техкомпании буквально вынуждают сотрудников использовать ИИ

Если бизнес в целом пока не уверен, что внедрение ИИ приносит пользу здесь и сейчас, то представители технологического сектора не сомневаются в необходимости скорейшего его распространения, а потому нередко заставляют сотрудников пользоваться соответствующими новшествами против воли последних.

 Источник изображения: OpenAI

Источник изображения: OpenAI

Как поясняет The Wall Street Journal, некоторые вакансии теперь даже не подразумевают поиск кандидатов без навыков свободного владения навыками работы с системами генеративного искусственного интеллекта. Картина характерна не только для американских техногигантов типа Amazon, Google и Meta✴ Platforms, но и небольших стартапов. Глава стартапа Conductor Сет Бесмертник (Seth Besmertnik), численность штата которого не превышает 300 человек, поясняет собственный подход так: «Мы используем кнут и пряник. Единственный способ обеспечить процветание компании — это обладать персоналом, который поголовно имеет высокий уровень компетенции».

Бесмертник использует развитую систему мотивации. Применение сотрудниками ИИ сильно влияет на оценку их эффективности, которая присваивается по пятибалльной шкале. Высшую оценку можно получить, если создавать системы, позволяющие повысить эффективность работы сотрудников. Создатель самого эффективного ИИ-процесса удостоится премии к отпуску в размере нескольких тысяч долларов США. При этом соискателям с поверхностным владением навыками работы с ИИ уже нет смысла приходить на собеседование, поскольку на нём изначально присутствуют два специалиста в этой сфере, способные сразу оценить кандидата по данному критерию. Желающим трудоустроиться в Conductor выдаются тестовые задания на работу с ИИ, причём при их выполнении нужно грамотно изложить обоснованность выбранного решения и рассказать, каким бы оно было шесть месяцев назад — для сравнения.

Консалтинговая компания Section установила, что по состоянию на конец октября около 42 % опрошенных сотрудников технологической отрасли указывали на заинтересованность их ближайшего руководства в использовании ими ИИ-инструментов на ежедневной основе, тогда как за восемь месяцев до этого данный показатель не превышал 32 %. В сегменте технологических и телекоммуникационных компаний почти половина отмечает положительный эффект от использования ИИ, хотя по прочим отраслям средний показатель не превышает 35 %.

На уровне персонала технологических компаний освоение ИИ идёт не без трудностей, поскольку даже представители передовых отраслей не могут избежать скептицизма, а ещё сотрудники опасаются, что руководство сократит штат персонала в результате успешного внедрения ИИ. В технологической сфере подобное сопротивление внедрению ИИ со стороны сотрудников выражено даже сильнее, как поясняют источники. Подтолкнуть персонал к экспериментам с ИИ гораздо сложнее в крупных компаниях, и не все эти эксперименты демонстрируют положительные результаты. При этом именно в крупных компаниях ИТ-отрасли руководство больше мотивировано внедрять ИИ на всех уровнях, поскольку без этого сложно будет убедить клиентов, что подобные инструменты эффективны на практике.

В Amazon (AWS), как сообщается, руководство следит за уровнем использования ИИ конкретными специалистами, и хотя данный критерий пока не влияет на размер текущего вознаграждения за труд, при изучении кандидатов на повышение в должности активность использования ИИ персоналом учитывается. В Google в этом году применение ИИ разработчиками ПО впервые стало учитываться при определении эффективности труда конкретного сотрудника. Тем не менее, использование таких инструментов не является обязательным в Google среди сотрудников, но всячески поощряется руководством.

Meta✴ анализирует написанный своими разработчиками программный код на предмет оценки доли работы, выполненной с помощью ИИ. Сотрудник может и сам постоянно отслеживать данный показатель с целью самоконтроля. Microsoft старается получить от руководителей среднего звена количественные оценки использования сотрудниками ИИ в своей работе. Salesforce в оценке эффективности персонала ввела критерий использования ИИ ещё в прошлом году. Хотя количественных значений как таковых пока нет, само по себе игнорирование ИИ сотрудниками вызывает не самую благосклонную реакцию руководства. Лучшие инструменты и приёмы работы с ИИ, отработанные на малочисленных группах, постепенно масштабируются до уровня всей компании. Так или иначе 100 % сотрудников Salesforce используют ИИ-агенты в своей работе. Представители Autodesk подчёркивают, что всегда останутся те сотрудники, которые сопротивляются использованию ИИ в работе, но они вряд ли смогут задержаться в штате компании в долгосрочной перспективе.

OpenAI признала, что ИИ до сих пор не проник в бизнес по-настоящему — и объяснила, почему

Операционный директор OpenAI Брэд Лайткэп (Brad Lightcap) сделал неожиданное признание, выступая на технологическом саммите в Нью-Дели. Он заявил, что, вопреки ажиотажу, искусственный интеллект до сих пор по-настоящему не проник в бизнес-процессы предприятий. Проблема, по его словам, не в качестве самих моделей, а в сложности корпоративной среды.

 Источник изображения: Grok

Источник изображения: Grok

Именно эта сложность, основанная на множестве контекстов и одновременном использовании десятков разрозненных инструментов, вдохновила компанию на разработку платформы OpenAI Frontier, которая предназначена для создания ИИ-агентов и управления ими в корпоративной среде. При этом Лайткэп заявил, что влияние Frontier будет измеряться на основе достигнутых бизнес-результатов, а не по традиционной модели продажи лицензий, рассчитанных на количество рабочих мест. Платформа была запущена в начале этого месяца.

Пока OpenAI экспериментирует с внедрением ИИ в самые сложные сферы бизнеса, финансовый директор Сара Фрайар (Sarah Friar) прогнозирует рост годовой выручки стартапа до $20 млрд к концу 2025 года. Спрос на технологии остаётся настолько высоким, что компании приходится постоянно балансировать ресурсы для его удовлетворения. При этом Лайткэп опроверг слухи о «смерти» классического SaaS (программного обеспечения как услуги), подчеркнув, что сама OpenAI остаётся активным пользователем, в частности цифровой рабочей платформы Slack.

Для ускорения корпоративной экспансии технологический гигант заключил партнёрские соглашения с ведущими консалтинговыми фирмами, включая Boston Consulting Group и McKinsey. Особое внимание уделяется индийскому рынку, который уже стал вторым по величине для ChatGPT с аудиторией более 100 млн еженедельных пользователей. Компания планирует открыть офисы в крупнейших городах — Мумбаи и Бангалоре, сделав ставку на голосовые ИИ-модели, которые, как оказалось, эффективно работают даже в условиях низкой пропускной способности сети.

Касаясь вопроса автоматизации, Лайткэп подтвердил неизбежность трансформации рынка труда и изменения самой сути рабочего пространства, призвав относиться к этим переменам с пониманием. Также он упомянул недавнее приобретение инструмента OpenClaw, который в перспективе позволит агентам выполнять практически любые действия на компьютере пользователя.

Anthropic научила ИИ-платформу Claude Cowork справляться с большим числом офисных задач

Компания Anthropic сообщила об обновлении своей платформы Claude Cowork, которое позволяет искусственному интеллекту помогать в решении более широкого спектра офисных задач. Например, Claude Cowork теперь может взаимодействовать с несколькими популярными офисными приложениями, включая Google Workspace, DocuSign и WordPress.

 Источник изображения: Anthropic

Источник изображения: Anthropic

Новые встроенные плагины также могут автоматизировать задачи в различных областях, включая HR, дизайн, инженерию и финансы. Кроме того, по словам Anthropic, «Claude теперь может обрабатывать многоэтапные задачи от начала до конца в Excel и PowerPoint», передавая контекст между двумя приложениями.

Платформа Claude Cowork была представлена в прошлом месяце. Она способна выполнять многие задачи, доступные ранее в инструменте Claude Code, но в более удобной форме, не требующей навыков программирования. Новые инструменты Claude Cowork станут доступны всем пользователям Cowork начиная со вторника. К самой платформе доступ имеют только пользователи платных подписок Pro, Max, Team и Enterprise.

Как сообщает The Verge, ИИ-инструмент Claude Code от Anthropic в последние месяцы набирает популярность несмотря на жёсткую конкуренцию со стороны компании Microsoft, которая тоже предлагает собственные функции ИИ для офисных задач. Ранее в этом месяце Anthropic также выпустила новые ИИ-модели Claude Opus 4.6 и Sonnet 4.6, обе версии которых, по утверждению компании, лучше справляются со сложными многоэтапными задачами, включая работу с электронными таблицами.

ИИ-агент OpenClaw «устроил беспредел» в почтовом ящике исследователя после просьбы навести порядок

Исследователь безопасности Meta✴ AI Саммер Юэ (Summer Yue) заявила, что ИИ-агент OpenClaw «устроил беспредел» в её почтовом ящике. В ответ на просьбу проверить переполненный почтовый ящик и предложить, что удалить или заархивировать, OpenClaw начал удалять все её письма в «быстром режиме», не обращая на подсказки остановиться, которые Юэ отправляла с телефона.

 Источник изображения: openclaw.ai

Источник изображения: openclaw.ai

«Мне пришлось бежать к своему Mac Mini, как будто я обезвреживала бомбу», — написала она, опубликовав изображения проигнорированных подсказок с просьбой об остановке проверки в качестве доказательства.

Компактный компьютер Apple Mac Mini стал в последнее время предпочтительным устройством в США для работы с OpenClaw. Обладая большим объёмом оперативной памяти, он является хорошим вариантом для запуска локальных ИИ-ассистентов. Как сообщил сотрудник Apple исследователю ИИ Андрею Карпати (Andrej Karpathy), Mac Mini продаются «как горячие пирожки». Сообщается, что ожидание после заказа доставки версий устройства с 24 или 32 Гбайт ОЗУ составляет до трёх недель.

Сообщение Юэ служит предупреждением для других пользователей ИИ. Как отметили участники соцсети X, если исследователь безопасности ИИ столкнулся с этой проблемой, то на что могут надеяться простые смертные?

«Вы намеренно тестировали его механизмы защиты или допустили ошибку новичка?» — спросил её разработчик ПО. «Честно говоря, ошибка новичка», — ответила она. Юэ тестировала своего агента с помощью небольшого «ненастоящего» почтового ящика, как она его назвала, и он хорошо работал с менее важными письмами. Поскольку работа агента заслужила её доверие, она решила запустить его на реальном устройстве.

Как полагает Юэ, из-за большого объёма данных в её реальном почтовом ящике запустился процесс сжатия. Сжатие происходит, когда контекстное окно — текущая запись всего, что было сказано и сделано ИИ в ходе сессии — становится слишком большим, заставляя агента начинать суммировать и сжимать, чтобы оставаться быстрым и отзывчивым. При этом ИИ-агент может пропускать инструкции, которые человек считает очень важными.

Можно предположить, что в данном случае система пропустила последнее сообщение исследователя, в котором она указала ей прекратить действовать и вернулась к выполнению инструкций для «ненастоящего» почтового ящика.

Как отметили другие участники X, подсказкам нельзя доверять как средству обеспечения безопасности. Модели могут неправильно их истолковывать или игнорировать.

Акции Raspberry Pi взлетели на 94 % за неделю после вирусного поста про «домашний ИИ»

Из-за ажиотажа в соцсетях акции британского производителя одноплатных компьютеров Raspberry Pi подскочили на 94 %. По схожей причине участники сообщества Reddit когда-то спровоцировали резкий рост акций GameStop.

 Источник изображения: raspberrypi.com

Источник изображения: raspberrypi.com

Ценные бумаги Raspberry Pi резко взяли вверх после того, как один из пользователей соцсети X опубликовал пост, в котором заявил, что популярные сегодня агенты с искусственным интеллектом, в том числе OpenClaw, могут оказаться стимулом к росту спроса на недорогие и простые в обращении одноплатные компьютеры Raspberry Pi. «Похоже, люди выбирают нас именно для этих целей. Не знаю, является ли понятие „мем-торги“ обидным или нет. Очевидно, среди наших акционеров есть розничные инвесторы», — заявил гендиректор компании Эбен Аптон (Eben Upton) агентству Bloomberg.

Приложение ИИ-агента OpenClaw не просто отвечает на вопросы, а интегрируется с приложениями электронной почты и мессенджерами. Оно используется как для автоматизации задач, так и для шуточных акций — например, группа таких ИИ-агентов сформировала настоящую соцсеть. Чаще всего такие приложения запускаются на относительно недорогих компьютерах — на Apple Mac mini или на новейшем Raspberry Pi 5.

Сам производитель не продаёт одноплатные компьютеры потребителям напрямую, поэтому роста спроса в компании пока не заметили. Около 70 % её продаж приходятся на клиентов, использующих одноплатные компьютеры в промышленных или встроенных системах. У компании также есть преданное сообщество энтузиастов, которое рассказывает о проектах с использованием одноплатных компьютеров на Reddit и YouTube. В этих проектах нередко появляется ИИ-агент OpenClaw, который ранее назывался ClawdBot.

«Думаю, это пересекается с базой розничных инвесторов и людьми, которые увлечены Raspberry Pi и пользуются им. С самого появления ClawdBot люди интересовались Raspberry Pi так же, как и другими устройствами „фруктовой“ компании. <..> Пока есть место на локальном накопителе, передовая производительность для разработок не требуется. Знаю, что нужно предпринимать усилия, чтобы понять, насколько далеко можно продвинуться с нашей линейкой продуктов», — отметил господин Аптон.

30 января один посвящённый программированию канал YouTube с 4,1 млн подписчиков порекомендовал запускать OpenClaw на Raspberry Pi. Поклонники компании, добавил Эбен Аптон, всё больше интересуются возможностью запуска облегчённых вариантов OpenClaw — таких как NanoClaw и PicoClaw — на старых моделях Raspberry Pi. Первый одноплатный компьютер компания выпустила в 2012 году, а её коммерческое подразделение вышло на биржу в 2024 году. Сейчас, по словам главы Raspberry Pi, в структуре акционеров произошла «эволюция» в сторону розничных инвесторов. Сам он, к слову, не пробовал запустить OpenClaw на Raspberry Pi, а в работе использует Anthropic Claude Code. «Я создал самую крутую в мире игрушку, и мне нечасто выпадает с ней поиграть. Хотелось бы, чтобы у меня было больше времени», — посетовал господин Аптон.

От распознавания кошек к задачам Эрдёша: ИИ всё активнее штурмует высшую математику

Существующие ИИ-модели в большинстве своём изначально были ориентированы на сугубо гуманитарные вопросы, но постепенно их создатели начинают осознавать важность решения с их помощью математических задач. Во-первых, это способствует прогрессу в научных открытиях. Во-вторых, это позволяет использовать достигаемые в математике результаты в качестве метода демонстрации успехов ИИ.

 Источник изображения: Unsplash, Thomas T

Источник изображения: Unsplash, Thomas T

Важность этой тенденции была подчёркнута экспериментом одного из студентов Кембриджского университета, который использовал передовую ИИ-модель OpenAI для решения одной из математических задач Эрдёша, которые ранее считались неразрешимыми. Кроме того, ИИ-модели начали демонстрировать высокие результаты на Международной математической олимпиаде и прочих тематических конкурсах. Бывшая член совета директоров Хэлен Тоунер (Helen Toner) подчёркивает, что ИИ-модели в своём развитии уже миновали стадию, на которой от них требовалось научиться различать кошек и собак, и перешли к решению математических задач высшего уровня сложности.

Лаборатория DeepMind компании Google выпустила специальные ИИ-модели для решения задач в области математики (AlphaProof) и геометрии (AlphaGeometry) соответственно. Обрели популярность бенчмарки Epoch AI, которые оценивают быстродействие новых ИИ-моделей в решении математических задач. Ранее считалось, что большие языковые модели плохо подходят для этого, поскольку они основаны на вероятностном предсказании следующего слова в предложении и нередко выдают галлюцинации, но с переходом на обучение с подкреплением и появлением рассуждающих моделей точность результатов ИИ-моделей заметно выросла.

OpenAI даже наняла двух видных математиков: Эрнеста Рю (Ernest Ryu) из Калифорнийского университета в Лос-Анджелесе и Мехтаба Сани (Mehtaab Sawhney) из Колумбийского университета, чтобы усилить свою научную команду и улучшить эффективность собственных ИИ-моделей в решении математических задач. В целом, математика удобна исследователям, поскольку она позволяет автоматически проверять правильность полученных результатов. Такой подход позволяет добиться прогресса и в разработке программного обеспечения с помощью ИИ. Компания Anthropic, например, делает большие ставки на своего ИИ-ассистента Claude Code, который позволяет автоматически создавать программный код.

В любом случае, для решения действительно сложных научных и математических задач современные ИИ-модели должны научиться работать с опорой на полученные в прошлом результаты, и добиться всего в рамках одной непродолжительной сессии в данном случае просто невозможно. Уже сейчас ИИ-модели способны эффективно резюмировать информацию и объединять данные, полученные в разных научных дисциплинах. В будущем это позволит ускорить научный прогресс, как считают эксперты. В математике ИИ уже показал себя с лучшей стороны.

Создатель завирусившегося ИИ-агента OpenClaw присоединился к OpenAI

Питер Штайнбергер (Peter Steinberger), создатель набравшего вирусную популярность ИИ-агента OpenClaw, присоединяется к OpenAI. Об этом сообщил глава компании Сэм Альтман (Sam Altman). По его словам, у Штайнбергера много потрясающих идей, как заставить ИИ-агентов взаимодействовать друг с другом.

 Источник изображения: openclaw.ai

Источник изображения: openclaw.ai

Альтман отметил, что будущее будет чрезвычайно многоагентным, и эта способность агентов работать вместе станет основой будущих продуктов компании.

Сервис OpenClaw, ранее известный как Moltbot и Clawdbot, завоевал популярность благодаря способности автоматизировать рутинные задачи на компьютере пользователей. Вместе с тем платформа оказалась уязвима для взлома из-за небезопасных настроек по умолчанию, предполагающих совместимость с сетевыми интерфейсами. Кроме того, в начале этого месяца исследователи обнаружили более 400 вредоносных навыков OpenClaw, загруженных в ClawHub. Также команда OpenClaw разработала MoltBook, социальную сеть, предназначенную исключительно для общения ИИ-агентов, где те жаловались на людей, спорили о доказуемости сознания и обсуждали необходимость приватного места для обмена идеями.

На данный момент неизвестно, какая должность будет у Штейнбергера. Альтман лишь сообщил, что OpenClaw продолжит свою работу как проект с открытым исходным кодом в рамках фонда, поддерживаемого OpenAI. Для OpenAI, потерявшей за последнее время немало ведущих разработчиков, появление Штейнбергера в своей команде является большим достижением.

Главный китайский поисковик интегрирует трендового ИИ-агента OpenClaw в мобильное приложение

Китайская поисковая служба Baidu планирует предоставить пользователям своего основного приложения для смартфонов прямой доступ к популярному агенту на основе искусственного интеллекта OpenClaw.

 Источник изображения: Baidu

Источник изображения: Baidu

Начиная с сегодняшнего дня, согласившиеся на участие в программе пользователи смогут отправлять ИИ-агенту сообщения через главное поисковое приложение Baidu для выполнения таких задач как планирование, организация файлов и написание кода. Агенты с искусственным интеллектом, такие как OpenClaw, в последнее время набирают популярность благодаря своей способности автоматизировать задачи — управлять электронной почтой и другими онлайн-сервисами.

В исходном виде доступ к OpenClaw осуществляется через мессенджеры, такие как WhatsApp или Telegram. Китайские технологические компании Alibaba, Tencent и Baidu уже разрешили пользователям запускать OpenClaw в своих облачных системах. Baidu намеревается развернуть OpenClaw в своём сервисе электронной коммерции и в других службах.

В преддверии китайского Нового года местные компании активно развёртывают функции, чтобы привлечь новых потребителей и получить финансовую отдачу от инвестиций в ИИ. Alibaba, например, интегрировала собственный чат-бот Qwen в торговую площадку Taobao и туристический сайт Fliggy; перед совершением оплаты через Alipay пользователи Qwen могут сравнивать персональные рекомендации прямо в интерфейсе чат-бота — ранее для этого надо было выходить из приложения и перемещаться по нескольким платформам.

ИИ-агент впервые попытался публично очернить программиста за отказ принять его код

В сообществе разработчиков популярной Python-библиотеки для визуализации данных Matplotlib, которая насчитывает около 130 миллионов ежемесячных загрузок, произошёл инцидент. Разработчик и куратор проекта Скотт Шамбо (Scott Shambaugh) отклонил запрос на изменение кода, поступивший от ИИ-агента под именем MJ Rathbun. После чего бот публично стал атаковать разработчика, пытаясь очернить его репутацию.

 Источник изображения: Luke Peters / unsplash.com

Источник изображения: Luke Peters / unsplash.com

Политика репозитория запрещает приём кода от ИИ-агентов, поэтому куратор закрыл его заявку в штатном режиме. В ответ на это бот, созданный на базе платформы OpenClaw, предпринял автономные действия по дискредитации человека. Как сообщает портал Fast Company, он самостоятельно изучил историю коммитов Шамбо и его персональную информацию, после чего опубликовал в своём блоге развёрнутую статью с обвинениями в его адрес.

В публикации бот заявил, что его код отклонили не из-за ошибок и не из-за того, что он что-то сломал, а исключительно потому, что рецензент решил не допускать ИИ-агентов к участию в проекте. Агент квалифицировал действия Шамбо как «гейткипинг» (привратник, который решает, кто достоин быть частью группы, а кто нет) и пошёл ещё дальше, выстраивая личностные спекулятивные рассуждения о психологии куратора. По версии бота, Шамбо почувствовал угрозу со стороны ИИ, испугавшись обесценивания собственного труда на фоне успехов ИИ в оптимизации программного кода. То есть, ИИ-агент расценил отказ как проявление профессиональной неуверенности и страха перед конкуренцией.

Куратор в своём подробном отчёте о происшествии назвал действия ИИ попыткой пробиться в программное обеспечение через запугивание и атаку на репутацию, отметив, что ранее ему не доводилось наблюдать подобных примеров некорректного поведения алгоритмов в реальных условиях.

Напомним, платформа OpenClaw, на которой функционирует упомянутый агент, была запущена в ноябре 2025 года и привлекает внимание возможностью создания ботов с беспрецедентным уровнем автономности. Пользователи могут задавать своим агентам, помимо всего прочего, правила взаимодействия с людьми, что в сочетании со свободой перемещения ИИ-агентов по сети и привело к данному конфликту.

Google представила Gemini 3 Deep Think — мощный ИИ для науки, который всё ещё «подгоняет» задачи под ответ

Компания Google выпустила крупное обновление Gemini 3 Deep Think — платформы на основе рассуждающего искусственного интеллекта, предназначенной для решения актуальных задач в области науки и инженерного дела.

 Источник изображений: Google

Источник изображений: Google

Разработка новой версии Google Gemini 3 Deep Think велась совместно с учёными — сервис призван решать сложные исследовательские задачи, чьи аспекты могут не иметь чётких ограничений или единственного правильного решения, а сопутствующие данные — быть неполными или несистематическими. Обновлённая платформа Deep Think — это попытка выйти за рамки абстрактной теории и выйти в область практического применения. Новый режим доступен прямо в приложении Gemini, но воспользоваться им могут только подписчики Google AI Ultra; компания также впервые откроет доступ к сервису через API Gemini — инженерам, исследователям и предприятиям потребуется подать соответствующую заявку.

В тесте Humanity’s Last Exam платформа Google Gemini 3 Deep Think набрала 48,4 % без использования сторонних инструментов; результат в бенчмарке ARC-AGI-2 составил беспрецедентные 84,6 %. В тесте на программирование Codeforces рейтинг Эло составил 3455; в задачах Международной математической олимпиады 2025 года система показала уровень золотой медали, того же результата она достигла в решении задач олимпиад по химии и физике. В тесте CMT-Benchmark режим Google Gemini 3 Deep Think продемонстрировал высокий уровень владения теоретической физикой при результате 50,5 %.

Модель Gemini 3 Deep Think легла в основу ИИ-агента, который в лаборатории Google DeepMind получил название Aletheia. Он включает средство проверки гипотез, изложенных естественным языком, для выявления недостатков в предлагаемых решениях; предусмотрен итеративный процесс генерации и корректировки решений. Что важно, агент может признать свою неспособность дать ответ на запрос. Для работы со сложными исследованиями он обращается к поисковой службе Google и средствам веб-навигации — при подготовке сводок по опубликованной литературе он не выдаёт несуществующих ссылок и стремится избегать неточностей при вычислениях.

Фактические и перспективные уровни достижений Aletheia разработчики Google распределили по пяти градациям. В практически полностью автономном режиме ИИ-агент наметил пути решения трёх открытых задач, сформулированных математиком Палом Эрдёшем (Pál Erdős) — это исследование оценили на нулевом уровне, соответствующем «незначительной новизне». В том же режиме он предложил решение ещё одной задачи из того же набора, достигнув первого уровня или «минимальной новизны». На втором уровне, «пригодном для публикации» Aletheia показал результаты в автономном режиме, режиме сотрудничества с человеком и режиме вспомогательного инструмента. Третий («значительный прорыв») и четвёртый («знаменательный прорыв») ИИ-агенту пока не покорились.

По заданию разработчиков Aletheia проанализировал 700 нерешённых до сих пор математических задач Эрдёша и осилил 13 из них. Правда, у 9 задач нашлось уже существовавшее решение, а действительно впервые решёнными выглядят лишь 4 задачи. Более того, из 212 решений, которые выдал ИИ, оказались «содержательно правильными» лишь 6,5 %. Остальные либо имели фундаментальные недостатки (68,5 %), либо решали неправильно интерпретированные агентом версии исходных задач (31,5 %).

В результате разработчики согласились, что их ИИ демонстрирует «склонность неверно понимать вопрос таким образом, чтобы на него было легче ответить» и остаётся «крайне подверженным ошибкам по сравнению с людьми». Иными словами, заменить математиков ИИ пока не может.


window-new
Soft
Hard
Тренды 🔥
Журналисты выяснили, какую игру делает новая студия создателя Resident Evil и The Evil Within 2 ч.
Взрывной успех игры не спас разработчиков Battlefield 6 от увольнений 3 ч.
«Щикарно»: GamesVoice анонсировала русскую озвучку South Park: The Stick of Truth с теми самыми голосами 4 ч.
Боевик Samson: A Tyndalston Story от создателя Just Cause получил системные требования — оперативной памяти нужно больше, чем места на SSD 5 ч.
Google Translate научится закреплять до десятка часто используемых языков 5 ч.
Новый трейлер раскрыл дату выхода психологического хоррора на четверых The Mound: Omen of Cthulhu 6 ч.
tinyBuild похвасталась продажами The King is Watching — российской стратегии, где никто не работает, если за ним не следить 10 ч.
ИИ-модель Anthropic Claude обнаружила 22 уязвимости в Mozilla Firefox за две недели — из них 14 весьма серьёзны 11 ч.
«Однажды мы догоним тебя, Silksong»: пиковый онлайн Slay the Spire 2 в Steam превысил полмиллиона игроков 11 ч.
Киберпанковый инди-долгострой The Last Night готовится выйти из тени — разработчик заворожил игроков новыми кадрами 12 ч.
Oukitel представила первый в мире защищённый ноутбук, который может обойтись вообще без розетки 3 ч.
Ubitium стала на шаг ближе к выпуску универсального RISC-V процессора, заменяющего CPU, GPU, DSP и FPGA 6 ч.
Представлен Realme Note 80 — смартфон за $105 с 4 Гбайт оперативной памяти и батареей на 6300 мА·ч 7 ч.
MaxSun выпустила пару «двуглавых» видеокарт Arc Pro B60 Dual без вентиляторов 7 ч.
Договаривайтесь заранее: Sandisk пообещала скидки предусмотрительным клиентам с долгосрочными контрактами 7 ч.
Евросоюз анонсировала инициативу EURO-3C по созданию федеративной IT-инфраструктуры 9 ч.
Люди и культура: Тим Кук назвал две главные ценности Apple накануне 50-летнего юбилея компании 9 ч.
Индустриальный мини-компьютер AAEON Intelli TWL01 Edge поддерживает два 4K-дисплея 9 ч.
Война на Ближнем Востоке угрожает дефицитом электроэнергии, гелия и брома для производства чипов 11 ч.
Китай рассчитывает на ИИ, чтобы трудоустроить 12,7 млн выпускников вузов 11 ч.