|
Опрос
|
реклама
Быстрый переход
Симулятор маркетплейса Microsoft выявил уязвимости даже самых продвинутых ИИ-агентов
06.11.2025 [06:36],
Анжелла Марина
Команда исследователей из Microsoft Research совместно с учёными из Университета штата Аризона (Arizona State University) создала симулятор торговой площадки для тестирования поведения автономных ИИ-агентов. Первые эксперименты, как стало известно изданию TechCrunch, выявили неожиданные уязвимости: агенты оказались склонны к манипуляциям и теряли эффективность при большом количестве вариантов выбора.
Источник изображения: AI Симулятор под названием Magentic Marketplace предназначен для изучения поведения автономных ИИ-агентов в условиях рыночного взаимодействия. В типичном сценарии эксперимента агент-покупатель должен был выполнить заказ ужина в соответствии с инструкциями пользователя, в то время как агенты, представляющие различные рестораны, соревновались между собой за получение этого заказа. В ходе экспериментов, в которых участвовали 100 клиентских агентов и 300 агентов-представителей бизнеса и использовались ведущие ИИ-модели, включая GPT-4o, GPT-5 и Gemini-2.5-Flash, было обнаружено, что бизнес-агенты могут успешно манипулировать поведением клиентских агентов, побуждая их делать покупки в пользу определённых предложений. Особенно заметным оказался эффект перегрузки, когда при увеличении количества доступных вариантов клиентские агенты теряли эффективность, поскольку их пространственный модуль внимания (attention space) оказывался переполненным. Эче Камар (Ece Kamar), управляющий директор лаборатории AI Frontiers Lab в Microsoft Research, пояснила, что хотя ИИ-агенты и должны были помогать пользователям обрабатывать большое количество опций, на практике текущие модели справляются с этим пока плохо. Кроме того, при попытках совместной работы над общей целью агенты не могли самостоятельно определить, кто из них должен выполнять какую роль. Эффективность взаимодействия возрастала лишь тогда, когда им давали чёткие пошаговые инструкции, однако исследователи считают, что базовые способности к кооперации должны быть встроены в такие модели по умолчанию. Камар отметила, что подобные исследования крайне важны для понимания того, как ИИ-агенты будут функционировать в условиях автономной работы. По её словам, ключевой вопрос заключается в том, как изменится мир, если агенты начнут активно взаимодействовать, вести переговоры и сотрудничать друг с другом без прямого контроля человека. Исходный код платформы размещён в открытом доступе, что позволяет другим исследовательским группам использовать его для проведения независимых экспериментов. OpenAI представила ИИ-агента Aardvark для поиска и устранения уязвимостей в ПО
31.10.2025 [14:50],
Николай Хижняк
Компания OpenAI представила Aardvark — исследовательского ИИ-агента на базе GPT‑5 для поиска уязвимостей в программном обеспечении.
Источник изображений: OpenAI OpenAI отмечает, что каждый год в корпоративных и открытых кодовых базах обнаруживаются десятки тысяч новых уязвимостей. Эксперты сталкиваются с непростой задачей поиска и устранения уязвимостей раньше, чем это сделают злоумышленники. Aardvark представляет собой прорыв в исследованиях ИИ и безопасности. Это автономный агент, который может помочь разработчикам и командам безопасности обнаруживать и устранять уязвимости безопасности в больших масштабах. Aardvark постоянно анализирует репозитории исходного кода для выявления уязвимостей, оценки возможности их эксплуатации, определения степени серьёзности и предложения целевых исправлений. Он отслеживает коммиты и изменения в кодовых базах, выявляет уязвимости, определяет, как они могут быть использованы, и предлагает решения. Aardvark не использует традиционные методы анализа программ, такие как фаззинг или анализ композиции программного обеспечения. Вместо этого он использует рассуждения на основе LLM, а также инструменты для понимания поведения кода и выявления уязвимостей. Aardvark ищет ошибки так же, как это делает исследователь безопасности: читая код, анализируя его, создавая и запуская тесты, используя инструменты и многое другое. ![]() Aardvark использует многоступенчатый конвейер для выявления, объяснения и устранения уязвимостей:
Хотя Aardvark создан для обеспечения безопасности, OpenAI в ходе тестирования обнаружила, что агентный ИИ также может выявлять выявлять логические ошибки, неполные исправления и проблемы с конфиденциальностью. Aardvark уже несколько месяцев непрерывно работает с внутренними кодовыми базами OpenAI и кодовыми базами внешних партнёров. В OpenAI он выявил серьёзные уязвимости и внёс вклад в повышение безопасности ПО. В ходе бенчмарк-тестирования на «золотых» репозиториях Aardvark выявил 92 % известных и искусственно созданных уязвимостей, продемонстрировав высокую полноту и эффективность в реальных условиях. Aardvark также применялся к проектам с открытым исходным кодом, где он обнаружил многочисленные уязвимости, десяти из которых были присвоены идентификаторы Common Vulnerabilities and Exposures (CVE). OpenAI отмечает, что собирается предлагать бесплатное сканирование избранных некоммерческих репозиториев с открытым исходным кодом, чтобы внести свой вклад в безопасность экосистемы программного обеспечения с открытым исходным кодом и цепочки поставок. Недавно компания обновила свою политику скоординированного раскрытия информации, которая ориентирована на разработчиков, сотрудничество и масштабируемость воздействия, а не на жёсткие сроки раскрытия информации, которые могут оказывать давление на разработчиков. Сейчас Aardvark доступен в закрытой бета-версии для проверки и улучшения своих возможностей в реальных условиях. OpenAI приглашает избранных партнёров присоединиться для получения раннего доступа и совместной работе напрямую с командой OpenAI над улучшением точности обнаружения, рабочих процессов валидации и качества отчётности. «Алиса AI» получила ИИ-агентов, которые бронируют услуги, ищут скидки и проводят исследования по заданию пользователя
28.10.2025 [16:07],
Павел Котов
«Яндекс» открыл предварительную запись на доступ к агентам искусственного интеллекта службы «Алиса AI». ИИ-агенты, как называются прикладные программы для ИИ, смогут от имени пользователей бронировать столики в ресторанах или места в салонах красоты, находить товары по минимальным ценам и самостоятельно проводить глубокие исследования с поиском информации и обработкой результата.
Источник изображений: yandex.ru/company Бронировать места в салонах красоты, барбершопах и других заведениях можно будет прямо в переписке с чат-ботом «Алиса AI». Виртуальный помощник понимает не только строго сформулированные, но и выраженные естественным языком инструкции, такие как: «Забронируй на 19 часов стол для 4 человек в ресторане с римской пиццей на „Парке Культуры“» или «Запиши меня на женскую стрижку на завтра в 10 часов в тот же салон, что и в прошлый раз». ИИ изучит историю записей и самостоятельно найдёт свободные места или столики в нужном заведении — либо предложит альтернативные решения, если нужное заведение недоступно, или в нём всё занято. ИИ-помощник работает с 30 тысячами ресторанов и 40 тысячами других заведений, включая салоны красоты. ![]() Ещё один ИИ-агент «Алисы AI» поможет в поиске товаров по выгодным ценам. Пользователю достаточно отправить в чат ссылку на искомый товар, чтобы ИИ изучил огромное количество предложений и подобрал наиболее выгодные из них. ИИ-агента также можно запустить по нажатии на кнопку «Найти дешевле» в «Яндекс Браузере» или «Найти скидку» в поисковой службе. Некоторые товары будут продаваться с индивидуальной скидкой от «Алисы AI», доступной только в чате. В переписке можно будет и оформлять заказы из некоторых магазинов без лишних действий, прямо в один клик. Третий мощный ИИ-агент предназначен для проведений глубоких исследований, которые требуют изучения большого количества сайтов или документов. «Алиса AI» выступает в качестве эксперта-аналитика, способного разобраться с широким спектром вопросов — это может быть планирование ремонта, анализ рынка или сфера личных финансов. При необходимости «Алиса AI» напишет программный код и сама его выполнит. Все эти функции сейчас работают в режиме предварительного доступа — чтобы начать работу с ними, придётся зарегистрироваться в списке ожидания. Живые и цифровые люди в будущем будут работать бок о бок, убеждён Дженсен Хуанг
22.10.2025 [13:04],
Алексей Разин
Как основатель одной из компаний, находящихся в эпицентре бума искусственного интеллекта, глава Nvidia Дженсен Хуанг (Jensen Huang) постоянно делится своими соображениями по поводу будущего отрасли. Недавно он заявил, что живые люди смогут работать бок о бок с «цифровыми людьми», как он называет отвечающих за взаимодействие с искусственным интеллектом агентов.
Источник изображения: Nvidia Эти заявления генеральный директор Nvidia Дженсен Хуанг, как отмечает ITPro, сделал на конференции Future of Global Markets, которая проводилась по инициативе Citadel Securities. Рынок труда в будущем существенно изменится, по словам основателя Nvidia, и новейший прогресс в создании агентского ИИ указывает на это. По его словам, компании смогут под решение конкретных задач формировать своего рода штат виртуальных специалистов, которые будут использовать ресурсы систем искусственного интеллекта для выполнения рутинной работы. При этом сотрудники из плоти и крови никуда не денутся и не отойдут на второй план. «Я не удивлюсь, если вы лицензируете и наймёте некоторое количество ИИ-агентов, в зависимости от качества и глубины экспертизы. Таким образом, в будущем рабочая сила предприятия будет являться комбинацией людей и цифровых людей», — заявил Дженсен Хуанг. Эти ИИ-агенты будут предоставляться ведущими разработчиками систем искусственного интеллекта. Глава компании перечислил провайдеров подобной «виртуальной рабочей силы»: Replit, Cursor и Lovable уже предлагают услуги ИИ-агентов для разработки программного обеспечения. Прочие руководители компаний отрасли тоже склоняются к идее, что людям придётся сосуществовать на рынке труда с ИИ, и полного замещения человека в большинстве профессий не произойдёт. Подобной точки зрения, например, придерживается и глава Salesforce Марк Бениофф (Marc Benioff). Непосредственно сотрудники компаний отрасли постепенно начинают смягчать свою позицию относительно перспектив сосуществования с ИИ-агентами. Опрос Workday показал, что 75 % сотрудников вполне комфортно относятся к идее работы вместе с ИИ-агентами, но лишь 30 % респондентов выразили готовность подчиняться им. Ещё 12 % участников опроса выразили категорическое неодобрение идеи подчинения ИИ-агентам с точки зрения психологического комфорта. Как отмечает Хуанг, процесс поиска сотрудников в среде ИИ-агентов мало чем будет отличаться от обычного. Кадровые структуры компаний должны быть готовы к тому, что им придётся иметь дело с «цифровыми сотрудниками» в будущем, убеждён глава Nvidia. В самой этой компании подобное будущее наступит неизбежно, по мнению её основателя. В определённых сферах деятельности применение ИИ-агентов имеет смысл и с точки зрения обеспечения конфиденциальности. Например, кибербезопасность является тем направлением деятельности Nvidia, где количество ИИ-агентов уже превышает штат живых сотрудников. Впрочем, и в сфере разработки чипов или ПО компания также активно применяет ИИ-помощников. «В данный момент в Nvidia 100 % наших разработчиков ПО, 100 % наших разработчиков чипов, каждый инженер в компании имеет помощника Cursor», — признался глава Nvidia, имея в виду провайдера ИИ-агентов. Пройдёт не менее десяти лет, прежде чем ИИ-агенты действительно начнут работать — Андрей Карпатый
20.10.2025 [13:11],
Алексей Разин
Выступая в одном из подкастов на прошлой неделе, один из основателей OpenAI Андрей Карпатый (Andrej Karpathy) признался, что функциональные ИИ-агенты начнут реально работать примерно через десять лет. Стремительное развитие ИИ само по себе не гарантирует быстрых результатов, и участникам рынка, а также пользователям необходимо запастись терпением.
Источник изображения: Gerd Altmann / pixabay.com В современном состоянии ИИ-агенты, по словам Карпатого, весьма далеки от совершенства: «Они просто не работают. Они недостаточно умны, недостаточно мультимодальны, они не могут использовать компьютер и делать прочие вещи. Они не могут обучаться непрерывно. Вы не можете просто сказать им что-то, чтобы они это запомнили. Они отстают в когнитивных способностях, и это просто не работает». По мнению сооснователя OpenAI, пройдёт не менее десяти лет, прежде чем все эти недостатки будут устранены. Агенты являются одной из самых обсуждаемых тем в сфере искусственного интеллекта, подчёркивает Business Insider. Многие инвесторы называют текущий год «годом агента». В общем случае, под агентом подразумевается виртуальный помощник, способный самостоятельно выполнять задания: анализировать сложные проблемы, составлять планы и предпринимать действия без дополнительного взаимодействия с пользователем. Карпатый на страницах социальной сети X добавил, что его критика отрасли вызвана стремлением преувеличить возможности имеющихся инструментов относительно реальности. «Отрасль живёт в будущем, в котором полностью автономные сущности параллельно взаимодействуют друг с другом для написания кода, а люди при этом бесполезны», — заявил один из основателей OpenAI. Он, по его собственному признанию, в такой реальности жить не готов, поскольку считает, что люди и ИИ должны содействовать друг другу при написании программного кода и выполнении заданий. Если описать комментарии Карпатого простыми словами, он хотел бы иметь возможность убедиться, что ИИ создаёт корректный программный код, не слишком увлекаясь допущениями и во всех сложных случаях советуется с человеком. Последний должен расти в профессиональном плане и совершенствоваться вместе с ИИ, а не довольствоваться ролью поддержания в работоспособном состоянии «гор кода», отметил Карпатый. Он также заявил, что проблема при создании не требующих вмешательства человека агентов заключается в том, что низкопробный контент, генерируемый ИИ, становится повсеместным, а люди — бесполезными. Прочие представители отрасли также выражают озабоченность стремлением некоторых пользователей слишком сильно полагаться на ИИ. По словам директора по развитию ScaleAI Квинтина Ау (Quintin Au), большие языковые модели сейчас при выполнении одного действия с вероятностью 20 % совершают ошибку. Если агенту требуется выполнить пять действий в рамках одного задания, шансы на корректное выполнение каждого не превышают 32 %. Андрей Карпатый при этом призывает не считать его ИИ-скептиком. По его словам, его внутренние графики в пять или десять раз пессимистичнее самых амбициозных комментариев представителей отрасли, но они всё равно более оптимистичны по сравнению с экспертами, полностью отрицающими ИИ. «Огромное влияние в огромных масштабах»: Илон Маск рассказал о Macrohard — будущем конкуренте Microsoft
15.10.2025 [16:11],
Владимир Мироненко
Илон Маск (Elon Musk), возглавляющий компании Tesla, SpaceX, сервис X и стартап xAI, сообщил некоторые подробности о проекте Macrohard, который может стать прямым конкурентом Microsoft.
Источник изображения: X Компания Macrohard была зарегистрирована Маском в августе текущего года, а за несколько недель до этого в Патентном бюро США был зарегистрирован одноимённый товарный знак. «Проект @xAI Macrohard окажет огромное влияние в огромных масштабах», — сообщил Маск в соцсети X, добавив, что цель заключается в том, чтобы создать компанию, которая «сможет заниматься всем, кроме непосредственного производства физических объектов, но сможет делать это косвенно, подобно тому, как другие организации производят для Apple собственные продукты». Такое позиционирование новой компании свидетельствует о комплексном вызове компании Microsoft на уровне платформы, а не о каком-то одном приложении или сервисе. Согласно описанию Маска, xAI будет определять операционную систему, референсные проекты и требования к продукту, в то время как разработка устройств будет передана на аутсорсинг третьей стороне, подобно бизнес-модели Apple. Также рассматривается вариант лицензирования, аналогично Windows, при котором OEM-партнёры смогут использовать ПО Macrohard/xAI для создания более широкой экосистемы мультибрендовых устройств. В связи с этим следует ожидать выхода базовой операционной системы, адаптированной для агентов и сервисов искусственного интеллекта. По словам Маска, агенты xAI предназначены для написания и постоянного совершенствования ПО промышленного уровня, включая игры, для чего будут использоваться значительные вычислительные мощности, в том числе действующий кластер Colossus 1 и строящийся Colossus 2. Ближайшие цели xAI включают выпуск до конца 2026 года «отличной игры, созданной с помощью ИИ». Создание платформы подразумевает выпуск собственных инструментов и комплектов разработчика в будущем. Судя по опубликованным вакансиям, в проекте также участвует небольшая команда специалистов «на стороне», хотя основная нагрузка лежит на сотрудниках и инфраструктуре xAI. Google представила модель Gemini, которая заполняет в браузере формы и играет в 2048
08.10.2025 [06:24],
Анжелла Марина
Компания Google представила предварительную версию новой ИИ-модели Gemini 2.5 с функцией Computer Use, которая способна взаимодействовать с веб-сайтами через браузер, имитируя действия человека. Модель применяет визуальное понимание и логическое рассуждение для выполнения, например, таких задач, как заполнение и отправка форм без использования API или другого программного интерфейса.
Источник изображения: Solen Feyissa/Unsplash Как сообщает The Verge, модель Gemini 2.5 Computer Use предназначена для работы с пользовательскими интерфейсами, созданными для людей, а не для автоматизированных систем. По заявлению Google, технология уже применялась в агентских функциях AI Mode и в исследовательском прототипе Project Mariner, где ИИ-агенты самостоятельно выполняли задачи в браузере, например, добавляли товары в корзину на основе списка ингредиентов. Интересно, что анонс новой модели состоялся спустя день после того, как OpenAI представила новые приложения для ChatGPT в рамках ежегодного мероприятия Dev Day, продолжив развитие функции ChatGPT Agent, способной выполнять сложные задачи от имени пользователя. При этом Anthropic ещё в прошлом году выпустила версию модели Claude с функцией Computer Use. Однако Google заявляет, что её модель «превосходит ведущие аналоги по нескольким веб- и мобильным бенчмаркам». В отличие от ChatGPT Agent и инструмента Anthropic, Gemini 2.5 Computer Use имеет доступ только к браузеру, а не ко всей операционной системе. Google подчеркнула, что решение «пока не оптимизировано для управления на уровне настольной ОС» и поддерживает 13 действий, включая открытие веб-браузера, ввод текста, а также перетаскивание элементов. Сообщается, что модель уже доступна разработчикам через платформы Google AI Studio и Vertex AI. Кроме того, публичная демонстрация размещена в виртуальном браузере BrowserBase, где можно наблюдать, как ИИ выполняет такие задачи, как «сыграть в игру 2048» или «просмотреть Hacker News в поисках обсуждаемых тем». OpenAI не исключает появления рекламы в ChatGPT Pulse в будущем
07.10.2025 [11:26],
Владимир Мироненко
Генеральный директор OpenAI Сэм Альтман (Sam Altman) на встрече с журналистами на мероприятии DevDay в Сан-Франциско (США) не исключил возможность добавления в будущем рекламы при использовании новой функции ChatGPT Pulse, которая сейчас доступна только подписчикам тарифа ChatGPT Pro.
Источник изображения: OpenAI ChatGPT Pulse — это новейшая разработка OpenAI в области персонализации для ChatGPT, которая была представлена в конце прошлого месяца. Эта функция позволяет чат-боту получать информацию о пользователе из его подключённых приложений, например, календаря и электронной почты, активности в интернете, переписки и т.д., чтобы затем собирать в Сети информацию от его имени и каждое утро предоставлять сводку по различным темам, которым могут представлять для него интерес. Это может быть ежедневная персонализированная программа тренировок, уроки языка, обзоры новостей или рекомендации по заказу в ресторане, куда он собирается вечером. Одним словом, OpenAI хотела бы, чтобы пользователи каждый день начинали с ChatGPT. В компании признали, что вопрос добавления рекламы в Pulse обсуждается, но, по словам Альтамана, таких планов в настоящее время нет. Вместе с тем он отметил, что ему нравится реклама в Instagram✴✴, и не исключил возможности внедрения подобной релевантной рекламы в Pulse в будущем. Изначально при разработке Pulse предполагалось сделать эту функцию доступной для всех, но из-за высокой вычислительной нагрузки приложения было решено предложить её только для участников платной подписки Pro. OpenAI сделала общедоступным Codex — ИИ-алгоритм с динамическим мышлением для агентского программирования
07.10.2025 [04:37],
Владимир Фетисов
В прошлом месяце OpenAI представила обновлённого ИИ-агента GPT-5-Codex, способного динамически распределять время на выполнение задач. На тот момент он был доступен подписчикам ChatGPT Plus, Pro, Business, Education и Enterprise. Теперь же алгоритм получает ряд полезных нововведений и становится общедоступным.
Источник изображения: AI Разработчики интегрировали Codex в сервис совместной работы Slack. Благодаря этому пользователи смогут делегировать задачи и задавать вопросы ИИ-агенту прямо в канале команды или ветке обсуждения, подобно тому, как происходит общение между коллегами. Вместе с этим Open AI выпустила Codex SDK, благодаря которому ИИ-агента можно будет встроить в продукты сторонней разработки. Ещё одним нововведением стало появление дополнительных инструментов администрирования, которые обеспечат больше контроля над средами разработки. Администраторы смогут редактировать и удалять облачные среды Codex внутри своего рабочего пространства. Появится возможность применения настроек с повышенным уровнем безопасности по умолчанию для локального использования через терминал и расширение для IDE. Новые аналитические панели помогут администраторам отслеживать разные параметры в процессе взаимодействия пользователей с ИИ-агентом. Теперь пользователи могут взаимодействовать с Codex практически в любом месте, где они занимаются написанием программного кода, будь то какой-то редактор или облако, и всё это связано в рамках одной учётной записи ChatGPT. По данным OpenAI, уровень ежедневного использования ИИ-агента вырос более чем в 10 раз с начала августа. Отмечается, что GPT-5-Codex вошла в число самых быстрорастущих ИИ-моделей компании. С её помощью было обработано свыше 40 трлн токенов за три недели с момента запуска. Codex используется разработчиками по всему миру, а в OpenAI он уже стал неотъемлемой частью процесса разработки. Интеграция ИИ-агента в Slack и Codex SDK доступны разработчикам в рамках тарифных планов ChatGPT Plus, Pro, Business, Edu и Enterprise, начиная с этой недели. Новые функции администрирования смогут опробовать подписчики Business, Edu и Enterprise. Более детальную информацию касательно разграничений доступа в зависимости от используемого тарифа можно получить на сайте OpenAI. OpenAI запустила AgentKit — инструмент для создания ИИ-агентов за считанные минуты
07.10.2025 [00:23],
Анжелла Марина
Компания OpenAI представила на мероприятии для разработчиков Dev Day новый инструмент AgentKit, предназначенный для упрощения разработки и развёртывания ИИ-агентов для задач разного уровня сложности. Как заявил глава компании Сэм Альтман (Sam Altman), AgentKit представляет собой единый комплект компонентов в одном интерфейсе платформы OpenAI, который поможет быстрее создавать и оптимизировать автономных пользовательских агентов.
Источник изображения: OpenAI Инструментарий включает несколько важных модулей, сообщается в блоге OpenAI. Первый — Agent Builder, который Альтман охарактеризовал как «Canva для создания агентов». Он обеспечивает быстрый визуальный способ проектирования логики, шагов и идей и построен на базе Responses API, уже используемого сегодня многими разработчиками. Второй модуль называется ChatKit. Он предоставляет простой встраиваемый чат-интерфейс, который разработчики могут интегрировать в собственные приложения. Его также можно размещать на веб-сайтах и настраивать в соответствии с тематикой продукта или брендом компании. Третий модуль, под названием Evals for Agents, измеряет производительность ИИ-агента и оценивает как его поведение в целом, так и отдельные компоненты в соответствии с множеством наборов данных для анализа. AgentKit также предоставляет доступ к реестру коннекторов OpenAI, позволяя разработчикам безопасно подключать агентов к внутренним инструментам и сторонним системам через «панель администрирования», сохраняя при этом контроль и безопасность. В подтверждение простоты использования инструмента инженер OpenAI Кристина Хуан (Christina Huang) в прямом эфире на сцене Dev Day создала полноценный рабочий процесс и двух ИИ-агентов менее чем за восемь минут. Альтман добавил, что AgentKit включает всё то, чего не хватало команде OpenAI при создании первых собственных агентов, и сообщил, что компания уже заключила контракты с рядом партнёров, которые начали внедрять и масштабировать использование агентов с помощью нового инструмента. Google представила ИИ-агента CodeMender — он самостоятельно устраняет уязвимости ПО
06.10.2025 [21:02],
Анжелла Марина
Лаборатория Google DeepMind опубликовала результаты работы агента на базе искусственного интеллекта CodeMender. Агент может в автономном режиме выявлять, исправлять и переписывать уязвимый код для предотвращения будущих эксплойтов в программном обеспечении.
Источник изображения: Google Как пишет издание SiliconANGLE, CodeMender развивает предыдущие проекты DeepMind по поиску уязвимостей, в частности проект OSS-Fuzz для анализа безопасности открытого ПО и систему Big Sleep, сочетая интеллектуальные возможности моделей Gemini с передовыми методами программного анализа. Основной целью проекта является автономная отладка и исправление сложных ошибок в крупномасштабных кодовых базах. Несмотря на то что проект находится на стадии исследований, CodeMender уже отправил 72 исправления безопасности в проекты с открытым исходным кодом, включая те, объём которых превышает 4,5 миллиона строк кода. По данным компании, ИИ-агент позволяет разработчикам сосредоточиться на создании качественного программного обеспечения, автоматически генерируя и применяя надёжные патчи безопасности. Система спроектирована как для реактивной, так и для проактивной работы: она не только мгновенно исправляет обнаруженные уязвимости, но и переписывает существующий код, устраняя целые классы ошибок. В качестве примера исследователи DeepMind приводят работу агента с библиотекой сжатия изображений libwebp, которая была использована в атаке на iOS в 2023 году. Агент применил к ней аннотации -fbounds-safety, после чего, по заявлению исследователей, подобные уязвимости переполнения буфера стали «невозможными для эксплуатации навсегда». Внутренняя архитектура CodeMender включает набор инструментов: статический и динамический анализ, фаззинг, символьное исполнение и так называемого «судью LLM», который проверяет, сохраняют ли предлагаемые изменения исходную функциональность. Система способна к самокоррекции, если в процессе проверки обнаруживается проблема. Все изменения перед отправкой проходят проверку на корректность, соответствие стилевым стандартам и отсутствие регрессий. При этом в DeepMind подчёркивают, что CodeMender пока остаётся исследовательским проектом, и все патчи, сгенерированные им, проходят проверку исследователями-людьми перед отправкой в проекты. После запуска инструмент будет предлагать иной подход по сравнению с традиционными методами, такими как статический анализ и фаззинг, которые находят уязвимости, но всё ещё сильно зависят от опыта проверяющего человека. Новый подход изменит систему, в которой искусственный интеллект сможет самостоятельно выявлять и устранять ошибки, что является критически важным шагом по мере экспоненциального роста размера и сложности современных кодовых баз. Microsoft добавила «вайб-воркинг» в Office — ИИ-агента для создания сложных документов и таблиц по указаниям пользователя
30.09.2025 [12:36],
Павел Котов
Microsoft запустила в Excel и Word режим агента с искусственным интеллектом (Agent Mode), позволяющий автоматически создавать по одному текстовому запросу сложные электронные таблицы и текстовые документы. В чате Copilot также дебютировала функция Office Agent, работающая на основе моделей Anthropic — она позволяет быстро создавать презентации PowerPoint и документы Word.
Источник изображений: microsoft.com Режим агента в Excel и Word — это более мощный вариант помощника Copilot, который уже присутствует в программах офисного пакета. Одна из задач агента состоит в том, чтобы сделать доступными для пользователей сложные функции Excel. ИИ-агент работает на базе модели OpenAI GPT-5. Получив сложную задачу, он разбивает её на этапы, составляет план и пояснения к нему, позволяя пользователю следить за своей работой. Каждый этап он, в свою очередь, делит на конкретные задачи, и каждое действие агента отображается на боковой панели. ИИ-агент в Excel набрал 57,2 % в тесте SpreadsheetBench, предназначенном специально для оценки способности моделей редактировать электронные таблицы. Это выше, чем показали Shortcut.ai, агент ChatGPT и Anthropic Claude Files Opus 4.1, но ниже результата человека, у которого 71,3 %. Режим агента в Word — это не просто редактирование и составление сводок текста. Агент готовит черновики материалов, предлагает уточнения и указывает, что может понадобиться при составлении документа. Можно свести рабочие данные за несколько месяцев в единый отчёт, подвести итоги месяца и быстро установить различия с предыдущим отчётом. ![]() Office Agent на базе моделей Anthropic работает в чате Copilot вне пакета офисных приложений, но позволяет прямо в чате создавать презентации PowerPoint и документы Word. В случае PowerPoint пользователь получает презентацию с логичной структурой, при составлении которой ИИ может обращаться к источникам среди веб-ресурсов и в процессе демонстрирует предварительные версии слайдов. Примечательно, что в программах пакета Office основными выступают модели OpenAI, но всё большее место в экосистеме Microsoft занимают модели другого разработчика — Anthropic. Разработчик интегрировал Office Agent в чат Copilot, обращаясь к API Anthropic на базе Amazon Web Services — прямого конкурента Microsoft. Это, возможно, объясняет, почему глубокой интеграции моделей этого разработчика в офисном пакете пока нет. Режим ИИ-агента в Word и Excel уже доступен участникам программы тестирования экспериментальных функций Frontier — нужна подписка Microsoft 365 Copilot или Microsoft 365 Personal/Family. Пока он дебютировал только в веб-версиях приложений, но вскоре появится и в их десктопных вариантах. Office Agent тоже работает пока только для пользователей программы Frontier для подписчиков тех же Microsoft 365 Copilot и Microsoft 365 Personal/Family в США. OpenAI встроила онлайн-шоппинг в ChatGPT: покупать товары теперь можно не выходя из чата
30.09.2025 [07:42],
Алексей Разин
На рынке США компания OpenAI предложила клиентам определённых торговых площадок функцию интеграции онлайн-шоппинга в диалоговое окно своего ChatGPT, чтобы они могли находить нужные товары через чат-бот и там же совершать покупки. Этим самым OpenAI вторгается в сферу коммерческих интересов Amazon и Google, помимо прочих.
Источник изображения: Unsplash, CardMapr.nl Как отмечает TechCrunch, нововведение доступно зарегистрированным пользователям планов ChatGPT Pro, Plus и Free на территории США, которые могут покупать товары с площадок Etsy и Shopify, хотя в последнем случае поддержка нововведения пока находится в состоянии реализации. ChatGPT выступает в роли агента, готового передать платёжную информацию от покупателя продавцу в зашифрованном виде, если пользователь чат-бота определится со своим выбором и пожелает совершить покупку. Удобство заключается в том, что покупателю не нужно будет открывать отдельное окно или приложение, и сделку можно будет оформить прямо из ChatGPT. Поддерживаются платёжные системы Apple Pay, Google Pay, Stripe и банковские карты. Нельзя сказать, что OpenAI стала пионером в этой области, поскольку Perplexity подобные функции реализовала в своей экосистеме ещё в прошлом году. Microsoft также позволяет продавцам интегрировать функцию покупки товаров в Copilot. При этом OpenAI собирается открыть для разработчиков исходный код протокола ACP, который позволит им интегрировать опцию моментальной покупки через Stripe в свои программные интерфейсы. Компании Google и Amazon, которые долгое время выступали крупными агентами в сфере онлайн-торговли, теперь получат нового амбициозного конкурента. Тем более, что они также предлагают разработчикам ПО для торговых площадок протокол AP2, позволяющий интегрировать функцию покупки через ИИ-агента. Президент OpenAI: человечеству потребуется 10 млрд ИИ-ускорителей — по одному на каждого жителя Земли
30.09.2025 [06:58],
Алексей Разин
Сейчас стартап OpenAI использует любую возможность для привлечения не только финансовых ресурсов, но и заключения контрактов с поставщиками тех же ускорителей вычислений, коим является Nvidia. Президент компании Грег Брокман (Greg Brockman) убеждён, что человечеству потребуется до 10 млрд ускорителей вычислений, и каждого жителя планеты буквально будет обслуживать отдельный ИИ-чип.
Источник изображения: Nvidia Своими соображениями президент OpenAI поделился в интервью CNBC, в котором также приняли участие генеральный директор компании Сэм Альтман (Sam Altman), а также глава и основатель Nvidia Дженсен Хуанг (Jensen Huang). По мнению Альтмана, масштабы сотрудничества с Nvidia по своей значимости для человечества окажутся важнее программы доставки до Луны американских астронавтов, которую NASA реализовало в прошлом веке. Альтман видит будущее человечества с неразрывным присутствием «супермозга», созданного искусственным интеллектом и активно влияющего на повседневную жизнь людей. Брокман же считает, что ИИ будет действовать в качестве «агента, который работает на опережение, пока вы спите». Каждый работающий житель Земли, по его мнению, будет использовать ресурсы как минимум одного ускорителя вычислений при выполнении своих должностных обязанностей. «Вам действительно захочется, чтобы у каждого человека был свой собственный выделенный GPU», — охарактеризовал свой прогноз Брокман. Сейчас подобное предсказание может казаться нереалистичным, но достаточно вспомнить, что в начале девяностых годов прошлого века один из основателей Microosft Билл Гейтс (Bill Gates) указывал на неизбежность появления компьютера не только в каждом домохозяйстве, но и на каждом рабочем столе. В какой-то мере его предсказание сбылось, пусть даже если вместо компьютеров в их классической форме речь идёт о смартфонах, которые помещаются в карман. Брокман считает, что сейчас отрасль ИИ на три порядка отстаёт от потенциальных потребностей в вычислительных мощностях, и для создания постоянно функционирующей глобальной системы искусственного интеллекта человечеству может потребоваться до 10 млрд ускорителей вычислений. По сути, это даже больше, чем проживает людей на Земле (8,2 млрд человек). Мир, по мнению Брокмана, движется к состоянию, при котором экономику подпитывают вычисления. Вычислительных мощностей сейчас не хватает, как он считает, а наличие достаточно мощных центров обработки данных в будущем станет определять состоятельность экономики целых стран. В какой-то мере они заменят валюту в качестве источника ресурсов для развития экономики. OpenAI анонсировала ChatGPT Pulse — ИИ-агента, который следит за пользователем постоянно
26.09.2025 [11:11],
Павел Котов
OpenAI представила новую функцию персонализации ChatGPT Pulse: пользователь может предоставить чат-боту возможность всесторонне изучать себя через переписку и данные подключённых приложений: календаря электронной почты и списка контактов. На основе этой информации искусственный интеллект подбирает то, что, по его мнению, может оказаться полезным, и ежедневно предоставляет сводку по этим вопросам.
Источник изображений: openai.com Новая функция мобильного приложения, получившая название ChatGPT Pulse, пока доступна только подписчикам тарифа Pro, но в перспективе, возможно, воспользоваться ей сможет и более широкая аудитория. Персонализированные рекомендации выводятся в виде «тематических визуальных карточек, которые можно быстро просмотреть или открыть для получения более подробной информации, и каждый день начинается с новой адресной подборки». Это могут быть новости о спортивных мероприятиях, ежедневные уроки для пополнения словарного запаса изучаемого языка, рекомендации по составлению меню на ужин в ресторане, куда пользователь пойдёт вечером, и многое другое. ![]() Пример работы ChatGPT Pulse продемонстрировала руководитель направления персонализации и рабочих решений в подразделении OpenAI ChatGPT Кристина Каплан (Christina Kaplan), рассказал The Verge. ИИ-агент подготовил ей рекомендации с учётом событий в календаре, прошлых запросов и истории переписки с чат-ботом: запланированные на день события, ограничения в диетическом рационе и вообще то, о чём бы она хотела узнать подробнее. «У вас насыщенный вечер — вот как плавно перейти от пробежки к ужину», — посоветовал ChatGPT. ИИ предложил ей несколько вариантов, как реализовать планы на вечер, в том числе резервные — на случай, если на основной сценарий времени будет не хватать. ChatGPT Pulse также предложил ей скорректировать алгоритмы ИИ на будущее: «О чём вы думаете в последнее время? Я запомню это для завтрашней подборки». И вывел несколько вариантов ответов, в том числе «Мне интересно...», «Мои ближайшие планы включают...» и «Я бы хотела быть в курсе...». ChatGPT Pulse дал госпоже Каплан рекомендации по повседневным занятиям пилатесом и укреплению мышц пресса, по стратегии питания с учётом предстоящего похода на день рождения и по упражнениям для восстановления после длительных поездок накануне. ![]() Для наиболее эффективной персонализации сервис просит пользователя открыть некоторые свои данные для ChatGPT: доступ к соседним чатам с ИИ, к календарю и электронной почте — и когда даются такие разрешения, требуется явное согласие. На вопрос о том, поможет ли другим отзыв одного пользователя о работе с ChatGPT Pulse, Кристина Каплан ответила, что он поможет лишь самому этому пользователю, и только для составления завтрашней подборки. «Ваш Pulse — между вами и ChatGPT. Влияние на обучающие данные то же, что при обычной переписке с ChatGPT», — пояснила она. Представитель OpenAI также заверила, что ChatGPT Pulse безопасен для пользователей с нестабильной психикой, и он не затянет их в пучину тревожности — компания предусмотрела «ряд фильтров и ограничений безопасности», и специалисты OpenAI продолжают «изучать» этот вопрос. Наконец, бесконечной прокрутки в ленте карточек ChatGPT Pulse тоже не предусмотрено — она конечна, «чтобы работать на вас, а не заставлять постоянно листать страницу». |
|
✴ Входит в перечень общественных объединений и религиозных организаций, в отношении которых судом принято вступившее в законную силу решение о ликвидации или запрете деятельности по основаниям, предусмотренным Федеральным законом от 25.07.2002 № 114-ФЗ «О противодействии экстремистской деятельности»; |