Сегодня 09 сентября 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → ии-агент
Быстрый переход

Искусственный интеллект Google теперь может звонить по телефону за пользователя

Google запустила функцию, которая позволяет искусственному интеллекту (ИИ) совершать телефонные звонки от лица пользователей. Эта возможность уже доступна в поисковой системе и позволяет получать информацию о ценах и доступности услуг различных компаний, не совершая звонков вручную.

 Источник изображения: Google

Источник изображений: Google

Изначально функция начала тестироваться в январе и пока охватывает ограниченный круг компаний в США — например, салоны для животных, химчистки и автосервисы, сообщает The Verge. При поиске таких услуг под результатами появляется кнопка «Проверить цену с помощью ИИ» (Have AI check pricing). После выбора пользователь предоставляет дополнительные данные: перечень необходимых услуг, удобное время визита, а также способ получения ответа — по SMS или электронной почте. Отмечается, что эта опция может быть особенно востребована среди молодых пользователей, которые зачастую испытывают дискомфорт при телефонных разговорах.

Как сообщил Робби Штейн (Robby Stein), вице-президент по продуктам Google Search, технология основана на модели Duplex и использует искусственный интеллект Gemini. По его словам, система представляет собой ИИ-ассистента, собирающего информацию от имени пользователя, чтобы тот не тратил время на самостоятельные звонки. После получения данных ИИ отправляет обновление с указанием доступных цен и другой необходимой информации. При этом владельцы бизнеса могут отключить приём звонков от ИИ в настройках своего профиля в Google.

Помимо этого, Google начала тестировать обновлённую версию Gemini 2.5 Pro в ИИ-режиме (AI Mode) — инструменте, который стал доступен всем пользователям в США с мая 2025 года. Подписчики AI Pro и AI Ultra, участвующие в эксперименте AI Mode через Google Labs, могут использовать новую модель, которая, по словам Штейна, особенно хорошо справляется с задачами, требующими логики, математических вычислений и программирования. По умолчанию AI Mode работает на базе модели Gemini 2.0.

Кроме того, тестируется интеграция функции Deep Search в AI Mode, позволяющая системе формировать подробные отчёты по пользовательским запросам. Отмечается, что модель самостоятельно формулирует вопросы, проводит поисковые запросы и, проверяя полученные данные, выстраивает цепочку логических шагов для формирования итогового ответа. Эта функция также будет доступна подписчикам AI Pro и AI Ultra в рамках экспериментов Google Labs.

ИИ-помощники программистов начали перемещаться в интерфейс командной строки

Существующие уже не первый год инструменты для написания кода, основанные на искусственном интеллекте, такие как Cursor, Windsurf и GitHub Copilot, выступают в качестве законодателей моды в своём сегменте. И по мере развития ИИ-агентов эти инструменты меняют механизмы работы, перемещаясь в терминал — интерфейс командной строки, обращает внимание TechCrunch.

 Источник изображения: Mohammad Rahmani / unsplash.com

Источник изображения: Mohammad Rahmani / unsplash.com

Вместо работы только с кодом эти сервисы всё чаще взаимодействуют напрямую с оболочкой операционной системы, в которой работают, — это существенное изменение в процессе разработки ПО с использованием ИИ, и оно может повлиять на всю отрасль. Переход уже начали все крупные разработчики: в феврале Anthropic, Google DeepMind и OpenAI выпустили инструменты для программирования, ориентированные на работу с командной строкой — Claude Code, Gemini CLI и CLI Codex соответственно. Эти продукты уже завоевали популярность у своей аудитории.

Эту перемену легко не заметить, поскольку новые средства выпускаются преимущественно под теми же брендами, что и предыдущие, но на самом деле изменения носят глубокий характер. В будущем, считают создатели профильного бенчмарка Terminal-Bench, 95 % взаимодействия больших языковых моделей с компьютерами будут осуществляться через терминал или аналогичный интерфейс. Первое место в рейтинге теста занимает компания Warp, предложившая «агентную среду разработки» — нечто среднее между традиционной IDE и набором инструментов командной строки, таких как Claude Code.

 Источник изображения: Fotis Fotopoulos / unsplash.com

Источник изображения: Fotis Fotopoulos / unsplash.com

Чтобы оценить отличия нового подхода, полезно взглянуть на применяемые для его анализа бенчмарки. Так, задачи SWE-Bench составляются на основе открытых сообщений о проблемах на GitHub — это реальные фрагменты кода, которые не работают. Для поиска решения ИИ-модели предлагают собственные варианты, пока код не начнёт функционировать. Инструменты с поддержкой терминала позволяют взглянуть ещё шире, поскольку охватывают не только сам код, но и всю среду, в которой запускается приложение: помимо написания кода, решаются задачи по настройке Git-сервера и отладке.

В одной из задач, предлагаемых в Terminal-Bench, указывается программа для распаковки и приводится целевой текстовый файл — ИИ-агенту требуется произвести обратную разработку и определить подходящий алгоритм сжатия. В другой задаче — агенту предлагается собрать ядро Linux из исходного кода, но не упоминается, что этот исходный код необходимо предварительно скачать. Важно, что новый подход предполагает поэтапное решение задач — именно на основе этой способности оценивается ценность ИИ-агентов. Однако даже в этом случае они пока не решают все задачи — так, Warp вышел в лидеры, справившись лишь с чуть более чем половиной из них.

Тем не менее уже сейчас, подчёркивают эксперты, ИИ-агенты способны взять на себя значительную часть задач, которые обычно выполняет разработчик, и игнорировать это нерационально. Тот же Warp успешно справляется с повседневной работой по подготовке нового проекта, выявлению зависимостей и запуску — а в случаях, когда ИИ не справляется, он поясняет, почему.

В Windows 11 появился ИИ-агент, помогающий с настройками ОС

Microsoft продолжает активно внедрять функции на базе искусственного интеллекта в операционную систему Windows 11. На этот раз разработчики добавили ИИ-агента в приложение «Настройки», благодаря чему пользователям будет проще находить и настраивать разные параметры для оптимизации работы программной платформы.

 Источник изображений: Mauro Huculak / Windows Central

Источник изображений: Mauro Huculak / Windows Central

Эффективное использование настроек, в том числе, подразумевает то, что пользователь точно знает, что ищет и где это можно найти. Хотя в этом может помочь функция внутреннего поиска, успех запроса по-прежнему зависит от того, имеет ли пользователь представление о названии той или иной опции. Для опытного пользователя навигация по интерфейсу Windows 11 не является чем-то трудным. Однако найти тот или иной параметр может быть не так просто. Исправить это должен новый ИИ-агент, который разработчики интегрировали в приложение «Настройки».

Упомянутый ИИ-агент не является аналогом виртуального помощника Copilot. Он интегрирован именно в приложение «Настройки», благодаря чему пользователь может находить параметры конфигурации, просто описывая проблему или изменения, которые он хочет внести. Важно и то, что задавать вопросы можно естественным языком, не прибегая к терминам, а просто описывая своими словами то, что нужно изменить. ИИ-агент понимает такие запросы и в ответ на них находит нужный параметр или предлагает внести изменение автоматически.

Пользователям предлагается воспринимать ИИ-агента не столько инструментом поиска, сколько встроенным помощником, который помогает устранять неисправности и настраивать разные параметры. Ранее Microsoft рассматривала возможность внедрения аналогичной концепции в Copilot, но в конечном счёте от неё было решено отказаться.

Для взаимодействия с ИИ-агентом в приложении «Настройки» потребуется компьютер класса Copilot+ PC. После запуска приложения «Настройки» достаточно начать писать запрос в строке поиска, а ИИ-агент в режиме онлайн будет предлагать варианты. Например, если спросить: «Как управлять моим компьютером с помощью голоса?», ИИ-агент предложит активировать соответствующую опцию.

Несмотря на то, что ИИ-агент выглядит многообещающим, Microsoft признаёт, что на данном этапе он работает не идеально, что, в том числе, обусловлено несовершенством используемых языковых моделей. Сейчас ИИ-агент доступен для владельцев компьютеров Copilot+ PC, принимающих участие в программе Windows Insider.

Huawei выпустила «безандроидную» бета-версию HarmonyOS 6 — пока только для разработчиков

В прошлую пятницу китайская компания Huawei Technologies представила не только свою серверную систему CloudMatrix 384 и новые большие языковые модели, но и бета-версию потребительской операционной системы HarmonyOS 6. Она уже доступна разработчикам приложений, но сроки выхода этой платформы на рынок пока не уточняются.

 Источник изображения: Unsplash, Onur Binay

Источник изображения: Unsplash, Onur Binay

Как поясняет South China Morning Post, серия премьер в изложении Huawei состоялась в минувшую пятницу на ежегодной конференции для разработчиков. Упор делался на приложения для искусственного интеллекта и сопутствующие функции. По словам главы потребительского бизнеса Huawei Ричарда Ю (Richard Yu), версия 5 операционной системы HarmonyOS уже установлена на более чем 40 моделях устройств Huawei, в экосистеме компании зарегистрированы более 8 млн разработчиков, а клиентам доступны более 30 000 приложений и сервисов, работающих под управлением этой платформы.

Из этого количества основное время использования клиентами пришлось примерно на 5000 самых популярных приложений, и с этой точки зрения решения Huawei всё ещё серьёзно отстают как от экосистемы Apple, так и от Google Android. Китайская компания в целях облегчения создания ИИ-агентов предложила разработчикам инструментарий HarmonyOS Agent Framework. Когда состоится публичный анонс HarmonyOS 6, под управлением этой операционной системы смогут функционировать более 50 ИИ-агентов — программ, которые способны выполнять определённую работу от имени пользователя и в его интересах, используя ресурсы систем искусственного интеллекта.

Perplexity анонсировала заменитель Google Chrome — ИИ-браузер Comet

Компания Perplexity анонсировала запуск браузера с искусственным интеллектом под названием Comet. Он создаётся как платформа для так называемого агентного поиска, при котором пользователь взаимодействует с веб-окружением через интеллектуального цифрового посредника, способного интерпретировать, уточнять и контекстуализировать запросы человека.

 Источник изображения: Perplexity

Источник изображения: Perplexity

По словам генерального директора компании Аравинда Сриниваса (Aravind Srinivas), разработка Android-версии браузера идёт успешно и быстро, а его релиз можно ожидать уже осенью этого года. При этом версия Comet для Windows будет доступна в формате открытой беты уже на следующей неделе. Компания подтвердила, что параллельно с этим будет выпущена и macOS-версия браузера, что подчёркивает её стратегию кроссплатформенного охвата. Возможно, ранний запуск Comet на Windows объясняется приоритетом настольных решений, где проще протестировать новые интерфейсные сценарии, прежде чем переходить к мобильной версии.

Разработчики делают ставку не только на поиск, но и на расширенную функциональность, превращающую Comet в модульную интеллектуальную среду. Браузер будет включать не только собственный Perplexity-поисковик, но и встроенные обучающие модули и игры, которые, по словам Сриниваса, будут вполне реализуемы в рамках архитектуры продукта. Также заявлена интеграция корпоративного инструмента Labs — среды для продуктивной работы и взаимодействия с ИИ. В перспективе Comet получит доступ к таким элементам экосистемы, как интеллектуальные сервисы для анализа и рекомендации контента, финансовые утилиты и платформа коллективной работы Spaces. Архитектура браузера спроектирована таким образом, чтобы эти модули можно было подключать по мере необходимости, превращая Comet в персонализированную цифровую среду.

 Мировой рынок веб-браузеров за период с мая 2024 года по май 2025 года. Лидером уверенно остаётся Google Chrome с долей 66,85 % по состоянию на май 2025 года. Источник изображения: StatCounter

Мировой рынок веб-браузеров за период с июня 2024 года по май 2025 года. Лидером уверенно остаётся Google Chrome с долей 66,85 % по состоянию на май 2025 года. Источник изображения: StatCounter

Конкуренция на рынке браузеров остаётся высокой. После запуска на Android Comet вступит в прямую борьбу с лидерами рынка вроде Google Chrome и Mozilla Firefox, а также с новыми игроками, включая Arc Search и проект Dia от The Browser Company, который, как ожидается, будет представлен в течение года. Учитывая, что браузер Chrome занимает более 66,85 % мирового рынка и установлен на большинстве Android-устройств по умолчанию, Perplexity предстоит непростая задача — убедить пользователей сменить привычный интерфейс на их интеллектуального агента.

Однако Perplexity делает ставку на то, что пользователи готовы к следующему этапу цифровой эволюции. Агентный поиск, в отличие от традиционного, предлагает не просто список ссылок, а персонализированный диалог с системой, уточнение запроса в реальном времени и выдачу итогового результата в виде готовой рекомендации, анализа или действия. На фоне релизов таких систем, как GPT-5 компании OpenAI и Gemini компании Google, модель взаимодействия «человек — агент — интернет» постепенно становится новой нормой. Именно в этот тренд и вписывается Comet, который должен стать не браузером в классическом понимании, а интеллектуальной навигационной платформой с глубокой интеграцией ИИ-инструментов.

Amazon тайно разрабатывает роботов с ИИ, которые смогут выполнять задачи полностью самостоятельно

Amazon подтвердила, что в её закрытом исследовательском подразделении Lab126 создана новая исследовательская группа, занимающаяся разработкой робототехнических систем с интегрированным агентным ИИ. Её цель — вывести логистику на новый уровень за счёт машин, способных понимать команды на естественном языке и выполнять сложные задачи в автономном режиме.

 Источник изображений: Amazon

Источник изображений: Amazon

Подразделение Lab126 хорошо известно в отрасли как сердце НИОКР-проектов, которые Amazon хранит в строжайшей тайне до их выхода на рынок. Именно здесь были разработаны такие знаковые устройства, как Kindle и Echo. Теперь команда переориентируется на новую задачу: вывести роботов Amazon на уровень «агентности», то есть научить их слышать, понимать и выполнять команды человека на естественном языке. В отличие от существующих складских роботов, каждый из которых выполняет строго одну функцию, агентные роботы будут адаптивны и многофункциональны.

 Источник изображений: Amazon

Йеш Даттатрея (Yesh Dattatreya), старший менеджер по прикладной науке в Amazon Robotics, в интервью изданию Reuters отметил, что главная цель проекта — сократить время доставки, особенно в периоды пикового спроса. Роботы нового поколения смогут не только разгружать трейлеры и сортировать товары, но и поднимать тяжёлые предметы в узких пространствах. Более того, Amazon рассчитывает, что внедрение таких систем позволит минимизировать производственные отходы и снизить углеродные выбросы.

 Источник изображений: Amazon

Несмотря на публичное объявление, проект пока остаётся в стадии начальных прототипов. По словам Даттатреи, Amazon ещё не определилась с форм-фактором устройств, не называет сроков, ни масштабов внедрения. Тем не менее, инженеры компании уже закладывают основу архитектуры, способной в будущем трансформировать роботов Amazon в универсальных и автономных исполнителей.

 Источник изображений: Amazon

У Amazon уже есть опыт в области агентного ИИ. В начале года её ИИ-лаборатория представила Nova Act — браузерного ИИ-агента, способного выполнять действия в интернете по командам пользователя. Ещё одно новшество — Alexa+, обновлённая версия голосового помощника, обладающая базовыми функциями агентности: запоминание целей, выполнение последовательных действий. Однако обе системы пока ограничены цифровым пространством и не взаимодействуют с физической средой.

 Источник изображений: Amazon

Amazon также рассказала о разработке усовершенствованных картографических технологий, ориентированных на работу курьеров. Новые карты обеспечат высокую детализацию зданий, покажут потенциальные препятствия и предложат оптимальные маршруты доставки. Особое внимание уделяется сложным локациям: офисным комплексам и жилым кварталам с одинаковыми зданиями. Это решение должно значительно упростить навигацию и снизить время на поиск точек доставки заказов.

Amazon заявила, что планирует интеграцию этих карт с очками дополненной реальности для водителей доставки. Эти очки со встроенным дисплеем смогут отображать карту и прокладывать пошаговый маршрут в реальном времени. Об этом сообщил вице-президент и глава Amazon Maps and Geospatial Вираж Чаттерджи (Viraj Chatterjee). Он отметил, что устройство пока находится в стадии тестирования, но первые результаты уже демонстрируют эффективность технологии, особенно в зонах с однотипной архитектурой.

«Алиса» научится сама бронировать столики и не только — «Яндекс» превратит помощницу в ИИ-агента

Компания «Яндекс» работает над интеграцией навыков ИИ-агента в цифровой помощник «Алиса». Ожидается, что новые возможности «Алисы» станут доступны в бета-версии «Яндекс Браузера» летом этого года.

 Источник изображений: «Яндекс»

Источник изображений: «Яндекс»

Напомним, ИИ-агент представляет собой программный продукт на базе больших языковых моделей (LLM), способный самостоятельно выполнять задачи, опираясь на алгоритмы машинного обучения и искусственного интеллекта. К примеру, ИИ-агенты способы осуществлять анализ данных, принимать решения на основе заданных параметров, взаимодействовать с другими системами, обучаться на собственных ошибках и др.

Что касается «Алисы», то добавление навыков ИИ-агента сделает возможным не только поиск информации с помощью виртуального помощника, но и взаимодействие с веб-страницами. К примеру, на просьбу забронировать визит в парикмахерскую или столик в ресторане «Алиса» сможет самостоятельно заполнить и отправить соответствующую форму на сайте заведения. Ранее «Яндекс» внедрила ИИ-агентов для улучшения работы техподдержки в сервисах «Еда» и «Маркет», благодаря чему решение вопросов пользователей ускорилось на 10–15 %.

Отметим, что ИИ-агентов запускают разные технологические компании. К примеру, в конце прошлого года прототип ИИ-агента представила Google. Он разрабатывается в рамках проекта Project Mariner и может заполнять разные формы в браузере Chrome, а также выполнять другие действия. Изначально ИИ-агент был доступен небольшой группе людей, но недавно Google объявила, что он также станет доступен пользователям тарифа AI Ultra стоимостью $250 в месяц.

У россиян стали вдвое чаще угонять аккаунты от ChatGPT и других ИИ-сервисов

Количество взломов аккаунтов пользователей нейросетей в России за первые четыре месяца 2025 года увеличилось на 90 % по сравнению с аналогичным периодом прошлого года. Об этом «Известиям» сообщили в компании «Информзащита». Главной причиной роста инцидентов эксперты называют популярность ИИ-приложений и недостаточную осторожность пользователей при работе с ними.

 Источник: Unsplash

Источник: Unsplash

Пользователи активно делятся с нейросетями конфиденциальной информацией: паролями от банковских счетов и платежных сервисов, персональными данными и рабочей информацией. Как сообщил директор Центра противодействия мошенничеству «Информзащиты» Павел Коваленко, граждане используют иностранные номера и специализированные сервисы-прослойки для регистрации в популярных ИИ-ассистентах, таких как ChatGPT, Grok или DeepSeek. Это, по его словам, создает дополнительные риски для безопасности.

Важным каналом утечек данных стали так называемые промпт-инъекции (внедрение вредоносных инструкций в запросы). Руководитель департамента информационно-аналитических исследований компании T.Hunter Игорь Бедеров сообщил, что подобные атаки могут привести к компрометации ИИ-инфраструктуры и раскрытию защищённых данных.

С начала 2025 года специалисты Bi.Zone Brand Protection обнаружили 2105 доменов, использующих темы ИИ для сбора персональных данных и распространения вредоносного ПО.

Эксперты рекомендуют пользователям придерживаться простых правил безопасности: использовать проверенные ресурсы, не делиться чувствительной информацией с чат-ботами и регулярно менять пароли. Аналитик Positive Technologies Роман Резников рекомендует обезличивать данные, заменяя реальные сведения на фиктивные, чтобы минимизировать риски в случае взлома.

Рост взломов в сфере ИИ отражает глобальную тенденцию: чем больше пользователей используют нейросети, тем активнее киберпреступники осваивают новые методы атак и мошенничества.

В ChatGPT появился ИИ-помощник программиста Codex

OpenAI представила ИИ-агента Codex для автоматизации программирования, который с сегодняшнего дня доступен подписчикам ChatGPT Pro, Enterprise и Team без дополнительной оплаты. Инструмент самостоятельно исправляет ошибки, запускает тесты и предлагает изменения в коде, работая как виртуальный коллега для разработчиков.

 Источник изображения: AI

Источник изображения: AI

Глава OpenAI Сэм Альтман (Sam Altman) позиционирует Codex не как улучшенную версию ChatGPT, а как полноценный самостоятельный продукт. Агент умеет генерировать код на основе простого текстового запроса, оптимизировать уже готовый код и запускать несколько задач параллельно, возвращаясь к ним позже. На выполнение сложных задач может уходить до 30 минут, но в будущем планируется увеличить время автономной работы помощника, сообщает The Verge.

Codex встроен в веб-версию ChatGPT, но пока не имеет доступа к интернету — это сделано для снижения рисков, связанных с безопасностью. Он работает на основе специализированной версии модели o3 от OpenAI под названием codex-1, специально оптимизированной для задач программирования. В OpenAI также заявляют, что Codex дополнит другие ИИ-инструменты, такие как Cursor и редактор кода Windsurf. Более того, компания ведёт переговоры о покупке Windsurf примерно за $3 млрд.

Отмечается, что пока возможности Codex ограничены, но со временем агент сможет полностью взять на себя рутинные задачи, связанные с программированием. «Мы считаем, что в будущем разработка будет строиться вокруг агента, работающего на отдельном компьютере, а люди будут лишь делегировать ему задачи», — заявили в компании. Сам Альтман называет программирование «ключевым направлением для будущего OpenAI».

Стоит отметить, что Codex — не совсем новый продукт. Ранее так назывался первый инструмент компании для генерации кода, представленный ещё в 2021 году. Сейчас помощь ИИ в программировании стала настолько важной и конкурентной темой, что OpenAI, конечно, не осталась в стороне. Anthropic активно развивает эту нишу, Windsurf только что выпустила свою линейку ИИ-моделей, а Google недавно добавила в Gemini возможность подключения к GitHub и представила своего агента для алгоритмической разработки под названием AlphaEvolve.

Интересно, что анонс Codex состоялся накануне ежегодной конференции Google I/O, которая пройдёт на следующей неделе. Учитывая конкуренцию между OpenAI и Google, выбор времени вряд ли случаен.

Цукерберг заявил, что ИИ сможет решить проблему одиночества и заменить психолога

Генеральный директор компании Meta заявил, что искусственный интеллект (ИИ) может стать решением проблемы одиночества и дефицита человеческого общения. По его мнению, ИИ способен выполнять функции друга и даже психолога, особенно для тех, кто не имеет возможности обратиться за профессиональной помощью.

 Источник изображения: AI

Источник изображения: AI

На этой неделе Марк Цукерберг (Mark Zuckerberg) выступил с рядом заявлений о социальной роли искусственного интеллекта в жизни человека. В интервью подкастеру Дваркешу Пателю (Dwarkesh Patel) он отметил, что современные люди страдают от одиночества. По его словам, у среднестатистического американца меньше трёх друзей, в то время как потребность в общении может достигать 15 человек.

Выходом из ситуации, по мнению миллиардера, может стать ИИ, встроенный в соцсети и умные устройства. Цукерберг подчеркнул, что ИИ конечно не заменит полностью живое общение, но поможет тем, у кого нет возможности иметь достаточное количество друзей или обратиться к психологу. «Физические связи лучше, когда они возможны, но реальность такова, что людям их не хватает, и они часто чувствуют себя более одинокими, чем хотели бы», — пояснил он.

При этом сегодня существуют предубеждения относительно общения с алгоритмами. Однако Цукерберг уверен, что со временем общество привыкнет к виртуальным собеседникам. «Мы найдём слова, чтобы объяснить, почему это ценно и как ИИ улучшает жизнь людей, — сказал он. — Но пока эта сфера очень молода, и воплощение таких идей остаётся слабым».

На конференции Stripe Цукерберг развил эту мысль, заявив, что пользователи будут стремиться к системам, которые понимают их почти так же хорошо, как алгоритмы социальных сетей. Он сравнил это с рекомендательными лентами Instagram и TikTok, которые изучают вкусы и предпочтения пользователей, и адаптируются под них.

В другом интервью с аналитиком Беном Томпсоном (Ben Thompson) глава Meta заявил, что в будущем у каждого будет собственный ИИ-психолог. «Это будет тот, с кем можно просто поговорить и обсудить любые жизненные проблемы. Для тех, у кого нет доступа к психологу-человеку, ИИ станет реальной альтернативой», — пояснил он.

Microsoft скоро позволит искусственному интеллекту менять настройки Windows 11

Microsoft объявила о внедрении ИИ-агента в приложение «Параметры» Windows 11. Агент сможет не только находить нужные настройки, но и автоматически изменять параметры ПК по голосовому или текстовому запросу пользователя, избавляя от необходимости искать нужные опции вручную.

 Источник изображения: Windows / Unsplash

Источник изображения: Unsplash

Как сообщает Windows Central, эта функция будет доступна только на компьютерах с поддержкой Copilot+ и сможет обрабатывать запросы на естественном языке. Пользователи смогут просто описать, что нужно найти или какой параметр изменить. Например, если сказать: «Как управлять ПК голосом» или «Как изменить указатель мыши», — система предложит соответствующее решение.

 Источник изображения: Microsoft

Источник изображения: Microsoft

Если пользователь даст разрешение, ИИ-агент сможет самостоятельно применять настройки, упрощая процесс для тех, кто не знает, где искать ту или иную опцию. При этом интерфейс приложения «Параметры» останется прежним, так что пользователи, предпочитающие ручную настройку, смогут продолжать пользоваться привычным меню.

 Источник изображения: Microsoft

Источник изображения: Microsoft

Новый ИИ-агент будет работать через поисковую строку в верхней части окна приложения. Достаточно ввести текст или продиктовать запрос — система покажет подходящие настройки и предложит применить их сразу, без необходимости перехода в дополнительные меню. Функция была анонсирована вместе с другими нововведениями Windows 11, включая обновлённое меню «Пуск» с настраиваемой панелью Phone Link.

Adobe представила ИИ-агента, который научит пользоваться Photoshop

Компания Adobe представила на мероприятии Adobe Max в Лондоне встроенного ИИ-агента для Photoshop, который поможет выполнять сложные задачи и автоматизировать многоэтапные процессы. Пользователям достаточно ввести запрос в текстовое поле, и агент либо выполнит задачу, либо пошагово объяснит, какие действия необходимо проделать. А в Firefly теперь можно использовать модели от Google и OpenAI.

 Источник изображения: Adobe

Источник изображения: Adobe

Новый агент доступен в обновлённой панели Actions и работает по принципу чат-бота. Adobe продемонстрировала, как ИИ применяет эффекты к тексту и фону, экономя время пользователей. По заявлению компании, инструмент справляется практически с любыми задачами, которые обычно требуют ручного вмешательства.

Параллельно Adobe представила новую версию генеративного сервиса Firefly, объединившего инструменты для создания изображений, видео, аудио и векторной графики. Обновлённый веб-интерфейс уже доступен, а мобильные приложения для Android и iOS выйдут позже. В основе Firefly теперь лежат улучшенные модели — Firefly Image Model 4 и 4 Ultra, обеспечивающие детализацию в разрешении 2K (2560 х 1440 пикселей). Сервис интегрирован с Photoshop, Premiere Pro и Express, помогая на всех этапах работы — от идеи до финального рендера.

 Источник изображения: Adobe

Источник изображения: Adobe

Впервые Adobe включила в Firefly сторонние ИИ-модели, включая Imagen 3 и Veo 2 от Google, а также генерацию изображений через ChatGPT. Компания подчеркнула, что данные пользователей не будут использоваться для обучения этих алгоритмов благодаря особым соглашениям с партнёрами. Кроме того, все собственные ИИ-модели Adobe обучены на легальном контенте, поэтому результат их работы безопасен для коммерческого использования. Это особенно важно для дизайнеров и фотографов, избегающих проблем с авторскими правами.

Выход ИИ-агента для Photoshop и новой версии Firefly запланирован на ближайшие месяцы. Точная дата и условия подписки пока не уточняются.

Adobe внедрит креативных ИИ-агентов в Photoshop и Premiere Pro

Компания Adobe работает над внедрением ИИ-агентов в графический редактор Photoshop и видеоредактор Premiere Pro. Агенты смогут не только предложить варианты редактирования изображений и видео, но и автоматически применить их. Об этом сообщил в своём блоге Илай Гринфилд (Ely Greenfield), технический директор Adobe по цифровым медиа.

 Источник изображения: blog.adobe.com

Источник изображения: blog.adobe.com

В приложении Photoshop новый ИИ-агент, который получил название «креативный агент», будет доступен через новую плавающую панель Actions. Этот инструмент сможет анализировать изображение и предлагать правки, например, удаление лишних объектов на заднем плане или художественное размытие фона. Для применения изменений пользователю потребуется лишь подтвердить выбранный вариант, отмечает The Verge.

Хотя опытные пользователи Photoshop традиционно предпочитают вручную редактировать объекты, работать со слоями и вносить детализированные правки, Adobe начала внедрение ИИ-инструментов. Среди них — функция Generative Fill для заливки или дополнения пикселями изображения, и Distraction Removal для удаления лишних объектов.

В перспективе пользователи смогут давать агенту команды на естественном языке, что упростит освоение сложных операций (хотя ИИ сможет выполнять их и самостоятельно). При этом можно будет либо корректировать работу агента, либо редактировать как обычно слои вручную.

Что касается Premiere Pro, Adobe продолжает развивать недавно представленную технологию Media Intelligence. Она уже умеет анализировать видео и помогать в поиске нужных фрагментов. В будущем ИИ-агент сможет выполнять черновой монтаж по запросу пользователя.

«Хотя ИИ не заменит творческое видение человека, он способен предложить разумные идеи, которые ускорят работу над проектом, — отметил Гринфилд. — Кроме того, он научит выполнять сложные задачи в несколько кликов, способствуя профессиональному росту редактора». В дальнейшем агент для Premiere Pro сможет подбирать оптимальные кадры, корректировать цвет, настраивать звук и выполнять другие задачи, в том числе с применением недавно представленного инструмента Generative Extend, который автоматически добавляет несколько секунд к клипу для плавного перехода.

Технологию, лежащую в основе первого ИИ-агента для Photoshop, представят на мероприятии Adobe Max в Лондоне 24 апреля.

ИИ-помощник программиста Google Gemini Code Assist научился писать приложения по описанию и переводить код из одного языка в другой

На конференции Cloud Next представитель компании сообщил, что ИИ-помощник по кодированию Code Assist теперь умеет развёртывать новых ИИ-агентов. Они могут создавать приложения из спецификаций продуктов в Google Docs или выполнять преобразования кода с одного языка на другой. Code Assist теперь доступен в Android Studio в дополнение к другим средам программирования.

 Источник изображения: Google

Источник изображения: Google

Обновления Code Assist являются ответом на конкурентное давление со стороны таких компаний, как GitHub Copilot, Cursor и Cognition Labs, создателя вирусного инструмента программирования Devin. Рынок помощников по кодированию на основе искусственного интеллекта растёт с каждым месяцем, а его ёмкость оценивается в миллиарды долларов.

Агенты Code Assist, которыми можно управлять с новой доски Gemini Code Assist Kanban, могут создавать рабочие планы и отчитываться о пошаговом прогрессе по запросам на работу. Помимо создания программного обеспечения и миграции кода, агенты могут внедрять новые функции приложений, выполнять проверки кода и генерировать модульные тесты и документацию.

Пока трудно понять, насколько хорошо работают агенты Code Assist. Исследования показали, что даже лучшие генераторы кода на основе ИИ на сегодняшний день могут допускать ошибки и вносить уязвимости безопасности из-за неспособности понимать логику программирования. На одном из недавних тестов Devin успешно выполнил только три из двадцати задач.

Поэтому, при использовании любого ИИ-ассистента для программирования не помешает самостоятельно проверить получившийся код.

Amazon представила ИИ-агента Nova Act, который заменит человека в интернет-серфинге

Amazon представила универсального ИИ-агента Nova Act, который может управлять веб-браузером и самостоятельно выполнять некоторые простые действия. В будущем Nova Act будет поддерживать все функции Alexa+ — обновлённого голосового помощника Amazon. Одновременно с агентом компания выпустила набор инструментов Nova Act SDK, который позволяет разработчикам создавать собственные прототипы агентов.

 Источник изображения: Pixabay

Источник изображения: Pixabay

Nova Act разработан недавно открытой в Сан-Франциско лабораторией AGI Amazon, возглавляемой бывшими исследователями OpenAI Дэвидом Луаном (David Luan) и Питером Аббелем (Pieter Abbeel). Amazon называет выпуск ИИ-агента «исследовательским предварительным просмотром». Разработчики уже сейчас могут получить доступ к набору инструментов Nova Act на специализированном ресурсе nova.amazon.com, который также служит «витриной» для различных моделей Nova Foundation от Amazon.

Nova Act — это попытка Amazon составить конкуренцию OpenAI Operator и Anthropic Computer Use с помощью технологии агентов ИИ общего назначения. Многие лидеры рынка искусственного интеллекта считают, что агенты ИИ, которые могут исследовать интернет по заданию пользователей, сделают чат-ботов ИИ значительно более полезными. Amazon рассчитывает, что распространённость Alexa+ обеспечит новому агенту широкий охват.

Разработчики, использующие Nova Act SDK, смогут автоматизировать базовые действия от имени пользователей, такие как заказ продуктов или бронирование столика в ресторане. С помощью Nova Act разработчики могут объединить инструменты, которые позволят ИИ-агенту перемещаться по веб-страницам, заполнять формы или выбирать даты в календаре.

По данным Amazon, Nova Act превосходит агентов от OpenAI и Anthropic в нескольких внутренних тестах компании. Например, в ScreenSpot Web Text, который измеряет, как агент ИИ взаимодействует с текстом на экране. Nova Act набрал 94 %, превзойдя CUA OpenAI (88 %) и Claude 3.7 Sonnet от Anthropic (90 %).

По мнению экспертов, основная проблема с недавно выпущенными ИИ-агентами от OpenAI, Google и Anthropic заключается в их низкой надёжности. Во многих тестах они работают медленно, с трудом принимают самостоятельные решения и склонны к ошибкам, которые человек бы не допустил. В скором времени станет ясно, удалось ли Amazon избавить свой продукт от этих недостатков.


window-new
Soft
Hard
Тренды 🔥
Бывший сотрудник подал на WhatsApp в суд из-за игнорирования проблем с кибербезопасностью 40 мин.
Соцсети заполонили боты: Сэм Альтман пожаловался, что интернет стал искусственным из-за ИИ 3 ч.
Meta обвинили в помехах исследованиям о рисках для детей в Instagram и других платформах 3 ч.
Аналитики: за три дня в Hollow Knight: Silksong сыграло пять миллионов человек, и больше половины из них купили игру в Steam 3 ч.
В открытый доступ попало ещё больше геймплея отменённой Prey 2 3 ч.
AMD выпустила графический драйвер с поддержкой Borderlands 4 и Hell Is Us 4 ч.
«Захватывающие новости», эксклюзивные анонсы и трейлеры: в рамках Tokyo Game Show 2025 пройдут игровые презентации Xbox и PC Gaming Show 4 ч.
В Hollow Knight: Silksong нашли секретный чит-код, который делает игру ещё сложнее 4 ч.
Apple оштрафовали на 3,5 млн рублей за отказ удалить запрещённые в РФ материалы 5 ч.
Yandex.ru продолжит перенаправлять на сервисы VK ещё два года 5 ч.