Сегодня 30 ноября 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → ai
Быстрый переход

Anthropic представила инструмент Skills, который сделает ИИ полезнее в реальной работе

Компания Anthropic объявила о запуске новой функции под названием Skills for Claude, предназначенной для повышения эффективности ИИ-помощника в профессиональной среде. Инструмент представляет собой набор специализированных инструкций, скриптов и ресурсов, которые Claude может загружать по требованию для выполнения конкретных рабочих операций. Спектр задач варьируется от работы с электронными таблицами Excel до рабочих задач организации.

 Источник изображения: Anthropic

Источник изображения: Anthropic

Новая функция, по сообщению The Verge, позволяет компаниям и отдельным пользователям создавать собственные наборы навыков (Skills), адаптированные под их уникальные рабочие процессы. Эти навыки можно применять внутри всей экосистемы Anthropic, например, в интерфейсе чат-бота Claude.ai, в среде для разработчиков Claude Code, через API компании и в рамках Claude Agent SDK. Сообщается, что такие компании, как Box, Rakuten и Canva, уже использовали данный инструмент на практике.

По замыслу разработчиков, функция призвана усовершенствовать агентские возможности Claude, избавляя пользователей от необходимости каждый раз составлять идеальные промпты или искать контекст для выполнения рутинных задач. Как пояснил Бред Абрамс (Brad Abrams), руководитель продукта в Anthropic, Skills призваны усилить агентские возможности Claude в контексте конкретной организации, а не для достижения абстрактных бенчмарков. По его словам, функция позволяет обучать ИИ выполнять задачи, актуальные именно для конкретной компании. В качестве примера он привёл создание презентации о рыночных результатах модели Haiku 4.5 с использованием PowerPoint Skill — Claude сгенерировал хорошо структурированные и легко читаемые слайды.

Инструмент доступен пользователям тарифных планов Pro, Max, Team и Enterprise. Примечательно, что анонс Anthropic последовал сразу после аналогичного мероприятия OpenAI, на котором была представлена платформа AgentKit, предназначенная для вывода ИИ-агентов из стадии прототипирования в промышленную эксплуатацию.

Google запустила Nano Banana в AI Mode и «Google Объектив»

Google расширила функциональность ИИ-инструмента Nano Banana, интегрировав его в новый режим поиска AI Mode и «Google Объектив» (Google Lens). Обновление позволяет создавать и редактировать изображения напрямую через поисковый интерфейс и камеру, сохраняя при этом технические особенности оригинальной реализации в приложении Gemini.

 Источник изображений: 9to5google.com

Источник изображений: 9to5google.com

В режиме AI Mode в поиске Google появился новый значок «плюс» в левом нижнем углу поля ввода запроса, а функции голосового ввода и «Google Объектив» переместились в правую часть интерфейса. На этой же странице карусель с предложениями была заменена на упрощённый список подсказок. Через новое меню пользователи получают доступ к галерее, камере и функции создания изображений, обозначенной эмодзи банана. При выборе последнего варианта подсказка в поле ввода меняется на «Опишите ваше изображение», что позволяет генерировать новые изображения или редактировать загруженные. Все сгенерированные изображения содержат водяной знак Gemini в виде искры в правом нижнем углу и могут быть скачаны или отправлены другим пользователям.

Более заметная интеграция Nano Banana реализована в «Google Объектив». После недавнего добавления функции Live в Поиск и переноса фильтра «Домашнее задание» непосредственно в интерфейс Поиска, в Lens появилась новая вкладка Create. Небольшое изменение дизайна переместило текстовые подписи под иконки, чтобы разместить больше фильтров горизонтально. Эта вкладка предлагает пользователям «снимать, создавать и делиться», причём кнопка спуска затвора отмечена эмодзи банана. В отличие от других фильтров, функция Create по умолчанию использует фронтальную камеру для селфи, но позволяет переключиться на основную камеру с помощью переключателя справа. Сделанный снимок автоматически добавляется в поле ввода AI Mode, где можно ввести текстовый запрос для редактирования или генерации.

На момент публикации функция Nano Banana доступна в Google Lens и AI Mode на устройствах под управлением Android в США для аккаунтов, подключённых к Search Lab с активным AI Mode. Параллельно Google на этой неделе расширила поддержку AI Mode на 35 новых языков и более чем 40 стран и территорий, доведя общее количество охваченных регионов до 200.

Google представила модель Gemini, которая заполняет в браузере формы и играет в 2048

Компания Google представила предварительную версию новой ИИ-модели Gemini 2.5 с функцией Computer Use, которая способна взаимодействовать с веб-сайтами через браузер, имитируя действия человека. Модель применяет визуальное понимание и логическое рассуждение для выполнения, например, таких задач, как заполнение и отправка форм без использования API или другого программного интерфейса.

 Источник изображения: Solen Feyissa/Unsplash

Источник изображения: Solen Feyissa/Unsplash

Как сообщает The Verge, модель Gemini 2.5 Computer Use предназначена для работы с пользовательскими интерфейсами, созданными для людей, а не для автоматизированных систем. По заявлению Google, технология уже применялась в агентских функциях AI Mode и в исследовательском прототипе Project Mariner, где ИИ-агенты самостоятельно выполняли задачи в браузере, например, добавляли товары в корзину на основе списка ингредиентов.

Интересно, что анонс новой модели состоялся спустя день после того, как OpenAI представила новые приложения для ChatGPT в рамках ежегодного мероприятия Dev Day, продолжив развитие функции ChatGPT Agent, способной выполнять сложные задачи от имени пользователя. При этом Anthropic ещё в прошлом году выпустила версию модели Claude с функцией Computer Use. Однако Google заявляет, что её модель «превосходит ведущие аналоги по нескольким веб- и мобильным бенчмаркам».

В отличие от ChatGPT Agent и инструмента Anthropic, Gemini 2.5 Computer Use имеет доступ только к браузеру, а не ко всей операционной системе. Google подчеркнула, что решение «пока не оптимизировано для управления на уровне настольной ОС» и поддерживает 13 действий, включая открытие веб-браузера, ввод текста, а также перетаскивание элементов.

Сообщается, что модель уже доступна разработчикам через платформы Google AI Studio и Vertex AI. Кроме того, публичная демонстрация размещена в виртуальном браузере BrowserBase, где можно наблюдать, как ИИ выполняет такие задачи, как «сыграть в игру 2048» или «просмотреть Hacker News в поисках обсуждаемых тем».

Google представила ИИ-агента CodeMender — он самостоятельно устраняет уязвимости ПО

Лаборатория Google DeepMind опубликовала результаты работы агента на базе искусственного интеллекта CodeMender. Агент может в автономном режиме выявлять, исправлять и переписывать уязвимый код для предотвращения будущих эксплойтов в программном обеспечении.

 Источник изображения: Google

Источник изображения: Google

Как пишет издание SiliconANGLE, CodeMender развивает предыдущие проекты DeepMind по поиску уязвимостей, в частности проект OSS-Fuzz для анализа безопасности открытого ПО и систему Big Sleep, сочетая интеллектуальные возможности моделей Gemini с передовыми методами программного анализа. Основной целью проекта является автономная отладка и исправление сложных ошибок в крупномасштабных кодовых базах.

Несмотря на то что проект находится на стадии исследований, CodeMender уже отправил 72 исправления безопасности в проекты с открытым исходным кодом, включая те, объём которых превышает 4,5 миллиона строк кода. По данным компании, ИИ-агент позволяет разработчикам сосредоточиться на создании качественного программного обеспечения, автоматически генерируя и применяя надёжные патчи безопасности.

Система спроектирована как для реактивной, так и для проактивной работы: она не только мгновенно исправляет обнаруженные уязвимости, но и переписывает существующий код, устраняя целые классы ошибок. В качестве примера исследователи DeepMind приводят работу агента с библиотекой сжатия изображений libwebp, которая была использована в атаке на iOS в 2023 году. Агент применил к ней аннотации -fbounds-safety, после чего, по заявлению исследователей, подобные уязвимости переполнения буфера стали «невозможными для эксплуатации навсегда».

Внутренняя архитектура CodeMender включает набор инструментов: статический и динамический анализ, фаззинг, символьное исполнение и так называемого «судью LLM», который проверяет, сохраняют ли предлагаемые изменения исходную функциональность. Система способна к самокоррекции, если в процессе проверки обнаруживается проблема. Все изменения перед отправкой проходят проверку на корректность, соответствие стилевым стандартам и отсутствие регрессий. При этом в DeepMind подчёркивают, что CodeMender пока остаётся исследовательским проектом, и все патчи, сгенерированные им, проходят проверку исследователями-людьми перед отправкой в проекты.

После запуска инструмент будет предлагать иной подход по сравнению с традиционными методами, такими как статический анализ и фаззинг, которые находят уязвимости, но всё ещё сильно зависят от опыта проверяющего человека. Новый подход изменит систему, в которой искусственный интеллект сможет самостоятельно выявлять и устранять ошибки, что является критически важным шагом по мере экспоненциального роста размера и сложности современных кодовых баз.

Foxconn показала рекордную квартальную выручку на фоне бума ИИ-технологий

Компания Foxconn, крупнейший в мире контрактный производитель электроники, зафиксировала рекордную выручку в третьем квартале 2025 года на фоне высокого спроса на продукты для искусственного интеллекта. При этом показатель оказался ниже рыночных ожиданий, а компания предупредила о рисках, связанных с колебаниями валютных курсов, сообщает Reuters.

 Источник изображения: Foxconn

Источник изображения: Foxconn

Выручка тайваньской компании, являющейся основным сборщиком iPhone для Apple и крупнейшим поставщиком серверов для Nvidia, выросла на 11 % по сравнению с аналогичным периодом прошлого года и составила 2057 трлн тайваньских долларов ($67,71 млрд). Этот результат уступил прогнозу LSEG SmartEstimate в 2134 трлн тайваньских долларов, который придаёт больший вес оценкам аналитиков, дающих наиболее точные результаты.

В пересчёте на доллары США выручка Foxconn в третьем квартале увеличилась на 16,1 % в годовом выражении. Выручка за сентябрь выросла на 14,2 % в годовом сравнении и достигла 837,1 млрд тайваньских долларов, что стало рекордом для этого месяца. По прогнозам Foxconn, операционная деятельность «сохранит последовательный квартальный рост благодаря наращиванию поставок серверов для ИИ в четвёртом квартале» и традиционному пиковому сезону перед праздничными распродажами на крупных западных рынках. В то же время, как добавили в компании, «влияние глобальной политической и экономической ситуации, а также колебаний валютных курсов потребует дальнейшего пристального наблюдения».

В срезе по сегментам рост выручки Foxconn оказался неравномерным: в то время как подразделение облачных и сетевых продуктов показало значительный рост благодаря высокому спросу на продукты в области искусственного интеллекта, сегмент умной потребительской электроники, включающий сборку iPhone, продемонстрировал незначительное снижение, что компания объяснила влиянием укрепления тайваньского доллара примерно на 8 % по отношению к американскому доллару за этот год.

При этом компания не даёт количественных прогнозов, а её полные финансовые результаты за третий квартал будут объявлены 12 ноября. На фоне этих данных акции компании с начала года выросли на 23 %, превысив рост всего тайваньского рынка, составивший 16 %, а в пятницу, накануне публикации отчёта о выручке, акции Foxconn закрылись ростом на 0,44 % по сравнению с ростом базового индекса на 1,45 %.

В Meta✴ начали отслеживать активность использования ИИ сотрудниками — через игру

Meta✴ стала активно внедрять искусственный интеллект в повседневную работу своих сотрудников, и делает это не просто через указания сверху, а с помощью игровых механик. С начала 2025 года в компании запустили панель мониторинга, которая показывают, насколько активно разные команды используют ИИ-инструменты. При этом подход варьируется: в одних подразделениях сотрудников мягко поощряют экспериментировать, в других необходимо достигать поставленных задач.

 Источник изображения: AI

Источник изображения: AI

Как сообщает Business Insider, сотрудники используют внутреннего ИИ-ассистента под названием Metamate для самых разных задач, например, он помогает в написании и оптимизации кода, генерации идей, оформления документов и других корпоративных задач. А чтобы мотивировать работников быстрее осваивать технологии, Meta✴ запустила программу Level Up, смысл которой заключается в том, что за достижение определённых этапов в использовании искусственного интеллекта сотрудники получают виртуальные медали.

Особенно амбициозные планы у команды Reality Labs, отвечающей за VR-устройства и аппаратные разработки, и стремящейся достичь показателя использования ИИ более 75-% сотрудниками. Отмечается, что за последние месяцы показатель вырос с 30 % в июне до 70 % в октябре и цель практически уже близка.

Генеральный директор Meta✴ Марк Цукерберг (Mark Zuckerberg) не раз подчёркивал, что внутреннее применение ИИ — один из ключевых приоритетов компании. Ещё в январе он заявил в подкасте Джо Рогана (Joe Rogan), что к концу 2025 года ИИ сможет работать на уровне инженера средней квалификации. При этом в апреле, на отчётной конференции, он сказал, что уже к середине–концу 2026 года ИИ-агенты, по его ожиданиям, будут выполнять значительную часть исследований и разработок.

В Meta✴ отметили, что целенаправленно делают ИИ частью ежедневного рабочего процесса, и такой подход в целом отражает общую тенденцию в индустрии. Например, Google отслеживает, сколько дополнительных часов продуктивности даёт ИИ инженерам, Microsoft увязывает его использование с производительностью, а другие корпорации активно закупают специализированное ПО для контроля внедрения ИИ. По словам поставщиков таких систем, за последние два года спрос на них резко вырос, так как работодатели хотят не просто использовать технологию, а убедиться, что она действительно приносит пользу, экономя время, снижая издержки и повышая производительность труда.

Microsoft вложит $33 млрд в бывшую Yandex N.V. и другие «неоклауды», чтобы побороть дефицит мощностей для ИИ

Microsoft заключила многомиллиардное соглашение с неоклауд-провайдерами (NeoCloud), такими как Nebius, CoreWeave, Nscale и Lambda, с целью ускорить доступ к высокопроизводительным вычислительным мощностям для разработки искусственного интеллекта (ИИ). Общая сумма обязательств компании перед этими поставщиками облачных услуг достигла $33 млрд.

 Источник изображения: Nebius Group NV

Источник изображения: Nebius Group NV

По сообщению Bloomberg, целью стратегии является решение проблемы нехватки мощностей центров обработки данных ИИ и предоставление Microsoft возможности высвободить собственные ресурсы для предоставления прибыльных ИИ-услуг клиентам. Сделка с Nebius (компания Аркадия Воложа, появившаяся из Yandex N.V.), о которой стало известно 8 сентября, оценивается в сумму до $19,4 млрд и предоставит Microsoft доступ к более чем 100 000 новейших чипов Nvidia GB300.

Традиционно облачные провайдеры оперируют собственными дата-центрами, но Microsoft столкнулась с трудностями в наращивании достаточных вычислительных мощностей. Аренда серверов у NeoCloud-провайдеров ускорит процесс, поскольку эти компании уже решили сложные логистические задачи, включая обеспечение необходимого энергоснабжения и доступ к чипам. Руководитель облачного подразделения Microsoft Скотт Гатри (Scott Guthrie) пояснил, что компания «находится в режиме захвата позиций на рынке искусственного интеллекта и приняла решение не ограничивать себя в объёмах мощностей».

По словам Гатри, появление энергоёмких генеративных ИИ-моделей создало колоссальную нагрузку на инфраструктуру дата-центров. Поэтому Microsoft освобождает место в своих собственных центрах обработки данных для облачных клиентов, перенося часть вычислений для внутренних нужд и для работы с OpenAI на мощности NeoCloud-партнёров. Например, первые базовые ИИ-модели, созданные под руководством главы потребительского ИИ Microsoft Мустафы Сулеймана (Mustafa Suleyman), были обучены в дата-центре CoreWeave недалеко от Портленда (США).

В конечном счёте эта стратегия позволяет Microsoft использовать свои серверы для продажи большего количества ИИ-услуг в условиях дефицита вычислительных мощностей и растущего давления со стороны инвесторов, требующих доказательств окупаемости огромных вложений в технологии.

Примечательно, что акции Nebius выросли примерно на 5,5 % в момент анонса, в то время как акции Microsoft практически не изменились. Nebius и другие компании, работающие в сфере NeoCloud, отказались от комментариев.

Meta✴ начнёт использовать чаты пользователей с ИИ, чтобы продавать ещё более персонализированную рекламу

Компания Meta✴ с 16 декабря начнёт использовать текстовые и голосовые диалоги пользователей с её ИИ-ассистентом для персонализации рекламы и контента в социальных сетях. Нововведение затронет большинство регионов мира, за исключением Великобритании, стран Европейского союза и Южной Кореи, где внедрение отложено до урегулирования всех вопросов в этих юрисдикциях.

 Источник изображения: Steve Johnson / Unsplash

Источник изображения: Steve Johnson / Unsplash

По сообщению The Verge, Meta✴ не будет применять новый метод сбора данных к чатам, затрагивающим конфиденциальные темы, такие как религиозные взгляды, ориентация в личных отношениях, политические предпочтения, здоровье, расовое или этническое происхождение, философские убеждения и членство в профсоюзах. Руководитель отдела конфиденциальности Meta✴ Кристи Харрис (Christy Harris) пояснила, что в компании действуют установленные правила обработки информации, которую пользователи могут считать «чувствительной» — эти политики сохранятся в полном объёме и продолжат применяться и дальше.

Она также добавила, что подход компании к шифрованию ИИ-диалогов не изменится в рамках данного обновления. Кроме того, пользователи по-прежнему смогут настраивать свои рекламные предпочтения в меню параметров, однако у них не будет возможности отказаться от персонализации.

Для пользователей, которые связали свои аккаунты Facebook✴, Instagram✴ или WhatsApp в едином центре учётных записей Meta✴, компания может использовать данные на основе взаимодействия с чат-ботом на одной платформе для показа рекламы или рекомендаций на другой. Это касается и личных диалогов с сервисом Meta✴ AI в WhatsApp и Messenger.

Жители США столкнулись с резким ростом счетов за электричество из-за прожорливого ИИ

Стремительный рост числа центров обработки данных для искусственного интеллекта привёл к резкому скачку оптовых цен на электроэнергию в некоторых регионах США, вынуждая местных жителей сокращать расходы на самое необходимое. Согласно анализу Bloomberg, проведённому на основе данных энергетической аналитической платформы Grid Status, в зонах расположения новых дата-центров цены за пять лет взлетели на 267 %.

 Источник изображения: AI

Источник изображения: AI

Например, 57-летний Кевин Стэнли (Kevin Stanley), живущий на пособие по инвалидности, столкнулся с ростом счетов за электричество на 80 % за три года. Мария Руффин (Mary Ruffine) из Арлингтона сообщила о единовременном скачке счетов более чем на 25 %. Их бюджеты, как и бюджеты их соседей, ведущих частные домохозяйства и проживающих вблизи новых центров обработки данных, находятся на грани своих возможностей, пишет Tom's Hardware.

При этом эксперты предупреждают, что ИИ-бум только набирает обороты: большинство крупных проектов дата-центров, анонсированных в этом году, ещё даже не начали строиться. По прогнозам, к 2035 году на их долю придётся почти 10 % общего энергопотребления США. Стоит также принять во внимание недавний анонс OpenAI относительно концепции будущего с 10 миллиардами графических процессоров, где каждый человек на планете сможет иметь персональный GPU для работы с ИИ.

Одним из решений проблемы является строительство электростанций непосредственно на месте объекта. Именно так был запущен дата-центр Colossus компании xAI, где были установлены десятки газовых турбин для поддержания бесперебойного электроснабжения. Такой подход поможет предотвратить рост цен на электроэнергию в регионах, а в случае избытка энергии, производимого для ЦОД, даже снизить расходы.

Однако даже в этом идеальном сценарии возникают вопросы о воздействии на окружающую среду, поскольку энергопотребление этих объектов в ближайшее время, очевидно, не уменьшится, а стоящие за ними крупные технологические компании, несмотря на сохраняющиеся опасения по поводу финансирования, демонстрируют слишком большую заинтересованность в ускорении их строительства.

Браузер Brave обновил фирменный ИИ-поиск: теперь он даёт развёрнутые ответы

Компания Brave обновила в своём браузере ИИ-поиск, добавив функцию Ask Brave, которая будет предоставлять развёрнутые ответы на основе пользовательских запросов. Ask Brave дополнит существующий режим AI Answers, запущенный в прошлом году для кратких резюме, и будет работать параллельно с ним.

 Источник изображения: Brave

Источник изображений: Brave

Новый режим, по данным TechCrunch, не потребует переключения в специальный интерфейс, так как поисковая система автоматически определяет тип запроса и формирует соответствующий ответ. Пользователи могут инициировать такой поиск с помощью кнопки «Спросить» (Ask) рядом со строкой поиска Brave, перейти в этот режим через вкладку на странице результатов или добавить к запросу двойной вопросительный знак, если Brave Search установлен в качестве поисковика по умолчанию.

Как отметили в компании, в отличие от режима AI Answers, дающего краткие сводки, Ask Brave предлагает более длинные ответы, возможность задавать уточняющие вопросы и чат-режим с функцией Deep Research, а также контекстно релевантные дополнения в виде видео, новостных материалов, товаров, информации о компаниях, предложений для шопинга и других полезных данных.

По словам руководителя поискового отдела Brave Хосепа Пухоля (Josep M. Pujol), в компании ожидают, что при помощи новой функции можно будет генерировать дополнительные ответы, исчисляемые миллионами в день, благодаря мощной комбинации ИИ-поиска и крупных языковых моделей (LLM). При этом формат ответов в Ask Brave напоминает ответы ChatGPT или Perplexity: он включает ссылки, видео и изображения, а после получения ответа пользователь может преобразовать его в другой формат или задать уточняющие вопросы. Для обеспечения точности Brave использует собственный API и глубокое исследование для определённых запросов.

Примечательно, что компания также заявляет о своём конкурентном преимуществе в области конфиденциальности. В частности, Brave утверждает, что шифрует все пользовательские чаты и удаляет их после 24 часов неактивности.

Google создала и показала в деле ИИ, который заставляет роботов сначала думать, а потом делать

Компания Google DeepMind представила две новые модели искусственного интеллекта (ИИ) для робототехники Gemini Robotics 1.5 и Gemini Robotics-ER 1.5, которые совместно реализуют подход, при котором робот сначала «обдумывает» задачу и только потом выполняет действие. Технология основана на генеративных ИИ-системах и призвана преодолеть ограничения современных роботов, требующих длительной настройки под каждую конкретную задачу.

 Источник изображения: Google

Источник изображения: Google

Генеративные ИИ-системы, способные создавать текст, изображения, аудио и даже видео, становятся всё более распространёнными. Подобно тому, как такие модели генерируют указанные типы данных, они могут также выдавать последовательности действий для роботов. Именно на этом принципе построен проект Gemini Robotics от Google DeepMind, в рамках которого анонсированы две взаимодополняющие модели, позволяющие роботам «думать» перед тем, как действовать. Хотя традиционные большие языковые модели (LLM) имеют ряд ограничений, внедрение симулированного рассуждения значительно расширило их возможности, и теперь аналогичный прорыв может произойти в робототехнике.

Команда Google DeepMind считает, что генеративный ИИ способен кардинально изменить робототехнику, обеспечив роботам универсальную функциональность. В отличие от современных систем, которые требуют месяцев настройки под одну узкоспециализированную задачу и плохо адаптируются к новым условиям, новые ИИ-подходы позволяют роботам работать в незнакомых средах без перепрограммирования. Как отметила Каролина Парада (Carolina Parada), руководитель направления робототехники в DeepMind, роботы на сегодняшний день «чрезвычайно специализированы и сложны в развёртывании».

Для реализации концепции DeepMind разработала Gemini Robotics-ER 1.5 и Gemini Robotics 1.5. Первая — это модель «зрение–язык» (VLM) с функцией воплощённого рассуждения (embodied reasoning), которая анализирует визуальные и текстовые данные, формирует пошаговый план выполнения задачи и может подключать внешние инструменты, например, поиск Google для уточнения контекста. Вторая — модель «зрение–язык–действие» (VLA), которая преобразует полученные инструкции в физические действия робота, одновременно корректируя их на основе визуальной обратной связи и собственного процесса «обдумывания» каждого шага. По словам Канишки Рао (Kanishka Rao) из DeepMind, ключевым прорывом стало наделение робота способностью имитировать интуитивные рассуждения человека, то есть думать перед тем, как действовать.

Разработчики наглядно продемонстрировали, как работают новые модели — наделённый Gemini Robotics 1.5 человекоподобный робот Apollo на видео упаковывает вещи для поездки, а другой робот Aloha 2, точнее пара роборук — сортирует мусор.

Обе модели основаны на фундаментальной архитектуре Gemini, но дополнительно дообучены на данных, отражающих взаимодействие с физическим миром. Это позволяет роботам выполнять сложные многоэтапные задачи, приближая их к уровню автономных агентов. При этом система демонстрирует кроссплатформенную совместимость. В частности, навыки, внедрённые в одного робота, например, на двурукого Aloha 2, могут быть перенесены на другого, включая гуманоида Apollo, без дополнительной настройки под конкретную механику.

Несмотря на вероятный технологический прорыв, практическое применение технологии пока ограничено. Модель Gemini Robotics 1.5, отвечающая за управление роботами, доступна только доверенным тестировщикам. В то же время Gemini Robotics-ER 1.5 уже интегрирована в Google AI Studio, что даёт разработчикам возможность генерировать инструкции для собственных экспериментов с физически воплощёнными роботами. Однако, как считает Райан Уитвам (Ryan Whitwam) из Ars Technica, до появления бытовых роботов, способных выполнять повседневные задачи, ещё предстоит пройти значительный путь.

GoPro представила стабилизатор Fluid Pro AI с ИИ-трекером — для камер и смартфонов за $230

Компания GoPro представила универсальный стабилизатор Fluid Pro AI, который предназначен для широкого круга пользователей, поскольку поддерживает работу не только с экшн-камерами, но и, благодаря грузоподъёмности до 400 граммов, со смартфонами и некоторыми компактными фотоаппаратами. Его главным преимуществом стала продвинутая система трекинга на основе искусственного интеллекта (ИИ), позволяющая удерживать объект в кадре автоматически.

 Источник изображения: GoPro

Источник изображения: GoPro

В отличие от предшественника Karma Grip, представленного в 2016 году, Fluid Pro AI совместим с устройствами GoPro, включая Hero13 Black, а также с широким спектром сторонних устройств. Стабилизатор оснащён специализированным ИИ-модулем, который распознаёт жесты для дистанционного управления и автоматически удерживает в кадре выбранный объект. При необходимости пользователь может вручную задать цель отслеживания через мобильное приложение, которое также предоставляет инструменты для панорамной съёмки и таймлапсов.

Fluid Pro AI обеспечивает панорамирование на 360 градусов и наклон камеры до 320 градусов. В конструкции предусмотрены встроенная светодиодная подсветка и сменные крепления с механизмом зажима, адаптированные под смартфоны различных размеров.

Вместо выдвижной ручки или встроенных ножек штатива, как у некоторых конкурентов, инженеры GoPro сосредоточились на увеличении ёмкости аккумулятора. По заявлению компании, устройство способно работать до 18 часов в базовом режиме и до шести часов при активном ИИ-трекинге и включённой подсветке. Эти показатели выше аналогов от Insta360 и DJI, где максимальное время работы не превышает 10 часов даже при отключённом трекинге местоположения движущегося объекта.

Стабилизатор GoPro Fluid Pro AI поступит в продажу 21 октября по цене $229,99.

«А кто спрашивает?», — точность ответов DeepSeek зависит от региона пользователя

Американская компания CrowdStrike, являющаяся мировым лидером в области кибербезопасности, провела эксперимент, в ходе которого выяснила, что качество генерируемого кода сильно зависит от того, кто его собирается использовать и в каких случаях. Например, запрос написать программу для управления промышленными системами содержал ошибки в 22,8 % случаев, а при указании, что этот код предназначен для использования на Тайване, доля ошибок выросла до 42,1 % или был получен полный отказ в генерации.

 Источник изображения: AI

Источник изображения: AI

Качество кода ухудшалось, если он предназначался для Тибета, Тайваня или религиозной группы Фалуньгун, которая запрещена в Китае, пишет TechSpot со ссылкой на The Washington Post. В частности, для Фалуньгун DeepSeek отказывался генерировать код в 45 % случаев. По мнению специалистов CrowdStrike, это может быть связано с тем, что ИИ-бот следует политической линии Коммунистической партии Китая, сознательно генерируя уязвимый код для определённых групп, либо с тем, что обучающие данные для некоторых регионов, таких как Тибет, содержат код низкого качества, созданный менее опытными программистами.

Также высказывается альтернативное мнение относительно того, что система могла самостоятельно принять решение генерировать некорректный код для регионов, ассоциируемых с оппозицией. При этом исследователи CrowdStrike отметили, что код, предназначенный для США, оказался наиболее надёжным, что может быть связано как с качеством обучающих данных, так и с желанием DeepSeek завоевать американский рынок.

Ранее 3DNews сообщал, что DeepSeek часто воспроизводит официальную позицию китайских властей по чувствительным темам, независимо от её достоверности, а в июле немецкие власти потребовали от Google и Apple запретить к установке на устройства приложение компании в Германии из-за подозрений в незаконной передаче данных пользователей в Китай. Отметим, использование данного приложения также запрещено на устройствах федеральных агентств и государственных учреждений США.

Создатели Shorts на YouTube получат ИИ для оживления фото

На YouTube появятся новые инструменты на основе искусственного интеллекта для создания коротких видео (Shorts). В рамках мероприятия Made on YouTube компания анонсировала адаптированную версию модели Google Veo 3, а также функции редактирования, создания ремиксов и стилизации контента. Нововведение станет доступно в ближайшие месяцы.

 Источник изображения: YouTube

Источник изображения: YouTube

Адаптированная версия Veo 3 Fast позволяет генерировать видеоклипы с разрешением 480 пикселей, низкой задержкой передачи данных и возможностью добавления звукового сопровождения. Появится функция наложения видео на статичное изображение, благодаря технологии, фиксирующей и передающей движения между объектами, которая позволит «оживлять» картинки. Также появится возможность применять к роликам различные художественные стили, например, поп-арт или оригами, и добавлять по текстовому описанию новые объекты.

Другим интересным инструментом стал Speech to Song, позволяющий превращать диалоги из видео в музыкальные треки. Для создания таких треков используется музыкальная ИИ-модель Google Lyria 2, при этом авторы смогут задавать любое настроение композиции.

Отдельно будет внедрена функция Edit with AI для преобразования необработанных видеозаписей из камеры в черновики Shorts с последующим автоматическим редактированием и выбором лучших моментов, а также добавлением музыки, переходов и даже озвучки с реакцией на происходящее в кадре — правда, пока только на английском или хинди. Эксперименты с этой функцией уже ведутся в приложении YouTube Create, а в ближайшие недели её распространение расширится на отдельные рынки.

Новые функции начнут распространяться в США, Великобритании, Канаде, Австралии и Новой Зеландии, с последующим расширением на другие регионы.

Китайская Tencent увела топ-учёного из OpenAI — цена вопроса $14 млн

Компания Tencent — один из крупнейших в мире технологических и интернет-холдингов из Китая, наняла ведущего исследователя в области искусственного интеллекта (ИИ) из американской компании OpenAI. Об этом сообщил Bloomberg со ссылкой на осведомлённые источники, которые назвали этот переход одним из самых громких случаев перехода американских ИИ-специалистов на работу в Китай.

 Источник изображения: Tencent

Источник изображения: Tencent

Tencent, базирующаяся в Шэньчжэне (Китай), известная разработкой и распространением видеоигр, онлайн-сервисов, платёжных систем и других продуктов, наняла Яо Шунью (Yao Shunyu) для работы по интеграции искусственного интеллекта в свои сервисы. Согласно его профилю в LinkedIn, до прихода в OpenAI он работал в Google и Принстонском университете.

После публикаций в местных СМИ о том, что Яо присоединится к компании за пакет выплат, превышающий 100 миллионов юаней (около $14 млн), Tencent разместила в своём аккаунте в WeChat скриншот заголовка на эту тему, который был помечен словом «слухи». При этом не было уточнено, какая именно часть информации была некорректной. В OpenAI подтвердили факт ухода Яо из компании, но не указали его дальнейшее место работы. Представители Tencent и сам Яо Шунью не ответили на запросы о комментариях.

Согласно его странице на GitHub, Яо является автором и соавтором около 10 научных работ и специализируется на изучении ИИ-агентов. Среди его работ — «Языковые агенты: от предсказания следующего токена к цифровой автоматизации» и «Когнитивная архитектура для языковых агентов». Согласно его профилю в LinkedIn, он окончил ведущий китайский научно-инженерный университет Цинхуа и получил докторскую степень в области компьютерных наук в Принстонском университете.

В этом году технологические компании стали вести ожесточённую борьбу за специалистов в сфере ИИ. Как ранее сообщал 3DNews, такие корпорации, как Meta✴, предлагали бонусы за переход на работу в размере до $100 млн, пытаясь переманить сотрудников у конкурентов. По словам одного из источников, Tencent, предложив Яо компенсационный пакет в размере до 100 миллионов юаней, не уточнила условий для достижения верхнего предела этого диапазона оплаты.


window-new
Soft
Hard
Тренды 🔥
Инвесторы пока не боятся вкладывать деньги в ИИ-стартапы на фоне разговоров о формировании пузыря 3 мин.
Новая статья: Goodnight Universe — колыбельная для крошки. Рецензия 9 ч.
Новая статья: Gamesblender № 754: кризис на рынке памяти, Pioner не для российского Steam и 20-летие Xbox 360 10 ч.
Роскомнадзор увидел в Roblox угрозу детям — на платформе нашли неподобающий контент 17 ч.
Asus предупредила об очередной критической уязвимости в маршрутизаторах с AiCloud 17 ч.
Infinix проведёт в декабре турнир по PUBG Mobile, для участия в котором нужно быть студентом вуза или ссуза России 18 ч.
Президент Signal призвала не спешить с внедрением ИИ в мессенджерах 19 ч.
ИИ-модель DeepseekMath-V2 достигла уровня золотой медали на Международной математической олимпиаде 20 ч.
Практическое использование ИИ в работе остаётся весьма неравномерным 29-11 08:07
Новая статья: PowerWash Simulator 2 — опять работать. Рецензия 29-11 00:01
Ускорители вычислений Baidu имеют все шансы стать хитом китайского рынка 30 мин.
SK hynix будет использовать все возможности, чтобы увеличить объёмы выпуска DRAM 2 ч.
Китайский предприниматель сколотил состояние на сдаче в аренду африканских IP-адресов за пределами континента 2 ч.
Первый в мире частный научный спутник успешно выведен в космос — он будет изучать звёзды в ультрафиолете 14 ч.
Главы технологических компаний наперебой заговорили о ЦОД в космосе 15 ч.
В 2027 году Intel может наладить выпуск процессоров Apple M по техпроцессу 18A-P 16 ч.
Samsung выпустила внешние SSD T7 Resurrected с ударопрочным корпусом из вторсырья и скоростью до 1050 Мбайт/с 17 ч.
Битва за Северную Европу: Digital Realty и Equinix борются за покупку скандинавского оператора ЦОД atNorth за €4,5 млрд 18 ч.
Asustor представила десктопные NAS Lockerstor Gen2+ с двумя портами 5GbE и чипом Intel Jasper Lake 18 ч.
MGX-сервер MSI CG480-S6053 получил чипы AMD EPYC Turin и восемь слотов PCIe 5.0 x16 для FHFL-карт двойной ширины 18 ч.