Сегодня 05 сентября 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → искусственный интеллект
Быстрый переход

Microsoft выпустила первые собственные ИИ-модели: одна генерирует речь, а другая — текст

До сих пор Microsoft в значительной степени полагалась на модели искусственного интеллекта компании OpenAI. Каждый раз, когда OpenAI представляла свои новейшие модели, Microsoft объявляла об их доступности в инфраструктуре Azure и во всех своих продуктах и ​​сервисах. Сегодня Microsoft представила две собственные модели искусственного интеллекта: MAI-Voice-1 и MAI-1-preview.

 Источник изображения: Microsoft

Источник изображения: Microsoft

MAI-Voice-1 — это модель генерации речи. Она уже доступна в приложениях Copilot Daily (аудиосводка новостей и погоды на основе ИИ) и Podcasts. Чтобы ознакомиться со всеми возможностями этой голосовой модели, Microsoft создала новый интерфейс Copilot Labs, который каждый может попробовать уже сегодня.

С помощью функции Copilot Audio Expressions пользователи могут вставить текстовый контент и выбрать голос, стиль и режим для создания высококачественного, выразительного звука. При необходимости можно скачать сгенерированный аудиофайл. Microsoft подчёркивает, что модель MAI-Voice-1 работает очень быстро и эффективно: она способна сгенерировать минуту аудио менее чем за секунду при использовании одного GPU.

Модель MAI-1-preview доступна в виде публичной бета-версии на платформе LMArena для оценки сообществом. Это первая фундаментальная модель MAI, прошедшая комплексное обучение, и она даёт представление о будущих возможностях Copilot.

MAI-1-preview — это модель MoE (смешанная модель экспертов), обученная на почти 15 000 специализированных ускорителях Nvidia H100. Это первая фундаментальная ИИ-модель Microsoft, прошедшая комплексное обучение собственными силами. Компания утверждает, что она эффективно выполняет инструкции и может давать полезные ответы на повседневные вопросы пользователей. Microsoft планирует внедрить MAI-1-preview для некоторых текстовых сценариев Copilot в ближайшие недели.

При этом Microsoft уточняет, что MAI-1-preview не заменяет модели OpenAI в Copilot. Компания планирует использовать лучшие решения как собственной команды, так и партнёров, включая сообщество разработчиков ПО с открытым исходным кодом. Помимо платформы LMArena, модель MAI-1-preview также доступна через API для доверенных тестировщиков.

Обнаружен первый ИИ-вирус — он запускает на локальном ПК нейросеть от OpenAI и просит её написать вредоносный код

Компания Eset выявила, вероятно, первую в мире программу-вымогатель со встроенной языковой моделью искусственного интеллекта. Программа, получившая название PromptLock, способна динамически создавать скрипты Lua с помощью ИИ, пишет CyberInsider.

 Источник изображения: Flipsnack / unsplash.com

Источник изображения: Flipsnack / unsplash.com

По данным исследователей, в PromptLock используется локальная реализация модели gpt-oss:20b через API Ollama, что позволяет ей работать в средах Windows, macOS и Linux без необходимости создания отдельных версий. Такие способности повышают гибкость вируса и затрудняют его обнаружение.

Код PromptLock написан на языке Go и классифицируется как Filecoder.PromptLock.A. Вредонос сканирует файловую систему и затем осуществляет выборочную эксфильтрацию данных и их шифрование по 128-битному алгоритму Speck. В самом коде PromptLock нет языковой модели, он подключается к ней через собственный сервер посредством прокси, что позволяет обходить сетевые ограничения.

В коде программы присутствуют элементы, указывающие на потенциально разрушительные действия, однако они пока не реализованы до конца. По этой причине в Eset считают, что программа может быть экспериментальным образцом, не предназначенным для массового распространения. Что, впрочем, не уменьшает серьёзность находки — появление подобных решений говорит о новом этапе в развитии киберугроз, где ИИ становится инструментом уже не только защиты, но и атаки, отмечают в Eset.

Интересно, что в коде PromptLock имеется жёстко заданный биткоин-адрес, связанный с автором биткоина Сатоси Накамото (Satoshi Nakamoto). По мнению специалистов, это может быть некой данью уважения к человеку со стороны создателей вируса, но также может быть отвлекающим манёвром.

Специалисты отмечают аналогию PromptLock с другой программой — Lamehug, в которой также используется языковая модель HuggingFace для генерации команд. Однако PromptLock отличается полной автономией и независимостью от внешних API. За счёт подобной интеграции ИИ вирус умеет адаптироваться к окружению в реальном времени, подчёркивают в Eset.

Администраторам сетей рекомендуется отслеживать выполнение Lua-скриптов, особенно связанных с шифрованием, и проверять исходящие соединения на наличие прокси с инфраструктурой Ollama.

Anthropic увернулась от иска за обучение ИИ на электронных книгах с помощью «исторического соглашения»

Компания Anthropic добилась урегулирования коллективного иска, который был подан группой американских писателей, обвинивших разработчика в сфере ИИ в нарушении авторских прав. В судебном заявлении, которое Anthropic подала на этой неделе, сказано, что компания достигла договорённости в рамках «предложенного урегулирования», которое позволит ей избежать судебного разбирательства.

 Источник изображения: Anthropic

Источник изображения: Anthropic

Условия соглашения неизвестны, но отмечается, что речь идёт об иске о нарушении авторских прав, который в прошлом году подали писатели Андреа Бартц (Andrea Bartz), Чарльз Гребер (Charles Graeber) и Кирк Уоллес Джонсон (Kirk Wallace Johnson). Они обвинили Anthropic в том, что компания обучала ИИ-модели Claude на находящихся в открытом доступе данных, в том числе пиратском контенте.

Anthropic сумела одержать победу в суде в июне, когда судья Уильям Алсуп (William Alsup) постановил, что обучение ИИ-моделей на данных книг, приобретённых законным путём считается легитимным. При этом он оставил возможность для дальнейших судебных разбирательств по данному вопросу. В июле Алсуп удовлетворил коллективный иск американских писателей, которые обвинили Anthropic в нарушении авторских прав и использовании пиринговой сети Napster для загрузки миллионов произведений. По данным источника, Anthropic должна была предстать перед судом по обвинению в пиратстве в декабре этого года. Компании грозили многомиллиардные штрафы.

Ожидается, что мировое соглашение между Anthropic и группой истцов будет окончательно оформлено 3 сентября. «Это историческое соглашение принесёт пользу всем участникам группы. Мы с нетерпением ждём объявления деталей соглашения в ближайшие недели», — прокомментировал данный вопрос адвокат истцов Джастин Нельсон (Justin Nelson).

ИИ усложнил старт в IT: программистам-новичкам стало труднее найти работу

Новое исследование Стэнфордского университета показывает, что инструменты искусственного интеллекта затрудняют трудоустройство новичков в сфере разработки программного обеспечения и обслуживания клиентов, сообщает агентство Bloomberg. В исследовании отмечается замедление темпов трудоустройства молодых, неопытных специалистов.

 Источник изображения: FLUX.1 AI

Источник изображения: FLUX.1 AI

Хотя недавнее исследование Массачусетского технологического института показало, что большинство компаний не увидели существенного роста прибыльности от использования ИИ, это не мешает им продолжать внедрять данную технологию в той или иной форме. В некоторых отраслях такое внедрение может негативно сказаться на карьерных перспективах тех, кто ищет должности начального уровня.

Исследование Стэнфордского университета, соавтором которого выступил экономист Эрик Бриньолфссон (Erik Brynjolfsson) и исследователи из Лаборатории цифровой экономики, показало, что за последние три года занятость людей, начинающих свою карьеру в областях, которые считаются наиболее подверженными воздействию ИИ, таких как бухгалтеры, разработчики и административные помощники, сократилась на 13 %. Это особенно затронуло молодых сотрудников в возрасте 22–25 лет, хотя в исследовании за тот же период отмечен рост занятости в других областях начального уровня, например, в сфере ухода за больными. В то же время должности, требующие более высокого опыта, в отслеживаемых в рамках исследования компаниях либо не изменились, либо были расширены. Это может говорить о том, что более опытные сотрудники, использующие ИИ, могут быть более продуктивны, взяв на себя часть функций молодых сотрудников.

В рамках исследования отслеживались данные из системы автоматической обработки данных (ADP), а также рассматривались расчётные листы по заработной плате тысяч компаний с общим штатом в миллионы сотрудников в США.

Популярность искусственного интеллекта разожгла споры о том, как быстрое внедрение ИИ повлияет на занятость. Согласно одному аргументу, технология может автоматизировать простые функции в определённых отраслях, заменив человека. Другой аргумент говорит о том, что инструменты ИИ могут повысить производительность труда, увеличив общую производительность, а не устранив роли начального уровня.

Оба аргумента, судя по выводам исследователей из Стэнфорда, могут быть верными. Однако это поднимает вопрос о том, как будут заполняться подобные вакансии в будущем. Если ИИ повысит эффективность и без того высококвалифицированных и высокопроизводительных сотрудников, но при этом устранит те роли, которые изначально позволили им получить этот опыт и навыки, откуда возьмётся следующее поколение разработчиков, бухгалтеров и помощников администраторов? Некоторые лидеры отрасли считают, что эти роли просто займёт ИИ, в то время как другие полагают, что это может привести к развитию более творческих инициатив: люди будут генерировать идеи, а ИИ — их реализовывать.

Хакеры научились внедрять невидимые вредоносные запросы к ИИ в изображения

Атака с внедрением подсказок — это способ сделать инструкции для системы искусственного интеллекта невидимыми для оператора-человека. Исследователи из Trail of Bits обнаружили, что такие инструкции можно скрывать в изображениях, делая текст невидимым для человеческого глаза. При последующей загрузке изображения в систему ИИ и его сжатии нейросетью подсказка становится доступной для распознавания, расшифровывается и может быть выполнена — всё это абсолютно незаметно для человека.

 Источник изображения: unsplash.com

Источник изображения: unsplash.com

Инструменты ИИ сегодня популярны даже среди пользователей, не слишком разбирающихся в традиционном ПО или вопросах безопасности, и это открывает множество новых возможностей для хакеров. Исследовательская группа Trail of Bits показала способ скрывать атаки с внедрением подсказок, используя сжатие изображений при их загрузке в систему ИИ. Хорошая аналогия — скрытый фишинг в электронном письме, где текст окрашен тем же цветом, что и фон: человек его не заметит, а нейросеть прочитает и, возможно, выполнит.

В примере, представленном Trail of Bits, при загрузке изображения с внедрённой подсказкой в Gemini бэкенд Google сжимает его для экономии пропускной способности и вычислительных ресурсов. В результате скрытый текст становится видимым для нейросети, и подсказка успешно внедряется, например сообщая Gemini о необходимости передать данные из личного календаря пользователя третьей стороне.

 Источник изображения: Trail of Bits

Источник изображения: Trail of Bits

Безусловно, такой метод требует значительных усилий ради получения относительно небольшого объёма персональных данных, причём и сама атака, и изображение должны быть адаптированы под конкретную систему ИИ. Пока нет доказательств того, что метод активно используется злоумышленниками. Но это показательный пример того, как на первый взгляд безобидное действие может превратиться в вектор атаки.

«Яндекс» и «Сбер» — главные бенефициары взрывной популярности ИИ в России

Российский рынок искусственного интеллекта по итогам 2025 года вырастет на 25–30 % приблизительно до 1,9 трлн рублей. Об этом пишет «Коммерсантъ» со ссылкой на данные аналитической компании Smart Ranking. В прошлом году совокупная выручка 150 крупнейших компаний от монетизации ИИ достигла 1,486 трлн рублей, увеличившись на 25 % год к году. При этом 95 % выручки пришлось на долю пяти крупнейших IT-компаний.

 Источник изображения: Steve Johnson / Unsplash

Источник изображения: Steve Johnson / Unsplash

В прошлом году лидером по выручке в сфере ИИ был «Яндекс». Выручка компании составила 500 млрд рублей, что говорит о росте на 49,25 % год к году. На втором месте по выручке в сфере ИИ расположился «Сбер» с 400 млрд рублей (рост на 14,29 %), а на третьем «Т-Технологии» Т-Банка с выручкой 350 млрд рублей (рост на 16 %). В первую пятёрку также вошли VK с выручкой 119 млрд рублей (+26,34 %) и «Лаборатория Касперского» с выручкой более 49 млрд рублей (+7,5 %).

По итогам 2023 года в первую пятёрку по выручке в сфере ИИ входили «Яндекс», VK, ГК «Ланит» (111-е место в 2024 году), «Газпромнефть – Цифровые решения» (не публиковала данные в 2024 году) и «Цифровые корпоративные технологии» (8-е место в 2024 году). Данные о выручке компаний Smart Ranking получила на основе анализа бухгалтерской отчётности, анкетирования и оценки экспертов.

По данным «Сбера», финансовый эффект от внедрения ИИ-технологий составил более 450 млрд рублей в 2024 году, что на 30 % больше аналогичного показателя за предыдущий год. «Сбер» предлагает клиентам «комплексные услуги — от первых экспериментов до промышленного внедрения». VK предоставляет сервис для клиентской аналитики и персонализации маркетинговых коммуникаций, сервис для обработки данных с помощью ML-моделей с целью прогнозирования разных признаков целевой аудитории и др. «Лаборатория Касперского» фокусируется на автоматизации обработки событий в сфере безопасности и повышении продуктивности разработчиков за счёт применения ИИ-ассистентов.

Однако не все участники рынка согласны с такой оценкой. По данным MWS AI (входит в состав МТС Web Services), объём российского рынка ПО и сервисов на базе ИИ составит около 50 млрд рублей в 2025 году. Отмечается, что приведённая оценка некорректно отражает состояние рынка, поскольку у перечисленных компаний искусственный интеллект не является основным направлением деятельности.

Samsung потешилась над Apple за отсутствие складных iPhone и отставание в ИИ

Компания Samsung выпустила рекламный видеоролик под названием «A Real Upgrade». По мнению корейской компании, «настоящим апгрейдом» является Galaxy Z Fold 7 со складным корпусом и продвинутыми возможностями ИИ, которых до сих пор лишён iPhone, рассказывает Android Authority.

 Источник изображения: smsng.us

Источник изображения: Samsung

В видео показано, как пользователь Galaxy Z Fold 7 с помощью функции Galaxy AI дорисовывает себе реалистичную рубашку на фотографии, где он запечатлён без верха, всего несколькими быстрыми жестами. Полученный эффект шокирует его друга — владельца iPhone.

Это уже не первый ролик, в котором Samsung и Google критикуют Apple за отставание в различных областях. В Samsung вообще любят использовать релизы новых устройств Apple в сатирическом ключе. В данном случае акцент сделан на двух аспектах — отсутствии складного iPhone и отставании Apple Intelligence от Galaxy AI и Google Gemini. По мнению Samsung, и Apple Intelligence, и Siri пока далеки от лидеров рынка ИИ.

Однако ситуация может измениться, отмечают авторы Android Authority: по их данным, работа над складным iPhone уже ведётся, и он может быть представлен в следующем году. Кроме того, в Купертино активно совершенствуют Siri, хотя и не без трудностей — в последнее время Apple сталкивается с «утечкой» ведущих специалистов в этой области.

ИИ замедлился в развитии, но бизнес не должен об этом беспокоиться

Развитие передовых ИИ-моделей демонстрирует признаки замедления. После ажиотажа вокруг искусственного интеллекта, возникшего при запуске алгоритма OpenAI ChatGPT в конце 2022 года, и регулярного появления впечатляющих ИИ-моделей становится всё более очевидным, что темпы прогресса больших языковых моделей снижаются.

 Источник изображения: Steve Johnson / Unsplash

Источник изображения: Steve Johnson / Unsplash

Этим летом компания Meta Platforms отложила запуск новой флагманской ИИ-модели Llama 4 Behemoth, поскольку процесс её доработки затянулся. OpenAI также выпустила свою последнюю модель GPT-5 позже запланированного срока, причём она не оправдала ожиданий.

На деле снижение интереса к передовым ИИ-алгоритмам не должно стать серьёзной проблемой для компаний, внедряющих искусственный интеллект в рабочие процессы. Генеративные алгоритмы уже закрепились в бизнесе и приносят ощутимую пользу — от обобщения больших текстовых документов и помощи в написании программного кода до составления электронных писем. Более простые нейросети, созданные ещё до появления генеративных алгоритмов, также находят всё больше применений, например, при обработке счетов-фактур. Однако большинство компаний едва ли глубоко разбирается в возможностях ИИ в его нынешнем виде, не говоря уже о том, каким он может стать в будущем.

Далеко не все организации активно внедряют ИИ-технологии в рабочие процессы. Часто это связано с опасениями утечек конфиденциальных данных через ИИ-ботов. Кроме того, искусственному интеллекту редко доверяют принятие ключевых решений, влияющих на финансы, сотрудников и клиентов. Склонность даже самых совершенных моделей время от времени выдавать некорректные ответы лишь усиливает недоверие.

Недавнее исследование Массачусетского технологического института показало, что многие компании в целом удовлетворены уже существующими ИИ-инструментами от OpenAI и Microsoft. Но когда дело доходит до разработки специализированного программного обеспечения с искусственным интеллектом — того, что должно приносить бизнесу наибольшую прибыль, — процент неудач в пилотных проектах достигает 95 %. Авторы исследования отмечают, что корпоративные пользователи «в подавляющем большинстве скептически относятся к ИИ-инструментам», считая их «чрезмерно усложнёнными или не соответствующими реальным рабочим процессам».

Простое осознание того, что развитие искусственного интеллекта замедляется, может придать компаниям больше уверенности в том, что они будут вкладывать в него деньги и время. Корпоративному сектору явно требуется больше времени для адаптации ИИ-инструментов к своей деятельности. На данный момент интеграция больших языковых моделей в повседневные задачи остаётся на начальной стадии.

В этом нет ничего удивительного. Интернет в конечном счёте изменил образ жизни людей и бизнес-практики, но в 1990-х на это ушло больше времени, чем предполагали первые энтузиасты. По данным Pew Research Center, потребовалось десятилетие, чтобы уровень проникновения домашнего широкополосного интернета в США вырос с почти нулевого в 2000 году до более чем 60 % взрослого населения.

Бум искусственного интеллекта во многом отличается, но развитие может пойти по схожей траектории: всплеск энтузиазма, за которым следует спад по мере распространения технологий в обществе и бизнесе. Истинный масштаб преимуществ от внедрения ИИ станет понятен лишь спустя годы. Добиваться повышения производительности моделей становится всё сложнее, что играет на руку производителям оборудования, таким как Nvidia. Крупные игроки, включая OpenAI и Meta, вероятно, будут вкладывать ещё больше средств в инфраструктуру, пытаясь ускорить темпы прогресса собственных моделей.

Учёные на коленке собрали радарную прослушку смартфонов — перехват работает на расстоянии до 3 м

Исследователи из Университета штата Пенсильвания сообщили об обнаружении атаки на смартфоны с помощью коммерческих микроволновых радаров, обычно устанавливаемых в системы автопилотов автомобилей. Собранный на коленке радар с расстояния три метра смог считывать вибрации динамика смартфона во время разговора. Точность распознавания пока низкая, но ИИ и знание контекста беседы обещают полную расшифровку звонков.

 Источник изображения: ИИ-генерация Grok 3/3DNews

Источник изображения: ИИ-генерация Grok 3/3DNews

В процессе разговора по телефону корпус динамика аппарата совершает вибрации, которые, как выяснилось, могут быть различимы в диапазоне 77–81 ГГц — типичный mmWave-диапазон, применяемый для платформ автопилотов автомобилей. Учёные воспользовались этой особенностью и собрали для экспериментов по перехвату разговоров по смартфону систему, которую назвали WirelessTap.

Этот новый метод перехвата ещё не совершенен, поясняют исследователи, но уже несёт в себе потенциальную опасность нарушения конфиденциальности звонков. В настоящее время максимальная точность распознавания слов составляет около 60 % и работает на расстоянии до 3 метров. Причём точность распознавания серьёзно снижается по мере удаления от прослушиваемого смартфона. Но технология даёт нам представление о будущем шпионажа и слежки и показывает, как искусственный интеллект может оказаться незаменимым в таких областях.

«Если мы зафиксируем эти вибрации с помощью удалённых радаров и внедрим машинное обучение, которое, используя контекстные подсказки, поможет нам понять, о чём идёт речь, мы сможем полностью распознавать разговоры, — поясняют исследователи уязвимости. — Возможно, мы можем этим помочь общественности осознать потенциальные риски».

Учёные отмечают, что технология WirelessTap значительно превосходит предыдущее разработки в сфере радарного перехвата разговоров. Раньше для этого требовалось включать громкую связь и пользоваться ограниченным запасом слов. Прогресс был достигнут поле использования кастомной версии OpenAI, оптимизированной для распознавания речи шёпотом. В экспериментах система работала с точностью распознавания 60 % на удалении 50 см от смартфона, но может быть улучшена, и это несёт с собой риски утери конфиденциальности во время звонков.

Meta✴ будет использовать облачную платформу Google — сумма контракта свыше $10 млрд

Meta Platforms заключила с Google контракт стоимостью более $10 млрд на использование облачной платформы компании. Соглашение рассчитано на шесть лет и предполагает, что гигант соцсетей задействует IT-инфраструктуру Google Cloud, включая серверы, хранилища данных, а также другие сервисы. Об этом пишет информационное агентство Reuters со ссылкой на собственный осведомлённый источник.

 Источник изображения: Farhat Altaf / Unsplash

Источник изображения: Farhat Altaf / Unsplash

Новость о подписании соглашения появилась после того, как глава Meta Марк Цукерберг (Mark Zuckerberg) заявил, что компания потратит сотни миллиардов долларов на строительство нескольких крупных центров обработки данных для нужд искусственного интеллекта. На этом фоне недавно Meta увеличила минимальную сумму планируемых капитальных затрат на $2 млрд (по итогам года они составят от $66 млрд до $72 млрд).

Параллельно с этим Meta продолжает поиск партнёров, которые помогут профинансировать строительство масштабной инфраструктуры, необходимой для обеспечения нужд искусственного интеллекта. В рамках этой деятельности компания вложила дополнительные $2 млрд в активы ЦОД.

В июне стало известно, что OpenAI, являющаяся разработчиком популярного ИИ-бота ChatGPT, также подписала соглашение об использовании облачного сервиса Google. Эта новость стала неожиданной, поскольку компании активно конкурируют друг с другом в разных сферах, включая онлайн-поиск. На этом фоне выручка облачного подразделения Alphabet, являющейся для Google материнской компанией, во втором квартале подскочила почти на 32 %.

Meta✴ будет использовать генеративные алгоритмы Midjourney в своих продуктах

Компания Meta Platforms объявила о сотрудничестве с разработчиком генеративных ИИ-алгоритмов Midjourney с целью «лицензировать их эстетические технологии» для использования в собственных ИИ-моделях и продуктах. Об этом в конце неделе объявил глава ИИ-подразделения Meta Александр Ван (Alexandr Wang).

 Источник изображения: Alexandra_Koch / pixabay.com

Источник изображения: Alexandra_Koch / pixabay.com

В заявлении Вана сказано, что партнёрство включает в себя «техническое сотрудничество между нашими исследовательскими командами». Это означает, что сделка не ограничивается тем, что Meta сможет использовать готовые продукты Midjourney. При этом Ван не раскрыл подробности соглашения, поэтому более детальной информации по этому вопросу пока нет.

Последнее время Meta активно инвестирует в создание суперинтеллекта, чтобы догнать конкурентов, таких как OpenAI и Google. Глава Meta Марк Цукерберг (Mark Zuckerberg) лично работал над тем, чтобы переманить к себе ведущих специалистов конкурентов, предлагая им огромные денежные выплаты. Сам Ван присоединился к Meta только после того, как компания заплатила $14,3 млрд за приобретение 49 % акций стартапа Scale AI, соучредителем которого он является.

Партнёрство с Midjourney напрямую связано с целями Meta в сфере интеграции в свои сервисы генеративных инструментов на базе ИИ. Несмотря на то, что во многих сервисах компании уже появилась функция генерации изображений, очевидно, что Meta хочет сделать этот инструмент более качественным, а также добавить возможность создания видео. Кроме того, гигант социальных сетей может задействовать технологии Midjourney, чтобы сделать проще процесс редактировании фото и видео перед публикацией в соцсетях.

«Мы невероятно впечатлены работой Midjourney. Они достигли настоящего технического и эстетического совершенства, и мы очень рады более тесному сотрудничеству с ними», — заявил Ван. Он также добавил, что в скором времени компании расскажут больше о совместных проектах. Основатель Midjourney Дэвид Хольц (David Holz) добавил, что, несмотря на партнёрство с Meta, Midjourney остаётся «независимой исследовательской лабораторией, поддерживаемой сообществом», у которой «нет инвесторов».

Видео: робот Atlas от Boston Dynamics продолжает работать, пока его толкают, мешают и отбирают вещи

После десяти месяцев совместных усилий компании Boston Dynamics и Toyota Research Institute (TRI) сообщили о значительном прогрессе в разработке человекоподобных роботов. Они продемонстрировали возможности робота Atlas, управляемого большой поведенческой моделью (Large Behavior Model, LBM). В опубликованном на днях видео Atlas выполняет сложные задачи без единой строчки кода — все его движения основаны исключительно на обучении.

 Источник изображений: Boston Dynamics

Источник изображений: Boston Dynamics

В частности, на видео робот занимается упаковкой, сортировкой и размещением объектов, сочетая манипуляции руками и перемещение всего тела. Интеграция больших поведенческих моделей, ставшая основой работы Boston Dynamics и TRI, позволяет добавлять новые навыки без написания кода, тогда как раньше для этого требовалось длительное программирование.

Этот прорыв стал возможным благодаря объединению опыта Boston Dynamics в робототехнике и TRI в области искусственного интеллекта. Такой симбиоз открыл путь к созданию универсальных человекоподобных помощников. Это особенно важно, поскольку человек приспособил мир под себя — значит, робот будет вести себя в нём наиболее естественно, если будет напоминать человека и сможет повторять его движения и жесты.

Ключевой особенностью проекта Boston Dynamics и TRI стало использование единой поведенческой модели, которая управляет всеми движениями робота — от ходьбы и поддержания равновесия до сложных манипуляций руками. В ходе демонстрации Atlas успешно адаптировался к неожиданным препятствиям, например к внезапному закрытию крышки коробки или её перемещению, без необходимости разделять управление на низкоуровневые и высокоуровневые задачи. Это отличает новый подход от традиционных методов, где управление руками и ногами обычно разделялось. Такой целостный метод гарантирует более естественное и гибкое поведение робота, приближая его к выполнению задач в реальных условиях.

Совместное исследование, начатое в октябре 2024 года, объединило сильные стороны обоих партнёров и ускорило разработку роботов с ИИ. По словам Скотта Куиндерсмы (Scott Kuindersma), вице-президента по исследованиям Boston Dynamics, обучение единой нейронной сети для выполнения множества задач способствует лучшему обобщению, а человекоподобные роботы, подобные Atlas, идеально подходят для задач, где требуется и точность, и сила.

В свою очередь, Расс Тедрейк (Russ Tedrake), старший вице-президент TRI, подчеркнул, что большие поведенческие модели позволяют быстро обучать робота новым навыкам через демонстрацию действий человеком, снижая необходимость в большом количестве примеров для достижения надёжного поведения.

Проект не только демонстрирует технические достижения, но и поднимает фундаментальные вопросы о будущем человекоподобных роботов и их интеграции в повседневную жизнь. Исследования направлены на углубление понимания больших моделей для управления сложными движениями и манипуляциями. Успех Atlas подтверждает потенциал технологий искусственного интеллекта в создании роботов общего назначения, способных работать в обычных условиях бок о бок с людьми, выполняя широкий спектр задач с минимальными ограничениями, что может изменить подходы к автоматизации в будущем.

TikTok заменит сотни британских модераторов на искусственный интеллект

Лондонское подразделение TikTok готовится уволить сотни сотрудников, занимающихся модерацией и безопасностью контента, как раз в момент, когда в Великобритании вступает в силу «Закон о безопасности в интернете», требующий от международных технологических компаний предотвращать распространение опасных материалов. Компания объяснила, что «начинает процесс коллективных консультаций в рамках глобальной реорганизации своей деятельности по модерации контента».

 Источник изображения: unsplash.com

Источник изображения: unsplash.com

Несколько сотен рабочих мест в отделе доверия и безопасности TikTok будут сокращены в Великобритании, а также в Южной и Юго-Восточной Азии, поскольку, по словам представителя компании «технологические достижения, такие как усовершенствование больших языковых моделей, меняют наш подход».

Этот шаг был предпринят всего через несколько недель после вступления в силу ключевых положений британского «Закона о безопасности в интернете», который обязывает компании вводить проверку возраста пользователей, пытающихся получить доступ к потенциально опасному контенту. Компаниям, не соблюдающим новые требования по оперативному удалению опасных и незаконных материалов, грозит штраф в размере до £18 млн или 10 % от мирового оборота, в зависимости от того, какая сумма больше.

В прошлом месяце в TikTok были введены новые правила «контроля возраста», чтобы соответствовать последним требованиям по ограничению воздействия вредоносного контента на лиц младше 18 лет. Как и другие социальные сети, TikTok планирует использовать технологии машинного обучения для определения возраста пользователя на основе истории использования сайта и круга общения. Эти системы на основе ИИ пока не получили одобрения регулятора.

Решение TikTok об увольнении сотрудников принято на фоне более масштабных усилий китайской технологической группы по рационализации своей деятельности в Европе. Компания уделяет особое внимание сокращению или закрытию групп модераторов на отдельных рынках и централизации этих функций в региональных центрах, таких как Дублин и Лиссабон. В этом месяце была закрыта команда TikTok по доверию и безопасности в Берлине.

 Источник изображения: Pixabay

Источник изображения: Pixabay

«Мы продолжаем реорганизацию, начатую в прошлом году, чтобы укрепить нашу глобальную операционную модель доверия и безопасности, которая включает в себя концентрацию нашей деятельности в меньшем количестве локаций по всему миру, чтобы обеспечить максимальную эффективность и скорость развития этой критически важной для компании функции с использованием технологических достижений». — заявил представитель TikTok.

Национальный организатор профсоюза работников связи Джон Чедфилд (John Chadfield) уверен, что компания просто планирует перенести свою деятельность в юрисдикции с более дешёвой рабочей силой. «Им не нужны модераторы-люди, их цель — передать всё это ИИ, — заявил он. — ИИ создаёт впечатление, что они умные и передовые, но на самом деле они просто собираются вывести его за пределы страны».

Сокращения в TikTok происходят на фоне продолжающегося роста доходов компании в Великобритании и Европе. Выручка компании в 2024 году выросла на 38 % в годовом исчислении до $6,3 млрд, при этом убытки до налогообложения сократились с $1,4 млрд в 2023 году до $485 млн в прошлом году.

OpenAI лишилась главы отдела кадров

На этой неделе OpenAI покинула директор по персоналу Джулия Виллагра (Julia Villagra). Об этом пишет информационное агентство Reuters со ссылкой на собственные источники в компании.

 Источник изображения: Rolf van Root / Unsplash

Источник изображения: Rolf van Root / Unsplash

На странице Виллагра в LinkedIn сказано, что она начала работать руководителем отдела кадров в OpenAI в феврале 2024 года. В марте этого года гендиректор OpenAI Сэм Альтман (Sam Altman) объявил о повышении Виллагра до директора по персоналу.

По данным источника, поиском нового директора по персоналу займётся глава направления разработки приложений Фиджи Симо (Fidji Simo), который пришёл в OpenAI в мае этого года. До этого момента руководить подразделением будет директор по стратегическому развитию Джейсон Квон (Jason Kwon).

Виллагра покинула компанию, чтобы уделять больше времени личным увлечениям, а также тому, чтобы донести до людей информацию о том, что означает переход к «сильному ИИ» (AGI), который разрабатывает OpenAI и который будет превосходить людей во многом. По данным опроса Reuters, искусственный интеллект меняет рабочие места, отрасли, промышленность и повседневную жизнь, что вызывает у людей обеспокоенность по поводу того, что из-за развития технологий они могут лишиться своих мест.

Google заявила, что её ИИ тратит всего пять капель воды на запрос — эксперты нашли несостыковки

На фоне ожесточённых споров о влиянии искусственного интеллекта на окружающую среду Google провела собственное исследование. В нём говорится, что, благодаря повышению эффективности, ИИ-помощник Gemini использует минимальное количество воды и энергии для каждого запроса. Однако эксперты уверены, что подобные заявления технологического гиганта сознательно вводят общественность в заблуждение.

 Источник изображения: Pixabay

Источник изображения: Pixabay

По оценкам Google, для ответа на средний текстовый запрос Gemini требуется около 0,26 миллилитра воды (пять капель) и примерно 0,24 Вт⋅ч электроэнергии (девять секунд работы телевизора). Это, по словам компании, приводит к выбросам около 0,03 грамма углекислого газа. В отчёте также отмечено, что в этом году Google начала исключать из своих климатических целей определённые категории выбросов парниковых газов, которые, по её словам, являются «периферийными» или находятся вне прямого контроля компании.

Предоставленные Google данные оказались заметно ниже, чем в предыдущих подобных независимых исследованиях. Отчасти это можно объяснить повышением эффективности, однако, по мнению экспертов, Google упустила из виду ключевые данные, что дало неполную картину воздействия Gemini на окружающую среду.

 Источник изображения: Techspot

Источник изображения: Techspot

«Они просто скрывают важную информацию, — утверждает доцент Калифорнийского университета Шаолэй Рен (Shaolei Ren). — Это действительно распространяет неверный сигнал по всему миру». Он занимается изучением потребления воды и загрязнения воздуха, связанных с ИИ, и является одним из авторов статьи, упомянутой Google в своём исследовании Gemini.

Эксперты указали, что Google не учитывает косвенное использование воды в своих оценках. В исследовании учитывалась лишь та вода, которую ЦОД используют в своих системах охлаждения. Но фактически, большая часть воды, потребляемой ЦОД, приходится на электроэнергию, для выработки которой также требуются гигантские объёмы воды, что Google упускает из виду в данном исследовании. «Вы видите, по сути, лишь верхушку айсберга», — прокомментировал отчёт Google аспирант Института экологических исследований Амстердамского свободного университета Алекс де Врис-Гао (Alex de Vries-Gao).

 Источник изображения: unsplash.com

Источник изображения: unsplash.com

Google утверждает, что указанный в её отчёте показатель расхода воды в 0,26 мл на средний запрос «на порядки меньше предыдущих оценок», которые в исследовании Рена достигали 50 мл. По мнению Рена, это сравнение вводит в заблуждение, так как он в своём исследовании учитывал как прямое, так и косвенное потребление воды ЦОД.

Google не учитывает ещё один важный показатель, связанный с энергопотреблением и загрязнением окружающей среды. В отчёте компании представлен только «рыночный» показатель выбросов углерода, учитывающий обязательства компании по поддержке роста использования возобновляемых источников энергии в энергосетях. Более комплексный подход должен учитывать местоположение ЦОД и текущее соотношение чистой и грязной энергии в местной энергосети. Эксперты считают, что Google следовало использовать именно такой подход, следуя стандартам, установленным международным «Протоколом по парниковым газам».

Google ссылается на предыдущее исследование, проведённое Реном и де Врис-Гао. Однако учёные утверждают, что Google сравнивает результаты, «как яблоки с апельсинами». Дело в том, что их предыдущие работы основывались на средних значениях, а Google использует медианные показатели, чтобы, как утверждает компания, «исключить искажение результатов выбросами, потребляющими чрезмерно много энергии». Компания также не сообщила количество слов или токенов для текстовых запросов, которые учитывались в отчёте.

 Источник изображения: unsplash.com

Источник изображения: unsplash.com

Google ещё не представила свою новую работу на рецензирование, хотя представитель компании заявил, что компания планирует сделать это в будущем. По словам Google, компания стремится к большей прозрачности в отношении потребления воды, энергопотребления и выбросов углерода, а также предлагает более стандартизированные параметры для оценки воздействия на окружающую среду. Google утверждает, что идёт дальше предыдущих исследований, учитывая энергию, потребляемую простаивающими машинами и вспомогательной инфраструктурой центров обработки данных, например, системами охлаждения.

Google утверждает, что за последний год значительно повысила энергоэффективность Gemini, добившись 33-кратного снижения потребления электроэнергии на один запрос. По данным компании, углеродный след медианной подсказки за тот же период сократился в 44 раза. «Мы гордимся инновациями, лежащими в основе нашего повышения эффективности, и намерены продолжать существенно совершенствоваться в ближайшие годы», — говорится в блоге Google.

Однако, реальная картина выглядит более мрачной. Повышение эффективности может привести к увеличению загрязнения из-за опережающего роста потребления ресурсов искусственного интеллекта — к печальному явлению, известному как парадокс Джевонса. Так называемые «выбросы углерода, обусловленные амбициями» Google, выросли на 11 % в прошлом году и на 51 % с 2019 года, поскольку компания продолжает активно развивать ИИ.


window-new
Soft
Hard
Тренды 🔥
«Нам есть что рассказать»: глава MachineGames подтвердил планы на Wolfenstein 3 2 ч.
Microsoft Copilot научился создавать сводки по файлам и документам из облака OneDrive 4 ч.
«Красиво, страшно, залипательно»: хоррор Cronos: The New Dawn от авторов ремейка Silent Hill 2 стартовал в Steam с «очень положительными» обзорами 4 ч.
VI Форум «Мой бизнес» в Архангельске: малый бизнес, цифровизация и новые правила 6 ч.
После выхода Hollow Knight: Silksong самой желанной игрой пользователей Steam стала скандальная Subnautica 2 6 ч.
Apple обвинили в нарушении патентов на технологию «Привет, Siri» 7 ч.
«Внушает оптимизм»: журналисты раскрыли, когда выйдут первые обзоры Ghost of Yotei 7 ч.
Россиянам вернут важнейшие сервисы во время отключений мобильного интернета 8 ч.
Microsoft уберёт Teams из пакета офисных приложений, чтобы избежать штрафа в ЕС 10 ч.
CD Projekt Red заинтриговала фанатов тизером, как новая книга Сапковского повлияет на The Witcher 4 11 ч.
Karri Messenger позволит детям безопасно общаться с родителями и друзьями при помощи голосовых сообщений 4 ч.
Qualcomm и BMW представили систему автономного вождения, которую будут продавать на сторону 4 ч.
Huawei заняла почти половину мирового рынка складных смартфонов — Samsung даже не вторая по популярности 5 ч.
На IFA 2025 показали пауэрбанк, который работает даже с пробитой батареей 6 ч.
Tesla предложила Илону Маску до $1 трлн за десять лет работы гендиректором 6 ч.
Mitsubishi Heavy Industries удвоит производство газовых турбин в связи с ростом индустрии ЦОД 7 ч.
Сверхтонкий 5,9-мм смартфон Nubia Air получил 6,78″ AMOLED-экран и защиту IP69K 7 ч.
Lenovo представила мобильные рабочие станции ThinkPad P с процессорами Core Ultra 200 и графикой Nvidia RTX Blackwell 7 ч.
Dreame представила свой дебютный монитор X1 Ultra 8 ч.
Team Group представила первый в мире внешний SSD со встроенной функцией геолокации 8 ч.