Сегодня 15 июня 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → ии
Быстрый переход

После месяцев подозрений Activision наконец призналась, что в Call of Duty: Black Ops 6 есть контент на основе генеративного ИИ

Сообщения о том, что Activision продаёт для игр Call of Duty контент на основе генеративного ИИ, появились ещё прошлым летом, но подтвердил опасения геймеров американский издатель лишь сейчас.

 Источник изображений: Activision

Источник изображений: Activision

Пользователи форума ResetEra обратили внимание, что на странице военного шутера Call of Duty: Black Ops 6 в сервисе Steam появилось подтверждение от Activision об использовании нейросетей для создания игрового контента.

«Наша команда использует инструменты генеративного ИИ для разработки некоторых внутриигровых материалов», — гласит появившееся недавно уточнение от создателей Call of Duty: Black Ops 6.

 Об использовании ИИ в Yokai’s Wrath сообщили информаторы издания Wired

Об использовании ИИ в Yokai’s Wrath сообщили информаторы издания Wired

Подозрения в использовании нейросетей преследовали Activision со времён Call of Duty: Modern Warfare 3, для которой компания в 2023 году выпустила созданный с применением ИИ набор Yokai’s Wrath («Ярость ёкая») стоимостью $15.

Вслед за выходом Black Ops 6 игроки заподозрили, что ИИ также применялся для создания как минимум праздничного загрузочного экрана (с шестипалым зомби) и визитной карточки Hard Breakup (см. изображение ниже).

 Обратите внимание на рукав и форму волос персонажа

Обратите внимание на рукав и причёску персонажа

Activision не уточнила, для каких материалов задействует ИИ. Одно дело — получить загрузочный экран в рамках рождественского события, но другое — гриндить часами для разблокировки ИИ-рисунка или продавать ИИ-иллюстрации за деньги.

Когда в январе 2024 года Microsoft уволила 1900 сотрудников игрового подразделения, под сокращения попали многие 2D-художники. Оставшихся заставили использовать ИИ, а также записаться на курсы по обучению работы с этими инструментами.

«Яндекс» представила свою самую мощную ИИ-модель YandexGPT 5 Pro — её уже встроили в «Алису»

«Яндекс» обеспечил голосового помощника «Алису» поддержкой новой большой языковой модели YandexGPT 5 Pro. Нейросеть, утверждает разработчик, отвечает на запросы не хуже передовых мировых аналогов, а в некоторых случаях их превосходит. Опробовать YandexGPT 5 Pro могут пользователи платной подписки «Алиса Про», а для корпоративных клиентов она доступна в облаке Yandex Cloud. Есть и YandexGPT 5 Lite, доступная с открытым исходным кодом.

 Источник изображений: «Яндекс»

Источник изображений: «Яндекс»

Обновлённая «Алиса Про» научилась правильно считать, решать логические задачи и писать программный код; она отвечает точнее, ориентируется на предложенный пользователем формат, предлагает более содержательные сводки текстов и генерирует идеи. При обращении к веб-поиску помощник с искусственным интеллектом выбирает источники, которые лучше подходят для российской аудитории; «Алиса» способна общаться на русском и английском языках — это поможет тем, кто учит английский или пользуется им в работе.

Модель ИИ YandexGPT 5 Pro уже доступна в чате с «Алисой»: пользователи с подпиской «Алиса Про» могут общаться с ней неограниченно, в бесплатном варианте число запросов увеличили с 5 до 20 в день. «Яндекс» намеревается чаще добавлять в чат с «Алисой» новые модели — так, сейчас компания готовит рассуждающую модель ИИ. Нейросеть YandexGPT 5 Pro доступна в веб-версии и мобильном приложении «Алиса», в мобильном и настольном вариантах «Яндекс Браузера», а также на умных устройствах.

Корпоративные клиенты могут воспользоваться YandexGPT 5 Pro на платформе Yandex Cloud AI Studio и в сервисе SpeechSense. На основе нейросети можно создавать ИИ-помощников, которые отвечают на вопросы с использованием предложенных документов и распределяют тексты по категориям. К примеру, YandexGPT 5 Pro может работать в контакт-центре, анализируя переписку с клиентами, распределяя обращения по темам и создавая сводки текстов для отчётов.

В семейство YandexGPT 5 вошли две модели: передовая Pro и облегчённая Lite. YandexGPT 5 Pro выступает на уровне мировых лидеров, в том числе OpenAI GPT-4o и Alibaba Qwen2.5 (Qwen-2.5-32b-Instruct) — в последнем случае российская модель опережает китайскую в запросах, связанных с фактической информацией, но немного уступает ей в математических задачах.

YandexGPT 5 Lite в версии pretrain с 8 млрд параметров и контекстом 32 000 токенов впервые за несколько лет опубликована «Яндексом» как модель с исходным кодом. Она предназначена для работы в качестве платформы, которую можно самостоятельно обучить следовать заданным инструкциям и давать ответ в нужном формате.

Perplexity начала тестирование собственного ИИ-браузера Comet

Компания Perplexity, известная своим поисковым движком на основе искусственного интеллекта (ИИ), анонсировала разработку собственного веб-браузера под названием Comet. Несмотря на судебные разбирательства с издателями, Perplexity продолжает расширять линейку своих поисковых продуктов, стремясь укрепить позиции на рынке ИИ и предложить пользователям новые возможности работы в сети.

 Источник изображения: Copilot

Источник изображения: Copilot

Представитель Perplexity заявил изданию TechCrunch, что компания намерена «переосмыслить» концепцию веб-браузера так же, как ранее изменила подход к поиску. Однако выход на этот рынок обещает быть непростым, учитывая высокую конкуренцию со стороны таких гигантов, как Google Chrome, и множества альтернативных браузеров, многие из которых, как, например, Dia от The Browser Company, предлагают функции на базе ИИ, сопоставимые с разработками Perplexity.

Perplexity надеется быстро привлечь аудиторию за счёт пользователей своего поискового сервиса и активного расширения новых продуктов, таких как инструмент для «глубокого исследования», конкурирующий с решениями OpenAI, Google и xAI, а также ИИ-ассистент для Android и API для поиска, который был выпущен в январе.

Основанная в 2022 году, Perplexity уже привлекла более $500 млн венчурных инвестиций и оценивается в $9 млрд. По словам компании, её поисковый сервис обрабатывает более 100 млн запросов в неделю, а также разрабатывается инструмент монетизации с подключением рекламной платформы и другие коммерческие инициативы.

Одновременно успехи компании сопровождаются юридическими проблемами. В прошлом году The New York Times направила Perplexity требование прекратить использование её контента, а недавно News Corp, Dow Jones и New York Post подали судебный иск, обвиняя компанию в «клептократии контента». Однако в Perplexity заявляют, что уважают права издателей и официально предлагают им программу разделения доходов.

Успех DeepSeek вызвал рост спроса на ускорители Nvidia H20 в Китае

Из-за санкций США поставки в Китай передовых ускорителей Nvidia запрещены, и с этой точки зрения усечённые с точки зрения производительности ускорители H20 являются наиболее продвинутыми решениями Nvidia среди доступных китайским клиентам. Спрос на них в Китае после успеха DeepSeek заметно вырос, как утверждают источники Reuters.

 Источник изображения: Nvidia

Источник изображения: Nvidia

Напомним, что китайский стартап DeepSeek продемонстрировал способность создавать эффективные большие языковые модели с ограниченным доступом к аппаратным ресурсам, поэтому интерес к его разработкам заметно вырос в самом Китае. По данным Reuters, закупки ускорителей Nvidia H20 китайскими компаниями Tencent, Alibaba и ByteDance были существенно увеличены после появления соответствующих откровений о прорыве DeepSeek.

Перечисленные китайские компании не только используют вычислительные мощности для собственных нужд, но и предоставляют их сторонним разработчикам. Китайские производители серверного оборудования отмечают, что на местном рынке вырос спрос на решения, оснащённые ускорителями H20 и использующие языковые модели DeepSeek. Теперь их приобретают даже представители сферы образования и здравоохранения, хотя ранее такими закупками занимались преимущественно провайдеры связи и успешные финансовые организации в Китае. Отчасти рост спроса на H20 мог быть спровоцирован слухами о намерениях США запретить поставки данных ускорителей в КНР.

По оценкам аналитиков, в 2024 году на территорию Китая было ввезено около 1 млн ускорителей H20, обеспечивших Nvidia выручкой в размере более $12 млрд. Взять на вооружение разработки DeepSeek решились многие китайские компании, включая Tencent и автопроизводителя Great Wall Motor.

Anthropic выпустила умнейшую нейросеть Claude 3.7 Sonnet — она бесплатна и превосходит DeepSeek R1 и OpenAI o3

Компания Anthropic, один из главных конкурентов OpenAI, выпустила Claude 3.7 Sonnet — свою первую «гибридную рассуждающую модель». По словам компании, она способна решать более сложные задачи, чем предшественницы, и превосходит их в таких областях, как математика и написание программного кода.

 Источник изображений: Anthropic

Источник изображений: Anthropic

Claude 3.7 Sonnet стала доступна в приложениях Claude и веб-версии чат-бота, в том числе и для бесплатных пользователей. Также взаимодействовать с новой нейросетью можно через API Anthropic, Amazon Bedrock и Google Cloud's Vertix AI — стоит новинка столько же, сколько и её предшественница, 3.5 Sonnet, то есть $3 за миллион входных токенов и $15 за миллион выходных токенов.

OpenAI и другие компании предлагают модели со способностью к рассуждениям отдельно от обычных генеративных ИИ-моделей. Anthropic решила совместить их в одной системе, чтобы получить универсальное решение. В результате пользователь может выбрать, когда модели Claude 3.7 Sonnet стоит отвечать нормально, а когда — подольше подумать над ответом. В стандартном режиме Claude 3.7 Sonnet представляет собой просто улучшенную версию прежней Claude 3.5 Sonnet с более свежими данными (её база включает информацию до ноября 2024 года). В режиме расширенного мышления ИИ самостоятельно размышляет перед ответом, что повышает производительность при решении задач по математике, физике, выполнению сложных инструкций, кодингу и многих других.

Руководитель отдела исследований продуктов Anthropic Дайанн Пенн (Dianne Penn) рассказала The Verge, что компания хотела упростить процесс использования модели. «Мы принципиально считаем, что рассуждения — это скорее особенность ИИ, чем совершенно отдельная вещь», — говорит она, отмечая, что Claude не нужно много времени, чтобы ответить на вопрос «который час?», в отличие от ответа на более сложный запрос, например «спланируй двухнедельную поездку в Италию, учитывая погоду в конце марта».

Помимо новой модели, Anthropic также выпускала «ограниченную исследовательскую предварительную версию» своего ИИ-агента для программирования под названием Claude Code. Хотя Anthropic уже предлагает такие ИИ-инструменты для кодинга, как Cursor, новый Claude Code компания позиционирует как «активного сотрудника, который может искать и читать код, редактировать файлы, писать и выполнять тесты, фиксировать и отправлять код на GitHub, а также использовать инструменты командной строки».

Anthropic также позволяет разработчикам управлять тем, как модель «думает», и даже устанавливать время на раздумья. «Иногда разработчику нужно просто сказать, что ответ на этот вопрос не должен занимать более 200 миллисекунд», — подмечает вице-президент Anthropic по продуктам Майкл Герстенхабер (Michael Gerstenhaber).

Пенн утверждает, что Claude 3.7 Sonnet заметно лучше конкурентов справляется с «агентским кодированием», финансовыми и юридическими задачами. По словам представительницы Anthropic, сотрудники компании активно используют новую модель для создания дизайна веб-сайтов, интерактивных игр и даже тратят до 45 минут на кодирование, «создавая тестовые наборы и итеративно редактируя тестовые примеры».

Пенн также рассказала, что компания тестирует свои модели на способность проходить олдскульную видеоигру Pokémon, имитируя нажатие кнопок контроллера через API. Claude 3.5 Sonnet не смог выбраться из Pallet Town в начале игры, в то время как версия 3.7 смогла победить нескольких боссов.

Выход Claude 3.7 Sonnet показывает, что индустрия ИИ движется к тому, чтобы вместо нескольких отдельных моделей предлагать одну модель, которая способна и быстро отвечать, и думать над сложными задачами. О чём-то подобном недавно говорил глава OpenAI Сэм Альтман (Sam Altman).

xAI Grok 3 заговорил и тут-же стал ругаться и заигрывать с пользователями

Анонсированная в феврале компанией xAI мультимодальная ИИ-модель Grok 3 получила голосовой режим, позволяющий пользователям взаимодействовать с ИИ в реальном времени посредством голоса. Он доступен платным пользователям. Как сообщает ресурс Aibase, пользователь платформы X обнаружил, что приложение также получило поддержку двух режимов для взрослых: «Безбашенный» (Unhinged) и «Сексуальный» (Sexy).

 Источник изображения: xAI

Источник изображения: xAI

По словам пользователя, в режиме Unhinged приложение «постоянно вовлекает вас в жаркие дебаты», преуспевая в провокационных аргументах. В свою очередь, режим Sexy «начинается с флирта», наполненного романтическими высказываниями или сексуальными намеками.

Как полагает Aibase, добавление таких режимов не только обогащает методы взаимодействия ИИ-приложения с пользователями, но и расширяет развлекательный аспект. Режим «Безбашенный» может включать спорный контент, способный вызвать интерес, в то время как режим «Сексуальный» использует беззаботный заигрывающий стиль диалога.

На этом личности «Грока» не заканчиваются. Есть режим «Укурок» (Stoner), имитирующий разговор с человеком под действием запрещённых в России и многих других странах веществ. Для тех, кто предпочитает более спокойные беседы, есть режимы «Лучший друг» и «Гений» — последний подражает стилю общения астрофизика Карла Сагана (Carl Sagan). Все эти личности доступны с женским (Ara) и мужским (Rex) голосами, причем женская версия имеет более строгие ограничения.

Появление этих режимов вызвало дискуссии среди пользователей о необходимости модерации контента, особенно в отношении их потенциального воздействия на несовершеннолетних.

Являются ли эти режимы официальными или просто находятся на стадии тестирования, пока неясно. Компания пока никак не прокомментировала сообщение пользователя. По мнению аналитиков, этот шаг xAI направлен на привлечение более широкой пользовательской базы, одновременно расширяя границы взаимодействия с ИИ. Голосовое общение в реальном времени и разнообразные режимы приложения Grok могут стать его конкурентным преимуществом, но, вместе с тем, создать для xAI проблемы в достижении баланса между инновациями и безопасностью.

OpenAI провела зачистку ChatGPT от аккаунтов из Китая и Северной Кореи, подозреваемых во вредоносной деятельности

OpenAI заблокировала аккаунты пользователей из Китая и Северной Кореи, которые, якобы, использовали технологии компании в злонамеренных целях, включая слежку и кампании по влиянию на общественное мнение. В заявлении OpenAI говорится, что авторитарные режимы могут применять искусственный интеллект во вред США и собственным гражданам. Отмечается, что для выявления подозрительной активности был задействован специальный ИИ-алгоритм.

 Источник изображения: Dima Solomin / unsplash.com

Источник изображения: Dima Solomin / unsplash.com

Компания не сообщила, сколько аккаунтов было заблокировано, а также не уточнила, как давно ведётся поиск учётных записей, владельцы которых потенциально занимаются злонамеренной деятельностью. В заявлении сказано, что в одном из таких случаев пользователь ChatGPT генерировал новостные статьи на испанском языке с целью очернить США. Эти материалы впоследствии публиковались новостными изданиями в Латинской Америке от имени китайской компании.

Во втором случае злоумышленники, предположительно связанные с Северной Кореей, использовали искусственный интеллект для создания резюме и онлайн-профилей фиктивных соискателей с целью трудоустройства в западные компании. Также была выявлена группа аккаунтов, принадлежащих пользователям из Камбоджи и связанных с финансовым мошенничеством. Они использовались для перевода и публикации комментариев в разных соцсетях, включая X и Facebook.

Правительство США выразило обеспокоенность тем, что Китай якобы использует искусственный интеллект для контроля над общественным мнением в стране, а также распространения дезинформации и подрыва безопасности США и их союзников. Напомним, ChatGPT от OpenAI является самым популярным ИИ-ботом с 400 млн еженедельно активных пользователей. Компания ведёт переговоры о привлечении инвестиций в размере до $40 млрд при оценке OpenAI в $300 млрд, что может стать рекордным раундом финансирования для частной компании.

«Нам просто нужно больше мощностей»: OpenAI постепенно поборет зависимость от Microsoft

OpenAI в разработке новых ИИ-моделей и предоставлении ИИ-услуг компаниям и пользователям сейчас в значительной степени полагается на вычислительные мощности своего главного акционера Microsoft. Однако в ближайшие пять лет ожидаются значительные изменения в этом вопросе, сообщило в пятницу издание The Information.

 Источник изображения: Growtika/unsplash.com

Источник изображения: Growtika/unsplash.com

По данным The Information, к 2030 году OpenAI рассчитывает получать три четверти вычислительных мощностей ЦОД от проекта Stargate, который будет в значительной степени финансироваться конгломератом SoftBank — одним из новых инвесторов OpenAI. Это означает существенное изменение во взаимоотношениях OpenAI с Microsoft, инвестировавшей в компанию с 2019 года почти $14 млрд.

Изменение не произойдёт мгновенно, пишет The Information. В ближайшие несколько лет OpenAI продолжит увеличивать расходы на оплату вычислительных мощностей ЦОД, принадлежащих Microsoft.

По данным The Information, в 2027 году OpenAI планирует потратить на свои разработки $20 млрд. Для сравнения, расходы компании в 2024 году составили $5 млрд. Согласно прогнозам OpenAI, к 2030 году её затраты на работу уже обученных моделей (инференс) моделей ИИ превысят расходы на их обучение.

Когда был анонсирован проект Stargate, один из пользователей соцсети X отметил, что дружбе между OpenAI и Microsoft пришёл конец. В ответ глава OpenAI Сэм Альтман (Sam Altman) заявил: «Вовсе нет! Это очень важное и крупное партнёрство на длительное время». Он также добавил: «Нам просто нужно больше вычислительных мощностей».

Microsoft, в свою очередь, утверждает, что отношения между двумя компаниями остаются прочными. Она продолжит размещать сервисы OpenAI на своей платформе облачных вычислений Azure. Вместе с тем Microsoft инвестировала в её французского конкурента Mistral AI и предлагает модели Meta Llama на платформе Azure. В прошлом году Microsoft добавила поддержку модели Anthropic — конкурента OpenAI — своему ИИ-ассистенту GitHub Copilot для помощи программистам в написании кода.

Apple выпустила первую бету iOS 18.4, в которой появились «приоритетные уведомления»

Apple выпустила адресованные разработчикам бета-версии очередных обновлений своих платформ. В предварительном варианте iOS 18.4 появились «приоритетные уведомления» (Priority Notifications), являющиеся частью из пакета Apple Intelligence: запущенная локально модель искусственного интеллекта анализирует поступающие уведомления и пытается определить наиболее важные, чтобы система показала их над другими.

 Источник изображения: apple.com

Источник изображения: apple.com

По умолчанию приоритетные уведомления отключены, функция активируется в настройках — там есть соответствующая опция. Подробностей об обновлённом голосовом ассистенте Siri в Apple пока не привели. «В ближайшие месяцы Apple Intelligence продолжит дополняться новыми функциями, в том числе новыми возможностями Siri», — гласит лаконичное замечание в пресс-релизе компании.

Также Apple объявила, что Apple Intelligence с обновлением iOS 18.4 станет доступна на нескольких языках, включая французский, немецкий, итальянский, португальский (Бразилия), испанский, японский, корейский и упрощённый китайский, а также локализованный английский для Сингапура и Индии. Пользователи из ЕС впервые получат доступ к функциям «Яблочного интеллекта».

Apple вместе с iOS 18.4 выпустила бета-версии iPadOS 18.4, macOS 15.4, tvOS 18.4, visionOS 2.4 и watchOS 11.4. В обновлённых iOS и iPadOS появилась возможность выбирать установленное по умолчанию приложение для перевода; пользователям из Европы, где действует «Закон о цифровых рынках» (DMA) также доступен выбор навигационного приложения по умолчанию.

С выходом iOS 18.4 владельцы Vision Pro могут прямо на iPhone изучать магазин приложений для гарнитуры, добавлять видео для просмотра и удалённо устанавливать приложения. На Mac и iPad вышел переработанный почтовый клиент, а в Apple News Plus для iPhone и iPad появился кулинарный раздел с «десятками тысяч рецептов», отформатированных для просмотра на мобильных устройствах.

Meta✴ рассказала, как скачивать контент через торренты, но не стать пиратом

Компанию Meta недавно обвинили в пиратстве терабайтов книг в связи с использованием для обучения ИИ-моделей контента из теневых библиотек. В ответ компания заявила, что не считает себя пиратом, поскольку нет доказательств того, что она раздавала защищённый авторским правом контент через торренты. Поэтому в компании считают, что обвинения в нарушении авторских прав не имеют под собой основания, пишет Tom's Hardware.

 Источник изображения: Glenn Carstens-Peters/unsplash.com

Источник изображения: Glenn Carstens-Peters/unsplash.com

В судебном процессе по иску писателя Ричарда Кадри (Richard Kadrey) против Meta авторы книг и владельцы авторских прав на контент настаивают на том, что Meta была «осознанным участником незаконной пиринговой сети» и действовала без заключения предварительных лицензионных соглашений. Для загрузки данных из теневых библиотек компания использовала протокол BitTorrent, который предполагает одновременную раздачу контента другим пользователям. По мнению стороны обвинения, это означает распространение пиратских материалов.

В свою очередь, Meta сообщила в документе, направленном в суд на этой неделе, что, хотя она загрузила 82 Тбайт контента, защищённого авторским правом, из теневых библиотек для обучения своих моделей ИИ LLaMA, её сотрудники «приняли меры предосторожности, чтобы не “раздавать” загруженные файлы».

Защита компании строится на том, что в настоящее время нет никаких доказательств того, что она делилась скачанным контентом во время процесса торрентирования. При этом Майкл Кларк (Michael Clark), руководитель Meta, отвечающий за управление проектами, сообщил в суде, что параметры конфигурации торрента были изменены «таким образом, чтобы раздача была минимальной». Когда судья спросил, почему Meta решила минимизировать раздачу, юристы компании воспользовались положением о клиентско-адвокатской тайне, позволив Кларку оставить этот вопрос без ответа.

Кроме того, Meta пока не ответила на вопросы о том, знала ли она, что данные передавались другим пользователям во время загрузки контента из теневых библиотек.

«Небольшой, но искренний прогресс»: DeepSeek откроет для всех пять ИИ-репозиториев

Китайский стартап DeepSeek объявил, что на следующей неделе сделает код своих моделей доступным для всех пользователей, подтвердив свою приверженность открытому исходному коду для технологий ИИ.

 Источник изображения: Solen Feyissa/unsplash.com

Источник изображения: Solen Feyissa/unsplash.com

Компания сообщила в соцсети X, что откроет исходный код пяти репозиториев, назвав это «небольшим, но искренним прогрессом», которым она делится «с полной прозрачностью». «Эти скромные строительные блоки в нашем онлайн-сервисе были задокументированы, развёрнуты и проверены на практике в производственной среде», — говорится в публикации DeepSeek.

DeepSeek выпустила в прошлом месяце Open Source-модель DeepSeek R1 со способностью к размышлению, способную соперничать с ИИ-системами американских компаний по производительности, хотя на её создание ушло гораздо меньше средств. Это заставило инвесторов более критично относиться к отчётам разработчиков в сфере ИИ о затратах на развёртывание новых моделей.

Приверженность DeepSeek открытому исходному коду отличает её от большинства фирм в сфере ИИ в Китае, которые, как и их американские конкуренты, предпочитают предлагать на рынке модели с закрытым исходным кодом, пишет Reuters.

Основатель DeepSeek Лян Вэньфэн (Liang Wenfeng) сообщил в интервью китайским СМИ в июле прошлого года, что компания не считает коммерциализацию своих моделей ИИ приоритетом, и что открытый исходный код может стать своего рода «мягкой силой». «Когда другие следуют за вашими инновациями, это даёт глубокое чувство выполненного долга», — сказал Лян.

Репозитории с открытым исходным кодом предоставят инфраструктуру для поддержки моделей ИИ, которыми DeepSeek уже публично поделилась, на основе существующих фреймворков Open Source-моделей.

Ранее на этой неделе DeepSeek представила новый алгоритм Native Sparse Attention (NSA), разработанный для повышения эффективности обучения и инференса ИИ-моделей при обширном контексте.

Чат-бот DeepSeek является самым популярным в Китае с 22,2 млн ежедневных активных пользователей по состоянию на 11 января, по данным Aicpb.com, что превышает 16,95 млн пользователей китайской платформы Douban.

DeepSeek разогнали до рекордной скорости всего на 16 чипах SambaNova — чипов Nvidia потребовалось бы в 20 раз больше

Стартап в области искусственного интеллекта SambaNova Systems, основанный в 2017 году выходцами из Sun, Oracle и Стэнфордского университета, объявил о создании самой быстрой в мире системы для развёртывания модели DeepSeek-R1 671B. Для оборудования Nvidia такие показатели недоступны.

 Источник изображения: sambanova.ai

Источник изображения: sambanova.ai

SambaNova добилась скорости работы DeepSeek-R1 в 198 токенов в секунду всего на 16 специально изготовленных ускорителях — аналогичного результата можно достичь, только развернув 40 стоек с 320 графическими процессорами Nvidia. «SambaNova на чипах SN40L RDU стала самой быстрой платформой для запуска DeepSeek. Это пятикратный прирост по сравнению со скоростью новейшего графического процессора на одной стойке, а к концу года мы предложим 100-кратную ёмкость для DeepSeek-R1», — пообещал соучредитель и генеральный директор SambaNova Родриго Лян (Rodrigo Liang).

Ресурсоёмкие рабочие нагрузки систем искусственного интеллекта традиционно обеспечиваются графическими процессорами Nvidia, но в SambaNova утверждают, что созданная компанией конфигурируемая архитектура потока данных представляет собой более эффективное решение. Её оборудование работает втрое быстрее и потребляет в пять раз меньше энергии, чем самые мощные из современных графических процессоров, сохраняя при этом полную вычислительную мощность модели DeepSeek-R1. Достижение подтвердили эксперты компании Artificial Analysis, которая проводит независимую оценку систем ИИ.

Открытая модель DeepSeek-R1 671B доступна в облаке SambaNova через API. Компания активно наращивает мощности и в ближайшем будущем надеется достичь общей пропускной способности в 20 000 токенов в секунду.

Microsoft представила ИИ-агента Magma для управления приложениями и реальными роботами

Разработчики из Microsoft Research представили мультимодальную языковую ИИ-модель Magma, которая способна обрабатывать визуальные и текстовые данные для управления программными интерфейсами и роботизированными системами. Если алгоритм после тестирования выйдет за пределы Microsoft, то это может стать важным шагом на пути к созданию универсального мультимодального ИИ, способного работать как в цифровом, так и в реальном пространстве.

 Деомнтсрация того, как Magma управляет роботизированной рукой / Источник изображения: Microsoft Research

Демонстрация того, как Magma управляет роботизированной рукой / Источник изображения: Microsoft Research

Microsoft утверждает, что Magma является первой ИИ-моделью, которая способна не только обрабатывать мультимодальные данные (например, текст, изображения, видео), но и умеет выполнять действия на их основе, будь то навигация по пользовательскому интерфейсу или манипулирование физическими объектами. Разработка алгоритма Magma велась совместными усилиями разработчиков из Microsoft, KAIST, Университета Мэриленда, Висконсинского университета в Мэдисоне и Университета Вашингтона.

Ранее уже были реализованы проекты в сфере робототехники, основой которых становились большие языковые модели (LLM). К таким работам можно отнести проекты PALM-E и RT-2 от Google или ChatGPT for Robotics от Microsoft, где ИИ-системы были задействованы для управления программными интерфейсами.

 Комбинированный график, демонстрирующий возможности Magma / Источник изображения: Microsoft Research

Комбинированная схема, демонстрирующая возможности Magma / Источник изображения: Microsoft Research

В отличие от многих уже созданных мультимодальных алгоритмов, требующих использования отдельных моделей для восприятия и управления, в Magma эти способности объединены внутри единой базовой ИИ-модели. Microsoft позиционирует Magma, как существенный шаг на пути создания единого ИИ-агента, т.е. системы, способной автономно разрабатывать планы действий и выполнять многоэтапные задачи от имени человека, а не просто отвечать вопросы о том, что она видит.

«Учитывая описанную цель, Magma способна формулировать планы и выполнять действия для их достижения. Эффективно передавая знания, извлекаемые из свободно доступных визуальных и языковых данных, Magma объединяет вербальный, пространственный и временной алгоритмы для навигации по сложным задачам и обстановке», — говорится в сообщении исследователей из Microsoft.

 Источник изображения:  Microsoft Research

Источник изображения: Microsoft Research

ИИ-модель Magma включает в себя два технических компонента: Set-of-Mark (идентифицирует объекты, которыми можно манипулировать в среде, присваивая цифровые метки интерактивным элементам, таким как нажимаемые кнопки в пользовательском интерфейсе или захватываемые объекты в рабочем пространстве роботов) и Trace-of-Mark (позволяет алгоритму выполнять такие задачи, как навигация по пользовательским интерфейсам или управление роботизированными руками для захвата и перемещения объектов).

Один из участников проекта рассказал, что название алгоритма Magma расшифровывается как M(ultimodal) Ag(entic) M(odel) at Microsoft (Rese)A(rch). В описании алгоритма Microsoft утверждает, что Magma-8B демонстрирует конкурентоспособные результаты в бенчмарках, показывая высокие результаты в задачах навигации по пользовательскому интерфейсу и манипулировании роботами.

Так в бенчмарке VQAv2 алгоритм Magma получил 80,0 баллов за визуальные ответы на вопросы, что выше результата GPT-4V (77,2 балла), но ниже показателя LLaVA-Next (81,8 балла). Показатель алгоритма POPE в 87,4 балла в настоящее время является абсолютно лучшим среди ИИ-моделей, участвовавших в сравнении. Отмечается, что в сфере манипулирования роботами Magma превосходит OpenVLA.

 Источник изображения: Microsoft Research

Источник изображения: Microsoft Research

По заявлениям разработчиков, Magma отличается от аналогов вроде GPT-4V тем, что выходит за рамки так называемого «вербального интеллекта» и включает в себя «пространственный интеллект», т.е. возможность планирования и выполнения действий. Обучаясь на смеси изображений, видео, робототехнических данных и взаимодействий с пользовательским интерфейсом, Magma, по сути, является полноценным мультимодальным ИИ-агентом, а не просто перцептивной моделью.

Как и все ИИ-модели, Magma не совершенна. Документация Microsoft указывает на то, что алгоритм по-прежнему сталкивается с техническими ограничениями при принятии сложных пошаговых решений, требующих многократного выполнения действий в течение определённого времени. Microsoft продолжает работать над улучшением алгоритма. Софтверный гигант намерен выложить исходный код Magma и другую документацию на GitHub, чтобы сторонние исследователи могли использовать эти наработки для реализации собственных проектов.

В России наметился дефицит электроэнергии для обучения ИИ

В России может возникнуть недостаток электроэнергии для обучения отечественных моделей искусственного интеллекта, сообщают «Ведомости» со ссылкой на заявление директора по развитию технологи ИИ в «Яндексе» Александра Крайнова.

 Источник изображения: NASA / unsplash.com

Источник изображения: NASA / unsplash.com

Дефицит электроэнергии наблюдается как в мировом масштабе, так и в России, отметил господин Крайнов. В современных реалиях запуск крупных центров обработки данных (ЦОД) становится всё более сложной задачей. Российские компании, которые обучают ИИ с нуля, для экономии ресурсов повторно используют результаты ранее проведённых вычислений. Важнейшей задачей остаётся не только обучение ИИ-моделей, но и инференс — запуск уже обученных систем, добавил директор центра продвинутой аналитики «Альфа-банка» Алексей Каширин.

За последние 10 лет лидеры рынка инвестировали в сферу ИИ не менее 650 млрд руб., подсчитали в ассоциации «Финтех». Данных по российскому рынку ИИ за 2024 год ещё нет, но, по оценкам, речь идёт о сумме порядка 780 млрд руб. с учётом роста на 30 %. В 2025 году этот показатель, по прогнозам правительства России, достигнет 1 трлн руб.

Крупнейшими разработчиками собственных ИИ-моделей в России являются «Яндекс» и «Сбер». В арсенале первой значатся YandexGPT и «Шедеврум», а второй — GigaChat и Kandinsky. МТС, «Т-Банк» и несколько других компаний дообучили открытые модели ИИ. Небольшое число корпоративных разработчиков и энтузиастов также обучили малые модели для собственных нужд.

У крупных компаний есть собственные центры обработки данных, однако объекты, на которых развивается ИИ, потребляют больше электроэнергии. Стандартная серверная стойка для задач, не связанных с ИИ, потребляет 5–10 кВт, тогда как оборудование для ИИ может требовать до 40 кВт на стойку.

 Источник изображения: Taylor Vick / unsplash.com

Источник изображения: Taylor Vick / unsplash.com

Учитывая дефицит мест в коммерческих ЦОД, многие крупные компании за последние три года были вынуждены заняться строительством собственных мощностей. В коммерческих ЦОД России на сегодняшний день установлено более 82 000 серверных шкафов, при этом годовой рост в 2024 году составил 17 %, подсчитали в ГК Softline. Количество корпоративных ЦОД значительно выше.

Потребление электроэнергии отечественными дата-центрами по состоянию на апрель 2024 года составляло около 2,6 ГВт, что эквивалентно 1 % установленной мощности Единой энергосистемы (ЕЭС) России. Если учитывать американский опыт, рост потребления в этом сегменте может составлять 30–40 % в год.

На начало 2025 года установленная мощность электростанций ЕЭС России составляла 263,7 ГВт, а максимальное потребление, зафиксированное в январе 2024 года, достигало 168,3 ГВт, что говорит о наличии запаса мощности. Однако из-за промышленного производства, криптовалютного майнинга и роста энергопотребления в отдельных регионах возможен дефицит — в первую очередь на юге России, в Сибири и на Дальнем Востоке. По прогнозам, на юго-востоке Сибири в 2025–2030 годах нехватка мощности может составить до 2,9 ГВт, аналогичный дефицит ожидается и в Объединённой энергосистеме Юга.

Таким образом, в масштабах страны проблем с выработкой электроэнергии нет, однако существуют сложности с её доставкой и распределением. В мегаполисах возможна точечная нехватка электроэнергии, тогда как в регионах, напротив, сохраняется профицит. Это создаёт предпосылки для развития инфраструктуры ЦОД в регионах, хотя на данный момент массового переноса дата-центров не ожидается.

Спрос на мощности ЦОД сегодня превышает предложение. По оценкам экспертов, на поиск места для строительства крупного объекта мощностью 60 МВт может уйти до трёх лет. В Москве, по различным данным, осталось около 50 МВт свободных мощностей, которых хватит на 2–4 крупных коммерческих ЦОД. В южной части энергосистемы Московского региона к 2030 году дефицит, по данным оператора ЕЭС, может достигнуть 564 МВт, а к 2042 году — уже 3,15 ГВт.

Стартап Figure продемонстрировал, как его человекоподобные роботы справляются с бытовыми делами

Две недели назад американская компания Figure AI отказалась от сотрудничества с OpenAI, и вчера продемонстрировала способность своих человекоподобных роботов понимать команды на естественном языке, обрабатываемые VLA-моделью Helix.

 Источник изображений: Figure AI

Источник изображений: Figure AI

VLA-модель представляет собой комбинацию системы машинного зрения и большой языковой модели, позволяющую обучать роботов различным операциям по комбинации зрительных образов и языковых команд. На практике это приводит к тому, что обучаемые роботы могут по команде манипулировать предметами, которые они ранее никогда не видели. Получая голосовую команду в естественной форме, робот начинает визуально анализировать окружение и потом выполняет поставленную задачу с учётом результатов анализа обстановки.

Модель Helix позволяет роботам Figure работать в паре и взаимодействовать друг с другом при выполнении бытовых операций. Подразумевается, что в быту роботы могут работать парами, помогая друг другу и повышая производительность труда. Figure демонстрирует возможности своих роботов 02 в типичном бытовом интерьере, который традиционно считается очень сложной для роботов средой. Производителям гораздо проще создавать роботов, которые будут работать в более контролируемом и предсказуемом промышленном окружении. Соответственно, появление на рынке «дееспособных» домашних человекоподобных роботов считается более отдалённой перспективой.

Обучение роботов выполнению бытовых операций требует существенных затрат на разработку программного обеспечения или тысяч экспериментов. Запрограммировать их вручную в данном случае не представляется возможным, а потому единственным способом создать помогающих в быту роботов является их самообучение. В домашней среде слишком много переменных, с которыми роботам предстоит столкнуться, поэтому совершенствование профильного ПО потребует существенных затрат времени.


window-new
Soft
Hard
Тренды 🔥
Тайвань наложил экспортные ограничения на китайские компании Huawei и SMIC 2 ч.
Администрация Трампа решила разобраться в госконтрактах со SpaceX, чтобы узнать, как лишить Маска финансирования 10 ч.
AMD представила Pensando Pollara 400 — первую 400-Гбит/с сетевую карту стандарта Ultra Ethernet 11 ч.
Asus ROG Astral GeForce RTX 5090 Dhahab Edition с автографом Дженсена Хуанга продали на аукционе за $24 200 12 ч.
Китайские учёные изготовили уникальный радиотелескоп для исследования тёмной энергии 13 ч.
Тайвань отправил в тюрьму капитана китайского судна, обвинив его в умышленном повреждении подводного кабеля 13 ч.
Intel выпустит недорогой шестиядерник Core 5 120F для платформы LGA 1700 13 ч.
Apple внесла iPhone XS в список винтажных гаджетов 14 ч.
AWS переведёт ещё 100 дата-центров на использование очищенных сточных вод для охлаждения 16 ч.
В Калифорнийском университете попробовали охлаждать процессоры мокрой тряпкой и добились теплоотвода 800 Вт 16 ч.