Сегодня 18 декабря 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → ии
Быстрый переход

Xiaomi выпустила «самую мощную LLM с открытым исходным кодом для программной инженерии» — MiMo-V2-Flash

Xiaomi сообщила о выпуске бесплатной и открытой модели искусственного интеллекта MiMo-V2-Flash. Её отличают высокие мощность, эффективность и скорость — модель хорошо проявляет себя в сценариях с рассуждениями, программированием и работы в качестве ИИ-агента. Это отличный универсальный помощник для повседневных задач, утверждает разработчик.

 Источник изображений: mimo.xiaomi.com

Источник изображений: mimo.xiaomi.com

ИИ-модель MiMo-V2-Flash доступна для пользователей по всему миру на платформе Hugging Face, в инфраструктуре Google Cloud AI Studio, а также на собственной платформе Xiaomi для разработчиков. MiMo-V2-Flash имеет архитектуру «смеси экспертов» — её общий размер составляет 309 млрд параметров, из которых активны только 15 млрд. Ещё один механизм оптимизации — гибридный механизм полного внимания (Global Attention), при котором охватываются все токены контекста, и скользящего окна (Sliding Window Attention), предусматривающего учёт только текущего и соседних с ним токенов. Он реализуется в соотношении 1:5 — если провести параллель, модель при ответе основную часть времени смотрит себе под ноги, но иногда осматривает и всю дорогу целиком. Это позволяет добиться скорости, сравнимой с механизмом скользящего окна, при точности почти как при чистом механизме полного внимания.

В стандартных тестах SWE-bench Verified и Multilingual, которые помогают оценить способности ИИ к разработке ПО, MiMo-V2-Flash, по утверждению Xiaomi, заняла первое место среди всех открытых моделей и выступила на уровне ведущих мировых моделей с закрытым кодом. В математическом AIME 2025 и междисциплинарном GPQA-Diamond она вошла в число двух лучших открытых моделей в мире. MiMo-V2-Flash поддерживает гибридную схему мышления, позволяя пользователям переключать модель между режимом рассуждения и форматом быстрых ответов. Поддерживается генерация полнофункциональных HTML-страниц в один клик; есть возможность интеграции со сторонними инструментами «вайб-кодинга», в том числе Claude Code, Cursor и Cline; длина контекстного окна составляет 256 тыс. токенов, что позволяет MiMo-V2-Flash выполнять задачи в течение нескольких сотен раундов взаимодействия с агентами и вызова сторонних инструментов.

Механизмы оптимизации помогли «разогнать» MiMo-V2-Flash до скорости ответа в 150 токенов в секунду — по субъективным ощущениям они выдаются почти мгновенно. В инфраструктуре Xiaomi при подключении через API стоимость работы с моделью составляет $0,1 за 1 млн входных и $0,3 за 1 млн выходных токенов. Помимо гибридного механизма полного внимания и скользящего окна, разработчик повысил скорость модели, обучив её генерировать по нескольку токенов одновременно (Multi-Token Prediction — MTP): первоначально они генерируются в черновом формате, проверяются и сразу могут направляться в ответ. На практике модель генерирует в среднем от 2,8 до 3,6 токенов параллельно, что помогает ускорить её работу на величину от 2,0 до 2,6 раза.

Ещё одно нововведение в Xiaomi развернули на этапе постобучения MiMo-V2-Flash — парадигму «динамической дистилляции знаний от группы наставников» (Multi-Teacher Online Policy Distillation — MOPD). Это значит, что ответы обучаемой модели оцениваются моделями-наставниками в реальном времени, причём последние дают свои рекомендации не по схеме «правильно или неправильно», а предлагают разбор ошибок. Обучаемая же модель при этом анализирует свои собственные ответы, а не действует в рамках заданных сценариев. Эта схема позволяет использовать всего 2 % вычислительных ресурсов по сравнению с традиционным сценарием обучения с подкреплением при тонкой настройке (SFT/RL). Кроме того, децентрализованная структура MOPD позволяет прошедшему обучение «ученику» впоследствии исполнять роль «наставника» — другими словами, модель непрерывно самосовершенствуется.

По совокупности тестов модель MiMo-V2-Flash демонстрирует результаты, сравнимые с показателями ведущих китайских систем K2 Thinking и DeepSeek V3.2 Thinking; причём в задачах с длинным контекстом нейросеть от Xiaomi превзошла значительно более крупную K2 Thinking, оправдав архитектуру скользящего окна. В тесте SWE-Bench Verified она набрала 73,4 %, обошла все открытые аналоги и выступила почти на уровне OpenAI GPT-5-High; в SWE-Bench Multilingual решила 71,7 % задач, подтвердив статус самой эффективной открытой модели для разработки ПО. В тестах τ²-Bench на работу в качестве отраслевого ИИ-агента она показала результаты в 95,3 баллов для телекоммуникационного направления, 79,5 для розничной торговли и 66,0 для авиакомпаний. В бенчмарке поисковых агентов BrowseComp она набрала 45,4 балла, а с учётом управления контекстом — 58,3. Веса модели, включая MiMo-V2-Flash-Base, доступны на Hugging Face по лицензии MIT, код для инференса (вывода) направлен разработчикам фреймворка SGLang.

Акции американских бигтехов обвалились после слухов о проблемах Oracle с финансированием проекта для OpenAI

Безудержный рост капитализации крупных игроков рынка ИИ до сих пор основывался на вере инвесторов в способность соответствующих проектов принести финансовую отдачу в отдалённом будущем. Запас оптимизма начал истощаться, и первыми сдались институциональные инвесторы. Вокруг Oracle начал формироваться неблагоприятный информационный фон, акции компании упали на 5,4 % потянули за собой остальной рынок.

 Источник изображения: Oracle

Источник изображения: Oracle

Издание Financial Times сегодня сообщило, что инвестиционный фонд Blue Owl Capital не намерен вкладывать средства в проект строительства центра обработки данных Oracle в штате Мичиган общей стоимостью $10 млрд. Опытным инвесторам из этого фонда не понравилась растущая долговая нагрузка Oracle, а также их смутили значительные расходы на инфраструктуру ИИ. В штате Мичиган должен был появиться ЦОД мощностью 1 ГВт, который Oracle планировала построить для нужд OpenAI. По имеющимся данным, переговоры с Blue Owl зашли в тупик, поставив под вопрос саму реализацию проекта.

Схема сделки предполагала, что дочерняя структура Blue Owl будет владеть ЦОД, сдавая его в лизинг для нужд Oracle и OpenAI соответственно. Новых инвесторов пока не нашлось, а Blue Owl от данного проекта оттолкнули не самые выгодные финансовые условия. Представители Oracle заявили, что застройщик в лице Related Digital выбрал источник финансирования, не имеющий отношения к Blue Owl, и переговоры по реализации проекта в Мичигане идут по плану. Напомним, что соглашение Oracle с OpenAI подразумевает расходы в размере $300 млрд на строительство ЦОД для инфраструктуры ИИ общей мощностью 4,5 ГВт в течение ближайших пяти лет.

К концу ноября сумма долговых обязательств Oracle выросла до $105 млрд, однако Morgan Stanley прогнозирует, что к 2028 году она увеличится до $290 млрд. Компания активно привлекает заёмные средства для реализации новейших инициатив, связанных с ИИ. Всего за три месяца сумма лизинговых контрактов Oracle выросла с $100 млрд до $248 млрд. Фонд Blue Owl ранее оказывал активное содействие Oracle в строительстве других ЦОД компании.

Техасский ЦОД, за который Oracle будет выплачивать средства Blue Owl в течение 15 лет, должен принести последней доходность в размере 25 %. На его строительство будет потрачено $15 млрд, в строй он будет введён в середине 2027 года и займётся обслуживанием инфраструктуры OpenAI. Финансированием строительства инфраструктуры для Meta✴ Platforms также занимается Blue Owl.

Акции Oracle упали в цене на 46 % после достижения пиковой стоимости в начале сентября, когда сооснователь компании Ларри Эллисон (Larry Ellison) на короткое время стал богатейшим человеком планеты. Акции Nvidia накануне потеряли в цене 3,8 %, у Alphabet снижение составило 3,1 %, а Broadcom своим не очень удачным отчётом не только способствовала снижению курса собственных акций на 4,5 %, но и повлияла на чужие. К слову, акции Micron при этом выросли в цене на 3,8 %, но этому способствовала собственная оптимистичная отчётность данного производителя памяти.

Азиатские фондовые рынки последовали за американским. Японский индекс Topix снизился на 0,4 %, южнокорейский Kospi упал на 1,2 %, а китайский CSI 300 просел на 0,3 %. Поддержку американскому индексу S&P 500 оказали действия властей США в отношении Венесуэлы, которые вызвали рост цен на нефть и сопутствующее повышение котировок акций компаний энергетического сектора. В результате данный индекс прибавил более 2 %.

OpenAI готовится привлечь до $100 млрд, увеличив капитализацию до $750 млрд

К аэрокосмической компании SpaceX Илона Маска (Elon Musk) появляются все шансы проиграть в «гонке капитализаций» за звание самого дорогого стартапа в мире, поскольку OpenAI готовится поднять планку до $750 млрд. По данным The Information, такой капитализации ИИ-стартап достигнет после готовящегося привлечения $100 млрд.

 Источник изображения: OpenAI

Источник изображения: OpenAI

Если переговоры о новом раунде финансирования завершатся успехом, то OpenAI сможет в полтора раза увеличить свою капитализацию относительно октябрьского уровня, когда она оценивалась в $500 млрд. Перед этим, как считается, у бывших и действующих сотрудников OpenAI появлялась возможность продать акций на $6,6 млрд.

Reuters при этом продолжает настаивать, что OpenAI готовится выйти на IPO, подав соответствующую заявку во второй половине следующего года. По итогам этого мероприятия капитализация стартапа может превысить $1 трлн. Пока инвесторы верят в перспективность тех технологий, что принято называть искусственным интеллектом в их нынешней реализации, многие участники рынка спешат воспользоваться возможностью для привлечения крупных сумм на своё развитие. Вчера также стало известно, что инвестором OpenAI может стать Amazon, которая наладит поставки фирменных ускорителей Trainium для нужд этого стартапа. Не исключено, что OpenAI традиционно обменяет свои акции на сумму $10 млрд в счёт оплаты таких поставок.

Вышла Gemini 3 Flash — новая базовая модель Google, которая лучше Gemini 2.5 Pro и доступна всем бесплатно

Компания Google выпустила ИИ-модель Gemini 3 Flash. Новинка вышла под слоганом «передовой интеллект, созданный для скорости по доступной цене». Gemini 3 Flash сохранила возможности сложных логических рассуждений модели Gemini 3, мультимодальность с пониманием визуальных данных, а также производительность в задачах агентного и визуального программирования, но с учётом «задержки, эффективности и стоимости уровня Flash».

 Источник изображений: Google

Источник изображений: Google

ИИ-модель Gemini 3 Flash превосходит 2.5 Flash по всем параметрам и «значительно» превосходит версию Gemini 2.5 Pro в нескольких тестах, включая MMMU Pro, Toolathlon и MPC Atlas. Google выделила следующие особенности ИИ-модели Gemini 3 Flash:

  • GPQA Diamond (научные знания) — точность 90,4 %;
  • Humanity’s Last Exam (академическое мышление) — эффективность 33,7 % без дополнительных инструментов;
  • MMMU Pro (мультимодальное понимание и рассуждение) — эффективность 81,2 %;
  • SWE-Bench Verified (агентное программирование) — эффективность 78 %;
  • Toolathlon (задачи разработки программного обеспечения в реальном мире с долгосрочным горизонтом) — точность 49,4 %;
  • MCP Atlas (многоэтапные рабочие процессы с использованием MCP) — эффективность 57,4 %.

Google утверждает, что Gemini 3 Flash «превосходит Gemini 2.5 Pro, будучи в 3 раза быстрее и при этом значительно дешевле». Использование сильного логического мышления, инструментов и мультимодальные возможности, реализованные в Gemini 3 Flash, обеспечивают «более сложный анализ видео, извлечение данных и визуальные вопросы и ответы» для сторонних разработчиков, создающих агентов поддержки клиентов или внутриигровых помощников.

Стоимость использования Gemini 3 Flash составляет $0,50 за входные токены и $3 за выходные токены (цена аудиозапроса составляет $1 за входные токены).

ИИ-модель Gemini 3 Flash уже доступна в приложении Gemini, где заменяет ИИ-модель Gemini 2.5 Flash в качестве модели по умолчанию. Компания позиционирует новую модель, как «значительное обновление вашего повседневного ИИ», который «стал умнее и быстрее».

«Вы можете быстро создавать интересные и полезные приложения с нуля, не имея предварительных знаний в программировании. Просто попросите Gemini помочь вам доработать идею. Вы можете на ходу диктовать поток мыслей и превращать их в прототип», — описывает Google возможности Gemini 3 Flash.

В Gemini 3 Flash доступен выбор из двух режимов работы: «Быстрый» — для оперативных ответов и «Глубокое размышление» — для решения сложных задач. Выпущенная в прошлом месяце ИИ-модель Gemini 3 Pro предназначена для более сложных математических задач и задач по программированию.

Gemini 3 Flash также внедряется по всему миру в качестве модели по умолчанию в режиме поиска ИИ (AI Mode). Модель позволяет задавать более тонкие и уточнённые вопросы. Google также сообщила, что модели Gemini 3 Pro с генеративным пользовательским интерфейсом и Nano Banana Pro стали доступны для всех пользователей в США.

«Gemini 3 Flash превосходно улавливает нюансы вашего запроса, извлекая в режиме реального времени локальную информацию и полезные ссылки со всего интернета и предоставляя продуманные, исчерпывающие ответы, которые легко воспринимаются визуально», — говорит Google.

Для разработчиков Gemini 3 Flash доступен в режиме предварительного просмотра через AI Studio, Google Antigravity, Gemini CLI и Android Studio. Для корпоративных пользователей новая ИИ-модель доступна через Vertex AI и Gemini Enterprise.

«В кадре появился кот»: умная IP-камера «Яндекса» научилась рассказывать о том, что видит

Умная IP-камера «Яндекса» получила новую функцию — анализ происходящего в кадре на основе искусственного интеллекта. Вместо простого сообщения, что обнаружено движение, устройство способно конкретизировать, что появился кот или другой объект. Интеллектуальный анализ можно включать в сценарии умного дома и запускать их, когда, например, «собака грызёт диван». Раз в сутки умная камера составляет сводку произошедшего за день и отправляет её владельцу.

 Источник изображений: «Яндекс»

Источник изображений: «Яндекс»

Теперь обо всём происходящем в кадре камера «Яндекса» сообщает человеку — она может конкретно определить, что, к примеру, вернулись домой дети; все эти записи сохраняются в архиве, чтобы можно было оперативно найти интересующее. Распознанные ИИ события в кадре можно привязывать к сценариям умного дома — их можно задать своими словами в приложении «Дом с Алисой». Так, если ребёнок просыпается ночью, включается ночник; когда появляется собака, включается автоматическая поилка; а если домашнее животное запрыгивает на диван, снимок отправляется владельцу. Каждый день ИИ генерирует составленную из описаний сводку событий за день и отправляет уведомление через приложение «Дом с Алисой» — посмотреть отчёт можно в карточке устройства.

За анализ происходящего в кадре отвечает визуально-языковая модель «Яндекса» Alice AI VLM. Она обучена на большом объёме визуальной и текстовой информации, за счёт чего ориентируется в происходящем в кадре. Ранее эта технология уже начала использоваться в «живом» режиме «Алисы» для подписчиков «Алисы Плюс». ИИ-описания, архивы записей и автоматические сводки доступны подписчикам тарифа «Стандарт»; чтобы воспользоваться остальными функциями, потребуется вариант «Экстра». Некоторые функции, которые ранее были доступны только по платной подписке, теперь работают бесплатно — например, слежение за человеком в кадре, фотоснимок при обнаружении движения, а также создание снимка по сценарию или расписанию.

Инвесторы сходят с ума от ИИ: акции разработчика ИИ-чипов MetaX взлетели в восемь раз сразу после IPO

Публичное размещение акций является традиционным способом привлечения капитала, и для китайских разработчиков ИИ-чипов сейчас наступил благоприятный период для выхода на IPO, поскольку диктуемый властями страны курс на импортозамещение сулит высокий спрос на их продукцию. Акции MetaX вслед за первичным размещением на бирже выросли в цене на 700 %, подтверждая эту традицию.

 Источник изображения: MetaX

Как уже отмечалось ранее, конкурирующая Moore Threads, которую считают китайским конкурентом Nvidia, недавно дебютировала на бирже, продемонстрировав рост котировок своих акций на 400 %. Основанная выходцем из AMD в 2020 году, MetaX разрабатывает не только ускорители вычислений на базе GPU, но и специализированные процессоры (ASIC). По итогам IPO ей удалось привлечь почти $600 млн, а количество желающих купить её акции в 4000 раз превысило доступную квоту. Пока стартап остаётся убыточным, но благодаря инициативам китайских властей в сфере импортозамещения ускорителей чипов планирует удвоить выручку в текущем году и выйти на безубыточность в следующем году. Пока MetaX контролирует не более 1 % китайского рынка компонентов для инфраструктуры ИИ.

Конкуренты тоже не стоят на месте. В конце ноября Moore Threads смогла привлечь $1,1 млрд, на этой неделе разрешение на размещение акций в Гонконге получила Biren Technology, а принадлежащая Baidu компания Kunlunxin также планирует разместить свои акции на этой площадке. В сегменте ASIC компании MetaX приходится конкурировать с Cambricon, HiSilicon (Huawei), Kunlunxin (Baidu) и T-Head (Alibaba). В сегменте GPU её конкурентами являются не только Moore Threads и Biren, но и Hygon Information Technology. Аналитики считают, что на фоне ажиотажа котировки акций новоиспечённых китайских эмитентов завышены, но в определённой перспективе даже покупка их акций по текущим ценам может себя оправдать.

Глава Larian подтвердил, что в разработке Divinity используется генеративный ИИ — фанаты в ярости, руководитель пытается объясниться

Глава Larian Studios Свен Винке (Swen Vincke) в интервью Bloomberg подтвердил, что в разработке амбициозной пошаговой ролевой игры Divinity используется генеративный ИИ. Анонс вызвал широкий общественный резонанс.

 Источник изображений: Larian Studios

Источник изображений: Larian Studios

По словам Винке, созданных с помощью ИИ материалов в Divinity не будет, однако студия активно (под его руководством) использует технологию на этапе изучения идей, при работе над концепт-артами, во внутренних презентациях и заглушках для текста.

Не все сотрудники Larian были рады идее внедрения нейросетей в рабочие процессы, но, если верить Винке, «к настоящему моменту все в компании более-менее довольны, как мы используем [ИИ]».

 Эффективность рабочих процессов в Larian применение ИИ существенно не повысило

Эффективность рабочих процессов в Larian применение ИИ существенно не повысило

Игроки и бывшие сотрудники Larian массово и жёстко раскритиковали Винке за продвижение ИИ в рабочих процессах — дошло даже до обвинений во лжи. «Проявите немного уважения к работникам. Это специалисты мирового уровня, и им не нужна помощь ИИ для генерации великолепных идей», — считает экс-художница студии.

Винке в комментарии для IGN поспешил уточнить, что Larian не пытается заменить труд людей нейросетями — применение ИИ в студии направлено на облегчение жизни сотрудников и не мешает компании дальше нанимать художников и сценаристов.

 На настоящий момент в Larian трудится 72 художника, и 23 из них специализируется на концепт-артах

На настоящий момент в Larian трудится 72 художника, и 23 из них специализируется на концепт-артах

У себя в микроблоге Винке добавил, что студия использует ИИ лишь на самом раннем этапе разработки — при изучении референсов, для создания «грубых набросков, которые затем заменяем оригинальными эскизами».

«Мы наняли творческих людей за их талант, а не способность выполнять то, что говорит машина. Но они могут экспериментировать с этими инструментами, чтобы облегчить себе жизнь», — заключил Винке.

Apple готовит собственные ИИ-чипы для серверов — Broadcom стала помощником в их создании

История компании Apple показывает, что она изначально внедряет новые технологии, полагаясь на компоненты сторонних поставщиков, но когда рынок формируется и крепнет, переходит к их замене на чипы собственной разработки. В случае с чипами для вычислительной инфраструктуры ИИ, как ожидается, Apple полагается на сотрудничество с Broadcom.

 Источник изображения: Broadcom

Источник изображения: Broadcom

Напомним, последняя из компаний в последнее время активно привлекает новых клиентов на направление специализированных чипов для инфраструктуры ИИ. Помимо Google, взаимодействовать на этом направлении Broadcom готова и с Anthropic, а ещё руководство этого поставщика чипов недавно пояснило, что количество профильных клиентов достигло четырёх, а в прошлом квартале к ним присоединился пятый. Его имя до сих пор не названо, но некоторые источники полагают, что Apple также может обратиться за помощью к Broadcom для разработки ИИ-чипов для собственной инфраструктуры.

Издание Economic Daily News упоминает условное обозначение первого специализированного чипа Broadcom — «Baltra», который ляжет в основу центров обработки данных Apple, запланированных к введению в строй с 2027 года. Контрактным производством специализированных серверов займётся Foxconn, а сама Apple будет использовать их для развития фирменного сервиса Apple Intelligence. Даже с учётом бурного развития контрактного бизнеса Foxconn по выпуску ИИ-серверов, Apple продолжает оставаться крупнейшим клиентом этой тайваньской компании, но благодаря заказам на выпуск традиционной потребительской электроники.

Отдельно сообщается, что пока Apple предпочитает осуществлять экспансию этого сервиса осторожно. Языковая модель Google Gemini, которая будет обслуживать клиентов Apple, насчитывает не более 3 трлн параметров. По условиям договорённостей между Apple и Google, первая будет платить второй ежегодно около $1 млрд за доступ к данной модели.

Если говорить о контрактном бизнесе Foxconn, то на направлении серверных систем на основе специализированных чипов (ASIC) она должна удвоить объёмы их выпуска в текущем году, но на GPU-системы будет приходиться до 80 % заказов. Тайваньский подрядчик контролирует примерно 40 % мирового рынка услуг по выпуску серверов для инфраструктуры ИИ.

OpenAI выпустила генератор изображений ChatGPT Images 1.5 — более высокая скорость и новые возможности

На прошлой неделе OpenAI выпустила модель искусственного интеллекта GPT-5.2, а теперь она стала основой фирменного генератора изображений ChatGPT Images 1.5. По словам разработчиков, это позволило в четыре раза повысить скорость работы сервиса по сравнению с предыдущей версией, а также реализовать несколько полезных нововведений.

 Источник изображения: ChatGPT Images

Источник изображения: ChatGPT Images

ChatGPT Images стал лучше следовать пользовательским инструкциям, в том числе в случаях, когда дело доходит до редактирования только что созданного изображения. Пользователь может попросить алгоритм добавить, убрать, объединить, смешать или даже перенести какие-то элементы на картинке. OpenAI заявила, что обновлённый ChatGPT Images лучше справляется с отображением текста, что традиционно является слабым местом многих генераторов изображений. По данным OpenAI, повысилось качество генерации читаемого текста, а также появилась возможность работы с более мелким и плотным тестом.

В рамках этого обновления фирменного генератора изображения OpenAI добавила в боковую панель ChatGPT отдельный раздел Images. В нём собраны готовые к использованию фильтры и промпты, призванные помочь в поиске вдохновения. «Мы считаем, что всё ещё находимся в самом начале пути к тому, что может дать генерация изображений. Сегодняшнее обновление — это значительный шаг вперёд, и впереди нас ждёт многое: от более детальных правок до более насыщенных и подробных результатов на разных языках», — говорится в сообщении OpenAI.

Разработчики приступили к развёртыванию ChatGPT Images 1.5 и в скором времени обновлённая версия сервиса станет доступна всем пользователям. Отмечается, что пользователи также смогут продолжить взаимодействие с моделью GPT-4o через пользовательский интерфейс чат-бота компании.

Новый ChatGPT Images появляется как раз в тот момент, когда его главный конкурент Google Nano Banana Pro вызвал всплеск популярности Gemini среди пользователей. В октябре Google заявила, что пользовательская база фирменного чат-бота выросла до 650 млн человек, что существенно больше 450 млн человек, о которых компания сообщала в июле. Nano Banana Pro оказалась настолько популярной, что Google для снижения нагрузки на инфраструктуру пришлось ограничить бесплатных пользователей всего двумя генерациями изображений в день. Для OpenAI, вероятно, было не столь важно дать сильный ответ на появление Nano Banana Pro, сколько обеспечить сильную конкуренцию чат-боту Gemini 3 Pro. Это связано с тем, что наличие в арсенале компании ChatGPT Images является одним из основных факторов, обеспечивающих ИИ-боту ChatGPT пользовательскую базу в 800 млн человек.

Властелин ИИ: OpenAI затягивает Amazon в свою игру кольцевых инвестиций

С точки зрения схем финансирования нынешнего бума ИИ стартап OpenAI вполне можно считать «властелином колец», поскольку он сосредоточил вокруг себя сделки с кольцевым принципом передачи средств и взаимными зависимости. Сама OpenAI при этом особо ничем не рискует, привлекая средства партнёров под обещания светлого будущего. Amazon может стать очередным инвестором OpenAI и поставщиком своих чипов.

 Источник изображения: Amazon

Источник изображения: Amazon

По крайней мере, об этом на текущей неделе сообщили The Information и Reuters, используя независимые источники. По имеющимся данным, OpenAI ведёт переговоры о сотрудничестве с Amazon, которая может либо вложить в капитал первой до $10 млрд, либо просто ограничиться поставками своих ускорителей Trainium для нужд инфраструктуры OpenAI. Недавно прошедшая реструктуризация стартапа открыла перед ним больше возможностей по поиску инвесторов, помимо Microsoft, которая владеет 27 % акций стартапа.

Облачные гиганты, включая Google и AWS (Amazon) давно разрабатывают собственные чипы для ускорения вычислений, и на фоне бума ИИ интерес к ним начали проявлять профильные стартапы. Например, ускорителями TPU заинтересовался не только Anthropic, но и конкурирующая с Google компания Meta✴ Platforms. Как теперь сообщается, ускорители Trainium компании Amazon могут найти применение в ИИ-инфраструктуре OpenAI.

Отдельно отмечается, что инвестиции Amazon в OpenAI могут поднять капитализацию последней до отметки более $500 млрд. Это повышает шансы OpenAI на успех в негласной борьбе с SpaceX Илона Маска (Elon Musk) за статус самого дорогого в мире стартапа. Принято считать, что в перспективе OpenAI выйдет на IPO, и тогда капитализация разработчика ChatGPT вырастет до $1 трлн. Представители компании пока наличие планов по выходу на биржу не подтверждают. В случае, если сделка с Amazon состоится, наличие такого весомого инвестора будет способствовать привлечению средств в капитал OpenAI из других источников. Не исключено, что ChatGPT также будет каким-то образом интегрирован в собственные информационные сервисы Amazon, включая услуги по поиску товаров на одноимённой торговой площадке.

Google запустила ИИ-агента, который избавит от утренней проверки почты и календаря

Разработчики из Google хотят сделать так, чтобы люди по всему миру начинали свой день с взаимодействия с её искусственным интеллектом. Для этого поисковый гигант запустил экспериментального ИИ-агента, который будет анализировать электронные письма пользователей, календарь и документы, чтобы каждое утро отправлять в почту краткую сводку на основе проведённого анализа.

 Источник изображения: Google

Источник изображения: Google

Новая функция под названием CC каждое утро направляет в почтовый ящик пользователя ежедневную сводку под названием «Ваш день впереди». Это персонализированный отчёт, который Google описывает, как «одно чёткое резюме», в котором содержится расписание на предстоящий день, а также все ключевые задачи, которые следует выполнить, и важная информация, например, о счетах, которые нужно оплатить, или встречах, к которым следует подготовиться. CC также может подготавливать черновики писем и делать ссылки в календарь на случай, если пользователь хочет приступить к выполнению задач прямо в начале дня.

ИИ-агент CC запускается в раннем доступе для платных подписчиков старше 18 лет в США и Канаде. Google также объявила о запуске списка ожидания для получения доступа к CC, записаться в который могут все желающие пользователи, соответствующие упомянутым критериям. Компания не уточнила, как долго доступ к ИИ-агенту будет предоставляться в таком формате и когда его доступность будет расширена.

Основой для CC стала ИИ-модель Gemini, которая анализирует данные пользователя из почты Gmail, «Календаря» и Google Диска, а также собирает информацию в интернете. Пользователь может сделать ИИ-агента более персонализированным, рассказывая ему о себе и давая задания на запоминание данных, а также отвечая на предоставляемые сводки или общаясь с ним напрямую.

ИИ почти самостоятельно разработал компьютер из 843 компонентов — Linux загрузился с первой попытки

Стартап из Лос-Анджелеса Quilter сообщил об успешном завершении проекта Speedrun: при участии искусственного интеллекта компания разработала двухплатный компьютер с 843 компонентами всего за одну неделю. Дистрибутив Debian на этом компьютере успешно загрузился с первого включения.

 Источник изображений: quilter.ai

Источник изображений: quilter.ai

Инженеры Quilter уверены, что показанный ими рабочий процесс сотрудничества человека и ИИ породит новое поколение производителей компьютерного оборудования. Проектирование печатных плат с помощью ИИ способно значительно сэкономить время: работа над проектом Speedrun заняла 38,5 часов времени у специалистов инженерных специальностей — без ИИ на это ушли бы 430 часов работы или около трёх месяцев.

Традиционный подход к проектированию подобных систем предполагает многократное повторение трёх этапов: постановки задачи, реализации и доводки с исправлением ошибок. Разработанная Quilter система оставляет человеку только первый и третий этапы, которые считаются творческими, а основную рутинную и трудоёмкую работу по реализации ИИ берет на себя, хотя он способен справляться также с первым и третьим этапами. Инженеры раскрывают свой творческий потенциал, получают возможность опробовать большее число проектов, а сами проекты выходят на рынок быстрее. Когда человек занимается первым и третьим этапами самостоятельно, он допускает ошибки, и тогда второй занимает ещё больше времени, что дополнительно задерживает весь проект.

Примечательно, что на ранних этапах ИИ Quilter не обучался на созданных людьми образцах плат, потому что при проектировании человек часто допускает ошибки, и разработчики не хотели ограничивать систему уровнем человеческого мышления. Долгосрочная цель компании — выстроить систему проектирования печатных плат, которая не просто будет соответствовать человеческому уровню, но и поможет в разработке «более совершенных плат, чем когда-либо пытались сделать люди», рассказал гендиректор Quilter Сергей Нестеренко — бывший инженер в SpaceX. Компания стремится запустить волную нового поколения стартапов в области оборудования, значительно снизив барьер для их выхода на рынок.

Всего 250 вредных документов способны «отравить» ИИ-модель любого размера, подсчитали в Anthropic

«Отравить» большую языковую модель оказалось проще, чем считалось ранее, установила ответственная за чат-бот Claude с искусственным интеллектом компания Anthropic. Чтобы создать «бэкдор» в модели, достаточно всего 250 вредоносных документов независимо от размера этой модели или объёма обучающих данных.

 Источник изображения: anthropic.com

Источник изображения: anthropic.com

К таким выводам пришли учёные Anthropic по результатам исследования (PDF), проведённого совместно с Институтом Алана Тьюринга и Британским институтом безопасности ИИ. Ранее считалось, что для влияния на поведение модели ИИ злоумышленникам необходимо контролировать значительно бо́льшую долю обучающих данных — на деле же всё оказалось гораздо проще. Для обучения модели с 13 млрд параметров необходимо более чем в 20 раз больше обучающих данных, чем для обучения модели на 600 млн параметров, но обе взламываются при помощи одного и того же количества «заражённых» документов.

«Отравление» ИИ может принимать различные формы. Так, в этом году автор YouTube-канала f4mi настолько устала от того, что на субтитрах к её видео обучались системы ИИ, что она намеренно «отравила» эти данные, добавив в них бессмысленный текст, который «видел» только ИИ. Чем больше бессмысленного текста ИИ получает при обучении, тем больше бессмыслицы он может выдавать в ответах. Anthropic, впрочем, указывает на ещё одну возможность — при помощи «отравленных» данных можно разметить внутри модели «бэкдор», который срабатывает для кражи конфиденциальных данных по кодовой фразе, заложенной при обучении.

Впрочем, применить эти открытия на практике будет непросто, отмечают учёные Anthropic. «Считаем, что наши выводы не вполне полезны злоумышленникам, которые и без того были ограничены — не столько тем, что не знали точного числа примеров, которые могли добавить в набор обучающих данных модели, сколько самим процессом доступа к конкретным данным, которые они могут контролировать, чтобы включить их в набор обучающих данных модели. <..> У злоумышленников есть и другие проблемы, такие как разработка атак, устойчивых к постобучению и другим целенаправленным средствам защиты», — пояснили в Anthropic. Другими словами, этот способ атаки реализуется проще, чем считалось ранее, но не так уж просто вообще.

Персонажи Disney будут эксклюзивом ИИ-генератора видео OpenAI Sora только год — а потом смогут появиться в других

На прошлой неделе медиагигант Disney заключил с OpenAI сделку, дающую право последней использовать персонажей первой в своих ИИ-сервисах, включая платформу Sora для генерации видео. Глава Disney Боб Айгер (Bob Iger) пояснил, что в течение первого года соглашение между компаниями будет носить исключительный характер, а в дальнейшем Disney получит право сотрудничать в этой сфере с другими компаниями.

 Источник изображения: Disney Shows

Источник изображения: Disney Shows

Об этом генеральный директор Disney сообщил в интервью CNBC. Пока лишь OpenAI имеет легальные основания для использования персонажей студий Disney, Marvel, Pixar и вселенной Star Wars в генерируемых по запросу пользователей изображениях и видео, причём с некоторыми ограничениями. Например, нельзя создавать фотореалистичные портретные изображения исполнителей главных ролей из соответствующих кинокартин или использовать их голоса без разрешения самих актёров.

Как известно, сделка между компаниями на сумму $1 млрд будет реализована по уже привычной для OpenAI схеме, когда она условно передаёт Disney указанную сумму при условии, что она полностью будет потрачена на приобретение акций ИИ-стартапа. То есть, фактических затрат OpenAI не понесёт, а просто передаст Disney пакет своих акций, сопоставимый по своей стоимости с $1 млрд.

«Ни одно поколение человечества не смогло противостоять ходу технического прогресса, и мы даже не пытаемся. Мы всегда считали, что это если случится и нарушит наши текущие бизнес-модели, то мы должны присоединиться», — выразил отношение Disney к ИИ-революции глава компании. Напомним, что недавно Disney выдвинула требования к Google прекратить использование своих персонажей в своих ИИ-сервисах. По всей видимости, того требуют исключительные условия соглашения с OpenAI, и прочим игрокам рынка придётся подождать год до перехода к приемлемым условиям сотрудничества.

Nvidia выпустила ИИ-модель Nemotron 3 Nano 30B с открытыми весами и большущим контекстным окном

Компания Nvidia сообщила подробности о новом семействе моделей Nemotron 3 с открытыми весами, разработанном, в том числе, для создания специализированного агентного ИИ нового поколения.

 Источник изображения: Nvidia

Источник изображения: Nvidia

Первый представитель семейства — модель Nemotron 3 Nano 30B с открытыми весами, общим количеством параметров в 30 млрд и 3 млрд активных параметров. Модель основана на гибридной архитектуре Mamba-Transformer, сочетающей «смесь экспертов» (MoE), обучение с подкреплением (RL) в интерактивных средах и собственное контекстное окно в 1 млн токенов, обеспечивающее высокопроизводительное и долгосрочное рассуждение для многоагентных приложений.

Как сообщает VideoCardz со ссылкой на публикацию на Hugging Face, маршрутизатор активирует 6 из 128 экспертов за один проход. Nvidia сообщила, что для запуска модели может использоваться система DGX Spark, а также ускорители H100 и B200.

В числе новшеств Nemotron 3, напрямую отвечающих потребностям агентных систем, указаны:

  • гибридная архитектура Mamba-Transformer MoE для повышения эффективности тестирования и долгосрочного рассуждения.
  • многосредовое обучение с подкреплением, разработанное на основе реальных агентных задач.
  • контекстное окно на 1 млн токенов с поддержкой глубокого рассуждения по нескольким документам и долговременной памяти агентов. Благодаря этому обеспечивается устойчивое логическое мышление в больших кодовых базах, длинных документах, продолжительных диалогах и агрегированном извлеченном контенте. Вместо использования фрагментированных эвристических алгоритмов сегментации, агенты могут хранить целые наборы доказательств, буферы истории и многоэтапные планы в одном контекстном окне.
  • открытый, прозрачный конвейер обучения, включающий данные, веса и рецепты.

Семейство MoE Nemotron 3 включает три модели:

  • Nemotron 3 Nano — компактная модель с 30 млрд параметров, активирующая до 3 млрд параметров одновременно для целевых высокоэффективных задач;
  • Nemotron 3 Super — высокоточная модель рассуждений с приблизительно 100 млрд параметров и до 10 млрд активных параметров на токен, предназначенная для многоагентных приложений;
  • Nemotron 3 Ultra — крупная модель рассуждений.

Nemotron 3 Nano с готовыми к использованию руководствами доступна уже сейчас. Nemotron 3Super и Ultra выйдут немного позже.


window-new
Soft
Hard
Тренды 🔥
10 тысяч модов и 350 миллионов загрузок: Larian похвасталась новыми достижениями игроков Baldur’s Gate 3 6 ч.
Вызывающий привыкание роглайк Ball x Pit достиг миллиона проданных копий и в 2026 году получит новые шары 7 ч.
Соавтор Counter-Strike признался в любви к русской культуре и рассказал о «самом депрессивном» периоде за 25 лет карьеры 9 ч.
Apple резко снизила награды багхантерам — при этом рост вредоносов в macOS бьёт рекорды 9 ч.
Mortal Kombat 1, Routine и Dome Keeper возглавили первую волну декабрьских новинок Game Pass, а Mortal Kombat 11 скоро подписку покинет 10 ч.
Google закрыла 107 дыр в Android — две нулевого дня уже использовались в атаках 10 ч.
В YouTube появился Recap — пользователям расскажут, чем они занимались на платформе в течение года 10 ч.
ИИ-агенты научились взламывать смарт-контракты в блокчейне — это риск на сотни миллионов долларов 10 ч.
Инструмент YouTube для защиты блогеров от дипфейков создал риск утечки их биометрии 11 ч.
В Microsoft Teams появились «иммерсивные встречи» в метавселенной с аватарами без ног 11 ч.