Сегодня 16 июня 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Теги → ии
Быстрый переход

Вышла Gemini 3 Flash — новая базовая модель Google, которая лучше Gemini 2.5 Pro и доступна всем бесплатно

Компания Google выпустила ИИ-модель Gemini 3 Flash. Новинка вышла под слоганом «передовой интеллект, созданный для скорости по доступной цене». Gemini 3 Flash сохранила возможности сложных логических рассуждений модели Gemini 3, мультимодальность с пониманием визуальных данных, а также производительность в задачах агентного и визуального программирования, но с учётом «задержки, эффективности и стоимости уровня Flash».

 Источник изображений: Google

Источник изображений: Google

ИИ-модель Gemini 3 Flash превосходит 2.5 Flash по всем параметрам и «значительно» превосходит версию Gemini 2.5 Pro в нескольких тестах, включая MMMU Pro, Toolathlon и MPC Atlas. Google выделила следующие особенности ИИ-модели Gemini 3 Flash:

  • GPQA Diamond (научные знания) — точность 90,4 %;
  • Humanity’s Last Exam (академическое мышление) — эффективность 33,7 % без дополнительных инструментов;
  • MMMU Pro (мультимодальное понимание и рассуждение) — эффективность 81,2 %;
  • SWE-Bench Verified (агентное программирование) — эффективность 78 %;
  • Toolathlon (задачи разработки программного обеспечения в реальном мире с долгосрочным горизонтом) — точность 49,4 %;
  • MCP Atlas (многоэтапные рабочие процессы с использованием MCP) — эффективность 57,4 %.

Google утверждает, что Gemini 3 Flash «превосходит Gemini 2.5 Pro, будучи в 3 раза быстрее и при этом значительно дешевле». Использование сильного логического мышления, инструментов и мультимодальные возможности, реализованные в Gemini 3 Flash, обеспечивают «более сложный анализ видео, извлечение данных и визуальные вопросы и ответы» для сторонних разработчиков, создающих агентов поддержки клиентов или внутриигровых помощников.

Стоимость использования Gemini 3 Flash составляет $0,50 за входные токены и $3 за выходные токены (цена аудиозапроса составляет $1 за входные токены).

ИИ-модель Gemini 3 Flash уже доступна в приложении Gemini, где заменяет ИИ-модель Gemini 2.5 Flash в качестве модели по умолчанию. Компания позиционирует новую модель, как «значительное обновление вашего повседневного ИИ», который «стал умнее и быстрее».

«Вы можете быстро создавать интересные и полезные приложения с нуля, не имея предварительных знаний в программировании. Просто попросите Gemini помочь вам доработать идею. Вы можете на ходу диктовать поток мыслей и превращать их в прототип», — описывает Google возможности Gemini 3 Flash.

В Gemini 3 Flash доступен выбор из двух режимов работы: «Быстрый» — для оперативных ответов и «Глубокое размышление» — для решения сложных задач. Выпущенная в прошлом месяце ИИ-модель Gemini 3 Pro предназначена для более сложных математических задач и задач по программированию.

Gemini 3 Flash также внедряется по всему миру в качестве модели по умолчанию в режиме поиска ИИ (AI Mode). Модель позволяет задавать более тонкие и уточнённые вопросы. Google также сообщила, что модели Gemini 3 Pro с генеративным пользовательским интерфейсом и Nano Banana Pro стали доступны для всех пользователей в США.

«Gemini 3 Flash превосходно улавливает нюансы вашего запроса, извлекая в режиме реального времени локальную информацию и полезные ссылки со всего интернета и предоставляя продуманные, исчерпывающие ответы, которые легко воспринимаются визуально», — говорит Google.

Для разработчиков Gemini 3 Flash доступен в режиме предварительного просмотра через AI Studio, Google Antigravity, Gemini CLI и Android Studio. Для корпоративных пользователей новая ИИ-модель доступна через Vertex AI и Gemini Enterprise.

«В кадре появился кот»: умная IP-камера «Яндекса» научилась рассказывать о том, что видит

Умная IP-камера «Яндекса» получила новую функцию — анализ происходящего в кадре на основе искусственного интеллекта. Вместо простого сообщения, что обнаружено движение, устройство способно конкретизировать, что появился кот или другой объект. Интеллектуальный анализ можно включать в сценарии умного дома и запускать их, когда, например, «собака грызёт диван». Раз в сутки умная камера составляет сводку произошедшего за день и отправляет её владельцу.

 Источник изображений: «Яндекс»

Источник изображений: «Яндекс»

Теперь обо всём происходящем в кадре камера «Яндекса» сообщает человеку — она может конкретно определить, что, к примеру, вернулись домой дети; все эти записи сохраняются в архиве, чтобы можно было оперативно найти интересующее. Распознанные ИИ события в кадре можно привязывать к сценариям умного дома — их можно задать своими словами в приложении «Дом с Алисой». Так, если ребёнок просыпается ночью, включается ночник; когда появляется собака, включается автоматическая поилка; а если домашнее животное запрыгивает на диван, снимок отправляется владельцу. Каждый день ИИ генерирует составленную из описаний сводку событий за день и отправляет уведомление через приложение «Дом с Алисой» — посмотреть отчёт можно в карточке устройства.

За анализ происходящего в кадре отвечает визуально-языковая модель «Яндекса» Alice AI VLM. Она обучена на большом объёме визуальной и текстовой информации, за счёт чего ориентируется в происходящем в кадре. Ранее эта технология уже начала использоваться в «живом» режиме «Алисы» для подписчиков «Алисы Плюс». ИИ-описания, архивы записей и автоматические сводки доступны подписчикам тарифа «Стандарт»; чтобы воспользоваться остальными функциями, потребуется вариант «Экстра». Некоторые функции, которые ранее были доступны только по платной подписке, теперь работают бесплатно — например, слежение за человеком в кадре, фотоснимок при обнаружении движения, а также создание снимка по сценарию или расписанию.

Инвесторы сходят с ума от ИИ: акции разработчика ИИ-чипов MetaX взлетели в восемь раз сразу после IPO

Публичное размещение акций является традиционным способом привлечения капитала, и для китайских разработчиков ИИ-чипов сейчас наступил благоприятный период для выхода на IPO, поскольку диктуемый властями страны курс на импортозамещение сулит высокий спрос на их продукцию. Акции MetaX вслед за первичным размещением на бирже выросли в цене на 700 %, подтверждая эту традицию.

 Источник изображения: MetaX

Как уже отмечалось ранее, конкурирующая Moore Threads, которую считают китайским конкурентом Nvidia, недавно дебютировала на бирже, продемонстрировав рост котировок своих акций на 400 %. Основанная выходцем из AMD в 2020 году, MetaX разрабатывает не только ускорители вычислений на базе GPU, но и специализированные процессоры (ASIC). По итогам IPO ей удалось привлечь почти $600 млн, а количество желающих купить её акции в 4000 раз превысило доступную квоту. Пока стартап остаётся убыточным, но благодаря инициативам китайских властей в сфере импортозамещения ускорителей чипов планирует удвоить выручку в текущем году и выйти на безубыточность в следующем году. Пока MetaX контролирует не более 1 % китайского рынка компонентов для инфраструктуры ИИ.

Конкуренты тоже не стоят на месте. В конце ноября Moore Threads смогла привлечь $1,1 млрд, на этой неделе разрешение на размещение акций в Гонконге получила Biren Technology, а принадлежащая Baidu компания Kunlunxin также планирует разместить свои акции на этой площадке. В сегменте ASIC компании MetaX приходится конкурировать с Cambricon, HiSilicon (Huawei), Kunlunxin (Baidu) и T-Head (Alibaba). В сегменте GPU её конкурентами являются не только Moore Threads и Biren, но и Hygon Information Technology. Аналитики считают, что на фоне ажиотажа котировки акций новоиспечённых китайских эмитентов завышены, но в определённой перспективе даже покупка их акций по текущим ценам может себя оправдать.

Глава Larian подтвердил, что в разработке Divinity используется генеративный ИИ — фанаты в ярости, руководитель пытается объясниться

Глава Larian Studios Свен Винке (Swen Vincke) в интервью Bloomberg подтвердил, что в разработке амбициозной пошаговой ролевой игры Divinity используется генеративный ИИ. Анонс вызвал широкий общественный резонанс.

 Источник изображений: Larian Studios

Источник изображений: Larian Studios

По словам Винке, созданных с помощью ИИ материалов в Divinity не будет, однако студия активно (под его руководством) использует технологию на этапе изучения идей, при работе над концепт-артами, во внутренних презентациях и заглушках для текста.

Не все сотрудники Larian были рады идее внедрения нейросетей в рабочие процессы, но, если верить Винке, «к настоящему моменту все в компании более-менее довольны, как мы используем [ИИ]».

 Эффективность рабочих процессов в Larian применение ИИ существенно не повысило

Эффективность рабочих процессов в Larian применение ИИ существенно не повысило

Игроки и бывшие сотрудники Larian массово и жёстко раскритиковали Винке за продвижение ИИ в рабочих процессах — дошло даже до обвинений во лжи. «Проявите немного уважения к работникам. Это специалисты мирового уровня, и им не нужна помощь ИИ для генерации великолепных идей», — считает экс-художница студии.

Винке в комментарии для IGN поспешил уточнить, что Larian не пытается заменить труд людей нейросетями — применение ИИ в студии направлено на облегчение жизни сотрудников и не мешает компании дальше нанимать художников и сценаристов.

 На настоящий момент в Larian трудится 72 художника, и 23 из них специализируется на концепт-артах

На настоящий момент в Larian трудится 72 художника, и 23 из них специализируется на концепт-артах

У себя в микроблоге Винке добавил, что студия использует ИИ лишь на самом раннем этапе разработки — при изучении референсов, для создания «грубых набросков, которые затем заменяем оригинальными эскизами».

«Мы наняли творческих людей за их талант, а не способность выполнять то, что говорит машина. Но они могут экспериментировать с этими инструментами, чтобы облегчить себе жизнь», — заключил Винке.

Apple готовит собственные ИИ-чипы для серверов — Broadcom стала помощником в их создании

История компании Apple показывает, что она изначально внедряет новые технологии, полагаясь на компоненты сторонних поставщиков, но когда рынок формируется и крепнет, переходит к их замене на чипы собственной разработки. В случае с чипами для вычислительной инфраструктуры ИИ, как ожидается, Apple полагается на сотрудничество с Broadcom.

 Источник изображения: Broadcom

Источник изображения: Broadcom

Напомним, последняя из компаний в последнее время активно привлекает новых клиентов на направление специализированных чипов для инфраструктуры ИИ. Помимо Google, взаимодействовать на этом направлении Broadcom готова и с Anthropic, а ещё руководство этого поставщика чипов недавно пояснило, что количество профильных клиентов достигло четырёх, а в прошлом квартале к ним присоединился пятый. Его имя до сих пор не названо, но некоторые источники полагают, что Apple также может обратиться за помощью к Broadcom для разработки ИИ-чипов для собственной инфраструктуры.

Издание Economic Daily News упоминает условное обозначение первого специализированного чипа Broadcom — «Baltra», который ляжет в основу центров обработки данных Apple, запланированных к введению в строй с 2027 года. Контрактным производством специализированных серверов займётся Foxconn, а сама Apple будет использовать их для развития фирменного сервиса Apple Intelligence. Даже с учётом бурного развития контрактного бизнеса Foxconn по выпуску ИИ-серверов, Apple продолжает оставаться крупнейшим клиентом этой тайваньской компании, но благодаря заказам на выпуск традиционной потребительской электроники.

Отдельно сообщается, что пока Apple предпочитает осуществлять экспансию этого сервиса осторожно. Языковая модель Google Gemini, которая будет обслуживать клиентов Apple, насчитывает не более 3 трлн параметров. По условиям договорённостей между Apple и Google, первая будет платить второй ежегодно около $1 млрд за доступ к данной модели.

Если говорить о контрактном бизнесе Foxconn, то на направлении серверных систем на основе специализированных чипов (ASIC) она должна удвоить объёмы их выпуска в текущем году, но на GPU-системы будет приходиться до 80 % заказов. Тайваньский подрядчик контролирует примерно 40 % мирового рынка услуг по выпуску серверов для инфраструктуры ИИ.

OpenAI выпустила генератор изображений ChatGPT Images 1.5 — более высокая скорость и новые возможности

На прошлой неделе OpenAI выпустила модель искусственного интеллекта GPT-5.2, а теперь она стала основой фирменного генератора изображений ChatGPT Images 1.5. По словам разработчиков, это позволило в четыре раза повысить скорость работы сервиса по сравнению с предыдущей версией, а также реализовать несколько полезных нововведений.

 Источник изображения: ChatGPT Images

Источник изображения: ChatGPT Images

ChatGPT Images стал лучше следовать пользовательским инструкциям, в том числе в случаях, когда дело доходит до редактирования только что созданного изображения. Пользователь может попросить алгоритм добавить, убрать, объединить, смешать или даже перенести какие-то элементы на картинке. OpenAI заявила, что обновлённый ChatGPT Images лучше справляется с отображением текста, что традиционно является слабым местом многих генераторов изображений. По данным OpenAI, повысилось качество генерации читаемого текста, а также появилась возможность работы с более мелким и плотным тестом.

В рамках этого обновления фирменного генератора изображения OpenAI добавила в боковую панель ChatGPT отдельный раздел Images. В нём собраны готовые к использованию фильтры и промпты, призванные помочь в поиске вдохновения. «Мы считаем, что всё ещё находимся в самом начале пути к тому, что может дать генерация изображений. Сегодняшнее обновление — это значительный шаг вперёд, и впереди нас ждёт многое: от более детальных правок до более насыщенных и подробных результатов на разных языках», — говорится в сообщении OpenAI.

Разработчики приступили к развёртыванию ChatGPT Images 1.5 и в скором времени обновлённая версия сервиса станет доступна всем пользователям. Отмечается, что пользователи также смогут продолжить взаимодействие с моделью GPT-4o через пользовательский интерфейс чат-бота компании.

Новый ChatGPT Images появляется как раз в тот момент, когда его главный конкурент Google Nano Banana Pro вызвал всплеск популярности Gemini среди пользователей. В октябре Google заявила, что пользовательская база фирменного чат-бота выросла до 650 млн человек, что существенно больше 450 млн человек, о которых компания сообщала в июле. Nano Banana Pro оказалась настолько популярной, что Google для снижения нагрузки на инфраструктуру пришлось ограничить бесплатных пользователей всего двумя генерациями изображений в день. Для OpenAI, вероятно, было не столь важно дать сильный ответ на появление Nano Banana Pro, сколько обеспечить сильную конкуренцию чат-боту Gemini 3 Pro. Это связано с тем, что наличие в арсенале компании ChatGPT Images является одним из основных факторов, обеспечивающих ИИ-боту ChatGPT пользовательскую базу в 800 млн человек.

Властелин ИИ: OpenAI затягивает Amazon в свою игру кольцевых инвестиций

С точки зрения схем финансирования нынешнего бума ИИ стартап OpenAI вполне можно считать «властелином колец», поскольку он сосредоточил вокруг себя сделки с кольцевым принципом передачи средств и взаимными зависимости. Сама OpenAI при этом особо ничем не рискует, привлекая средства партнёров под обещания светлого будущего. Amazon может стать очередным инвестором OpenAI и поставщиком своих чипов.

 Источник изображения: Amazon

Источник изображения: Amazon

По крайней мере, об этом на текущей неделе сообщили The Information и Reuters, используя независимые источники. По имеющимся данным, OpenAI ведёт переговоры о сотрудничестве с Amazon, которая может либо вложить в капитал первой до $10 млрд, либо просто ограничиться поставками своих ускорителей Trainium для нужд инфраструктуры OpenAI. Недавно прошедшая реструктуризация стартапа открыла перед ним больше возможностей по поиску инвесторов, помимо Microsoft, которая владеет 27 % акций стартапа.

Облачные гиганты, включая Google и AWS (Amazon) давно разрабатывают собственные чипы для ускорения вычислений, и на фоне бума ИИ интерес к ним начали проявлять профильные стартапы. Например, ускорителями TPU заинтересовался не только Anthropic, но и конкурирующая с Google компания Meta✴ Platforms. Как теперь сообщается, ускорители Trainium компании Amazon могут найти применение в ИИ-инфраструктуре OpenAI.

Отдельно отмечается, что инвестиции Amazon в OpenAI могут поднять капитализацию последней до отметки более $500 млрд. Это повышает шансы OpenAI на успех в негласной борьбе с SpaceX Илона Маска (Elon Musk) за статус самого дорогого в мире стартапа. Принято считать, что в перспективе OpenAI выйдет на IPO, и тогда капитализация разработчика ChatGPT вырастет до $1 трлн. Представители компании пока наличие планов по выходу на биржу не подтверждают. В случае, если сделка с Amazon состоится, наличие такого весомого инвестора будет способствовать привлечению средств в капитал OpenAI из других источников. Не исключено, что ChatGPT также будет каким-то образом интегрирован в собственные информационные сервисы Amazon, включая услуги по поиску товаров на одноимённой торговой площадке.

Google запустила ИИ-агента, который избавит от утренней проверки почты и календаря

Разработчики из Google хотят сделать так, чтобы люди по всему миру начинали свой день с взаимодействия с её искусственным интеллектом. Для этого поисковый гигант запустил экспериментального ИИ-агента, который будет анализировать электронные письма пользователей, календарь и документы, чтобы каждое утро отправлять в почту краткую сводку на основе проведённого анализа.

 Источник изображения: Google

Источник изображения: Google

Новая функция под названием CC каждое утро направляет в почтовый ящик пользователя ежедневную сводку под названием «Ваш день впереди». Это персонализированный отчёт, который Google описывает, как «одно чёткое резюме», в котором содержится расписание на предстоящий день, а также все ключевые задачи, которые следует выполнить, и важная информация, например, о счетах, которые нужно оплатить, или встречах, к которым следует подготовиться. CC также может подготавливать черновики писем и делать ссылки в календарь на случай, если пользователь хочет приступить к выполнению задач прямо в начале дня.

ИИ-агент CC запускается в раннем доступе для платных подписчиков старше 18 лет в США и Канаде. Google также объявила о запуске списка ожидания для получения доступа к CC, записаться в который могут все желающие пользователи, соответствующие упомянутым критериям. Компания не уточнила, как долго доступ к ИИ-агенту будет предоставляться в таком формате и когда его доступность будет расширена.

Основой для CC стала ИИ-модель Gemini, которая анализирует данные пользователя из почты Gmail, «Календаря» и Google Диска, а также собирает информацию в интернете. Пользователь может сделать ИИ-агента более персонализированным, рассказывая ему о себе и давая задания на запоминание данных, а также отвечая на предоставляемые сводки или общаясь с ним напрямую.

ИИ почти самостоятельно разработал компьютер из 843 компонентов — Linux загрузился с первой попытки

Стартап из Лос-Анджелеса Quilter сообщил об успешном завершении проекта Speedrun: при участии искусственного интеллекта компания разработала двухплатный компьютер с 843 компонентами всего за одну неделю. Дистрибутив Debian на этом компьютере успешно загрузился с первого включения.

 Источник изображений: quilter.ai

Источник изображений: quilter.ai

Инженеры Quilter уверены, что показанный ими рабочий процесс сотрудничества человека и ИИ породит новое поколение производителей компьютерного оборудования. Проектирование печатных плат с помощью ИИ способно значительно сэкономить время: работа над проектом Speedrun заняла 38,5 часов времени у специалистов инженерных специальностей — без ИИ на это ушли бы 430 часов работы или около трёх месяцев.

Традиционный подход к проектированию подобных систем предполагает многократное повторение трёх этапов: постановки задачи, реализации и доводки с исправлением ошибок. Разработанная Quilter система оставляет человеку только первый и третий этапы, которые считаются творческими, а основную рутинную и трудоёмкую работу по реализации ИИ берет на себя, хотя он способен справляться также с первым и третьим этапами. Инженеры раскрывают свой творческий потенциал, получают возможность опробовать большее число проектов, а сами проекты выходят на рынок быстрее. Когда человек занимается первым и третьим этапами самостоятельно, он допускает ошибки, и тогда второй занимает ещё больше времени, что дополнительно задерживает весь проект.

Примечательно, что на ранних этапах ИИ Quilter не обучался на созданных людьми образцах плат, потому что при проектировании человек часто допускает ошибки, и разработчики не хотели ограничивать систему уровнем человеческого мышления. Долгосрочная цель компании — выстроить систему проектирования печатных плат, которая не просто будет соответствовать человеческому уровню, но и поможет в разработке «более совершенных плат, чем когда-либо пытались сделать люди», рассказал гендиректор Quilter Сергей Нестеренко — бывший инженер в SpaceX. Компания стремится запустить волную нового поколения стартапов в области оборудования, значительно снизив барьер для их выхода на рынок.

Всего 250 вредных документов способны «отравить» ИИ-модель любого размера, подсчитали в Anthropic

«Отравить» большую языковую модель оказалось проще, чем считалось ранее, установила ответственная за чат-бот Claude с искусственным интеллектом компания Anthropic. Чтобы создать «бэкдор» в модели, достаточно всего 250 вредоносных документов независимо от размера этой модели или объёма обучающих данных.

 Источник изображения: anthropic.com

Источник изображения: anthropic.com

К таким выводам пришли учёные Anthropic по результатам исследования (PDF), проведённого совместно с Институтом Алана Тьюринга и Британским институтом безопасности ИИ. Ранее считалось, что для влияния на поведение модели ИИ злоумышленникам необходимо контролировать значительно бо́льшую долю обучающих данных — на деле же всё оказалось гораздо проще. Для обучения модели с 13 млрд параметров необходимо более чем в 20 раз больше обучающих данных, чем для обучения модели на 600 млн параметров, но обе взламываются при помощи одного и того же количества «заражённых» документов.

«Отравление» ИИ может принимать различные формы. Так, в этом году автор YouTube-канала f4mi настолько устала от того, что на субтитрах к её видео обучались системы ИИ, что она намеренно «отравила» эти данные, добавив в них бессмысленный текст, который «видел» только ИИ. Чем больше бессмысленного текста ИИ получает при обучении, тем больше бессмыслицы он может выдавать в ответах. Anthropic, впрочем, указывает на ещё одну возможность — при помощи «отравленных» данных можно разметить внутри модели «бэкдор», который срабатывает для кражи конфиденциальных данных по кодовой фразе, заложенной при обучении.

Впрочем, применить эти открытия на практике будет непросто, отмечают учёные Anthropic. «Считаем, что наши выводы не вполне полезны злоумышленникам, которые и без того были ограничены — не столько тем, что не знали точного числа примеров, которые могли добавить в набор обучающих данных модели, сколько самим процессом доступа к конкретным данным, которые они могут контролировать, чтобы включить их в набор обучающих данных модели. <..> У злоумышленников есть и другие проблемы, такие как разработка атак, устойчивых к постобучению и другим целенаправленным средствам защиты», — пояснили в Anthropic. Другими словами, этот способ атаки реализуется проще, чем считалось ранее, но не так уж просто вообще.

Персонажи Disney будут эксклюзивом ИИ-генератора видео OpenAI Sora только год — а потом смогут появиться в других

На прошлой неделе медиагигант Disney заключил с OpenAI сделку, дающую право последней использовать персонажей первой в своих ИИ-сервисах, включая платформу Sora для генерации видео. Глава Disney Боб Айгер (Bob Iger) пояснил, что в течение первого года соглашение между компаниями будет носить исключительный характер, а в дальнейшем Disney получит право сотрудничать в этой сфере с другими компаниями.

 Источник изображения: Disney Shows

Источник изображения: Disney Shows

Об этом генеральный директор Disney сообщил в интервью CNBC. Пока лишь OpenAI имеет легальные основания для использования персонажей студий Disney, Marvel, Pixar и вселенной Star Wars в генерируемых по запросу пользователей изображениях и видео, причём с некоторыми ограничениями. Например, нельзя создавать фотореалистичные портретные изображения исполнителей главных ролей из соответствующих кинокартин или использовать их голоса без разрешения самих актёров.

Как известно, сделка между компаниями на сумму $1 млрд будет реализована по уже привычной для OpenAI схеме, когда она условно передаёт Disney указанную сумму при условии, что она полностью будет потрачена на приобретение акций ИИ-стартапа. То есть, фактических затрат OpenAI не понесёт, а просто передаст Disney пакет своих акций, сопоставимый по своей стоимости с $1 млрд.

«Ни одно поколение человечества не смогло противостоять ходу технического прогресса, и мы даже не пытаемся. Мы всегда считали, что это если случится и нарушит наши текущие бизнес-модели, то мы должны присоединиться», — выразил отношение Disney к ИИ-революции глава компании. Напомним, что недавно Disney выдвинула требования к Google прекратить использование своих персонажей в своих ИИ-сервисах. По всей видимости, того требуют исключительные условия соглашения с OpenAI, и прочим игрокам рынка придётся подождать год до перехода к приемлемым условиям сотрудничества.

Nvidia выпустила ИИ-модель Nemotron 3 Nano 30B с открытыми весами и большущим контекстным окном

Компания Nvidia сообщила подробности о новом семействе моделей Nemotron 3 с открытыми весами, разработанном, в том числе, для создания специализированного агентного ИИ нового поколения.

 Источник изображения: Nvidia

Источник изображения: Nvidia

Первый представитель семейства — модель Nemotron 3 Nano 30B с открытыми весами, общим количеством параметров в 30 млрд и 3 млрд активных параметров. Модель основана на гибридной архитектуре Mamba-Transformer, сочетающей «смесь экспертов» (MoE), обучение с подкреплением (RL) в интерактивных средах и собственное контекстное окно в 1 млн токенов, обеспечивающее высокопроизводительное и долгосрочное рассуждение для многоагентных приложений.

Как сообщает VideoCardz со ссылкой на публикацию на Hugging Face, маршрутизатор активирует 6 из 128 экспертов за один проход. Nvidia сообщила, что для запуска модели может использоваться система DGX Spark, а также ускорители H100 и B200.

В числе новшеств Nemotron 3, напрямую отвечающих потребностям агентных систем, указаны:

  • гибридная архитектура Mamba-Transformer MoE для повышения эффективности тестирования и долгосрочного рассуждения.
  • многосредовое обучение с подкреплением, разработанное на основе реальных агентных задач.
  • контекстное окно на 1 млн токенов с поддержкой глубокого рассуждения по нескольким документам и долговременной памяти агентов. Благодаря этому обеспечивается устойчивое логическое мышление в больших кодовых базах, длинных документах, продолжительных диалогах и агрегированном извлеченном контенте. Вместо использования фрагментированных эвристических алгоритмов сегментации, агенты могут хранить целые наборы доказательств, буферы истории и многоэтапные планы в одном контекстном окне.
  • открытый, прозрачный конвейер обучения, включающий данные, веса и рецепты.

Семейство MoE Nemotron 3 включает три модели:

  • Nemotron 3 Nano — компактная модель с 30 млрд параметров, активирующая до 3 млрд параметров одновременно для целевых высокоэффективных задач;
  • Nemotron 3 Super — высокоточная модель рассуждений с приблизительно 100 млрд параметров и до 10 млрд активных параметров на токен, предназначенная для многоагентных приложений;
  • Nemotron 3 Ultra — крупная модель рассуждений.

Nemotron 3 Nano с готовыми к использованию руководствами доступна уже сейчас. Nemotron 3Super и Ultra выйдут немного позже.

Жёсткие диски начали дорожать вслед за SSD, но здесь виноват не только ИИ

После почти двух лет относительного затишья рынок жёстких дисков снова демонстрирует признаки напряжённости. Согласно сообщению Digitimes Asia, контрактные цены на HDD подскочат примерно на 4 % по итогам четвёртого квартала 2025 года. Это самый резкий рост за восемь кварталов, и поставщики ожидают, что эта тенденция сохранится. Аналитики считают, что возрастающий спрос на HDD — это симптом масштабных факторов, меняющих всю цепочку поставок вычислительной техники.

 Источник изображения: unsplash.com

Источник изображения: unsplash.com

В отчёте Digitimes Asia выделены два основных фактора, определяющих спрос. Во-первых, это внезапный всплеск спроса на HDD на китайском рынке ПК, обусловленный государственной политикой закупок, отдающей предпочтение процессорам и операционным системам отечественного производства. Этот сдвиг в политике ускорил местное производство ПК и также способствовал востребованности HDD. Спрос именно на HDD вызван опасениями по поводу надёжности долговременного хранения данных в SSD.

Второй важный фактор — это растущий спрос на высокоёмкие жёсткие диски для ЦОД. Несмотря на многолетние прогнозы о том, что флэш-память полностью вытеснит HDD, операторы гиперскейлеров по-прежнему в значительной степени полагаются на жёсткие диски для хранения больших объёмов данных и резервного копирования. По мере масштабирования рабочих нагрузок ИИ увеличивается и объем генерируемых, хранимых и перемещаемых данных, большая часть которых в конечном итоге оказывается на ёмких и относительно недорогих HDD.

Рост спроса и цен на HDD во многом порождён бумом развивающейся инфраструктуры ИИ. Высокоскоростная память и корпоративная DRAM уже находятся в дефиците, а высокие цены на DRAM затрудняют производителям жёстких дисков контроль производственных затрат, ведь HDD используют много DRAM для кэш-памяти.

Рост цен на жёсткие диски — это не столько аномалия, сколько побочный эффект. Капитальные затраты на инфраструктуру ИИ выросли настолько быстро, что это начало отражаться в макроэкономических данных. Аналитики отмечают, что непропорционально большая часть недавнего роста ВВП США пришлась на инвестиционные расходы, связанные с центрами обработки данных, серверами и соответствующей инфраструктурой, а не на потребительский спрос. Жёсткие диски являются частью той же волны капитальных затрат.

Данные аналитической компании TrendForce показывают, что производители HDD вывели свои предприятия на полную мощность, но пока не могут угнаться за спросом со стороны поставщиков облачных услуг. Цены на HDD продолжают расти, отражая системную нехватку ёмких серверных накопителей.

В отличие от флэш-памяти, производство которой может наращиваться за счёт новых заводов и уменьшения технологических параметров, производство HDD ограничено специализированными компонентами, такими как считывающие/записывающие головки и прецизионные носители. Масштабирование производства HDD — это не быстрый и не дешёвый процесс, и производители с осторожностью относятся к расширению мощностей.

На сегодняшний день жёсткие диски, которые часто рассматриваются как устаревшая технология, снова оказываются в центре истории роста отрасли — спрос на них переживает динамику, которую ещё пару лет назад мало кто мог предсказать. Рост потребности в HDD напрямую будет зависеть от того, как быстро будут наращиваться вычислительные мощности и будут ли инвестиции в инфраструктуру ИИ продолжаться нынешними стремительными темпами.

ИИ по прежнему не окупается, но компании всё равно увеличат расходы на него

Многочисленные стартапы в области ИИ благополучно внушают инвесторам мысль о том, что не так страшно вложить в эту сферу больше средств, чем нужно, как не вкладывать достаточно и упустить какие-то возможности в развитии. Проведённый Teneo опрос показал, что 68 % руководителей публичных компаний в следующем году намерены увеличить расходы на ИИ.

 Источник изображения: OpenAI

Источник изображения: OpenAI

При этом статистика показывает, что прибыль генерируют менее половины современных проектов в сфере ИИ. В опросе участвовали генеральные директора более чем 350 публичных компаний. Печальную статистику о финансовой эффективности таких проектов привели те же респонденты. Менее половины проектов в области ИИ позволяют компаниям получать больше, чем на них тратится. Наиболее эффективными сферами применения ИИ в настоящее время считаются маркетинг и поддержка пользователей, а вот в сфере юриспруденции, работы с кадрами и безопасности риски применения ИИ значительно выше.

Опрошенные Teneo около 400 институциональных инвесторов в 53 % случаев считают, что инициативы в области ИИ начнут приносить финансовую отдачу в ближайшие шесть месяцев. При этом 84 % руководителей крупных компаний с выручкой более $10 млрд уверены в том, что на получение прибыли от ИИ-проектов уйдёт более шести месяцев. Разделяются взгляды руководства компаний и на степень влияния ИИ на численность персонала: 67 % респондентов уверены, что внедрение ИИ увеличит численность сотрудников начального уровня, тогда как 58 % убеждены, что ИИ увеличит количество более квалифицированных сотрудников. Опрос проводился с середины октября по середину ноября, в число опрашиваемых попали представители 350 публичных компаний с годовой выручкой более $1 млрд.

Если год назад 51 % респондентов среди представителей крупных компаний демонстрировал уверенность в способности глобальной экономики вырасти в ближайшие шесть месяцев, то теперь количество таких оптимистов сократилось до 31 %. Мелкие компании, напротив, более оптимистично смотрят на перспективы восстановления мировой экономики, рассчитывая на него в новом году в 80 % случаев, хотя год назад таковых набиралось 83 %.

Усиление активности по слиянию и поглощениям на корпоративном рынке в следующем году прогнозируют 78 % руководителей, год назад таковых набиралось 83 %, и по итогам текущего года уже можно судить, что они были правы, поскольку соответствующая активность на мировом рынке выросла на 40 %.

Бум ИИ взвинтил цены на уран, используемый в качестве топлива для АЭС

Ещё одной сферой, на которую бум систем искусственного интеллекта оказывает влияние, стала поставка урана для использования в качестве топлива на АЭС. По информации Nikkei Asian Review, цены на топливный уран выросли почти до двадцатилетнего максимума, и аналитики ожидают, что к 2040 году потребности рынка в таком топливе удвоятся относительно нынешнего уровня до 150 000 тонн в год.

 Источник изображения: Unsplash, Mick Truyts

Источник изображения: Unsplash, Mick Truyts

По прогнозу World Nuclear Association, объём генерирующих мощностей в сегменте АЭС к 2040 году удвоится до 746 ГВт. Проблема заключается в том, что предыдущий период снижения интереса к ядерной энергетике не только опустил цены на урановое топливо, но и способствовал прекращению разработки новых месторождений. Последний процесс не только требует существенного времени, но и серьёзных затрат. Сейчас рост спроса покрывается существующими запасами, но уже в следующем десятилетии многие действующие месторождения урана будут истощены.

С другой стороны, рост цен на топливный уран будет создавать более выгодные условия для разведки новых месторождений и расширения добычи. Долгосрочные контракты на поставку топливного урана сейчас заключаются по цене $86 за фунт, что выше не только стоимости топлива на рынке моментальных сделок ($75,85), но и соответствует максимальному уровню с 2008 года. К слову, в январе прошлого года спот-цены достигали $100 за фунт топлива, поэтому при сохранении конъюнктуры цены могут продолжить свой рост.

Специфика ядерной энергетики заключается в том, что после закладки топлива в реактор он может вырабатывать энергию практически безостановочно и очень долго, поэтому спрос на топливо измеряется какими-то конечными и осязаемыми величинами. В структуре затрат энергетической компании уран занимает не более 20 %, тогда как у ТЭС на базе угля или природного газа топливо определяет от 60 до 80 % расходов на генерацию. Рост цен на уран вызывает интерес к инвестициям в профильные компании, причём не только со стороны профессиональных игроков фондового рынка, но и частных инвесторов.


window-new
Soft
Hard
Тренды 🔥
Хардкорный ролевой боевик Outward 2 лишился даты выхода в раннем доступе — разработчики не хотят разочаровать игроков 32 мин.
Ядро Linux лишилось поддержки Intel 486 и других «пережитков прошлого» 2 ч.
Жертвы киберпреступлений в США потеряли почти $21 млрд за прошлый год 2 ч.
Call of Duty: Vanguard и EA Sports FC 26 возглавили вторую волну июньских новинок Game Pass, а Tomb Raider и Slay the Spire подписку скоро покинут 2 ч.
Евросоюз не станет обязывать издателей спасать видеоигры, но у Stop Killing Games есть план 4 ч.
Соцсеть Threads почти догнала X по месячной аудитории — она достигла полумиллиарда пользователей 5 ч.
ИИ-сводки в Gmail стали доступны всем — их можно отключить, но со всеми ИИ-функциями сразу 5 ч.
Импортозамещение СЗИ: почему менеджер паролей стал критически важным элементом инфраструктуры (и причём здесь ФСТЭК России) 5 ч.
«Расширитель» памяти Mext был продан AMD 6 ч.
Европа начала очередное расследование против Apple — на этот раз из-за iCloud 6 ч.