Сегодня 06 апреля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

«Максимально правдивый ИИ»: xAI Илона Маска выпустила флагманскую ИИ-модель Grok 3

Компания xAI, основанная Илоном Маском (Elon Musk), представила флагманскую ИИ-модель Grok 3, а также обновления для iOS-приложения Grok и веб-версии. Разработка Grok 3 велась несколько месяцев, а её запуск, первоначально запланированный на 2024 год, был отложен. Для обучения Grok 3 были использованы вычислительные мощности, в 10 раз превышающие ресурсы его предшественника, что позволило существенно повысить точность и глубину анализа данных новой ИИ-моделью.

 Источник изображений: xAI

Источник изображений: xAI

Grok 3 представляет собой третье поколение семейства ИИ-моделей xAI, созданного в противовес таким разработкам, как GPT-4o компании OpenAI и Gemini корпорации Google. Новая ИИ-модель серьёзный технологический шаг вперёд: усовершенствованные алгоритмы, увеличенные объёмы обучающих данных, возможность анализа изображений и даже интеграция ряда функций в социальной сети X. «Grok 3 на порядок мощнее Grok 2. Это максимально правдивый ИИ, даже если эта правда иногда расходится с политически корректной», — заявил Маск во время презентации.

Для обучения Grok 3 xAI использовала один из крупнейших в мире дата-центров, расположенный в Мемфисе. В нём задействованы около 200 000 графических процессоров (GPU), что позволило обрабатывать более сложные массивы данных и выполнять вычисления с беспрецедентной скоростью. По словам Маска, ресурсы, использованные при обучении Grok 3, оказались в 10 раз больше, чем потребовалось для Grok 2. Кроме того, в обучающую выборку вошли не только общедоступные данные, но и материалы судебных дел, что потенциально расширяет возможности новой ИИ-модели в области анализа юридических документов.

 Дата-центр xAI, использовавшийся для обучения Grok 3, оснащён 200 000 GPU, причём расширение с 100 000 до 200 000 GPU заняло 92 дня

Дата-центр xAI, где обучался Grok 3, оснащён 200 000 GPU, причём расширение с 100 000 до 200 000 GPU заняло 92 дня


Важно подчеркнуть, что новая версия Grok представляет собой не единственную ИИ-модель, а целое семейство нейросетей, адаптированных под различные сценарии использования. Например, Grok-3 mini Reasoning способен обрабатывать запросы с высокой скоростью, но за счёт этого снижается точность. Однако не все версии Grok 3 стали доступны сразу — часть функций остаётся в бета-тестировании, но их развёртывание начнётся уже сегодня.

 Grok 3 демонстрирует высокие результаты в тестах на математические, научные и задачи программирования, значительно опережая конкурентов в AIME'24, GPQA и LCB

Grok 3 демонстрирует высокие результаты в тестах на математические, научные и задачи программирования, значительно опережая конкурентов в AIME'24, GPQA и LCB

Компания xAI утверждает, что Grok 3 показывает превосходные результаты в тестах, в частности, опережая GPT-4o. В бенчмарке AIME, оценивающем математические способности, и GPQA, измеряющем уровень знаний в области физики, биологии и химии на уровне доктора наук, новинка демонстрирует выдающиеся показатели. Более того, ранняя версия Grok 3 заняла высокие позиции в Chatbot Arena (LMSYS) — платформе, где пользователи сравнивают ответы различных ИИ-моделей и голосуют за наиболее качественные.

 В рейтинге Chatbot Arena ранняя версия Grok 3 под кодовым названием «Chocolate» показала наивысший результат среди множества больших языковых ИИ-моделей

В рейтинге Chatbot Arena ранняя версия Grok 3 под кодовым названием Chocolate показала наивысший результат среди множества больших языковых ИИ-моделей

Одним из ключевых нововведений стало появление Grok-3 Reasoning и Grok-3 mini Reasoning — специализированных ИИ-моделей, способных глубоко анализировать проблемы, подобно «рассуждающим» моделям, таким как o3-mini компании OpenAI и R1 китайской компании DeepSeek. Эти нейросети не просто дают ответы, но и тщательно проверяют факты перед их формулировкой, что позволяет значительно снизить вероятность ошибок. По данным xAI, Grok-3 Reasoning превзошёл o3-mini-high в ряде популярных бенчмарков, включая AIME 2025 Performance.

 Производительность Grok 3 в тестах AIME 2025 показывает, что версия Grok-3 Reasoning Beta превосходит конкурентов, включая o3mini(high) и Deepseek-R1

Производительность Grok 3 в тестах AIME 2025 показывает, что версия Grok-3 Reasoning Beta превосходит конкурентов, включая o3-mini-high и Deepseek-R1

Пользователи могут работать с Grok 3 через приложение Grok, в котором доступны два режима работы: Think — для стандартных запросов, и Big Brain — для сложных вычислений и логических задач. Режим Big Brain использует расширенные вычислительные мощности, что позволяет добиться более высокой точности ответов. Он оптимален для научных исследований, математического моделирования и программирования. По словам Маска, в приложении Grok некоторые «мысли» ИИ скрываются в процессе рассуждения, чтобы предотвратить дистилляцию — метод, используемый разработчиками конкурирующих ИИ-моделей для извлечения знаний из других нейросетей.

 Grok 3 и его мини-версия превзошли конкурентов в тестах на математику, естественные науки и программирование, обогнав GPT-4o, Gemini-2 Pro и DeepSeek-V3

Grok 3 и его мини-версия превзошли конкурентов в тестах на математику, естественные науки и программирование, обогнав GPT-4o, Gemini-2 Pro и DeepSeek-V3

Ещё одной важной новацией стало появление DeepSearch — инструмента, построенного на базе «думающих» ИИ-моделей. Он выполняет интеллектуальный поиск по открытым источникам в интернете и данным социальной сети X, анализируя массивы информации и формируя сжатые аналитические сводки. Эта функциональность делает DeepSearch аналогом OpenAI Deep Research, но с более интегрированным подходом к обработке данных. На данный момент доступ к Grok 3 предоставляется подписчикам X Premium+, стоимость подписки составляет $22 в месяц. Дополнительно компания xAI запустила новый тариф SuperGrok, который стоит $30 в месяц или $300 в год. В него входят расширенные возможности reasoning-запросов, более глубокий анализ через DeepSearch и неограниченная генерация изображений.

 Работа DeepSearch в интерфейсе Grok 3, где система выполняет анализ и поиск актуальной информации о предстоящем запуске Starship от SpaceX

Работа DeepSearch в интерфейсе Grok 3, где система выполняет анализ и поиск актуальной информации о предстоящем запуске Starship от SpaceX

В течение ближайшей недели приложение Grok получит обновление, которое добавит голосовой режим, позволяющий Grok общаться с пользователями синтезированным голосом. В дальнейшем, через несколько недель, Grok 3 станет доступен через корпоративный API xAI, что позволит компаниям интегрировать DeepSearch в свои бизнес-процессы. По словам Маска, его компания планирует открыть исходный код Grok 2: «Наш подход заключается в том, что мы выкладываем последнюю версию [Grok] в открытый доступ, когда следующая версия полностью готова. Когда Grok 3 станет зрелой и стабильной, что, вероятно, произойдёт в течение нескольких месяцев, тогда мы откроем исходный код Grok 2». Это означает, что после окончательной стабилизации работы Grok 3 разработчики смогут изучать исходный код его предшественника.

Первоначально Grok позиционировался как передовой и альтернативный ИИ, способный свободно обсуждать темы, которых избегают другие нейросети. Проведённые исследования показали, что до выхода Grok 3 ИИ-модель демонстрировала политический уклон, особенно в вопросах разнообразия и неравенства. Маск объяснил это тем, что обучающие данные включали общедоступные веб-страницы, отражающие определённые идеологические позиции. Маск пообещал, что Grok 3 будет более политически нейтральным, однако пока неясно, удалось ли xAI достичь этой цели.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Календарь релизов 6 – 12 апреля: Starfield: Terran Armada, DarkSwitch и People of Note 41 мин.
На момент анонса State of Decay 3 существовала лишь в виде документа Word — никаких зомби-животных в игре не будет 4 ч.
Китайские власти не смогли заблокировать мессенджер Bitchat, поэтому заставили Apple его удалить 6 ч.
В РКН пожаловались на резкий скачок DDoS-атак на государственные информресурсы в феврале–марте 8 ч.
«Это только начало»: авторы Arc Raiders сделали крафтинг удобнее и пообещали впредь реагировать на жалобы игроков 8 ч.
Список достижений Starfield раскрыл неанонсированные секреты дополнения Terran Armada 10 ч.
В Google Play появилась функция поиска по отзывам 10 ч.
Британцы пытаются «заманить» к себе Anthropic после конфликта с Пентагоном 11 ч.
Свежий трейлер аркадного авиасимулятора Ace Combat 8: Wings of Theve показал, какой путь серия проделала за 30 лет 11 ч.
Глава разработки Skyblivion объяснил, зачем команде срочно понадобились новые специалисты, хотя ремейк уже на финишной прямой 11 ч.
Intel внезапно представила пару мобильных процессоров серий Arrow Lake-HX и Panther Lake 4 ч.
Объявлена дата анонса смартфонов Honor 600 и 600 Pro — новинки уже показались во всей красе 4 ч.
Умные очки Meta научились изучать еду пользователя и рассказывать о её питательной ценности 4 ч.
Дефицит Mac Mini и Mac Studio усугубляется: сроки поставки растянулись вплоть до сентября 5 ч.
Intel пообещала и дальше выпускать устаревающие процессоры Raptor Lake, чтобы помочь пережить дефицит DDR5 6 ч.
Развитие ИИ в США теперь зависит от электрооборудования из Китая, а санкции и пошлины только усугубляют дело 7 ч.
Tesla отделалась от расследования по поводу одной из функций автопилота, просто обновив ПО 9 ч.
Тайвань заподозрил ещё 11 китайских компаний в агрессивном переманивании чиповых специалистов 10 ч.
Люди впервые за полвека оказались в сфере гравитационного влияния Луны — важный этап Artemis II 10 ч.
Dell’Oro Group: мировая телеком-отрасль снизит затраты в 2026 году 11 ч.