Сегодня 09 июня 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

xAI выпустила Grok 4.1 — ИИ-модель заняла первое место в независимых тестах LMArena

Компания xAI Илона Маска (Elon Musk) приступила к глобальному развёртыванию модели Grok 4.1 и «думающей версии» Grok 4.1 Thinking, которые представляют собой улучшенные версии предыдущей модели Grok 4. Оба продукта доступны для бесплатного использования, однако для пользователей с платной подпиской действуют менее строгие ограничения.

 Источник изображений: bleepingcomputer.com

Источник изображений: bleepingcomputer.com

По заявлению представителей компании, новая модель Grok 4.1 показала в тестах трёхкратное снижение вероятности генерации недостоверной информации, или, как сейчас принято говорить, «галлюцинаций», по сравнению со своими предшественниками, что позволяет назвать данное обновление одним из самых успешных в истории стартапа xAI.

Работа новых моделей была протестирована в рамках независимого открытого проекта LMArena, который специализируется на сравнительном анализе крупных языковых моделей (LLM) с помощью «слепых» рандомизированных тестов. Согласно полученным результатам, обе новинки показали выдающиеся результаты в самой конкурентной среде этой платформы. Так, модель Grok 4.1 Thinking возглавила экспертный рейтинг LMArena, набрав 1483 баллов, в то время как базовая версия Grok 4.1 заняла в этом же рейтинге 2-ю строчку с результатом в 1465 баллов. Специалисты платформы отметили, что данный результат означает улучшение более чем на 40 баллов по сравнению с моделью Grok 4 fast, которая была представлена двумя месяцами ранее.

Несмотря на значительный прогресс, аналитики полагают, что Grok 4.1 может не стать лучшей моделью года, поскольку компания Google готовит к выпуску версию Gemini 3.0, которая, по предварительным оценкам, имеет потенциал и получит звание самой мощной LLM на сегодняшний день.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Apple представила функцию разделения общего счёта за ужин по фотографии чека 48 мин.
iOS 27 получила настраиваемый эквалайзер для AirPods и передачу данных о пульсе через GymKit 6 ч.
Apple лишила не слишком старые iPad и Watch поддержки iPadOS 27 и watchOS 27 6 ч.
Apple представила visionOS 27 с поддержкой Siri AI и изогнутых окон 7 ч.
В iOS 27 появятся новые ИИ-инструменты для редактирования фотографий в «Фото» 7 ч.
Европейцы не получат Siri AI вместе с iOS 27 — Apple винит в этом закон DMA 7 ч.
Apple радикально обновила Apple Intelligence, опираясь на Google Gemini 8 ч.
Apple представила новую Siri, снова — Siri AI поселилась на островке iPhone, работает с Google Gemini и умеет анализировать экран 9 ч.
После семи лет разработки олдскульная ролевая игра Sea of Stars от создателей The Messenger получила прощальное обновление и вышла на Switch 2 10 ч.
Meta обвинила создателя шпионского софта Pegasus в нарушении судебного запрета и новых атаках на WhatsApp 10 ч.
OpenAI запустила проект Economic Research Exchange для изучения влияния ИИ на экономику 2 ч.
Новая статья: Компьютер месяца — июнь 2026 года 4 ч.
Google заказала у Intel изготовление 3 млн TPU — у TSMC спрос превысил возможности производства 6 ч.
Новая статья: Крах доктрины: авария тяжелой ракеты New Glenn оставила NASA в полной зависимости от SpaceX 6 ч.
Google заказала у Intel производство 3 млн ИИ-процессоров TPU 10 ч.
Акции TSMC и других азиатских техногигантов массово дешевеют вслед за американскими 13 ч.
Россиян не будут заставлять регистрировать аккаунты через отечественные e-mail — «Антифрод 2.0» доработали 14 ч.
Эстонская Skeleton Technologies представила суперконденсаторные ИБП GrapheneUPS для ИИ ЦОД 14 ч.
Российский рынок радиоэлектроники достиг 4 трлн рублей, но зависимость от импорта остаётся высокой 14 ч.
Стартап Windrose Electric, разрабатывающий электрические грузовики, представил концепцию ИИ ЦОД на колёсах 15 ч.