Сегодня 19 ноября 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

xAI выпустила Grok 4.1 — ИИ-модель заняла первое место в независимых тестах LMArena

Компания xAI Илона Маска (Elon Musk) приступила к глобальному развёртыванию модели Grok 4.1 и «думающей версии» Grok 4.1 Thinking, которые представляют собой улучшенные версии предыдущей модели Grok 4. Оба продукта доступны для бесплатного использования, однако для пользователей с платной подпиской действуют менее строгие ограничения.

 Источник изображений: bleepingcomputer.com

Источник изображений: bleepingcomputer.com

По заявлению представителей компании, новая модель Grok 4.1 показала в тестах трёхкратное снижение вероятности генерации недостоверной информации, или, как сейчас принято говорить, «галлюцинаций», по сравнению со своими предшественниками, что позволяет назвать данное обновление одним из самых успешных в истории стартапа xAI.

Работа новых моделей была протестирована в рамках независимого открытого проекта LMArena, который специализируется на сравнительном анализе крупных языковых моделей (LLM) с помощью «слепых» рандомизированных тестов. Согласно полученным результатам, обе новинки показали выдающиеся результаты в самой конкурентной среде этой платформы. Так, модель Grok 4.1 Thinking возглавила экспертный рейтинг LMArena, набрав 1483 баллов, в то время как базовая версия Grok 4.1 заняла в этом же рейтинге 2-ю строчку с результатом в 1465 баллов. Специалисты платформы отметили, что данный результат означает улучшение более чем на 40 баллов по сравнению с моделью Grok 4 fast, которая была представлена двумя месяцами ранее.

Несмотря на значительный прогресс, аналитики полагают, что Grok 4.1 может не стать лучшей моделью года, поскольку компания Google готовит к выпуску версию Gemini 3.0, которая, по предварительным оценкам, имеет потенциал и получит звание самой мощной LLM на сегодняшний день.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Авторы ремейка «Готики» рассказали и показали, как прокачали боевую систему благодаря отзывам игроков 54 мин.
Microsoft исправила проблему с установкой первого платного обновления безопасности для Windows 10 56 мин.
«Мы подвели весь интернет»: технический директор Cloudflare извинился за сбой, уронивший половину интернета 2 ч.
Релиз почтового сервера RuPost 4.0: поддержка геокластеризации и повышенная безопасность 2 ч.
Capcom похвасталась продажами Dragon’s Dogma 2 — игроки требуют обещанных улучшений и DLC 3 ч.
xAI намерена привлечь $15 млрд инвестиций и увеличить оценку до $230 млрд — более чем вдвое дешевле OpenAI 3 ч.
В Chrome нашли опасную уязвимость, которую уже используют хакеры — вышел экстренный патч 13 ч.
Electronic Arts и Codemasters анонсировали переосмысление симуляторов «Формулы-1» — F1 26 не будет 15 ч.
AMD представит технологию FSR Redstone с реконструкцией лучей и не только 10 декабря 16 ч.
Спасение галактики, истребление пауков и многое другое: Microsoft раскрыла, какие игры пополнят Game Pass в конце ноября и начале декабря 17 ч.
Jeep представила электрический внедорожник Recon со съёмными дверями и задними стёклами за $65 000 12 мин.
«Яндекс» выпустил «Станцию 3» мощностью 50 Вт с окружающей подсветкой и пиксельным дисплеем 14 мин.
DJI начала продажи экшн-камеры Osmo Action 6 с квадратным сенсором по цене от €379 15 мин.
Второй европейский экзафлопсный суперкомпьютер Alice Recoque получит чипы AMD EPYC Venice и ускорители Instinct MI430X 48 мин.
Телевизоры TCL серий X, C и P: обзор актуальной линейки 2 ч.
«Samsung не нужен»: лондонские грабители брезгуют Android-смартфонами, предпочитая iPhone 2 ч.
Блок питания SAMA P1200 — «платиновый» КПД и два разъема 12V-2x6 2 ч.
Huawei строит антисанкционную экосистему — более 60 китайских компаний получили инвестиции 2 ч.
Китайцы создали первый в мире экзоскелет для дайверов, который помогает «шевелить ластами» 3 ч.
Видео: страхующий водитель роботакси Tesla задремал прямо за рулём 3 ч.