Сегодня 19 апреля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Модель o3 от OpenAI разгромила Grok Илона Маска в шахматном турнире

Модель o3 от OpenAI победила модель Grok 4, разработанную компанией xAI, со счётом 4:0 в финале шахматного турнира Kaggle AI Exhibition, сообщает The Independent. В соревновании также участвовали другие ИИ-модели от Anthropic, DeepSeek, Google и Moonshot AI. Финальный поединок приобрёл особый смысл на фоне крайне натянутых отношений сооснователей OpenAI Сэма Альтмана (Sam Altman) и Илона Маска (Elon Musk), который после ухода из OpenAI попытался приобрести компанию.

 Источник изображения: Steve Johnson/Unsplash

Источник изображения: Steve Johnson/Unsplash

В финале турнира модель o3 продемонстрировала безупречную игру, выиграв все четыре партии у Grok 4. Обе системы прошли в финал, одолев конкурентов на предыдущих этапах. В ответ на поражение Grok 4 в шахматах Маск заявил, что игровая способность модели является «дополнительным эффектом» и не была приоритетом при её разработке.

Способность компьютеров обыгрывать лучших шахматистов мира известна с 1997 года, когда суперкомпьютер IBM Deep Blue победил Гарри Каспарова. Позже компания Google DeepMind создала ИИ-модель, способную самообучаться игре в шахматы и го. Однако новый турнир стал первым крупным соревнованием, где тестировались большие языковые модели (LLM), подобные ChatGPT.

Генеральный директор и сооснователь Take Take Take Матс Андре Кристиансен (Mats André Kristiansen) отметил, что, хотя в 1990-х матч Каспарова против Deep Blue стал громким событием, ключевая ценность нынешнего турнира заключается в исследовании того, как современные ИИ модели рассуждают и принимают решения.

Интересно, что в июле действующий чемпион мира по шахматам Магнус Карлсен (Magnus Carlsen) победил ChatGPT в онлайн-матче, не потеряв ни одной фигуры. Комментируя финал между Grok и o3, Карлсен оценил шахматный рейтинг Grok примерно в 800 пунктов, а модель o3 в 1200. Для сравнения, его собственный рейтинг на пике составляет 2882 пунктов. Отвечая на вопрос пользователя в соцсети X, сам Grok оценил свой уровень в диапазоне от 1600 до 1800.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Индийские власти решили не требовать предустанавливать государственное приложение на смартфоны 42 мин.
Ситуация вышла из под контроля: разработчики открытого ПО тонут в потоке багрепортов, найденных ИИ 2 ч.
Приложение ЕС для проверки возраста провалило публичные тесты на безопасность 5 ч.
Новая статья: Samson — «Смута» не у нас дома. Рецензия 13 ч.
World Альтмана выйдет за пределы крипто: верификация настоящих людей появится в Tinder и других сервисах 22 ч.
ИИ показал прогресс в изучении редких и малоизвестных языков 22 ч.
Microsoft добавила режим Xbox в Windows 11 на ПК, ноутбуках и планшетах 18-04 11:00
Специалисты нашли фундаментальную брешь в безопасности большинства смартфонов Samsung, Xiaomi, Nokia и Honor 18-04 10:45
Исследователь слил уязвимости Windows, которые проигнорировала Microsoft — хакеры уже их используют 18-04 08:20
На этой неделе OpenAI потеряла ещё троих руководителей 18-04 06:40
Samsung закрыла приём заказов на LPDDR4/4X и направит освободившиеся мощности на выпуск 1c DRAM 5 ч.
После отказа от выпуска электромобилей проект Afeela компаний Sony и Honda продолжит работу 6 ч.
Samsung, SK Hynix и Micron покроют лишь 60 % мирового спроса на DRAM, а дефицит продлится до 2027 года 6 ч.
От исторического максимума 2000 года курс акций Intel отделяют всего 8 % 6 ч.
Дефицит процессоров бьёт по рынку сильнее, чем рынок памяти 7 ч.
Lenovo открыла региональную штаб-квартиру в Эр-Рияде 17 ч.
Суд возобновил иск VLSI к Intel на $3 млрд и передал патентный спор на рассмотрение присяжных 17 ч.
В I квартале мировые поставки ПК выросли на 3,2 % — покупателей испугал рост цен на память 18 ч.
Plaion возродила ретро-приставку Neo Geo AES — новая версия поддерживает оригинальные картриджи и ЭЛТ-телевизоры 18 ч.
AOC выпустила 24,5-дюймовый игровой монитор 25G51F — Full HD, 180 Гц и поддержка VRR всего на $77 20 ч.