Сегодня 16 апреля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Свежая версия ИИ Google Gemini обошла в тестах GPT-4o и Claude-3

Последняя версия большой языковой модели Gemini 1.5 Pro внезапно пробилась на верхушку рейтинга на платформе Chatbot Arena, обойдя в тестах традиционных лидеров в области генеративного искусственного интеллекта — OpenAI GPT-4o и Anthropic Claude-3.

 Источник изображения: blog.google

Источник изображения: blog.google

Бывшая прежде чемпионом нейросеть OpenAI GPT-4o уступила лидерство 1 августа, когда Google без громких анонсов выпустила экспериментальную сборку своей последней модели — она быстро привлекла интересующееся ИИ сообщество в соцсетях, которое сочло победу в бенчмарке свидетельством качества. Сервис OpenAI ChatGPT стал почти синонимом генеративного ИИ с момента запуска ещё в эпоху GPT-3. К настоящему моменту устоявшимися лидерами считаются OpenAI GPT-4o и Anthropic Claude-3, которые за последний год почти не знали конкурентов в тестах.

 Источник изображения: x.com/lmsysorg

Источник изображения: x.com/lmsysorg

Один из наиболее популярных тестов — LMSYS Chatbot Arena. Он предлагает моделям различные задачи и присваивает им оценки. Актуальная версия GPT-4o смогла набрать 1286 баллов, а Claude-3 — 1271 балл. У предыдущей Google Gemini 1.5 Pro рейтинг был 1261, но выпущенная 1 августа Gemini 1.5 Pro 0801 внезапно получила колоссальные 1300 баллов. Это может свидетельствовать, что новая нейросеть Google способнее своих конкурентов, но бенчмарки не всегда точно отражают, что может и чего не может модель ИИ.

Современный рынок чат-ботов уже достаточно созрел, чтобы предложить потребителю несколько вариантов и дать ему возможность самому решить, какой ИИ подходит лучше всего. Пока нет ясности, станет ли экспериментальная Gemini 1.5 Pro версией по умолчанию в будущем. Она остаётся общедоступной, но с экспериментальным статусом может быть закрыта или радикально отредактирована по соображениям безопасности или другим причинам.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Нуарный ретрошутер Mouse: P.I. For Hire стартовал в Steam с рейтингом 94 % 37 мин.
Nvidia выпустила драйвер с поддержкой Pragmata, Neverness to Everness и Windrose 4 ч.
Эпичный финал: для Atomic Heart вышло масштабное сюжетное дополнение «Кровь на Хрустале» 4 ч.
«Вот это похоже на фильм по видеоигре»: первый полноценный трейлер экранизации Street Fighter произвёл фурор среди фанатов 4 ч.
Anthropic представила флагманскую ИИ-модель Opus 4.7 — она стала «самостоятельнее» и лучше в сложных задачах 5 ч.
Google с помощью ИИ заблокировала 8,3 млрд рекламных объявлений за 2025 год — на 60 % больше, чем годом ранее 5 ч.
Зачем читать классику, если можно в неё играть — Character.AI получил режим «Книги», который превращает чтение в ролевую игру 6 ч.
Windrose подтвердила, что геймеры соскучились по пиратским играм — 500 тысяч проданных копий за два дня 7 ч.
ЕС обязал Google открыть конкурентам доступ к поисковым данным 7 ч.
«Алиса AI» предложит помощь в подготовке к школьным экзаменам 8 ч.
Ракета Blue Origin New Glenn прошла огневые испытания перед первым повторным запуском в воскресенье 17 мин.
Keychron представила геймерские беспроводные мыши G4 и G5 по цене $80 и $110 2 ч.
Эксперты бьют тревогу в связи с неготовностью сетей к ИИ-трафику 3 ч.
Apple похвасталась экологичностью: её продукты на 30 % созданы из переработанных материалов 4 ч.
Honor представила ноутбуки MagicBook 14 и 16 2026 с чипами Intel Panther Lake и автономностью свыше 15 часов 4 ч.
DJI представила блогерскую камеру Osmo Pocket 4 — 1″ сенсор, замедленное видео в 4K и больше 100 Гбайт 6 ч.
Gigabyte представила блоки питания Gaming — до 1000 Вт и защита T-Guard от выгорания 12V-2x6 6 ч.
Starlink продолжает бурный рост: число пользователей увеличилось более чем вдвое 6 ч.
AMD объявила, когда её процессоры получат поддержку памяти LPDDR5X SOCAMM2 6 ч.
Meta подняла цены на VR-гарнитуры Quest 3S и Quest 3 — и снова из-за дефицита памяти 6 ч.