Сегодня 29 ноября 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Свежая версия ИИ Google Gemini обошла в тестах GPT-4o и Claude-3

Последняя версия большой языковой модели Gemini 1.5 Pro внезапно пробилась на верхушку рейтинга на платформе Chatbot Arena, обойдя в тестах традиционных лидеров в области генеративного искусственного интеллекта — OpenAI GPT-4o и Anthropic Claude-3.

 Источник изображения: blog.google

Источник изображения: blog.google

Бывшая прежде чемпионом нейросеть OpenAI GPT-4o уступила лидерство 1 августа, когда Google без громких анонсов выпустила экспериментальную сборку своей последней модели — она быстро привлекла интересующееся ИИ сообщество в соцсетях, которое сочло победу в бенчмарке свидетельством качества. Сервис OpenAI ChatGPT стал почти синонимом генеративного ИИ с момента запуска ещё в эпоху GPT-3. К настоящему моменту устоявшимися лидерами считаются OpenAI GPT-4o и Anthropic Claude-3, которые за последний год почти не знали конкурентов в тестах.

 Источник изображения: x.com/lmsysorg

Источник изображения: x.com/lmsysorg

Один из наиболее популярных тестов — LMSYS Chatbot Arena. Он предлагает моделям различные задачи и присваивает им оценки. Актуальная версия GPT-4o смогла набрать 1286 баллов, а Claude-3 — 1271 балл. У предыдущей Google Gemini 1.5 Pro рейтинг был 1261, но выпущенная 1 августа Gemini 1.5 Pro 0801 внезапно получила колоссальные 1300 баллов. Это может свидетельствовать, что новая нейросеть Google способнее своих конкурентов, но бенчмарки не всегда точно отражают, что может и чего не может модель ИИ.

Современный рынок чат-ботов уже достаточно созрел, чтобы предложить потребителю несколько вариантов и дать ему возможность самому решить, какой ИИ подходит лучше всего. Пока нет ясности, станет ли экспериментальная Gemini 1.5 Pro версией по умолчанию в будущем. Она остаётся общедоступной, но с экспериментальным статусом может быть закрыта или радикально отредактирована по соображениям безопасности или другим причинам.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Новая статья: PowerWash Simulator 2 — опять работать. Рецензия 6 ч.
Американцы стали уходить из X, отдавая предпочтение TikTok 7 ч.
Амбициозный авиасимулятор «Корея. Серия Ил-2» перенесли на 2026 год — новый трейлер и предзаказ с «максимальной скидкой» 9 ч.
OpenAI урезала лимиты на генерацию контента с помощью Sora — Google так же поступила с Nano Banana Pro 9 ч.
«РТК-ЦОД» запустила новую площадку «Облака КИИ» в московском дата-центре 9 ч.
Перенос GTA VI не помешает Forza Horizon 6 — инсайдер уточнил, когда выйдет новый гоночный хит от Playground Games 9 ч.
«Дорога была долгой, но скоро мы будем дома»: возрождённая ролевая песочница Hytale в духе Minecraft наконец получила дату выхода в раннем доступе 11 ч.
Энтузиасты раскопали бета-версию Fallout: New Vegas с массой вырезанного контента 12 ч.
Гора с плеч: SEC отказалась от иска к SolarWinds и её шефу по безопасности из-за нашумевшей атаки SUNBURST пятилетней давности 14 ч.
В Туркменистане узаконили майнинг и криптовалютные биржи 14 ч.
Японский электрокар Owl Roadster установил новый мировой рекорд разгона почти до сотни 5 ч.
Google внезапно самоустранилась из антимонопольного спора с Microsoft по поводу облаков в Европе 8 ч.
Erying выпустила настольные материнские платы с мобильными процессорами Intel Core Ultra 200H 8 ч.
Хитрый трюк помог станции NASA развенчать дутую сенсацию о подземном озере на Марсе 9 ч.
Сбой в системе охлаждения ЦОД обрушил крупнейшую в мире товарную биржу CME 9 ч.
По слухам, Apple возобновит сотрудничество с Intel в сфере чипов, но не как раньше 9 ч.
Сбой системы охлаждения ЦОД остановил торги на крупнейшей в мире бирже деривативов 12 ч.
Российский рынок IT резко замедлил рост в 2025 году — продажи оборудования и вовсе упадут 12 ч.
Фрески из Помпей помогут восстановить роботы 12 ч.
Alibaba и ByteDance натренировались тренировать передовые ИИ-модели в ЦОД Юго-Восточной Азии 12 ч.