Сегодня 11 сентября 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Свежая версия ИИ Google Gemini обошла в тестах GPT-4o и Claude-3

Последняя версия большой языковой модели Gemini 1.5 Pro внезапно пробилась на верхушку рейтинга на платформе Chatbot Arena, обойдя в тестах традиционных лидеров в области генеративного искусственного интеллекта — OpenAI GPT-4o и Anthropic Claude-3.

 Источник изображения: blog.google

Источник изображения: blog.google

Бывшая прежде чемпионом нейросеть OpenAI GPT-4o уступила лидерство 1 августа, когда Google без громких анонсов выпустила экспериментальную сборку своей последней модели — она быстро привлекла интересующееся ИИ сообщество в соцсетях, которое сочло победу в бенчмарке свидетельством качества. Сервис OpenAI ChatGPT стал почти синонимом генеративного ИИ с момента запуска ещё в эпоху GPT-3. К настоящему моменту устоявшимися лидерами считаются OpenAI GPT-4o и Anthropic Claude-3, которые за последний год почти не знали конкурентов в тестах.

 Источник изображения: x.com/lmsysorg

Источник изображения: x.com/lmsysorg

Один из наиболее популярных тестов — LMSYS Chatbot Arena. Он предлагает моделям различные задачи и присваивает им оценки. Актуальная версия GPT-4o смогла набрать 1286 баллов, а Claude-3 — 1271 балл. У предыдущей Google Gemini 1.5 Pro рейтинг был 1261, но выпущенная 1 августа Gemini 1.5 Pro 0801 внезапно получила колоссальные 1300 баллов. Это может свидетельствовать, что новая нейросеть Google способнее своих конкурентов, но бенчмарки не всегда точно отражают, что может и чего не может модель ИИ.

Современный рынок чат-ботов уже достаточно созрел, чтобы предложить потребителю несколько вариантов и дать ему возможность самому решить, какой ИИ подходит лучше всего. Пока нет ясности, станет ли экспериментальная Gemini 1.5 Pro версией по умолчанию в будущем. Она остаётся общедоступной, но с экспериментальным статусом может быть закрыта или радикально отредактирована по соображениям безопасности или другим причинам.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Ролевой шутер Witchfire от бывших создателей Painkiller и Bulletstorm не выйдет из раннего доступа в 2025 году — представлен обновлённый план 43 мин.
YouTube добавил функцию ИИ-дубляжа видео на разных языках для всех авторов 2 ч.
Кольцо смерти, огромная карта на 100 человек и «разрушения повсюду»: разработчики Battlefield 6 раскрыли подробности королевской битвы 2 ч.
Владельцы iPhone 14 и 15 получат ещё один бесплатный год спутниковых функций 3 ч.
«Росгосстрах Жизнь» перевела ИТ-инфраструктуру на экосистему «Базис» 4 ч.
«Росгосстрах Жизнь» перевела ИТ-инфраструктуру на экосистему «Базис» 4 ч.
OpenAI купит у Oracle вычислительные мощности для развития ИИ за баснословные $300 млрд 6 ч.
Microsoft отменила дань для разработчиков, публикующих приложения в Microsoft Store 15 ч.
Фильм по BioShock «однозначно» будет основан на первой BioShock и выйдет нескоро 16 ч.
Microsoft закрыла 80 уязвимостей в Windows и Office, включая восемь критических 17 ч.
MSI выпустила лимитированный ноутбук Prestige 13 AI+ Ukiyo-e Edition с японской гравюрой на крышке 34 мин.
AMD не признаёт поражения на графическом направлении и обещает нокаутировать Nvidia с помощью Instinct MI450 45 мин.
Российские объёмы предзаказов на iPhone 17 стали самыми высокими с 2023 года 2 ч.
Самое громкое в истории столкновение черных дыр подтвердило теорию Стивена Хокинга 2 ч.
Продажи электромобилей в России возобновили падение, но самой популярной маркой остаётся Zeekr 3 ч.
Hobot представил на выставке IFA 2025 два инновационных робота-мойщика окон 3 ч.
NASA обнаружило «явное свидетельство» древних форм жизни на Марсе 3 ч.
Индия изучит возможность переоборудования старых угольных шахт в дата-центры 3 ч.
Эксплуатация Starship для доставки стотонных грузов на орбиту начнётся уже в 2026 году 4 ч.
XPeng наладит серийный выпуск электролётов в октябре и надеется выйти на европейский рынок 4 ч.