Сегодня 30 марта 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Свежая версия ИИ Google Gemini обошла в тестах GPT-4o и Claude-3

Последняя версия большой языковой модели Gemini 1.5 Pro внезапно пробилась на верхушку рейтинга на платформе Chatbot Arena, обойдя в тестах традиционных лидеров в области генеративного искусственного интеллекта — OpenAI GPT-4o и Anthropic Claude-3.

 Источник изображения: blog.google

Источник изображения: blog.google

Бывшая прежде чемпионом нейросеть OpenAI GPT-4o уступила лидерство 1 августа, когда Google без громких анонсов выпустила экспериментальную сборку своей последней модели — она быстро привлекла интересующееся ИИ сообщество в соцсетях, которое сочло победу в бенчмарке свидетельством качества. Сервис OpenAI ChatGPT стал почти синонимом генеративного ИИ с момента запуска ещё в эпоху GPT-3. К настоящему моменту устоявшимися лидерами считаются OpenAI GPT-4o и Anthropic Claude-3, которые за последний год почти не знали конкурентов в тестах.

 Источник изображения: x.com/lmsysorg

Источник изображения: x.com/lmsysorg

Один из наиболее популярных тестов — LMSYS Chatbot Arena. Он предлагает моделям различные задачи и присваивает им оценки. Актуальная версия GPT-4o смогла набрать 1286 баллов, а Claude-3 — 1271 балл. У предыдущей Google Gemini 1.5 Pro рейтинг был 1261, но выпущенная 1 августа Gemini 1.5 Pro 0801 внезапно получила колоссальные 1300 баллов. Это может свидетельствовать, что новая нейросеть Google способнее своих конкурентов, но бенчмарки не всегда точно отражают, что может и чего не может модель ИИ.

Современный рынок чат-ботов уже достаточно созрел, чтобы предложить потребителю несколько вариантов и дать ему возможность самому решить, какой ИИ подходит лучше всего. Пока нет ясности, станет ли экспериментальная Gemini 1.5 Pro версией по умолчанию в будущем. Она остаётся общедоступной, но с экспериментальным статусом может быть закрыта или радикально отредактирована по соображениям безопасности или другим причинам.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Россиянам запретят пополнение Apple ID с мобильного счёта — так распорядились власти РФ 2 ч.
Dolby подала в суд на Snapchat за использование бесплатного кодека AV1 4 ч.
«Это буквально всё, что мне было нужно»: трейлер с датой выхода файтинга Avatar Legends: The Fighting Game привёл фанатов в восторг 5 ч.
Samsung и Google научат Android передавать файлы касанием — почти как AirDrop 6 ч.
Блогеры в Telegram стали публиковать больше контента после начала блокировки мессенджера 6 ч.
Warhorse уволила переводчика Kingdom Come: Deliverance 2, чтобы заменить его на ИИ 7 ч.
Новая студия создателя The Stanley Parable не нашла денег на следующую игру и скоро закроется, а Wanderstop ждёт «последний сюрприз» 8 ч.
PUBG: Blindspot проживёт в раннем доступе Steam меньше двух месяцев — Krafton свернула разработку неудачного ответвления PUBG 8 ч.
«Базис» реализовал в Basis Workplace поддержку геораспределённой инфраструктуры 8 ч.
«Базис» реализовал в Basis Workplace поддержку геораспределённой инфраструктуры 8 ч.
MSI выпустила 27-дюймовый монитор Pro Max 271QPHW E14 с круговой поляризацией, QHD и 144 Гц 14 мин.
США ускорят отказ от медных телеком-сетей 2 ч.
Исследователи разработали «глубинный Wi-Fi» — беспроводную передачу данных под землёй на глубину до 100 метров 3 ч.
За первую неделю Xiaomi поставила 5000 обновлённых электромобилей Xiaomi SU7 3 ч.
Биткоин больше не кормит — майнеры срочно переключаются на ИИ 3 ч.
Французская Mistral AI привлекла в долг $830 млн для оснащения ИИ ЦОД и конкуренции с американскими техногигантами 3 ч.
Новая статья: Обзор и тестирование корпуса Ocypus Iota C70 Curve ARGB: дом стоит, свет горит… 4 ч.
Японская Rapidus ускорит освоение техпроцессов тоньше 2 нм — отставание от TSMC хотят свести до шести месяцев 4 ч.
Дефицит 3-нм чипов продолжит обостряться — TSMC отдаёт приоритет ИИ и ключевым клиентам 5 ч.
Производительность ирландского суперкомпьютера CASPIr составит 15 Пфлопс 5 ч.