Сегодня 26 марта 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Свежая версия ИИ Google Gemini обошла в тестах GPT-4o и Claude-3

Последняя версия большой языковой модели Gemini 1.5 Pro внезапно пробилась на верхушку рейтинга на платформе Chatbot Arena, обойдя в тестах традиционных лидеров в области генеративного искусственного интеллекта — OpenAI GPT-4o и Anthropic Claude-3.

 Источник изображения: blog.google

Источник изображения: blog.google

Бывшая прежде чемпионом нейросеть OpenAI GPT-4o уступила лидерство 1 августа, когда Google без громких анонсов выпустила экспериментальную сборку своей последней модели — она быстро привлекла интересующееся ИИ сообщество в соцсетях, которое сочло победу в бенчмарке свидетельством качества. Сервис OpenAI ChatGPT стал почти синонимом генеративного ИИ с момента запуска ещё в эпоху GPT-3. К настоящему моменту устоявшимися лидерами считаются OpenAI GPT-4o и Anthropic Claude-3, которые за последний год почти не знали конкурентов в тестах.

 Источник изображения: x.com/lmsysorg

Источник изображения: x.com/lmsysorg

Один из наиболее популярных тестов — LMSYS Chatbot Arena. Он предлагает моделям различные задачи и присваивает им оценки. Актуальная версия GPT-4o смогла набрать 1286 баллов, а Claude-3 — 1271 балл. У предыдущей Google Gemini 1.5 Pro рейтинг был 1261, но выпущенная 1 августа Gemini 1.5 Pro 0801 внезапно получила колоссальные 1300 баллов. Это может свидетельствовать, что новая нейросеть Google способнее своих конкурентов, но бенчмарки не всегда точно отражают, что может и чего не может модель ИИ.

Современный рынок чат-ботов уже достаточно созрел, чтобы предложить потребителю несколько вариантов и дать ему возможность самому решить, какой ИИ подходит лучше всего. Пока нет ясности, станет ли экспериментальная Gemini 1.5 Pro версией по умолчанию в будущем. Она остаётся общедоступной, но с экспериментальным статусом может быть закрыта или радикально отредактирована по соображениям безопасности или другим причинам.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Инсайдер показал, как будет выглядеть iOS 19, но это не точно 6 мин.
Криптовалютный банк Трампа запустит свой стейблкоин, привязанный к доллару 59 мин.
Легендарный игровой журнал Game Informer вернулся из мёртвых благодаря студии Нила Бломкампа 3 ч.
CD Projekt подтвердила, когда выйдет The Witcher 4 — не раньше 2027 года 13 ч.
Правительство возьмёт объекты КИИ на карандаш и наведёт порядок в деле миграции на отечественное ПО 13 ч.
Новая компания сооснователя Blizzard анонсировала мультиплеерный шутер Wildgate, который выглядит как Sea of Thieves в космосе 14 ч.
Google представила Gemini 2.5 Pro — свою самую умную ИИ-модель, которая превзошла OpenAI o3 14 ч.
Инсайдер раскрыл план выпуска игр для Nintendo Switch 2 — консоль выйдет в июне 15 ч.
ЕС намерен «обуздать хищническую монетизацию» игр и запретить продажу внутриигровой валюты детям 16 ч.
Vampire: The Masquerade — Bloodlines 2 не выйдет в первой половине 2025 года, но есть и хорошая новость 16 ч.
Российские производители электроники пожаловались на слабые продажи и попросили субсидий и ограничений импорта 30 мин.
BMW объединилась с Alibaba для совместной разработки автомобильного ИИ 58 мин.
Руководитель Alibaba предупредил о перегреве рынка ЦОД для искусственного интеллекта 60 мин.
SMART Modular представила энергонезависимые модули памяти CXL E3.S 2 ч.
Объём рынка корпоративного WLAN-оборудования в 2024 году сократился на 12,7 % 2 ч.
Учёные открыли чёрные дыры «на максималках» — сегодня таких уже нет 2 ч.
Sony представила беспроводные наушники WF-C710N за $120 с улучшенным шумоподавлением и повышенной автономностью 2 ч.
Xenium X680 — классическая кнопочная раскладушка, с привлекательным дизайном и высокой автономностью 3 ч.
Производители газовых турбин с трудом справляются с заказами для ИИ ЦОД, но расширять производство опасаются 4 ч.
Qualcomm наябедничала на Arm антимонопольным органам сразу в трёх регионах 4 ч.