Сегодня 05 мая 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Свежая версия ИИ Google Gemini обошла в тестах GPT-4o и Claude-3

Последняя версия большой языковой модели Gemini 1.5 Pro внезапно пробилась на верхушку рейтинга на платформе Chatbot Arena, обойдя в тестах традиционных лидеров в области генеративного искусственного интеллекта — OpenAI GPT-4o и Anthropic Claude-3.

 Источник изображения: blog.google

Источник изображения: blog.google

Бывшая прежде чемпионом нейросеть OpenAI GPT-4o уступила лидерство 1 августа, когда Google без громких анонсов выпустила экспериментальную сборку своей последней модели — она быстро привлекла интересующееся ИИ сообщество в соцсетях, которое сочло победу в бенчмарке свидетельством качества. Сервис OpenAI ChatGPT стал почти синонимом генеративного ИИ с момента запуска ещё в эпоху GPT-3. К настоящему моменту устоявшимися лидерами считаются OpenAI GPT-4o и Anthropic Claude-3, которые за последний год почти не знали конкурентов в тестах.

 Источник изображения: x.com/lmsysorg

Источник изображения: x.com/lmsysorg

Один из наиболее популярных тестов — LMSYS Chatbot Arena. Он предлагает моделям различные задачи и присваивает им оценки. Актуальная версия GPT-4o смогла набрать 1286 баллов, а Claude-3 — 1271 балл. У предыдущей Google Gemini 1.5 Pro рейтинг был 1261, но выпущенная 1 августа Gemini 1.5 Pro 0801 внезапно получила колоссальные 1300 баллов. Это может свидетельствовать, что новая нейросеть Google способнее своих конкурентов, но бенчмарки не всегда точно отражают, что может и чего не может модель ИИ.

Современный рынок чат-ботов уже достаточно созрел, чтобы предложить потребителю несколько вариантов и дать ему возможность самому решить, какой ИИ подходит лучше всего. Пока нет ясности, станет ли экспериментальная Gemini 1.5 Pro версией по умолчанию в будущем. Она остаётся общедоступной, но с экспериментальным статусом может быть закрыта или радикально отредактирована по соображениям безопасности или другим причинам.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Журналисты показали сражение с многоглазым козлом-шаманом из Elden Ring Nightreign — фанаты заинтригованы 3 мин.
«10 лет Гвинта»: CD Projekt Red пригласила игроков на празднование юбилея The Witcher 3: Wild Hunt 2 ч.
Календарь релизов — 5–11 мая: «Приключения капитана Блада», Hordes of Hunger и The Midnight Walk 2 ч.
Антимонопольный иск против Google может привести к исчезновению Firefox 3 ч.
Рынок DLP-систем взлетел на 40 % после принятия закона о штрафах за утечки персональных данных 4 ч.
Microsoft анонсировала Gears of War: Reloaded, в том числе для PS5 — дата выхода, технические улучшения и бесплатный апгрейд с подвохом 4 ч.
Apple оспорила решение суда, ограничившее её контроль над приложениями для iPhone 4 ч.
«До свидания, Skype»: Microsoft закрыла сервис, который когда-то первым принёс видеосвязь миллионам людей 6 ч.
В этом месяце Трамп заработает миллионы на криптовалюте всего за два вечера 6 ч.
«У нас появился шанс!»: звезда Kingdom Come: Deliverance 2 остался в восторге от переноса GTA VI 6 ч.
Ещё один повод избегать GeForce RTX 5060 Ti 8GB: карта «задыхается» без PCIe 5.0 51 мин.
Индонезия намерена построить АЭС на 10 ГВт в рамках масштабного энергетического экопроекта 53 мин.
Опубликованы детальные изображения каждого кристалла процессоров Intel Arrow Lake-S 2 ч.
Google и Broadcom совместно обеспечат кибербезопасность своих решений 4 ч.
США готовят закон об отслеживании ИИ-чипов после продажи, чтобы пресечь их контрабанду в Китай 4 ч.
1 Пбит/с через Атлантику: Meta намерена построить самый быстрый подводный кабель 5 ч.
Unitree представила робопса-пожарного с брандспойтом на месте головы 7 ч.
Профессиональная видеокарта Nvidia RTX Pro 6000 Blackwell Workstation Edition с 96 Гбайт GDDR7 поступила в продажу за €9000 8 ч.
Sparkle через пять месяцев после анонса выпустила видеокарту Arc B580 ROC Luna OC Ultra 10 ч.
XPeng показала человекоподобного робота Iron, который собирает электромобили 10 ч.