Сегодня 27 мая 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Свежая версия ИИ Google Gemini обошла в тестах GPT-4o и Claude-3

Последняя версия большой языковой модели Gemini 1.5 Pro внезапно пробилась на верхушку рейтинга на платформе Chatbot Arena, обойдя в тестах традиционных лидеров в области генеративного искусственного интеллекта — OpenAI GPT-4o и Anthropic Claude-3.

 Источник изображения: blog.google

Источник изображения: blog.google

Бывшая прежде чемпионом нейросеть OpenAI GPT-4o уступила лидерство 1 августа, когда Google без громких анонсов выпустила экспериментальную сборку своей последней модели — она быстро привлекла интересующееся ИИ сообщество в соцсетях, которое сочло победу в бенчмарке свидетельством качества. Сервис OpenAI ChatGPT стал почти синонимом генеративного ИИ с момента запуска ещё в эпоху GPT-3. К настоящему моменту устоявшимися лидерами считаются OpenAI GPT-4o и Anthropic Claude-3, которые за последний год почти не знали конкурентов в тестах.

 Источник изображения: x.com/lmsysorg

Источник изображения: x.com/lmsysorg

Один из наиболее популярных тестов — LMSYS Chatbot Arena. Он предлагает моделям различные задачи и присваивает им оценки. Актуальная версия GPT-4o смогла набрать 1286 баллов, а Claude-3 — 1271 балл. У предыдущей Google Gemini 1.5 Pro рейтинг был 1261, но выпущенная 1 августа Gemini 1.5 Pro 0801 внезапно получила колоссальные 1300 баллов. Это может свидетельствовать, что новая нейросеть Google способнее своих конкурентов, но бенчмарки не всегда точно отражают, что может и чего не может модель ИИ.

Современный рынок чат-ботов уже достаточно созрел, чтобы предложить потребителю несколько вариантов и дать ему возможность самому решить, какой ИИ подходит лучше всего. Пока нет ясности, станет ли экспериментальная Gemini 1.5 Pro версией по умолчанию в будущем. Она остаётся общедоступной, но с экспериментальным статусом может быть закрыта или радикально отредактирована по соображениям безопасности или другим причинам.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
CD Projekt Red анонсировала сюжетное дополнение «Баллады прошлого» к The Witcher 3: Wild Hunt и повышение системных требований игры 26 мин.
Трилогия классических стратегий Empire Earth спустя 25 лет вышла в Steam — в том числе российском 2 ч.
ИИ уличили в расизме при найме на работу 3 ч.
Sony без предупреждения сняла с продажи один из первых эксклюзивов PS5 3 ч.
Безумству храбрых: французский инженер троллит IT-гигантов сатирическими ИИ-нарезками с индюком 3 ч.
Apple усложнит жизнь уличным ворам — iPhone будет автоматически блокироваться, если его вырвут из рук 4 ч.
Пользователи бегут от Google из-за ИИ — поисковик DuckDuckGo резко прирос аудиторией 4 ч.
Сайт для оформления виз в Великобританию случайно опубликовал десятки тысяч паспортов и селфи заявителей 4 ч.
Серверы с ИИ-агентами по всему миру оказались под угрозой из-за ошибки фреймворка Starlette 9 ч.
Смартфоны Motorola уличили в скрытом внедрении партнёрских ссылок Amazon 9 ч.
ByteDance спустит почти всю прошлогоднюю прибыль на ИИ — капзатраты вырастут до $70 млрд 2 ч.
Флагманским смартфонам Samsung предрекли резкое подорожание в июне 2 ч.
ИИ-пузырь раздувается: SK hynix вслед за Micron подорожала до $1 триллиона 2 ч.
Дженсен Хуанг: компании используют ИИ как удобное оправдание для массовых увольнений 2 ч.
Китайцы сделали роботу кисть с почти человеческой гибкостью — пожмёт руку, погладит и обнимет как человек 2 ч.
Китай перейдёт на уличные камеры с ИИ для продвинутой слежки за населением 2 ч.
Минцифры расширило список данных о россиянах, которые операторы должны передавать силовикам 2 ч.
Создание базы NASA на Луне начнётся с трёх миссий, которые состоятся в этом году 3 ч.
Роботакси Tesla сдуваются: на линии осталось всего 20 машин, несмотря на громкие обещания Маска 3 ч.
Дефицит памяти взвинтит цены на смартфоны — рынок откатится к уровню 2013 года 4 ч.