Сегодня 07 мая 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Свежая версия ИИ Google Gemini обошла в тестах GPT-4o и Claude-3

Последняя версия большой языковой модели Gemini 1.5 Pro внезапно пробилась на верхушку рейтинга на платформе Chatbot Arena, обойдя в тестах традиционных лидеров в области генеративного искусственного интеллекта — OpenAI GPT-4o и Anthropic Claude-3.

 Источник изображения: blog.google

Источник изображения: blog.google

Бывшая прежде чемпионом нейросеть OpenAI GPT-4o уступила лидерство 1 августа, когда Google без громких анонсов выпустила экспериментальную сборку своей последней модели — она быстро привлекла интересующееся ИИ сообщество в соцсетях, которое сочло победу в бенчмарке свидетельством качества. Сервис OpenAI ChatGPT стал почти синонимом генеративного ИИ с момента запуска ещё в эпоху GPT-3. К настоящему моменту устоявшимися лидерами считаются OpenAI GPT-4o и Anthropic Claude-3, которые за последний год почти не знали конкурентов в тестах.

 Источник изображения: x.com/lmsysorg

Источник изображения: x.com/lmsysorg

Один из наиболее популярных тестов — LMSYS Chatbot Arena. Он предлагает моделям различные задачи и присваивает им оценки. Актуальная версия GPT-4o смогла набрать 1286 баллов, а Claude-3 — 1271 балл. У предыдущей Google Gemini 1.5 Pro рейтинг был 1261, но выпущенная 1 августа Gemini 1.5 Pro 0801 внезапно получила колоссальные 1300 баллов. Это может свидетельствовать, что новая нейросеть Google способнее своих конкурентов, но бенчмарки не всегда точно отражают, что может и чего не может модель ИИ.

Современный рынок чат-ботов уже достаточно созрел, чтобы предложить потребителю несколько вариантов и дать ему возможность самому решить, какой ИИ подходит лучше всего. Пока нет ясности, станет ли экспериментальная Gemini 1.5 Pro версией по умолчанию в будущем. Она остаётся общедоступной, но с экспериментальным статусом может быть закрыта или радикально отредактирована по соображениям безопасности или другим причинам.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Эпидемию одиночества не вылечить ИИ-ботами — они лишь усиливают изоляцию 21 мин.
Squadron 42 может не выйти в 2026 году из-за GTA VI, а Star Citizen «никогда не будет закончена» 58 мин.
«Потратили много времени и денег»: глава Take-Two оказался «глубоко разочарован» проблемами BioShock 4 2 ч.
Google обновит поисковую выдачу, добавив в ИИ-обзоры цитаты с форумов 6 ч.
Anthropic наделила управляемых ИИ-агентов Claude «сновидениями» — в некотором роде 9 ч.
Лаконичный трейлер раскрыл дату выхода и цену олдскульного приключения Mina the Hollower от создателей Shovel Knight 12 ч.
AMD выпустила драйвер с поддержкой Pragmata и других новых игр 14 ч.
Славянская Devil May Cry: разработчики балетного слешера «Царевна: Эпоха сказок» показали пять минут чистого геймплея 14 ч.
Meta готовит персонального ИИ-помощника для миллиардов пользователей — проект на $145 млрд пугает инвесторов 15 ч.
Второй трейлер GTA VI вышел ровно год назад, а фанаты вычислили дату следующего показа по расположению планет 16 ч.
Российские и белорусские смарт-ТВ стали заметно популярнее на отечественном рынке — но лидируют китайские бренды 3 мин.
Бур марсохода NASA Curiosity застрял в камне — инженеры целую неделю вызволяли его из ловушки 12 мин.
Arm разворачивается к ИИ: спад в смартфонах компенсируют серверные чипы 2 ч.
Apple впервые за 30 лет тратит на разработки более 10 % выручки — чтобы догнать конкурентов в ИИ 3 ч.
Anthropic заключила сделку со SpaceX по использованию мощностей дата-центра Colossus 1 4 ч.
После IPO компании SpaceX возглавляющий её Илон Маск должен получить почти неограниченные полномочия 4 ч.
1 Тбайт/с на x16: PCI-SIG раньше срока предоставила спецификации PCI Express 8.0 версии 0.5 9 ч.
Новая статья: Обзор и тестирование корпуса Xastra A700 ARGB «башня» для всего 10 ч.
Инвесторы требуют от Nintendo поднять цену Switch 2 — сейчас консоль убыточна 11 ч.
Corning построит в США три завода по выпуску оптоволокна для ИИ ЦОД с чипами NVIDIA 12 ч.