Сегодня 16 июня 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Свежая версия ИИ Google Gemini обошла в тестах GPT-4o и Claude-3

Последняя версия большой языковой модели Gemini 1.5 Pro внезапно пробилась на верхушку рейтинга на платформе Chatbot Arena, обойдя в тестах традиционных лидеров в области генеративного искусственного интеллекта — OpenAI GPT-4o и Anthropic Claude-3.

 Источник изображения: blog.google

Источник изображения: blog.google

Бывшая прежде чемпионом нейросеть OpenAI GPT-4o уступила лидерство 1 августа, когда Google без громких анонсов выпустила экспериментальную сборку своей последней модели — она быстро привлекла интересующееся ИИ сообщество в соцсетях, которое сочло победу в бенчмарке свидетельством качества. Сервис OpenAI ChatGPT стал почти синонимом генеративного ИИ с момента запуска ещё в эпоху GPT-3. К настоящему моменту устоявшимися лидерами считаются OpenAI GPT-4o и Anthropic Claude-3, которые за последний год почти не знали конкурентов в тестах.

 Источник изображения: x.com/lmsysorg

Источник изображения: x.com/lmsysorg

Один из наиболее популярных тестов — LMSYS Chatbot Arena. Он предлагает моделям различные задачи и присваивает им оценки. Актуальная версия GPT-4o смогла набрать 1286 баллов, а Claude-3 — 1271 балл. У предыдущей Google Gemini 1.5 Pro рейтинг был 1261, но выпущенная 1 августа Gemini 1.5 Pro 0801 внезапно получила колоссальные 1300 баллов. Это может свидетельствовать, что новая нейросеть Google способнее своих конкурентов, но бенчмарки не всегда точно отражают, что может и чего не может модель ИИ.

Современный рынок чат-ботов уже достаточно созрел, чтобы предложить потребителю несколько вариантов и дать ему возможность самому решить, какой ИИ подходит лучше всего. Пока нет ясности, станет ли экспериментальная Gemini 1.5 Pro версией по умолчанию в будущем. Она остаётся общедоступной, но с экспериментальным статусом может быть закрыта или радикально отредактирована по соображениям безопасности или другим причинам.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
WhatsApp добавит в веб-версию мессенджера голосовые и видеозвонки в групповых чатах 44 мин.
Google сама показала, что новая Gemini 3.5 Flash не лучшая ИИ-модель для Android-разработки 45 мин.
Alibaba представила первый набор LLM для «воплощённого ИИ» — Qwen Robot Suite 57 мин.
ФБР устранило китайский фишинговый сервис Outsider, генерировавший мошеннические сайты с помощью ИИ 60 мин.
Одна голова хорошо, а две лучше: руководитель Treyarch покинул студию после 22 лет работы над Call of Duty 2 ч.
В «Яндекс Картах» появился надёжный пошаговый навигатор при нестабильном сигнале GPS 3 ч.
Teams научили отслеживать сотрудников через корпоративный Wi-Fi — Microsoft уверяет, что это не слежка 3 ч.
Double Fine, Ninja Theory и другие студии Xbox тоже оказались под угрозой закрытия, но продолжают борьбу за выживание 3 ч.
Индия заблокировала Telegram перед пересдачей аналога ЕГЭ, опасаясь утечек заданий 4 ч.
Fox купила конкурента Netflix за $22 млрд 4 ч.
Китайские инженеры заявили, что их лунный модуль многократно надёжнее американских аналогов, которые ещё не построены 40 мин.
Представлена игровая клавиатура Logitech G316 X 98 с горячей заменой клавиш и частотой опроса 8 кГц 54 мин.
Акции SpaceX взлетели на 50 % всего за три торговые сессии 2 ч.
Турция вложится в ИИ, ЦОД, облака и обучение в рамках программы AI Action Plan 3 ч.
Документы раскрыли характеристики Tesla Cybercab — роботакси проедет до 669 км на одной зарядке 3 ч.
Австралийская SharonAI Holdings купит 40 тыс. ускорителей GB300 и поделится с NVIDIA выручкой от ИИ-облака 3 ч.
TSMC получила от IMEC техпроцесс для массового выпуска 2D-транзисторов на 300-мм пластинах 3 ч.
Японская Nidec разработала 300-кВт внутристоечный CDU 3 ч.
Представлен смартфон Honor X70 Pro Max — большой экран, защита IP69K и батарея на 8560 мА·ч за $295 3 ч.
Qualcomm готовится к миру без приложений и разрабатывает более 40 ИИ-устройств 3 ч.