Сегодня 16 сентября 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Свежая версия ИИ Google Gemini обошла в тестах GPT-4o и Claude-3

Последняя версия большой языковой модели Gemini 1.5 Pro внезапно пробилась на верхушку рейтинга на платформе Chatbot Arena, обойдя в тестах традиционных лидеров в области генеративного искусственного интеллекта — OpenAI GPT-4o и Anthropic Claude-3.

 Источник изображения: blog.google

Источник изображения: blog.google

Бывшая прежде чемпионом нейросеть OpenAI GPT-4o уступила лидерство 1 августа, когда Google без громких анонсов выпустила экспериментальную сборку своей последней модели — она быстро привлекла интересующееся ИИ сообщество в соцсетях, которое сочло победу в бенчмарке свидетельством качества. Сервис OpenAI ChatGPT стал почти синонимом генеративного ИИ с момента запуска ещё в эпоху GPT-3. К настоящему моменту устоявшимися лидерами считаются OpenAI GPT-4o и Anthropic Claude-3, которые за последний год почти не знали конкурентов в тестах.

 Источник изображения: x.com/lmsysorg

Источник изображения: x.com/lmsysorg

Один из наиболее популярных тестов — LMSYS Chatbot Arena. Он предлагает моделям различные задачи и присваивает им оценки. Актуальная версия GPT-4o смогла набрать 1286 баллов, а Claude-3 — 1271 балл. У предыдущей Google Gemini 1.5 Pro рейтинг был 1261, но выпущенная 1 августа Gemini 1.5 Pro 0801 внезапно получила колоссальные 1300 баллов. Это может свидетельствовать, что новая нейросеть Google способнее своих конкурентов, но бенчмарки не всегда точно отражают, что может и чего не может модель ИИ.

Современный рынок чат-ботов уже достаточно созрел, чтобы предложить потребителю несколько вариантов и дать ему возможность самому решить, какой ИИ подходит лучше всего. Пока нет ясности, станет ли экспериментальная Gemini 1.5 Pro версией по умолчанию в будущем. Она остаётся общедоступной, но с экспериментальным статусом может быть закрыта или радикально отредактирована по соображениям безопасности или другим причинам.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
TikTok в США продолжит использовать китайские алгоритмы, а за инфраструктуру будет отвечать Oracle 17 мин.
15 хакерских группировок объявили о закрытии — хакеры хотят насладиться «золотыми парашютами» 19 мин.
«Яндекс» научил «Алису» оживлять фото 57 мин.
OpenAI приняла на работу сбежавшего из xAI финансового директора 58 мин.
Хакеры украли данные миллионов клиентов Gucci и Balenciaga, включая информацию о покупках 2 ч.
Диски уходят: продажи игр на физических носителях в прошлом году принесли Sony только 3 % от общего объёма выручки 2 ч.
Уникальная и действительно жуткая: журналистка раскрыла первую оценку Silent Hill f за неделю до окончания эмбарго 2 ч.
Вышла Apple macOS Tahoe 26 — она получила интерфейс Liquid Glass, новые средства автоматизации и многое другое 3 ч.
Планы Sony на сентябрьский выпуск State of Play подтвердил ещё один инсайдер — шоу пройдёт совсем скоро 4 ч.
Спустя полтора года в раннем доступе нашумевший симулятор «покемонов с пушками» Palworld взял курс на полноценный релиз 5 ч.
ATP выпустила индустриальные SSD серий N701/N601 вместимостью до 960 Гбайт 4 мин.
Китайский регулятор обвинил NVIDIA в нарушении антимонопольного законодательства при покупке Mellanox 6 мин.
Сделанный для Китая ускоритель Nvidia RTX 6000D провалился в продаже — GeForce RTX 5090 лучше 22 мин.
Встроенная в DDR5 защита от атаки Rowhammer оказалась с дырой — любую современную систему можно взломать 26 мин.
Смартфон Xiaomi 17 Pro показался на видео — у него будет второй дисплей в блоке камер 43 мин.
BlackRock вложит до £500 млн в развитие дата-центров в Великобритании 2 ч.
Silver Lake закрыла сделку по покупке контролирующей доли в бизнесе Altera 2 ч.
OpenAI планирует заняться гуманоидными роботами и собирает команду специалистов в робототехнике 3 ч.
В числе первых чипов, которые выпустит TSMC по 2-нм техпроцессу, окажется следующий Mediatek Dimensity 3 ч.
eSIM от Yesim: как забыть о роуминге и не остаться без связи за границей 4 ч.