Сегодня 26 ноября 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Свежая версия ИИ Google Gemini обошла в тестах GPT-4o и Claude-3

Последняя версия большой языковой модели Gemini 1.5 Pro внезапно пробилась на верхушку рейтинга на платформе Chatbot Arena, обойдя в тестах традиционных лидеров в области генеративного искусственного интеллекта — OpenAI GPT-4o и Anthropic Claude-3.

 Источник изображения: blog.google

Источник изображения: blog.google

Бывшая прежде чемпионом нейросеть OpenAI GPT-4o уступила лидерство 1 августа, когда Google без громких анонсов выпустила экспериментальную сборку своей последней модели — она быстро привлекла интересующееся ИИ сообщество в соцсетях, которое сочло победу в бенчмарке свидетельством качества. Сервис OpenAI ChatGPT стал почти синонимом генеративного ИИ с момента запуска ещё в эпоху GPT-3. К настоящему моменту устоявшимися лидерами считаются OpenAI GPT-4o и Anthropic Claude-3, которые за последний год почти не знали конкурентов в тестах.

 Источник изображения: x.com/lmsysorg

Источник изображения: x.com/lmsysorg

Один из наиболее популярных тестов — LMSYS Chatbot Arena. Он предлагает моделям различные задачи и присваивает им оценки. Актуальная версия GPT-4o смогла набрать 1286 баллов, а Claude-3 — 1271 балл. У предыдущей Google Gemini 1.5 Pro рейтинг был 1261, но выпущенная 1 августа Gemini 1.5 Pro 0801 внезапно получила колоссальные 1300 баллов. Это может свидетельствовать, что новая нейросеть Google способнее своих конкурентов, но бенчмарки не всегда точно отражают, что может и чего не может модель ИИ.

Современный рынок чат-ботов уже достаточно созрел, чтобы предложить потребителю несколько вариантов и дать ему возможность самому решить, какой ИИ подходит лучше всего. Пока нет ясности, станет ли экспериментальная Gemini 1.5 Pro версией по умолчанию в будущем. Она остаётся общедоступной, но с экспериментальным статусом может быть закрыта или радикально отредактирована по соображениям безопасности или другим причинам.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
«Новый год пришёл раньше времени»: Sony включила в декабрьскую линейку PS Plus сразу пять игр, в том числе Lego Horizon Adventures и Killing Floor 3 57 мин.
Продажи Cyberpunk 2077 превысили 35 миллионов копий, а команда Cyberpunk 2 растёт не по дням, а по часам 2 ч.
ЕС откажется от сканирования переписок — ИТ-гиганты выиграли битву за конфиденциальность пользователей 3 ч.
Новый геймплейный трейлер Warhammer 40,000: Dark Heresy показал в деле огрина Когга, поумневшего благодаря аугментации коры головного мозга 3 ч.
После скандала Character.AI закрыла свободные чаты для детей — вместо них появились безопасные «Истории» 3 ч.
Китай штампует новые ИИ-модели еженедельно — США уже проигрывают гонку открытого ИИ 3 ч.
Переосмысление классики психологических квестов: культовая российская игра Sublustrum получит новую жизнь на ПК и консолях 4 ч.
В этот день в 1996 году в США выдали патент на MP3 – формат аудио, перевернувший музыкальную индустрию 4 ч.
«ChatGPT — это продукт, а не друг»: подростки спрашивали ИИ о преступлениях — теперь ими занимается полиция 4 ч.
Ubisoft представила Teammates — прототип игры с ИИ-напарниками, реагирующими на голосовые команды 5 ч.
Seagate создала магнитный диск на 6,9 Тбайт — из таких можно создать HDD на 55–69 Тбайт 14 мин.
TSMC сообщила о старте серийного производства 2-нм чипов 2 ч.
Продажи Tesla рушатся по всему миру — Маск увлёкся роботами, а стоило бы новыми машинами 3 ч.
Китай против Nvidia: владельцу TikTok запретили использовать «зелёные» чипы в новых дата-центрах 4 ч.
AWS вложит $26 млрд в ИИ-инфраструктуру в Индиане, покрыв расходы на новые ЛЭП и электростанции для своих ЦОД 5 ч.
Очередной рекорд разгона DDR5 — покорена планка в 13 500 МТ/с 5 ч.
Твердотельные трансформаторы сингапурской Amperesand обещают произвести революцию в питании ИИ ЦОД 5 ч.
iPhone 17 переворачивает рынок: Apple близка к тому, чтобы обогнать Samsung по поставкам смартфонов 6 ч.
Airbus чуть не остановила выпуск самолётов из-за нехватки топлива для генераторов ЦОД в критический момент 6 ч.
Apple выпустит iPad mini с OLED-дисплеем в третьем квартале 2026 года, но это не точно 6 ч.