Сегодня 06 октября 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Свежая версия ИИ Google Gemini обошла в тестах GPT-4o и Claude-3

Последняя версия большой языковой модели Gemini 1.5 Pro внезапно пробилась на верхушку рейтинга на платформе Chatbot Arena, обойдя в тестах традиционных лидеров в области генеративного искусственного интеллекта — OpenAI GPT-4o и Anthropic Claude-3.

 Источник изображения: blog.google

Источник изображения: blog.google

Бывшая прежде чемпионом нейросеть OpenAI GPT-4o уступила лидерство 1 августа, когда Google без громких анонсов выпустила экспериментальную сборку своей последней модели — она быстро привлекла интересующееся ИИ сообщество в соцсетях, которое сочло победу в бенчмарке свидетельством качества. Сервис OpenAI ChatGPT стал почти синонимом генеративного ИИ с момента запуска ещё в эпоху GPT-3. К настоящему моменту устоявшимися лидерами считаются OpenAI GPT-4o и Anthropic Claude-3, которые за последний год почти не знали конкурентов в тестах.

 Источник изображения: x.com/lmsysorg

Источник изображения: x.com/lmsysorg

Один из наиболее популярных тестов — LMSYS Chatbot Arena. Он предлагает моделям различные задачи и присваивает им оценки. Актуальная версия GPT-4o смогла набрать 1286 баллов, а Claude-3 — 1271 балл. У предыдущей Google Gemini 1.5 Pro рейтинг был 1261, но выпущенная 1 августа Gemini 1.5 Pro 0801 внезапно получила колоссальные 1300 баллов. Это может свидетельствовать, что новая нейросеть Google способнее своих конкурентов, но бенчмарки не всегда точно отражают, что может и чего не может модель ИИ.

Современный рынок чат-ботов уже достаточно созрел, чтобы предложить потребителю несколько вариантов и дать ему возможность самому решить, какой ИИ подходит лучше всего. Пока нет ясности, станет ли экспериментальная Gemini 1.5 Pro версией по умолчанию в будущем. Она остаётся общедоступной, но с экспериментальным статусом может быть закрыта или радикально отредактирована по соображениям безопасности или другим причинам.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Ubisoft анонсировала дату выхода «мясистого» бесплатного дополнения к Assassin's Creed Mirage — геймплей и подробности Valley of Memory 39 мин.
Эпично сломал Gemini? Теперь за это можно получить $20 000 от Google 2 ч.
Регулятор выдал возрастной рейтинг Aliens: Fireteam Elite 2 до официального анонса — кооперативный шутер во вселенной «Чужого» получит сиквел 2 ч.
Во Франции запустили расследование возможной прослушки пользователей Apple через Siri 3 ч.
Рокерский экшен Devil Jam в духе Vampire Survivors отправится в адское турне по Steam уже совсем скоро — дата выхода и новый геймплейный трейлер 3 ч.
OpenAI дала пользователям больше контроля над их ИИ-двойниками в Sora 6 ч.
Paradox забросит амбициозную стратегию Millennia в духе «Цивилизации» спустя всего полтора года после релиза, и фанаты не рады 9 ч.
Поглощение Activision обернулось тем, чего боялась FTC — Microsoft режет кадры и поднимает цены 9 ч.
«Это полный сюр»: хоррор об ужасах долговой ямы CloverPit за восемь дней достиг полумиллиона проданных копий в Steam 11 ч.
Orion soft представил рынку собственный VDI 11 ч.
OnePlus объявила дату выпуска Android 16 для поддерживаемых смартфонов 38 мин.
MaxSun представила первую видеокарту Intel с СЖО — двухпроцессорную Arc Pro B60 Dual Liquid Edition 47 мин.
Представлен чехол, который превратит iPhone 17 Pro Max в смартфон в стиле BlackBerry с клавиатурой 2 ч.
Судьба зонда «Юнона» под вопросом — NASA прекратило публикацию данных из-за шатдауна 2 ч.
OCuLink оказался быстрее Thunderbolt 5 — тесты показали до 16 % прироста FPS в играх 3 ч.
Acer выпустила видеокарты Radeon RX 9000 Nitro L со умеренным заводским разгоном GPU и сниженным энергопотреблением 4 ч.
AMD поставит OpenAI ИИ-ускорители на 6 ГВт, а OpenAI получит долю в AMD 5 ч.
Gigabyte выпустила внешнюю RTX 5090 за $2999 — в играх она на 18–27 % медленнее настольной 5 ч.
AMD нашла клиента на миллионы ИИ-чипов Instinct — они лягут в основу новых дата-центров OpenAI на 6 ГВт 6 ч.
Разработчик царь-ускорителей Cerebras Systems отозвал заявку на IPO 7 ч.