Сегодня 15 апреля 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Свежая версия ИИ Google Gemini обошла в тестах GPT-4o и Claude-3

Последняя версия большой языковой модели Gemini 1.5 Pro внезапно пробилась на верхушку рейтинга на платформе Chatbot Arena, обойдя в тестах традиционных лидеров в области генеративного искусственного интеллекта — OpenAI GPT-4o и Anthropic Claude-3.

 Источник изображения: blog.google

Источник изображения: blog.google

Бывшая прежде чемпионом нейросеть OpenAI GPT-4o уступила лидерство 1 августа, когда Google без громких анонсов выпустила экспериментальную сборку своей последней модели — она быстро привлекла интересующееся ИИ сообщество в соцсетях, которое сочло победу в бенчмарке свидетельством качества. Сервис OpenAI ChatGPT стал почти синонимом генеративного ИИ с момента запуска ещё в эпоху GPT-3. К настоящему моменту устоявшимися лидерами считаются OpenAI GPT-4o и Anthropic Claude-3, которые за последний год почти не знали конкурентов в тестах.

 Источник изображения: x.com/lmsysorg

Источник изображения: x.com/lmsysorg

Один из наиболее популярных тестов — LMSYS Chatbot Arena. Он предлагает моделям различные задачи и присваивает им оценки. Актуальная версия GPT-4o смогла набрать 1286 баллов, а Claude-3 — 1271 балл. У предыдущей Google Gemini 1.5 Pro рейтинг был 1261, но выпущенная 1 августа Gemini 1.5 Pro 0801 внезапно получила колоссальные 1300 баллов. Это может свидетельствовать, что новая нейросеть Google способнее своих конкурентов, но бенчмарки не всегда точно отражают, что может и чего не может модель ИИ.

Современный рынок чат-ботов уже достаточно созрел, чтобы предложить потребителю несколько вариантов и дать ему возможность самому решить, какой ИИ подходит лучше всего. Пока нет ясности, станет ли экспериментальная Gemini 1.5 Pro версией по умолчанию в будущем. Она остаётся общедоступной, но с экспериментальным статусом может быть закрыта или радикально отредактирована по соображениям безопасности или другим причинам.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
«Яндекс» научил «Алису» рассуждать, работать с файлами, говорить по-английски, изучать мир и заниматься с детьми 20 мин.
В открытый доступ попали первые скриншоты The Elder Scrolls IV: Oblivion Remastered — официального ремейка культовой RPG от Bethesda 32 мин.
Япония предписала Google прекратить навязывание своих приложений производителям смартфонов 3 ч.
Obsidian рассказала о широте ролевых возможностей в The Outer Worlds 2 — игроки смогут отыгрывать серийного убийцу и не только 3 ч.
Датамайнер рассказала о самом большом неиспользованном боссе в играх FromSoftware — он мог появиться в Sekiro: Shadows Die Twice 4 ч.
В деле об отделении Instagram и WhatsApp от Meta появилась веская улика — компрометирующее письмо Цукерберга от 2012 года 4 ч.
ИИ-модели Gemini позволили анализировать снимки в «Google Фото», но пока не у всех пользователей 4 ч.
«Абсолютно завораживающий опыт»: эксперт Digital Foundry протестировал Cyberpunk 2077 на Nintendo Switch 2 5 ч.
К Apple подали ещё два иска за невыполненные обещания по ИИ-функциям Apple Intelligence 6 ч.
Apple будет анализировать переписки пользователей на iPhone, iPad и Mac для улучшения своего ИИ 6 ч.
«Яндекс» представила «Станцию Мини 3 Про» с поддержкой Zigbee и подключаемыми модулями 7 мин.
«Рикор» представила Rikor Pro 7 — лёгкий и мощный ноутбук для бизнеса 12 мин.
Учёные МФТИ построили литограф для создания 3D-микроструктур с элементами размером 150 нм 16 мин.
«Яндекс» представила первую в России портативную умную колонку — «Станцию Стрит» с «Алисой» 21 мин.
«Яндекс» представила свою первую умную IP-камеру для дома 24 мин.
США призвали Европу сделать выбор между американскими и китайскими технологиями связи 27 мин.
ИБП Google Cloud стали причиной… шестичасового перебоя в электроснабжении одного из облачных регионов 2 ч.
Caviar представила OVI 8 — спецверсию iPhone в часть Александра Овечкина за 650 тыс. рублей 3 ч.
МТС придумала, как сэкономить на развёртывании сетей 5G 3 ч.
Тайвань впервые обвинил капитана китайского судна в умышленном повреждении подводных кабелей 4 ч.