Сегодня 20 июня 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Свежая версия ИИ Google Gemini обошла в тестах GPT-4o и Claude-3

Последняя версия большой языковой модели Gemini 1.5 Pro внезапно пробилась на верхушку рейтинга на платформе Chatbot Arena, обойдя в тестах традиционных лидеров в области генеративного искусственного интеллекта — OpenAI GPT-4o и Anthropic Claude-3.

 Источник изображения: blog.google

Источник изображения: blog.google

Бывшая прежде чемпионом нейросеть OpenAI GPT-4o уступила лидерство 1 августа, когда Google без громких анонсов выпустила экспериментальную сборку своей последней модели — она быстро привлекла интересующееся ИИ сообщество в соцсетях, которое сочло победу в бенчмарке свидетельством качества. Сервис OpenAI ChatGPT стал почти синонимом генеративного ИИ с момента запуска ещё в эпоху GPT-3. К настоящему моменту устоявшимися лидерами считаются OpenAI GPT-4o и Anthropic Claude-3, которые за последний год почти не знали конкурентов в тестах.

 Источник изображения: x.com/lmsysorg

Источник изображения: x.com/lmsysorg

Один из наиболее популярных тестов — LMSYS Chatbot Arena. Он предлагает моделям различные задачи и присваивает им оценки. Актуальная версия GPT-4o смогла набрать 1286 баллов, а Claude-3 — 1271 балл. У предыдущей Google Gemini 1.5 Pro рейтинг был 1261, но выпущенная 1 августа Gemini 1.5 Pro 0801 внезапно получила колоссальные 1300 баллов. Это может свидетельствовать, что новая нейросеть Google способнее своих конкурентов, но бенчмарки не всегда точно отражают, что может и чего не может модель ИИ.

Современный рынок чат-ботов уже достаточно созрел, чтобы предложить потребителю несколько вариантов и дать ему возможность самому решить, какой ИИ подходит лучше всего. Пока нет ясности, станет ли экспериментальная Gemini 1.5 Pro версией по умолчанию в будущем. Она остаётся общедоступной, но с экспериментальным статусом может быть закрыта или радикально отредактирована по соображениям безопасности или другим причинам.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Футбольная аркада Rematch от создателей Sifu привлекла более миллиона уникальных игроков за первый день 48 мин.
«Сбер» научил GigaChat проводить глубокие многоступенчатые исследования 2 ч.
Мобильная версия Disco Elysium получила дату выхода на Android — это тотальное переосмысление культовой RPG для пользователей TikTok 2 ч.
«Ростелеком» и МГТУ объединили усилия на благо российской игровой индустрии 3 ч.
Датамайнер показал взрывной финал сюжетной миссии из новой Battlefield — фанаты в восторге 6 ч.
Длительная работа с ИИ-инструментами ослабляет у людей когнитивные способности, выяснили учёные 7 ч.
Google давно использует контент YouTube для обучения ИИ и никогда этого не скрывала 7 ч.
Релиз СУБД Tantor Postgres 17.5.0: доработки безопасности и аналитики, оптимизации для «1С» и прочие улучшения 7 ч.
WhatsApp не сможет запустить рекламу в Евросоюзе до следующего года 8 ч.
Дурову разрешили ездить из Франции в Дубай, но только на две недели 8 ч.
Гуманоидные роботы Foxconn приступят к сборке ИИ-серверов Nvidia уже в следующем году 18 мин.
Смартфоны Redmi Note 14 4G и Redmi Note 14 Pro сочетают высокую функциональность с доступной ценой 31 мин.
Слабые продажи Samsung Galaxy S25 Edge заставили Samsung менять планы на будущее 2 ч.
Meta совместно с Oakley представила умные очки для спортсменов 3 ч.
IEA представило интерактивную карту для мониторинга энергетических показателей инфраструктуры ЦОД 3 ч.
Разделение Western Digital и SanDisk создало проблемы с Windows 11 владельцам накопителя WD Black SN770 4 ч.
Представлен смартфон Vivo Y400 Pro — изогнутый AMOLED-дисплей 120 Гц и чип Dimensity 7300 за $290 4 ч.
Ирландия готова разрешить дата-центрам строить не только электростанции, но и частные ЛЭП 4 ч.
AMD «поместит геймеров в центр событий», — в компании прокомментировали сотрудничество с Microsoft 5 ч.
В Германии протестировали рядовую оптическую магистраль на рекордную дальность квантовой связи 6 ч.