Сегодня 25 июня 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Свежая версия ИИ Google Gemini обошла в тестах GPT-4o и Claude-3

Последняя версия большой языковой модели Gemini 1.5 Pro внезапно пробилась на верхушку рейтинга на платформе Chatbot Arena, обойдя в тестах традиционных лидеров в области генеративного искусственного интеллекта — OpenAI GPT-4o и Anthropic Claude-3.

 Источник изображения: blog.google

Источник изображения: blog.google

Бывшая прежде чемпионом нейросеть OpenAI GPT-4o уступила лидерство 1 августа, когда Google без громких анонсов выпустила экспериментальную сборку своей последней модели — она быстро привлекла интересующееся ИИ сообщество в соцсетях, которое сочло победу в бенчмарке свидетельством качества. Сервис OpenAI ChatGPT стал почти синонимом генеративного ИИ с момента запуска ещё в эпоху GPT-3. К настоящему моменту устоявшимися лидерами считаются OpenAI GPT-4o и Anthropic Claude-3, которые за последний год почти не знали конкурентов в тестах.

 Источник изображения: x.com/lmsysorg

Источник изображения: x.com/lmsysorg

Один из наиболее популярных тестов — LMSYS Chatbot Arena. Он предлагает моделям различные задачи и присваивает им оценки. Актуальная версия GPT-4o смогла набрать 1286 баллов, а Claude-3 — 1271 балл. У предыдущей Google Gemini 1.5 Pro рейтинг был 1261, но выпущенная 1 августа Gemini 1.5 Pro 0801 внезапно получила колоссальные 1300 баллов. Это может свидетельствовать, что новая нейросеть Google способнее своих конкурентов, но бенчмарки не всегда точно отражают, что может и чего не может модель ИИ.

Современный рынок чат-ботов уже достаточно созрел, чтобы предложить потребителю несколько вариантов и дать ему возможность самому решить, какой ИИ подходит лучше всего. Пока нет ясности, станет ли экспериментальная Gemini 1.5 Pro версией по умолчанию в будущем. Она остаётся общедоступной, но с экспериментальным статусом может быть закрыта или радикально отредактирована по соображениям безопасности или другим причинам.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
В Steam стартовала летняя распродажа с «чертовски большими» скидками на тысячи игр 2 ч.
«Яндекс» сделал «Алису AI» более человечной — она запоминает пользователей и подстраивается под их стиль общения 2 ч.
Код в мешке: Rockstar снабдила «дисковую» версию GTA VI для PS5 региональными ограничениями 3 ч.
Несколько лет разочарований с Destiny 2 обернулись для Bungie массовыми увольнениями, но разработчики «должны гордиться» собой 5 ч.
ИИ-модель Wildberries вошла в топ-3 русскоязычного бенчмарка MERA 5 ч.
Adobe купила разработчика ИИ для повышения качества изображений и видео Topaz Labs 5 ч.
Глава Epic Games раскритиковал Valve за «очень безответственную» политику Steam в отношении генеративного ИИ 5 ч.
Ролевой боевик Enshrouded с выживанием в волшебном мире и кооперативом на 16 человек скоро выйдет из раннего доступа — дата релиза и новый трейлер 5 ч.
Московский суд оштрафовал Apple на 500 000 рублей, но дело не в удалении VK 6 ч.
Инженерные профессии оказались наиболее устойчивы в эпоху ИИ 7 ч.
Xbox Series X и S снова подорожают по всему миру — теперь сразу на $100–150 60 мин.
Планшет Honor MagicPad 4 с большим OLED-экраном и Snapdragon 8 Gen 5 поступил в продажу в России за 100 тыс. рублей 3 ч.
Акции Apple упали более чем на 5 % после резкого повышения цен на MacBook и iPad 3 ч.
Эволюция гольф-кара: выходцы из Apple и Audi создали электрический багги для дорог общего пользования за $25 000 4 ч.
Французский ретейлер подшутил над Steam Machine за €1039, предложив свою Stim Machine c RX 9060 XT чуть дешевле 4 ч.
Leica выпустила 44-Мп полнокадровую камеру SL3-P за $6690 — она займёт нишу между SL3 и SL3-S 5 ч.
«Звёздный разум» заполнит орбиту: SpaceX назвала будущую миллионную группировку ИИ-спутников Starmind 6 ч.
Apple подняла цены на все Mac и iPad на $100–1300 — причина та же, что и у всех 7 ч.
Qualcomm анонсировала HBC — альтернативу HBM на базе LPDDR 8 ч.
Samsung представила Galaxy A27 5G — недорогой смартфон с ИИ и шестью годами обновлений Android 8 ч.