Сегодня 22 июля 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Свежая версия ИИ Google Gemini обошла в тестах GPT-4o и Claude-3

Последняя версия большой языковой модели Gemini 1.5 Pro внезапно пробилась на верхушку рейтинга на платформе Chatbot Arena, обойдя в тестах традиционных лидеров в области генеративного искусственного интеллекта — OpenAI GPT-4o и Anthropic Claude-3.

 Источник изображения: blog.google

Источник изображения: blog.google

Бывшая прежде чемпионом нейросеть OpenAI GPT-4o уступила лидерство 1 августа, когда Google без громких анонсов выпустила экспериментальную сборку своей последней модели — она быстро привлекла интересующееся ИИ сообщество в соцсетях, которое сочло победу в бенчмарке свидетельством качества. Сервис OpenAI ChatGPT стал почти синонимом генеративного ИИ с момента запуска ещё в эпоху GPT-3. К настоящему моменту устоявшимися лидерами считаются OpenAI GPT-4o и Anthropic Claude-3, которые за последний год почти не знали конкурентов в тестах.

 Источник изображения: x.com/lmsysorg

Источник изображения: x.com/lmsysorg

Один из наиболее популярных тестов — LMSYS Chatbot Arena. Он предлагает моделям различные задачи и присваивает им оценки. Актуальная версия GPT-4o смогла набрать 1286 баллов, а Claude-3 — 1271 балл. У предыдущей Google Gemini 1.5 Pro рейтинг был 1261, но выпущенная 1 августа Gemini 1.5 Pro 0801 внезапно получила колоссальные 1300 баллов. Это может свидетельствовать, что новая нейросеть Google способнее своих конкурентов, но бенчмарки не всегда точно отражают, что может и чего не может модель ИИ.

Современный рынок чат-ботов уже достаточно созрел, чтобы предложить потребителю несколько вариантов и дать ему возможность самому решить, какой ИИ подходит лучше всего. Пока нет ясности, станет ли экспериментальная Gemini 1.5 Pro версией по умолчанию в будущем. Она остаётся общедоступной, но с экспериментальным статусом может быть закрыта или радикально отредактирована по соображениям безопасности или другим причинам.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Госдума окончательно запретила россиянам искать экстремистские материалы в интернете 8 мин.
Один из самых драматичных сюжетных поворотов Clair Obscur: Expedition 33 появился в игре благодаря шутке 2 ч.
Сериал по Mass Effect в надёжных руках: производством шоу займётся команда «Фоллаут» 3 ч.
«Нейроаналитик» «Яндекса» ускорит анализ и визуализацию данных 4 ч.
«Т-Банк» выпустил ИИ-модель распознавания речи с открытым исходным кодом — T-one 4 ч.
Copilot+PC на чипах AMD и Intel наконец получили новые ИИ-функции — на три месяца позже, чем Snapdragon X 6 ч.
Electronic Arts анонсировала открытую «бету» Battlefield 6, а в приложении EA App засветились её подробности 6 ч.
Плохо прогнозируемый эффект от применения ИИ — один из основных барьеров, сдерживающих его использование в промышленности 6 ч.
ИИ-модель Google Gemini получила золотую медаль Международной математической олимпиады 7 ч.
OpenAI раскрыла масштабы популярности ChatGPT: каждый день бот получает 2,5 млрд запросов 17 ч.
Два миллиона GPU и 4,5 ГВт: Oracle и OpenAI договорились построить в США дата-центры для ИИ 18 мин.
Galax GeForce RTX 5080 NOX OC Black Edition получила зеркальную панель и магнитный кожух 25 мин.
Устройства Google Home и Nest перестали понимать команды — и никто не знает почему 28 мин.
Учёные впервые увидели звезду-компаньона у Бетельгейзе — жить ей осталось недолго 32 мин.
Samsung Display оснастит флагманские Mercedes-Maybach огромными OLED-дисплеями 37 мин.
«Яндекс» начал продажи умной колонки «Станции Мини 3 Про» с модульной конструкцией и ценой 12 тыс. рублей 2 ч.
AAEON выпустила индустриальный одноплатный компьютер PICO-TWL4 на базе Intel Twin Lake 3 ч.
Nokia попытается ещё раз вернуться на рынок смартфонов с новым производителем 3 ч.
Tesla отпраздновала выпуск 3 миллионов Model 3 — по одной машине каждые 90 секунд 4 ч.
В NASA рассказали, как спасли камеру зонда «Юнона» в окрестностях Юпитера 4 ч.