Сегодня 23 января 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Свежая версия ИИ Google Gemini обошла в тестах GPT-4o и Claude-3

Последняя версия большой языковой модели Gemini 1.5 Pro внезапно пробилась на верхушку рейтинга на платформе Chatbot Arena, обойдя в тестах традиционных лидеров в области генеративного искусственного интеллекта — OpenAI GPT-4o и Anthropic Claude-3.

 Источник изображения: blog.google

Источник изображения: blog.google

Бывшая прежде чемпионом нейросеть OpenAI GPT-4o уступила лидерство 1 августа, когда Google без громких анонсов выпустила экспериментальную сборку своей последней модели — она быстро привлекла интересующееся ИИ сообщество в соцсетях, которое сочло победу в бенчмарке свидетельством качества. Сервис OpenAI ChatGPT стал почти синонимом генеративного ИИ с момента запуска ещё в эпоху GPT-3. К настоящему моменту устоявшимися лидерами считаются OpenAI GPT-4o и Anthropic Claude-3, которые за последний год почти не знали конкурентов в тестах.

 Источник изображения: x.com/lmsysorg

Источник изображения: x.com/lmsysorg

Один из наиболее популярных тестов — LMSYS Chatbot Arena. Он предлагает моделям различные задачи и присваивает им оценки. Актуальная версия GPT-4o смогла набрать 1286 баллов, а Claude-3 — 1271 балл. У предыдущей Google Gemini 1.5 Pro рейтинг был 1261, но выпущенная 1 августа Gemini 1.5 Pro 0801 внезапно получила колоссальные 1300 баллов. Это может свидетельствовать, что новая нейросеть Google способнее своих конкурентов, но бенчмарки не всегда точно отражают, что может и чего не может модель ИИ.

Современный рынок чат-ботов уже достаточно созрел, чтобы предложить потребителю несколько вариантов и дать ему возможность самому решить, какой ИИ подходит лучше всего. Пока нет ясности, станет ли экспериментальная Gemini 1.5 Pro версией по умолчанию в будущем. Она остаётся общедоступной, но с экспериментальным статусом может быть закрыта или радикально отредактирована по соображениям безопасности или другим причинам.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Осенняя Москва, интересные квесты и графика лучше, чем в S.T.A.L.K.E.R. 2: датамайнеры раскрыли новые подробности следующей Metro 53 мин.
Релиз ремейка Resident Evil 2 на iPhone 16 и iPhone 15 Pro обернулся ещё одним провалом для Capcom 2 ч.
ChatGPT перестал открываться по всему миру — тысячам пользователей пришлось думать самостоятельно 2 ч.
В софте Subaru нашли дыру, позволявшую удалённо отпирать, заводить и следить за миллионами автомобилей 2 ч.
Сооснователя французского криптостартапа Ledger освободили после похищения 2 ч.
Британский регулятор расследует, не вредят ли Apple и Google инновациям в смартфонах 3 ч.
Cloudflare снова отразила крупнейшую в истории DDoS-атаку — её мощность достигла 5,6 Тбит/с 3 ч.
Патч 2.21 добавил в Cyberpunk 2077 поддержку DLSS 4, но пока без мультикадровой генерации на GeForce RTX 50-й серии 4 ч.
Пользователи Rutube теперь могут скачивать видео на Android-смартфонах 7 ч.
В Nebius AI Studio появились открытые ИИ-модели для преобразования текста в изображение 7 ч.
ByteDance намерена потратить $12 млрд на ИИ-ускорители в 2025 году 4 мин.
Китайский гиперзвуковой беспилотник с детонационным двигателем взлетит уже в 2026 году — на год раньше планов 43 мин.
Apple ответит в суде за токсичную и опасную для здоровья химию в ремешках умных часов 2 ч.
«Рег.ру» запустил ленточную платформу для безопасного хранения данных 3 ч.
Стартап Vast Space намерен построить космическую станцию с искусственной гравитацией — демонстрация намечена на 2028 год 3 ч.
Samsung подтвердила, что разрабатывает трёхстворчатый смартфон 4 ч.
Не Китай: Тайвань назвал «естественный износ» причиной последних отключений подводных интернет-кабелей 5 ч.
Для гонок электромобилей Formula E создали сверхбыструю зарядку — 10 % за 34 секунды 6 ч.
Смартфон HONOR X9c выдержал проверку на прочность ударами камня для керлинга весом 20 кг 6 ч.
Медь с примесью алмазов обеспечит лучшее охлаждение самых горячих чипов 7 ч.