Сегодня 22 мая 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Google представила компактную языковую модель Gemma 2 2B, которая превосходит GPT 3.5 Turbo

Компания Google представила Gemma 2 2B — компактную, но мощную языковую модель искусственного интеллекта (LLM), которая может составить конкуренцию лидерам отрасли, несмотря на свой значительно меньший размер. Новая языковая модель, содержащая всего 2,6 миллиарда параметров, демонстрирует производительность не хуже гораздо более крупных аналогов, включая OpenAI GPT-3.5 и Mistral AI Mixtral 8x7B.

 Источник изображений: Google

Источник изображений: Google

В тесте LMSYS Chatbot Arena, популярной онлайн-платформы для сравнительного тестирования и оценки качества моделей искусственного интеллекта, Gemma 2 2B набрала 1130 баллов. Этот результат немного опережает результаты GPT-3.5-Turbo-0613 (1117 баллов) и Mixtral-8x7B (1114 баллов) — моделей, обладающих в десять раз большим количеством параметров.

Google сообщает, что Gemma 2 2B также набрала 56,1 балла в тесте MMLU (Massive Multitask Language Understanding) и 36,6 балла в тесте MBPP (Mostly Basic Python Programming), что является значительным улучшением по сравнению с предыдущей версией.

Gemma 2 2B бросает вызов общепринятому мнению, что более крупные языковые модели изначально работают лучше компактных. Производительность Gemma 2 2B показывает, что сложные методы обучения, эффективность архитектуры и высококачественные наборы данных могут компенсировать недостаток в числе параметров. Разработка Gemma 2 2B также подчеркивает растущую важность методов сжатия и дистилляции моделей ИИ. Возможность эффективно компилировать информацию из более крупных моделей в более мелкие открывает возможности к созданию более доступных инструментов ИИ, при этом не жертвуя их производительностью.

Google обучила Gemma 2 2B на огромном наборе данных из 2 триллионов токенов, используя системы на базе своих фирменных ИИ-ускорителей TPU v5e. Поддержка нескольких языков расширяют её потенциал для применения в глобальных приложениях. Модель Gemma 2 2B имеет открытый исходный код. Исследователи и разработчики могут получить доступ к модели через платформу Hugging Face. Она также поддерживает различные фреймворки, включая PyTorch и TensorFlow.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Ролевой шутер Witchfire от экс-разработчиков Painkiller и Bulletstorm скоро получит перевод на русский — подробности The Revelations Update 47 мин.
«Болотный лагерь выглядит великолепно»: 20 минут нового геймплея ремейка «Готики» впечатлили фанатов оригинальной игры 2 ч.
Cisco выяснила, почему безупречные на первый взгляд отчёты ИИ о киберинцидентах нельзя принимать на веру 3 ч.
Заряженное ностальгией и ужасами приключение Midnight Souls отправит искать любовь и бороться со стариками 3 ч.
Google назвала лучшие ИИ-модели для разработки Android-приложений — Gemini проиграл GPT 4 ч.
Сегодня исполнилось 16 лет первой покупке за биткоины — две пиццы теперь стоили бы $770 млн 6 ч.
Microsoft разрешит убирать раздражающую кнопку ИИ-помощника Copilot в Word, Excel и PowerPoint 7 ч.
Новый большой патч для Crimson Desert добавил детёнышей виверн и позволил Клиффу использовать дробовик 8 ч.
Meta переизобрела Reddit — приложение Forum объединит группы Facebook и ИИ-поиск ответов 8 ч.
Техас подал иск против Meta и WhatsApp — мессенджер соврал про зашифрованные переписки 8 ч.
Huawei придумала, как выпускать SSD на 122 Тбайт без передовой флеш-памяти 16 мин.
Создан материал для «неисчерпаемой фляги» — он сам добывает воду из воздуха, пока светит Солнце 19 мин.
Huawei выпустила 122-Тбайт SSD с фирменной технологией DoB 27 мин.
Tesla отзывает тысячи электромобилей Model Y из-за вероятного отсутствия одной наклейки 3 ч.
Realme представила смарт-часы Watch S5 с 1,43-дюймовым AMOLED и автономностью до 20 дней за $80 4 ч.
Bosch поможет стартапу Humanoid выпускать человекоподобных роботов на ногах и колёсах 4 ч.
Creative представила звуковую карту Sound Blaster AE-X с поддержкой 32-битного звука на 384 кГц 5 ч.
Sparkle выпустила тонкую видеокарту Arc Pro B50 Blower с «турбиной» для рабочих станций 5 ч.
Microsoft потеряла директора по маркетингу, который проработал в компании 35 лет 5 ч.
Hobot выпустила робота-мойщика окон Hobot SP10 с подвижными скребками для кристально чистого результата 5 ч.