Сегодня 28 ноября 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Google представила компактную языковую модель Gemma 2 2B, которая превосходит GPT 3.5 Turbo

Компания Google представила Gemma 2 2B — компактную, но мощную языковую модель искусственного интеллекта (LLM), которая может составить конкуренцию лидерам отрасли, несмотря на свой значительно меньший размер. Новая языковая модель, содержащая всего 2,6 миллиарда параметров, демонстрирует производительность не хуже гораздо более крупных аналогов, включая OpenAI GPT-3.5 и Mistral AI Mixtral 8x7B.

 Источник изображений: Google

Источник изображений: Google

В тесте LMSYS Chatbot Arena, популярной онлайн-платформы для сравнительного тестирования и оценки качества моделей искусственного интеллекта, Gemma 2 2B набрала 1130 баллов. Этот результат немного опережает результаты GPT-3.5-Turbo-0613 (1117 баллов) и Mixtral-8x7B (1114 баллов) — моделей, обладающих в десять раз большим количеством параметров.

Google сообщает, что Gemma 2 2B также набрала 56,1 балла в тесте MMLU (Massive Multitask Language Understanding) и 36,6 балла в тесте MBPP (Mostly Basic Python Programming), что является значительным улучшением по сравнению с предыдущей версией.

Gemma 2 2B бросает вызов общепринятому мнению, что более крупные языковые модели изначально работают лучше компактных. Производительность Gemma 2 2B показывает, что сложные методы обучения, эффективность архитектуры и высококачественные наборы данных могут компенсировать недостаток в числе параметров. Разработка Gemma 2 2B также подчеркивает растущую важность методов сжатия и дистилляции моделей ИИ. Возможность эффективно компилировать информацию из более крупных моделей в более мелкие открывает возможности к созданию более доступных инструментов ИИ, при этом не жертвуя их производительностью.

Google обучила Gemma 2 2B на огромном наборе данных из 2 триллионов токенов, используя системы на базе своих фирменных ИИ-ускорителей TPU v5e. Поддержка нескольких языков расширяют её потенциал для применения в глобальных приложениях. Модель Gemma 2 2B имеет открытый исходный код. Исследователи и разработчики могут получить доступ к модели через платформу Hugging Face. Она также поддерживает различные фреймворки, включая PyTorch и TensorFlow.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Гора с плеч: SEC отказалась от иска к SolarWinds и её шефу по безопасности из-за нашумевшей атаки SUNBURST пятилетней давности 27 мин.
В Туркменистане узаконили майнинг и криптовалютные биржи 2 ч.
SAP предложила клиентам из Евросоюза суверенное ИИ-облако EU AI Cloud 2 ч.
Бывший сценарист inXile рассекретил, когда выйдет Clockwork Revolution — амбициозная стимпанковая RPG про путешествия во времени 3 ч.
Велосипедный хоррор Quite a Ride от создателя Selfloss «напугал до смерти» даже своего издателя 4 ч.
Control 2 могут показать на The Game Awards 2025 — Remedy зарегистрировала торговую марку Control Resonant 6 ч.
Москвичи и не только массово пожаловались на сбой в работе WhatsApp 7 ч.
«С тех пор игра сильно изменилась»: Ubisoft отреагировала на утечку внутренней презентации ремейка Prince of Persia: The Sands of Time 8 ч.
Steam наконец стал 64-битным — 32-битному клиенту осталось чуть больше месяца 16 ч.
Трассировка лучей на ПК, «Новая игра +» и прокачка «Легенды»: для Dying Light: The Beast вышло самое крупное обновление с релиза 20 ч.
В Минцифры рассказали, как обойти период «охлаждения» для иностранных SIM-карт 49 мин.
В Китае реализуют крупнейший в мире проект по хранению энергии в задутом под землю воздухе 2 ч.
Tesla подсмотрела у китайских конкурентов методы производства машин, признался экс-руководитель отдела продаж 3 ч.
Смартфоны Poco M7 и Redmi Note 14 сочетают высокую функциональность с доступной ценой 3 ч.
В Китае похвастались разработкой ИИ-ускорителя в полтора раза быстрее чипа Nvidia пятилетней давности 4 ч.
Люди даже не представляют, насколько ИИ изменит мир — но завершится всё пузырём, хоть и не скоро 4 ч.
Россияне показали преданность брендам своих смартфонов — больше всего любят Apple, Realme, Xiaomi и Samsung 4 ч.
Астрономы обнаружили молодую звезду с древней химией — похоже, она впитала часть партнёра по системе 4 ч.
Партнёры OpenAI набрали долгов на $100 млрд, чтобы оплатить ИИ-мегапроекты Альтмана 4 ч.
Сервер Giga Computing R284-A91 получил 16 отсеков для CXL-модулей формата E3.S 2T 4 ч.