Сегодня 18 ноября 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Google представила компактную языковую модель Gemma 2 2B, которая превосходит GPT 3.5 Turbo

Компания Google представила Gemma 2 2B — компактную, но мощную языковую модель искусственного интеллекта (LLM), которая может составить конкуренцию лидерам отрасли, несмотря на свой значительно меньший размер. Новая языковая модель, содержащая всего 2,6 миллиарда параметров, демонстрирует производительность не хуже гораздо более крупных аналогов, включая OpenAI GPT-3.5 и Mistral AI Mixtral 8x7B.

 Источник изображений: Google

Источник изображений: Google

В тесте LMSYS Chatbot Arena, популярной онлайн-платформы для сравнительного тестирования и оценки качества моделей искусственного интеллекта, Gemma 2 2B набрала 1130 баллов. Этот результат немного опережает результаты GPT-3.5-Turbo-0613 (1117 баллов) и Mixtral-8x7B (1114 баллов) — моделей, обладающих в десять раз большим количеством параметров.

Google сообщает, что Gemma 2 2B также набрала 56,1 балла в тесте MMLU (Massive Multitask Language Understanding) и 36,6 балла в тесте MBPP (Mostly Basic Python Programming), что является значительным улучшением по сравнению с предыдущей версией.

Gemma 2 2B бросает вызов общепринятому мнению, что более крупные языковые модели изначально работают лучше компактных. Производительность Gemma 2 2B показывает, что сложные методы обучения, эффективность архитектуры и высококачественные наборы данных могут компенсировать недостаток в числе параметров. Разработка Gemma 2 2B также подчеркивает растущую важность методов сжатия и дистилляции моделей ИИ. Возможность эффективно компилировать информацию из более крупных моделей в более мелкие открывает возможности к созданию более доступных инструментов ИИ, при этом не жертвуя их производительностью.

Google обучила Gemma 2 2B на огромном наборе данных из 2 триллионов токенов, используя системы на базе своих фирменных ИИ-ускорителей TPU v5e. Поддержка нескольких языков расширяют её потенциал для применения в глобальных приложениях. Модель Gemma 2 2B имеет открытый исходный код. Исследователи и разработчики могут получить доступ к модели через платформу Hugging Face. Она также поддерживает различные фреймворки, включая PyTorch и TensorFlow.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Спустя 7 лет после запуска и через 18 лет после Steam в Epic Games Store появилась возможность дарить игры друзьям 10 мин.
Абонентам МТС перестали быстро приходить SMS для входа на «Госуслуги» 54 мин.
Генпрокуратура признала нежелательной деятельность разработчиков S.T.A.L.K.E.R. 2: Heart of Chornobyl на территории России 2 ч.
Alibaba выпустила ИИ-бота Qwen — будущего конкурента ChatGPT 2 ч.
Евросоюз рассматривает необходимость ограничения возможностей американских облачных гигантов 3 ч.
Roblox скоро начнёт разделять пользователей по возрасту — грядёт обязательная верификация 3 ч.
ИИ-агент в Windows 11 сможет загружать вирусы, предупредила Microsoft 3 ч.
ИИ сохранит ценность, даже если пузырь лопнет — но достанется всем, считает глава Google 6 ч.
Не для гуманитариев: Nvidia представила открытые ИИ-модели для цифровизации физики, механики, электроники и метеорологии 6 ч.
Ant Group представила ИИ-ассистента для разработки мини-приложений за полминуты 7 ч.
Американский стартап стал ближе к запуску «бюджетных» термоядерных реакторов, заинтересовавших даже Билла Гейтса 2 мин.
Представлен стандарт связи Zigbee 4.0 для умного дома — расширенное покрытие, пакетная настройка и работа без концентратора 12 мин.
Илон Маск хочет на порядок больше ИИ-чипов, чем выпускает вся полупроводниковая индустрия мира 2 ч.
Apple N1 сравнили с сетевыми чипами Android-флагманов: чуть медленнее, но намного стабильнее 2 ч.
InWin выпустила корпус Dlite с премиальным дизайном и четвёркой ARGB-вентиляторов в комплекте 2 ч.
Oracle подешевела на $374 млрд после заключения сделки с OpenAI на $300 млрд 2 ч.
Бывший гендир Intel Пэт Гелсингер рассказал, как его инициалы появились на каждом процессоре i386 2 ч.
d-Matrix привлекла ещё $275 млн и объявила о разработке первого ИИ-ускорителя с 3D-памятью Raptor 3 ч.
Google проложит интернет-кабель Dhivaru и создаст два телеком-хаба на островах в Индийском океане 4 ч.
Samsung и Hyundai инвестируют $400 млрд в ИИ-проекты в Южной Корее 4 ч.