Сегодня 17 ноября 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Meta✴ представила ИИ-модели семейства Llama 4 и встроила их в WhatsApp и Instagram✴

Компания Meta Platforms объявила о запуске семейства открытых моделей искусственного интеллекта Llama 4. В него вошли Llama 4 Scout, Maverick и Behemoth, которые обеспечивают возможность мультимодального взаимодействия, т.е. способны отвечать не только на текстовые запросы, но и обрабатывать изображения, видео и др. Они обучались на «большом количестве немаркированных текстовых, графических и видеоданных» для обеспечения «широкого визуального понимания».

 Искусственный интеллект: Steve Johnson / Unsplash

Искусственный интеллект: Steve Johnson / Unsplash

Успех ИИ-моделей китайской компании DeepSeek, которые работают наравне или превосходят флагманские алгоритмы Llama предыдущих поколений, подтолкнул Meta к ускорению процесса разработки в этом направлении. По данным источника, сотрудники компании прикладывают массу усилий, чтобы понять, как DeepSeek удалось снизить стоимость разработки и запуска ИИ-моделей, таких как R1 и V3.

 Источник изображения: ***

Источник изображения: Meta

Алгоритм Llama 4 Scout имеет 17 млрд активных параметров, 16 «экспертов» и 109 млрд параметров в целом. По данным Meta, ИИ-модель превосходит Gemma 3, Gemini 2.0 Flash-Lite и Mistral 3.1 в обработке разных типов задач. Одна из основных особенностей модели заключается в поддержке контекстного окна в 10 млн токенов.

Llama 4 Maverick имеет 17 млрд активных параметров и 128 «экспертов» (всего 400 млрд параметров). По данным разработчиков, модель превосходит GPT-4o и Gemini 2.0 Flash при тестировании в разных бенчмарках, а также показывает сравнимые с DeepSeek V3 результаты при ведении рассуждений и в процессе написания программного кода. Scout может работать на одном графическом ускорителе Nvidia H100, тогда как для Maverick требуется система Nvidia H100 DGX или эквивалентная ей.

Модель Llama 4 Behemoth имеет 288 млрд активных параметров и 16 «экспертов» (всего около 2 трлн параметров) и превосходит алгоритм GPT-4.5, Claude Sonnet 3.7 и Gemini 2.0 Pro по результатам тестирования в разных бенчмарках. Модель Llama 4 Behemoth продолжает обучаться, поэтому она ещё недоступна публично. В это же время модели Scout и Maverick доступны на сайте Llama.com и на Hugging Face. В дополнение к этому фирменный ИИ-помощник Meta AI, доступный в приложениях компании, таких как WhatsApp, Messenger и Instagram, переведён на работу с Llama 4 в 40 странах мира. Возможность обработки мультимодальных запросов пока ограничена английским языком и доступна только в США.

 Источник изображения: ***

Источник изображения: Meta

«Модели Llama 4 знаменуют собой начало новой эры экосистемы Llama. Это только начало для семейства Llama 4», — говорится в сообщении в блоге Meta. Компания утверждает, что Llama 4 является первой группой ИИ-моделей, использующих архитектуру «смесь экспертов» (MoE), которая более эффективна при обучении и инференсе. Архитектура MoE позволяет алгоритму разбивать задачи на подзадачи, а затем делегировать их обработку более мелким и специализированным «экспертным» моделям.

Следует отметить, что ни одна из моделей Llama 4 не является правильной «рассуждающей» моделью, как, например, GPT-o1 или GPT-o3-mini от OpenAI. Рассуждающие модели проверяют свои ответы на достоверность и, как правило, их ответы более надёжны, но для их получения требуется больше времени, чем при взаимодействии с традиционными «не рассуждающими» моделями.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Владелец Amazon Джефф Безос нашёл себе новую работу в сфере ИИ 2 мин.
Разработчики Cities: Skylines 2 и Paradox Interactive разорвали сотрудничество — игру доверят другой студии 43 мин.
Capcom пообещала уберечь Resident Evil Requiem от судьбы Monster Hunter Wilds, которая даже спустя восемь месяцев страдает от проблем с оптимизацией 2 ч.
Программный «ускоритель» Huawei обещает практически удвоить производительность дефицитных ИИ-чипов 3 ч.
Разработчики Pioner «с удвоенной силой» взялись за исправление главных проблем открытой «беты» и готовят новое тестирование 6 ч.
Глава Microsoft считает, что ИИ не должен обогащать лишь кучку техногигантов 9 ч.
Новая Splinter Cell умерла из-за увлечения Ubisoft играми-сервисами 10 ч.
«Базис» представляет новую версию Basis Dynamix Enterprise с поддержкой программно-определяемых сетей и зон доступности 10 ч.
Игровой движок Unreal Engine 6 выпустят значительно раньше ожидаемого 23 ч.
Apple сократила вдвое комиссию для разработчиков мини-приложений 23 ч.
Наушники Samsung Galaxy Buds 4 получат управление головой и множество других новых функций 6 мин.
Colorful выпустила видеокарты iGame Ultra Z BTF 2.0 с «невидимым» питанием 3 ч.
Перегрузка энергосетей угрожает лидерству Нидерландов в сфере ЦОД — доступный водород продолжают игнорировать 3 ч.
Больше $300 млрд за пятилетку Samsung вложит в производство чипов, аккумуляторов и не только 4 ч.
Huawei представит технологию, позволяющую выжать из дефицитных ИИ-чипов максимум 4 ч.
Veir испытала сверхпроводящие кабели для ЦОД — до 3 МВт на впятеро большее расстояние, чем у обычных 6 ч.
Создатель ИИ-гаджета Rabbit R1 перестал платить зарплаты, но ожидает инвестиций на новое устройство 6 ч.
Стало известно, когда на дорогах России появятся беспилотные грузовики без людей в кабине 7 ч.
Huawei раскрыла дату анонса флагманов Mate 80 и складного Mate X7 7 ч.
Silicon Motion представила контроллер SM8388 для QLC SSD с интерфейсом PCIe 5.0 7 ч.