Сегодня 13 ноября 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Meta✴ представила ИИ-модели семейства Llama 4 и встроила их в WhatsApp и Instagram✴

Компания Meta Platforms объявила о запуске семейства открытых моделей искусственного интеллекта Llama 4. В него вошли Llama 4 Scout, Maverick и Behemoth, которые обеспечивают возможность мультимодального взаимодействия, т.е. способны отвечать не только на текстовые запросы, но и обрабатывать изображения, видео и др. Они обучались на «большом количестве немаркированных текстовых, графических и видеоданных» для обеспечения «широкого визуального понимания».

 Искусственный интеллект: Steve Johnson / Unsplash

Искусственный интеллект: Steve Johnson / Unsplash

Успех ИИ-моделей китайской компании DeepSeek, которые работают наравне или превосходят флагманские алгоритмы Llama предыдущих поколений, подтолкнул Meta к ускорению процесса разработки в этом направлении. По данным источника, сотрудники компании прикладывают массу усилий, чтобы понять, как DeepSeek удалось снизить стоимость разработки и запуска ИИ-моделей, таких как R1 и V3.

 Источник изображения: ***

Источник изображения: Meta

Алгоритм Llama 4 Scout имеет 17 млрд активных параметров, 16 «экспертов» и 109 млрд параметров в целом. По данным Meta, ИИ-модель превосходит Gemma 3, Gemini 2.0 Flash-Lite и Mistral 3.1 в обработке разных типов задач. Одна из основных особенностей модели заключается в поддержке контекстного окна в 10 млн токенов.

Llama 4 Maverick имеет 17 млрд активных параметров и 128 «экспертов» (всего 400 млрд параметров). По данным разработчиков, модель превосходит GPT-4o и Gemini 2.0 Flash при тестировании в разных бенчмарках, а также показывает сравнимые с DeepSeek V3 результаты при ведении рассуждений и в процессе написания программного кода. Scout может работать на одном графическом ускорителе Nvidia H100, тогда как для Maverick требуется система Nvidia H100 DGX или эквивалентная ей.

Модель Llama 4 Behemoth имеет 288 млрд активных параметров и 16 «экспертов» (всего около 2 трлн параметров) и превосходит алгоритм GPT-4.5, Claude Sonnet 3.7 и Gemini 2.0 Pro по результатам тестирования в разных бенчмарках. Модель Llama 4 Behemoth продолжает обучаться, поэтому она ещё недоступна публично. В это же время модели Scout и Maverick доступны на сайте Llama.com и на Hugging Face. В дополнение к этому фирменный ИИ-помощник Meta AI, доступный в приложениях компании, таких как WhatsApp, Messenger и Instagram, переведён на работу с Llama 4 в 40 странах мира. Возможность обработки мультимодальных запросов пока ограничена английским языком и доступна только в США.

 Источник изображения: ***

Источник изображения: Meta

«Модели Llama 4 знаменуют собой начало новой эры экосистемы Llama. Это только начало для семейства Llama 4», — говорится в сообщении в блоге Meta. Компания утверждает, что Llama 4 является первой группой ИИ-моделей, использующих архитектуру «смесь экспертов» (MoE), которая более эффективна при обучении и инференсе. Архитектура MoE позволяет алгоритму разбивать задачи на подзадачи, а затем делегировать их обработку более мелким и специализированным «экспертным» моделям.

Следует отметить, что ни одна из моделей Llama 4 не является правильной «рассуждающей» моделью, как, например, GPT-o1 или GPT-o3-mini от OpenAI. Рассуждающие модели проверяют свои ответы на достоверность и, как правило, их ответы более надёжны, но для их получения требуется больше времени, чем при взаимодействии с традиционными «не рассуждающими» моделями.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Sony разрешила оплачивать покупки в PS Store картами из стран без поддержки PSN — возможно, ненадолго 2 ч.
Google грозит новый штраф в ЕС — на этот раз из-за неправильной борьбы со спамом 2 ч.
ИИ Google пробежится по рождественским распродажам за пользователя — сам выберет, сам закажет… и сам воспользуется? 2 ч.
Власти Франции полностью сняли с главы Telegram Павла Дурова запрет на выезд из страны 3 ч.
Анонсирована третья экранизация Death Stranding — мультсериал Death Stranding Isolations с новой историей и смелой анимацией 3 ч.
Apple заработает миллиарды на пользователях WeChat — компания договорилась с Tencent о комиссии в 15 % 4 ч.
Похоже, Red Dead Redemption выйдет на PS5, Switch 2, Xbox Series X и S раньше, чем RDR 2 4 ч.
«Ростелеком» приобретает долю в одном из старейших разработчиков российского Linux — «Базальт СПО» 5 ч.
В Steam стартовали предзаказы Escape from Tarkov — до релиза игра доступна со скидкой 25 % 7 ч.
Google передумала закрывать Android от сторонних приложений — но только для «опытных пользователей» 7 ч.
«Алиса» не подслушивает чужих секретов, заверили в «Яндексе» — но как подстраховаться рассказали 3 ч.
Google инвестирует €5,5 млрд в дата-центры в Германии 3 ч.
Ретро-консоль Analogue 3D с поддержкой 4K и картриджей Nintendo 64 наконец поступит в продажу на следующей неделе 3 ч.
Меж болот и прерий: Meta начала строительство юбилейного 30-го дата-центра за $1 млрд 3 ч.
DJI выпустила селфи-дрон Neo 2 за €239 на глобальный рынок, но не в США 4 ч.
1024 ядра, 6 ГГц и 48 Тбайт DDR5-17600: Tachyum обновила характеристики несуществующего процессора Prodigy 5 ч.
Samsung выпустила портативные смарт-мониторы Movingstyle диагональю 27 и 32 дюйма 5 ч.
Backblaze назвала самые надёжные жёсткие диски — и те, что ломаются чаще других 5 ч.
Утечка раскрыла характеристики первого трёхстворчатого смартфона Samsung 5 ч.
Астрономы впервые засекли корональный выброс массы далёкой звезды — фатальный для потенциальной инопланетной жизни 6 ч.