Сегодня 23 февраля 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Meta✴ представила большую языковую ИИ-модель LLaMA для создания чат-ботов вроде ChatGPT, но лучше и экономичнее

Meta Platforms представила в пятницу большую языковую модель Large Language Model Meta AI (LLaMA) на базе ИИ, предназначенную для исследовательского сообщества. LLaMA будет доступна по некоммерческой лицензии исследователям и организациям, связанным с правительством, гражданским обществом и академическими кругами, сообщается в блоге компании. Разработчики смогут использовать LLaMA для создания чат-ботов и других продуктов на основе ИИ.

 Источник изображения: Pixabay

Источник изображения: Pixabay

LLaMA отличается от ChatGPT тем, что вовсе не является системой, с которой можно поговорить, а скорее исследовательским инструментом, который может помочь экспертам выявить проблемы языковых моделей ИИ, от предвзятости и токсичности до их склонности выдумывать информацию. Также следует отметить, что LLaMA Meta будет доступна в нескольких версиях — LLaMA-7B, LLaMA-13B, LLaMA-33B и LLaMA-65B, где цифры означают количество параметров — 7, 13, 33 и 65 млрд соответственно.

Инструмент, LLaMA, является новейшим достижение Meta в области больших языковых моделей, которые «показали многообещающие возможности для создания текста, ведения разговоров, обобщения письменного материала и более сложных задач, таких как решение математических теорем или предсказание белковых структур»,сообщил исполнительный директор Марк Цукерберг в своём аккаунте в Instagram.

LLaMA является более новой и продвинутой системой по сравнению с вышедшей в мае прошлого года большой языковой моделью OPT-175B, тоже предназначенной для исследователей, которая легла в основу новой версии чат-бота Meta BlenderBot.

Meta утверждает, что вторая по размеру версия модели LLaMA, LLaMA-13B, «в большинстве тестов» работает лучше популярной модели OpenAI GPT-3, в то время как самая большая модель LLaMA-65B, «конкурирует с лучшими моделями», такими как Chinchilla70B от DeepMind и PaLM 540B от Google.

В конце прошлого года компания выпустила ещё одну языковую модель Galactica, демонстрационную версию которой вскоре закрыла после того, как исследователи обнаружили, что она регулярно делилась предвзятой или неточной информацией.

Сообщается, что компания предоставит пользователям базовый код для настройки модели и её применения в сценариях использования, связанных с исследованиями. Модель, которая, по словам Meta, требует «гораздо меньше» вычислительной мощности, обучается на 20 языках с упором на языки с латиницей и кириллицей. После обучения LLaMA-13B сможет работать на одном ускорителе NVIDIA Tesla V100.

Источники:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Новая статья: Keep Driving — великолепная игра, сотканная из странных идей. Рецензия 6 ч.
Количество слияний и поглощений в российском IT-секторе в 2024 году выросло на треть 7 ч.
В рекордной краже криптовалюты у ByBit обвинили северокорейских хакеров 16 ч.
«Нам просто нужно больше мощностей»: OpenAI постепенно поборет зависимость от Microsoft 17 ч.
Трамповская криптооттепель: Coinbase удалось малой кровью отделаться от иска Комиссии по ценным бумагам США 17 ч.
Apple выпустила первую бету iOS 18.4, в которой появились «приоритетные уведомления» 19 ч.
Новая статья: Kingdom Come: Deliverance II — ролевое вознесение. Рецензия 22-02 00:03
Apple отключила сквозное шифрование в iCloud по требованию властей Великобритании 21-02 23:43
Взрывной платформер Shotgun Cop Man от создателя My Friend Pedro предложит спуститься в ад и арестовать Дьявола — трейлер и демоверсия в Steam 21-02 22:01
Valve заблокировала игру в российском Steam по требованию Роскомнадзора 21-02 20:20
Lenovo сообщила о двузначном росте выручки за III финансовый квартал по всем подразделениям — ISG снова в плюсе благодаря ИИ 7 ч.
В облаке Google Cloud появились инстансы A4X на базе суперускорителей NVIDIA GB200 NVL72 7 ч.
STMicroelectronics представила фотонный чип для 1,6-Тбит/с сетей 7 ч.
Несмотря на риск землетрясений, геотермальную энергию ждёт светлое будущее, считают учёные 8 ч.
Размышляющий ИИ DeepSeek R1 встроят в смартфоны Infinix Note 50 12 ч.
Nvidia признала, что не знает, когда сможет решить все проблемы видеокарт GeForce RTX 5000 14 ч.
Huawei захватила больше половины рынка складных смартфонов в Китае — на втором месте Honor 14 ч.
В Asus разогнали GeForce RTX 5090 до 3,5 ГГц и установили несколько рекордов 15 ч.
Норвежцы представили человекоподобного робота для дома и семьи — он мягкий и обтекаемый 16 ч.
Дженсен Хуанг снял с DeepSeek обвинения в обвале акций Nvidia — это инвесторы всё не так поняли 17 ч.