Сегодня 25 сентября 2023
18+
MWC 2018 2018 Computex IFA 2018
Новости Software

Meta✴ представила большую языковую ИИ-модель LLaMA для создания чат-ботов вроде ChatGPT, но лучше и экономичнее

Meta Platforms представила в пятницу большую языковую модель Large Language Model Meta AI (LLaMA) на базе ИИ, предназначенную для исследовательского сообщества. LLaMA будет доступна по некоммерческой лицензии исследователям и организациям, связанным с правительством, гражданским обществом и академическими кругами, сообщается в блоге компании. Разработчики смогут использовать LLaMA для создания чат-ботов и других продуктов на основе ИИ.

 Источник изображения: Pixabay

Источник изображения: Pixabay

LLaMA отличается от ChatGPT тем, что вовсе не является системой, с которой можно поговорить, а скорее исследовательским инструментом, который может помочь экспертам выявить проблемы языковых моделей ИИ, от предвзятости и токсичности до их склонности выдумывать информацию. Также следует отметить, что LLaMA Meta будет доступна в нескольких версиях — LLaMA-7B, LLaMA-13B, LLaMA-33B и LLaMA-65B, где цифры означают количество параметров — 7, 13, 33 и 65 млрд соответственно.

Инструмент, LLaMA, является новейшим достижение Meta в области больших языковых моделей, которые «показали многообещающие возможности для создания текста, ведения разговоров, обобщения письменного материала и более сложных задач, таких как решение математических теорем или предсказание белковых структур»,сообщил исполнительный директор Марк Цукерберг в своём аккаунте в Instagram.

LLaMA является более новой и продвинутой системой по сравнению с вышедшей в мае прошлого года большой языковой моделью OPT-175B, тоже предназначенной для исследователей, которая легла в основу новой версии чат-бота Meta BlenderBot.

Meta утверждает, что вторая по размеру версия модели LLaMA, LLaMA-13B, «в большинстве тестов» работает лучше популярной модели OpenAI GPT-3, в то время как самая большая модель LLaMA-65B, «конкурирует с лучшими моделями», такими как Chinchilla70B от DeepMind и PaLM 540B от Google.

В конце прошлого года компания выпустила ещё одну языковую модель Galactica, демонстрационную версию которой вскоре закрыла после того, как исследователи обнаружили, что она регулярно делилась предвзятой или неточной информацией.

Сообщается, что компания предоставит пользователям базовый код для настройки модели и её применения в сценариях использования, связанных с исследованиями. Модель, которая, по словам Meta, требует «гораздо меньше» вычислительной мощности, обучается на 20 языках с упором на языки с латиницей и кириллицей. После обучения LLaMA-13B сможет работать на одном ускорителе NVIDIA Tesla V100.

Источники:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме

✴ Внесена в перечень общественных объединений и религиозных организаций, в отношении которых судом принято вступившее в законную силу решение о ликвидации или запрете деятельности по основаниям, предусмотренным Федеральным законом от 25.07.2002 № 114-ФЗ «О противодействии экстремистской деятельности».

window-new
Soft
Hard
Тренды 🔥
Гибридная облачная платформа Huawei Cloud Stack упростит создание кастомных ИИ-моделей 10 ч.
Военная стратегия Company of Heroes выйдет на Nintendo Switch со всеми дополнениями уже 12 октября 13 ч.
Видео: 9 минут геймплея сессионного онлайн-шутера Escape from Tarkov: Arena 15 ч.
400 тыс. новых вирусов каждый день: «Лаборатория Касперского» заявила о глобальном росте числа кибератак 23 ч.
Nintendo сделала шаг в будущее без паролей: заработал вход в аккаунт Nintendo через Passkey 24-09 07:32
Новая статья: Dune: Spice Wars — дождевой червяк вместо Шаи-Хулуда. Рецензия 24-09 00:22
Resident Evil Village для iPhone и iPad выйдет 30 октября 23-09 17:33
Microsoft обогатила мобильную клавиатуру SwiftKey ИИ-функциями — умные подсказки, проверка текста и генерация картинок и стикеров 23-09 16:21
Клиентов российских хостингов будут идентифицировать через «Госуслуги» или по паспорту 23-09 14:40
ИИ-генераторы текстов и изображений оказались экологичнее живых писателей и художников 23-09 12:40
Tesla показала, как роботы Optimus сортируют предметы и выполняют упражнения йоги, стоя на одной ноге 41 мин.
Новая статья: Как DDR5-память влияет на производительность Ryzen 7 7800X3D: отвечаем на главные вопросы 9 ч.
Microsoft ищет топ-менеджера по внедрению малых модульных реакторов для питания ЦОД 11 ч.
Swissbit представила индустриальные microSD-карты iShield Archive с аппаратным AES-шифрованием и контролем доступа 12 ч.
Китай под санкциями удвоил уровень локализации в сфере оборудования для производства чипов 21 ч.
SpaceX повторила рекорд по использованию первой ступени Falcon 9 в 17-й раз 22 ч.
Apple iPhone 15 Plus стал рекордсменом по продолжительности работы аккумулятора 24-09 08:00
Американская Lucid Motors получила разрешение на выпуск электромобилей в Саудовской Аравии 24-09 07:56
В Остине роботизированные такси Cruise создали затор на перекрёстке и быстро его усугубили 24-09 07:30
Смартфоны iPhone 15 поддерживают проводное подключение к интернету — быстрее, чем по Wi-Fi 24-09 05:55