Сегодня 01 октября 2024
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

AMD выпустила свою первую языковую модель ИИ — AMD-135M

Поскольку AMD пытается нарастить своё присутствие на рынке ИИ, производитель выпускает не только аппаратное обеспечение под эти нужды, но также решил заняться разработкой языковых моделей. Результатом этого стал анонс первой малой языковой AMD-135M.

 Источник изображения: AMD

Источник изображения: AMD

Новая малая языковая модель AMD-135M принадлежит к семейству Llama и нацелена на развёртывание в частном бизнесе. Неясно, имеет ли новая ИИ-модель AMD какое-либо отношение к недавнему приобретению компанией стартапа Silo AI (сделка ещё не завершена и пока не одобрена различными регуляторами, поэтому, вероятно, нет). Однако это явный шаг в направлении удовлетворения потребностей конкретных клиентов с помощью предварительно обученной модели, созданной AMD с использованием её же оборудования.

Преимущество языковой модели AMD заключается в том, что она использует так называемое спекулятивное декодирование. Последнее представляет собой меньшую «черновую модель», которая генерирует несколько токенов-кандидатов за один прямой проход. Затем токены передаются в более крупную, более точную «целевую модель», которая проверяет или исправляет их. С одной стороны, такой подход позволяет генерировать несколько токенов одновременно, но с другой стороны, это приводит к повышению потребляемой мощности за счёт увеличения передачи данных.

Языковая модель AMD представлена в двух версиях: AMD-Llama-135M и AMD-Llama-135M-code. Каждая из них оптимизирована для определённых задач путём повышения производительности вывода с помощью технологии спекулятивного декодирования. Базовая модель AMD-Llama-135M была обучена с нуля на базе 670 млрд токенов общих данных. Этот процесс занял шесть дней с использованием четырех 8-канальных узлов на базе AMD Instinct MI250.

Модель AMD-Llama-135M-code в свою очередь была улучшена за счёт дообучения на базе дополнительных 20 млрд токенов, специально ориентированных на написание программного кода. Дополнительное обучение модели заняло четыре дня с использованием того же набора оборудования AMD. Компания считает, что дальнейшие оптимизации её моделей могут привести к дополнительному повышению их производительности и эффективности.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Вечерний 3DNews
Каждый будний вечер мы рассылаем сводку новостей без белиберды и рекламы. Две минуты на чтение — и вы в курсе главных событий.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
AMD выпустила свою первую языковую модель ИИ — AMD-135M 4 ч.
На смартфоны россиян стали прилетать фейковые пуш-уведомления от банков — мошенники совершенствуют тактику 4 ч.
Steam устроил фестиваль пошаговых ролевых игр со скидками на Jagged Alliance 3, Warhammer 40,000: Rogue Trader и сотни других RPG 5 ч.
Календарь релизов — 30 сентября – 6 октября: Starfield: Shattered Space, Until Dawn и Kill ... t 5 ч.
SoftBank вызвалась заменить Apple в списке ключевых инвесторов OpenAI 6 ч.
Neon Blood получила дату релиза в Steam и на консолях — это киберпанковый ролевой детектив в последнем мегаполисе на Земле 8 ч.
Продюсер Tekken рассказал, как пытался добавить в игру Полковника Сандерса из KFC 9 ч.
«Это просто нечто»: в Steam вышел хоррор Zoochosis о смотрителе зоопарка с животными-мутантами 10 ч.
Книжный сервис «Букмейт» сменил название на «Яндекс Книги» 10 ч.
Ещё более технологичная и реалистичная: гоночный симулятор Assetto Corsa Evo выйдет на старт раннего доступа Steam позже ожидаемого 11 ч.
Оказывается, сенсорные экраны в технике бесят пользователей — в моду возвращаются физические кнопки 3 ч.
iPhone 16 стали самыми ремонтопригодными смартфонами Apple за всю историю 3 ч.
Samsung разработала твердотельную батарею для Galaxy Watch: она ёмче, меньше и безопаснее литийионной 4 ч.
Высокоскоростная память CUDIMM совместима с Ryzen 9000, но нужна плата на AMD X870 или X870E 4 ч.
В 2025 году Apple может выпустить умный дисплей с Apple Intelligence и HomeOS 5 ч.
Новая статья: Обзор iPhone 16: наконец-то базовый «айфон» стал интересным 5 ч.
Noctua выпустила новую серию высокоэффективных вентиляторов NF-A14x25 G2 5 ч.
AMD улучшила Ryzen 9000 через AGESA: 105 Вт TDP для младших моделей и сниженные задержки для старших 6 ч.
Asus, ASRock и MSI выпустили BIOS с финальным исправлением нестабильности Raptor Lake 8 ч.
Первая установка Canon для нанопечатной литографии передана на изучение специалистам Intel и Samsung 8 ч.