Сегодня 17 октября 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

AMD выпустила свою первую языковую модель ИИ — AMD-135M

Поскольку AMD пытается нарастить своё присутствие на рынке ИИ, производитель выпускает не только аппаратное обеспечение под эти нужды, но также решил заняться разработкой языковых моделей. Результатом этого стал анонс первой малой языковой AMD-135M.

 Источник изображения: AMD

Источник изображения: AMD

Новая малая языковая модель AMD-135M принадлежит к семейству Llama и нацелена на развёртывание в частном бизнесе. Неясно, имеет ли новая ИИ-модель AMD какое-либо отношение к недавнему приобретению компанией стартапа Silo AI (сделка ещё не завершена и пока не одобрена различными регуляторами, поэтому, вероятно, нет). Однако это явный шаг в направлении удовлетворения потребностей конкретных клиентов с помощью предварительно обученной модели, созданной AMD с использованием её же оборудования.

Преимущество языковой модели AMD заключается в том, что она использует так называемое спекулятивное декодирование. Последнее представляет собой меньшую «черновую модель», которая генерирует несколько токенов-кандидатов за один прямой проход. Затем токены передаются в более крупную, более точную «целевую модель», которая проверяет или исправляет их. С одной стороны, такой подход позволяет генерировать несколько токенов одновременно, но с другой стороны, это приводит к повышению потребляемой мощности за счёт увеличения передачи данных.

Языковая модель AMD представлена в двух версиях: AMD-Llama-135M и AMD-Llama-135M-code. Каждая из них оптимизирована для определённых задач путём повышения производительности вывода с помощью технологии спекулятивного декодирования. Базовая модель AMD-Llama-135M была обучена с нуля на базе 670 млрд токенов общих данных. Этот процесс занял шесть дней с использованием четырех 8-канальных узлов на базе AMD Instinct MI250.

Модель AMD-Llama-135M-code в свою очередь была улучшена за счёт дообучения на базе дополнительных 20 млрд токенов, специально ориентированных на написание программного кода. Дополнительное обучение модели заняло четыре дня с использованием того же набора оборудования AMD. Компания считает, что дальнейшие оптимизации её моделей могут привести к дополнительному повышению их производительности и эффективности.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Anthropic представила инструмент Skills, который сделает ИИ полезнее в реальной работе 8 ч.
Умер легендарный гейм-дизайнер Томонобу Итагаки — создатель Dead or Alive и отец современной Ninja Gaiden 9 ч.
OnePlus представила OxygenOS 16 в стиле iOS с расширенными ИИ-функциями и не только 10 ч.
Мультиплеерной игрой Quantic Dream оказалась условно-бесплатная MOBA — первый трейлер, геймплей и подробности Spellcasters Chronicles 10 ч.
Battlefield 6 установила новый рекорд скорости продаж для франшизы — 7 миллионов копий за три дня 12 ч.
Партнёр PayPal по блокчейну случайно выпустил стейблкоины на $300 триллионов 13 ч.
Windows 11 получит голосовое управление, будет следить за происходящим на экране и выполнять поручения пользователя 13 ч.
Приложения Facebook Messenger для Windows и macOS перестанут работать через 60 дней 13 ч.
Разработчик Heavy Rain и Detroit: Become Human впервые взялся за мультиплеерную игру, а Star Wars Eclipse всё ещё жива 14 ч.
Спрос на молодых айтишников в Великобритании рухнул на 46 % из-за ИИ — дальше будет хуже 14 ч.
Nintendo намерена до марта выпустить 25 млн игровых консолей Switch 2 2 ч.
Британцы раздумывали над уничтожением дата-центра с секретными данными, который по недосмотру достался компании, связанной с Китаем 6 ч.
Новая статья: Обзор игрового QD-Mini LED VA-монитора MSI MAG 274QPF X30MV: редкое сочетание 7 ч.
Oppo представила сверхтонкие смарт-часы Watch S с 1,46-дюймовым экраном и автономностью до 10 дней 8 ч.
Водители Uber будут обучать искусственный интеллект в перерывах между заказами 9 ч.
Загадочное свечение центра Млечного Пути может пролить свет на тайну тёмной материи 9 ч.
Qualcomm и MediaTek задумались о передаче заказов на выпуск чипов Samsung — TSMC задрала цены 11 ч.
Xiaomi продолжит оснащать флагманы тыловыми дисплеями после успеха Xiaomi 17 Pro 12 ч.
Анонсированы смартфоны Oppo Find X9 и X9 Pro — камеры Hasselblad, чипы Dimensity 9500, ёмкие батареи и цена от $620 12 ч.
Pegatron представила ИИ-сервер AS501-4A1-16I1 с СЖО и 16 ускорителями AMD Instinct MI355X 14 ч.