Сегодня 02 февраля 2026
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

AMD выпустила свою первую языковую модель ИИ — AMD-135M

Поскольку AMD пытается нарастить своё присутствие на рынке ИИ, производитель выпускает не только аппаратное обеспечение под эти нужды, но также решил заняться разработкой языковых моделей. Результатом этого стал анонс первой малой языковой AMD-135M.

 Источник изображения: AMD

Источник изображения: AMD

Новая малая языковая модель AMD-135M принадлежит к семейству Llama и нацелена на развёртывание в частном бизнесе. Неясно, имеет ли новая ИИ-модель AMD какое-либо отношение к недавнему приобретению компанией стартапа Silo AI (сделка ещё не завершена и пока не одобрена различными регуляторами, поэтому, вероятно, нет). Однако это явный шаг в направлении удовлетворения потребностей конкретных клиентов с помощью предварительно обученной модели, созданной AMD с использованием её же оборудования.

Преимущество языковой модели AMD заключается в том, что она использует так называемое спекулятивное декодирование. Последнее представляет собой меньшую «черновую модель», которая генерирует несколько токенов-кандидатов за один прямой проход. Затем токены передаются в более крупную, более точную «целевую модель», которая проверяет или исправляет их. С одной стороны, такой подход позволяет генерировать несколько токенов одновременно, но с другой стороны, это приводит к повышению потребляемой мощности за счёт увеличения передачи данных.

Языковая модель AMD представлена в двух версиях: AMD-Llama-135M и AMD-Llama-135M-code. Каждая из них оптимизирована для определённых задач путём повышения производительности вывода с помощью технологии спекулятивного декодирования. Базовая модель AMD-Llama-135M была обучена с нуля на базе 670 млрд токенов общих данных. Этот процесс занял шесть дней с использованием четырех 8-канальных узлов на базе AMD Instinct MI250.

Модель AMD-Llama-135M-code в свою очередь была улучшена за счёт дообучения на базе дополнительных 20 млрд токенов, специально ориентированных на написание программного кода. Дополнительное обучение модели заняло четыре дня с использованием того же набора оборудования AMD. Компания считает, что дальнейшие оптимизации её моделей могут привести к дополнительному повышению их производительности и эффективности.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Microsoft заключила облачную сделку с Perplexity на $750 млн, но любимым провайдером ИИ-поисковика всё равно останется AWS 48 мин.
Инсайдер огорчил фанатов, которые ждали Аду Вонг и Криса Редфилда в Resident Evil Requiem 51 мин.
Глава HBO дал понять, что третий сезон сериала The Last of Us всё-таки станет последним 3 ч.
Yahoo представила поисковый движок Scout на основе ИИ 3 ч.
Выручка SAP в сегменте облака в 2025 году выросла на четверть, но акции рухнули из-за слабого прогноза 3 ч.
Амбициозная тактическая ролевая игра ATOM RPG 2 отправит вершить судьбу постапокалиптического мира — первый тизер и подробности 5 ч.
xAI хочет нанять лауреатов литературных премий для обучения глупого чат-бота Grok — за $40 в час 10 ч.
Microsoft не будет перегружать Windows 11 ИИ-функциями — возможности Copilot и Recall урежут 01-02 12:12
Новая статья: Quarantine Zone: The Last Check — эмоций при досмотре не выявлено. Рецензия 01-02 00:05
Новая статья: Gamesblender № 761: GTA VI только в «цифре», иск к Valve на $900 млн и тайны отмененного «Принца» 31-01 23:32
Художественное топтание снега человекоподобным роботом: Unitree G1 прошёл 130 000 шагов на 47-градусном морозе 33 мин.
Ноутбуки Apple MacBook Pro с процессорами M5 Pro и M5 Max представят уже в феврале, но это не точно 40 мин.
Seagate сильно отстала от Western Digital по прибыли на Эбайт отгруженных HDD 53 мин.
Япония сделала шаг к добыче редкоземов со дна океана — с глубины 6000 м подняли первую порцию ила 53 мин.
Сингапур собрался стать космической державой и сформирует собственное аэрокосмическое агентство 3 ч.
Apple готовит обновлённый монитор Studio Display 3 ч.
Samsung Galaxy S26 Ultra со стилусом показался на изображении до анонса 3 ч.
Hitachi Vantara: устаревшая инфраструктура данных оборачивается $108 млрд неэффективных инвестиций в ИИ 3 ч.
Giga Computing выпустила вычислительные узлы TO25-ZU4 и TO25-ZU5 на базе AMD EPYC Turin 4 ч.
Ещё один криптомайнер отказывается от биткоинов в пользу ИИ — Bitfarms переоборудует свои ЦОД под NVIDIA Vera Rubin 4 ч.