Сегодня 18 октября 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

AMD выпустила свою первую языковую модель ИИ — AMD-135M

Поскольку AMD пытается нарастить своё присутствие на рынке ИИ, производитель выпускает не только аппаратное обеспечение под эти нужды, но также решил заняться разработкой языковых моделей. Результатом этого стал анонс первой малой языковой AMD-135M.

 Источник изображения: AMD

Источник изображения: AMD

Новая малая языковая модель AMD-135M принадлежит к семейству Llama и нацелена на развёртывание в частном бизнесе. Неясно, имеет ли новая ИИ-модель AMD какое-либо отношение к недавнему приобретению компанией стартапа Silo AI (сделка ещё не завершена и пока не одобрена различными регуляторами, поэтому, вероятно, нет). Однако это явный шаг в направлении удовлетворения потребностей конкретных клиентов с помощью предварительно обученной модели, созданной AMD с использованием её же оборудования.

Преимущество языковой модели AMD заключается в том, что она использует так называемое спекулятивное декодирование. Последнее представляет собой меньшую «черновую модель», которая генерирует несколько токенов-кандидатов за один прямой проход. Затем токены передаются в более крупную, более точную «целевую модель», которая проверяет или исправляет их. С одной стороны, такой подход позволяет генерировать несколько токенов одновременно, но с другой стороны, это приводит к повышению потребляемой мощности за счёт увеличения передачи данных.

Языковая модель AMD представлена в двух версиях: AMD-Llama-135M и AMD-Llama-135M-code. Каждая из них оптимизирована для определённых задач путём повышения производительности вывода с помощью технологии спекулятивного декодирования. Базовая модель AMD-Llama-135M была обучена с нуля на базе 670 млрд токенов общих данных. Этот процесс занял шесть дней с использованием четырех 8-канальных узлов на базе AMD Instinct MI250.

Модель AMD-Llama-135M-code в свою очередь была улучшена за счёт дообучения на базе дополнительных 20 млрд токенов, специально ориентированных на написание программного кода. Дополнительное обучение модели заняло четыре дня с использованием того же набора оборудования AMD. Компания считает, что дальнейшие оптимизации её моделей могут привести к дополнительному повышению их производительности и эффективности.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
ИИ-бот Google Gemini успешно конкурирует в области редактирования фото с инструментами Adobe 5 ч.
Новая статья: Baby Steps — встань и иди. Рецензия 13 ч.
ИИ Meta будет предлагать пользователям отредактировать и опубликовать фото из галереи смартфона 14 ч.
Новая статья: Vampire: The Masquerade — Bloodlines 2 — резус разочаровательный. Рецензия 14 ч.
«Невероятно исторический момент»: в Football Manager 26 впервые для серии появится Чемпионат мира по футболу и другие турниры ФИФА 14 ч.
Судебные документы Sony и Tencent раскрыли, когда выйдет фильм по Horizon Zero Dawn 17 ч.
Фэнтезийный боевик Absolum приглянулся не только критикам, но и игрокам — 200 тысяч проданных копий и 91 % в Steam 17 ч.
«Выбор сделали за меня»: бывший руководитель франшизы Assassin’s Creed объяснил, почему покинул Ubisoft 18 ч.
Хакеры слили данные сотен сотрудников ФБР, Минюста и Министерства внутренней безопасности США 19 ч.
Родители смогут ограничивать общение своих детей с ИИ-персонажами в Instagram 19 ч.
Первый в мире ИИ-спутник с ускорителем Nvidia H100 отправится в космос в ноябре 6 мин.
После визита Тима Кука iPhone Air в Китае раскупили за минуты 22 мин.
Память HBM4 окажется дороже, чем ожидалось, но производители не останутся внакладе 5 ч.
Asus представила первый мини-ПК ROG NUC с процессором AMD — чип Ryzen 9 9955HX3D и графика GeForce RTX 5070 5 ч.
Рекорд разгона памяти до режима DDR5-13010 прошёл валидацию 5 ч.
Первый складной iPhone может не только задержаться, но и получить дисплей более скромных размеров 6 ч.
TSMC выпустила для Nvidia первую кремниевую пластину с чипами Blackwell на территории США 7 ч.
Релиз Kaspersky NGFW 1.1: улучшенная отказоустойчивость, антивирусная проверка архивов и новые аппаратные платформы 14 ч.
Atari представила ретро-консоль Intellivision Spirit c 45 встроенными играми с «возможностью расширения» 15 ч.
Huawei представила смартфон Nova 14 Lite на устаревшем чипе Kirin 8000 и HarmonyOS 5.1 15 ч.