Сегодня 31 июля 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

AMD выпустила свою первую языковую модель ИИ — AMD-135M

Поскольку AMD пытается нарастить своё присутствие на рынке ИИ, производитель выпускает не только аппаратное обеспечение под эти нужды, но также решил заняться разработкой языковых моделей. Результатом этого стал анонс первой малой языковой AMD-135M.

 Источник изображения: AMD

Источник изображения: AMD

Новая малая языковая модель AMD-135M принадлежит к семейству Llama и нацелена на развёртывание в частном бизнесе. Неясно, имеет ли новая ИИ-модель AMD какое-либо отношение к недавнему приобретению компанией стартапа Silo AI (сделка ещё не завершена и пока не одобрена различными регуляторами, поэтому, вероятно, нет). Однако это явный шаг в направлении удовлетворения потребностей конкретных клиентов с помощью предварительно обученной модели, созданной AMD с использованием её же оборудования.

Преимущество языковой модели AMD заключается в том, что она использует так называемое спекулятивное декодирование. Последнее представляет собой меньшую «черновую модель», которая генерирует несколько токенов-кандидатов за один прямой проход. Затем токены передаются в более крупную, более точную «целевую модель», которая проверяет или исправляет их. С одной стороны, такой подход позволяет генерировать несколько токенов одновременно, но с другой стороны, это приводит к повышению потребляемой мощности за счёт увеличения передачи данных.

Языковая модель AMD представлена в двух версиях: AMD-Llama-135M и AMD-Llama-135M-code. Каждая из них оптимизирована для определённых задач путём повышения производительности вывода с помощью технологии спекулятивного декодирования. Базовая модель AMD-Llama-135M была обучена с нуля на базе 670 млрд токенов общих данных. Этот процесс занял шесть дней с использованием четырех 8-канальных узлов на базе AMD Instinct MI250.

Модель AMD-Llama-135M-code в свою очередь была улучшена за счёт дообучения на базе дополнительных 20 млрд токенов, специально ориентированных на написание программного кода. Дополнительное обучение модели заняло четыре дня с использованием того же набора оборудования AMD. Компания считает, что дальнейшие оптимизации её моделей могут привести к дополнительному повышению их производительности и эффективности.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
Telegram готовится запустить глобальный поиск во всех публичных каналах сразу 18 мин.
Утечка подтвердила дату выхода Battlefield 6 — Electronic Arts раньше времени показала тизер нового трейлера 32 мин.
Инсайдер раскрыл планы Electronic Arts на открытую «бету» Battlefield 6 — когда тестирование и как получить ранний доступ 12 ч.
«Абсолютно нормальное» обновление на радость фанатам добавило в инди-хит Peak каннибализм 13 ч.
Google выпустила экстренное обновление для Chrome, закрывшее опасную уязвимость 15 ч.
Devil May Cry 5 стала самой продаваемой игрой квартала для Capcom, а Monster Hunter Wilds весь запал растеряла 15 ч.
ИИ-приложения захватили смартфоны и удвоили выручку — ChatGPT уже дышит в затылок Google 15 ч.
Google заявила, что Великобритания не требовала от неё создать бэкдор в облаке — в отличие от Apple 16 ч.
Тысячи камер Hikvision остаются уязвимы ко взлому почти год — доступ к ним активно продают в даркнете 16 ч.
TikTok запустил систему проверки фактов и новые инструменты родительского контроля 16 ч.
Western Digital тоже наживается на ИИ-буме — выручка подскочила на 30 % 5 мин.
В России начались продажи роботов-пылесосов Dreame F10 и F10 Plus 29 мин.
Сообщение о ликвидации утечки воздуха в модуле «Звезда» на МКС оказалось преждевременным 45 мин.
Выделение сетевого бизнеса Intel в отдельную компанию угрожает бизнесу Ericsson и других поставщиков 5G-решений 2 ч.
Arm заговорила о производстве собственных процессоров, но квартальный отчёт всё равно обрушил акции 2 ч.
Qualcomm отчиталась о росте выручки, но недозаработала на чипах для смартфонов — акции обвалились 3 ч.
Прибыль Samsung от чипов рухнула в 16 раз — зато смартфоны показали рост благодаря Galaxy S25 5 ч.
Новая статья: Обзор гибкого смартфона Samsung Galaxy Z Fold7: догнал одним прыжком 9 ч.
Макеты всех версий iPhone 17 показались на фото в новых цветах — оранжевый Pro стал сюрпризом 10 ч.
Новая статья: Система жидкостного охлаждения Arctic Liquid Freezer III Pro 360 A-RGB: новые вентиляторы — и точка 10 ч.